OCR в СЭД: ИИ-возможности для минимизации ручного труда
OCR в СЭД: ИИ-возможности для минимизации ручного труда
Современные OCR — это больше, чем инструмент для распознавания данных. Сегодня это решение, которое позволяет автоматизировать работу юридической службы, бухгалтерии, департаментов логистики и кадров, а также инженерных подразделений.
SOICA проводит коррекцию изображения перед распознаванием и обработкой, используя 18 встроенных фильтров — выполняет бинаризацию и очистку, удаляет затемнения от заломов бумаги, шумы и другие визуальные дефекты.
При необходимости SOICA формирует различные варианты предобработки исходного изображения с помощью наложения фильтров — это дает оптимальное качество извлечения данных. Например, при обработке страницы, содержащей текст и печать, SOICA предложит два варианта: первый — для извлечения печати, а второй — для текста под печатью. Из каждого варианта будут использованы наиболее качественно распознанные данные.
Для повышения качества распознавания SOICA сопоставляет найденные целевые данные с различными справочниками и базами данных, а также с внешними источниками, например, базами ФНС, МВД и другими. Объектами сопоставления могут выступать номенклатуры, имена, товарные позиции, единицы изменения и другие детали документов.
Автоматическое определение наличия на документе разного рода печатей, штампов, меток, подписей и прочих критичных для валидации элементов. Сравнение разных версий документов, даже если они в разных форматах, например, согласованная с контрагентом версия в DOCX и подписанный скан в PDF.
SOICA позволяет эффективно работать со слабоструктурированными документами. Например, платформа без проблем сможет обработать товарные накладные с плотным расположением строк, в которых отсутствуют вертикальные разделители столбцов.
А с помощью No-Code инструментария платформы легко настроить самые сложные сценарии поиска целевых данных, даже для документов с высокой вариативностью визуальных форм — без опоры на жестко привязанные к координатам области поиска.
С помощью продуктов SOICA можно модифицировать исходные изображения: наносить печати и факсимиле, добавлять электронные подписи, маркировки, индексы, проводить деперсонализацию документов и многое другое.
Распознанный документ можно экспортировать в какую-либо целевую систему, например, в 1C, CRM, SAP, WMS, системы электронного документооборота, архивы. Экспорт происходит в форматах XML, JSON, TXT, а также в шаблоны Office. Дополнительно обработанные изображения могут выгружаться в нужном формате — PDF, JPG, PNG и других.
Новости
и публикации
Мероприятия
OCR в СЭД: ИИ-возможности для минимизации ручного труда
OCR в СЭД: ИИ-возможности для минимизации ручного труда
Технологическая сессия: OCR-платформа SOICA
Технологическая сессия: OCR-платформа SOICA