SOICA
обработки документов

передовых OCR‑технологий
передовых OCR‑технологий
без участия человека
документов
одной страницы
для потокового и пользовательского
распознавания и обработки любых типов
документов: скан-образов, электронных
файлов, фотографий, а также текстов
писем и вложений


в том числе деперсонализация
Продуктовая линейка
для решения любых задач по распознаванию, классификации и автоматизированной
обработке документов.
распознавание
SOICA проводит коррекцию изображения перед распознаванием и обработкой, используя 18 встроенных фильтров — выполняет бинаризацию и очистку, удаляет затемнения от заломов бумаги, шумы и другие визуальные дефекты.
При необходимости SOICA формирует различные варианты предобработки исходного изображения с помощью наложения фильтров — это дает оптимальное качество извлечения данных. Например, при обработке страницы, содержащей текст и печать, SOICA предложит два варианта: первый — для извлечения печати, а второй — для текста под печатью. Из каждого варианта будут использованы наиболее качественно распознанные данные.
и выверка данных
Для повышения качества распознавания SOICA сопоставляет найденные целевые данные с различными справочниками и базами данных, а также с внешними источниками, например, базами ФНС, МВД и другими. Объектами сопоставления могут выступать номенклатуры, имена, товарные позиции, единицы изменения и другие детали документов.
Автоматическое определение наличия на документе разного рода печатей, штампов, меток, подписей и прочих критичных для валидации элементов. Сравнение разных версий документов, даже если они в разных форматах, например, согласованная с контрагентом версия в DOCX и подписанный скан в PDF.
SOICA позволяет эффективно работать со слабоструктурированными документами. Например, платформа без проблем сможет обработать товарные накладные с плотным расположением строк, в которых отсутствуют вертикальные разделители столбцов.
А с помощью No-Code инструментария платформы легко настроить самые сложные сценарии поиска целевых данных, даже для документов с высокой вариативностью визуальных форм — без опоры на жестко привязанные к координатам области поиска.
С помощью продуктов SOICA можно модифицировать исходные изображения: наносить печати и факсимиле, добавлять электронные подписи, маркировки, индексы, проводить деперсонализацию документов и многое другое.
Распознанный документ можно экспортировать в какую-либо целевую систему, например, в 1C, CRM, SAP, WMS, системы электронного документооборота, архивы. Экспорт происходит в форматах XML, JSON, TXT, а также в шаблоны Office. Дополнительно обработанные изображения могут выгружаться в нужном формате — PDF, JPG, PNG и других.
Примеры обрабатываемых документов
- Торг12
- Счета
- Счета-фактуры
- Акты
- Документы, удостоверяющие личность
- Кадровые документы
- Резюме
- Приказы и заявления
- Опросы покупателей
- Анкеты мерчандайзеров
- Ценники и чеки
- Заказы и заявки
- Договоры и приложения
- Протоколы согласований
- Уставные документы
- Лицензии и патенты
- Проектная документация
- Чертежи
- Инструкции
- Сертификаты
- Входящая корреспонденция
- Архивы и реестры
- Журналы регистраций