ООО «Сойка»

платформа для оцифровки и интеллектуальной
обработки документов, ИНН 7704451468 КПП 770501001
платформа для оцифровки и интеллектуальной обработки документов
Для любых компаний с документооборотом от 10 000 страниц в год, а также для персонального использования
Для любых компаний с документооборотом от 10 000 страниц в год, а также для персонального использования
Платформа разработана на основе
передовых OCR‑технологий
Платформа разработана на основе
передовых OCR‑технологий
Финансовый сектор
Металлургия
Нефтегазовый сектор
Телеком
Финансовый сектор
Металлургия
Нефтегазовый сектор
Телеком
5
ускорение обработки
документов
1–3
стоимость обработки
одной страницы
1–1,5
ГОДА
срок окупаемости решения
Продукты ООО "Сойка" предназначены
для потокового и пользовательского
распознавания и обработки любых типов
документов: скан-образов, электронных
файлов, фотографий, а также текстов 
писем и вложений
Российское импортонезависимое решение. Входит в Реестр отечественного ПО и ЭВМ № 7808 от 14.12.2020
Участник проекта «Сколково»
Возможности
Безупречное 
распознавание

OCR проводит коррекцию изображения перед распознаванием и обработкой, используя 18 встроенных фильтров — выполняет бинаризацию и очистку, удаляет затемнения от заломов бумаги, шумы и другие визуальные дефекты.

При необходимости платформа формирует различные варианты предобработки исходного изображения с помощью наложения фильтров — это дает оптимальное качество извлечения данных. Например, при обработке страницы, содержащей текст и печать, OCR предложит два варианта: первый — для извлечения печати, а второй — для текста под печатью. Из каждого варианта будут использованы наиболее качественно распознанные данные.

Поиск, сопоставление
и выверка данных

Для повышения качества распознавания OCR сопоставляет найденные целевые данные с различными справочниками и базами данных, а также с внешними источниками, например, базами ФНС, МВД и другими. Объектами сопоставления могут выступать номенклатуры, имена, товарные позиции, единицы изменения и другие детали документов.

Автоматическое определение наличия на документе разного рода печатей, штампов, меток, подписей и прочих критичных для валидации элементов. Сравнение разных версий документов, даже если они в разных форматах, например, согласованная с контрагентом версия в DOCX и подписанный скан в PDF.

Интеллектуальный поиск данных без использования жестких шаблонов

OCR позволяет эффективно работать со слабоструктурированными документами. Например, платформа без проблем сможет обработать товарные накладные с плотным расположением строк, в которых отсутствуют вертикальные разделители столбцов.

А с помощью No-Code инструментария платформы легко настроить самые сложные сценарии поиска целевых данных, даже для документов с высокой вариативностью визуальных форм — без опоры на жестко привязанные к координатам области поиска.

Модификация

С помощью OCR можно модифицировать исходные изображения: наносить печати и факсимиле, добавлять электронные подписи, маркировки, индексы, проводить деперсонализацию документов и многое другое.

Экспорт результатов

Распознанный документ можно экспортировать в какую-либо целевую систему, например, в 1C, CRM, SAP, WMS, системы электронного документооборота, архивы. Экспорт происходит в форматах XML, JSON, TXT, а также в шаблоны Office. Дополнительно обработанные изображения могут выгружаться в нужном формате — PDF, JPG, PNG и других.