24.10.2013 14:45
Консультации.
Просмотров всего: 3180; сегодня: 1.

ABBYY FineReader Engine научился классифицировать документы

Классификация документов по внешнему виду и содержанию, а также другие новые функции OCR-решения ABBYY для разработчиков доступны одновременно на трёх платформах – Windows, Linux, Mac

Компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.

Возможности новой версии

• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.

• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).

• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.

• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.

• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.

• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.

«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».

ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.

ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

О компании ABBYY

Российская компания ABBYY – ведущий мировой разработчик программного обеспечения и поставщик услуг в области распознавания и ввода документов, лингвистики и перевода. Более 30 миллионов пользователей и десятки тысяч организаций по всему миру используют решения ABBYY для автоматизации трудоемких процессов, экономя время и превращая информацию в полезные знания. На российском рынке ABBYY является уникальной компанией, лидирующей одновременно в области лингвистических технологий и услуг.


Ньюсмейкер: ABBYY — 211 публикаций
Поделиться:

Интересно:

Кто собрал крупнейшую коллекцию пожарных артефактов в России?
30.04.2025 11:15 Интервью, мнения
Кто собрал крупнейшую коллекцию пожарных артефактов в России?
13 тысяч уникальных предметов – от царских наград до редчайших касок. Денис фон Мекк, коллекционер с 25-летним стажем, восстанавливает по крупицам то, что едва не исчезло из истории. Денис фон Мекк живёт в Москве, пожарная тематика увлекла его ещё в юности. Особенность его коллекции — оригинальность предметов и широкий охват эпох: от императорской России до современной Европы и Америки. Помимо коллекционирования, фон Мекк занимается популяризацией пожарной безопасности и истории пожарного дела – посетил более 100 пожарных  выставок в 30 странах мира, выступает с лекциями, пишет статьи. От шевронов до касок Первое, что начал собирать фон Мекк, – нарукавные шевроны. Сейчас в его коллекции более 5000 нашивок из почти 100 стран мира.  – Моя особая любовь – каски. Только американские не нравятся – нет, не из-за политики, просто визуально не нравятся, – смеётся он. В собрании ...
Подвиг, ставший символом нашей Победы
30.04.2025 11:06 Персоны
Подвиг, ставший символом нашей Победы
30 апреля 1945 года старший сержант Красной армии Николай Масалов совершил подвиг, который вошел в историю как образец мужественности и добродетели, которыми всегда славился наш народ. Во время штурма Берлина в одном из боевых эпизодов советский воин, рискуя своей жизнью, под плотным немецким огнем на руках вынес из-под обстрела трехлетнюю немецкую девочку. Скромный сержант не считал свой поступок подвигом, тем более, что таких случаев в ходе штурма Берлина было немало, но его подвиг стал широко известен благодаря многочисленным очевидцам. Этот поступок лег в основу идеи монумента Воину-освободителю в Трептов парке, в Берлине. Образцовый гвардеец Николай Иванович Масалов, как и многие миллионы наших соотечественников, встал на защиту Родины от врага. Молодого человека 1922 года рождения призвали в армию 10 декабря 1941 года в Тисульском районе Кемеровской области. У Масаловых...
Возвращаем имена Победы
29.04.2025 15:01 Мероприятия
Возвращаем имена Победы
28-29 апреля в Алматы состоится международная конференция «Возвращённые имена Победы». Мероприятие пройдёт под девизом «80 лет Великой Победы – от доблести к суверенитету» и объединит историков и поисковиков, исследователей и педагогов из Казахстана, России, Узбекистана, Таджикистана, Словении и других стран. Цель конференции – расширить исследовательскую работу по увековечению памяти воинов-победителей в Великой Отечественной войне, отдать дань уважения всем советским людям, которые сражались на фронте и трудились в тылу. Это продолжение той деятельности, которая Ассамблея народов Евразии и Африки последовательно ведёт в рамках сохранения исторической памяти, стремясь к справедливости и сохранению памяти о подвигах всех народов, победивших нацизм.К конференции «Возвращённые имена Победы» на Медиаплатформе «Сеть истории» открыт специальный проект «Герои Центральной Азии в Великой...
ИИ и гибкость — опыт Ventra на конференции Russian Retail Show 2025
28.04.2025 18:55 Аналитика
ИИ и гибкость — опыт Ventra на конференции Russian Retail Show 2025
На прошедшей в Москве конференции от Retail TECH Net, посвящённой цифровой трансформации отрасли, руководитель ИТ-подбора HR-холдинга Ventra Алексей Большаков представил результаты масштабного исследования о мотивации и трендах в управлении ИТ-командами. Эксперт поделился инсайтами, как ритейл-компании могут сохранять ключевых специалистов в условиях дефицита кадров и меняющихся ожиданий сотрудников. Конференция объединила несколько тысяч участников — представителей крупных ритейл-сетей, технологических стартапов и ИТ-департаментов. В своем выступлении на секции «Ключевые тренды и кейсы ИТ в ритейле» Алексей Большаков рассказал о масштабном опросе HR-холдинга Ventra, который охватил 900 компаний и тысячи ИТ-специалистов: от джунов до ИТ-директоров.  Согласно исследованию, 62% организаций в 2024 году расширили свои технические команды, несмотря на общую оптимизацию расходов. Более...
Какие функции выполнял князь в древнерусском государстве
28.04.2025 12:14 Аналитика
Какие функции выполнял князь в древнерусском государстве
Слово «князь» (от общеславянского kъnęzь) в древнейшие времена обозначало главу рода, предводителя племени; в древнерусском государстве князем стали именовать правителя области, удела, земли. Функции или деятельность князей зависели от особенностей исторического периода и от местности, где они правили. Самые широкие полномочия имели великие князья: титул «великий князь» в IX-XII веках относился к киевскому князю, а с XII века также и к владимирскому князю. Власть великих князей не была абсолютной, она ограничивалась советом (думой) и народным собранием (вече). Местные или удельные князья имели более ограниченную власть: в Галиче она зависела от старших дружинников-бояр; в Новгороде и Пскове по решению вече князя могли изгнать. Обязанности древнерусского князя (IX-XII века) Основные обязанности князя изложены в «Поучении», составленном для своих потомков князем Владимиром...