Описание системы Tesseract OCR
Информация о Tesseract OCR
Краткий обзор Tesseract OCR
Tesseract — это программный движок с открытым исходным кодом, позволяющий распознавать символы с поддержкой кодировки Unicode и возможностью распознавания более 130 языков, а также с возможностью дополнения для распознавания других языков.
Программное решение Tesseract (рус. Тессеракт) с открытым исходным кодом от компании Google предназначено для распознавания текста (англ. OCR). Программа распространяется бесплатно и доступна для использования по лицензии Apache 2.0.
Программное обеспечение Tesseract может быть использовано непосредственно или при помощи API, позволяя извлекать печатный текст из изображений.
Программный движок Tesseract не имеет встроенного графического интерфейса (GUI), но есть несколько доступных вариантов графического интерфейса от третьих сторон. Система поддерживает широкий спектр языков для распознавания — более 130.
Подробнее: https://opensource.google/projects/tesseract
Функции
Разработчик системы Tesseract OCR
Вопросы и ответы Tesseract OCR
?
Поддерживает ли Tesseract OCR работу с защищёнными (зашифрованными) документами и как это реализовано?
Tesseract OCR не имеет встроенных механизмов для работы с защищёнными (зашифрованными) документами, требуется дополнительное ПО для расшифровки данных перед распознаванием.
?
Какие языки поддерживает Tesseract OCR?
Tesseract OCR поддерживает в своём интерфейсе следующие языки: Русский, Английский, Азербайджанский, Арабский, Белорусский, Бенгальский, Болгарский, Венгерский, Вьетнамский, Греческий, Датский, Иврит, Индонезийский, Испанский, Итальянский, Казахский, Китайский, Корейский, Кхмерский, Литовский, Монгольский, Немецкий, Нидерландский, Норвежский, Персидский, Польский, Португальский, Сербский, Татарский, Турецкий, Украинский, Фарси, Финский, Французский, Хинди, Хорватский, Чешский, Шведский, Эстонский, Японский.
?
Можно ли использовать Tesseract OCR без установки на собственные (частные) сервера, арендовать из публичного облака?
Нет, Tesseract OCR не может использоваться из публичного облака (SaaS).
?
Существует ли дистрибутив Tesseract OCR под операционные системы семейства Linux?
Да, Tesseract OCR может быть развёрнута и использоваться на ОС Linux.
?
Предполагает ли Tesseract OCR серверный вариант установки (или на частное облако)?
Да, Вы можете инсталлировать Tesseract OCR на сервер предприятия или в частном облаке.
?
Поддерживает ли Tesseract OCR многоязычное распознавание, и какие языки доступны?
Tesseract OCR поддерживает многоязычное распознавание, доступно более 130 языков.
?
Каковы возможности кастомизации и настройки алгоритмов распознавания в Tesseract OCR?
Возможности кастомизации Tesseract OCR включают настройку параметров распознавания и добавление языковых пакетов, что позволяет адаптировать систему под специфические задачи.
?
Располагает ли Tesseract OCR программным интерфейсом приложения (API)?
Да, у Tesseract OCR есть программный интерфейс (API).
Популярные аналоги Tesseract OCR

Медиалогия SM
Медиалогия
«Медиалогия SM» — это система аналитики и мониторинга социальных медиа, которая собирает и анализирует данные из 2,5 млрд источников соцмедиа (соцсети, видео-платформы, маркетплейсы, отзовики, блоги-форумы, карты, мессенджеры и СМИ), обрабатывает тексты, картинки, локации, логотипы, видео и истории, и по итогам анализа формирует подробный отчёт.

Медиалогия PR
Медиалогия
Медиалогия PR — это цифровой инструмент оперативного мониторинга и анализа СМИ. Более 105000 источников: Пресса, ТВ, Радио, Информагентства, Интернет-СМИ.

PolyAnalyst
Мегапьютер Интеллидженс
Megaputer PolyAnalyst — это российская low-code платформа визуальной разработки сценариев анализа данных и текстовых документов, а также построения интерактивных отчётов, не требующая навыков программирования.

Инлексис Голосовой бот
Инлексис
Инлексис Голосовой бот — это интеллектуальный сервис для эффективного обзвона клиентов, позволяющий крупному бизнесу экономить миллионы рублей на сокращении операционных расходов.
МТС Облачное видеонаблюдение — это онлайн-сервис, включающий 11 модулей видеоаналитики, для организации интеллектуального наблюдения за автомобилями, пассажирами, сотрудниками и иными рабочими объектами.

Linkage ABI
Westlink Group
Linkage ABI — это централизованная BI-система самообслуживания со встроенной интеллектуальной поддержкой принятия управленческих решений с использованием ИИ.


