Логотип Soware

Описание системы Tesseract OCR

Информация о Tesseract OCR

Подходит для
Специалист
Развёртывание
Сервер предприятия, Персональный компьютер
Графический интерфейс
macOS, Windows, Linux
Тарификация
Бесплатно
Поддержка языков
:Иврит, :Эстонский, :Португальский, :Монгольский, :Болгарский, :Сербский, :Русский, :Казахский, :Китайский, :Латвийский, :Норвежский, :Турецкий, :Татарский, :Кхмерский, :Азербайджанский, :Белорусский, :Венгерский, :Хинди, :Польский, :Финский, :Немецкий, :Нидерландский, :Японский, :Фарси, :Французский, :Арабский, :Вьетнамский, :Литовский, :Индонезийский, :Английский, :Греческий, :Бенгальский, :Шведский, :Испанский, :Чешский, :Украинский, :Корейский, :Хорватский, :Персидский, :Итальянский, :Датский, :Каталонский
Реестр российского ПО
Да
Демо версия
Да
Пробная версия (триал)
Нет
Свободное ПО
Да

Краткий обзор Tesseract OCR

Программное решение Tesseract (рус. Тессеракт) с открытым исходным кодом от компании Google предназначено для распознавания текста (англ. OCR). Программа распространяется бесплатно и доступна для использования по лицензии Apache 2.0.

Программное обеспечение Tesseract может быть использовано непосредственно или при помощи API, позволяя извлекать печатный текст из изображений.

Программный движок Tesseract не имеет встроенного графического интерфейса (GUI), но есть несколько доступных вариантов графического интерфейса от третьих сторон. Система поддерживает широкий спектр языков для распознавания — более 130.

Подробнее: https://opensource.google/projects/tesseract

Функции1

Многопользовательский доступ
(да)Наличие API
Отчётность и аналитика
(да)Импорт/экспорт данных
Администрирование
Интеллектуальный анализ данных
(да)Машинное обучение
Дообучение
Обработка структурированных данных
(да)Обработка текстовых данных
Обработка звуковых данных
Обработка голосовых данных
(да)Обработка визуально-графических данных
Обработка видео-данных
Классификация данных
Прогнозирование
Кластеризация
Интеграция данных
Мониторинг данных
Оптимизация процессов
Визуализация

Разработчик системы

Компания-разработчик:

Google

Страна:

США

Головной офис:

Маунтин-Вью, Калифорния

Веб-сайт (продукт):

https://opensource.google/projects/tesseract

Веб-сайт:

https://about.google/intl/ru_ru/

Вопросы и ответы

?

Располагает ли Tesseract OCR программным интерфейсом приложения (API)?

Да, у Tesseract OCR есть программный интерфейс (API).

?

Поддерживает ли Tesseract OCR русский язык?

Да, Tesseract OCR поддерживает русский язык.

?

Подойдёт ли Tesseract OCR для малого бизнеса?

Нет, Tesseract OCR хорошо подходит для других категорий пользователей. Система не адаптирована для нужд малого бизнеса.

?

Как Tesseract OCR справляется с распознаванием текста на сложных фонах или в условиях сильного шума изображения?

Tesseract OCR использует алгоритмы для улучшения распознавания текста на сложных фонах и в условиях шума, но результаты зависят от степени сложности изображения.

?

Поддерживает ли Tesseract OCR многоязычное распознавание, и какие языки доступны?

Tesseract OCR поддерживает многоязычное распознавание, доступно более 130 языков.

?

Есть ли у Tesseract OCR встроенные механизмы для обработки рукописного текста и насколько они эффективны?

Tesseract OCR имеет ограниченные возможности для обработки рукописного текста, эффективность распознавания в таких случаях ниже, чем для печатного текста.

?

Какие существуют варианты установки Tesseract OCR?

Система Tesseract OCR может быть установлена на: Сервер предприятия, Персональный компьютер.

?

Можно ли использовать Tesseract OCR без установки на собственные (частные) сервера, арендовать из публичного облака?

Нет, Tesseract OCR не может использоваться из публичного облака (SaaS).

Популярные аналоги

Логотип

Entera

Entera

Entera — это облачный мультисервис для автоматической загрузки первичной документации в учётную систему 1С.

Логотип

Видеоинтеллект

Видеоинтеллект

Видеоинтеллект — это профессиональный программный комплекс российской разработки для построения современных систем интеллектуального видеонаблюдения.

Логотип

Система охраны труда, промышленной безопасности и контроля нарушений

Statanly Technologies

Система охраны труда, промышленной безопасности и контроля нарушений — это универсальная платформа видео и аудио аналитики для выявления различных событий и нарушений техники безопасности, распознавания и анализа речи, работы с текстовой и визуальной информацией с помощью больших языковых моделей.

Логотип

Биорг.KYC

Beorg

Биорг.Идентификация физических лиц (KYC) — это API-сервис для оцифровки документов, распознавания изображений, идентификации личности с применением технологий искусственного интеллекта, с быстрой интеграцией за 30 минут и мгновенным стартом распознавания.

Логотип

ITFB EasyDoc

ITFB Group

ITFB EasyDoc — это инновационная система, которая позволяет автоматизировать процессы распознавания текста, извлечения данных и аналитической обработки документов.

Логотип

ABBYY FineReader

ABBYY

ABBYY FineReader — это универсальное программное приложение для распознавания текста, предназначенное для повышения производительности бизнеса, быстрого захвата документов на бумажных носителях и получения на выходе оцифрованных файлв в форматах PDF, DOC и прочих.