Почему сайт вынужден перейти на домен международной зоны ?

Все программы:

Финансы

Контакты и Отказ от ответственности

О нас

Tesseract-ocr

Автор: admin

Комментарии:

Добавлен: 7 августа 2013

Обновлено: 4.02.2014 - 19:42

Консольная программа распознавания текста.
Система Tesseract оптического распознавания текста (OCR) показала один из трёх лучших результатов в 1995 году на тесте UNLV. Между 1995 и 2006 система мало развивалась, но потом была значительно улучшена Google и сейчас, вероятно, является одной из наиболее точных систем OCR с открытым исходным кодом. Может читать широкий диапазон различных форматов и преобразовывать их в текст на более чем 40 языках, в том числе на русский, украинский и белорусский.

В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0) осуществляется с помощью дополнительных модулей.

------------------------
Код PHP на HTML сайты

Категория: Распознавание текста и речи

Лицензия:
Apache2

Размер архива исходников: 3.3 MB
Дата последних изменений в проекте: 04.05.2013
Интерфейс консольный
Язык программирования:
C, C++
Сайт проекта
Скачать Tesseract-ocr 3.02