OCRopus |
Автор: admin Просмотров: 3880 Комментарии:
Добавлен: 7 августа 2013
Обновлено: 4.02.2014 - 19:31
Система распознавания текста на базе недавно открытого Tesseract
OCRopus™ является OCR системой, написанной на Python, NumPy и SciPy упором на самообучение для решения проблем в анализе документов.
OCRopus 0.7 является последней версии системы OCRopus OCR. Он имеет новый распознаватель текстовых линий на основе рекуррентных нейронных сетей (и не требует языка моделирования), модели для латиницы и готического письма Fraktur.
Установка
$ hg clone -r ocropus-0.7 https://code.google.com/p/ocropus
$ cd ocropus/ocropy
$ sudo apt-get install $(cat PACKAGES)
$ python setup.py download_models
$ sudo python setup.py install
$ ./run-test
Системные требования: Ubuntu 12.10 (64 бит) и, по крайней мере, 4 Гбайта оперативной памяти и быстрый процессор.
Ограничения: основные текущие ограничения в том что производительность на многоколоночных документах и документах содержащих картинки не очень хорошая.
------------------------
ТРИО теплый пол отзыв
Заработок на сокращении ссылок
Earnings on reducing links
Код PHP на HTML сайты
Категория: Распознавание текста и речи
Лицензия:
Apache2
Интерфейс консольный
Язык программирования:
Python, NumPy, SciPy
Сайт проекта
Скачать OCRopus 0.7
Комментарии |