TXM |
Автор: admin Просмотров: 2229 Комментарии:
Добавлен: 22 января 2017
Обновлено: 22.01.2017 - 10:01
Программа для анализа корпусов текстов в Unicode и XML. Также работает онлайн как J2EE совместимый веб-портал (на основе GWT) с встроенным контролем доступа.
Широкий спектр иструментов (конкордансы, поиск расстановок, частотные списки и т. д.) на основе мощного поискового движка CQP и ряде статистических функций (факторный анализ, классификация, анализ конкуренции и т. д.) основываясь на пакете R.
Возможности TXM
Соответствие лексическим моделям на основе слов и структуре запросов, богатой HTML текстовой навигации редактирования, отображение разметки местанахождения шаблонов.
Предоставляет количественные инструменты анализа: факторный анализ, конструктивные особенности слов, иерархическая классификация, смежность шаблонов.
Работает на любой коллекции закодированных Unicode документов различных форматов: тексты сборников (TXT, XML, XML-TEI P5), записи транскрипции (XML-Transcriber), выровненный корпусы (XML-TMX), статьи в прессе (XML-PPS Factiva, Europress) и более.
Применение различных инструментов NLP на лету по текстам перед анализом (например TreeTagger для лемматизации и pos tagging)
Позволяет создавать различные подкорпусы и разделы (для constrative анализа между текстовыми структурами или группами слов)
Экспорт любых результатов в форматы CSV, XML или SVG
Скрипт для автоматизации повторяющихся задач и расширения платформы (в Groovy / Java)
Включает в себя текстовый редактор для редактирования источников данных, результаты и сценарии
Работает автономно на Windows, Mac OS X и GNU/Linux
Работает также, как портал веб-приложение для доступа и анализа корпусов в онлайн режиме через веб-браузер (с управлением контроля доступа)
Открытый исходный код: на основе лучших компонентов с открытым исходным кодом для анализа текста: CQP, R и Java и XSLT библиотеки
Модульная архитектура (Eclipse RCP OSGi и J2EE совместимость): один набор инструментов подключения всех основных компонентов используемых всеми приложениями
Эффективные средства разработки Eclipse и Netbeans
------------------------
ТРИО теплый пол отзыв
Заработок на сокращении ссылок
Earnings on reducing links
Код PHP на HTML сайты
Категория: Программы по статистике, Лингвистика, Программы по анализу информации
Лицензия:
GPL3
Интерфейс графический
Язык программирования:
C, Groovy, Java, S/R
Сайт проекта
Скачать TXM
Комментарии |