Java-библиотека для анализа и манипуляции частями HTML документа, в том числе сервеными тегами при дословном воспроизведении любого не распознаваемого или невалидного HTML. Есть высокоуровневые функции по манипуляции формами HTML.
Это проект, который объединяет все существующие свободные словари и обеспечивает простым пользователям и разработчикам универсальный XML-формат, который совместим с такими популярными форматами как Mova, PtkDic, StarDict, ABBYY Lingvo. Новые проекты формата можно найти здесь: https://github.com/soshial/xdxf_makedict/tree/master/format_standard. Разработка преобразователя словарей переехала на Github: https://github.com/soshial/xdxf_makedict