Направление: Обработка текстов/работа с текстами на естественном языке (ЕЯ). В основном на русском. Эти проекты направлены на формальное представление знаний о ЕЯ.
Важнейшие направления:
- КРЯ - контролируемый русский язык,
- поиск КСГ правил пунктуации литературного русского языка, одна из главных целей - разбивка литературно правильного текста на предложения и другие части;
Замечание 19.01.2015, которое могло быть и раньше. Наличие разметки ру-текстов, например, fb2, где текст представлен структурированно (xml-документ) упрощает задачу до "правил" разбивки абзаца на предложения!!!
- БД грамматических характеристик словоформ,
- построение дерева подчинения фразы и предложения.
На первом этапе проекта предполагается что тексты на ЕЯ имеют отношение к "миру" - модели некоторой аксиоматической теории, например, теории графов, где таким миром является один конкретный/заданный граф (не обязательно связный;-). И ЕЯ-тексты соответственно транслируются в элементы модели/теории или порождаются по ним.
Предполагается, что именно с деревом подчинения будет работать преобразователь его значения/смысла/информации в [семантически] эквивалентный текст на формальном/математическом языке. Такой преобразователь, по-простому, придётся писать для каждой аксиоматической теории.
См. замечание о высказываниях об отношении инцидентности здесь.
Дружественные проекты: http://www.feofan.com
шутка юмора: публикация от Leidi Hanani.
гу мельчук смысл текст 1974
Теория «Смысл — текст» викип
Московская семантическая школа тут