Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Язык программирования для многоязыковых грамматических приложений: grammatical framework, GF

15 декабря 2009г. выложена версия 3.1 GF (http://www.grammaticalframework.org/):

GF, Grammatical Framework, is a programming language for multilingual grammar applications. It is

  • a special-purpose language for grammars, like YACC, Bison, Happy, BNFC, but not restricted to programming languages
  • a functional language, like Haskell, Lisp, OCaml, Scheme, SML, but specialized to grammar writing
  • a natural language processing framework, like LKB, XLE, Regulus, but based on functional programming and type theory
  • a categorial grammar formalism, like ACG, CCG, but different and equipped with different tools
  • a logical framework, like Agda, Coq, Isabelle, but equipped with concrete syntax in addition to logic

Don't worry if you don't know most of the references above - but if you do know at least one, it may help you to get a first idea of what GF is.

Я обнаружил, что я не понимаю только аббревиатур из categorial grammar formalism, а про все остальное уже как-то наслышан (хотя и не особо начитан).

Почему меня это интересует: я выделяю в работе с методами два четко выраженных уровня -- онтологический/семантический и словарный/терминологический. На данный момент мы как-то пытаемся разобраться с онтологическим уровнем. Но это вовсе не означает, что у нас не остается "текстов на естественном языке" -- прежде всего разных guidance, фрагментов учебников. И все эти тексты нужно иметь в вариантах для разных языковых сообществ (использую тут термин из OMG SBVR), причем вовсе необязательно это сообщества типа "русскоговорящие" и "англоговорящие". Это могут быть, например, "энергетики" и "авиастроители" -- у них будет отличаться сленг, отдельные термины. Именно на этом уровне можно будет договариваться, как переводить ISO 15288 -- и менять термин нажатием кнопочки (а не сложным и нудным процессом ручной замены с последующими грамматическими согласованиями).

Оно понятно, что в этот момент нужно быстро вытаскивать губозакатывательную машинку. Тем не менее, данный язык программирования языков будут использовать для проекта переводов на 23 языка, в числе которых есть и русский: http://www.molto-project.eu/ (The most research-intensive parts of MOLTO are the two-way interoperability between ontology standards (OWL) and GF grammars, and the extension of rule-based translation by statistical methods. The OWL-GF interoperability will enable multilingual natural-language-based interaction with machine-readable knowledge. The statistical methods will add robustness to the system when desired. New methods will be developed for combining GF grammars with statistical translation, to the benefit of both.).

Насчет "повышения устойчивости за счет использования статистических методов" ничего не скажу, но вот связь переводческой механики с семантическими технологиями на базе OWL -- это то, что доктор прописал.
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 1 comment