Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Category:

Новый материал для нитей мировой паутины и эрудитные системы

Интернет-стандарты проходят интересные шаги развития.

В семантический веб (который, как мы помним, должен был стать web 3.0, но всё никак) подложена бомба в виде свежепринятого W3C стандарта JSON-LD (LD=Linked Data). Этот стандарт руководителем его разработки был задуман как прямое противодействие засилью стека TURTLE/SPARQL/Quad Stores -- http://manu.sporny.org/category/json-ld/

А вот ещё одна новость: http/2 отныне с No More Text, вторая версия стала binary protocol -- http://www.mnot.net/blog/2014/01/30/http2_expectations

Хорошая тема для Ontology Summit 2014 хакатона: поразбираться в представлениях данных:
-- presentation в виде веб-страничек для linked data как в предложении vvagr http://ontolog.cim3.net/forum/ontology-summit/2014-02/msg00065.html,
-- representation в виде целого букета форматов -- от XML/RDF и Turtle до JSON-LD с CVS for Web для табличных данных http://www.w3.org/2013/05/lcsv-charter с размышлениями о приложимости новых реалий http/2, раз уж речь идёт о Linked Data). Можно сюда и побольше форматов добавить (например, эксперименты, которые делает с форматом представления данных justy_tylor). Придумать какие-то метрики, сделать какие-то замеры по удобству парсинга и порождения.

Отдельно -- это поразмышлять, как добавить в эти форматы семантику (отвечая на критику John Sowa про то, что Semantic Web сгорел именно на том, что слишком много занимался синтаксисом и мало семантикой). Но тут правильно понимать, какую именно нужно добавлять семантику, чтобы не переборщить.

Интересным критерием для языковой ступеньки тут может быть подход IBM Watson, в котором онтологии используются, но только не для формального логического вывода (ибо "трудно перевести запрос на естественном языке в логическую форму, но ещё трудней потом делать логический вывод, так как все знания у нас в текстовом виде, а не формализованы" -- см. презентацию и рассказ Chris Welty из IBM Research на прошлой сессии Ontolog Summit 2014 -- http://ontolog.cim3.net/cgi-bin/wiki.pl?ConferenceCall_2014_01_30). Я бы хорошо подумал: а какой язык представления данных нам нужен для тех "онтологий" (пока возьмём это слово в кавычки), которые используются для поддержки работы систем, похожих на IBM Watson? Назовём эти вопросно-ответные системы на базе корпусов текстов "эрудитными системами", чтобы подчеркнуть их отличие от "экспертных систем" на базе трипл-сторов и логического вывода.
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 17 comments