Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

AINL 2014 -- день первый

Сходил сегодня на конференцию AINL (http://ainlconf.ru/agenda) -- искусственный интеллект и естественный язык. Лингвистики было в количестве, искусственный интеллект пока не детектед. Совсем не детектед, что очень жаль.

Тусовка хвастается значениями метрик F1 для узнавания чего-то в текстах (http://en.wikipedia.org/wiki/F1_score, а "на пальцах" и по-русски, например, http://blog.gramant.ru/2012/06/06/f1-measure/). Узнаётся у каждого что-то своё высокоспецифичное, а значения метрики сегодня у людей типовая выше 0.9, у университетских узкоспециализированных программ 0.8, у коммерческих "унивесальных движков" порядка 0.7. Новички легко выходят на 0.6, а дальше нужно учиться.

Как я понял, опытные лингвисты уже прониклись необходимостью обращения к онтологиям, ибо уже понимают, что без них нельзя нынешние инвалидные лингвистические программы быстро-быстро исключительно глубокими нейронными сетками и прочими "машинными обучениями" доводить до гипервалидных с F1 лучше, чем у усталого и не очень внимательного человека не-лингвиста. В докладе ABBYY отметили, что их технологию сегодня делают человек 30 лингвистов и человек 10 онтологов (хотя тут нужно ещё разобраться, онтология ли там, или по-прежнему "онтолого-лингвистическая сеть"). Но пример ABBYY почти исключительный: онтологи среди лингвистов пока почти не встречаются.

Лингвисты и онтологи сильно различаются. Онтолог говорит о сущностях (окружающего мира, а хоть и об абстрактных сущностях -- "существующем"), лингвист в аналогичных ситуациях -- о "концептах" (которые абстрактны, но явно не существуют в реальном мире -- на "концепте самолёта" не полетишь, а вот на такой сущности реального мира, как "самолёт с серийным №23468835" -- вполне). Студенты-лингвисты бодро поддерживают разговор о поиске отношений часть-целое между словами (уточняя при переспросе, что речь идёт не о том, что одно слово является частью другого, а... -- и тут их речь становится неразборчивой). Лингвисты постарше радостно соглашаются, что нужно бы онтологию, и задумчиво перечисляют фамилии тех, кто этими онтологиями-в-лингвистике занимается.

Я проверил сегодня: в нашем онтологическом редакторе .15926 Editor (freeware, http://techinvestlab.ru/dot15926Editor) команда "import nltk" отличненько работает. Хотя большинство стендовых докладов ориентировались не на NLTK, а на Yandex Tomita Parser (http://api.yandex.ru/tomita/). Но ежели хочется быстро-быстро попробовать всю мощь связки современных технологий обработки текстов и онтологических технологий, то у нас оказывается не самый плохой для этого инструментарий.

Завтра тоже планирую пойти. Завтрашние темы даже поинтересней сегодняшних (обещают много разного рассказать про лингвистическое обеспечение для роботов).
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 7 comments