?

Log in

No account? Create an account
Лабораторный журнал -- Day [entries|friends|calendar]
Anatoly Levenchuk

[ website | Лабораторный журнал ]
[ userinfo | livejournal userinfo ]
[ calendar | livejournal calendar ]

AINL 2014 -- день первый [12 Sep 2014|10:10pm]
Сходил сегодня на конференцию AINL (http://ainlconf.ru/agenda) -- искусственный интеллект и естественный язык. Лингвистики было в количестве, искусственный интеллект пока не детектед. Совсем не детектед, что очень жаль.

Тусовка хвастается значениями метрик F1 для узнавания чего-то в текстах (http://en.wikipedia.org/wiki/F1_score, а "на пальцах" и по-русски, например, http://blog.gramant.ru/2012/06/06/f1-measure/). Узнаётся у каждого что-то своё высокоспецифичное, а значения метрики сегодня у людей типовая выше 0.9, у университетских узкоспециализированных программ 0.8, у коммерческих "унивесальных движков" порядка 0.7. Новички легко выходят на 0.6, а дальше нужно учиться.

Как я понял, опытные лингвисты уже прониклись необходимостью обращения к онтологиям, ибо уже понимают, что без них нельзя нынешние инвалидные лингвистические программы быстро-быстро исключительно глубокими нейронными сетками и прочими "машинными обучениями" доводить до гипервалидных с F1 лучше, чем у усталого и не очень внимательного человека не-лингвиста. В докладе ABBYY отметили, что их технологию сегодня делают человек 30 лингвистов и человек 10 онтологов (хотя тут нужно ещё разобраться, онтология ли там, или по-прежнему "онтолого-лингвистическая сеть"). Но пример ABBYY почти исключительный: онтологи среди лингвистов пока почти не встречаются.

Лингвисты и онтологи сильно различаются. Онтолог говорит о сущностях (окружающего мира, а хоть и об абстрактных сущностях -- "существующем"), лингвист в аналогичных ситуациях -- о "концептах" (которые абстрактны, но явно не существуют в реальном мире -- на "концепте самолёта" не полетишь, а вот на такой сущности реального мира, как "самолёт с серийным №23468835" -- вполне). Студенты-лингвисты бодро поддерживают разговор о поиске отношений часть-целое между словами (уточняя при переспросе, что речь идёт не о том, что одно слово является частью другого, а... -- и тут их речь становится неразборчивой). Лингвисты постарше радостно соглашаются, что нужно бы онтологию, и задумчиво перечисляют фамилии тех, кто этими онтологиями-в-лингвистике занимается.

Я проверил сегодня: в нашем онтологическом редакторе .15926 Editor (freeware, http://techinvestlab.ru/dot15926Editor) команда "import nltk" отличненько работает. Хотя большинство стендовых докладов ориентировались не на NLTK, а на Yandex Tomita Parser (http://api.yandex.ru/tomita/). Но ежели хочется быстро-быстро попробовать всю мощь связки современных технологий обработки текстов и онтологических технологий, то у нас оказывается не самый плохой для этого инструментарий.

Завтра тоже планирую пойти. Завтрашние темы даже поинтересней сегодняшних (обещают много разного рассказать про лингвистическое обеспечение для роботов).
7 comments|post comment

navigation
[ viewing | September 12th, 2014 ]
[ go | previous day|next day ]