Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Соревнование в мире цифровых персональных помощников

Когда-то давным-давно фирма Майкрософт ввязалась в соревнование редакторов текста -- глянцевые компьютерные журналы публиковали ежемесячные сводки "кто лучше". Word постепенно по очкам победил всех конкурентов, после чего публиковать эти сводки стало бессмысленно. Затем то же самое произошло с электронными таблицами -- тоже постепенно, фича за фичей победителем стал Excel. Потом вышла интеграция всех этих программ как MS Office, и глянцевые компьютерные журналы перестали эти сравнения публиковать. Потом случилась битва браузеров, где время от времени публиковали скорость работы (всё остальное оказалось не таким важным). И вот пришло время очередной битвы: цифровых персональных помощников (Digital Personal Assistants, иногда их называют virtual assistants, виртуальных ассистентов). Stone Temple скормил Goole Assistant, Cortana, Alexa и Siri аж 5000 вопросов, которые им мог бы задать обыватель, и проверил правильность ответов -- https://www.stonetemple.com/digital-personal-assistants-test

Вот результаты:


Я своему телефону "ОК, Гугль" всё чаще и чаще говорю. Ибо он оказывается всё чаще и чаще не так уж и туп. Более того, он способен сообразить, что отвечать при цепочке вопросов с местоимениями вместо уже спрошенного раньше (это поразительно, насколько естественно происходит). И вот результаты замеров показывают, что он не тупее Google Assistant, и уж точно поумней всех остальных. Запомним.

И никаких IQ-тестов, никаких экзаменов с хитрыми задачками. Просто 5тыс. вопросов. Неделю назад все обсуждали сдачу китайским роботом AI-MATH вступительного экзамена в колледж по математике, он набрал без доступа в интернет 105 баллов из 150 возможных, а школьники набрали в среднем 109 баллов -- компьютер оказался лишь чуть-чуть тупей абитуриентов на этих экзаменах -- http://news.xinhuanet.com/english/2017-06/07/c_136347963.htm. Соревнование Stone Temple интересней: мне лично не приходится часто сдавать экзамен по математике для поступления в ВУЗ, а вот спрашивают у меня всякое разное очень часто (например, мой вьюнош регулярно удивляет меня разнообразием своих вопросов). И я, конечно, переспрашиваю у Гугля. А Гугль отвечает всё точней и точней, дай бог здоровья его разработчикам. Это не в исследовательской лаборатории происходит, это уже у меня в кармане, в телефоне.

Вот и добавить бы в таблицу Stone Temple строчку для человеков, отвечающих на 5000 вопросов. Думаю, что эти люди отвечали бы на эти вопросы исключительно обращаясь к этим персональным помощникам, ровно как и я это делаю. А сами по себе они бы это соревнование продули. Без гугляшки ты букашка, а с гугляшкой -- человек.

Мне подумалось, что первые вебсайты были тоже "разговорчивыми" -- там были длинные нарративы с отдельными словами, с которых ссылки вели на разные странички. Потом нарративы исчезли, и вместо них появились меню: меньше слов в разы, больше удобства тоже в разы. Вот я и думаю, что с голосовыми ассистентами может быть то же самое: вместо общей разговорчивости и художественности там будет разговорный минимализм на базе ключевых слов, как сейчас в поиске Гугля или запросах Вольфрамальфы. Персональному ассистенту вовсе не нужно мимикрировать под человека, как автомобилю не нужно мимикрировать под лошать или телегу. Поисковая система тем и хороша, что она не мимикрирует под ассистента. Она просто ищет ответы на вопросы, ответы к задачам, ответы на главные вопросы жизни, вселенной и всего такого.

Ну, а дальше конкуренция: если та же Cortana+Bing не будет поджимать Google Assistant+Google, а Alexa+не знаю, что там за поиск не будет поджимать Cortana+Bing в этих ответах на вопросы, мы не увидим быстрых улучшений. А так можно быть уверенными, что эти улучшения будут у всех поставщиков мирового ума. Я же для этого ума держу карман шире, у меня телефон для этого ума с экраном 5", держать карман уже не получается.
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 10 comments