?

Log in

No account? Create an account
Лабораторный журнал -- Day [entries|friends|calendar]
Anatoly Levenchuk

[ website | Лабораторный журнал ]
[ userinfo | livejournal userinfo ]
[ calendar | livejournal calendar ]

Пример очередного технологического прорыва: распознавание речи [22 Dec 2014|03:40pm]
Прорыв в распознавании речи -- это хороший пример опровержения аргумента "вы уже двадцать лет говорите, что XXX будет реализовано, и ничего этого не происходит. Значит, и не произойдёт". Вот статья 2010 года, в которой говорится, что в распознавании речи давно ничего не происходит, поэтому "зелен виноград" -- делается вывод о том, что распознавание речи в управлении компьютеров вовсе не нужно: http://blog.codinghorror.com/whatever-happened-to-voice-recognition/, ибо люди делают ошибку распознавания речи 2-4%, а у компьютера ошибка много-много лет зашкаливает за десяток процентов и прогресса не наблюдается.

Но вот свеженький материал о достижениях известного профессора Andrew Ng, который сейчас помогает Baidu -- https://gigaom.com/2014/12/18/baidu-claims-deep-learning-breakthrough-with-deep-speech/. Без шума система Baidu Deep Speech распознаёт речь с ошибкой 6.56%, и только в условиях зашумлённости ошибка идёт в одном слове из пяти (19.06%). Бывший чемпион был Google API, у которого эти результаты были 6.64% без помех и 30.47% в условиях шума. Интересно и то, что новые алгоритмы распознавания очень щадяще относятся к вычислительным ресурсам и памяти.

Поэтому больше никакого "зелёного винограда" (https://gigaom.com/2014/09/04/baidu-says-its-massive-deep-learning-system-is-nearly-complete/): Baidu CEO Robin Li told Bloomberg that 10 percent of the company’s search queries are currently done by voice, and that voice and image search will surpass text queries within five years.

UPDATE: у Google Now способности ещё круче оказались -- он имеет подотчётные Гуглю (и заодно спецслужбам) "волшебные уши", то есть внимательно слушает окружение и понимает, какие фильмы вы смотрите и какие песенки слушаете. О чём может рассказать вам (ну, или кому-нибудь): http://bgr.com/2014/12/11/best-google-now-tricks-jeopardy/

В тексте по первой ссылке (2010 год! Всего четыре года назад!) также обсуждается уход от систем распознавания рукописного текста -- по причине того, что качество этого распознавания плохое. В 2014 году системы распознавания текста работают не хуже, а в некоторых случаях и лучше человека (superhuman performance -- http://ailev.livejournal.com/1102234.html).

И таких технологических прорывов в самых застойных проблемах сейчас множество, так что аргумент "вы много лет нам об этом рассказываете, а воз и ныне там" сегодня никак нельзя считать сильным аргументом. Жизнь меняется, жизнь меняется быстро.
26 comments|post comment

lytdybr [22 Dec 2014|06:29pm]
На солнечном колесе обозрения сегодня окончание наступления сил тьмы, а уже через квартал света и тьмы будет поровну.

Новое исследование: результаты обучения больше кореллируют с личностными качествами, нежели с IQ учащихся -- http://www.eurekalert.org/pub_releases/2014-12/gu-poi121614.php. Самооценка своих личностных качеств тоже подойдёт для прогноза, но when people who know the student well provide the personality rating, it is nearly four times more accurate for predicting grades. Ну, и Previous studies have shown that students who think they are smart often stop trying and their performance declines over time, while those who consider themselves hard workers get progressively better. Остаётся только вспомнить, что личные качества тоже во многом генетически обусловлены.

Пришли результаты олимпиады МФТИ по математике: отрок решил там полностью 3 задачи и надкусил (не привёл разные способы решения, не расписал подробно решение) ещё две из всего шести. Задачи там оказались одинаковыми для потоков шестого и седьмого класса. Мама в ужасе от таких плохих результатов (её критерий: отсутствие успеха), я и отрок вполне счастливы (наш критерий: отсутствие неуспеха). Главное, получен опыт.

Вышел свободный софт Capella (http://www.polarsys.org/capella/) для MBSE, причём основным языком там не SysML. Софт поддерживает методологию разработки Arcadia (http://www.polarsys.org/capella/arcadia.html). Это подарок от системных инженеров Thales: Arcadia is currently applied in most Thales business units, in many countries, on very large or small projects, by hundreds of users.

Прочитал пересказ моего доклада на HappyDev как его понял один из участников (https://vk.com/wall-26044456_387) и пришёл в ужас: новые слова все услышаны и повторены -- но их значение, соотношения друг с другом и связь их с реальной жизнью не поняты. Совсем. Немудрено, я замерял трудность текстов своей книжки на сервисе проверки читабельности http://ru.readability.io/ -- значительная часть текстов уровня 4-6 курса ВУЗа. Тем не менее, основная задача следующей версии текста (по плану это будет к февралю) -- это доработка содержания: сборка всех нужных идей в одном тексте, а не выработка способа изложения и тем самым снижение образовательного ценза для восприятия этого текста. Мультитаскинг нужно удавливать -- его и так в жизни хватает. А пока зажмуриться, терпеть и воспринимать такие пересказы как ценную обратную связь.

Кстати, об "обратной связи". Современная кибернетика без произнесения самого слова "кибернетика" сегодня такая: Sensing and Acting Under Information Constraints -- http://johncarlosbaez.wordpress.com/2014/10/30/sensing-and-acting-under-information-constraints/.
5 comments|post comment

navigation
[ viewing | December 22nd, 2014 ]
[ go | previous day|next day ]