Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Об неуниверсальность нынешних нейросеток

Я уже перестал удивляться новостям из DeepMind, но они там замутили новую софтинку, AlphaZero. Вот: https://arxiv.org/abs/1712.01815

AlphaGo Zero tuned the hyper-parameter of its search by Bayesian optimization. In AlphaZero they reuse the same hyper-parameters for all games without game-specific tuning. The sole exception is the noise that is added to the prior policy to ensure exploration; this is scaled in proportion to the typical number of legal moves for that game type. Like AlphaGo Zero, the board state is encoded by spatial planes based only on the basic rules for each game. The actions are encoded by either spatial planes or a flat vector, again based only on the basic rules for each game. They applied the AlphaZero algorithm to chess, shogi, and also Go. Unless otherwise specified, the same algorithm settings, network architecture, and hyper-parameters were used for all three games.

Затем они победили самые сильные компьютерные программы по этим видам игр -- используя один и тот же алгоритм.

Фишка в том, какое время обучения они затратили (правда, это время аж 64 TPU второго поколения для обучения сетки, тем не менее). In chess, AlphaZero outperformed Stockfish after just 4 hours (300k steps); in shogi, AlphaZero outperformed Elmo after less than 2 hours (110k steps); and in Go, AlphaZero outperformed AlphaGo Lee (29) after 8 hours (165k steps).

Дальше пообсуждайте "неуниверсальность алгоритмов машинного обучения" и покажите мне универсального человека, которого за сутки можно подготовить стать чемпионом мира по шахматам, японским шахматам (шоги) и заодно Го.

Конечно, все эти новые алгоритмы ещё не вышли на массовые применения, но достижимость такой постановки задачи уже показана. Теперь нет вопроса, "а возможно ли такое?", есть вопрос "когда любой кофейник и холодильник такое смогут?".

И, конечно, при таких требованиях к вычислительным ресурсам растёт запрос на оптимизацию распределения вычислений между железом и софтом:
-- соревнование, которое бьёт в эту точку: Pareto efficient deep learning (http://cknowledge.org/request-cfp-asplos2018.html). A ReQuEST artifact evaluation committee (AEC) will be tasked to reproduce and evaluate workflow submissions on compliant hardware platforms to aggregate results in a multi-objective public leaderboard. Due to the multi-faceted nature of the competition, submissions won't be ranked according to a single metric, but instead the AEC will assess their Pareto optimality across two or more metrics. There won't be a single ranking of submissions since this competition is multi-objective: it accounts for classification accuracy, inference latency, energy, $ cost of the platform and TCO. As such, there won't be a single winner, but better and worse designs based on their relative Pareto optimality.
-- конференция с акцентом на железо для глубокого обучения: SysML (не путать с архитектурным языком SysML!), http://www.sysml.cc/. SysML is a new conference targeting research at the intersection of systems and machine learning. The conference aims to elicit new connections amongst these fields, including identifying best practices and design principles for learning systems, as well as developing novel learning methods and theory tailored to practical machine learning workflows.

Два прорыва в неделю, на многих и многих уровнях технологического интеллект-стека. И универсальность ровно такая же, как и у человека: ни один человек не может сделать всего того, что умеют делать все остальные люди. Ну так и ни одна программа или аппаратура не может делать всего. Но один человек оказывается чуток более универсален, чем об этом можно подумать. Так и одна программа и одна аппаратура оказываются чуток более универсальны, чем об этом можно подумать. При этом неуниверсальность алгоритмов и аппаратуры для них и универсальность людей сильно преувеличиваются.

Я полностью согласен с тезисом Сергея Шегурина (https://yadi.sk/d/b_F4_lxC3Pj2fq):
-- интеллект людей сегодня сильно переоценен
-- интеллект софта+железа сегодня сильно недооценен

UPDATE: обсуждение в фейсбуке -- https://www.facebook.com/ailevenchuk/posts/10211785845295647, ВКонтакте -- https://vk.com/wall-44016343_17607, freefeed -- https://freefeed.net/ailev/e7e2cc5e-a8e9-4375-a2fc-5bfabb6eb996
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 148 comments