Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Category:

Робот-престидижитатор, или экспоненциальные технологии на марше

Руку-манипулятор Dactyl научили сноровке -- она крутит предметы разной формы в руке: https://blog.openai.com/learning-dexterity/. Обучали в игровом мире в облаке, используя ровно те же алгоритмы обучения с подкреплением, которые используются для обучения агентов в играх-стрелялках (кстати, до сражения этих агентов с чемпионами-людьми в Dota 2 осталось всего пять дней, это будет 5 августа 2018 -- https://blog.openai.com/openai-five-benchmark/). Потом результаты обучения передавали реальному физическому роботу (использовали руку Shadow Dexterous Hand -- https://www.shadowrobot.com/products/dexterous-hand/). И всё получилось, в том числе манипулирование с предметами той формы, которая не использовалась при обучении.
robothand

В чём трудность? В обычной руке-манипуляторе 7 степеней свободы, а вот в манипуляторе-кисти 24 степени свободы. И датчики работают не все: объект проворачивается в руке, поэтому информация от датчиков всегда частична. И объект может быть заранее неизвестной формы (что не мешает его крутить человеку, но вот для робота это огромная проблема). А ещё трудно передать результаты обучения из виртуального мира физическому роботу так, чтобы всё заработало -- хотя сегодня это уже оказывается более-менее решаемая задача.

Хинт был в том, что применили приём domain randomization: вместо того, чтобы моделировать реальность поточнее, ровно наоборот -- добиваются разнообразия в моделировании, внося случайные возмущения и добиваясь устойчивости в поведении модели. Так сумели выучить агентов для стрелялок, так сумели выучить и руку робота. Так можно выучить ещё много каких агентов в виртуальном (необязательно игровом) мире, а потом и передать выученные умения в физический мир реальному роботу.

Получение руки, которая хоть как-то сравнима с рукой человека, Rodney Brooks, CEO фирмы, выпускающей Roomba, ожидал увидеть только в 2030 самое раннее, и считал, что только в 2040 году они станут распространены. Почему? А просто "за последние 40 лет в этой области не было существенных прорывов" -- https://rodneybrooks.com/my-dated-predictions/. Как это совместить с тем, что в области искусственного интеллекта идёт два прорыва в неделю? Никак. Вот вам и прорыв, хотя "прорывов не было 40 лет".

Всё то же самое, что и с видеоиграми, которые после победы в Го тоже ожидали на уровне, сравнимом с людьми, только через несколько лет. А они уже вот.

Экспоненциальные технологии именно так и работают: ничего, ничего, ничего, потом чуть-чуть и незначимо, и вдруг бабах -- и вот оно, а сразу быстро опять кабум -- и уже ой-ой-ой, мало никому не кажется.

Вот одна из оценок того, что происходит: в марте 2015 года создатель Keras (одной из библиотек глубокого обучения) Francois Chollet оценивал число занимающихся глубоким обучением в 10тыс. человек, а сейчас он оценивает это как примерно миллион, причём только его библиотекой из них пользуются порядка четверти миллиона человек -- https://www.pyimagesearch.com/2018/07/02/an-interview-with-francois-chollet/.

Вот этот миллион мозгов, который только-только пришёл в эту область и быстро-быстро набирается опыта, начинает изобретать во все тяжкие. То, что изобретает сегодня миллион неглупых человек, просто нельзя представить -- это может оказаться чем угодно. Два прорыва в неделю, и эти прорывы могут быть и в самих технологиях искусственного интеллекта, и в каких-то применениях этих технологий.

И не нужно недооценивать то, что происходит в части чисто человеческих (а не животных, как в случае обучения роботов движению, или агентов в стрелялках -- это ж те же животные в стае!) способностей. Человечьи способности -- это способности к абстрактному мышлению. В этом ведь тоже идут подвижки: https://deepmind.com/blog/measuring-abstract-reasoning/ пару недель назад как раз про измерение абстрактных рассуждений в нейронных сетях. Не померял -- не узнал успеха. А чтобы померять, нужно разобраться, что это за такая способность к абстракции, генерализации знаний о мире. Начали практически с тестов на "какой объект будет следующим в последовательности" на поиск закономерностей по образу и подобию человечьих IQ-тестов. Получили результаты абсолютно плохие, но для искусственного интеллекта более чем хорошие. И завершили статью прямым обращением к помянутому миллиону человек, занимающихся обучением машин: we wish to end by inviting our colleagues across the machine learning community to participate in our new abstract reasoning challenge. И наверняка ведь кто-то неглупый откликнется, и что-нибудь придумает!

Тут тоже будет ничего-ничего-ничего -- а потом бабах, и что-то придумают, кабум -- и люди с их способностями абстрагировать визуальные образы (пока только их, но и другие абстрагирования скоро последуют) окажутся далеко позади.

И это не единственная лаборатория, где пытаются заниматься интеллектуальными способностями как таковыми. Никогда в истории человечества ещё столько людей не пытались заниматься мышлением, да ещё и правильным инженерным способом -- не пытаясь повторить мышление живого существа. Нам не нужно мыслительного махолёта, который сотнями лет безуспешно делался по образу и подобию летающих птиц, нам нужно мыслительный самолёт. Самолёт не машет крыльями, но триста человек по воздуху домчит через полземного шара. Вот нам не нужно искусственного интеллекта, который мыслит так же, как человек. Нам нужен искусственный интеллект (даже не буду обсуждать, сколько при этом и каких агентов имеется ввиду, и как они коллективно взаимодействуют между собой и с людьми), который решает задачки круче, чем человек или даже какой-то коллектив людей.

Ну, и это всё будет дешевле грибов. Экспоненциальные технологии это просто те, которые становятся вдвое-втрое мощнее за год-полтора. Так уж получается, что есть выбор: или при той же цене вдвое мощнее, или при той же мощности вдвое дешевле. Так что всё это будет очень и очень быстро доступно и простым смертным.

Пожалуйста, не нужно тут писать в комментах стоны о том, куда при этом денутся люди, у которых роботы будут захватывать рабочие места. Никуда люди не денутся, я уже устал на эту тему писать. Люди будут радостно потреблять плоды дешёвого труда роботов -- плоды как физического труда, так и умственного труда. Что, собственно, уже и сейчас происходит во всевозрастающих количествах.

UPDATE: обсуждение в интернете -- https://www.facebook.com/ailevenchuk/posts/10213460663485055, https://www.facebook.com/groups/162254460635735/permalink/946384645556042/

UPDATE: вот ещё дешёвые "не-руки" и тренинг в реальном мире -- https://bair.berkeley.edu/blog/2018/08/31/dexterous-manip/
Subscribe

  • lytdybr

    Очередной апдейт "Методологии" закончен (порядка 50 страниц вписаны за 7 дней -- это была переработка материала из постов, посты были переработкой…

  • Опубликована новая версия курса "Методология"

    Опубликована новая версия курса "Методология". В текущей версии графы создания стали графами создателей. Также добавлены подразделы, описывающие…

  • Двухдневный открытый семинар "Инженерия всего на пороге 2025"

    Я решил провести открытый двухдневный лекционный семинар "Инженерия всего на пороге 2025". Пройдёт в Москве (если кто хочет участвовать очно, но…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 18 comments

  • lytdybr

    Очередной апдейт "Методологии" закончен (порядка 50 страниц вписаны за 7 дней -- это была переработка материала из постов, посты были переработкой…

  • Опубликована новая версия курса "Методология"

    Опубликована новая версия курса "Методология". В текущей версии графы создания стали графами создателей. Также добавлены подразделы, описывающие…

  • Двухдневный открытый семинар "Инженерия всего на пороге 2025"

    Я решил провести открытый двухдневный лекционный семинар "Инженерия всего на пороге 2025". Пройдёт в Москве (если кто хочет участвовать очно, но…