Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Categories:

Наш способ ускорить разбирательство с непонятками в жизни: дать людям цивилизационные priors.

Основная гипотеза, которая сейчас отрабатывается в области AI -- это то, что интеллект получается за счёт очень простого алгоритма, который работает с огромными вычислениями по разбирательству с непонятками встреченных им ситуаций (тезис Sutton, http://incompleteideas.net/IncIdeas/BitterLesson.html). Чтобы уменьшить количество этих вычислений, алгоритм должен получить в свой состав какие-то удачные эволюционные находки по поводу структуры мира, innate priors, как их называли вначале, а потом и вовсе сократили до priors. Это то, что интеллекту известно о мире "из коробки", "по конструкции", до того, как его начали учить. Количество вычислений при правильно выбранных priors уменьшается в десятки тысяч раз.

Текущие алгоритмы глубокого обучения практически не содержат этих priors. Уж заведомо содержат их меньше, чем мозги ребёнка. Поэтому и работают медленно и плохо. Так что одно из направлений сегодняшних исследований -- снабдить эти алгоритмы хотя бы такими же priors, которые есть у новорождённых человеков, чтобы ускорить мышление этих алгоритмов. Интеллект ведь -- это прежде всего про скорость мышления, скорость научения решать проблемы в какой-то предметной области, разбираться с непонятками. François Chollet в https://arxiv.org/abs/1911.01547 предположил, какие там у ребёнка priors, и дал набор тестов, которые должны демонстрировать, что предлагаемые всё новые и новые алгоритмы AI быстро решают задачи, требующие этих priors -- в надежде на то, что такие алгоритмы будут учиться дальше не хуже алгоритма в дитячьем мозгу.

Ещё один способ тестировать эти priors -- давать компьютеру решать те задачи, с которыми хорошо справляется человек. Например, набор из 57 видеоигр Atari. Выяснилось, что большинство priors, с которыми работает интеллект ребёнка, касается умения распознавать объекты окружающего мира. И в алгоритм, который учится играть во все эти 57 игр сразу были добавлены эти человеческие priors. И алгоритм начал учиться играть во все эти игры (то есть научился справляться с новой проблемой, которой раньше ещё не видел, то есть проявлять силу своего интеллекта) за меньшее число проб и ошибок, чем человек. И работает этот алгоритм в 10тыс. раз (четыре порядка!) быстрее, чем алгоритм без priors. Вот эта работа: "Self-Supervised Object-Level Deep Reinforcement Learning", https://arxiv.org/abs/2003.01384. Авторы William Agnew и Pedro Domingos (тот самый, который написал The Master Algorithm) пишут: Current deep reinforcement learning approaches incorporate minimal prior knowledge about the environment, limiting computational and sample efficiency. We incorporate a few object-based priors that humans are known to use: "Infants divide perceptual arrays into units that move as connected wholes, that move separately from one another, that tend to maintain their size and shape over motion, and that tend to act upon each other only on contact" [Spelke]. We propose a probabilistic object-based model of environments and use human object priors to develop an efficient self-supervised algorithm for maximum likelihood estimation of the model parameters from observations and for inferring objects directly from the perceptual stream. We then use object features and incorporate object-contact priors to improve the sample efficiency our object-based RL agent.We evaluate our approach on a subset of the Atari benchmarks, and learn up to four orders of magnitude faster than the standard deep Q-learning network, rendering rapid desktop experiments in this domain feasible. To our knowledge, our system is the first to learn any Atari task in fewer environment interactions than humans.

Мы делаем тот же самый ход, который люди из AI делают со своими простыми алгоритмами. Они добавляют человечьи priors, чтобы их алгоритмы стали в десять тысяч раз быстрее. Мы берём простые алгоритмы мышления в мозгах обычных (и даже уже образованных!) людей и добавляем state-of-the-art цивилизационные priors, которые выработало коллективное человеческое мышление буквально только что, в 21 веке. Спецы по AI переносят priors из мозга человека в железку компьютера, а мы переносим priors из цивилизации -- в голову человека. Мы называем эти priors трансдисциплинами (ибо это "по ту сторону прикладных дисциплин", то, что относится к "общему интеллекту", "силе мозга", а не прикладным компетенциям). Про то, что интеллект это не про прикладные компетенции, а возможности по быстрому с ними разбирательству я писал в https://ailev.livejournal.com/1498481.html (там подробней про подход François Chollet в https://arxiv.org/abs/1911.01547).

Дальше я напишу то, что писал в разных местах уже много раз. Какие именно мы берём цивилизационные priors, то есть какие именно трансдисциплины мы берём для инсталлирования их в человечьи мозги, чтобы работа этих мозгов в новых предметных областях оказывалась быстрой (может и не в десять тысяч раз, но весьма и весьма ощутимо):
-- функционально-ориентированное сознание (это нижний уровень, практически мы тренируем priors, заложенные в мозг матерью-природой. Медленное мышление S2 по Канеману должно работать как часики. У кошечек его нет, а у людей есть -- но только тех, которые выросли не в лесу, выкормленные волками. Вот нам надо, чтобы человек в режиме медленного мышления и глубоких размышлений мог провести часы, а не секунды. Клиповое мышление, блуждающее внимание -- это зло. Понятийное мышление нужно тренировать, чтобы возможности именно человеческого мозга проявились). У нас нет курса на эту тему, но уже есть доклад, где такой курс как-то рассматривается как priors, необходимые для научения решать проблемы в онтологике и коммуникации: https://www.youtube.com/watch?v=8D8cfcJ20zI
-- онтологика и коммуникация. Это priors о том, что есть актуальный физический мир, но мы можем его очень по-разному описывать, добиваясь в этом мире каких-то своих целей. Есть агенты, их много, цели у них разные, они взаимодействуют и строят описания мира и себя (онтология), рассуждают про мир и достижения целей (логика), при этом ещё и общаясь с использованием кулаков или мирно (коммуникация). Описания могут быть более или менее правдоподобными (наука), а цели более или менее злобными по отношению к другим агентам (этика). Есть курс https://system-school.ru/united
-- системное мышление про то, что описания нужно делать на многих уровнях по отношению частей и целых, и есть очень важные описания (минимально: описание функциональности, конструктивного устройства, пространственного размещения, но это только начало), которые просто таки нужно сделать, чтобы достигнуть цели, понимаемой как успешно созданная система. Успешная -- это когда множество агентов, которым для чего-то эта система нужна, договорились. На эту тему есть онлайн-курс https://system-school.ru/sm2019, курс для школьников и студентов https://system-school.ru/intro, практикум https://system-school.ru/praktikum, вводный курс https://system-school.ru/base
-- вычислительное мышление про то, как работать со всеми этими моделями, чтобы рассуждать с их использованием. Ведь их могут интерпретировать как люди, так и компьютеры. Они могут быть изложены на самых разных языках, и они могут быть ещё и коннективистскими (те же нейросетевые модели). У нас нет пока на эту тему курса, есть только постановка задачи: https://ailev.livejournal.com/1477090.html

Если есть эти priors, то у вас уже более-менее налажено скоростное (а не медленное! в этом фишка!) мышление о чём угодно. Но можно ещё больше ускорить разбирательство с новыми практиками, если дать знания о том, как делаются проекты -- как в самых общих чертах устроена человеческая деятельность. Мы называем эти priors деятельностным кругозором (думаем о нём как прохождении трёхдневного курса по каждой перечисленной практике):
-- системная инженерия (разработка концепции использования, инженерия требований, инженерия системной архитектуры, управление конфигурацией и изменениями/жизненным циклом, проверка и приёмка). Курс у нас есть -- https://system-school.ru/engineering
-- системный менеджмент (операционный менеджмент/цепи поставок/логистика, управленческий учёт и контроллинг, инженерия предприятия и архитектура предприятия/технологический менеджмент, организационные изменения/развитие и системное лидерство) – это мой курс https://system-school.ru/sms
-- системное предпринимательство (стратегирование, продвижение продукта, корпоративные финансы, корпоративная поднадзорность/governance), курса пока нет, но стратегирование уже вошло в мой курс.
-- ... остальные сферы деятельности (политика и политэкономия, религия, искусство, наука, образование и просвещение, здравоохранение, спорт, право, армия, частная жизнь/семья). Из курсов тут у нас пока только курсы по личному развитию (как учиться эффективно https://system-school.ru/study, телесная инженерия https://system-school.ru/body и системный фитнес https://system-school.ru/move, а также временно прерванный в силу форс-мажора социальный мультиданс https://system-school.ru/multidance. Да, мультиданс делается тоже на основе трансдисциплины системного мышления, см. набор ссылок на посты об этом в https://vk.com/wall-179019873_624).

При этом мы понимаем, что вот так обученный самым крутым цивилизационным priors, то есть самым крутым трансдисциплинам человек живёт и работает обычно на в одиночку, поэтому наша картина мира более сложна. Текущий пост лишь раскрывает пункт второй "2. Для усиления интеллекта людей нужно:" поста "Дело спасения утопающих -- дело интеллекта самих утопающих" https://ailev.livejournal.com/1509601.html, используя идеи из тамошнего пункта первого "1. Интеллект как результат бесконечного развития (open endedness)". Хотя наши курсы системного фитнеса можно отнести и к пункту "5. Embodied intelligence", а в кругозоре по системному менеджменту и стратегированию я существенно раскрываю содержание пункта "4. Обеспечивать распределённое по людям и компьютерам мышление".

UPDATE: обсуждение в https://www.facebook.com/ailevenchuk/posts/10217996881727676 и https://freefeed.net/ailev/56441e78-c54f-41bc-9383-42fc842c27ed
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 5 comments