Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Мой слабый искусственный интеллект

Меня абсолютно не волнуют всякие разговоры про "универсальный разум", "сознание", "войну ботов и людей" и прочая голливудщина про сильный искусственный интеллект (strong AI). Соответственно, всякие идеологии "универсального мозга" -- фтопку. Меня интересуют не "универсальные искусственные мозги, не глупее среднего клерка", а абсолютно неуниверсальные недомозги (weak AI), которые могут решать отдельные задачи лучше профессионала. Экскаватор копает лучше землекопа, калькулятор считает лучше расчётчиков-на-бумаге-в-столбик, и мне не нужен мозг-экскаватор-и-калькулятор в одной коробке. Даже в коробке мне это не нужно, мне и обитающий в облацех сойдёт.

Мне и само название "искусственный интеллект" мало важно, мне нужно решать задачи, а вот лаптем, интеллектом или просто хорошим софтом -- уже неважно, лишь бы побыстрее и подешевле.

И ещё мне нужно следить за тем, что происходит, чтобы не вылететь из профессии консультанта. Консультанта по лопатам не пригласят в бригаду экскаваторщиков, консультанта по логарифмической линейке не пригласят в лабораторию киберфизического моделирования. Мои проекты чаще всего -- это старт-ап сопровождение корпоративных программ технологического развития (от запуска технологий рынка ценных бумах и интернета в 90-х, торговли электроэнергией и методов управления проектами в нулевых, моделе-ориентированной системной и организационной инженерии прямо сейчас). Поэтому мне важно заранее готовиться к тому, что произойдёт. А произойдёт интересное: похоже, застой в computer science закончился.

1. На глобусе опять пошло языкостроительство, хотя и не сравнимое ещё по масштабу с работами 70-х, но уже хоть как-то заметное. До этого мне казалось, что 90-е и нулевые -- потерянные на ОО годы. Нет, мультипарадигмальность идёт в массы, хотя иногда очень странными путями (так, факт-ориентированная модель данных идёт через задницу, каковой является semantic web стек стандартов). В любом случае, сдвинулись даже с SQL, и разных видов баз данных сейчас не меньше, чем в начале 80-х (когда в ВУЗах учили про деревянные, CODASYL и реляционные базы данных, ибо наличествовали все, а уж "непонятно каких" вариантов было ой-ой-сколько).

2. О параллельности долго и много говорили. Теперь делают. Параллельность теперь поддерживается и аппаратурой (хотя бы на уровне GPU в каждом телефоне, а также компьютерными сетями как в кластерах, так и Интернетом в целом, чего уж там). Аппаратура таки научилась быть шустрой и маломощной, а также многопамятной. Датчики и дисплеи стали дешёвыми.

3. В алгоритмах машинного обучения таки случился прорыв: глубокие архитектуры (deep architecture) научились обрабатывать нелинейности в многомерных данных. Это совсем новенькое, с 2006г.

4. А теперь всё это начало слипаться в длинные технологические цепочки, с результатами, которые невыразимы в терминах отдельных составляющих их технологий. И вот эти результаты меня и интересуют.

В слабом AI я грубо различаю (хотя и понимаю их тесную связь, например, эквивалентность перцептронов с минимизацией энергетической функции символическому выводу):
-- моделирование, восприятие: когда нужно как-то обеспечить соответствие между системами А и B. Это мэпперы, распознаватели, движки метафор и блендинга, абдукции и рассуждения по аналогии. В обратную сторону (демоделирование, воплощение) -- генераторы, рендеры. Наблюдательность, памятливость и находчивость.
-- вычисления, рассуждение: когда есть "дано" и "требуется найти/доказать". Солверы, оптимизаторы и прочие "символьные думатели". Занудство и точность.
-- обеспечение гибридности (когда и моделей много, и вычисления по ним самые разные -- а потом принимается как-то решение). Мудрость и надёжность.

Вот такой мой слабый искусственный интеллект. Никакого сознания, разговор только по делу, а не "о душе". Впрочем, если делом является разговор о чьей-то душе, то тоже ОК -- только не нужно рассуждений о сходстве или различиях искусственного и ествественного интеллекта "вообще" и "всегда" и "обычно", но можно рассуждать о качестве выполнения чётко поставленной задачи в среднем человеком и нежитью, хоть конкурсы проводить. Не требовать победы одной программы в разных конкурсах. Не антропоморфизировать нежить. Не, не, не. Не нужно мне пока AGI (хотя, конечно, очень и очень любопытно -- но только в качестве хобби).

Вот несколько интересных для меня (то есть не для всех) ссылочек только по одной теме, глубокому обучению (deep learning):
-- списочек последних достижений в виде побед в соревнованиях команды IDSIA, с некоторыми комментариями: http://www.kurzweilai.net/how-bio-inspired-deep-learning-keeps-winning-competitions
-- пример сервиса "под ключ": виртуальный клерк в call-centre: http://www.interactions.net/ (интересная бизнес-модель: они берут не за минуту разговора, а только за законченную успешную трансакцию).
-- ещё один сервис под ключ: сержант Стар, отвечальщик для новобранцев -- http://www.fastcompany.com/3003716/siri-yes-siri-sgt-star-becomes-armys-version-apples-digital-assistant
-- яндексовские "пробки из будущего": http://yandex.livejournal.com/250587.html
-- русская лента ресурсов по deep learning: http://vk.com/deeplearning
-- тусовка в Google+ по deep learning: https://plus.google.com/communities/112866381580457264725
-- исследователи в области deep learning (на их страницах и появляется всё свеженькое): http://vk.com/topic-44016343_27630498
-- самое сильное улучшение последних лет (июль 2012г.), метод dropout: http://arxiv.org/abs/1207.0580
-- компактный список питоновских ссылок (для курса SPSC 540 Machine Learning): http://www.cs.ubc.ca/~nando/540b-2011/python.php
-- вот люди в Онтарио занимаются машинным обучением мэппингу схем данных. Обучающий набор данных: http://archive.ics.uci.edu/ml/datasets/Northix (там огромный репозиторий наборов данных для обучения алгоритмов -- http://archive.ics.uci.edu/ml/). Это и есть "courseware для нежитей". Надо как-нибудь пост про это написать.
-- русскоязычное гнездо машинного обучения (более 700 страниц): http://www.machinelearning.ru (и там тоже система для тестирования алгоритмов на реальных задача: http://poligon.machinelearning.ru).

Обратим внимание, что deep learning (и machine learning в целом) -- это прежде всего про алгоритмы и их разнообразие. Грубо говоря, про молотки. А те люди, которые интересуются гвоздями, то есть данными и их разнообразием, занимаются data mining, у них другой предмет, другие тусовки, другие инструменты. Но молоток и гвоздь обязательно встретятся. И мы помним, что посторонние люди часто путают data mining и deep learning (шутка об этом "интеллектуальном анализе" была тут: http://ailev.livejournal.com/1035883.html).

Вот пара ссылок по "интеллектуальному анализу" (data mining):
-- основное гнездо data mining: http://www.kdnuggets.com/ (обратите внимание, как это коммерциализовано! Это вам не наука с её алгоритмами. Это добыча вполне конкретного золота из вполне конкретных данных, со всеми вытекающими. Ресурс огромный, в нём легко заблудиться и он перешпигован рекламой).
-- про самоназвание "учёный по данным" (data scientist) http://allthingsanalytics.com/2012/03/04/data-scientist-too-narrow-a-definition/
-- почти шутки юмора по "науке данных" (data science): http://analyticsmadeskeezy.com/2012/11/05/check-yo-self-5-things-you-should-know-about-data-science-author-note/
-- пример среды для data mining -- питоновский Orange. В этих системах только-только начинают появляться методы deep learning в виде подключаемых плагинов и доступных библиотек. Но "рама есть, картина будет" -- http://orange.biolab.si/ (понятно, что подобных коммерческих и "коммерческих open source" систем -- тьма тьмущая, рейтинг использования в 2012г. тут: http://www.kdnuggets.com/polls/2012/analytics-data-mining-big-data-software.html).

Слабый искусственный интеллект появляется в количестве, когда все эти data mining встречаются с machine learning и многими другими методами. Про эти другие методы, например, работу с текстом, абдукцию и гибридные рассуждения -- как-нибудь в следующий раз. Про датчики и эффекторы (и далее робототехнику) -- тоже когда-нибудь потом. И никаких "может ли машина думать", или "мы не там ищем искусственный интеллект, нужны принципиально иные архитектуры", или "что такое интеллект", или "где у вас тут саморазвитие интеллекта?". Не нужны рассуждения, нужны приложения.
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 29 comments