?

Log in

No account? Create an account
Лабораторный журнал -- Day [entries|friends|calendar]
Anatoly Levenchuk

[ website | Лабораторный журнал ]
[ userinfo | livejournal userinfo ]
[ calendar | livejournal calendar ]

Модель интеллектуальной обработки: ускорители в ассортименте. Вероятностный сопроцессор на подходе. [20 Aug 2010|09:41am]
Моя модель интеллектуальной обработки сводится к разнообразию используемых обработок знаний (и тем самым применяемых в этих обработках спецпроцессоров -- ровно как в мозге довольно много разных "зон" с их специализацией), но в целом я бы выделил три основных работы (давно об этом думаю, вот, например, переписка июля 2003г. http://community.livejournal.com/openmeta/24040.html, но тут я добавлю куски):
1. Вероятностная работа со "смыслами" (контекст-анализ), определяющая предметную область в достаточной мере, чтобы разобраться с омонимами и вообще речью. Распознавание образов тоже сюда относится: отнесение каких-то "образов" к смыслам.
2. Эвристичные логические алгоритмы для высокопорядковых логик в рамках контекста/микротеории, найденной в пункте. Понятное дело, из-за NP-характера (запредельная вычислительная сложность) задачи эти все решения являются "вероятными", и не факт, что здесь тоже не будут работать вероятностные алгоритмы, связанные с "распознаванием образов". Cyc, например, решает такие задачи введением марковской логики (где логические высказывания снабжаются вероятностями их истинности).
3. Собственно "логика", подразумевающая "точное решение" (например, SAT). Но это совсем специальный случай, а не самый частый. Это только недоразумение, что компьютеры ассоциирууются сегодня только с этими алгоритмами.
4. А еще должны быть симуляционные модели, которые воспроизводят какие-то сложные куски реальности (можно думать о какой-нибудь Моделике).
5. И так далее...

Современные исследования тоже где-то в этом русле (например, поглядите на работы последних лет от Cyc: http://cyc.com/cyc/technology/pubs, или вспомните тот же пакет по работе с натуральными текстами Apache UIMA http://uima.apache.org/). Прорывы в софте налицо: одни и те же данные молотят самыми разными методами -- сочетая вероятностные расчеты и строгий логический вывод, а часто еще и численное моделирование в рамках одной задачи.

Но главное, намечается существенный прорыв в аппаратуре. Когда-то думали, что пролог-машины или лисп-машины решат все задачи AI, но теперь очевидно, что этого недостаточно. Нужны обильные вероятностные расчеты, и поэтому процессорные ускорители должны быть не только "логическими", но и "вероятностными". И вот оно -- готовятся к выпуску (скоро, в 2013 году) аппаратные ускорители x1000 для вероятностных алгоритмов: http://www.hpcwire.com/features/Startup-Aims-to-Shake-Up-Computing-with-Probability-Processing-100816474.html?viewAll=y

Компьютер потихоньку обрастает ускорителями: графика, DSP для аудио, вероятностные алгоритмы. Мне кажется, что появление этого "лирического процессора" будет критическим для работы с текстами на естественном языке, и тем самым критическим для продвижения к общему искусственному интеллекту. Так что -- ждем-с с нетерпением.

Я сейчас участвую (дистанционно) в семинаре по онтологическому моделированию. Основная процедура в онтологическом моделировании -- это поиск, который (увы и ах) совершенно неинтеллектуальный в текущих системах. А заканчивается эта процедура тем, что объем знаний, в котором нужно искать следующим модельерам, растёт. Я вот склоняюсь к мысли, что интеллектуальный поиск смог бы в разы и разы облегчить задачу промышленных модельеров данных. Но люди, которые занимаются интеллектуальным поиском, и промышленные модельеры практически незнакомы друг с другом. Наверное, придется их познакомить: если не я, то кто?!
7 comments|post comment

Почему мне интересна теория категорий: она претендует на онтологический статус [20 Aug 2010|10:50pm]
_darkus_ перевел статью Baez про то, почему вообще так интересна теория категорий (раздел 1-5, раздел 4-5):

На текущий момент имеется исчерпывающая сеть взаимосвязанных аналогий между физикой, топологией, логикой и теорией информатикой. Они подсказывают, что исследования в области пересечения приведут к появлению новой науки: общей науки о системах и процессах. Создание такой науки будет крайне сложным. Имеются как позитивные, так и негативные причины для этого. Одной из негативных причин является то, что разные области исследований используют различную нотацию и терминологию.

Оригинальный Розеттский камень, созданный в 196 г. до н. э., содержит три версии одного и того же текста на трёх языках: на египетском в демотическом письме, на египетском в иероглифическом письме и на классическом греческом. Его находка солдатами Наполеона позволило современным египтологам расшифровать иероглифы. В конечном счёте это привело к кардинальному увеличению степени нашего понимания египетской культуры.

В настоящее время дедуктивные системы математической логики выглядят как иероглифы для большинства физиков. Абсолютно также квантовая физика похожа на греческий алфавит для большинства специалистов по информатике, и т. д. Так что имеется необходимость в новом Розеттском камне для того, чтобы помочь исследователям найти переводы для терминов из различных областей знания. Таблица 1 показывает авторское предложение того, как такой Розеттский камень может выглядеть.

Теория категорийФизикаТопологияЛогикаТеория вычислений
ОбъектСистемаМногообразиеВысказываниеТип данных
МорфизмПроцессБордизмДоказательствоПрограмма
Таблица 1. Розеттский камень (карманная версия)

Нижеследующий текст расшифровывает позиции данной таблицы, описывая то, как категории используются в физике, топологии, логике и теории вычислений. К сожалению, данные различные области знаний используют слегка различные виды категорий. Несмотря на то, что большинство физиков не знают термина, но в квантовой физике широко используются «компактные симметричные моноидные категории». Теория узлов использует «компактные закрученные моноидные категории», которые являются слегка более общими. Однако в 1990-х годах стало ясно, что эти более обобщённые понятия также полезны в физике. Логика и информатика заостряют внимание на «декартовых замкнутых категорий», где слово «декартов» видится антонимом слову «квантовый». однако благодаря работам в линейной логике и квантовых вычислениях некоторые логики и специалисты по информатике отбросили своё упорство в использовании декартовых категорий — теперь они изучают более общие виды «замкнутых симметричных моноидных категорий».
Кому как, а мне очень любопытно. Проблема в том, что я совсем не математик -- а чтение этой статьи, как мне кажется, предполагает хорошую математическую подготовку. Осталось дождаться, что лет за двадцать этот материал научатся растолковывать "на пальцах", доступно для школьников.

Дальше нужно смотреть на онтологии и теории категорий -- причем не на "онтологические формализмы" (типа http://suo.ieee.org/IFF/versions/20020515/IFFCategoryTheoryOntology.pdf или http://johnsymons.files.wordpress.com/2007/10/healy-tao-r3.pdf и даже свеженькое http://www.springerlink.com/content/4x37p1448xu1j334/ и вообще отечественная работа http://arxiv.org/abs/1008.1309), а философские заходы (то есть "соответствуют ли категории теории категорий философским категориям, которые позволят удобно перепаковать нынешнее знание человечества -- ибо они более точно соответствуют природе бытия и отвечают на вопрос, что есть в мире?" -- то есть ближе к http://larval-subjects.blogspot.com/2006/08/is-badious-ontology-consistent-with.html или работ Alain Badiou, типа http://ndpr.nd.edu/review.cfm?id=17765 или даже книжка про собственно философию теории категорий).
24 comments|post comment

navigation
[ viewing | August 20th, 2010 ]
[ go | previous day|next day ]