2019

Современное бесконечное развитие

Современное бесконечное развитие, onen-endedness as stepping stones through fog (via https://www.minds.com/newsfeed/1198559708823244800).


Буду летом переписывать "Образование для образованных 2020" на версию 2021 года, не поменять ли обложку? А то как-то несовременно пока, https://ridero.ru/books/obrazovanie_dlya_obrazovannykh/
2019

Полиция алгоритмов

Первое решение по уничтожению алгоритма в США было 11 января 2021: федеральная торговая комиссия (FTC) сказала фирме Paravision уничтожить не только датасет тайно от пользователей собранных данных, но и алгоритмы, полученные с использованием этих датасетов (грубо говоря, уничтожить нейронную сетку, и наверняка не одну) -- https://onezero.medium.com/the-ftc-forced-a-misbehaving-a-i-company-to-delete-its-algorithm-124d9f7e0307. Раньше в подобных случаях требовалось удалять только наборы данных, но не созданные по ним алгоритмы, а теперь и алгоритмы тоже. Я бы заодно предложил сделать лоботомию людям, работавшим с этим набором данных и алгоритмами, ибо их мокрая нейронная сетка ведь тоже чему-то научилась!

UPDATE: Обсуждение в фейсбуке -- https://www.facebook.com/ailevenchuk/posts/10220244552198033
2019

Раса и гендерас

Вот тут предложили "мультирасовую белость": объявлять белыми небелых, если они ведут себя как белые (проводят политику белых!) -- https://www.washingtonpost.com/opinions/2021/01/15/understand-trumps-support-we-must-think-terms-multiracial-whiteness/. Такое мы уже видели, оторванный от пола гендер. Предлагаю назвать оторванную от расы принадлежность к расе по аналогии -- гендерасом.

Бесцензурный комментарий Сергея Кузнецова см. тут: https://www.minds.com/newsfeed/1197658612319735808 (суть комментария: "кто у нас белый теперь решает Вашингтон Пост").

Update: дискуссия в чате блога https://t.me/ailev_blog_discussion/6010, дискуссия в фейсбуке -- https://www.facebook.com/ailevenchuk/posts/10220228878206193, дискуссия во фрифиде -- https://freefeed.net/ailev/eed5dd89-0d8b-478d-9293-4d9262914217
2019

"Какие эккаунты отключать? Вырубай всю сетку! Господь отличит своих" -- вопросы к такому остаются.

Не ожидал от Cory Doctorow, что он любитель антитраста. Он считает, что частные корпорации (Гугль и Эппл) в своём праве вышибить из своих магазинов приложений Parler, и должны были это давно сделать, если хотели -- и сказать своим клиентам, что если не нравится, то пусть клиенты идут в другие магазины. А дальше он жалеет, что других магазинов нет, и это из-за бездействия антитраста, пренебрежения законами, по которым магазинам Гугля и Эппла не дали бы так сильно вырасти! Это я прочёл пост слэшдота https://www.minds.com/newsfeed/1197228191492689920.

В 2016 году я писал, что очередные заходы на антитраст будут и в части искусственного интеллекта: https://ailev.livejournal.com/1289188.html, и в 2017 писал https://ailev.livejournal.com/1371791.html, но сегодняшняя ситуация с монополией Гугля, Эппла и Амазона и их реакцией на Parler и Minds.com даёт хороший пример того, что может происходить.

Если какой-то интеллект покажется чрезмерно умным, то бишь монопольным (скажем, медицинский интеллект будет ощутимо лучше лечить, и все побегут лечиться именно у него), то при попытке вылечить условного трампа (клятву Гиппократа этому интеллекту обеспечат!) те же Гугль и Эппл вышибут приложение этого интеллекта из своих магазинов, а Амазон вышибет в 24 часа из облака. Что там будет кто-то недолеченный из святых и невинных в этот момент -- не волнует. То, что в Parler были оборваны абсолютно святые и невинные коммуникации -- это ж не волновало! "Когда армия крестоносцев в июле 1209 года подошла к городу Безье и осадила его, Арнольд выступил за немедленный штурм. Ему приписывается знаменитая фраза «Убивайте всех! Господь отличит своих» (лат. Cædite eos! Novit enim Dominus qui sunt eius), которую он якобы произнёс в ответ на вопрос о том, как можно отличить католиков от еретиков" -- https://ru.wikipedia.org/wiki/Арнольд_Амальрик. Вот это и произошло с Parler. Minds.com следующий, от него уже потребовали удалить возможность комментирования постов и поиска в приложениях Android и iOS. Вредные или полезные поиски и комменты будут отрублены, это никого не волнует: "убивайте всех, господь отличит своих". Далее обсуждаем утилитаризм: можно ли прервать 1000 хороших разговоров, если есть шанс оборвать один реально плохой разговор с потенциально ужасными последствиями! Та же проблема вагонетки.

И да, ещё и соображения по важности банов в частных разговорах приличных людей: https://lesswrong.ru/w/Пацифизм_губит_ухоженные_сады

С этикой в подобных решениях сложно, это обсуждалось в https://ailev.livejournal.com/1551283.html (там шли ссылки на https://arxiv.org/abs/2011.00620, https://arxiv.org/abs/2008.09094 и говорилось " Машинки строгих выводов на строгих правилах не работают, ибо правила обычно сильно противоречат друг другу в реальных ситуациях, оказываются недоспецифицированными. Когда их начинаешь конкретизировать, то там сплошные противоречия и нюансы, но нужно как-то рассуждать на этом материале. Вот добавка этического и морального кругозора (descriptive ethics, https://en.wikipedia.org/wiki/Descriptive_ethics в отличие от normative через кем-то определённые правила ethics) позволяет тут сдвинуться с места и что-то думать про этику и мораль. Вывод в сложных моральных ситуациях (в "витаминчиках морального кругозора" 300тыс. "правил") оказывается вычислительно трудным.

Запутавшиеся в этих вычислениях считают, что противная сторона тащит их прямо в ад!

Вот тут про либерализм пишет Вадим Новиков (https://www.facebook.com/vadim.novikov.39/posts/10224710075323852): либерализм появился в ответ на проблему совместного проживания граждан, глубоко уверенных в том, что их идеи ведут их прямо таки в описанный их собственной религией ад, и проблемы поэтому будут выходить далеко за рамки проблем текущей жизни, а затрагивают ещё и загробную вечность! Религиозные войны были почище нынешних войн трампа с байденом, но проблема совместного проживания либералами (классическими!) постепенно как-то решилась -- и Вадим жалеет, что никак не найдут сегодня либералов, их бы опыт очень пригодился.
в
Но иметь отдельно коммуникационные площадки только для своих религиозных разговоров, воздерживаясь от хаков этих неверных -- это ведёт к процветанию разнообразия, но не ведёт к улучшению жизни: ни одна идея, которая будет лучше имеющихся не получит шанса! Её быстро отсадят в отдельную клетку, и только там она и будет жить, шанса завоевать мир у неё не будет: договорились ведь, чтобы без прозелитизма!

Мне симпатичней тут что CEO minds.com Ottoman говорит, "если цензурировать, то шанс договориться исчезает -- должны быть площадки, где встречаются противоположно мыслящие стороны". Вот да, этот вопрос о верности-неверности (чьи убеждения ведут в ад) есть и в науке, и как убедить других, если у всех временное помутнение разума, хорошо поднимается у Дэвида Дойча: https://yadi.sk/i/SjpWiPqM4PQQSg (читайте там про Спарту против Афин). Идея там в том, что массовое помутнение разума обычно быстро наступает, но оно всё одно временное, и если не затыкать рты и допускать свободное обсуждение, то более качественное описание мира всё равно побеждает. А если рты затыкать, то в обновлении знания будут огромные проблемы.

Если регуляторы не будут мешать (а регуляторы будут мешать, обязательно будут мешать -- им очень удобно иметь такое "централизованное саморегулирование", которое работает быстро), то рынок эту ситуацию разрулит. Рыночные силы работают медленно (межотраслевые переливы капитала неспешны, это не указивки государства, которые отрабатываются за сутки), но зато надёжно. У того же Телеграма уже полмиллиарда подписчиков, и поглядим ещё, что будет.

Для меня законы антитраста применять -- та же цензура, только не высказываний, а действий. Суть законов антитраста: "Ты не должен быть успешен, ты должен выигрывать в конкуренции так, чтоб оставаться маленьким!". Монополистзамещение тут такое же импортзамещение: тебя заставляют пользоваться не лучшим, а разрешённым.

Вот Яндекс тоже был недоволен монополией Гугля, я писал в 2015 году https://ailev.livejournal.com/1166104.html, там начало такое:
Гугль, когда начинался проект Android -- кто над ним не смеялся? Ход был дико рискованным, первый релиз 23 сентября 2008 года (напомню, что первый iPhone вышел 29 июня 2007г, а первый iPad аж 3 апреля 2010 года). Предпринимательство в чистом виде: понять, что происходит у конкурентов, дико вложиться и молиться на успех. Мы понимаем, что успех у Гугля не так часто бывает (с социальными сетями тот же Гугль традиционно неудачен). Но в случае Android выгорело. Победа в конкуренции, рискованные многолетние и всё возрастающие инвестиции начали окупаться.
Применение антитраста не решит ни проблемы цензуры высказываний, ни проблемы монополизации мышления. Нужны другие ходы. Не так плох, например, ход на "не пишите законы, пишите код" (а в нынешнюю эру AI я ещё и добавляю "и обучайте код", https://ailev.livejournal.com/1263637.html). Слэшдот упоминает в своём посте план создания "инфраструктуры защиты от цензуры", но без обсуждения вот этих основ (для чего именно нужна эта инфраструктура, её функциональность в надсистеме) всё это будет не слишком эффективно. Например, блокчейн и финтех споткнулись именно на этом: инфраструктура финтеха пока не слишком функциональна для обеспечения нормальных сделок, иначе мы давно бы плевали на финансовых регуляторов и расчёты массово шли бы в каких-нибудь койнах. То же самое со всякими "защищёнными платформами для общения". Кстати, тот же Ottoman сделал конкретные технологические шаги в сторону цензурозащищённости, можно постить код в Permaweb на блокчейне: https://decrypt.co/45709/crypto-social-network-minds-uncensorable-arweave-permaweb, вот что это — https://arweave.medium.com/welcome-to-the-permaweb-ce0e6c73ddfb. Узнал я это из интерфейса поста, я уже там как https://www.minds.com/ailev/ (и там можно выбрать видимость поста вне сети, тип лицензии, а ещё этот вот "пост в вечность блокчейна").

Так что:
-- частные компании в своём праве, конечно. Но иметь право -- это не означает, что им нужно пользоваться. "Вырубай все эккаунты, господь отличит своих" -- это вызывает вопросы.
-- иметь площадки без цензуры нужно, чтобы хоть как-то вести обсуждения (это ж сложное мышление! договориться реально тяжело, нужно много вычислений/мышления!). Нет обсуждений -- нет познания, нет прогресса, есть застой.
-- антитраст не поможет, монополистзамещение и импортзамещение -- это заставить потребителей использовать что-то не лучшее, а только разрешённое. И этот антитраст может оказаться удивительно идеологизированным. Так что не будите лихо, пока оно тихо.
-- не пишите законы, пишите код (и обучайте код). Но не забывайте, что инфраструктура избегания цензуры и "вычислительного антитраста" (похоже, это может оказаться одна и та же инфраструктура) должна как-то функционально вписываться в надсистему, в нашу жизнь. Поэтому сначала "идеологические" обсуждения -- зачем это всё, а затем техническая реализация инфраструктуры именно для этой функции. Системный подход ровно в этом.

UPDATE: обсуждение в фейсбуке -- https://www.facebook.com/ailevenchuk/posts/10220220988008943, в чате блога с https://t.me/ailev_blog_discussion/5885
2019

lytdybr

Будем экспериментировать с присвоением уровней мастерства ШСМ, рабочая версия формулировок -- https://blog.system-school.ru/2021/01/15/urovni-masterstva-v-shkole-sistemnogo-menedzhmenta/, замечания приветствуются. Это мы потихоньку двигаемся к реализации идей из "Оформление школы: формальная конверсия из мастеров в преподы", https://ailev.livejournal.com/1493105.html. Пока рабочие названия уровней -- падаван, выпускник, практик, мастер, преподаватель, (общественный) деятель.

Курочу слайды для шестидневки "Системный менеджмент и стратегирование 2021", добавляю туда материалы по вычислительному мышлению. Стартуем 31 января 2020, это уже через пару недель. Собственно системного менеджмента там три дня из шести, ибо пара дней обычно уходит на практикум по системному мышлению в части определения целевой системы, и ещё один день -- это стратегирование, которое формально относится к предпринимательству. По по менеджменту в начальный момент в колоде было 212 довольно наполненных слайдов, целая книжка. Если начинать раскрывать это примерно по той же форме, в какой я сделал курс системного мышления, то это будет явно за тысячу книжных страниц. Так что я докурочу слайды, а потом ограничусь видео. Принял решение, что это будет последний тренинг в таком шестидневном формате (и я его хочу сделать очно-дистантным: кто хочет, тот будет приходить в офис и общаться лично, а кто не в Москве, будет присутствовать через MS Teams). Дальше материал тренинга будет разобран на части: отдельно практикум по системному мышлению, отдельно кругозор "Системный менеджмент", отдельно кругозор "Предпринимательство" (туда уйдёт стратегирование, и там же будет готовящийся курс по праксиологии/экономике).

Как всегда, материал курса понимается постепенно -- и многое уже после окончания курса. На этой неделе в чате выпускников было замечание, что "в очередной раз было переосмыслено: программы, проекты, процессы, кейсы -- это же просто разные описания одного и того же, работ!". Да, в курсе на это обращалось особое внимание. Вот этот слайд:


Начал трансляцию постов в соцсетку Minds (она пока крохотная, там миллион подписчиков), мой эккаунт там https://www.minds.com/ailev/, за день пришло 20 подписчиков. Абсолютно убогий движок социальной сети по сравнению с ЖЖ или даже фейсбуком, всё крутится вокруг "монетизации контента на токенах", но лайки не видно чьи, длина комментария не более 1500 символов (три маленьких абзаца), куча рекламных постов (хотя от них можно откупиться: или сразу за деньги, или накопив токены активной своей блогерской работой). Изо всех достоинств там заявленное отсутствие цензуры. Меньше чем через сутки после моего прихода Гугль уже заявил, что выкидывает в 24 часа приложение Minds из Google Play, пока оттуда не выкинут существенную часть функциональности (типа поиска, можно ж плохой контент найти!). Но люди, которые осваивали в начале века ЖЖ -- они все уже там. Ну, все побежали, и я побежал. ЖЖ для таких постов, как у меня, IMHO пока лучше всех, разве что с цензурой там как везде. При этом бесцензурные варианты ЖЖ не взлетели. Опять же, про частную (а не государственную) цензуру помним в том числе и https://lesswrong.ru/w/Пацифизм_губит_ухоженные_сады (и да, я знаю, что можно затеять спор о словах -- что "цензура" это только про государство, но я ж тут не про слова пишу). А телеграм стал размером в полмиллиарда человек за эти дни, и теперь это тоже социальная сетка, там ведь комменты в каналах появились.

Я таки успешно мигрировал в новый Evernote (https://ailev.livejournal.com/1544316.html -- проблема была в том, что импортировать бесплатно всё сразу не получалось). Просто я перетаскивался туда пару месяцев, этого хватило, чтобы не превышать месячной квоты. Сказать, что там что-то так уж резко улучшилось, я не могу. Хотя пару дней назад там сделали "главную страницу" типа dashboard с виджетами, но мне она такая не нужна.

Неожиданно для себя (в ответ на вопросы в частных дискуссиях) собрал небольшую библиотечку танцевальных нотаций (лабанотация только одна из них). Вдруг кому ещё интересно: https://vk.com/wall-179019873_1154. И ещё сама собой как-то нашлась парочка научных статей про историю кизомбы в Европе (кто там куда и когда её привёз): https://yadi.sk/i/9O2jB84XPwu9Ew и https://yadi.sk/i/kiRop2mKiE05bA.
2019

Кругозорные витамины для жизненного опыта (common sense knowledge graphs для large language models)

Второе пришествие здравого смысла/common sense/кругозора в AI
Кругозором мы называем то, что в AI издавна называют common sense и плохо переводят как "здравый смысл". Нет, речь идёт о наборе фактов, которые уже есть у интеллекта и которые используются при мышлении. Классический пример -- это "любой человек знает, что из перевёрнутого стакана вода выливается", и таких знаний у людей огромное количество. У компьютера таких знаний нет, поэтому чисто логический вывод в конкретных ситуациях не работает: информация о ситуации у компьютера обычно неполная, но люди недостающую информацию легко достают из своего необъятного кругозора (а дети имеют кругозор поменьше, и поэтому они не так умны). И тут начинаются проблемы:
-- кругозор необъятен, и его непонятно как получить вручную. Компания CYC просадила огромное количество денег на создание своей базы данных. И продаёт теперь лицензии на логический/дискретный/символьный кругозор, собранный вручную по $1млн.
-- кругозор необъятен, и поэтому логический вывод на нём вычислительно труден
-- кругозор состоит из бесчисленного количества исключений. Так, тот самый стакан с водой, если в центрифуге с вертикальной плоскостью вращения, то скорей стекло лопнет, чем вода выплеснется из него в тот момент, когда он оказывается "перевёрнутым". Или если вода в нём замёрзла, то она не выльется. Или если на стакане крышка. И всё это нужно учитывать в выводе, это defeasible reasoning (опровержимые рассуждения, https://plato.stanford.edu/entries/reasoning-defeasible/), и для работы с такими рассуждениями нужны не просто логики, а немонтонные логики, https://plato.stanford.edu/entries/logic-nonmonotonic/, позволяющие опровержение/retraction вывода. Вот эта "опровержимость" хорошо иллюстрируется моими замечаниями к решению тренажёрных задач (есть раздел учебника на эту тему), где инженеры вместо обсуждения наиболее вероятной ситуации обсуждают ситуацию с минимальной вероятностью, но формально опровергающую задуманный ответ. С естественным языком обычно всегда можно найти какие-нибудь маловероятные исключения и проблемы, редко встречающиеся, но делающие предположение формально не истинным (если хотя бы иногда не истинно, то в формальном исчислении ведь это просто "не истинно" -- доказательство от противного всегда сработает, достаточно предъявить один пример невыполнения правила!). И весь этот кругозор в конечном итоге привязан к контрфактическим рассуждениям, причинному выводу.
-- по факту речь идёт о формальной системе в theory theory, "онтологии". Знание о какой-то ситуации скорее всего будет в другой формальной системе, и общего вывода на этих системах не сделаешь.

Идея с кругозором поэтому осталась маргинальна, CYC с его дико дорогим и неуклюжим проектом уехал на обочину прогресса, и финансирование подобных проектов было прекращено, научное сообщество посчитало это полным тупиком, заниматься common sense стало неприлично, как до 2012 года заниматься нейронными сетями.

Но нейронные сети с 2012 года уже были, а с 2017 года в них на первый план вышли нейросетевые языковые модели (начиная с модели BERT архитектуры Transformer), в которых:
-- есть модель собственно языка, поэтому вход-выход этой модели не в виде ужасных формул (на входе тексты, на выходе тексты. И ещё можно говорить о "визуальных языках", рассматривать и картинки и целые ситуации). Тут решаются проблемы перевода, в том числе проблемы перехода от дискретных "словесных" (из символов/слов) к непрерывным репрезентациям (я писал про representational learning в 2015 -- https://ailev.livejournal.com/1045081.html). Понятия живут в непрерывных представлениях, а слова их представляют неточно, для перевода в слова делается discrete sampling -- иногда одно слово берём, иногда три для выражения понятия, иногда целую историю рассказываем. Но совмещать онтологии в таком пространстве можно, все построения Хофштадтера про "аналогии" работают! И даже есть что-то похожее на способность рассуждать, хотя с этим совсем непонятно: достаточно большие нейросетки типа GPT-3 со 175млрд. параметров или вновь появившаяся Switch Transformeк с 1.6 триллионами параметров (https://arxiv.org/abs/2101.03961) явно могут что-то выводить, но не очень понятно пока что и как.
-- есть знания о мире, а поскольку обучение идёт по какому-то гигантскому корпусу текстов (или текстов с картинками, или даже просто картинками), описывающих что-то в мире. Можно считать, что решена проблема кругозора (вот я обсуждал их связь с кругозором в 2018, https://ailev.livejournal.com/1449229.html).
Но не тут-то было. Нейросетевые языковые модели оказались тупы, причём очень похожим способом на тупость людей, у которых нет "машинки типов" (писал про неё https://ailev.livejournal.com/1532144.html -- машинка типов вскрывает нелепости в тексте). В кругозоре языковых моделей чего-то не хватает крайне важного, они генерируют легко как красивые художественные тексты, так и полную ахинею. Вот Евгений Пескин привёл пример диалога, типичный для людей и нейросеток, у которых нет этого контроля типов, нет учёта контекста социального взаимодействия/social-interaction с намерениями и какой-то связной онтологией для ситуации:
- Девушка, дайте мне таблетку.
- Вам какую?
- Белую.
- Послушайте, это аптека. У нас много белых таблеток.
- Одну дайте.
Этим вопросом опровержимого вывода и кругозора/common sense занялась Yejin Choi (https://homes.cs.washington.edu/~yejin/, https://arxiv.org/search/?query=Yejin+Choi&searchtype=all&source=header), у которой научная судьба похожа на судьбу выбравших нейронные сети "когда это ещё было не модно": ей все говорили, что у неё не будет денег и научных результатов с этим провальным "здравым смыслом", а она таки занялась проблемой, ибо:
-- вычислительные мощности выросли
-- появились непрерывные представления понятийных пространств (в том числе такие, как большие языковые модели, large language models типа BERT)
-- можно использовать не убогое формальное представление ситуаций, а полноценное языковое (ибо нейросетка хорошо работает с языком)

Команда Yejin Choi получила отличные результаты, которые можно посмотреть в ролике https://www.youtube.com/watch?v=h2wzQKRAdA8 и работах https://arxiv.org/abs/2101.00297, https://arxiv.org/abs/2012.08012, https://arxiv.org/abs/2010.12884, и особенно https://arxiv.org/abs/2010.05953.

Для вывода в AI вместо формально-логических триплов нужно использовать полноценный естественный язык
Первый вывод в том, что нужно использовать естественный язык для представления информации о common sense, ибо пространство понятий непрерывно, и никакие символы-термы не передают понятия точно (categories/concepts vastly outnumbered words and require free form open text description). Вывод в таком непрерывном бесконечном пространстве становится с этого момента generative as opposed to categorization/discriminative task -- ибо пространство вывода/inference/reasoning бесконечно, мы не выбираем результат рассуждения из ограниченного их набора, а порождаем результат мышления. Порождение идёт через абдукцию (поиск минимального объяснения к частичному наблюдению, и обычно требует дополнительной внешней информации, занимался этой абдукцией Charles Sanders Peirce, https://plato.stanford.edu/entries/abduction/peirce.html, и тут John Sowa и Yejin Choi удивительно единодушны). Тут можно обсуждать о том, как вообще делается вывод в нейросетях. Choi в своих работах обсуждает алгоритмы neural backpropagation (алгоритм DeLorean), search with logical constraints (алгоритм NeuroLogic), distributional neural imagination (reflective decoding). И таких работ по выводу в бесконечных пространствах понятий, которые можно выразить в языке, довольно много. Но всё одно там работает "машинка типов": logical constraints, правила, формулируются через and и or, это ж всё равно логический язык! Хотя речь в defeasible reasoning идёт не о строгих доказательствах (вывод не доказательный, non-demonstrative), а просто об "усиленном рассуждении" (ampliative reasoning).

Естественный язык недоспецифицирован, и это важно (замечу, что из онтологов практически то же самое говорит John Sowa, и он же говорит о необходимости выражения знаний на естественных языках, но далее он же спокойно говорит о формально-логических построениях в языке логики первого порядка/common logic, а вот Yejin Choi сразу говорит, что этих логических представлений и не нужно, естественный язык лучше). И дальше в тех местах, где люди обычно говорят "факты" или "отношения" или "триплы", Choi сотоварищи говорит сразу о правилах/rules и об элементарных выводах/inferences, которые могут быть использованы или опровергнуты/retract в ходе опровержимых рассуждений/defeasible reasoning.

Кругозорные графы знаний (common sense knowledge graphs) на естественном языке: без них большие языковые модели глупы
Второй вывод -- это то, что важных для вывода "отношений", "элементарных выводов" кругозорного уровня нет в исходных текстах, они оттуда не вытаскиваемы! Какие это отношения? Указывающие прежде всего на прагматику (чего обычно хотят люди, на что направлена коммуникация), на события (например, возможные препятствия к реализации намерений) и физический мир (использование объектов). А остальное? А про остальное есть надежда, что может быть вытащено из корпуса текстов (хотя опять же, исследования тут только-только начинаются).

Choi предлагает: давайте а) триплы просто представим как входной текст для обучения нейросетевой языковой модели, просто вот так вытянем их всех в линейку и скормим так же, как основной огромный корпус текстов. В модели кругозорного графа знаний/common sence knowledge graph/CSKG Atomic-2020 1.33млн. трипловых высказывания по 23 типам отношений, в виде текста это очень немного (явно завышенная оценка -- 100Мбайт) по сравнению с, например, 750GB текстов в Colossal Clean Crawled Corpus, на котором обучалась языковая модель Switch Transformer Гугля. Так сказать, "не еда, а витаминчики -- нужно их мало, но без них цинга и смерть". И вот тут оказывается, что "знаниевые витаминчики" бывают разными, эти CSKG отличаются друг от друга по типам представленных отношений существенно. Витаминчики для персональных ситуаций могут существенно отличаться от витаминчиков для обсуждения производства. Вот картинка из https://arxiv.org/abs/2010.05953, показывающая разнообразие CSKG по относительному составу входящих в них отношений:


А вот пример этих типов "триплов":


И вот когда вы набираете "витаминчиков" в том числе по социальным взаимодействиям, то можете дальше учитывать и моральные и этические соображения. Так что по этой линии выходят ещё и приложения к рассуждениям на темы морали и этики https://arxiv.org/abs/2011.00620, https://arxiv.org/abs/2008.09094. Машинки строгих выводов на строгих правилах не работают, ибо правила обычно сильно противоречат друг другу в реальных ситуациях, оказываются недоспецифицированными. Когда их начинаешь конкретизировать, то там сплошные противоречия и нюансы, но нужно как-то рассуждать на этом материале. Вот добавка этического и морального кругозора (descriptive ethics, https://en.wikipedia.org/wiki/Descriptive_ethics в отличие от normative через кем-то определённые правила ethics) позволяет тут сдвинуться с места и что-то думать про этику и мораль. Вывод в сложных моральных ситуациях (в "витаминчиках морального кругозора" 300тыс. "правил") оказывается вычислительно трудным. Но если работать не в дискретной строгой логике, а "аппроксимировать", "порождать решение" в непрерывном пространстве, а не выбирать единственно верный ответ, то всё вполне работает.

Очень далёкая аналогия тут -- это в части трудности точных вычислений нестабильности планетных орбит. Но если взять нейронную сеть (свежий пример: https://arxiv.org/abs/2101.04117), то можно получить приближённое решение задачи, которое оказывается со всех сторон (точность, трудоёмкость вычислений) на порядки лучше, чем попытки вычислить точно. Если "слишком много всего учитывать" и этот учёт запутанный, то приблизительные решения в непрерывных представлениях оказываются легче достижимыми, чем в дискретном аналитическом представлении.

Это всё делает Allen Institute, поэтому "кругозорные витаминчики" доступны в open source: https://mosaickg.apps.allenai.org/ (хотя для атласа кругозорных отношений/atlas of commonsense relations Atomic-2020 ничего пока не было опубликовано, для более ранних работ наборы данных все опубликованы уже, так что ждём публикации окончательных работ, а не препринта в arxive, и дальше публикации датасета).

Так что CSKG/common sense knowledge graphs рекомендуют использовать как витаминчики, которые исследования/self-supervising learning по корпусу текстов сами выделить не могут, и поэтому предлагается их просто добавлять в концентрированном виде, "без воды" (как большой такой текст, полученный конкатенацией высказываний о триплах отношений). Где берём? Краудсорсинг, "механический турок", толока. Дорого?! Но тут идёт замечание, что это копейки по сравнению с обучением основной языковой модели на гигантских корпусах текстов, а результат получается ошеломительный: neural knowledge model Comet-Atomic2020 successfully transfers declarative knowledge to beat GPT-3, the largest pre-trained language model, in spite of using 400x fewer parameters.

Понятно, что эти "кругозорные витаминчики" совершенно не мешают, а только помогают потом настроить предобученную по корпусу текстов и кругозорному графу знаний языковую модель. А потом её ещё можно донастроить по какому-нибудь zettelkasten -- и если это личный экзокортекс, то получить личного помощника, а если это проектный экзокортекс (у нас ведь проектная команда вполне себе мыслит/вычисляет), то получить коллективного помощника. Этот помощник как минимум сможет содержательно отвечать на какие-то вопросы с учётом содержания zettelkasten, генерировать какие-то осмысленные тексты и предположения там, где "просто преобученная языковая модель плюс подстройка под предметную область" не справляется.

Я писал в "Предобучи, потом подстрой/pretrain then finetune" о том, что прикладное обучение будет делаться после обучения трансдисциплинам для появления какого-то кругозора, https://ailev.livejournal.com/1485511.html. Обучение людей и нейронных сеток вполне можно обсуждать как в чём-то похожие, и способы обучения брать из AI назад в педагогику/хьютагогику (https://ru.wikipedia.org/wiki/Эвтагогика )/андрагогику. Работы Choi указывают на развитие этой идеи: она считает, что нейросетки нужно учить не только давая доступ к богатому на объекты и действия миру, но ещё и так же, как и людей -- через чтение учебников (а не художественной или случайной литературы), проведение тьюториалов (а не путём "проблемного обучения", когда дают решить задачу, решение которой давно известно), то есть давая знания в декларативной/"объявительной" форме. Весь вопрос, какие именно это знания! Добавлять нужно те знания, которые трудно вытащить самому из окружающей среды. Например, знания о машинке типов (что можно вот так проверять тексты, вот так относиться к словам).

S1 и S2 это про осознанность, а не про распределённое против символического или про формальное против неформального
Третий вывод -- это то, что "автоматическое мышление" S1 нужно рассматривать по Канеману вместе с восприятием (object recognition, image segmentation), ибо нарезка мира на объекты идёт из восприятия. Этой нарезке на объекты нужно учить. И это знание об объектах тоже нужно давать декларативно/обучением, а не только надеяться на то, что правильные объекты будут выделены вниманием в ходе исследований. Нет, предыдущие усилия в исследованиях нужно брать -- и скармливать ученикам (тут мне уже без разницы, кремнивые эти ученики или мясные) "без воды" как материал для опровержимого и контрфактуального вывода. Но не в виде логических утверждений, а в сформулированном на естественном языке виде. Хотя да, люди учебник прочтут, но этот же материал в виде "естественноязыковых триплов" (то есть триплов не в RDF) не прочтут. И людям ещё потребуется немного поработать с этим материалом, чтобы его усвоить. Но речь идёт о целенаправленном процессе обучения, без надежды, что "поживёт, наберётся опыта". "Из опыта" объекты для S1 не берутся.

А дальше Choi с Kahneman хором (Канеман это делал несколько раз, последний вот тут, на AI Debates 2 в декабре 2020: https://www.youtube.com/watch?v=2zNd69ZGZ8o) уточняют про S2:
-- неверное понимание, что S1 это про распределённое представление, а S2 про символьное/язык. S1 тоже знает про язык, интуитивные мысли -- они вполне в языке! S1 делает львиную долю работы по выводу! Байесовский вычислитель в S1, и он отлично работает с понятиями! Другое дело, что понятия там в непрерывном пространстве и выражаются естественным языком. Вот это "понятийное мышление в бесконечном пространстве значений" естественного языка -- это ключ, оно необходимо. Язык есть, но он используется как язык в целом, а не отдельные слова или словосочетания или даже графы ситуаций типа фреймового представления знаний Марвина Минского (Choi подчёркивает вот этот факт: число выражаемых языком понятий бесконечно больше числа используемых в языке слов и устойчивых словосочетаний). И в S1 ни один вывод не верен абсолютно, выводы на этом понятийном киселе причинны и вероятностны по природе, а при добавлении контекста ("новых привходящих") все результаты вывода вполне могут быть объявлены враньём (в формальных онтологиях тут возникает проблема ontology revision -- менять/согласовывать придётся все знания, а не только текущий вывод. Даже использование микротеорий тут помогает мало). S1 держит представление мира, и оно каким-то образом имитационно моделирует мир (simulation of the world). Но оно отслеживает невязки (что укладывается в "нормальное", и что расходится с "нормальным", удивляет -- расхождение симуляции и реальности). Контрфактуальное мышление, причины и следствия, а ещё оценка эмоций и намерений, вплетение прагматизма, нацеленности на какой-то результат в деятельности -- это S1 мышление.
-- S2 это про "намеренное выполнение каких-то вычислений", это про надзор за вниманием (сознание, kahneman использует слово explicit в противовес implicit в S1). Нет, ключевое различие для Канемана -- это something that happens to you (S1) and something that you do (S2), и это всё внеязыковое или языковое тут уже неважно. Важно тут: для чего это мы напрягаемся какие-то вычисления/мышление делать, а не довольствуемся тем, что просто "случилось"? Для социальности, для коммуникации (включая коммуникацию с собой): только когда сталкиваемся с другими (или хоть и собой, но осознанно) мы занимаемся аргументацией, контрфактуальностью, удерживанием длинных цепочек причинных связей (то есть объяснениями), учётом этики, морали и вообще социальных взаимодействий.

По первому пункту ("S1 про богатое концептуальное представление, в том числе и естественный язык") я всегда говорил, что понятия могут быть представлены и ощущениями, и выражены синестезийно (это мы регулярно обсуждали в рамках разговоров о телесном мышлении, TAE и всём подобном, а также при обсуждении материала книжки "Визуальное мышление", https://ridero.ru/books/vizualnoe_myshlenie/).

Но вот эти уточнения про S2 удивительно похожи (вот прямо все слова совпадают) про дискуссию о сознании и внимании, и именно на это обратил в какой-то момент внимание Виктор Агроскин (https://vvagr.livejournal.com/2379034.html и видео семинара по трёхчастной модели сознания Graziano https://www.youtube.com/watch?v=lyOQhPlSxgI):
-- тоже упоминание о коммуникационном характере (при этом коммуникация может быть и с собой! но языковый "интерфейс" есть и в модели Graziano), значимости аргументации "для других", для себя же достаточно "ощущения правоты" от S1, незачем обращаться к трудному S2
-- удержание внимания при захождении в тупики, backtracking в рассуждениях, модель самого мышления (работа с контрфактуальностью и опровержимостью).
-- использование extended cognition для удержания внимания, а также подхват в мышление внешних вычислителей (коммуникация с другими)

Так что S1 выходит как "неосознанное/автоматическое/основное мышление" (и сопричастное ему восприятие, которое у Канемана рассматривается рядом!), а S2 -- мышление в рамках осознанности. А схема формальности оказывается про другое, про уход от естественного языка, про representation sampling -- переход от непрерывного пространства понятий к дискретной выборке из его точек. Но мышление про эти выборки из точек обсуждается отдельно в части S1 и S2 -- как неявное/implicit или явное/explicit, это совсем другая шкала. Поэтому про "спектр формальности мышления" нужно материал уточнить.

А ещё нужно учитывать, что для обучения хорошо бы использовать качественные данные: ибо обученная по помоечным датасетам сетка делает затем помоечные выводы (это было проверено работой . Если вы обучаете свою мокрую сетку по текстам "из этих ваших интернетов", а не по научной литературе и не по учебникам, то выводы у неё тоже будут вполне помоечными -- и это будет вне вашего внимания, вы этого не заметите. Поэтому учиться лучше бы не в "университетах жизни" (хотя и это нужно), но и просто в университетах, где хоть какой-то шанс, что тебе дадут качественных "знаниевых витаминчиков" для обучения, а не огромное количество фантазийных текстов непонятного качества и направленности для "набора опыта из жизни".
2019

Цифровой -- это новый информационный, цифровая нить -- это новая интеграция данных

Цифровая трансформация, инженерия, модель, тень, нить и так далее
В языке медленно, но верно слово цифровой/digital заменяет слово информационный/information. Где лет десять назвали бы "информационный", сегодня называют "цифровой". Означает ли это хоть что-нибудь? Нет, ничего особенного, кроме как вы будете попадать в правильные строчки бюджетов, если будете следовать моде. Под "организационные изменения" и даже "организационную трансформацию", равно как и под "автоматизацию/компьютеризацию" деньги не дадут, а вот под "цифровую трансформацию" -- пожалуйста. Ещё объяснят, что это ж вы будете думать и о людях, и о компьютерах, и о бизнес-моделях, как будто это в голову не придёт при использовании более старых терминов для того же (подробней я писал об этом год назад в "Об цифровую трансформацию: то же оргразвитие, и даже не в профиль", https://ailev.livejournal.com/1497402.html, там был и слоган про "больше buzzwords богу buzzwords"). Но новых "цифровых" терминов в коропоративной цифре (раньше бы сказали "айти", но поддамся тренду) к началу 2021 года резко набежало, давайте с ними разберёмся.

Речь пойдет о digital transformation, digital engineering, digital engineer, digital twins, digital model, digital shadow, digital thread, SDM (simulation data management), model-based engineering, model-based systems engineering, digital mission engineering, и тут давайте пока остановимся (игнорируя всякие маркетинговые терминологические затеи одной фирмы, типа specification data management, который формулируется как "высокоуровневый PLM", https://specright.com/blog/specright/whats-the-difference-between-product-lifecycle-management-and-specification-data-management/).

Сразу оговорка: о значении этих терминов в мире так и не договорились. Поскольку нет ни одного законодательного органа одной страны, ни одного комитета по стандартизации, ни одного факультета в каком-то университете, где приватизировали бы язык, есть множество документов, в которых даются самые разные толкования этим терминам. А ещё язык живёт независимо от всех этих официальных документов и словарей, и люди в самых разных фирмах используют эти слова уж как бог на душу положит. И помним, что словарные значения -- это значения вне контекста какого-то проекта, а в конкретных высказываниях у всех этих слов появляется ещё и уточнённый контекстом смысл. Но не всё так плохо: несмотря на дикий разнобой в значениях можно понять, о чём идёт речь. Уж точно не о сыроварении и не о бирюзовых организациях! Нельзя сказать, что "эти термины вообще ни о чём".

С цифровыми двойниками мы разобрались ("Цифровые двойники: физика ведёт математику, математика ведёт компьютерную науку", https://ailev.livejournal.com/1549559.html). Цифровые двойники/digital twin -- информационные/цифровые модели aka виртуальные системы для киберфизических систем (реальных экземпляров hardware), существующие на всём протяжении их жизненного цикла, особенно включая эксплуатацию.

Если мы провалимся на системный уровень выше, то получим сеть цифровых двойников/digital twins network. Если провалимся на уровень ниже, то получим целый ряд моделей как по разным viewpoints на стадии эксплуатации, так и по жизненному циклу (все эти механические, электрические, тепловые и прочие модели).

Цифровая инженерия: делаем цифрового двойника и связываем его цифровой нитью
Цифровая нить/digital thread -- это технология (инструменты и практика федерирования-объединения-интеграции данных, обычно на основе так называемых семантических моделей данных/semantic data models, тысячи их), связывающая между собой все эти отдельные модели, а также цифровые двойники окружения и физического двойника. Инженер старой закалки скажет "интеграция данных жизненного цикла" и помянет множество PLM (а если это не машиностроение, то помянет "корпоративную шину данных"), менеджер новой закалки скажет "цифровая нить" и помянет PLM, ERP, EAM и даже CRM (и вообще всё остальное). И, поскольку "цифровой -- это новый информационный", то заметят, что для какого-нибудь здания или моста кроме BIM/building information model цифровая нить добавит к цифровому двойнику данные дронов, сенсоры интернета вещей и какой-нибудь искусственный интеллект обнаружения аномалий для ремонта по состоянию. А разве это не предусматривалось концепцией BIM? Предусматривалось, но тогда и деньги были бы прежние. А цифровая нить -- это новый бюджет, новые слова для новых денег! Скажем, вы просите денег на интеграцию данных жизненного цикла, какие слова будете говорить? А тут говорят так: Digital thread -- golden thread of information that runs right throuht the life cycle of a project, the thread that grows and gathers more strands until it develops the heft and weight of a digital twin (https://www.raconteur.net/technology/digital-engineering-what-is-it-and-why-you-need-to-know-about-it/). Инженеры старой закалки продолжают говорить "управление информацией" или "управление данными", их эта менеджерская поэзия не увлекает. Так, если нужно сшить между собой мультифизическую модель (модели нескольких физик -- механическую модель, электрическую модель, тепловую модель, акустическую модель и т.д.), то инженеры будут говорить управление данными имитационного моделирования/SMD/simulation data management, а менеджеры старой закалки предпочтут говорить управление информацией (имитационного/мультифизичного) моделирования/simulation information management (но говорят так довольно редко, менеджеры до этих тонкостей уже не доходят, они больше про "нить").

Цифровая инженерия/digital engineering -- это создание цифрового двойника путём сплетения цифровой нитью различных его моделей, экземпляра его физического двойника и цифровых двойников окружения. Цифровой инженерией занимается цифровой инженер/digital engineer, и сразу признаётся, что знания цифрового инженера должны быть настолько широки (вся просто инженерия и всё просто айти), что его роль выполняется обычно большими командами.

Если цифровая нить не привязывает экземпляр цифровой модели цифрового двойника к физическому двойнику (экземпляру киберфизической системы, чей двойник), то это просто цифровая модель/digital model, данные к ней и из неё попадают "вручную", асинхронно. Если цифровая нить привязывает физического двойника к модели, и модель обновляется автомагически, то это будет цифровая тень/digital shadow. И только если цифровая нить привязывает не только физического двойника как источника калибровочной информации для модели, но и модель как источник калибровочной информации для физического двойника -- вот тогда это полноценный цифровой двойник/digital twin. И помним, что формально для ответов на вопросы "а что если..." можно породить несколько digital siblings (ибо они не будут соответствовать полностью физическому двойнику, их не любят называть цифровыми двойниками, но признают кровное родство).

Вот в этой картинке (из https://www.cadmatic.com/en/resources/blog/digital-model,-digital-shadow,-or-digital-twin-%E2%80%93-what-is-at-the-core-of-data-driven-shipbuilding/) пунктирная нить означает ту самую цифровую нить:

Вот типичное софтовое предложение для организации цифровой нити, найдите хоть одно отличие от предложений по организации PLM и интеграции данных жизненного цикла: https://prostep.us/cpmn/apidt/digital-thread-and-digital-twin-solutions/ (и да, это предложение от фирмы, которая традиционно занималась тематикой PLM, а дальше просто переписала свои тексты с использованием модной лексики).

Вот картинка новой V-диаграммы от Boeing, в которой поминается ещё один синоним для цифровой инженерии: моделеориентированная инженерия/model-base engineering/MBE, и теперь это не V, а MBE-ромб/diamond, с 2018 (https://www.incose.org/docs/default-source/midwest-gateway/events/incose-mg_2018-11-13_scheurer_presentation.pdf):

В этой диаграмме к традиционной V-диаграмме физической системы/двойника добавлена симметричная Λ-диаграмма цифрового двойника, а серединка отдана цифровой нити (вместо показа традиционных для этой диаграммы проверок и приёмок).

MBE любят в NIST и туда включают модели требований, архитектуры мультифизику и всё остальное, в отличие от INCOSE, которая любит MBSE/model-based systems engineering/моделеориентированную системную инженерию с акцентом на модели требований и архитектуры и меньшим акцентом на мультифизику -- но в INCOSE тоже переобуваются на ходу, и ветер там дует с военной стороны (см., например, как определяют digital engineering в SEBoK, https://www.sebokwiki.org/wiki/Digital_Engineering -- прямо ссылаются на DoD и в тексте, и в литературе).

Цифровая трансформация/digital transformation -- это прежде всего постановка практики цифровой инженерии, переход к тому, чтобы физические двойники (предприятие в ходе его работы, пациенты в ходе операции, здания в ходе эксплуатации, самолёты в полёте) управлялись со стороны своих цифровых двойников. Если этого нет, а просто вы ставите какую-то ещё одну базу данных и ещё одну систему аналитики, вроде как можете говорить о big data всём таком прочем модном, можете добавлять что-нибудь про цифровую тень но слово "цифровой" для такой трансформации говорить должно быть неудобно. Но с этим, конечно, никто не считается.

Военная цифровая инженерия
Как всегда, волну новой терминологии оседлали военные, прежде всего США. Они сходу объявили, что у них теперь цифровая инженерия, а в ней цифровая инженерия (военных) миссий/digital mission engineering -- удостоверение того, что вся инженерная работа как-то повлияет на результативность военных миссий. Если вы начнёте искать в сети всю эту цифровую терминологию, то найдёте много военного (они хорошо разрабатывают регламенты, стандарты и прочее подобное, что в нормальном бизнесе аккуратно срезается lean-подходом) -- так что аккуратней с источниками. Вот вам ссылки на тексты военных, прелесть ведь как всё структурировано, но не факт, что именно в этом виде оно будет хорошо работать в коммерческом секторе (факт, что не будет):
-- "What Is Digital Engineering and How Is It Related to DevSecOps?", ноябрь 2020, https://insights.sei.cmu.edu/sei_blog/2020/11/what-is-digital-engineering-and-how-is-it-related-to-devsecops.html (помним, что DevSecOps -- это те же DevOps, только с добавкой безопасности. Это ж военные!). При этом чётко говорится, что это всё для спасения жизней в том числе разработчиков и испытателей (во время испытаний F100 в 50-е погибли 324 пилота и потеряно 889 самолётов, https://en.wikipedia.org/wiki/North_American_F-100_Super_Sabre, а "цифровые испытания" позволяют сократить потери в подобных проектах).
-- "Digital Engineering Metrics. Supporting Technical Report SERC-2020-SR-003", июнь 2020, https://sercuarc.org/wp-content/uploads/2020/06/SERC-SR-2020-003-DE-Metrics-Summary-Report-6-2020.pdf (в этом отчёте старинное MBSE/model based systems engineering из INCOSE используется как синоним с Digital engineering, хотя MBSE это только часть digital engineering, ибо в MBSE обычно поддержка работы с требованиями, архитектурой и планами испытаний, а в digital engineering ещё и non-architectural part of design как минимум, плюс ремонт и обслуживание на стадии эксплуатации, во время работы digital twin. И это ж военные и государственные: если вы хотите попросить приличных денег за цифровую инженерию, то вам сюда: десятки метрик для оценки этой самой цифровой инженерии! KPI получите в количестве, никаких денег не хватит, чтобы их выполнять и по ним отчитываться! И упор тут именно на digital transformation: как определить, идёт трансформация, или таки не очень. Но если вам вдруг выпало заняться информатизацией, тьфу, цифровизацией, тьфу, цифровой трансформацией в части постановки цифровой инженерии, то это хорошие чеклисты: о чём нужно подумать -- но ни в коем случае не делать всё сразу, ибо тогда точно не сделаете, но зато освоите много денег, по круглой сумме за каждую метрику. Вот прямо берёте метрику и заключаете какой-нибудь договор на её реализацию с кем-нибудь, будет не хуже, чем в армии США).
-- digital mission engineering, https://www.agi.com/digital-mission-engineering (больше всего тут материалов от AGI, an ANSYS company -- поставщик софта для системной инженерии в военных применениях, вот и смотрите материалы на этой странице). Можно ли это применить гражданским? Ну, считайте, что речь идёт о нацеленности всей инженерии на эксплуатацию в условиях разнородного окружения целевой системы.

Смотреть новости по всему этому богатству цифровой инженерии можно на порталах https://www.plmportal.org, https://www.digitalengineering247.com, на немецком https://www.digital-engineering-magazin.de/. А что со старинными названиями? Например, "автоматизация"? Тоже всё найдёте, https://www.automation.com/ -- ресурс международного общества автоматизации. Ну, вы поняли: где раньше занимались PLM, автоматизацией, САПРами, инженерным моделированием, там и продолжают заниматься. Но слов стало больше, и ресурсов стало больше. Ну, и старые слова тоже вполне живут, люди-то никуда не делись. По последней ссылке вы найдёте и smart manufacturing (Industry 4.0), и integrated manufacturing business operations, и IIoT/Industrial Internet of Things.

Для не-заводов всё тоже цифровое, но единства в терминологии ещё меньше
У банка, страховой компании, вуза, логистической компании и многих других нет PLM, но цифровая трансформация есть. У нас для них советы:
-- иметь таки для их целевых систем цифровых двойников, а для этого целевую систему придётся таки найти в физическом мире как физического двойника.
-- считать, что прохождение кейсов по проектированию, как бы "изготовлению" и как бы "эксплуатации" (как это у них называется? у всех ведь по разному) -- это цифровой банкинг, цифровое образование, цифровое страхование и т.д.. Тем более что все эти слова есть (и означают в том числе уход в онлайн плюс ту же автоматизацию и биг дату с data-driven enterprise, тьфу, это ж теперь цифровая трансформация!).
-- смело пересказывать тексты и идеи промышленников, заменяя слова, там ведь всё то же самое. Не забывайте только вставлять слова про privacy, safety и security, хотя и у промышленников compliance через слово. С другой стороны, там везде и своих слов хватает. Но если вам приходится работать и с промышленными предприятиями, и банками, то лучше бы как-то экономить мышление и научиться думать о самой разной цифровой трансформации одинаково.

Обычно непромышленные организации идут впереди промышленных, у них что сейчас происходит с цифровизацией? Ну, hyperautomation/AI-Transformation/Digital Process Automation/Intelligent process automation (и ряд других терминов от разных лавок, пока совсем-совсем не договорились, вот обзор терминологии: https://research.aimultiple.com/hyperautomation/ (там полный винегрет изо всех идей, абсолютно разноуровневый). Отличается всё это от цифровой инженерии только тем, что явно и специально поминается через слово искусственный интеллект и машинное обучение, но не говорится о том, куда этот интеллект употребляется (а тут как с людьми и употреблением естественного интеллекта: нельзя ничего сказать, использовать-то можно везде!). В инженерии проще: объявляем эти "искусственные интеллекты" просто какими-то отдельными моделями/вычислителями и вплетаем их цифровой нитью в состав цифрового двойника. А что тогда RPA? Ну, это инструментарий цифровой нити, который может связать и текущий корпоративный софт, и вплести в него а хоть и людей. Интерфейсы к живым людям в PRA тоже есть, Текущий RPA состоит из набора коннекторов к софту, набора коннекторов к человеку (все эти распознавания речи), плюс BPM-движка (можно думать, насколько там близко к case management -- они ж себя процессниками считают, и языки там типа CMMN есть, хотя пока выглядит как "голимый недоBPMN". Но это ж ровно то же самое, что PLM, только данные берём не сапровские, и не только через API, но и через формы, и непосредственно от живых людей!

Так что терминологию цифровизации/цифровой трансформации для всех этих разных предприятий меняем, а мышление -- нет. Оно продолжает быть системным и вычислительным, трансдисциплинарным.

UPDATE: обсуждение в фейсбуке -- https://www.facebook.com/ailevenchuk/posts/10220193584883882, обсуждение в чате блога -- с https://t.me/ailev_blog_discussion/5866
2019

lytdybr

Как я провёл этим каникулом? Да точно так же, как и рабочие дни, разве что докладов и моих тренингов не было, но читал-писал столько же. Впрочем, семинары тоже были, но доклады там были не мои. Отличия от рабочих будней были вечерами-ночами: на вечеринки ходил меньше, а ещё в ночь хорошо кушал, а ещё ложился где-то в пять утра, каждый день прямо таки расписание нового года, изо дня в день! Надо как-то теперь взять себя в руки, закончить этот праздник.

Внимание рассеяно по нескольким связанным темам: отслеживаю последние сдвиги в digital twins и digital engineering, и отслеживаю проблематизацию в текущей ситуации в AI -- это все идёт в краткосрочной перспективе в апдейт курса системного менеджмента (у меня же старт 31 января очередного потока, https://system-school.ru/sms), а в долгосрочной перспективе в курс вычислительного мышления. Часть материала я оформляю записями в блог, но часть так и остаётся открытыми табами для более подробного изучения.

Бодро все обсуждают, куда валить из фейсбука и твиттера. Ну, я по-прежнему остаюсь в ЖЖ, о котором все давно забыли -- а он есть, https://ailev.livejournal.com/ (и даже более короткий адрес есть: http://ailev.ru). Твиттер у меня не пользуется популярностью: я не говорю афоризмами, это точно не моё медиа (хотя эккаунт есть, но я туда не заглядываю). В фейсбуке у меня трансляция на https://www.facebook.com/ailevenchuk/, некоторым это удобно. Ещё трансляция ВКонтакте https://vk.com/ailev, ещё трансляция в фрифиде https://freefeed.net/ailev, ещё трансляция в телеграме https://t.me/ailev_blog (и там даже отдельный чат для дискуссии по постам https://t.me/ailev_blog_discussion. Если куда массово люди валят, и им очень нужно меня читать прямо там, то я всегда готов ещё трансляцию устроить, мне нетрудно.

А какое моё мнение по поводу отлучения от интернета? Особый смак -- это отлучение Трампа от ТикТок, который он активно запрещал вроде как из-за возможностей недемократического поведения, и ТикТок честно сказал, что будет вести себя демократически, и первым делом вычеркнул видео Трампа из дозволенных на платформе -- https://www.inputmag.com/culture/tiktok-censoring-trump-videos-is-the-laugh-we-needed-this-week. Parler CEO сказал, что после выкидывания его из Гугля и Эппла как каналов распространения, Амазона как датацентра, его бросили и провайдер электронной почты, и даже его собственные юристы -- https://www.theverge.com/2021/1/10/22223956/parler-ceo-john-matze-lawyers-vendors-abandoning. Ну, если тебе выдали анафему от одной церкви, выстрой свою и предай сам анафеме другую, история полна таких примеров: https://ru.wikipedia.org/wiki/Анафема. А потом тебя через сто лет причислят к лику святых, почему бы и нет. Для меня это значит "не пишите законов, пишите код" (а с учётом того, что тебе ещё и датацентры не выдают, то и стройте хардверные вычислители, а в какой-то момент могут и хардверные линии связи потребоваться). Церковь интернета оказалась да, мощна. Ну, нужно организовывать другие церкви, только и всего. Huawei уже пошёл по этому пути, нужно только немножко подождать. Меня давно смущало, что на планете есть только один интернет. Надо хотя бы пять, и чтобы они жёстко конкурировали, иначе будет застой, отсутствие развития, да и с безопасностью проблемы. Другое дело, что эволюция дело не слишком торопливое, и проблемы вот таким путём конкуренции всех со всеми решаются не быстро. Но в долгосрочном плане они решаются, а при отсутствии конкуренции -- нет, идёт долгое загнивание, потом убожество, потом смерть.

При этом Китай концепцию цифровой кармы, тьфу, системы социального кредита потихоньку продолжает реализовывать, 24 декабря 2020 для своих 1.4млрд человек выпущены руководящие материалы, поезд идёт -- https://www.reuters.com/article/china-economy-data/china-issues-rules-on-social-credit-system-amid-public-concerns-idUSL4N2J417K. Эти социальные кредиты интересная штука. Мало баллов? Иди монстров мочить, то есть защищать правительственную политику (за это дают баллы! а за участие в митингах баллы снимают!): https://en.wikipedia.org/wiki/Social_Credit_System. То есть понятие "неблагонадёжный", сиречь "враг народа" чётко публичится и приравнивается к понятию "вор" и "хулиган". А цифровая трансформация? Вот это она и есть, в государственных масштабах: цифра меняет и способы ведения бизнеса, и способы борьбы с инакомыслием.

И да, исследования по предсказанию политической ориентации даже по внешности уже тут. Using a dataset of over 1 million Facebook and dating sites profiles from users across Canada, the U.S., and the U.K., Kosinski and coauthors say they trained an algorithm to correctly classify political orientation in 72% of “liberal-conservative” face pairs. И ответили на самую разную критику, которая была неминуема, https://venturebeat.com/2021/01/11/outlandish-stanford-facial-recognition-study-claims-there-are-links-between-facial-features-and-political-orientation/. Перед тем как делать свою аватарку, подумайте трижды -- что вы этим хотели сказать людям? Ничего не хотели, ага. А алгоритмам что вы хотели сказать? Вот то-то же!

А я сам? Помним работу про ухоженные сады, которые чахнут от пацифизма -- https://www.greaterwrong.com/posts/tscc3e5eujrsEeFN4/well-kept-gardens-die-by-pacifism. Одного шибко политизированного и флудящего товарища пришлось в эти каникулы забанить из двух чатов поддержки онлайн-курсов. И за него ведь заступались! Жалею, что поддался на уговоры и дал ему порезвиться подольше. В следующий раз буду действовать быстрее. Оффтопы и флуд не пройдут, за возделанными садами нужно ухаживать: сорняки туда не пускать. Если хотят, пусть возделывают свои сады теми методами, которыми портят чужие.

Неделю назад поменял VPN с Hotshield Elite на NordVPN -- по субъективным ощущениям качество соединения осталось примерно такое же, а вот скорость включения-выключения выросла в разы (но страной выхода по умолчанию для России в NordVPN является Украина, и ты тут же лишаешься всех сервисов яндекса). Но это умолчание легко исправить. Спасибо людям, которые пишут код! Они помогают игнорировать людей, которые пишут дурацкие законы и Роскомпозор, который пытается эти законы реализовывать. А как я знаю, что законы дурацкие? А как вы узнаёте, что вам ответ на 2*2 дан дурацкий?! Когда-то мне Гена Лебедев в самом конце 80х сказал, что он думал, что вопрос политических пристрастий как вопрос свободы совести: нет доказательств -- выбирай политику, какую хочешь. А потом оказалось, что в рассуждениях на политические и политэкономические темы тоже работают правила логики, и у тех же социалистов в рассуждениях тупо логические ошибки. А дальше, как и везде в науках: где ошибок меньше, та теория побеждает, а остальные проигрывают. Вот дурацкие законы нелогичны, они следуют ошибочным теориям. При этом нужно учитывать, что в 21 веке ещё и сама логика поменялась (спасибо AI, там с этим много разбирались -- не нужно смотреть работы философов, эти писатели-фантасты тут вообще сбоку), и логика науки поменялась (эволюционная эпистемология Поппера-Дойча и open-endedness, объяснения с их контрфактуальностью и причинным выводом с учётом do-calculus вместо "истина" и "ложь", это ж всё 21 век).

Сходил на этих каникулах на интесив ламбазука: смесь ламбады и зука. За девять часов интенсива я, конечно, этот ламбазук не научился танцевать, но зато поисследовал людскую природу: мне многие говорили, что им лабмазук не очень -- вот я пошёл и поспрашивал тех людей, которым ламбазук очень. И у них вполне разумные аргументы: от "люблю скорость побольше", "люблю ощущение полёта в ламбе, а не качания на волнах зука", "в отличие от всё более сумрачной музыки в зуке, ламба -- это солнце, море и радость", "на высоких уровнях зука требуется зрелищность, а она есть только в ламбе" до бесхитростного "в ламбазуке фигуры девочек в среднем лучше, чем в зуке, значит и нам сюда"! Как говорится, "кто любит пиво, кто любит квас, а я ужасно обожаю контрабас!". Выпускная вечеринка удалась: подходили мои знакомые кизомби (среди зукеров мультидансеров не так уж и мало, их везде не так мало), и мы вместо этого мало мной освоенного ламбазука танцевали урбанкиз-таррашо с элементами всего подряд -- зука, ламбазука, танго и просто чистой импровизации. С танцами как с языками: после третьего каждый новый занимает меньше и меньше времени для его освоения. Но в ламбазуке обнаружилось ещё одно обязательное требование, которое быстро не выполнишь: девочками у мальчиков тоже ожидается фигура получше, при этом диаметр фигуры неважен, а вот грудь колесом -- важна. Так что для ламбазука мне нужно продолжать выпрямляться, без этого там никак.

И ещё было письменное новогоднее танцевальное приключение: с середины декабря много писал комментов в танго-сообщество (и даже сходил на одну альтернативную милонгу перед самым новым годом), https://www.facebook.com/groups/2979915785566910/permalink/3543216122570204/, https://www.facebook.com/groups/2979915785566910/permalink/3545906785634471/, https://www.facebook.com/groups/2979915785566910/permalink/3544173689141114/, https://www.facebook.com/groups/2979915785566910/permalink/3531910550367428/, https://www.facebook.com/groups/2979915785566910/permalink/3537208909837592/, https://www.facebook.com/groups/2979915785566910/permalink/3530302853861531/, https://www.facebook.com/groups/2979915785566910/permalink/3527640194127797/. Увы, пока ничего из этого приключения хорошего не вышло. Танго-тусовка сегодня делает акцент на исторических танцах и своём благородном происхождении, а любые разговоры о развитии понимает как подрыв основ. Тем не менее, танго интересно: более-менее полный танец идёт от работы ногами, корпусом, головой. Вот ноги -- танго, корпус -- таррашо, голова -- зук (ещё остались руки, и даже ламбазука для рук маловато будет. Руки, наверное, из хип-хопа таки тянуть нужно. Нет пока интересных рук в социальных танцах).

Собрал заодно материалы по танцевальным нотациям: https://vk.com/wall-179019873_1154. Это такой побочный результат дооформления проекта системной ритмики в музыке и танцах -- https://ailev.livejournal.com/1550157.html, https://system-school.ru/rhythm.
2019

Уровни Марра и первые принципы: это всё системное мышление

Sutton напомнил в дебатах по AI 2020 (пока наиболее подробное изложение в https://www.zdnet.com/article/ai-debate4-2-night-of-a-thousand-ai-scholars/, выступление Sutton в https://www.youtube.com/watch?v=hcJNFdZit-Q) про необходимость вести обсуждение чего бы то ни было в рамках концептуальных подходов (https://en.wikipedia.org/wiki/Conceptual_framework, иногда ссылаются на просто подход/framework, в том числе системный подход именно таков -- набор концептов для рассмотрения сложных ситуаций), а не как попало. Подходы обращают внимание на важное, позволяют структурировать обсуждение.

Для обсуждения искусственного интеллекта Sutton предложил использовать "уровни анализа" Марра для вычислительной системы (первая версия Marr and Poggio 1976 с четырьмя уровнями, https://www.researchgate.net/publication/37596647_From_Understanding_Computation_to_Understanding_Neural_Circuitry, вторая с тремя уже классическими -- 1982 год, https://web.stanford.edu/class/psych209a/ReadingsByDate/01_07/Marr82Philosophy.pdf, в Сети анализов этой работы более чем достаточно). Даю по работе Levels of Analysis for Machine Learning от коллег Sutton в DeepMind, https://arxiv.org/abs/2004.05107):
-- Computational level.What is the goal of a system, what are its inputs and outputs, and what mathematical language can be used to express that goal?
-- Algorithmic or representational level. What representations and algorithms are used to achieve the computational-level goal?
-- Implementation level. How is the system implemented, either physically or in software?

А вот как это изложил Sutton в своём слайде в дебатах:

Эти "уровни анализа вычислительных систем" всем показались очень удачными, и им пошли давать разные толкования, и продолжают давать толкования до сих пор. Но раньше этих попыток было ещё больше, см., например, https://www.albany.edu/~ron/papers/marrlevl.html, 1991, где сразу указывается: In recent work in the theoretical foundations of cognitive science, it has become commonplace to separate three distinct levels of analysis of information-processing systems. David Marr (1982) has dubbed the three levels the computational, the algorithmic, and the implementational; Zenon Pylyshyn (1984) calls them the semantic, the syntactic, and the physical; and textbooks in cognitive psychology sometimes call them the levels of content, form, and medium (e.g. Glass, Holyoak, and Santa 1979).

Важно тут указать, что предполагается рекурсивное применение этого фреймворка, то есть не только для вычислительной системы, но и для её подсистем (это, например, явно обсуждается с примером в https://arxiv.org/abs/2004.05107).

Я предлагаю считать, что удачность выделения этих уровней -- это просто использование системного подхода в вычислительном мышлении, и не более того (системный подход в вычислительном мышлении я обсуждал в https://ailev.livejournal.com/1544639.html):
-- вычислительный уровень -- это предложение обсудить функциональность вычислителя, формализм обсуждения потребностей и требований (и это требует разговора на языке надсистемы)
-- алгоритмический или репрезентационный уровень -- это уровень обсуждения функциональности вычислителя (в смысле из "Программирования для математиков" Кушниренко и Лебедева, первые два раздела первой главы -- https://yadi.sk/i/virGAvARqqtMhQ, хотя для случая неимперативного программирования и тем более вычислений в распределённых представлениях нельзя применить тамошние идеи "в лоб", но если речь идёт о полнотьюринговых вычислениях, а все они таковы, что обсуждается у того же Дэвида Дойча, то различение "исполнитель-выполнитель" может оказаться очень полезным. Аналогичные различения пытался ввести Алан Кей как chain of meanings. А для самого Марра обсуждают, что он вводит computational pipelines).
-- уровень реализации -- это уровень обсуждения конструкции вычислителя, что там в физике будет эффективно реализовывать вычисление (в терминах Кушниренко-Лебедева это обсуждение выполнителя для данного исполнителя).

То есть речь идёт о том, чтобы обсудить надсистему (какое вычисление требуется для надсистемы), затем архитектуру вычислителя/вычислительной системы. А при обсуждении архитектуры вычислителя речь пойдёт о его частях, и всё обсуждение нужно будет повторить.

Итого: если вы будете использовать вычислительное мышление, основанное на системном мышлении, то дополнительной необходимости говорить об "уровнях анализа Марра" не нужно, это у вас будет "из коробки". Вы и так не забудете обсудить постановку задачи на вычисление и формализм постановки задачи (потребности и требования -- ещё и в их различении!), затем обсудите архитектуру (алгоритмы и представления данных, а также аппаратуру или софт, их эффективно реализующие). И будете использовать такое рассмотрение на многих уровнях вверх и вниз от границы вашего целевого вычислителя.

Осталось понять, что же говорил Sutton, зачем ему был нужны эти уровни анализа? Sutton обратил внимание на отсутствие высокоуровневых обсуждений (универсальных алгоритмов уровня когнитивных фреймворков, вычислительная надсистема над традиционно понимаемом "компьютере простых алгоритмов") и отсутствии формализации разговора об этих вычислениях. Его волнует отсутствие обсуждения обучения с подкреплением (именно reinforcement learning он считает хорошим кандидатом на универсальный алгоритм "computational level" для AI, другие для него менее хороши -- predictive coding, bayesian inference), формализации постановки задачи на эту универсальность. А то, что там где-то внутри для обучения с подкреплением используются алгоритмы градиентного спуска и распределённые представления в нейросетях -- это уровнем ниже, хотя на эту тему очень много выдающихся работ. Я бы переформулировал, что Sutton говорит: "если ты не знаешь, какой вычислитель ты делаешь -- никакая алгоритмика внутри этого вычислителя тебе не поможет". Да, если целевая система не выявлена, мы не можем предложить её архитектуру. Это стандартное рассуждение системного мышления.

И такого много: самые разные удачные "приёмы мышления" оказываются просто частями системного мышления. Прошлый раз этот феномен мы видели на примере "первых принципов" (цитирую свой сентябрьский текст 2020, https://ailev.livejournal.com/1536680.html):
Разборка с "мышлением из первых принципов" показала, что ничего там особо интересного, увы, нет. Это всё придумал Аристотель, выразившись крайне невнятно про разбиение на части в духе ранних версий системного подхода (неважно какие части, главное до дна, где вы полностью уверены в утверждениях -- это и будут первые принципы). Дальше, как и в системном подходе, всё зависит от того, что вы считаете частями. Версия Элона Маска оказывается одной из самых продуктивных -- но в переводе с аристотелевских иносказаний на современный означает выход в физический мир (он прямо указывает на физику как основание для мышления) и попытка альтернативного модульного синтеза при сохранении функции в надсистеме. Попытки использования типовых архитектур он называет мышлением по аналогии, а предложение новой конструкции на низких системных уровнях для реализации высокоуровневых функций -- это и есть мышление из первых принципов. Тот же ТРИЗ занимается тем же самым, только называет это по-другому. Системные архитекторы всего мира (которые разрабатывают новые архитектуры, а не переиспользуют старые -- то есть мыслят не по аналогии, как об этом говорит Элон Маск) тоже занимаются этим. Вот парочка ссылок, там всё понятно: https://fs.blog/2018/04/first-principles/, https://jamesclear.com/first-principles. Линия с выходом на принятие формул всерьёз (это я продолжаю упоминать Дэвида Дойча) и впрямь связана с теми самыми широко понимаемыми первыми принципами как опору на утверждения, которые нам известны и в которые мы верим, но нам вполне хватит понятий системного мышления, чтобы поддерживать этот разговор о "делении на части, о которых уже хорошо известно". Мы хотя бы знаем, как делить на части: функционально, конструктивно, по местам, разными другими хитрыми способами, а также на много уровней вниз и ещё и со сборкой вверх всеми этими способами. Аминь, тема с инженерией из первых принципов оказалась закрыта -- это просто термин для обозначения предложения first in a kind архитектур, новых способов организации/структурирования вещества для выполнения какой-то функции. Это как раз про получение той самой архитектурной идеи, которая переведёт мечту в проект, или предложит такой проект, который не стыдно назвать мечтой.
Человеческое знание не просто может быть, а прямо таки должно быть компактифицировано. Вместо сотен и сотен "удачных идей" мы получим небольшой набор трансдисциплин, который заменит их все. Системное мышление как раз такая компактифицирующая дисциплина. Овладейте системным мышлением, и вам не нужно будет специально изучать "мышление из первых принципов" и "марровские уровни анализа вычислительных систем". А заодно поймёте разницу между потребностями и требованиями (а кто не обратил внимание, обратите: на вычислительном уровне подхода Марра я говорю о потребностях и требованиях, а не просто о требованиях. Почему? Ответ в курсе системного мышления -- https://system-school.ru/systems-thinking, чат поддержки книги/курса https://t.me/systemsthinking_course.
2019

О будущем курсе "Системная ритмика в музыке и танцах"

Мы опубликовали на сайте Школы системного менеджмента новую схему курсов, её структура примерно соответствует декомпозиции жизненного мастерства, описанной в "Образовании для образованных 2020" (жизненное мастерство делим на мастерство собранности, мыслительное и прикладное). И на этой схеме отражены некоторые курсы, которые мы ещё не даём, но которые стоят в наших исследовательских практиках -- они там обзозначены серым цветом. В частности, в рамках прикладного мастерства заявлен интенсив по системной ритмике в музыке и танцах. Интенсивы мы планируем как вывод некоторых кругозорных практик на уровень рабочего применения (например, практикум архитектуры предприятия), так и какие-то углублённые штудии по хоббийным вопросам (скажем, для кругозорного курса по системному мультидансу/танцевальному мышлению это интенсивы по конкретным базам, а также по ритмике в музыке и танцах. Мы ведём исследования по ритмике.


Дисциплина: системная ритмика.
Лаборатория: системной ритмики.
Руководитель: вакантно
Роли: методолог, нотационный инженеры, методист. Вакантны.

Площадка коммуникации: MS Teams (требуется приглашение от членов команды и выполнение квалификационного минимума).

Квалификационный минимум: знакомство с онтологической работой, знание материала учебника системного мышления, владение ритмикой в музыке и танцах (предполагается не изучение предмета новичками в ходе любительского самообучения, а создание курса профи в ритмике -- исследования и разработки, а не "посмотрю, что там у вас, заодно и научусь").

Контекст исследования
Ритмика даётся музыкантам и танцорам тяжело, и хотелось бы ускорить это обучение в разы. Для этого необходимо разработать:
-- понятийный минимум системной ритмики, отражающий SoTA дисциплины с учётом системности. Работа методолога.
-- нотационное представление ритма (включая отражение сочетание ритмов -- например, соответствие ритма музыки и танца, или ритма какого-то инструмента ритму ансамблевого исполнения), адекватное понятийному минимуму ритмики и учитывающую системность. Работа нотационного инженера.
-- собственно учебный курс (в том числе объяснений, упражнений, последовательности обучения/curriculum). Работа методиста.

Интенсив по системной ритмике мог бы углубить материал, даваемый в рамках кругозорных курсов танцевального мышления (сейчас: системный мультиданс, охватывает социальные танцы) и музыкального мышления (планируется).

Исследовательская гипотеза
Мы можем положить в основу курса ритмики нынешний SoTA: материалы по ритмическому сольфеджио такадими, а затем от сольфеджио перейти к прикладным/исполнительским аспектам, то есть в музыкальном и танцевальном перформансе.

Мы будем учитывать системные уровни, на которых бытует ритм -- как системные уровни танца, так и системные уровни самого ритма: минимально онсеты и их свойства (тембр, акцент), ритмические паттерны, уровень композиции/перформанса, уровень ритмической культуры. Учёт системных уровней показал свою успешность при структурировании материала системного мультиданса и системного фитнеса.

Ещё одна идея -- это то, что в ходе исследований по ритмическому искусственному интеллекту были предложены понятия, более компактно и универсально выражающие ритмы в музыке и танцах.

Время начала исследования: 2019 год в рамках лаборатории системного мультиданса (https://vk.com/buffdance), выделение в отдельный проект -- январь 2021

Программа исследований
Такадими и традиционные способы обучения музыке в танцах были обсуждены в ходе работы лаборатории танцевального мышления, их материалы доступны тут (в обратном хронологическом порядке): https://vk.com/wall-179019873_615, https://vk.com/wall-179019873_586, https://vk.com/wall-179019873_505, https://vk.com/wall-179019873_483, https://vk.com/wall-179019873_258, https://vk.com/wall-179019873_237, https://vk.com/wall-179019873_232. В этих постах приведено большое количество литературы по такадими и ритмике в мировой музыке и танцах.
Также изучению подлежат материалы по распознаванию и порождению ритма, полученные в ходе исследований и разработок в области искусственного интеллекта, нужно проанализировать понятия и идеи, использовавшиеся в последних работах (тут только примеры работ):
-- связь ритмики в танцах и музыке: https://arxiv.org/abs/1906.00606, https://arxiv.org/abs/1911.02001, https://arxiv.org/abs/2002.03761, https://arxiv.org/abs/2004.11994, https://arxiv.org/abs/2006.05743, https://arxiv.org/abs/2006.06119, https://arxiv.org/abs/2006.11905, https://arxiv.org/abs/2008.08171, https://arxiv.org/abs/2008.10122, https://arxiv.org/abs/2008.13040, https://arxiv.org/abs/2009.08027, https://arxiv.org/abs/2009.07637, https://arxiv.org/abs/2009.12763, https://arxiv.org/abs/2011.12999.
-- Ритмический искусственный интеллект в музыке: https://arxiv.org/abs/2011.13062, https://arxiv.org/abs/2011.12676, https://arxiv.org/abs/2010.08091, https://arxiv.org/abs/2010.07518, https://arxiv.org/abs/2009.02057, https://arxiv.org/abs/2007.10610, https://arxiv.org/abs/2004.04687, https://arxiv.org/abs/2004.01525, https://arxiv.org/abs/2002.06638, https://arxiv.org/abs/1908.06969, https://arxiv.org/abs/1905.06118, множество работ в книге computational models of Rhythm and Meter, https://b-ok.cc/book/3525005/920637

Можно также указать на традиционные учебники A Rithmic Vocabulary https://b-ok.cc/book/1260402/87e8fb и Sight-Read Any Rhythm Instantly https://b-ok.cc/book/1210209/494586 и The Rhythm Book: Studies in Rhythmic Reading and Principles https://b-ok.cc/book/3434138/fae1d3 наряду со Studying Rhythm https://b-ok.cc/book/5102727/dbfccf/

Интересны не только учебные результаты этих всех работ, но и используемый ими язык разговора о ритме: набор понятий, который позволял авторам этих работ лучше изучать и порождать алгоритмы синтеза ритмов.

В ходе исследования будет учтён опыт структурирования предметной области ритмики по системным уровням: будет предложен ритм-стек, аналогичный стеку мультиданса и системного фитнеса.

UPDATE: добавил про системность ритмики.