July 25th, 2020

2019

lytdybr

Во фрифиде огромный тред о шрифтах (повод: указание о шрифтах в Ridero дано на странице с аннотацией кеглем тем же, что и заголовок, да ещё и в позиции заголовка -- если издали поглядеть, то "спасибо Кириллу и Мефодию за эти буквы" легко спутать с заголовком) -- https://freefeed.net/ailev/a33ad000-571a-4841-9c33-8ae696c0ea90. И ещё о шрифтах ШСМ тут: https://freefeed.net/ailev/14f3d761-6d70-484b-96d0-f72408e7b196. Мой основной пойнт в том, что со шрифтами та же ситуация, что с рынком HiEnd аудио: премиальные цены за тёплые ламповые особые шрифты (при минимуме исследований и максимуме заявлений, что "я чувствую разницу). Ну прямо как традиционные споры меломанов и аудиофилов при резком неприятии исследований по психоакустике и слепых двойных прослушиваний, только тут про шрифты. Для кофе то же самое, тьма таких рыночков "на субъективных ощущениях" и премией за их тёплое ламповое описание. Тут нужно сказать, что всё это ещё и базируется на копирайте, а я критик копирайта справа (а не слева, я ж либертарианец). То есть я ещё и скептик того, что за пользование шрифтом нужно платить. Если бы эти истории со шрифтами кого-то сильно волновали, то публикации о генерации шрифтов нейросетками типа https://arxiv.org/abs/1905.12502 были бы мейнстримом.

А вот тут я пишу про то, как достала меня реклама подкастов в яндекс.музыки: трейлер какого-то подкаста на тридцать секунд даже подсунули мне вчера в плейлист дня (я там и скриншот дал). Я не сразу сообразил, откуда у меня в комнате громко играет какое-то радио с радостными дикторскими голосами, у меня ж проплаченный яндекс.плюс ровно для того, чтобы такого не слышать -- https://freefeed.net/ailev/39f07de1-303e-4866-a950-f3a02347bcb8.

Первые читатели закончили читать "Образование для образованных 2020". y_pat откликнулся поэтическим текстом про меня, пишущего много лет в ЖЖ, не сходя с места, и привлекающего этим внимание богов (а остальные при этом кочуют по разным соцсеткам) -- https://www.facebook.com/patarakin/posts/10158378485199788. Я ж ответил, что и с места не схожу, и кочую не меньше других одновременно (трансляции моего блога в ЖЖ можно найти тут сразу после "цепочек" -- https://ailev.livejournal.com/profile). А ещё доступ к тексту книги уже получили выпускники моего одноимённого курса, традиционный аттракцион невиданной щедрости.

Сегодня купил капсул кофе американо. Попробовал -- и понял, что это ровно тот вкус, какой был у кофе в компании Карана в конце 90-х. Туда, бывало, придёшь, и тебе сразу наливают где-то 300мл кофейку, стандартную тамошнюю порцию. Вот ровно этот американо и наливали (хотя в Каране наливали оригинал: ту самую капельную заварку, к которой привыкли американцы, и которую потом повторяли итальянцы путём разбавления эспрессо водой. А капсультная система Dolce Gusto имитирует в капсулах оба варианта сразу -- но на вкус получается очень похоже! Это всё развитие той же темы кофефилов и кофеманов (как аудиофилов и меломанов, шрифтофилов и шрифтоманов и т.д.).

Открыл сезон кизомбических плясок в Сокольниках. С ужасом заметил на градуснике в парке температуру: 11°. Но танцевал в майке и даже чуток употел. А накануне танцевал буфф-импро в Музеоне, там тоже было прохладно -- но главное, это 13 минут на самокате от дома! Сегодня крыша в Движении, должно быть уже теплее.
2019

Онтологическая власть: чей bias станет formal, explicit specification of a shared conceptualization

Начинаются онтологические разбирательства с австрийской школой экономики (вот тут Пётр Щедровицкий: https://www.facebook.com/petr.shchedrovitskiy/posts/3133496026737273), я напоминаю там про дискуссию свою 2016 года с Павлом Усановым по поводу феноменологии Гуссерля и австрийской школы https://ailev.livejournal.com/1297004.html (и там много ссылок на мои посты 2009 года, когда всплывала эта тема). В 2016 году я считал, что праксиологию нужно сажать на логику-онтологию-эпистемологию (онтологическая традиция, описанная в посте 2011 года https://ailev.livejournal.com/952930.html). Но сейчас это для меня "предсовременность", сегодня нужно говорить о другой логике: причинный вывод, вероятностные модели знания -- всё это появилось после 2000 года. И вот об этом нужно говорить чуток подробней.

В плане разбирательств со схемами аргументации vvagr нашёл работу 2016 года -- диссертацию Matthias Grabmair http://d-scholarship.pitt.edu/27608/7/MGrabmair-ETD-v2.pdf, Modeling Purposive Legal Argumentation and Case Outcome Prediction using Argument Schemes in the Value Judgment Formalism (Uncontrolled Keywords: Artificial Intelligence and Law, Argumentation, Argument Schemes, Case-based Reasoning).

Это нужно всё сопоставлять с попытками тестирования и дебага представлений чистых трансформеров, таких как открытая на прошлой неделе GPT-3 (обзорчик вот: https://venturebeat.com/2020/07/24/ai-weekly-the-promise-and-shortcomings-of-openais-gpt-3/). И вот тут предложение того, как нужно проверять эти сетки на их адекватность: https://venturebeat.com/2020/07/09/ai-researchers-create-testing-tool-to-find-bugs-in-nlp-from-amazon-google-and-microsoft/, AI researchers create testing tool to find bugs in NLP from Amazon, Google, and Microsoft.

Тут я хотел написать лонгрид с разъяснениями и ссылками про этот вой про "расистские" bias, который стоит сейчас в связи с использованием нейросетей (см., например, тот самый обзорчик по GPT-3, на который я дал ссылку), но лень и некогда. Так что ограничусь только коротенькой цепочкой:
-- модели языка это по факту современные "вероятностные онтологии". Классическое определение Т.Грубера: An ontology is a formal, explicit specification of a shared conceptualization, https://iaoa.org/isc2012/docs/Guarino2009_What_is_an_Ontology.pdf. Разделяемая спецификация -- что они отражают по витгенштейну коллективный опыт использования понятий в коммуникации, а не выдумки одной головы. Формализация, ибо дан формализм вывода (коннекционизм, понятно как вычислять вывод в нейросетках трансформеров). Концептуализация, так это не совсем модели языка, ибо под словами там лежат понятия, восстанавливаемые из гигантского корпуса учебных для модели языка текстов. Эти тексты понятийно описывают некоторую модель мира (там не только модель языка, но и модель мира -- тексты-то не только тексты, они ещё и мир описывают! Сетка выучивает и язык, и нарезку мира на объекты, соответствующие понятиям -- и становится тем самым явной спецификацией). Тут ещё можно сказать, что у современных онтологов точно такая же путаница между онтологиями-про-слова и онтологиями-про-объекты-мира.
-- разделяемость каким-то сообществом означает в том числе и неразделяемость другим сообществом. Что родная онтология для одних, то дикий бред для других. Что для одного понятийно "разведчик", для другого "шпион". Если брать большой корпус текстов для обучения нейросетки, то неминуемо будет bias в сторону народных представлений. И какие-то "элиты" будут громко возражать. Вот эти все bias в сторону белых протестантских здоровых гетеросексульных мужчин, а не чёрных нью эйдж феминисток-лесбиянок-инвалидок. То есть онтология должна быть "правильной", история и культура должны быть преодолены и переписаны. Те, кто считает, что нейросетка должна быть культурной (то есть традиционной) тем самым враги народа, нейросетка должна быть бескультурной, не нести на себе бремя культуры: современную культуру мы придумаем сами и будем ей следовать прямо от сейчас и в будущем (а прошлое гори огнём). Я, замечу, согласен с этим тезисом. Не согласен только с тем, какую именно культуру нужно придумывать самим, и сомневаюсь, что прошлое нужно вот так сразу полить огнём, а не оставить хотя бы для справок. Книги можно жечь и путём вытравливания bias. При этом одновременно книги пишутся именно путём вытравливания bias (новое знание, "новая книга", новая онтология подхакивает модель мира -- уж куда подхакаете, такая модель мира и будет)!
-- Тут можно сослаться на любимую тему последователей ММК про то, что "онтология задаётся властью", "кто задаёт онтологию, тот и власть". Вот, мы сейчас ровно это и видим. Пока онтология была в мозгах людей, это было незаметно. Но когда онтология отчуждена и лежит где-нибудь в нейросетке полиции, или нейросетке Фейсбука (то есть где-то рядом с штыками, в том числе цензурирующими перьями-штыками), эта "борьба за власть", за "правильный новый bias", правильный новояз по сравнению с неправильным староязом мировой культуры -- вот это становится очевидным. Онтология становится артефактом, появляется иллюзия, что её можно "отрегулировать законодательно", как можно отрегулировать законодательно книгописание.
-- всё станет сильно интересней, когда нейросетевые "модели языка" начнут взаимодействать со всеми этими "моделями причинности". После эпохи бигдатовых knowledge graphs (классические древние онтологии из computational ontology до момента её стагнации с 2012 года) придёт эпоха бигдатовых графов причинности и схем аргументов. Вот тогда-то и поговорим о bias, полиции кремниевой мысли и всём таком: что вам разрешат считать причинностью, что пойдёт как аргумент, а что будет сочтено "правдой, но поскольку это неполиткорректная правда, то в зачёт не идёт".

А кто победит? Похоже, что победит тот, у кого больше вычислительных мощностей, тот и победит. Несчастные деньги налогоплательщиков, которые эту победу будут оплачивать. Кто эти деньги захватит, тот и пропихнёт свой вариант политкорректности, свой bias, свою онтологию как "истинное равенство и онтологический стандарт". При этом рядом через границу будут жить другие налогоплательщики, и их захватят другие люди, пропихивающие другой bias. И тот другой хрен из-за бугра будет этой отечественной редьки не слаще. Будет такая война за нейтральный bias, что никого (и ничего, не все в этой войне людьми будут) нейтрального на глобусе не останется.

Disclaimer. Да, я понимаю, что bias это не ontology, он в онтологии. Это ничего в заголовке и тексте не меняет.

UPDATE: обсуждение в фейсбуке -- https://www.facebook.com/ailevenchuk/posts/10219038627290664