Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Управление знаниями. Инженерия знаний. Знаниевые технологии: тусовки и их стандарты.

Знаниевые технологии я пока делю на:
-- работающие с tacit knowledge в человечьих головах (чаще всего именно они имеются ввиду, когда говорится об "управлении знаниями").
-- работающие с письменным знанием (это когда "управление знаниями" распространяется на компьютеры -- типа "блоги в управлении знаниями" или "система работы с документами в управлении корпоративными знаниями" -- http://en.wikipedia.org/wiki/Knowledge_management).
-- работающие с письменным формальным знанием (инженерия знаний, которую тоже включают в управление знаниями, но уже не так уверенно).

Про tacit knowledge и "устный письменный" потом, а пока списочек технологий, работающих с формальным знанием. Все эти технологии по старой традиции называются инженерией знаний -- ибо формальное знание теперь записывается в компьютерные системы, а не просто на бумажку (http://en.wikipedia.org/wiki/Knowledge_engineering, инженерия знаний -- это инженерная дисциплина, которая занимается интеграцией знаний с компьютерными системами для того чтобы решить сложные проблемы, обычно требующие высокого уровня человеческой экспертизы).

Большинство технологий в инженерии знаний пошло по пути реализации так называемой "семантической сети", которая отражает подход Гуссерля-Витгенштейна-Бунге о том, что знание представимо фактами (а факты -- это отношения концептов). Из множества фактов возникает сеть (граф, http://en.wikipedia.org/wiki/Semantic_network и там ссылка на отличный старенький обзор все того же John F.Sowa -- http://www.jfsowa.com/pubs/semnet.htm), в котором отношения-ребра связывают концепты-вершины. Реализацией идеи хранения и использования знаний в форме семантической занялось множество почти непересекающихся тусовок/школ (community of practice), отчего появилось огромное количество реализаций и стандартов, в которых ни одного слова не совпадает (и часто не используется даже название "семантическая сеть" или даже "концепт") -- но которые идейно и технологически совместимы, ибо растут из общего философского (метафизического) корня.

1. Моделирование данных + интеграция данных -- http://www.15926.org/, http://gellish.wiki.sourceforge.net/.
Используют, когда нужно объединить данные множества САПР различных поставщиков при постройке крупного промышленного объекта (вариант: множество разнородных ERP или финансовых систем, например, при слияниях и поглощениях крупных холдингов).
Ключевые слова: ISO 15926, Gellish, ISO 10303. Вместо слова "онтология" говорят "модель данных".
Средства оперирования знаниями: практически нет, все запросы к данным. Со знаниями сражается каждый сам врукопашную. Никакой графики, сплошной XML, проприетарные форматы хранения Схемы данных в каждом отдельном САПР. В последнее время появляются и иные решения, нацеленные на интеграцию разнородных данных, например от CYC и http://www.zitgist.com/ (на базе стандартизированной онтологии UMBEL, выражения в RDF и обеспечения доступа к данным через HTTP, http://www.zitgist.com/labs/linked_data.html). Впрочем, проекты ISO 15926-7 сводятся к тому же: некая онтология + semantic web стандарты.

2. Concept Map (http://en.wikipedia.org/wiki/Concept_map, http://cmap.ihmc.us)
Используют для (часто коллаборативной через веб) учебной и творческой работы.
Ключевые форматы (все на XML): XCT 3.0, но готовы кушать и Topic Map, и многое другое -- им ведь только для редактирования и отображения.
Средства оперирования знаниями: крайне важно графическое отображение, объединение сетей, которые нарисовали два участника творческого процесса.
Близкий родственник -- MindMap, где вообще не граф, а красиво нарисованное дерево -- а связи неименованы.

3. Conceptual Graphs -- http://conceptualgraphs.org/
Используют для академических занятий искусственным интеллектом, экспертные системы, агентские системы и прочая классика жанра. Опираются на работы философа и логика Pierce ("интеллектуальное индексирование"), ключевой человек -- John F.Sowa.
Ключевой формат хранения знаний: три синтаксиса, главный из которых -- CGIF (XML).
Средства оперирования знаниями: Common Logic (или ISO ISO/IEC IS 24707:2007, http://cl.tamu.edu/).

4. Topic Map (http://www.topicmap.com,
Использут для Knowledge Management инициатив -- а пришли они из каталожников (библиографов). Большие любители стандартизации (http://www.isotopicmaps.org/), но потеряли фокус (ибо их от каталожной работы неумолимо влечет к моделированию данных общего вида, в котором они проигрывают подходам Semantic Web -- http://www.topic-maps.org/projects:rule_the_world).
Ключевые форматы хранения знаний: ISO 13250, XTM 2.0, HyTM.
Средства оперирования знаниями: используется topic map engine (десяток вариантов), ибо стандартизован TMAPI 2.0. Кроме того, на финишную прямую вышел специальный стандарт на задание констрейнтов для topic maps -- ISO/IEC FCD 19756 (TMCL), а язык запросов Topic Map Query Language (проект ISO 18048, http://www.isotopicmaps.org/tmql/), похоже, заглох.

5. Semantic Web (http://en.wikipedia.org/wiki/Semantic_Web)
Очень разношерстное месиво самых разных инициатив на базе стека стандартов W3C.
Ключевые форматы хранения знаний: RDF и OWL.
Средства оперирования: язык запросов SPARQL, так называемые business rules, обобщенные затем до просто "правил" (http://www.ruleml.org/) и огромное число самых разных частных разработок. Например, интерфейс DIG 2.0 позволяет самым разным редакторам онтологий работать с моделью вычислений Desctiption Logic (http://dl.kr.org/dig/interface.html). Все древние онтологии срочно переписываются на OWL, все редакторы знаний срочно переделываются на чтение/запись OWL, все системы представления знаний стремятся быть совместимыми.

6. Частные инициативы -- им несть числа. Типа CYC (кстати, они завели блог -- http://blog.cyc.com/), который любит, когда его называют "Rolls Royce of formal ontologies". Или всяческие "семантические поиски" пары десятков крупных фирм (ибо корпоративный поиск -- это сейчас большие деньги). Все это проприетарное в разной степени, стандартизации там мало. С другой стороны, у Microsoft международной стандартизации тоже немного. Да у того же CYC пользователей его онтологии и языка представления знаний (CycL) вполне может быть побольше, чем пользователей какого-нибудь ISO 15926 или Gellish. Вот, например, Formal Concept Analysis (о чем это: http://en.wikipedia.org/wiki/Formal_concept_analysis, homepage -- http://www.fcahome.org.uk/fca.html), используется для выведения иерархии типов и отношений "естественным способом", популярен в России, ибо это крутейшая математика, но в стандартизации пока не замечен.

Конечно, я много из этого знаниевого движения пропустил. Будем считать, что это все ушло в пункт 6. Если вы знаете еще какие-нибудь тусовки и разработанные ими стандарты хранения и оперирования формально представленными знаниями -- напомните, плиз.

Когда кто-то с вами начинает разговаривать про управление знаниями, спросите его при случае -- а какие именно знаниевые стандарты он юзает в своей работе? Если никакие, то вы, скорее всего, столкнулись не с пытающимся управлять знаниями, а пытающимся порулить людьми. Дальше можно разбираться, перед вами спец по работе исключительно с tacit knowledge (и лучше бы ему тогда разговаривать не в терминах знаний, а каких-нибудь других терминах -- "опыт", "коллаборация", "коммуникация" и т.д., чтобы не нужно было отвечать на вопрос "а какое именно знание вам нужно? можете ли сформулировать?", а дальше рисовать хотя бы Concept Map), или это просто произнесение модных слов.
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 30 comments