Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Кодификация, характеризация, каталогизация, идентификация, классификация

ISO 22745: standard for master data -- http://findarticles.com/p/articles/mi_qa3766/is_200710/ai_n27997247/
Solving Data Quality Problems Using Data Standards -- http://findarticles.com/p/articles/mi_qa3766/is_200710/ai_n27997243/ (четыре шага обеспечения качества данных).
Про master data очень правильная и очень свежая презентация от IBM: http://www.spegcs.org/attachments/studygroups/4/2010_06_Digital%20Energy%20Study%20Group_Jim%20Soos%20SPE%20Master%20Data%20Mgmt%20Discussion.pdf

Удивительно, но при попытках поиска на слова Classification, Identification, Cataloguing, Codification, Characterization и даже master data главным словом во всех найденных страничках выскакивает NATO (оценка вложений NATO в создание своего электронного словаря данных -- $3млрд, так что это неудивительно).

Но все эти слова знакомы не только для NATO. Так, ГОСТ Р 51725.2-2001 "Каталогизация продукции для федеральных государственных нужд. Термины и определения" определяет, что процессы каталогизации промышленной информации включают:
-- единообразное представление
-- сбор
-- классификацию
-- идентификацию -- распознавание и/или выделение item из их множества по каким-то правилам (описательным методом, ссылочным методом, ссылочно-описательным методом)
-- кодирование -- присвоение номенклатурного номера
-- регистрация
-- обработка
-- хранение
-- распространение

Правда, что означают все эти слова, в стандарте не определено (а что определено, я указал). С другой стороны, разные источники определений (в том числе и иностранные) путаются в показаниях от стандарта к стандарту. Так что с этим еще нужно будет чуток поразбираться. Пока же понятно, что в этой предметной области master data наиболее существенны еще:
-- стандарты метаданных, где заодно определяется "регистрация метаданных" (вспоминаем всю проблематику регистраторов, включая делегирование полномочий): http://en.wikipedia.org/wiki/ISO/IEC_11179
-- терминологические стандарты.

А еще восхищает история "победы Гуголя над Йеху": как мантра во всех материалах про ISO 22745 звучит, что в современной системе каталогов не должно быть никакой иерархии классов, ибо компьютерный поиск круче и лучше, чем работа с классификаторами. Ср.: http://ailev.livejournal.com/368377.html?thread=2565625 (интересно, что в нынешнем 2010 скажет kukutz: пять лет-то с января 2006г. уже почти прошло! По средней дневной аудитории отношение к "поиску" как раз 20:1, но вот с месячной аудиторией что-то странное, 1:6 -- http://stat.yandex.ru/stats.xml?ReportID=-225&ProjectID=16).

Если это кому интересно, то я еще вчера про промышленные каталоги написал тут (развернув в сторону каталогов методов, а не каталогов "предметов снабжения"): http://community.livejournal.com/praxos/9600.html

Programming-in-the-large и истинная предмет-ориентированность тут достигается тем, что все системы поддержки master data обмениваются сообщениями. Почитайте свежее интервью Alan Kay http://www.computerworld.com.au/article/352182/z_programming_languages_smalltalk-80/ -- там он как раз говорит, что ООП он дал название крайне неудачно, потому как идея "объектов" была менее важной, чем идея масштабирования через обеспечение обмена сообщениями. Объекты были нужны только как активные, т.е. умеющие обмениваться сообщениями, ибо "просто данные" не могут обмениваться сообщениями.

В принципе, тут вытаскиваются также и system-of-systems.

Все с этими кодификациями-каталогизациями оказалось еще интересней, чем я думал. Хотя, возможно, это свойство моего мышления, а не данной предметной области ;)
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 8 comments