Solving Data Quality Problems Using Data Standards -- http://findarticles.com/p/articles/mi_qa3766/is_200710/ai_n27997243/ (четыре шага обеспечения качества данных).
Про master data очень правильная и очень свежая презентация от IBM: http://www.spegcs.org/attachments/studygroups/4/2010_06_Digital%20Energy%20Study%20Group_Jim%20Soos%20SPE%20Master%20Data%20Mgmt%20Discussion.pdf
Удивительно, но при попытках поиска на слова Classification, Identification, Cataloguing, Codification, Characterization и даже master data главным словом во всех найденных страничках выскакивает NATO (оценка вложений NATO в создание своего электронного словаря данных -- $3млрд, так что это неудивительно).
Но все эти слова знакомы не только для NATO. Так, ГОСТ Р 51725.2-2001 "Каталогизация продукции для федеральных государственных нужд. Термины и определения" определяет, что процессы каталогизации промышленной информации включают:
-- единообразное представление
-- сбор
-- классификацию
-- идентификацию -- распознавание и/или выделение item из их множества по каким-то правилам (описательным методом, ссылочным методом, ссылочно-описательным методом)
-- кодирование -- присвоение номенклатурного номера
-- регистрация
-- обработка
-- хранение
-- распространение
Правда, что означают все эти слова, в стандарте не определено (а что определено, я указал). С другой стороны, разные источники определений (в том числе и иностранные) путаются в показаниях от стандарта к стандарту. Так что с этим еще нужно будет чуток поразбираться. Пока же понятно, что в этой предметной области master data наиболее существенны еще:
-- стандарты метаданных, где заодно определяется "регистрация метаданных" (вспоминаем всю проблематику регистраторов, включая делегирование полномочий): http://en.wikipedia.org/wiki/ISO/IEC_11179
-- терминологические стандарты.
А еще восхищает история "победы Гуголя над Йеху": как мантра во всех материалах про ISO 22745 звучит, что в современной системе каталогов не должно быть никакой иерархии классов, ибо компьютерный поиск круче и лучше, чем работа с классификаторами. Ср.: http://ailev.livejournal.com/368377.html?thread=2565625 (интересно, что в нынешнем 2010 скажет
Если это кому интересно, то я еще вчера про промышленные каталоги написал тут (развернув в сторону каталогов методов, а не каталогов "предметов снабжения"): http://community.livejournal.com/praxos/9600.html
Programming-in-the-large и истинная предмет-ориентированность тут достигается тем, что все системы поддержки master data обмениваются сообщениями. Почитайте свежее интервью Alan Kay http://www.computerworld.com.au/article/352182/z_programming_languages_smalltalk-80/ -- там он как раз говорит, что ООП он дал название крайне неудачно, потому как идея "объектов" была менее важной, чем идея масштабирования через обеспечение обмена сообщениями. Объекты были нужны только как активные, т.е. умеющие обмениваться сообщениями, ибо "просто данные" не могут обмениваться сообщениями.
В принципе, тут вытаскиваются также и system-of-systems.
Все с этими кодификациями-каталогизациями оказалось еще интересней, чем я думал. Хотя, возможно, это свойство моего мышления, а не данной предметной области ;)