Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Информация, данные, информационные объекты

В информатике есть принципиально три разные сущности:

1. Информация -- это факты, сведения, команды и т.д.. Когда говорим об информации, имеем ввиду инфологию: о чем это? что означает, в чем смысл? чему соответствует в реальном мире? зачем это?

Плохая весть -- это информация. Обратим внимание, что "плохая весть" не подразумевает обсуждения способа записи, структуры, какого-то синтаксиса, носителя и т.д.

Вотчина пользователей.

2. Данные -- это представление информации с использованием какого-то формализма. Например, данные хорошей вести, представленная в RDF, или даже просто по-русски в KOI-8. Когда говорим о данных, подразумевается их структура и возможность разобраться (человеку или компьютеру).

Данные абстрактны, т.е. не существуют в материальном мире. Действительно, одни и те же данные (например, текстовая строка "ABC" в UNICODE или небольшая база данных со сложной схемой) могут быть представлены на самых разных носителях -- оставаясь теми же самыми данными.

Модели, описания -- это всё данные, ибо налицо использование формализмов (схемы данных, нотации и т.д.).

Тем не менее, даталогия -- это главным образом про то, как что-то представить в формализме, а затем цепочках формальных преобразований, позволяющих сохранить значение и смысл (семантику и прагматику) в ходе хранения экземпляров данных на носителях, передачи их с одного носителя на другой, перекодирования из одного формализма в другой.

Вотчина модельеров данных, прочих модельеров, программистов.

3. Информационные объекты
Газеты, журналы, документы (бумажные и даже электронные -- файлы), базы данных -- это информационные объекты, т.е. физические объекты, содержащие данные. Эти данные можно прочесть. Одни и те же данные могут содержаться на разных информационных объектах (например, быть в газете и базе данных).

Нужно понимать, что данные не живут без носителя -- а носитель с данными всегда является физическим объектом: файл, например, это обычно маленькие магнитные частички, специальным образом ориентированные, расположенные во множестве разных мест. Ну, или какие-то части микросхем памяти, имеющие разные физические характеристики (напряжения, отражающие -- depict -- данные).

Информационными объектами занимаются сисадмины -- они следят за сохранностью информационных объектов и санкционированием доступа к ним, ибо это характеристики физических объектов. Документы, хранилища данных -- это как раз информационные объекты.

В речи хорошо бы не путать все эти абсолютно разные сущности. Например, david_gor ратует за то, чтобы люди поняли неуничтожимость данных, попавших в Сеть -- и действительно, абстрактный объект нельзя уничтожить физически, он живёт до тех пор, пока существуют экземпляры его носителей. Информация не подлежит осмысленной компьютерной обработке, пока она не стала данными -- т.е. пока у нее не появилась адекватная заявленным целям формальная структура (так, если это видео -- ни один плеер его не покажет, пока не договоритесь о формате).

Пример: начальник сказал "у нас есть база данных, учтите это в вашей работе" -- что имелось ввиду?
а) есть информация -- можно позвонить по телефону, и оператор ответит на вопросы, обращаясь к каким-то своим записям то ли в компьютере, то ли в записной книжке
б) есть данные: известна схема базы данных, и можно подумать о том, как запрашивать информацию из этой базы данных и маршрутизировать ответы в правильной кодировке нужным людям, используя нужные для них каналы передачи (кому твиттер, а кому письмом)
в) есть носитель с базой данных (купленный на рынке DVD), при этом неведомо, в каком эта база данных формате, и как из нее вытащить хоть что-нибудь.
г) и так далее -- число вариантов огромно, и чтобы их подробно обсуждать, как раз и нужно договориться о картине мира (онтологии) обработки данных, хотя бы между профессионалами -- архитекторами корпоративных информационных систем.
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 16 comments