Ценность ваших данных
Шрифт:
Согласно «Оксфордскому словарю современного английского языка» [40] :
Data: 1) Известные факты, используемые для вывода или расчета. 2) Числовые и нечисловые значения характеристик кого-либо (чего-либо), с которыми выполняет операции компьютер или какое-нибудь другое подобное устройство.
Information: 1) a) Что-то, что было сообщено; знания. б) Элементы знаний; новости. 2) Обвинение или жалоба, поданная в суд и т. п.
Согласно «Новому словарю русского языка» [41] :
40
Oxford Dictionary of Current English / Edited by Della Thompson: 2nd Edition, Oxford University Press, 1993.
41
Ефремова Т. Ф. Новый словарь русского языка. Толково-словообразовательный. В 2 т. – М.: Русский язык, 2000.
Данные: 1)
Информация: 1) Сообщение о положении дел где-либо, о состоянии чего-либо. 2) а) Сведения об окружающем мире и протекающих в нем процессах, воспринимаемые человеком или специальными устройствами. б) Обмен такими сведениями между людьми и специальными устройствами. в) Обмен сигналами в животном и растительном мире. 3) То же, что: информирование.
Все это позволяет понять разницу между понятиями «данные» и «информация» и очертить преимущественные сферы их применения.
Следует заметить, что здесь в отношении термина «информация» мы ограничиваемся его общепринятыми нестрогими определениями и не обсуждаем научные определения, используемые в теории связи, теории информации и кибернетике и связанные с понятием количества информации. Отметим только, что известны два основных сугубо научных подхода к определению этого термина [42] .
42
Шамис А. Л. Модели поведения, восприятия и мышления: курс лекций. – М.: Интуит НОУ, 2016. – URL: https://intuit.ru/studies/courses/2191/423/info.
Согласно первому, информация – это внешнее описание объекта, содержащееся в передаваемом сообщении. Количество информации определяется как мера неопределенности, снимаемой полученным сообщением. Такое представление в 1948 году ввел Клод Шеннон [43] в своей статье «Математическая теория связи», попутно предложив для обозначения наименьшей единицы информации использовать слово «бит».
Согласно второму подходу, информация не связывается с передаваемым сообщением. Она относится к объекту и есть мера его разнообразия. Автор этого представления – Уильям Эшби [44] .
43
Клод Шеннон (Claude Elwood Shannon) – выдающийся американский математик, основатель математической теории информации.
44
Уильям Эшби (William Ross Ashby) – английский психиатр, крупный теоретик кибернетики.
Указанные научные определения в дальнейшем в этой книге не используются, поскольку ценность информации слабо связана с ее количеством. Важность информации субъективна и зависит от цели ее потребителя. Все способы количественного определения ценности основаны на представлении о цели, достижению которой способствует полученная информация. Чем больше информация помогает достижению цели, тем более ценной она считается [45] . Массив информации объемом в сотни гигабайт может иметь колоссальную важность для одной организации и нулевую для другой.
45
Чернавский Д. С. Синергетика и информация (динамическая теория информации). 2-е изд., испр. и доп. – М.: Едиториал УРСС, 2004.
Основываясь на приведенных сведениях, можно продолжить обсуждение вопросов, относящихся к ценности данных.
Как уже говорилось выше, применительно к сфере управления данными термины «данные» и «информация» часто используются как синонимы. Кроме того, как видно из приведенных выше определений, термин «информация» иногда заменяется термином «знания».
Всегда ли допустимо такое обобщение и не приводит ли оно к недоразумениям? В частности, к существенному недопониманию между участниками многочисленных проектов по внедрению различного рода информационных систем, а также между участниками их дальнейшей эксплуатации и пользователями. В том числе и по вопросам определения ценности данных.
Для ответа необходимо более подробно обсудить взаимосвязь понятий «данные» и «информация», а также соотнести их с понятиями «знания» (knowledge) и «мудрость» (wisdom).
2.2. Информационная иерархия
При обсуждении взаимосвязи понятий «данные», «информация», «знания» и «мудрость» обычно используется классическое представление – иерархия Data-Information-Knowledge-Wisdom (DIKW). Часто в литературе применяются названия «иерархия знаний», «пирамида знаний» или же «информационная иерархия», «информационная пирамида».
В большинстве исследований, посвященных происхождению иерархии DIKW (например, [46] [47] [48] ) в качестве одного из наиболее ранних источников, в которых встречается ее описание, обычно упоминается статья Харлана Кливленда [49]
«Информация как ресурс». Она была опубликована в 1982 году в американском журнале The Futurist [50] .46
Sharma N. The origin of the data information knowledge wisdom hierarchy, 2005. – URL: https://web.archive.org/web/20051221151426/http://www-personal.si.umich.edu/~nsharma/dikw_origin.htm.
47
Rowley J. The wisdom hierarchy: representations of the DIKW hierarchy. Journal of Information Science, 2007, 33(2), 163–180. DOI: 10.1177/0165551506070706. – URL: http://www-public.imtbs-tsp.eu/~gibson/Teaching/Teaching-ReadingMaterial/Rowley06.pdf.
48
Williams D. Models, Metaphors and Symbols for Information and Knowledge Systems // Journal of Entrepreneurship Management and Innovation (JEMI), 2014, Vol. 10, Iss. 1: 79–107. DOI: 10.7341/20141013. – URL: https://www.semanticscholar.org/paper/Models%2C-Metaphors-and-Symbols-for-Information-and-Williams/fde0d2b7da419d66f1cdbc7cce8ff37116254cf3.
49
Харлан Кливленд (Harlan Cleveland) – американский дипломат, педагог и писатель.
50
Cleveland H. Information as Resource. The Futurist, 1982. Vol. 16. No. 6, Pp. 34–39.
По мнению Кливленда, данные образуются в результате исследований, а также путем создания или сбора или же совершения открытий, в то время как информация имеет контекст. Данные превращаются в информацию с помощью организации их таким образом, чтобы мы могли легко делать какие-либо заключения. Кроме того, они преобразуются в информацию с помощью представления (презентации), например в визуальной или аудиальной (звуковой) форме.
Хотя известно несколько более ранних публикаций других авторов, затрагивающих эту тему [51] , статья Кливленда цитируется особенно часто и примечательна фрагментом из поэмы Томаса Элиота [52] «Камень» (The Rock), написанной в 1934 году, в которой отражена иерархическая взаимосвязь понятий «информация», «знания» и «мудрость».
51
Williams D. Models, Metaphors and Symbols for Information and Knowledge Systems // Journal of Entrepreneurship Management and Innovation (JEMI), 2014, Vol. 10, Iss. 1: 79–107. DOI: 10.7341/20141013. – URL: https://www.semanticscholar.org/paper/Models%2C-Metaphors-and-Symbols-for-Information-and-Williams/fde0d2b7da419d66f1cdbc7cce8ff37116254cf3.
52
Томас Элиот (Thomas Stearns Eliot) – выдающийся английский поэт, лауреат Нобелевской премии по литературе 1948 года.
Кливленд назвал определенную в поэме цепочку понятий «иерархией Элиота». После выхода его статьи в специальной литературе прочно закрепилось мнение о том, что именно Элиоту принадлежит авторство идеи иерархии DIKW (или, по крайней мере, IKW) [53] .
53
В литературе часто упоминается еще один представитель мира искусств, который описал иерархию IKW до того, как она стала активно обсуждаться специалистами по обработке информации и управлению знаниями, – легендарный американский рок-музыкант Фрэнк Заппа (Frank Zappa). Связанные с этой темой рассуждения приводятся в его песне Packard Goose из альбома Joe’s Garage: Act II & III (1979).
Среди академических работ, в которых рассматривается иерархия DIKW, наиболее ранней стала статья Милана Желены [54] «Системы поддержки управления: На пути к интегрированному управлению знаниями» [55] . В ней описана схема последовательного продвижения от данных к знаниям. Ученый предложил упрощенные определения уровней иерархии, основанные на знании ответов на простые вопросы.
Данные – «не знаю – ничего» (know-nothing).
54
Милан Желены (Milan Zeleny) – американский экономист чешского происхождения, профессор в области систем управления Фордхемского университета (Fordham University).
55
Zeleny M. Management support systems: Towards integrated knowledge management. Human Systems Management, 1987, 7(1), 59–70.