Книга: Корпоративное управление и стратегический менеджмент: информационный аспект
Хранилища данных
Хранилища данных
Напомним определение Билла Инмона (Bill Inmon): хранилища данных – это «предметно-ориентированные, интегрированные, стабильные, поддерживающие хронологию наборы данных, используемые для поддержки принятия управленческих решений» [Inmon, 1992, p. 29].
Данные в хранилище попадают из оперативных (трансакционных) систем, а также из внешних источников. По аналогии с «материальными» хранилищами хранилища данных предусматривают такие операции, как сбор данных (приход материалов на склад), хранение данных (складской запас), перемещение в витрины данных (отгрузка товаров в розничную сеть).
С экономической точки зрения хранилище данных приносит долгосрочный эффект тогда, когда оно становится надежным механизмом доставки данных, существенных для анализа и принятия решений. При этом не следует забывать и о затратной части: ведь информация может считаться действительно полезной лишь тогда, когда экономические выгоды от ее использования превышают затраты, связанные с ее приобретением. Построение хранилища данных – достаточно сложный проект и обеспечить его окупаемость в краткосрочной перспективе бывает непросто [Духонина, Исаев, 2005].
Высокая стоимость проектов создания хранилищ данных объясняется прежде всего необходимостью сбора, преобразования и обобщения данных из различных источников. При всей своей необходимости эта работа достаточно трудоемка и занимает много времени. Неоправданных затрат можно избежать на этапе проектирования хранилища за счет определения состава и структуры загружаемых в хранилище данных. При этом следует помнить, что хранилище данных не должно играть роль электронного архива, в котором хранится «все, что только можно». К числу распространенных ошибок относится недостаточное внимание к качеству хранимых данных, а также превалирование технологических соображений над экономическими.
Самое сложное в проектировании хранилища – добиться сбалансированной структуры, т. е. определить, какие данные будут полезны для аналитика и менеджера, а какие нет. Большое значение имеют способ размещения данных в хранилище, а также процессы идентификации, анализа и преобразования данных перед их загрузкой в хранилище.
В качестве основы хранилища данных, как правило, используется реляционная модель хранения данных, что существенно облегчает дальнейшее развитие такого хранилища. Впрочем, имеет место и другой путь – применение оптимизированных структур, например многомерных (по этому пути пошли разработчики компании SAP в своем продукте SAP BW). Однако, по мнению ряда исследователей (например, Б. Инмона [Inmon, 1999]), такой подход имеет целый ряд недостатков, не являясь достаточно гибким и универсальным. В самом деле, если данные из хранилища поступают лишь в ограниченное количество витрин данных и аналитических приложений, то от хранилища вовсе не требуется поддерживать специализированные запросы. В этом отношении использование реляционных баз данных экономичнее (без потери функциональности), а следовательно, предпочтительнее.
После того как хранилище построено, встает вопрос об использовании данных конечными пользователями. При этом могут применяться различные средства (от специализированных средств создания пользовательских запросов и отчетов до электронных таблиц) в зависимости от решаемых задач, предпочтений и опыта пользователей. И все же есть целый спектр задач, которые предъявляют к информационным системам особые требования: это задачи, требующие оперативной (т. е. в режиме реального времени) обработки достаточно больших объемов данных в разных аналитических разрезах. Экономический анализ, как правило, бывает многомерным: информация может быть сгруппирована и консолидирована по разным признакам, причем разные группы пользователей информации заинтересованы в разных способах группировки.
Таким образом, превращение разрозненных данных в структурированную информацию, описанную в экономических терминах и обеспечивающую поддержку принятия управленческих решений, можно считать одной из самых актуальных задач. При этом обработка данных и принятие решений должны быть настолько оперативными, насколько этого требуют интересы бизнеса. Именно для этого предназначены специальные системы аналитической обработки данных в режиме реального времени – OLAP-системы.
- Наик Дайлип Системы хранения данных в Windows
- Глава 7 Управление хранилищем данных
- 7.3 Виртуализация хранилищ данных
- 7.4 Технология виртуализации хранилища от компании Microsoft
- 7.9 Будущее управления хранилищами по версии ассоциации SNIA: стандарты SMI
- Глава 2. Серверные хранилища данных
- Глава 3. Сетевые хранилища данных
- Резервное копирование базы данных InterBase
- Firebird РУКОВОДСТВО РАЗРАБОТЧИКА БАЗ ДАННЫХ
- Резервное копирование многофайловых баз данных
- Восстановление из резервных копий многофайловых баз данных
- Владелец базы данных