Хранилища данных отличаются от баз данных или систем оперативной обработки транзакций (OLTP-систем) своим назначением и устройством:
хранилище содержит данные, позволяющие проводить анализ деловых операций;
хранилища обычно представляют собой системы, доступные только для чтения;
в хранилищах же накапливаются данные, не меняющиеся со временем и избавленные от ошибок.
Из-за большого объема данных в хранилищах одной из основных проблем создания хранилищ является обеспечение высокой производительности обработки запросов. Запросы в хранилище отличаются высоким уровнем сложности.
Создание хранилищ данных – трудоемкий и длительный процесс. Наряду с хранилищами данных существуют и часто используются компаниями витрины данных (Data Mart), называемые также киосками данных. Такие системы создаются для отдельных подразделений компаний или для обеспечения отдельных видов деятельности. Объемы данных и требования к вычислительным ресурсам в витринах данных существенно меньше по сравнению с хранилищами. Витрины данных могут строиться как независимо, так и на основе хранилищ данных компании. Хранилища данных имеют двухуровневую или трехуровневую архитектуру. В двухуровневых хранилищах на верхнем уровне поддерживается объединенная информация. На нижнем уровне - различные источники баз данных. В трехуровневой архитектуре предусматривается поддержка витрин данных для отдельных подразделений компании над ее единым хранилищем.
ТРАНЗАКЦИЯ
Под транзакцией
понимается неделимая с точки зрения воздействия на БД последовательность операторов манипулирования данными (чтения, удаления, вставки, модификации) такая, что либо результаты всех операторов, входящих в транзакцию, отображаются в БД, либо воздействие всех этих операторов полностью отсутствует. Лозунг транзакции – «Все или ничего». Поддержание механизма транзакций - показатель уровня развитости СУБД. Корректный механизм поддержания транзакций одновременно является основой обеспечения целостности баз данных.
Удаленный доступ –
доступ к базе данных через модемную связь.
Распределенная обработка.
В современном бизнесе очень часто возникает необходимость предоставить доступ к одним и тем же данным группам пользователей, территориально удаленным друг от друга. В качестве примера можно привести банк, имеющий несколько отделений. Эти отделения могут находиться в разных городах, странах или даже на разных континентах, тем не менее необходимо организовать обработку финансовых транзакций (перемещение денег по счетам) между отделениями. Результаты финансовых операций должны быть видны одновременно во всех отделениях.
Существуют два подхода к организации обработки распределенных данных.
технология распределенной базы данных
. Такая база включает фрагменты данных, расположенные на различных узлах сети. С точки зрения пользователей она выглядит так, как будто все данные хранятся в одном месте. Естественно, такая схема предъявляет жесткие требования к производительности и надежности каналов связи.
технология тиражирования.
В этом случае в каждом узле сети дублируются данные всех компьютеров. При этом передаются только операции изменения данных, а не сами данные. Передача может быть асинхронной (неодновременной для разных узлов), данные располагаются там, где обрабатываются.
Использование технологии тиражирования позволяет снизить требования к пропускной способности каналов связи. При выходе из строя линии связи какого-либо компьютера, пользователи других узлов могут продолжать работу. Однако при этом допускается неодинаковое состояние базы данных для различных пользователей в один и тот же момент времени. Следовательно, невозможно исключить конфликты между двумя копиями одной и той же записи.
Перейти на страницу:
2 3 4 5 6 7 8