Простими словами, вітрина даних є сховищем даних, обмеженим за обсягом, і чиї дані можуть бути отримані шляхом узагальнення і вибору даних зі сховища даних або за допомогою окремих процесів вилучення, перетворення і завантаження з вихідної системи даних.
Діаграма порівняння
Основа для порівняння | Інформаційне сховище | Data Mart |
---|---|---|
Основний | Склад даних є незалежним від додатків. | Вітрина даних специфічна для застосування системи підтримки прийняття рішень. |
Тип системи | Централізований | Децентралізована |
Форма даних | Детально | Узагальнено |
Використання денормалізації | Дані злегка денормалізовані. | Дані дуже денормалізовані. |
Модель даних | З верху до низу | Знизу вгору |
Природа | Гнучка, орієнтована на дані та довге життя. | Обмежувальне, проектно-орієнтоване та коротке життя. |
Тип використовуваної схеми | Фактична сузір'я | Зірка і сніжинка |
Простота будівництва | Важко побудувати | Простий у побудові |
Визначення сховища даних
Термін сховище даних означає часовий варіант, суб'єктно-орієнтований, енергонезалежний і інтегровану групу даних, які допомагають у процесі прийняття рішень управління. Альтернативно, це сховище інформації, зібраної з декількох джерел, що зберігаються в уніфікованій схемі, на єдиному сайті, що дозволяє інтегрувати різноманітні прикладні системи. Як тільки ці дані збираються, вони зберігаються протягом тривалого часу, отже, мають довге життя і дозволяють доступ до історичної інформації.
Отже, сховище даних надає користувачеві єдиний інтегрований інтерфейс до даних, через які користувач може легко писати запити на підтримку рішень. Сховище даних допомагає перетворювати дані в інформацію. Проектування сховища даних включає підхід зверху вниз.
Він збирає інформацію про суб'єкти, що охоплюють всю організацію, такі як клієнти, продажі, активи, предмети, і тому його діапазон є загальнонаціональним. Як правило, у ній використовується схема сузір'я фактів, яка охоплює широкий спектр предметів. Сховище даних не є статичною структурою і постійно розвивається .
Визначення даних Mart
Вітрину даних можна назвати підмножиною сховища даних або підгрупи загальнокорпоративних даних, що відповідають певному набору користувачів. Сховище даних включає в себе кілька відомчих і логічних вітрин даних, які повинні бути стійкими в їх ілюстрації, щоб забезпечити надійність сховища даних. Вітрина даних - це набір таблиць, які концентруються на одному завданні, розробленому з використанням підходу «знизу вгору».
Як схема зірки та сніжинки приводяться до одновимірного моделювання, тому вони зазвичай використовуються у вітрині даних. Хоча схема зірок більш популярна, ніж схема сніжинки. Залежно від джерела даних вітрини даних можна розділити на два типи: залежні і незалежні вітрини даних.
Ключові відмінності між сховищем даних і Data Mart
- Сховище даних є незалежним від додатків, тоді як вітрина даних є специфічним для застосування в системі підтримки прийняття рішень.
- Дані зберігаються в єдиному централізованому сховищі в сховищі даних. На відміну від цього, матриця даних зберігає дані децентралізовано в області користувача.
- Склад даних містить детальну форму даних. Навпаки, вікно даних містить узагальнені та вибрані дані.
- Дані у сховищі даних дещо денормалізовані, а у випадку Data mart - високо денормалізовані.
- Побудова сховища даних передбачає підхід « зверху вниз» . І навпаки, при побудові вітрини даних використовується підхід знизу вгору .
- Сховище даних є гнучким, інформаційно орієнтованим і давно існуючим. Навпаки, вітрина даних є обмежувальною, орієнтованою на проект і має менший термін існування.
- Фактична схема сузір'я зазвичай використовується для моделювання сховища даних, тоді як у масі даних зірка є більш популярною.
Висновок
Сховище даних забезпечує корпоративне уявлення, єдину та централізовану систему зберігання даних, притаманну архітектуру та незалежність додатків, а Data mart - це підмножина сховища даних, що забезпечує децентралізовану пам'ять. Оскільки сховище даних є дуже великим і інтегрованим, він має високий ризик невдач і труднощів при його побудові. З іншого боку, вітрина даних легко побудувати і пов'язаний з ними ризик збою також менше, але вітрина даних може відчувати фрагментацію.