Рекомендуємо, 2024

Вибір Редакції

Різниця між таблицею фактів і таблицею розмірів

Таблиця фактів і таблиця розмірів є основними факторами для створення схеми . Запис таблиці фактів - це комбінація атрибутів з різних таблиць розмірів. Таблиця фактів допомагає користувачеві аналізувати бізнес-розміри, що допомагає йому приймати рішення щодо вдосконалення свого бізнесу. З іншого боку, таблиці розмірів допомагають таблиці факторів збирати розміри, уздовж яких необхідно вжити заходів.

Точка, яка відрізняє таблицю Факти і таблицю виміру, полягає в тому, що таблиця розмірів містить атрибути, уздовж яких беруться заходи в таблиці фактів . Є деякі інші фактори, які створюють відмінності між таблицею фактів і таблицею розмірів для їх перегляду, давайте поглянемо на таблицю порівняння, показану нижче.

Діаграма порівняння

Основа для порівнянняТаблиця фактівТаблиця розмірів
ОсновнийТаблиця фактів містить вимірювання вздовж атрибутів таблиці розмірів.Таблиця розмірів містить атрибути, по яких таблиця фактів обчислює метрику.
Атрибут і записиФактична таблиця містить менше атрибутів і більше записів.Таблиця розмірів містить більше атрибутів і менше записів.
Розмір таблиціТаблиця фактів зростає вертикально.Таблиця розмірів зростає горизонтально.
КлючФактична таблиця містить первинний ключ, який є конкатенацією первинних ключів всієї таблиці розмірів.Кожна таблиця розмірів містить її первинний ключ.
СтворенняТаблиця фактів може бути створена тільки тоді, коли таблиці розмірів завершені.Спочатку потрібно створити таблиці розмірів.
СхемаСхема містить меншу кількість таблиць фактів.Схема містить більше число таблиць розмірів.
АтрибутиТаблиця фактів може мати дані як у цифровому, так і в текстовому форматі.Таблиця розмірів завжди містить атрибути в текстовому форматі.

Таблиця визначення факторів

Таблиця фактів - це таблиця, яка містить вимірювання уздовж атрибутів таблиць розмірів. Він може містити інформацію на мінімально можливому рівні. Деякі таблиці фактичних даних містять узагальнені дані, які називаються таблицею зведених фактів . Таблиця фактів майже містить дані з датами . Розглянемо характеристики таблиці фактів.

Сцепленний ключ
Фактична таблиця містить зв'язаний ключ, який є конкатенацією первинних ключів всіх таблиць виміру. Спливаюча клавіша таблиці фактів повинна однозначно ідентифікувати рядок у таблиці фактів.

Зерно даних
Дані зерна показують, наскільки глибоко зберігаються фактично таблиці вимірювань. Дані зерна повинні бути на можливому найвищому рівні.

Адитивні заходи
Атрибути таблиці фактів можуть бути повністю адитивними або напів-добавками . Повністю аддитивні заходи - це ті, які можна легко підсумувати для всіх вимірів у таблиці фактів. Наприклад, number_ordered - це атрибут, який можна підсумувати для всіх вимірів. Як, ми можемо взяти загальну кількість, для конкретного клієнта, регіону, дати, бренду і т.д. Напівадитивні заходи - це ті, які можна підсумувати за деякими вимірами таблиці фактів, але не у всіх вимірах. Подібно, сума балансу не може бути підведена під час вимірювання, оскільки вона змінюється протягом часу.

Розріджені дані
Іноді ми можемо бачити записи в таблиці факти, що має атрибути з нульовими заходами . Наприклад, на святі не може бути жодного замовлення. Отже, атрибути для цієї дати матимуть нульові заходи. Ми не повинні зберігати заходи для такого роду записів, оскільки вони не надають ніякої інформації.

Вироджені розміри
Іноді ви можете зіткнутися з деякими вимірами в таблиці фактів, які взагалі не є адитивними. Наприклад, номер_порядку, customer_id, ви не можете додати ці типи розмірів. Однак у випадку, якщо вам потрібно знайти замовлення, зроблене конкретним клієнтом у цьому місяці; тоді вам знадобиться customer_id, щоб пов'язати ваш пошук. Ці типи, якщо атрибути або розміри таблиці фактів називаються виродженими вимірами.

Визначення таблиці розмірів

Таблиця розмірів є ключовим компонентом для початкової схеми. Таблиця розмірів містить атрибути, які представляють розміри, вздовж яких вимірювання береться у таблицю факти. Далі ми розглянемо деякі характеристики таблиці розмірів.

Атрибути та ключі
Кожна таблиця розмірів повинна мати первинний ключ, який однозначно ідентифікує кожен запис таблиці. Зазвичай спостерігається, що таблиця розмірів містить багато атрибутів. Отже, вона здається широкою, тобто, коли ви створюєте таблицю виміру, ви знайдете її поширюється горизонтально .

Значення атрибутів
Значення атрибутів у таблиці розмірів рідко є числовими, більшість разів ви знайдете значення в атрибутах у текстовому форматі . Наприклад, назва продукту, бренд, категорія, підкатегорія тощо

Відношення між атрибутами
Часто ви можете спостерігати, атрибути, з якими ви зустрічаєтеся в таблиці виміру, безпосередньо не пов'язані. Подібно, Product_brand нічого не має робити з package_date, але все одно обидва можуть бути атрибутами таблиці розмірів продукту.

Нормалізація
Таблиця розмірів не повинна бути нормалізована . Це відбувається тому, що нормалізація таблиці створить багато проміжних таблиць. Коли запит забирає атрибут з таблиці розмірів і відновлює вимірювання по тому, що для таблиці фактів, запит повинен пройти через ті проміжні таблиці, які стають неефективними. Таким чином, таблиці розмірів не нормалізуються.

Буріння вниз, згортання
Атрибути таблиці розмірів дозволяють отримати деталі шляхом переходу від більш високого рівня агрегованих атрибутів до атрибутів нижчого рівня. Наприклад, якщо ви хочете знайти загальний обсяг продажу в регіоні, то ви можете розібратися, щоб знайти продажі за державою, містом, zip. Ви навіть можете закатати, щоб знайти загальний обсяг продажів спочатку по zip, а потім по місту, а потім штату.

Кілька ієрархій
Часто таблиця розмірів пропонує кілька ієрархій. Наприклад, ми маємо таблицю розмірів продукту для відомчого магазину. Тепер у нас є два відділи маркетингу та бухгалтерії.

Відділ маркетингу розбереться серед атрибутів таблиці розмірів продукту в певній ієрархії, щоб отримати вимірювання для таблиці фактів.

З іншого боку, відділ бухгалтерського обліку розглядатиме серед атрибутів таблиці розмірів продукту в різних ієрархіях для отримання вимірювань для таблиці фактів.

Таким чином, таблиця розмірів повинна мати декілька ієрархій або рівень агрегації атрибутів, щоб дозволити користувачеві просуватися по будь-якій з декількох ієрархій.

Записи
Хоча таблиця розмірів має занадто багато атрибутів, вона має менше записів.

Основні відмінності між таблицею фактів і таблицею виміру

  1. Таблиця фактів містить вимірювання вздовж розмірності / атрибутів таблиці розмірів.
  2. Фактична таблиця містить більше записів і менше атрибутів порівняно з таблицею розмірів, тоді як таблиця розмірів містить більше атрибутів і менше записів.
  3. Таблиця розмірів таблиці зростає вертикально, тоді як розмір таблиці розмірів таблиці зростає горизонтально.
  4. Кожна таблиця розмірів містить первинний ключ для ідентифікації кожного запису в таблиці, тоді як таблиця фактів містить конкатенированний ключ, який є комбінацією всіх первинних ключів всієї таблиці розмірів.
  5. Таблиця розмірів повинна бути записана до створення таблиці фактів.
  6. Схема містить менше таблиць фактів, але більше таблиць виміру.
  7. Атрибути в таблиці фактів є як числовими, так і текстовими, але атрибути таблиці розмірів мають лише текстові атрибути.

Висновок:

Обидва з них однаково важливі для створення схеми, але таблиця розмірів повинна бути записана до таблиці фактів. Як неможливо створити таблицю фактів з нашими розмірами.

Top