Давайте перевіримо різницю між даними та сховищами даних за допомогою діаграми порівняння, показаної нижче.
Діаграма порівняння
Основа для порівняння | Видобуток даних | Зберігання даних |
---|---|---|
Основний | Інтелектуальний аналіз даних - це процес отримання або вилучення значущих даних з бази даних / сховища даних. | Сховище даних - сховище, де інформація з декількох джерел зберігається в одній схемі. |
Визначення інтелектуального аналізу даних
Інтелектуальний аналіз даних - це процес для виявлення знань, які ви ніколи не очікували існувати у вашій базі даних . Використовуючи традиційний інструмент запитів, ви можете отримати тільки відомі відомості з даних. Але, Data mining надає вам спосіб вилучення прихованої інформації з даних . Інтелектуальний аналіз даних витягує значущу інформацію з бази даних, яка може бути використана для прийняття рішень .
Виявлення знань у базах даних, що називаються KDD, демонструє відносини та закономірності . Зв'язок може бути між двома або більше різними об'єктами, між атрибутами одного об'єкта. План є іншим результатом інтелектуального аналізу даних, який показує регулярну та зрозумілу послідовність інформації, яка допомагає у прийнятті рішень.
Кроки, пов'язані з KDD, тобто виявлення знань у базах даних, можна узагальнити як перший вибір набору даних, на якому має виконуватися інтелектуальний аналіз даних. Далі йде попередня обробка, яка включає видалення суперечливих даних. Потім відбувається перетворення даних, де дані перетворюються у форму, відповідну для інтелектуального аналізу даних. Далі відбувається інтелектуальний аналіз даних, тут до даних застосовуються алгоритми інтелектуального аналізу даних. І, нарешті, інтерпретація та оцінка, які передбачають вилучення відношення або структури між даними.
Інтелектуальний аналіз даних добре вписується в середовище сховища даних, яке зберігає дані в агрегованому і узагальненому вигляді. Як стає легко шахти дані в сховищі даних
Визначення сховищ даних
Сховище даних - це центральне місце, де інформація, зібрана з декількох джерел, зберігається в єдиній уніфікованій схемі . Дані спочатку збираються, різні джерела підприємства потім очищаються і трансформуються і зберігаються в сховищі даних. Після того, як дані вводяться в сховище даних, воно залишається там протягом тривалого часу і може отримати доступ до періодів часу.
Сховище даних - це ідеальне поєднання технологій, таких як моделювання даних, збір даних, управління даними, управління метаданими, управління запасами інструментів розробки . Всі ці технології підтримують такі функції, як вилучення даних, перетворення даних, зберігання даних, надання користувальницьких інтерфейсів для доступу до даних .
Сховище даних не є продуктом або програмним забезпеченням, це інформаційне середовище, яке надає інформацію, як інтегрований погляд на підприємство. Ви можете отримати доступ до поточних та історичних даних підприємства, які допомагають у прийнятті рішень. Він підтримує операції, ухвалені для прийняття рішень, не впливаючи на операційні системи. Це гнучкий ресурс для отримання стратегічної інформації.
Ключові відмінності між видобуванням даних та зберіганням даних
- Існує принципова відмінність, що відокремлює видобування даних і сховища даних, тобто інтелектуальний аналіз даних - це процес вилучення значущих даних з великої бази даних або сховища даних. Однак сховище даних забезпечує середовище, в якому дані зберігаються в інтегрованій формі, що полегшує інтелектуальний аналіз даних для більш ефективного вилучення даних.
Висновок:
Data Mining може бути зроблено тільки тоді, коли є добре інтегрована велика база даних, тобто сховище даних. Таким чином, сховище даних повинно бути завершено до видобування даних. Сховище даних повинно мати інформацію в добре інтегрованій формі, щоб видобування даних могло ефективно видобувати знання.