
Діаграма порівняння
Основа для порівняння | Класифікація | Регресія |
---|---|---|
Основний | Відкриття моделі або функцій, де відображення об'єктів здійснюється в попередньо визначені класи. | Розроблена модель, в якій відображення об'єктів здійснюється у значення. |
Включає прогноз | Дискретні значення | Безперервні значення |
Алгоритми | Дерево рішень, логістична регресія і т.д. | Дерево регресії (випадковий ліс), лінійна регресія тощо. |
Характер прогнозованих даних | Невпорядковано | Замовлено |
Метод розрахунку | Точність вимірювання | Вимірювання середньоквадратичної похибки |
Визначення класифікації
Класифікація - це процес пошуку або виявлення моделі (функції), яка допомагає розділити дані на декілька категоріальних класів. У класифікації ідентифікується членство групи в проблемі, що означає, що дані класифікуються під різними мітками відповідно до деяких параметрів, а потім передбачаються мітки для даних.
Похідні моделі можуть бути продемонстровані у вигляді правил «IF-THEN», дерев рішень або нейронних мереж тощо. Дерево рішень є принциповою схемою, яка нагадує деревоподібну структуру, де кожен внутрішній вузол зображує тест на атрибут, і його гілки показує результат тесту. Процес класифікації стосується проблем, в яких дані можуть бути розділені на дві або більше дискретних мітки, іншими словами, дві або більше непересічних множин.
Приведемо приклад, припустимо, ми хочемо передбачити можливість дощу в деяких регіонах на основі деяких параметрів. Тоді було б два етикетки дощ і без дощу, під яким різні регіони можуть бути класифіковані.
Визначення регресії
Регресія - це процес пошуку моделі або функції для розрізнення даних на безперервні реальні значення замість використання класів. Математично, з проблемою регресії, намагається знайти апроксимацію функції з мінімальним відхиленням помилки. У регресії передбачається розрізняти числову залежність даних.
Регресійний аналіз є статистичною моделлю, яка використовується для прогнозування числових даних замість міток. Він також може ідентифікувати рух розподілу в залежності від наявних даних або історичних даних.
Візьмемо аналогічний приклад і в регресії, де ми знаходимо можливість дощу в окремих регіонах за допомогою деяких параметрів. У цьому випадку існує ймовірність, пов'язана з дощем. Тут ми не класифікуємо регіони в дощових, а не дощових етикетках, замість цього класифікуємо їх зі своєю пов'язаною ймовірністю.
Основні відмінності між класифікацією та регресією
- Процес класифікації моделює функцію, за допомогою якої дані прогнозуються в дискретних мітках класів. З іншого боку, регресія - це процес створення моделі, яка передбачає безперервну кількість.
- Алгоритми класифікації включають дерево рішень, логістичну регресію тощо. На противагу цьому, регресійне дерево (наприклад, випадкове ліс) і лінійна регресія є прикладами регресійних алгоритмів.
- Класифікація прогнозує невпорядковані дані, а регресія прогнозує впорядковані дані.
- Регресію можна оцінити, використовуючи середньоквадратичну помилку. Навпаки, класифікація оцінюється по точності вимірювання.
Висновок
Методика класифікації передбачає модель прогнозування або функцію, яка передбачає нові дані в дискретних категоріях або мітках за допомогою історичних даних. І навпаки, метод регресії моделює безперервні функції, що означає, що він прогнозує дані в безперервних числових даних.