Засоби та технології аналітики даних


Тема 8. Підготовчі етапи процесів Data Mining. Дублювання даних. Очищення даних. Етапи очищення даних. Основні принципи та аналітичні співвідношення методики

ChatGPT

Підготовчі Етапи Процесів Data Mining та Очищення Даних: Огляд і Принципи

Вступ

Data Mining - це процес вилучення цінної інформації з великих наборів даних шляхом застосування різних методів і алгоритмів. Процес Data Mining може бути вкрай успішним лише в разі належної підготовки та очищення даних. У цьому рефераті розглянемо основні підготовчі етапи процесів Data Mining, включаючи дублювання даних, очищення даних та основні принципи та аналітичні співвідношення методики очищення даних.

Підготовчі Етапи Процесів Data Mining

Процес Data Mining розпочинається зі збору великої кількості даних, які можуть бути отримані з різних джерел, таких як бази даних, журнали, соціальні мережі тощо. Однак перед тим, як перейти до фази аналізу, необхідно виконати кілька підготовчих етапів.

Дублювання Даних

Дублювання даних - це одна з поширених проблем, які можуть виникнути під час збору даних. Дублікати можуть змінювати результати аналізу та призводити до невірних висновків. Тому на цьому етапі важливо виявити та вилучити всі дублікати, щоб забезпечити правильність даних.

Очищення Даних

Етап очищення даних є критичним у процесі Data Mining. Під час збору даних можуть виникати помилки, пропуски, аномалії та інші неправильності, які впливають на якість даних. Очищення даних включає в себе такі кроки:

Основні Принципи та Аналітичні Співвідношення Методики Очищення Даних


Google Sites інших аналітиків даних:

1 - https://sites.google.com/view/data-analytics-tech-ies-myskiv/%D0%BB%D0%B5%D0%BA%D1%86%D1%96%D1%8F-1/%D0%BB%D0%B5%D0%BA%D1%86%D1%96%D1%8F-8

2 - https://sites.google.com/view/rozpakouka-analitycs/data-mining



Виконав аналітик даних Коновал Євген

Науковий керівник Огірко Ігор