29-12-2021
корректировки аномалий
исключения дубликатов
исключения противоречий
восстановления пропущенных значений
выбор источников данных
разработка стратегии консолидации
оценка качества данных
обогащение
очистка
анализ
прогнозирование
синтез
обеспечение высокой скорости доступа к ним
компактность хранения
автоматическая поддержка целостности структуры данных
контроль непротиворечивости данных
адекватность данных поставленной задаче
структурированность данных
консолидация
агрегирование
обобщение
фильтрация
всегда
если число записей в выборке данных существенно превышает минимум, требуемый для анализа
если количество аномальных значений невелико
никогда
естественными
искусственными
фактическими
теоретическими
корректировки аномалий
исключения дубликатов
исключения противоречий
восстановления пропущенных значений
значения, содержащиеся в записи, могут негативно повлиять на результаты анализа
значения записи нежелательны для использования в данной аналитической задаче
запись связана с каким-либо объектом или событием, которое не желательно рассматривать при анализе
запись содержит незначащую информацию и т.д.
все вышеперечисленное
очистка
трансформация
визуализация
обогащение
да
нет
всех признаков
входных признаков и различные наборы значений выходных
выходных признаков и различные наборы значений входных
всех признаков
входных признаков и различные наборы значений выходных
выходных признаков и различные наборы значений входных.
Очистка от шумов и сглаживание рядов данных
Регрессионный анализ
Восстановление пропущенных значений
Нейронные сети
Редактирование аномальных значений
Карты Кохонена
Обработка дубликатов и противоречий
Фильтрация
Факторный анализ
очистка
трансформация
визуализация
обогащение
очистка
предобработка
трансформация
консолидация
аномалии
отклонения
противоречия
искажения