29-12-2021
аномалии
отклонения
противоречия
искажения
всех признаков
входных признаков и различные наборы значений выходных
выходных признаков и различные наборы значений входных
да
нет
корректировки аномалий
исключения дубликатов
исключения противоречий
восстановления пропущенных значений
естественными
искусственными
фактическими
теоретическими
корректировки аномалий
исключения дубликатов
исключения противоречий
восстановления пропущенных значений
Очистка от шумов и сглаживание рядов данных
Регрессионный анализ
Восстановление пропущенных значений
Нейронные сети
Редактирование аномальных значений
Карты Кохонена
Обработка дубликатов и противоречий
Фильтрация
Факторный анализ
обеспечение высокой скорости доступа к ним
компактность хранения
автоматическая поддержка целостности структуры данных
контроль непротиворечивости данных
адекватность данных поставленной задаче
структурированность данных
очистка
трансформация
визуализация
обогащение
очистка
предобработка
трансформация
консолидация
выбор источников данных
разработка стратегии консолидации
оценка качества данных
обогащение
очистка
анализ
прогнозирование
синтез
всегда
если число записей в выборке данных существенно превышает минимум, требуемый для анализа
если количество аномальных значений невелико
никогда
очистка
трансформация
визуализация
обогащение
всех признаков
входных признаков и различные наборы значений выходных
выходных признаков и различные наборы значений входных.
значения, содержащиеся в записи, могут негативно повлиять на результаты анализа
значения записи нежелательны для использования в данной аналитической задаче
запись связана с каким-либо объектом или событием, которое не желательно рассматривать при анализе
запись содержит незначащую информацию и т.д.
все вышеперечисленное
консолидация
агрегирование
обобщение
фильтрация