Автоматизированные системы обработки маркетинговой информации. Подготовка данных к анализу

Автоматизированные системы обработки маркетинговой информации. Подготовка данных к анализу

29-12-20210721

1 из 16

Значения, которые сильно отличаются от окружающих данных или несовместимы с ними:

Значения, которые сильно отличаются от окружающих данных или несовместимы с ними:

аномалии

отклонения

противоречия

искажения

Противоречиями называют две или более записи таблицы, если они содержат одинаковые наборы значений …

всех признаков

входных признаков и различные наборы значений выходных

выходных признаков и различные наборы значений входных

Возможны ситуации, при которых поиск дубликатов и противоречий проводить не целесообразно:

да

нет

Интерполяция данных — это один из методов …

корректировки аномалий

исключения дубликатов

исключения противоречий

восстановления пропущенных значений

Аномалии, которые отражают факты и события, имевшие место в действительности, но вызванные исключительными обстоятельствами, которые имеют место очень редко или в единичных случаях называют …

естественными

искусственными

фактическими

теоретическими

Подстановка констант — это один из методов …

корректировки аномалий

исключения дубликатов

исключения противоречий

восстановления пропущенных значений

Средствам (инструментам) предобработки данных:

Очистка от шумов и сглаживание рядов данных

Регрессионный анализ

Восстановление пропущенных значений

Нейронные сети

Редактирование аномальных значений

Карты Кохонена

Обработка дубликатов и противоречий

Фильтрация

Факторный анализ

Основные критерии оптимальности данных с точки зрения консолидации данных:

обеспечение высокой скорости доступа к ним

компактность хранения

автоматическая поддержка целостности структуры данных

контроль непротиворечивости данных

адекватность данных поставленной задаче

структурированность данных

Комплекс методов и процедур, направленных на устранение причин, мешающих корректной обработке: аномалий, пропусков, дубликатов, противоречий, шумов и т.п.:

очистка

трансформация

визуализация

обогащение

Комплекс методов и алгоритмов, применяемых в аналитическом приложении с целью подготовки данных к решению конкретной аналитической задачи и приведения их в соответствие с требованиями, определяемыми спецификой задачи и способами ее решения:

очистка

предобработка

трансформация

консолидация

Основные задачи, которые решаются в процессе консолидации данных:

выбор источников данных

разработка стратегии консолидации

оценка качества данных

обогащение

очистка

анализ

прогнозирование

синтез

Удаление записи с аномальным значением целесообразно проводить …

всегда

если число записей в выборке данных существенно превышает минимум, требуемый для анализа

если количество аномальных значений невелико

никогда

Процесс дополнения данных некоторой информацией, которая позволит повысить эффективность решения аналитических задач:

очистка

трансформация

визуализация

обогащение

Дубликатами называют две или более записи таблицы, если они содержат одинаковые наборы значений …

всех признаков

входных признаков и различные наборы значений выходных

выходных признаков и различные наборы значений входных.

Процедура фильтрации может потребоваться в следующих случаях:

значения, содержащиеся в записи, могут негативно повлиять на результаты анализа

значения записи нежелательны для использования в данной аналитической задаче

запись связана с каким-либо объектом или событием, которое не желательно рассматривать при анализе

запись содержит незначащую информацию и т.д.

все вышеперечисленное

Комплекс методов и процедур, направленных на извлечение данных из различных источников, обеспечение необходимого уровня их информативности и качества, преобразование к единому формату, в котором они могут быть загружены в хранилище данных или аналитическую систему:

консолидация

агрегирование

обобщение

фильтрация