Уменьшение размерности
Выбор переменных:
• Удаление переменных, не связанных с целевыми признаками, на основе критериев отбора хи-квадрат или R2.
• Удаление переменных из иерархий.
• Удаление переменных со многими недостающими значениями.
• Сокращение числа классовых переменных с большим количеством уровней.
• Группировка непрерывных исходных данных для выявления нелинейных взаимосвязей.
• Выявление взаимодействий.
Главные компоненты:
• Вычисление собственных значений и собственных векторов на основании матриц корреляции и ковариации.
• Графики: масштабированное отклонение, логарифмические собственные значения, кумулятивные пропорциональные собственные значения.
• Исследование выбранных основных компонентов при помощи методов предиктивного моделирования.
Исследование временных рядов:
• Сокращение объемов транзакционных данных на основе формирования временных рядов с использованием разнообразных методов аккумуляции и преобразования.
• Методы анализа включают сезонный анализ, анализ тенденций, анализ временных областей, сезонную декомпозицию.
• Исследование сокращенных временных рядов при помощи методов кластерного и предиктивного моделирования.