В некоторых случаях расчетная кривая


В некоторых случаях расчетная кривая может очень хорошо аппроксимировать некоторую часть данных и в то же время значительно отклоняться от некоторых из них. Попытки использовать более «гибкие» кривые, задаваемые, например, полиномами большой степени, могут привести к переаппроксимации. В такой ситуации аппроксимирующая функция неверно характеризует тенденции исследуемого процесса, так как не учитывается тот факт, что случайные выбросы в данных не содержат никакой полезной информации, а лишь вносят информационные помехи в результаты анализа. Классические методы обеспечивают возможность эффективной фильтрации случайных выбросов входных данных только при небольшой размерности входного массива. Если же, например, используются данные такой размерности, как массив балансовых показателей предприятия, эффективная фильтрация стандартными методами неосуществима.

На практике возможности фильтрации ограничены лишь одномерными рядами (или, в лучшем случае, двумерными матрицами) отдельных входных параметров. Например, можно отфильтровать в потоке информации показатели, свидетельствующие об отрицательном значении активов предприятия, или показатели высокой чистой прибыли при отрицательной ликвидности.

При использовании метода «интеллектуальной» аппроксимации вид функциональной зависимости не считается заданным a priori. Он автоматически определяется входными данными и некоторыми заранее заданными ограничениями.

Чтобы описать сущность «интеллектуальной» аппроксимации, необходимо от аппроксимации данных наблюдений с помощью некоторой непрерывной кривой перейти к аппроксимации с помощью линии, образованной дискретным множеством соединенных друг с другом точек, именуемых узлами. Такой подход не меняет основной сути представленных выше рассуждений и алгоритмов. Все аппроксимирующие узлы по-прежнему лежат на аппроксимирующей линии в той последовательности, в какой эта линия проходит через пространство входных данных. Необходимо иметь в виду лишь то, что отрезки, используемые для вычисления суммы квадратов расстояний от аппроксимирующей линии до точек входных данных, будут не вертикальными, как в случае среднеквадратической регрессии, и не перпендикулярными аппроксимирующей линии, как в случае среднеквадратической ортогональной регрессии, а просто будут соединять точки входных данных с ближайшими узлами. Кроме этого сама аппроксимирующая линия будет выглядеть как набор направленных прямых отрезков, соединяющих соседние узлы.

Рассматриваемые узлы, как и входные данные, представляются множествами вещественных чисел. Они также могут быть описаны координатами в пространстве входных параметров. Любая точка с известными координатами может быть представлена как вектор, проведенный из начала координат (точки, где все входные параметры принимают нулевое значение) к данной точке с известными координатами в пространстве входных параметров. Упорядоченные (вдоль условной аппроксимирующей линии) множества узлов принято именовать модельными векторами.

Рассмотрим снова двумерное пространство наблюдений (т.е. отражающее только две величины: x и y ).

Содержание раздела