Принципы функционирования АНС 19


Если для инициализации модельных векторов используются случайные числа, то приведенные выше рекомендации относительно выбора значений (t) и (t) непригодны. В этом случае начальный радиус (t) должен составлять половину размера сети, и скорость обучения в начале процесса должна быть близкой к единице.

Для получения хорошего визуального представления данных рекомендуется гексагональное расположение нейронов. Множество нейронов должно иметь продолговатую форму, поскольку очертания распределения данных на практике обычно продолговатые, а набор модельных векторов должен им соответствовать. Квадратные массивы нейронов не ориентируются по отношению к таким распределениям нужным образом.

Размерность плоскости выходных параметров АНС в общем случае определяется исследователем произвольно. Чаще всего она прямоугольная, а не квадратная.

При этом следует иметь в виду следующее:

 чем больше размерность плоскости выходных параметров, тем выше вероятность того, что каждый отдельный вектор входных данных будет отображаться в отдельном нейроне. Большие плоскости позволяют организовать новые данные в легко читаемые таблицы, но обобщающая способность таких изображений недостаточна;

 плоскости меньшей размерности обеспечивают большую степень сжатия данных. Однако слишком малое число нейронов приводит к уменьшению разрешения, поэтому соответствующие плоскости способны обеспечить лишь очень грубую дифференциацию, не позволяя увидеть разницу между предприятиями, действующими в определенных секторах экономики или в отдельных регионах.

Размерность плоскости выходных параметров определяет степень обобщения входных данных. Помимо большого объема вычислений обучение АНС с использованием большого количества нейронов может привести к отображению на плоскости множества лишних подробностей. С другой стороны, используя слишком малое количество нейронов можно упустить существенные различия в изучаемой совокупности. Поэтому определение оптимального размера (числа нейронов) АНС сводится к выбору «гранулярности» или степени обобщенности данных, оптимальной с точки зрения поставленной цели.

Как правило, даже при относительно равномерном выходном распределении, когда среднее число предприятий, попавших в каждую ячейку, составляет от 4 до 6, вследствие случайных флуктуаций входных данных, на плоскости выходных параметров может образоваться несколько пустых ячеек, в которые не попало ни одно предприятие. Увеличение количества выходных нейронов в этом случае представляется нежелательным, так как оно ведет к возрастанию числа нейронов, на которые ничего не отображается.

Универсальных рекомендаций по выбору количества нейронов в сети не существует, так как оптимальная размерность плоскости выходных параметров зависит как от сферы применения АНС, так и от объема имеющихся данных. Например, если имеется относительно однородное множество примеров, то нейронов целесообразно выбрать в несколько раз меньше, чем записей. В ином случае: если векторы данных представляют собой случайные переменные и распадаются на более или менее размытые кластеры, а с помощью АНС необходимо выявить кластерную структуру, число нейронов лучше выбрать кратным числу кластеров. Если с помощью АНС изучается кластеризация, а количество кластеров заранее неизвестно, число нейронов не должно быть больше, чем 10% от общего числа записей. Иногда объем имеющихся данных ограничен вследствие высокой стоимости или трудности их получения. В таком случае статистическая точность их представления может оказаться проблематичной, поскольку нельзя использовать несколько узлов для представления одного образа. Возможны также иные ситуации, поэтому осознать характер проблемы и специфику имеющихся данных важно еще до того как будет определяться размерность плоскости выходных параметров. Как правило, выбор «наилучшей» размерности плоскости выходных параметров производится в каждом случае на основе множественного моделирования (расчета различных вариантов) с использованием различных методов инициализации АНС, функции соседства нейронов, топологии выходной плоскости и обучающих процедур.