назад    Оглавление    вперед


страница - 0

Электронный журнал «ИССЛЕДОВАНО В РОССИИ»1 74http: zhurnal.ape.relarn.ru/articles/2001/016.pdf

ОПТИМИЗАЦИЯ АДАПТИВНОЙ ОЦЕНКИ ПРОГНОЗИРОВАНИЯ НА ОСНОВЕ ТЕОРЕТИКО-ИНФОРМАЦИОННОГО ПОДХОДА

А. В. Баринов (barinov@lunn.sci-nnov.ru)

Нижегородский государственный лингвистический университет

Задача прогнозирования случайного временного ряда X{t} относится к числу центральных задач теории и практики статистического анализа информации, особенно в области экономики и управления. Для решения этой задачи в последнее время на практике все чаще используется авторегрессионная модель временного ряда [1]

м

x(t) = Х atx(t - i) + l(t), t = 1,2,...(1)

где a1,a2,...,aM- вектор постоянных коэффициентов, n(t)- белый

.... ,-2

гауссовский шум с постоянной дисперсией оц и нулевым математическим

ожиданием, t - дискретное время.

При использовании данной модели оптимальный прогноз на 1 шаг или временной дискрет в будущее в отсчете от текущего времени t = n - 1 сводится к линейной зависимости

м

x(n) = Х aix(n - i ),(2)

i=1

где м - порядок оценки прогнозирования. В классе гауссовских случайных процессов такая оценка обеспечивает минимум дисперсии ошибки

прогнозирования= M{[ x (n) - x(n)]2 } при условии, что вектор

коэффициентов {ai} отвечает системе нормальных уравнений Юла-Уокера

[2]


K n па = kn

n ,nn

Здесь Knjn - автокорреляционная матрица, кп - вектор-столбец

коэффициентов автокорреляции анализируемого процесса.

К сожалению, на практике, как правило, мы не имеем достоверных сведений о корреляционных свойствах процесса X{t} . В условиях априорной неопределенности возникает необходимость в оценивании коэффициентов автокорреляции в выражении (3) по имеющейся выборке наблюдений. При этом в зависимости от используемого метода оценивания получают различные модификации адаптивной оценки прогнозирования (2). Причем предпочтение обычно здесь отдают состоятельным оценкам со свойством их сходимости с вероятностью 1 к искомому оптимальному результату (3). В таком случае главное различие между существующими алгоритмами оценивания заключается в их быстродействии или скорости сходимости.

С указанной точки зрения представляют первостепенный интерес адаптивные методы нового класса, изначально нацеленные на решение проблемы малых выборок в задачах спектрального анализа. Типичным представителем этого класса является метод Берга. Его математическая формулировка может быть записана в рекуррентном виде [2]

ап(0 = ат-1 (0+ртат-1(m-0; / =1,2,...,m;

n-1

2ЕUm-1(t) "Vm-1(t - 1)

t = VH

P,

t=m

Um (t) = Um-1(t) -PmVm-1(t ~ 1);

Vm (t) = Vm-1(t - 1)Um-1(t); П = 1,2,.- Я

с инициализацией системой равенств v0(t) = u0(t) = x(t) для всех моментов времени t=0,1, n-1. Ее центральным звеном служит рекурсия Левинсона,


которая связывает между собой векторы коэффициентов линейной оценки прогнозирования {aq возрастающих порядков q=1,2, M. Финальное (при

q=M значение этой рекурсии {aM (i), i = 1, M} определяет совместно с выражением (2) адаптивную линейную оценку прогнозирования М-го порядка со свойством оптимальности (3) в асимптотике, когда объем выборки Поо .

Очевидно, что скорость сходимости в общем случае зависит не только от применяемого метода АР-анализа, но и от статистических свойств временного ряда. Проблема повышения скорости сходимости линейной оценки прогнозирования приобретает особую актуальность в случае анализа нестационарных процессов, когда их статистические характеристики не остаются неизменными во времени. Указанная ситуация наиболее характерна для большинства социально-экономических процессов. По видимому, для каждого конкретного процесса X{t} должен выбираться алгоритм, оптимальный в смысле максимума скорости сходимости формируемой оценки прогнозирования к оценке с минимальной дисперсией.

Указанный подход реализован в работе [3] на основе информационной метрики Кульбака-Лейблера [4]. В этой работе было показано, что величина удельного информационного рассогласования (УИР) между реальным процессом и его авторегрессионной моделью (1 ) описывается следующим выражением:

у (М, N) = ln о2л (M, N) + °ZM, N)(5)

Здесь <( M, N), оК M, N) - зависимости дисперсий порождающего шума

и ошибки прогнозирования от двух исходных параметров адаптивной оценки: порядка модели M и объема анализируемой (обучающей) выборки N. Чем меньше величина у(M, N), тем лучше модель (1) согласована с исходным временным рядом X {t} и тем точнее в конечном итоге оценка (2).




содержание:
[стр.Введение] [стр.1] [стр.2]