WWW.LIBRUS.DOBROTA.BIZ
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - собрание публикаций
 

Pages:   || 2 | 3 |

«Богачев Михаил Игоревич МАТЕМАТИЧЕСКИЕ МОДЕЛИ И МЕТОДЫ АНАЛИЗА РЯДОВ С ДАЛЬНЕЙ КОРРЕЛЯЦИЕЙ В СТОХАСТИЧЕСКИХ СИСТЕМАХ РАЗЛИЧНОЙ ФИЗИЧЕСКОЙ ПРИРОДЫ ...»

-- [ Страница 1 ] --

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ЭЛЕКТРОТЕХНИЧЕСКИЙ

УНИВЕРСИТЕТ «ЛЭТИ» ИМ. В.И.УЛЬЯНОВА (ЛЕНИНА) (СПБГЭТУ)

На правах рукописи

УДК 004.942

Богачев Михаил Игоревич

МАТЕМАТИЧЕСКИЕ МОДЕЛИ И МЕТОДЫ АНАЛИЗА

РЯДОВ С ДАЛЬНЕЙ КОРРЕЛЯЦИЕЙ В СТОХАСТИЧЕСКИХ

СИСТЕМАХ РАЗЛИЧНОЙ ФИЗИЧЕСКОЙ ПРИРОДЫ

Специальность 05.13.18 —

«Математическое моделирование, численные методы и комплексы программ»

Диссертация на соискание учёной степени доктора технических наук

Научный консультант:

доктор технических наук, профессор Кутузов Владимир Михайлович Санкт-Петербург — 2018 Оглавление Стр .

Введение...................................... 7 Глава 1 . Математические модели и численные методы анализа рядов с дальней корреляцией......................... 19

1.1 Линейные модели и методы флуктуационного анализа рядов с дальней корреляцией.......................... 20 1.1.1 Методы формирования и корреляционные свойства модельных рядов данных с ближней и дальней линейной корреляцией........................... 20 1.1.2 Самоподобность кумулятивного ряда и показатель Хёрста. 26 1.1.3 Флуктуационный анализ с исключением тренда (DFA)... 28 1.1.4 Флуктуационный анализ методом вейвлет-преобразования (WTA).............................. 30

1.2 Нелинейные модели и методы анализа рядов с дальней корреляцией 31 1.2.1 Нелинейные модели рядов с дальней корреляцией на основе мультипликативного каскада.............. 31 1.2.2 Нелинейные методы статистического анализа рядов данных с дальней корреляцией................. 32 1.2.3 Нелинейные модели рядов данных с дальней корреляцией на основе мультифрактального случайного блуждания... 39

1.3 Выводы по главе 1............................ 41 Глава 2 . Исследование математических моделей рядов с дальней корреляцией и численных методов их параметризации..... 44

2.1 Модификация модели мультипликативного каскада со случайными множителями..................... .

–  –  –

Глава 5 . Комплексные исследования динамики выбросов временных рядов, характеризующих аномальные состояния сложных стохастических систем различной физической природы .

... 137

5.1 Cтатистические характеристики временной локализации аномальных событий в геофизических и гидроклиматических системах с дальней корреляцией.................... 137 5.1.1 Характеристики интервалов между выбросами данных длительного мониторинга количества осадков и расхода рек 138 5.1.2 Оценки риска возникновения и прогнозируемость гидроклиматических аномалий................ 149 5.1.3 Примеры анализа и модельного описания отдельных рядов данных длительных гидроклиматических наблюдений 151 5.1.4 Оценка критических уровней, превышение которых происходит с заданной вероятностью, на основе Value-at-Risk........................... 157 5.1.5 Прогнозирование нерегулярных климатических аномалий на основе анализа выбросов меры связности графа..... 160





5.2 Cтатистические характеристики интервалов повторения аномальных событий в информационных и экономических системах168 5.2.1 Характеристики выбросов агрегированного трафика в информационных сетях..................... 170

–  –  –

Установление закономерностей, характеризующих особенности структурной организации и флуктуационного поведения стохастических систем различной физической природы, неразрывно связано с построением адекватных математических моделей таких систем. Типичными примерами такого поведения являются нерегулярные флуктуации геофизических, гидрологических, климатических и метеорологических показателей, регуляторные колебания физиологических процессов, нерегулярные флуктуации показателей, характеризующих поведение информационных, экономических и других сложных систем со стохастической динамикой, а также неоднородности структуры биополимеров. Спецификой таких систем является глубоко нелинейный характер закономерностей, описывающих поведение системы, обуславливающий появление аномальных по отношению к типичным состояниям системы. Построение адекватных динамических моделей таких систем зачастую ограничено сложностью и/или неполным пониманием внутренних механизмов их функционирования, а также неполнотой данных, необходимых для их параметризации применительно к каждому исследуемому объекту с учетом его индивидуальных характеристик. В этих условиях одним из возможных альтернативных подходов является приближенное описание обширного класса систем с использованием обобщенных феноменологических моделей .

Характерной особенностью многих стохастических систем различной физической природы является неограниченный рост оценки интервала корреляции N s = s=0 C(s) с ростом окна его оценивания N. В качестве инструмента непротиворечивого феноменологического описания таких систем, при котором модель не зависит от размера окна наблюдения, был предложен класс математических моделей с дальней корреляцией. Математические модели систем, проявляющих свойства дальней корреляции, рассматривались в работах А.Н. Колмогорова, А.М. Обухова, А.М. Яглома, Г.Э. Хёрста, Дж. Ламперти, Б.Б. Мандельброта, Е. Стэнли, Ш. Хавлина, Д. Сорнэ, А. Арнеодо, А. Бунде, С.В. Булдырева, Р.М. Юльметьева, Р.Р. Нигматуллина и многих других исследователей и получили широкое распостранение при описании стохастического поведения геофизических [1–4], информационных [5–9], физиологических [10–13], экономических [14–16] и многих других систем, а также особенностей структурной организации биополимеров [17–21]. Наряду с линейными статистическими связями, для многих сложных стохастических систем характерны эффекты нелинейной дальней корреляции, характеризуемые расходимостью автокорреляционных моментов высших порядков, которые оказывают дополнительное влияние на возникновение аномальных состояний .

В присутствии дальней корреляции характерны длительные отклонения от типичных состояний, проявляющиеся протяженными и значительными эволюциями порождаемых системой случайных процессов .

Подобное поведение приводит к выраженной кластеризации аномальных состояний системы и, как следствие, к временной группировке выбросов порождаемых ей случайных процессов (динамических рядов) и пространственной локализации однородных структурных элементов. Упрощенного представления на основе линейных моделей часто оказывается достаточно для характеристики среднестатистического или типичного поведения таких систем, однако не позволяет в полной мере охарактеризовать возникновение и развитие аномальных состояний системы, характеризующихся выбросами порождаемых ей случайных процессов. Косвенная характеристика аномальных флуктуаций может быть получена за счет их доминирования их вклада при вычислении корреляционных моментов высших порядков, однако интерпретация таких оценок затруднена и не может использоваться непосредственно для динамической оценки вероятности возникновения выбросов .

В этих условиях для характеристики динамики аномальных состояний системы представляется целесообразным перейти от рассмотрения структурной или динамической модели системы в целом непосредственно к модели потока событий, заданных выбросами порождаемых системой динамических рядов x Q, единственной характеристикой которого являются интервалы r между их положениями. Широко применяемое при отсутствии априорной информации о флуктуационном поведении системы описание потоков классическими пуассоновскими моделями, полагающими события статистически независимыми, приводит к плотности распределения вероятностей (ПРВ) интервалов вида P (r) = (1/RQ )(1 1/RQ )r1, которое при уменьшении шага дискретизации в пределе приводит к известному выражению для непрерывных систем P (r) = (1/RQ ) exp(r/RQ ), где средний интервал RQ взаимно однозначно связан с порогом Q для заданного вида ПРВ P (x) исходного ряда данных xi. В системах с конечным интервалом корреляции s данное приближение справедливо при RQ s .

При анализе рядов с дальней корреляцией данное приближение приводит к значительной недооценке эффектов кластеризации выбросов, что многократно отмечалось при исследовании динамики информационных [8], климатических [22; 23], гидрологических [24], геофизических [25; 26] и экономических [27] систем .

Рассмотренные явления характерны не только для временной эволюции динамических систем, но также для первичной структуры биологических полимеров (ДНК и белков), где проявления дальней корреляции связаны с формированием последовательных кластеров, содержащих идентичные или близкие по физико-химических свойствам мономеры (нуклеотиды и аминокислоты), и участвующих в формировании сложной пространственной структуры и иерархической упаковки биополимеров [28; 29] .

В общем виде задача отыскания статистических характеристик временных положений выбросов случайных процессов рассматривалась в работах П.И. Кузнецова, Р.Л. Стратоновича и В.И. Тихонова, впоследствии обобщенных и развитых В.И. Тихоновым и В.И. Хименко (1970, 1987), в которых статистики пересечения уровней представляются аналитически через совместные распределения случайного процесса и его производной в каждый момент времени. Полученные в указанных работах точные решения общего вида для процессов с памятью хорошо подходят для анализа марковских случайных рядов, в то время как попытки их обобщения на случай немарковских моделей приводят к аналитически сложным и вычислительно трудным выражениям, которые для моделей с дальней корреляцией становятся бесконенчномерными, что ограничивает возможности их практического применения для данного класса математических моделей .

Несмотря на широкое распространение математических моделей с дальней корреляцией, большинство известных аналитических работ в области интервалов между нерегулярными событиями либо не рассматривают указанные классы моделей [30–34], либо содержат выводы граничных условий для конкретных примеров [35], не составляющие общей картины. Полученное сравнительно недавно масштабно-инвариантное описание асимптотического вида ПРВ и АКФ интервалов для рядов данных с линейной дальней корреляцией [36–38] не учитывает нелинейные эффекты, хотя и позволяет воспроизвести эмпирические характеристики некоторых климатических [37] и экономических [27] показателей в силу эффектов линеаризации. Таким образом, актуальность исследований обусловлена необходимостью построения математических моделей потоков событий в системах с нелинейной дальней корреляцией, характеризующих эффекты временной и пространственной кластеризаци в самоорганизующихся системах с дальней корреляцией различной физической природы .

Объектом исследования являются ряды данных с дальней корреляцией, отражающие длительную динамику или структурную организацию сложных стохастических систем различной физической природы .

Предметом исследования являются математические модели и методы численного анализа рядов данных, составляющих объект исследования .

Целью настоящего исследования стало выявление статистических закономерностей, характеризующих эффекты временной и структурной кластеризации в рядах с дальней корреляцией, порождаемых сложными стохастическими системами различной физической природы, в интересах создания адекватных математических моделей потоков событий, отражающих возникновение аномальных состояний таких систем, а также разработки на их основе численных методов и комплекса программ для оценки динамических и структурных характеристик указанных систем .

Для достижения поставленной цели необходимо было решить следующие задачи .

1. Проанализировать основные подходы к математическому моделированию биофизических, геофизических, информационных и иных сложных стохастических систем с учетом эффектов дальней корреляции, установить возможности и ограничения численных методов флуктуационного анализа, используемых для параметризации математических моделей указанных классов систем, а также исследовать возможности обобщения моделей и преодоления ограничений методов .

2. Разработать метод математического моделирования флуктуационного поведения и структурной организации сложных стохастических систем с дальней корреляцией на основе совокупности потоков событий, характеризующихся выбросами порождаемых указанными системами рядов свыше заданных уровней, для чего установить асимптотический вид распределений интервалов между событиями и корреляционные свойства последовательных рядов указанных интервалов .

3. Для разработанной модели потоков событий получить аналитические оценки вероятностей возникновения указанных событий на интервале прогнозирования, с учетом предыстории аналогичных событий, исследовать возможность и эффективность прогнозирования событий на основе предложенных оценок, в том числе в присутствии шумовых искажений наблюдений исходного ряда .

4. На основе полученных оценок разработать численный метод динамической оценки уровней, превышение которых анализируемым рядом ожидается с заданной вероятностью на заданном интервале прогнозирования, и на основе данного метода предложить алгоритмы управления рисками, связанными с возникновением выбросов анализируемого ряда .

5. Реализовать рассмотренные и предложенные численные методы и алгоритмы в виде проблемно-ориентированного комплекса программ для проведения вычислительного эксперимента с модельными и эмпирическими рядами данных, характеризующими флуктуационное поведение и структурные неоднородности в сложных стохастических системах различной физической природы .

6. Выполнить комплексные исследования флуктуационного поведения геофизических, информационных, экономических, физиологических и иных стохастических систем различной физической природы на основе численного анализа статистических характеристик потоков событий, характеризующих аномальные состояния указанных систем, представленных выбросами порождаемых ими временных рядов по данным длительных эмпирических наблюдений .

7. Исследовать возможность математического моделирования взаимного положения мономеров в первичной структуре биополимеров на основе предложенного подхода, для чего проанализировать статистические характеристики интервалов между положениями отдельных мономеров в ДНК и белках, установить их взаимосвязь со структурными особенностями указанных биомолекул и параметрами математической модели потока .

8. Разработать вычислительные методы и алгоритмы предсказания структурных особенностей биополимеров и адаптации генетических конструкций к особенностям генетического аппарата организма-хозяина на основе анализа взаимного положения мономеров в их первичной структуре на основе предложенных математических моделей .

В работе были использованы аналитические методы исследования, методы математического моделирования, методы численного анализа данных и методы математической статистики .

Научная новизна:

1. Предложен метод математического моделирования флуктуационного поведения и структурной организации сложных стохастических систем на основе семейства потоков событий, характеризующихся выбросами порождаемых ими рядов с дальней корреляцией свыше заданных уровней, для которых получены выражения, характеризующие асимптотический вид распределений интервалов между событиями и корреляционные свойства последовательных рядов указанных интервалов .

2. Получены аналитические оценки вероятностей возникновения событий, связанных с выбросами рядов с дальней корреляцией на интервале прогнозирования, с учетом предыстории аналогичных событий для рассмотренных математических моделей, исследованы их эффективность и помехоустойчивость .

3. Разработан численный метод динамической оценки уровней, превышаемых анализируемым рядом с заданной вероятностью на заданном интервале прогнозирования, вычислительная сложность которого не зависит от интервала прогнозирования, получены оценки вычислительной эффективности метода для разработанных моделей потоков событий .

4. Впервые выполнены комплексные исследования флуктуационного поведения широкого спектра геофизических, информационных, экономических, физиологических и иных стохастических систем различной физической природы на основе численного анализа статистических характеристик потоков событий, характеризующих аномальные состояния указанных систем, представленных выбросами порождаемых ими временных рядов по данным длительных эмпирических наблюдений .

5. Показана адекватность предложенной математической модели потока для описания взаимного положения мономеров в первичной структуре биополимеров на основе анализа статистических характеристик интервалов между положениями отдельных мономеров в ДНК и белках, установлена их взаимосвязь со структурными особенностями указанных биомолекул и параметрами математической модели потока .

6. Разработан вычислительный метод и алгоритм предсказания структурных и структурно-обусловленных свойств биополимеров на основе анализа данных масс-спектрометрии остатков их множественного протеолитического расщепления без реконструкции состава и/или последовательности аминокислот в их первичной структуре на основе предложенных математических моделей .

Научная и практическая значимость Предложенные в диссертации математические модели и методы вносят существенный вклад в обоснование и развитие представлений о флуктуационном поведении широкого спектра систем с дальней корреляцией различной физической природы, включая биологические, геофизические, информационные, экономические и иные сложные системы со стохастической динамикой в широком диапазоне временных масштабов. Установленные по результатам исследований статистические закономерности характеризуют эффекты кластеризации аномальных выбросов временных рядов, порождаемых такими системами, а также позволяют получить оценки вероятности возникновения таких выбросов с учетом предыстории их возникновения, что может быть использовано в прикладных геофизических, гидрологических, климатических и метеорологических исследованиях при оценке рисков стихийных бедствий с учетом уровней защитных гидротехнических сооружений, разработке алгоритмов управления гидротехническими сооружениями с целью оптимизации накопления воды в водохранилищах и резервуарах гидроузлов, экономических расчетах и страховой аналитике, связанной со стихийными бедствиями, вызванными аномальными геофизическими, климатическими и метеорологическими явлениями, а также для оптимизации пространственно-временного представления информации в системах геофизического мониторинга. На основе предложенных в работе математических моделей первичной структуры биополимеров, учитывающих эффекты дальней корреляции во флуктуациях локальных концентраций отдельных мономеров, разработаны новый метод направленной обратной трансляции полипептидов с учетом особенностей организации ДНК организма-хозяина, востребованный в прикладных задачах генетической инженерии, а также оригинальный метод предсказания ряда структурных и структурно-обусловленных свойств полипептидов на основе анализа формы распределения масс остатков их множественного протеолитического расщепления без реконструкции состава и/или последовательности аминокислот в их первичной структуре, востребованный при автоматизации анализа больших объемов протеомных данных в области прикладной молекулярной биологии, вирусологии и фармакологии .

Реализация и внедрение были выполнены в рамках международных проектов FP6 EC DAPHNET (Dynamic Analysis of Physiological Networks) и DYSONET (Dynamic Analysis of Sociological Networks) в 2007-2009 гг., проектов при поддержке Deutsche Forschungsgemeinschaft (BU-534/23-1, BU-534/24в 2011-2015 гг., а также ряда НИР, выполенных в СПбГЭТУ “ЛЭТИ” в рамках ФЦП “Научные и научно-педагогические кадры инновационной России на 2009-2013 гг.” (ГК №№ П480, П521, П702, П1114, П1200, П2342,

14.В37.21.0180, 14.В37.21.2080) и Госзадания Минобрнауки РФ (2014/187, 8.324.2014/К, 2.5475.2017/6.7), 2014 г.-н.в. Исследования были поддержаны грантом Германской службы Академических обменов (DAAD) 2006 г., совместными грантами Минобрнауки РФ и DAAD 2010 и 2012 гг., грантами Российского фонда фундаментальных исследований (12-08-33156, 14-34-50054, 15-34-51252) и Российского научного фонда (16-19-00172), грантами Администрации СанктПетербурга в сфере научной и научно-технической деятельности 2010 и 2011 гг., персональным грантом Президента РФ для поддержки молодых российских ученых - кандидатов наук 2011-2012 гг. (МК-556.2011.8) и персональными грантами Администрации Санкт-Петербурга для молодых ученых - кандидатов наук 2009гг .

Разработанные математические модели и численные методы предсказания структурных и структурно-обусловленных свойств полипептидов и оптимизации искусственных генетических конструкций к особенностям генетического аппарата организма-хозяина были успешно использованы в прикладных исследованиях в области молекулярной биологии и фармакологии, выполненных на базе Института фундаментальной биологии и медицины Казанского (Приволжского) федерального университета и на базе Лаборатории структурной организации генома ФГБУН “Институт цитологии Российской академии наук”, что подтверждается актами о внедрении результатов диссертационной работы .

Личный вклад. Основные положения и результаты диссертационной работы получены автором лично. В опубликованных работах по теме диссертации, выполненных в соавторстве, основные теоретические исследования, включая исходную формализацию, математическое моделирование, статистический анализ данных и интерпретацию его результатов, выполнены автором лично. При этом в работах, относящихся к анализу конкретных биологических, геофизических и экономических систем, вклад соавторов в основном сводится к формулировкам особенностей организации и функционирования данных систем, на этапах постановки задачи и интепретации результатов исследований .

Основные положения, выносимые на защиту:

1. Математическое моделирование потоков выбросов свыше произвольных уровней Q рядов с дальней корреляцией основано на универсальном характере асимптотического поведения плотности распределения интервалов PQ (r) и условных средних интервалов RQ (r0 ), зависящих только от среднего интервала повторения выбросов RQ .

2. Аналитические оценки вероятности WQ (t; t) возникновения хотя бы одного выброса случайного ряда с дальней корреляцией свыше заданного уровня Q на интервале наблюдения t убывают асимптотически по степенному закону с ростом времени t, истекшего с момента последнего выброса свыше того же уровня Q .

3. Количественная динамическая оценка пороговых уровней Q, превышаемых анализируемым рядом с заданной вероятностью p на заданном интервале прогнозирования t, реализуется на основе итерационного численного решения уравнений вида p = WQ (t; t) для семейства оценок WQ (t; t), вычислительная сложность которого не зависит от параметров t; t .

4. Прогнозирование нерегулярных климатических аномалий Эль-Ниньо с упреждением в один год реализовано на основе анализа превышений уровня средней взаимной нормированной ковариацией рядов приповерхностных температур в экваториальной зоне и в остальной части тихоокеанского бассейна .

5. Взаимное расположение мономеров в первичной структуре ДНК описывается математической моделью, в рамках которой в пределах локальных фрагментах размером 150 п.о. они расположены случайным образом, а относительная доля различных мономеров в последовательных фрагментах характеризуется рядом с дальней корреляцией .

6. Неоднородность структуры полипептидов проявляется в форме отклонения распределений масс остатков их множественного протеолитического расщепления от экспоненциального, что позволяет предсказывать их структурные и структурно-обусловленные свойства без реконструкции состава и/или последовательности аминокислот в первичной структуре .

Степень достоверности полученных результатов подтверждается согласованностью аналитических расчетов, математического моделирования и численного исследования больших объемов эмпирических данных, характеризующих структурную организацию и динамическое поведение различных биофизических, геофизических, информационных и иных сложных стохастических систем. Достоверность полученных результатов также подтверждается успешным прогнозированием эпизода Эль-Ниньо 2014-2016 года, одного из наиболее выраженных за всю историю непрерывных климатических наблюдений, осуществленным за один год до наступления события и подтвердившимся в ходе последующих наблюдений .

Апробация работы. Основные результаты работы представлялись на ежегодных конференциях American Geophysical Union (AGU) 2008-2012 гг. (San Francisco, USA); European Geophysical Union (EGU) 2009-2011 гг. (Vienna, Austria); конференции “Econophysics Approaches to Large-Scale Business Data and Financial Crisis” (Tokyo, Japan, 2009); научном семинаре “Physiological Networks: Theory, Implementation and Application” (Rauischholzhausen, Germany, 2009); конференциях “Bioinformatics of Genome Regulation and Structure / Systems Biology” (BGRS/SB) (Новосибирск, 2010, 2012, 2016); II-IV международных научно-практических конференциях “Постгеномные методы анализа в биологии, лабораторной и клинической медицине” (Новосибирск, 2011; Казань, 2012, 2014); VIII Российско-баварской конференции по биомедицинской инженерии (С.-Петербург, 2011); XIV и XV Санкт-Петербургских Ассамблеях молодых ученых и специалистов (2009-2010 гг.); Всероссийской конференции «Материалы и технологии XXI века» (Казань, 2014, 2016); IV научно-практическом семинаре “Вычислительная физика, суперкомпьютерные и информационные технологии” (Омская область, Чернолучье, 2014 г); конференциях Северо-Западной секции IEEE ElConRusNW (С.-Петербург, 2015-2017 гг.) и конференциях по мягким вычислениям и измерениям SCM (С.-Петербург, 2015-2017 гг.) .

Публикации. Основные результаты по теме диссертации опубликованы в 61 печатной работе, из которых 20 статей в международных рецензируемых журналах, индексируемых Web of Science и Scopus [39–58]; 3 главы в зарубежных монографиях, индексируемых Web of Science [59–61]; 16 статей в журналах, рекомендованных ВАК [62–77]; 2 монографии [78; 79] и ряд материалов международных конференций и симпозиумов [80–88]; 2 патента РФ [89; 90] и 9 зарегистрированных программ для ЭВМ [91–99] .

Объем и структура работы. Диссертация состоит из введения, шести глав и заключения .

Первая глава диссертации посвящена краткому обзору основных классов математических моделей рядов данных с дальней корреляцией и методов флуктуационного анализа данных, используемых при их параметризации. Во второй главе рассматриваются основные ограничения известных моделей и предлагаются их модификации, рассматриваются возможности и ограничения методов флуктуационного анализа, связанные с оценками флуктуационного поведения на основе данных выборочных наблюдений. Приводятся результаты исследования типичных искажений, возникающих при практическом применении указанных методов к модельным и реальным данным, на основании которых формулируются рекомендации по комбинированию различных методов анализа в интересах минимизации рассмотренных искажений .

Третья глава занимает центральное место в теоретической части диссертации. В ней предлагается и осуществляется переход от модели дискретного ряда, характеризующего поведение динамической системы в целом, к модели потока событий, характеризующих возникновение аномальных состояний такой системы. Вводятся основные статистические характеристики такого потока, приводятся их аналитические и численные оценки для распространенных классов моделей систем с линейной и нелинейной дальней корреляцией. Таким образом, устанавливается взаимосвязь между эффектами дальней корреляции и их проявлением в свойствах потока событий, связанных с возникновением аномальных состояний системы. Рассматриваются оценки вероятности аномальных событий на основе модели потока и предлагается численный метод оценки уровней, превышение которых на некотором интервале прогнозирования ожидается с заданной вероятностью .

Четвертая глава посвящена описанию архитектуры программного комплекса, реализующего предложенные модели и методы. С использованием указанного программного комплекса методом вычислительного эксперимента на модельных рядах данных исследуется эффективность предложенных оценок, в том числе в присутствии шумов наблюдений, проверяются условия сходимости предложенного численного метода. Рассматривается синтез алгоритмов управления рисками, связанными с их возникновением, предлагаются конкретные алгоритмы их численного оценивания .

Пятая глава посвящена вопросам адекватности предложенных моделей и применения предложенных методов анализу временных рядов в системах с дальней корреляцией различной физической природы: геофизических, гидрологических, климатических, метеорологических, информационных, экономических, физиологических. Подробно рассматриваются особенности каждого класса систем с учетом возможностей измерения данных, особенностей их поведения, выбора и параметризации моделей. Для каждого рассматриваемого класса рядов данных выявляются как универсальные, так и специфические свойства потока событий, связанных с аномальными состояниями исследуемых систем. Рассматриваются вопросы оценки вероятности и управления рисками, связанными с возникновением аномальных явлений в анализируемых системах .

Шестая глава посвящена применению предложенного математического аппарата для анализа структурных свойств систем с дальней корреляцией на примере первичной структуры биополимеров (ДНК и белков). Исследуются статистические характеристики интервалов между положениями отдельных мономеров в биополимерах, на основе которых предлагаются статистическая модель первичной структуры ДНК, а также перспективные методы и алгоритмы, направленных на решение актуальных задач генетической инженерии и молекулярной биологии .

Полный объём диссертации составляет 331 страницу с 110 рисунками и 2 таблицами. Список литературы содержит 375 наименований .

Глава 1. Математические модели и численные методы анализа рядов с дальней корреляцией Появление и практическое распространение математических моделей рядов с дальней корреляцией связано с накоплением больших объемов эмпирических данных длительного наблюдения самоорганизующихся систем различной физической природы .

Нередко исследователями в различных областях отмечается феномен, связанный с ростом эмпирической оценки интервала корреляции при увеличении окна наблюдения, причем этот рост ограничен только максимальной длительностью доступной реализации исследуемого ряда. Зависимость характеристик модели той или иной системы от длительности наблюдения затрудняет параметризацию таких моделей и сравнительный анализ данных, полученных на различных интервалах наблюдения. В этих условиях в качестве одного из возможных решений, позволяющих абстрагироваться от вышеуказанного явления, был предложен переход к моделям данных с теоретически неограниченным интервалом корреляции s = N C(s) при N, и формирующим такие ряды s=0 моделям систем с дальней корреляцией. В классе линейных систем к таким можно отнести все ряды, для которых в стационарном режиме автокорреляционная функция асимптотически убывает медленнее, чем 1/s, s 0. Аналогичные свойства неоднократно отмечались также при исследовании структурной организации некоторых природных систем, а также в геометрических фракталах. Самоподобные, или фрактальные свойства также многократно наблюдались в системах различной физической природы и связанных с ними явлениях, что определило широкую популярность феноменологических моделей сложных систем с фрактальными свойствами .

Первые широко известные и получившие распространение в практических приложениях математические модели самоподобных, или фрактальных, рядов с дальней корреляцией были введены Г.Э. Хёрстом для описания гидрологических данных [1–3]. Следует отметить, что варианты моделей с аналогичными статистическими свойствами рассматривались в более ранних работах А.Н. Колмогорова [100], а впоследствии и Дж. Ламперти [101], однако на тот момент времени не нашли широкого практического применения .

К основным математическим моделям, приводящим к рядам с дальней корреляцией, относятся в первую очередь линейные модели фрактального гауссовского шума (ФГШ) и фрактального броуновского движения (ФБД), а также нелинейные модели мультифрактального случайного движения и мультипликативного каскада. В дальнейшем целым рядом исследователей было показано, что набор процессов, регистрируемых в природе, содержит самоподобные, или фрактальные составляющие. Несмотря на многообразие предложенных моделей, наиболее популярным на сегодняшний день остаются, среди линейных, модели ФГШ и ФБД, а также две группы нелинейных моделей, связанных с вариациями мультипликативного каскада и мультифрактального случайного движения. Здесь и в дальнейшем, если не оговорено иное, приводятся выражения для эквидистантных во времени дискретных рядов данных .

–  –  –

1.1.1 Методы формирования и корреляционные свойства модельных рядов данных с ближней и дальней линейной корреляцией На протяжении длительного времени в различных прикладных областях при описании последовательных рядов данных, описывающих динамические процессы в саморегулирующихся системах различной физической природы, для приближенного описания наиболее часто используются линейные модели случайных рядов с конечным интервалом корреляции. В группе стационарных линейных моделей наибольшее распространение получили авторегрессионные (АР) модели

–  –  –

В силу симметрии АКФ здесь и в дальнейшем, если не оговорено иное, приводятся выражения для s 0. Удобство использования авторегрессионных фильтров для моделирования рядов данных обусловлено во многом простым и универсальным алгоритмом синтеза фильтра, формирующего такой ряд из независимых отсчетов, когда для произвольного порядка модели p при известных первых p отсчетах АКФ (или их оценках) коэффициенты АР-модели могут быть найдены как решение уравнений Юла-Уокера, при этом для p = 1, a1 = C(1) .

Также широкое применение находят модели скользящего среднего (СС)

–  –  –

Все рассмотренные выше модели относятся к классу моделей с ближней корреляцией и характеризуются конечными значениями оценки интервала корреN ляции s = 0 Cx (s) при неограниченном росте N. Выбор и параметризация вышеуказанных моделей обычно базируется на оценке ряда параметров эмпири

–  –  –

чески наблюдаемых данных, ключевым из которых является интервал корреляции s .

Накопление большого объема эмпирических данных и распространение доступных широкому кругу исследователей вычислительных мощностей, начиная с 90-х годов XX века, привело к широкому проявлению типичных ограничений моделей с ближней корреляцией для описания процессов во многих самоорганизующихся системах и стимулировало интерес к моделям с дальней корреляцией .

Простейшей математической моделью ряда с линейной дальней корреляцией является фрактальный гауссовский шум (ФГШ) xt = N sH3/2 uts при N, s=0 где ut – отсчеты белого гауссовского шума (БГШ), H – показатель Хёрста. Для стационарных рядов 0 H 1, причем 0 H 1/2 соответствует отрицательной, 1/2 H 1 – положительной дальней корреляции. Вычисление кумулятивной суммы ФГШ приводит к нестационарному ряду вида yi = i xk, который k=1 характеризует текущее положение в модели фрактального броуновского движения (ФБД). Ряд yi обладает характерным свойством самоподобности с точностью до аффинных преобразований ybs = bH ys, поэтому такие модели часто называют фрактальными [4] .

Без потери общности, рассмотрим случай ряда с нулевым средним значением и единичной дисперсией. Для рассмотренного класса моделей характерно асимптотическое затухание АКФ по степенному закону (см. напр. [102]),

–  –  –

= 1, 0 1 .

Для синтеза реализаций ФГШ используется несколько стандартных алгоритмов. Первый алгоритм называется алгоритмом случайных добавок [104]. Рассмотрим синтез дискретной реализации длительностью N = 2l – 1 отсчетов, где l

– число итераций алгоритма. Вначале зададимся двумя значениями x1 и xN, взятых из нормального распределения с нулевым средним и дисперсией 0 = 1. На первой итерации получим значение

–  –  –

методом линейной интерполяции. Затем к каждому из значений полученного ряда x1,x(N +1)/2, xN прибавим значения, взятые из нормального распределения, но с дисперсией 1 = (1/2)H, где H – требуемое значение показателя Хёрста. На второй итерации разделим пополам два интервала между значениями, полученными после первой итерации, и произведем аналогичную процедуру линейной y i

–  –  –

Рисунок 1.2 — Визуальное сравнение выборочных фрагментов (a) некоррелированного ряда данных и двух рядов с дальней корреляцией, характеризующихся (b) = 0 .

5 и (c) 0.25, соответственно. Жирной линией показано скользящее среднее, определяемое в окне из 30 отсчетов .

интерполяции, после чего к полученным значениям добавим значения, взятые из нормального распределения, но с дисперсией 1 = (1/2)H. Наконец, на l-ой итерации получим после процедуры линейной интерполяции на 2l1 интервалах к значениям сформированного ряда прибавим случайные значения из распределения с нулевым средним и дисперсией 1 = (1/2)H. Указанный метод приводит к одномерной реализации с заданным показателем Хёрста H. Указанная модель отражает иерархическую структуру многоконтурной регуляции в саморегулирующихся системах различной физической природы, в том числе астрономических циклов, регулярных гидроклиматических колебаний, физиологических ритмов и др., от наиболее медленных до самых быстрых .

Альтернативный подход к синтезу дискретных рядов с долговременной зависимостью связан с использованием процедуры линейной фильтрации с передаточной характеристикой фильтра K(f ) f /2, моделирование которой обычно выполняется с помощью быстрого преобразования Фурье (БПФ), см. рис. 1.1 .

Часто по условиям задачи требуется, наряду с обеспечением заданного значения корреляционной экспоненты или взаимно однозначно связанного с ней показателя Хёрста H, обеспечить также заданное распределение отсчетов данных в пределах каждой синтезируемой реализации. В случае, когда речь идет о синтезе данных с гауссовским распределением, процедура линейной фильтрации не приводит к искажению гауссовского распределения, поэтому синтез таких данных не составляет трудности. Несколько сложнее решается задача синтеза данных с некоторым специфическим распределением, в особенности затухающим медленнее экспоненциального и не являющимся предельным. В самом общем случае поставленная задача может быть решена за счет применения итерационного алгоритма, предложенного Шрайбером и Шмитцем [105]. В рамках данного алгоритма, на первой итерации на вход линейного фильтра со степенной передаточной функцией подается ряд данных с независимыми отсчетами с требуемым распределением. На выходе фильтра получаем ряд с требуемым значением показателя Хёрста H, но в общем случае с искаженным распределением отсчетов. Полученные отсчеты ранжируются, после чего производится их поэлементная замена на ранжированные отсчеты, повторно взятые из выборки с требуемым распределением: самое большое значение заменяется на самое большое, второе по величине на второе и так далее, вплоть до самого малого. Полученный результат в точности отвечает требованиям по распределению отсчетов, но на сей раз имеет в общем случае искаженное значение показателя Хёрста H. Поэтому производится оценка истинного значения показателя Хёрста H при помощи одного из общепринятых методов (методология оценивания показателя Хёрста на основании анализа доступной реализации случайного ряда будет подробно рассмотрена ниже), и производится коррекция на показатель Хёрста H = H H путем повторной линейной фильтрации. Данный алгоритм повторяется итерационно, пока не будут достигнуты требуемые точности представления как по значению показателя Хёрста H, так и по распределению отсчетов данных (которое может проверяться на каждой итерации при помощи одного из общепринятых статистических тестов, например, теста Колмогорова-Смирнова). Данный алгоритм является универсальным, но, в то же время, достаточно ресурсоёмким. Для некоторых распределений, относящихся к предельным, существуют упрощенные алгоритмы, позволяющие синтезировать монофрактальные данные, позволяющие избежать итерационной процедуры или минимизировать число итераций за счет оптимизации скорости сходимости алгоритма .

На рис. 1.2 приведены фрагменты ряда, состоящего из независимых отсчетов (a), и двух рядов с дальней корреляцией (b,c) с = 0.5 и 0.25 соответственно .

Жирной линией показано скользящее среднее, определяемое в окне из 30 отсчетов. Для некоррелированных рядов данных, скользящее среднее постоянно локализуется вблизи нуля, тогда как для рядов с дальней корреляцией характерны значительные эволюции относительно среднего значения, наиболее выраженные для = 0.25, что является отражением внутренней персистентности процессов. При этом при рассмотрении отдельного фрагмента ряда с дальней корреляцией, как видно из рис. 1.2, данные эволюции могут быть ошибочно трактованы как признаки нестационарного поведения, или наличия фоновых трендов. Таким образом, в общем случае, ввиду теоретически неограниченного интервала корреляции исследуемого ряда, при наблюдении его конечной выборки в окне произвольного размера эффекты дальней корреляции и тренды могут как имитировать, так и маскировать друг друга .

1.1.2 Самоподобность кумулятивного ряда и показатель Хёрста

Поскольку, как было отмечено выше, медленные флуктуации, обусловленные эффектами дальней корреляции и присутствием трендов способны как имитировать, так и маскировать друг друга, возникает задача их различения, а также оценивания корреляционной экспоненты, характеризующей флуктуации наблюдаемого ряда с дальней корреляцией относительно некоторого внешнего тренда .

Указанная задача решается с помощью группы методов, которые обычно называют методами флуктуационного анализа, получивших широкое распространение, начиная с 90-х годов XX столетия, по мере накопления данных длительного мониторинга сложных систем различной физической природы и появления доступных вычислительных мощностей, достаточных для проведения углубленного статистического анализа данных таких наблюдений .

Для всех методов данной группы общими являются несколько шагов, первым из которых является вычисление кумулятивной суммы, или интегрирование ряда y(i) i xk, i = 1,..., L, где L –объем выборки. Полученный в результаk=1 те ряд обладает замечательным свойством самоподобия: для двух произвольных масштабов s и bs в среднем справедливо масштабное соотношение

y(bs) = bH y(s), (1.10)

где H – показатель Хёрста. Чтобы получить оценку значения H, исследуются флуктуации наблюдаемого ряда в сегментах длиной s для различных значений s. Одним из хрестоматийных примеров такой задачи является задача случайного блуждания точки вдоль прямой, в контексте которой отсчеты ряда ys указывают на текущее местоположение. В дальнейшем производится разбиение ряда yi на Ks = int[N /s] непересекающихся сегментов длиной s сперва от начала, а затем от конца анализируемого фрагмента ряда. Дальнейшие действия определяются модификацией используемого метода флуктуационного анализа .

В классическом флуктуационном анализе (FA) рассматриваются квадраты отклонений между значениями кумулятивных сумм, отстоящими друг от друга на s отсчетов, для каждого из сегментов

–  –  –

В задаче случайного блуждания F2 (s) имеет смысл среднеквадратического отклонения после s шагов и для независимых отсчетов xi, согласно уравнениям диффузии Фика, имеет вид F2 (s) s1/2, откуда H = 1/2 .

Для рядов с линейной дальней корреляцией, характеризующейся степенной АКФ вида (1.7), F2 (s) возрастает по степенному закому (см. напр. [102])

–  –  –

Для АКФ, убывающих быстрее, чем 1/s, асимптотически H = 1/2 для больших s, как и для некоррелированных данных .

Недостатком рассмотренного выше классического флуктуационного анализа является требование стационарности данных и конечной дисперсии. Простейшим примером некорректной работы FA в случае нестационарной динамики является анализ результата интегрирования белого шума, или винеровского процесса, когда вместо истинного значения H = 3/2 оценка составляет H = 1. Аналогично, при наблюдении флуктуаций ряда данных на фоне медленных трендов или квазипериодических процессов, в ряде случаев отмечается переоценка H .

1.1.3 Флуктуационный анализ с исключением тренда (DFA)

Описанные выше ограничения обуславливают потребность в методологическом аппарате, позволяющем проводить анализ флуктуационного поведения на фоне регулярных составляющих и трендов, инвариантных к изменению их формы и параметров по крайней мере в некотором диапазоне. Указанным требованиям в значительной мере удовлетворяет метод флуктуационного анализа с исключением тренда (Detrended Fluctuation Analysis, DFA). Как и в классическом флуктуационном анализе, при реализации метода DFA производится разбиение ряда xi на сегменты длиной s. В дальнейшем, метод DFA предполагает вычисление в каждом из сегментов отклонения ряда от локальной полиномиальной аппроксимации p методом наименьших квадратов [19; 106] .

i

–  –  –

где H2 = 1 /2 = (1 + )/2 характеризует линейную составляющую дальней корреляции .

Инвариантность по отношению к фоновым трендам определяется свойствами аппроксимации p (i), в первую очередь порядком используемого полинома. Часто порядок аппроксимирующего полинома связывают с порядком метода, DFA0 для случая вычитания постоянной составляющей, DFA1 – линейной, DFA2

– квадратичной, DFA3 – кубической аппроксимации и т.д. Таким образом, например, метод DFA2 инвариантен по отношению к трендам, которые могут быть аппкросимированы квадратичными полиномами, в кумулятивном ряде y(i) и, соответственно, по отношению к линейным трендам в исходном анализируемом ряде xi. В общем случае, тренды, успешно аппроксимируемые полиномами порядка k 1 в исходном ряде данных не влияют на флуктуационные функции, оценивание которых производилось методом DFAk или более высоких порядков, однако вносят искажения в оценки, получаемые методами DFA(k 1) или более низких порядков, что позволяет оценивать свойства флуктуационной составляющей анализируемого ряда инвариантно по отношению к фоновым трендам, при этом выбор адекватного порядка аппроксимирующего полинома может быть осуществлен путем последовательного повышения порядка до стабилизации асимптотического поведения флуктуационной функции. Достоинством метода DFA также является относительно позднее проявление эффектов конечности выборки, позволяющее получать устойчивые оценки ФФ вплоть до s L/4. С другой стороны, использование высоких порядков полинома приводит к расширению зоны неопределенности в области малых значений s, образующейся за счет идеальной аппроксимации полиномом порядка n значений ряда в сегментах s n + 1, откуда F2 (s) 0 при s n + 1. За зоной неопределенности наблюдается характерный перегиб (кроссовер) ФФ, завершающийся в случае однородно коррелированного ряда (в качестве простейшего примера можно привести ФГШ) переходом к асимптотическому поведению, которое для DFA2 достигается при s 8. В этом случае оценка показателя Хёрста H может быть получена с помощью линейного регрессионного анализа зависимости log F2 (s) от log s в диапазоне s от 8 до L/4 .

На практике эмпирически наблюдаемые ряды данных часто демонстрируют характерный вид ФФ только в некотором диапазоне масштабов s, что накладывает дополнительные ограничения на выбор окна регрессионного анализа .

1.1.4 Флуктуационный анализ методом вейвлет-преобразования (WTA) Альтернативный подход основан на использовании вейвлетпреобразования (Wavelet Transform Analysis, WTA) в базисе Хаара, в рамках которого в сегментах исходного ряда xi длиной s вычисляются средние значения x. Таким образом, WTA0 рассматривает статистики вида g (s) = (x )2,

–  –  –

В смысле инвариантности к фоновым трендам, DFAn соответствует WTAn .

Например, WTA2 позволяет наблюдать флуктуации на фоне линейных трендов .

Достоинством WTA, наряду с простотой реализации и низкой вычислительной сложностью, является отсутствие зоны неопределенности, характерной для ранее рассмотренного метода DFA при малых значениях аргумента s, что позволяет получать устойчивые оценки ФФ непосредственно начиная с s = 1, что подверждается результатами анализа синтезированных рядов ФГШ с помощью WTA .

Недостатком метода является неустойчивость оценок ФФ при s L/100 в силу более выраженного влияния эффекта конечности выборки. Таким образом, для корректной оценки асимптотического поведения как на малых, так и на больших масштабах целесообразно комбинировать рассмотренные методы флуктуационного анализа .

1.2 Нелинейные модели и методы анализа рядов с дальней корреляцией

–  –  –

Среди математических моделей рядов с нелинейной дальней корреляцией наибольшее распространение получили мультифрактальные модели, введеные в контексте турбулентности в начале 70-х годов XX века Б. Мандельбротом [107] на основе более ранних работ А.Н. Колмогорова, А.М. Обухова и А.М. Яглома [100; 108–110]. В дальнейшем этот термин был неоднократно и широко использован для описания динамики сложных систем специалистами из различных областей, что в конечном итоге привело к отсутствию единства терминологии в части описания рядов с нелинейной дальней корреляцией и их характеристик .

Ниже приведен ряд численных характеристик, получивших наибольшее распространение при описании сложных систем с нелинейной дальней корреляцией, и обладающих, приемущественно, мультифрактальными свойствами .

Среди используемых на практике алгоритмов синтеза данных с мультифрактальными свойствами, наибольшее распространение получили алгоритмы на основе различных модификаций процедуры мультипликативного каскада, впервые предложенной Мандельбротом [107; 111]. В рамках указанной группы алгоритмов задаются некоторым начальным значением х1 (0). Далее на каждой итерации п = 1, 2,... производится итеративное умножение каждого из значений реn1), i = 1, 2,..., rn1 полученной на предыдущей итерации, на rn ализации xi различных множителей ml, l = 1, 2,..., rn. Таким образом, длительность реализации возрастает в r раз на каждой итерации, и после N итераций длительность составляет rN. Модификации алгоритма мультипликативного каскада связаны с выбором различных алгоритмов формирования набора множителей ml, а также с выбором различных параметров модели r, N. При моделировании рядов с мультифрактальными свойствами на ЭВМ наиболее часто прибегают к основанию r = 2, при этом часто модель мультипликативного каскада называют биномиальной [79] .

В простейшем варианте алгоритма мультипликативного касакада при r = 2 задаются множителями ml = а для нечетных значений l и ml = b для четных значений l. Нередко в литературе данная реализация мультипликативного каскада упоминается как ab-модель. При этом, если a + b = 1, т.е. на каждой итерации умножения на ml сохраняется среднее значение реализации, такая модель мультипликативного каскада называется канонической [111] .

Данная модификация мультипликативного каскада носит детерминистический характер, и может быть описана при помощи детерминистических уравнений, на основании которых можно однозначно определить значение реализации xi при заданном значении аргумента i и заданной итерации n. Например, если а b, первое значение реализации на любой итерации всегда будет максимальным (что нельзя считать удовлетворительным при моделировании многих процессов) [79] .

Простейший способ введения случайной составляющей в ab-модель заклюn1) чается в том, что на n-ой итерации для каждого значения xi случайным образом (как правило, равновероятно) выбирается, какой из множителей (нечетный или четный) будет равен, при этом второй множитель автоматически равен b = 1

– а (для канонической модели). Пример реализации алгоритма синтеза ab-модели со случайным порядком множителей проиллюстрирован на рис. 1.5 .

1.2.2 Нелинейные методы статистического анализа рядов данных с дальней корреляцией Характеристика нелинейных статистических связей между отсчетами анализируемого ряда требует обобщения численных методов его анализа, используемых для параметризации рассматриваемых моделей. Как уже неоднократно отмечалось, для самоорганизующихся систем характерны также нелинейные эффекты, приводящие к появлению нелинейных статистических связей. Численный анализ и характеристика нелинейных статистических связей в практических приложениях основывается на использовании обобщений рассмотренных в предыдущем разделе методов анализа данных, в первую очередь флуктуационного анализа .

<

–  –  –

Таким образом, обобщенные показатели Хёрста H(q) порядка q взаимно однозначно связаны с показателями Реньи, принятыми во фрактальном анализе (q) .

Для монофрактальных рядов данных, H(q) не зависит от q, поскольку масштабирование флуктуаций F (s) проявляется одинаково для всех фрагментов .

Если же малые и большие значения проявляют различные закономерности масштабирования, H(q) будет зависеть от q: для больших положительных значений q, фрагменты с выраженными флуктуациями F (s) будут доминировать в статистике Fq (s). Подобные эффекты относят к проявлениям нелинейной дальней корреляции .

Таким образом, для больших положительных q, H(q) отражает закономерности выраженных флуктуаций относительно типичных значений. На практике, в реальных системах чаще всего выраженные флуктуации характеризуются меньшими значениями H(q). Напротив, для больших по абсолютной величине отрицательных q, сегменты с малыми девиациями F (s) будут доминировать в статистике Fq (s). Таким образом, для больших по абсолютной величине отрицательных q, H(q) отражает поведение участков ряда со слабыми девиациями, которые в реальных физических системах чаще характеризуются меньшими значениями H(q) .

Рассмотренный выше метод мультифрактального анализа данных является прямым обобщением классического флуктуационного анализа и наследует его основные недостатки: (i) наблюдение флуктуаций на фоне монотонных трендов приводит к существенным искажениям H(q), (ii) нестационарная динамика, соответствующая H(q) 1, не может быть корректно описана с помощью данного метода, т.к. он не различает различные показатели Хёрста свыше 1, во всех подобных случаях приводя к асимпотическому поведению ФФ вида Fq (s) s .

Эмпирические данные, характеризующие динамику саморегулирующихся систем сложной физической природы, наблюдаются на фоне регулярных колебаний и случайных составляющих. Регулярные годовые и суточные циклы характерны для большинства геофизических систем и присутствуют в данных длительных гидрологических, климатических и метеорологических наблюдений. В динамике показателей информационных и экономических систем наличие (квази)периодических составляющих, помимо выраженного суточного цикла, связано также с недельными колебаниями. Для динамики физиологических ритмов характерен целый набор вложенных регуляторных циклов с нетривиальной структурой, изучаемой в рамках хронобиологии. Циклическая повторяемость определенных элементов структуры также характерна для организации биополимеров и характеризует, в частности, определенные уровни регулярной упаковки ДНК (цикл двойной спирали в 10-11 пар оснований, ее цикл вокруг гистона в 146 п.о .

и др.). Локальная цикличность в последовательности ДНК обусловлена наличие повторений, составляющих до 50% размера генома человека. Кроме того, флуктуационное поведение системы часто наблюдается на фоне регулярных трендов

c) H2 = 0.98

b) H2 = 0.8

a) H2 = 0.5 10 LTC LTC 1/2

–  –  –

(связанных, например, с медленными изменениями в геофизических и климатических системах, нестационарными режимами в биологических системах, интенсификацией трафика информационных сетей, инфляционными процессами в экономике и др.) .

Классическим приемом, позволяющим охарактеризовать флуктуационное поведение системы в присутствии регулярного цикла, является описание циклического поведения регулярной моделью и последующий анализ ряда остатков .

При наличии в эмпирической реализации wi достаточно большого числа полных циклов, можно оценить значения регулярной составляющей как средние значения wi в каждой точке цикла по всем периодам и выделить флуктуационную составляющую xi = wi wi. Данный подход предполагает доступность априорной информации о характере регулярной составляющей, наличие достаточной статистики (полных измерений за большое число периодов) и малоэффективен в присутствии нескольких вложенных регулярных циклов, особенно при вариабельности их параметров от периода к периоду .

Таким образом, существует потребность в методологическом аппарате, позволяющем проводить анализ флуктуационного поведения на фоне регулярных составляющих и трендов, инвариантных к их форме и параметрам. Указанным

–  –  –

На рис. 1.4 приведены примеры, характеризующие типичный вид Fq (s), q = 1,2,5 для рядов, сформированных в результате длительных наблюдений динамики систем различной физической природы: а) колебания температуры воздуха (Казань, Россия), хорошо описываемые линейной (монофрактальной) моделью с H2 = 0.65; b) интенсивности осадков (С.-Петербург, Россия), характеризующиеся слабовыраженной нелинейной зависимостью; c) стока реки (Селенга, Россия), с выраженной дальней корреляцией с H2 = 0.9; d) сердечного ритма здорового человека, близкого к 1/f шуму, дополненному нелинейной дальней корреляцией; e) возвратов инвестиций (IBM, USA), некоррелированного ряда с выраженной нелинейной дальней корреляцией; f) трафика WWW-сервера (University of Saskatchewan, Canada), для которого характерно сочетание выраженной нелинейной кратковременной и асимптотически линейной дальней корреляции, разделенной характерным выбросов, соответствующим суточному циклу .

В частности, для биномиальной ab-модели известны аналитические выражения для функции разбиения (q) и распределения обобщенных показателей Хёрста H(q), откуда также при необходимости нетрудно получить аналитическое выражение для мультифрактального спектра f (). Как показано, например, в работе [113], ln [aq + bq ] 1 ln [aq + bq ], h (q) = (q) =, ln 2 q q ln 2 Рисунок 1.5 — Синтез данных с дальней корреляцией с помощью алгоритма мультипликативного каскада с фиксированными множителями .

при этом для случая канонической биномиальной ab-модели в силу нормировки вышеприведенные выражения принимают вид [113]

–  –  –

Данная модель получила распространение, в частности, при анализе климатологических, метеорологических и гидрографических данных. В частности, в работе [114] было предложено применение указанной модели для математического моделирования динамики количества осадков и потока воды в реках. Более подробно данный вопрос рассматривается в главе 5, посвященной применению данного математического аппарата для анализа временных рядов, порождаемых сложными системами различной физической природы, где также показан ряд недостатков данной модификации мультипликативного каскада .

1.2.3 Нелинейные модели рядов данных с дальней корреляцией на основе мультифрактального случайного блуждания Альтернативный подход к формированию данных с выраженной нелинейной зависимостью представлен алгоритмом мультифрактального случайного блуждания (Multifractal Random Walk, MRW), впервые предложенный в работе [115]. Суть алгоритма заключается в том, что формируется монофрактальная последовательность ai характеризуемая показателем Хёрста Ha, причем для формирования финального стационарного мультифрактального ряда для ai должно выполняться условие 0,5 Н 1. Затем формируется вторая последовательность bi состоящая из независимых нормально распределенных случайных величин. Мультифрактальный ряд данных в рамках алгоритма мультифрактального случайного блуждания формируется путем экспоненциирования монофрактальной последовательности ai и ее поэлементного умножения на случайную последовательность bi, xi = exp (ai ) bi. Как и для рассмотренного выше примера, характерным свойством полученного ряда данных являются исчезающие линейные корреляции C(s) 0, s = 0; таким образом, ряд имеет только нелинейные статистические связи, характеризующиеся корреляционными моментами высших порядков .

Алгоритм синтеза дискретной последовательности на основе мультифрактального случайного блуждания проиллюстрирован на рис. 1.6 .

В работе [115] для мультифрактального ряда, полученного при помощи данной модели, было получено аналитическое выражение для обобщенной корреляционной функции порядка q:

Cq (s) s = qHa q (q 1), q, q a ) (H где Н – показатель Хёрста используемого при синтезе монофрактального ряда ai,

– основание модели, которое при сопоставлении с моделью на основе мультипликативного каскада может быть выражено как = 1/r .

Воспользовавшись приведенным выше аналитическим выражением Cq (s) sqHq [112], можно легко получить выражение для распределения Приемуществом данной модели является наличие аналитического выражения. К сожалению, в рамках данного алгоритма не предусматривается возможность управления параметром, а стандартные реализации алгоритма приводят к некоррелированным последовательностям с линейно независимыми отсчетами, но с выраженной нелинейной зависимостью. По этой причине данный класс моделей также в основном нашел применение при анализе динамики возвратов на финансовых рынках .

Другим немаловажным свойством последовательностей, полученных при помощи алгоритма мультифрактального случайного блуждания, является наличие случайного составляющей bi и возможность управления ее уровнем в рамках алгоритма синтеза модельных последовательностей. Для моделирования многих естественных сложных систем присутствие случайной составляющей является необходимым условием адекватности модели. Однако, учитывая ряд вышеприведенных ограничений, актуальным является введение случайной составляющей, а также возможных кратковременных зависимостей, также в последовательности, полученные с использованием других алгоритмов, в том числе в монофрактальиые последовательности и в мультифрактальные последовательности, полученные при помощи алгоритма мультипликативного каскада [79] .

1.3 Выводы по главе 1

По результатам литературного обзора математических моделей и методов анализа рядов данных с дальней корреляцией, а также собственных исследований возмжностей методов флуктуационного анализа указанных выше рядов данных, можно сделать следующие выводы .

1. Математические модели рядов данных с дальней корреляцией, методы их численного анализа и параметризации широко используются применительно к широкому классу сложных стохастических систем различной физической природы и позволяют достичь в целом адекватного описания динамических характеристик таких систем. В то время как линейные модели с дальней корреляцией, как правило, адекватно характеризуют только типичную динамику таких систем, широко используемые классы нелинейных моделей с дальней корреляцией во многих случаях адекватно отражают различные режимы функционирования исследуемой системы, включая динамику сильных и слабых флуктуаций. Благодаря этому, модели на основе мультипликативого каскада, теоретические основы которых были заложены в работах А.Н. Колмогорова, А.М. Обухова и А.М. Яглома и развиты в работах Б. Мандельброта и его последователей, на сегодняшний день являются одним из широко распространенных инструментов феноменологического моделирования флуктуационного поведения сложных стохастических систем с нелинейной дальней корреляцией различной физической природы .

2. При этом практическое применение таких моделей сталкивается с рядом ограничений, основные из которых отражены ниже .

– При выборе и параметризации математических моделей различных наблюдаемых явлений часто приходится опираться на данные длительного наблюдения единственной реализации случайного процесса, полученной по данным мониторинга за длительный, но все же конечный интервал времени. В качестве типичных примеров можно привести исторические данные геофизических, климатических или метеорологических наблюдений (температуры воздуха и водной поверхности, интенсивности осадков, расхода воды в реке), информационных и экономических систем (данные сетевого трафика, динамика конкретных биржевых индексов, курсов акций и т.п.), и ряда других показателей .

– Ввиду теоретически неограниченного интервала корреляции для рассматриваемого класса моделей для конечных фрагментов реализаций произвольной длительности не обеспечивается условие эргодичности, ввиду чего невозможно гарантировать репрезентативность оценок, получаемых из единственной реализации. Таким образом, помимо статистических оценок, получаемых непосредственно из данных наблюдений, адекватный выбор модели часто опирается на общие свойства исследуемого типа данных и сведения о типичных, в первую очередь асимптотических, характеристиках аналогичных рядов по данным предшествующих комплексных исследований согласно литературным данным (например, температурные колебания атмосферы успешно описываются линейными монофрактальными моделями, тогда как динамика трафика и экономических показателей требует привлечения нелинейных мультифрактальных моделей) .

– При этом выбор типа модели органично дополняются оценками, полученными для конкретного наблюдаемого ряда данных. В отсутствии данных длительных наблюдений динамики в конкретной точке некоторые приближения могут быть получены с использованием масштабной инвариантности выбранного класса моделей, при этом для их параметризации оказывается достаточно отдельных выборочных статистик моделируемого процесса, в большинстве случаев среднего значения и меры разброса (дисперсии или среднеквадратического отклонения) .

Для некоторых типов данных дополнительно необходимо уточнить параметры дальней корреляции, в первую очередь H и h(q) для линейных и нелинейных моделей, соответственно, если они не являются универсальными для исследуемого типа данных .

3. Наблюдение эффектов дальней корреляции в присутствии артефактов, связанных с появлением фоновых кратковременных трендов, периодических и/или шумовых составляющих в данных эмпирических наблюдений, что является типичным для наблюдения реальных процессов в живой и неживой природе, и обуславливает актуальность систематического исследования влияния данных артефактов на получаемые оценки. Также на практике важными факторами являются дискретность и конечная длительность доступных эмпирических выборок данных, что также необходимо учесть в рамках исследования и интерпретации его результатов, включая возможные сценарии как имитации, так и маскирования дальней корреляции .

4. В условиях существующих ограничений является актуальным дальнейшее развитие методов флуктуационного анализа, в частности, связанное с выбором оптимального базиса для локальной аппроксимации фонового (регулярного) поведения исследуемого ряда, на фоне которого наблюдается флуктуационная составляющая, направленную на минимизацию ошибок, обусловленных вышеизложенными факторами. Недавний прогресс в этом направлении связан с переходом от аппроксимации фрагмента кумулятивного ряда данных к аппроксимации его порядковых (ранговых) статистик -распределением [116–118] .

5. Также интерес представляет развитие возможных альтернатив флуктуационному анализу, среди которых важное место занимают методы теоретикоинформационного анализа данных, связанные с оценками различных мер энтропии системы в заданном диапазоне временных и структурных масштабов и разрешений. В контексте исследуемых свойств рядов данных, среди нелинейных мер энтропии наибольший интерес представляют работы Реньи [119], Грассбергера и Прокаччиа [120], Тсаллиса [121], для которых была показана тесная взаимосвязь с показателями флуктуационного поведения, в том числе распределением обобщенных показателей Хёрста h(q). Данные методы также представляют интерес при создания альтернативного инструментария для характеристики поведения и параметризации математических моделей сложных стохастических систем различной физической природы .

Глава 2. Исследование математических моделей рядов с дальней корреляцией и численных методов их параметризации

–  –  –

Рассмотренная в главе 1 модель мультипликативного каскада с фиксированными множителями не лишена ряда недостатков. В частности, поскольку множители могут принимать только 2 возможных значения а и b, множество возможных значений отсчетов после п итераций определяется выражением xi = ak bnk, 0 k п, однако при достаточно больших значениях п подавляющее большинство отсчетов соответствует нескольких наиболее вероятным значениям k, в соответствии с биномиальным распределением. Поэтому полученная реализация является квантованной по времени [79] .

Дальнейшее введение случайного фактора в модель мультипликативного каскада связано с отходом от фиксированных значений множителей ml. В модели случайного мультипликативного каскада множители ml представляют собой выборку из совокупности независимых одинаково распределенных случайных величии. Для случая r = 2 можно записать [39] (n) (n1) (n) (n) (n1) (n) x2l1 = xl m2l1, x2l = xl m2l .

При этом управление параметрами мультифрактальной модели осуществляется путем изменения параметров распределения множителей ml. В том случае, когда значения множителей ml берутся из нормального распределения, достаточно изменять два параметра, математическое ожидание m и среднеквадратическое отклонение m, которые в этом случае полностью задают распределение множителей [79] .

Чтобы оценить форму распределения синтезируемой реализации с мультифрактальными свойствами, рассмотрим вначале пример, когда все значения множителей ml положительны. В этом случае легко представить множители в виде (n) (n) ml = eyl, и тогда отсчеты синтезируемой реализации будут описываться выражением [40; 41] (N ) N (n) (n) xi = ml = exp yl, n=1 n=1 (n) где N – общее число итераций. Поскольку отсчеты ряда yl также являются независимыми и одинаково распределены, в соответствии с центральной предельной теоремой, при достаточно большом значении N их распределение сходится к норN (n) мальному. Следовательно, ln xi = n=1 yl имеют нормальное распределение, откуда получаем, что xi распределены логнормально. Данный результат можно легко обобщить на случай, когда множители ml могут принимать как положительные, так и отрицательные значения, рассматривая отдельно положительную и отрицательную часть распределения. При этом можно утверждать, что при произвольном распределении множителей после достаточно большого числа итераций N полученные распределения мультифрактальных данных характеризуются логнормальными хвостами [79] .

На основе данного подхода в работе [39] была предложена модификация мультипликативного каскада с центрированным распределением множителей ml, т.е. m = 0, а среднеквадратическое отклонение m конечно, которая приводит к реализации с симметричным распределением с логнормальными хвостами, обладающей следующим замечательным свойством: основной показатель Хёрста данной реализации H = 0.5, а значения автокорреляционной функции, характеризующей линейную связь между отсчетами, при достаточно больших значениях N стремятся к нулю C(s) 0, s = 0. Таким образом, при помощи достаточно простого алгоритма удается синтезировать реализации мультифрактального ряда с чисто нелинейным характером дальней корреляции. Помимо чисто академического интереса и возможности использования таких реализаций для сравнительной оценки тех или иных статистических характеристик у рядов с присутствующей линейной долговременной зависимостью, как было показано, данная модификация мультипликативного каскада успешно воспроизводит ряд статистических свойств таких случайных рядов, как последовательности возвратов на финансовых рынках .

Более подробно приложения данной модели рассмотрены в главе 5, посвященной применения рассматриваемого математического аппарата для анализа временных рядов в различных прикладных областях .

Рисунок 2.1 — Синтез данных с дальней корреляцией с помощью алгоритма MRC со случайными множителями [44] Дальнейшие направления развития моделей на основе мультипликативного каскада связано, в частости, с созданием на их основе универсальных моделей удароподобных сигналов [122] .

2.2 Погрешность флуктуационного анализа для конечных выборок данных На практике, параметризацию любых моделей, в том числе и моделей с дальней корреляцией, приходится осуществлять на основе данных выборочных наблюдений. На сегодняшний день наиболее распространенным инструментом анализа данных эмпирических наблюдений при параметризации моделей с дальней корреляцией являются методы флуктуационного анализа. Поэтому в дальнейшем было предпринято собственное исследование точности оценок статистических характеристик, используемых при параметризации моделей с дальней корреляцией, на основании конечных выборок рядов данных .

В первую очередь, рассмотрим оценивание характеристик рядов с линейной дальней корреляцией, на примере реализаций ФГШ, с помощью различных методов флуктуационного анализа. Отметим, что на практике для быстрого визуального качественного анализа часто оказывается удобным использовать графическое отображение не исходных ФФ F (s), а их модифицированных вариантов F (s)/ s в случае DFA и F (s) s в случае WTA. В этом случае постоянное значение будет соответствовать некоррелированному ряду, возрастающая функция – положительно коррелированному, а убывающая – отрицательно коррелированному ряду .

Из рисунка 2.2(a,b) видно, что оба рассматриваемых метода приводят к устойчивым степенным ФФ практически для всего диапазона значений s. Отклонения от асимптотического поведения наблюдаются только при использовании метода DFA при s 10 что, как уже было отмечено выше, связано с наличием зоны неопределенности, обусловленной точной аппроксимацией коротких фрагментов ряда полиномами. Для используемого здесь DFA2 F (s) 0 при s 4, т.к. квадратичный полином можно точно провести через три любые произвольно заданные точки. С увеличением поряка аппроксимирующего полинома зона неопределенности возрастает (см. [106]). Из рисунка также видно, что асимтотический наклон ФФ F (s) s после усреднения по множеству реализаций соответствует теоретическим значениям H = 0.6 и 0.75 .

В то время как усредненные ФФ демонстрируют устойчивое асимптотическое поведение, для отдельных реализаций наблюдается существенный разброс оценок. На рисунке 2.2(c-e) представлены выборочные ПРВ оценок наклонов ФФ, полученных для отдельных реализаций. Для оценки наклона ФФ было выбрано окно регрессионного анализа 2000 s 8000 .

Из рисунка 2.2(c,e) видно, что выборочные ПРВ оценок наклонов ФФ при использовании метода DFA оказываются существенно более узкими, что позволяет эффективно различать ряды с истинными значениями H = 0.6 и 0.75 в подавляющем большинстве случаев. Напротив, из рис. 2.2(d,f) видно, что при использовании метода WTA указанные выборочные ПРВ оказываются существенно шире, что затрудняет различение рядов с истинными H = 0.6 и 0.75 .

–  –  –

Рисунок 2.2 — (a,b) Флуктуационные функции рядов с дальней корреляцией с H = 0 .

6 и 0.75, полученные с использованием (a) DFA и (b) WTA, усредненные по 210 реализациям объема L = 216 каждая. Штриховыми линиями показаны теоретические наклоны. (c-e) выборочные ПРВ оценок, полученных для рядов с истинным значением H = 0.6 (c,d) и H = 0.75 (e,f) полученных с использованием (c,e) DFA и (d,f) WTA, для N = 1000 (), 4000 () и 16000 () реализаций размером L = 216 .

2.3 Основные факторы возникновения ошибок при анализе нелинейной дальней корреляции по данным длительных наблюдений В реальных ситуациях ряды с дальней корреляцией крайне редко бывают доступны для непосредственного измерения. Как правило, в наблюдаемом процессе, помимо дальней корреляции, описываемой, например, фрактальной моделью, содержатся случайные компоненты, периодические составляющие и дополнительные кратковременные зависимости, выходящие за рамки данной модели. Ниже рассмотрены типичные модели, воспроизводящие данные составляющие, помимо модели аддитивного белого гауссовского шума, модель экспоненциально-коррелированной помехи, отражающей добавочную по отношению к фрактальной модели ряда, отражающией дальние корреляции, составляющую с ближней корреляцией, и периодического узкополосного процесса, отражающего типичные (квази)периодические процессы [79] .

Экспоненциально-коррелированные составляющие. Формируется путем пропускания исходного шумоподобного процесса (в качестве которого может выступать, например, ряд с дальней корреляцией) через авторегрессионный (АР) фильтр, в простейшем случае первого порядка

–  –  –

где xn – отсчет сгенерированного алгоритмом АР1 сигнала с кратковременной зависимостью, a1 – параметр модели, а un – входная последовательность данных .

Автокорреляционная функция этого ряда затухает экспоненциально с интервалом корреляции s = 1/ |ln (a1 )| .

Процессы на основе авторегрессионных уравнений более высоких порядков являются суперпозицией сигналов с кратковременной зависимостью с различными интервалам корреляции s .

Следует отметить, что данная процедура успешно выполняется для монофрактальных данных с нормальным распределением. В случае иного вида распеределения, пропускание через авторегрессионный фильтр приводит к эффектам нормализации распределения, а также к частичной линеаризации нелинейных зависимостей, присутствующих в исходном ряде данных, поэтому в некоторых случаях, когда подобные искажения нежелательны по условиям задачи, поступают следующим образом: формируют отдельный ряд с ближней корреляцией, подавая на вход авторегрессионного фильтра белый шум un и в дальнейшем добавляют полученный ряд xn к исходному ряду с дальней корреляцией [123] .

Периодические (узкополосные) составляющие. Для получения модели сигнала с данным видом помехи к ряду с дальней корреляцией прибавляется ряд, отсчеты которого распределены по гармоническому закону A sin (2n/T ), где А – амплитуда помехи, n – номер отсчета, T – период. Данный вид помехи воспроизводит наложение на флуктуационную составляющую изучаемого случайного ряда (описываемого фрактальной моделью) регулярных колебаний, которые лучше описываются динамическими моделями (например, при анализе метеорологических данных – сезонные циклы, при анализе данных трафика информационных сетей – суточные циклы). Поэтому целесообразно рассматривать подобные регулярные колебания отдельно от флуктуационной составляющей, и выполнять их описание с помощью модели узкополосного процесса или модели регулярного колебания сложной формы .

2.4 Исследование эффектов, имитирующих дальнюю корреляцию при флуктуационном анализе данных с ближней корреляцией С целью количественной оценки влияния вышеперечисленных факторов на результаты флуктуационного анализа рядов данных, было проведено исследование, в рамках которого рассмотренные виды искажений вносились в модельные ряды данных. Результаты этого исследования представлены ниже .

На рисунке 2.3(a,b) показаны ФФ, полученные для рядов данных с ближней корреляцией, сформированных с помощью авторегрессионного фильтра первого порядка (АР1), с интервалами корреляции s = 125, 250, 500, 1000 и 2000. Оба рассмотренных метода при s s приводят к ФФ вида F (s) s1.5 = s0.5 s1.0, как для винеровского процесса. При больших значениях аргумента s s, все ФФ стремятся к асимптотическому поведению F (s) s0.5, что соответствует горизонтальным линиям на рисунке, что согласуется с отсутствием корреляционных

–  –  –

Рисунок 2.3 — (a,b) Флуктуационные функции рядов данных с ближней корреляцией, сформированных с помощью авторегрессионного фильтра первого порядка (АР1), с интервалами корреляции s = 125 (), 250 (), 500 (), 1000 () и 2000 (), полученные с использованием тех же методов, что и выше на рис .

2.2, усредненные по 210 реализациям размера L = 216 каждая. Для сравнения, штриховыми линиями приведены теоретические ФФ для H = 1.5 .

(c-e) Выборочные ПРВ оценок наклонов ФФ, полученных для рядов данных с ближней корреляцией с s = 125 (c,d) и s = 250 (e,f), полученных с использованием тех же методов и объема выборки .

связей для больших значений s. Между двумя рассмотренными выше асимптотическими режимами, наблюдается растянутый переходный режим (кроссовер), начинающийся приблизительно в районе s s. Из рис. 2.3(c,e) видно, что при использовании метода DFA данный кроссовер оказывается более растянутым и завершается лишь в районе s 50... 100 s, что сопоставимо с предельным масштабом s 4 L, для которого возможно устойчивое оценивание F (s) .

В работе [106] был также рассмотрен пример анализа ряда данных со степенным видом АКФ при малых значениях s и отсутствием корреляционных связей при больших значениях s, в сопоставлении с монофрактальным рядом данных, где степенной вид АКФ сохранялся для всех значений аргумента s. Было показано, что с использованием метода DFA можно успешно различить эти ряды при достаточном объеме выборки данных. Так, в работе [106] показано, что DFA2 дает характерную оценку = 0.5 при s 3... 4 s. Поскольку устойчивое оценивание ФФ возможно вплоть до значений s = L/4, где L – длина реализации, отсутствие корреляций для больших значений s и, как следствие, отсутствие дальней корреляции можно установить при объеме выборки по крайней мере L = 12... 16 s. Следует отметить, что приведенная оценка справедлива для синтезированных рядов данных, не содержащих нестационарных фоновых трендов, циклических и/или шумовых составляющих, поэтому на практике ее можно рассматривать как наиболее оптимистичную, отражающую нижнюю границу требуемого объема выборки для успешного различения ближней и дальней корреляции в рядах данных. На том же рисунке показано, что положение и протяженность кроссовера зависит зависит как от порядка метода, так и от выраженности корреляций на малых масштабах s .

При рассмотрении ряда, сформированного с помощью АР1, для малых значений s характерен наклон ФФ = 1.5, что соответствует интегрированному ряду данных. При этом, даже когда длина реализации в 28 раз превышает интервал корреляции s выбрать интервал значений s, для которого F (s) s0.5 затруднительно. При этом гипотеза о монофрактальном характере исследуемого ряда может быть также исключена за счет выраженного перегиба (кроссовера) ФФ в районе s = 2000 для обоих исследуемых методов, даже при объеме данных всего L 26 s. Следует отметить, что модель, рассмотренная в [106], характеризуется менее растянутыми переходными режимами, и поэтому различение эффектов ближней и дальней корреляции в рядах данных в этом случае оказывается возможным .

Напротив, при использовании метода WTA2 (см рис. 2.3(b)) асимптотическое отсутствие корреляционных связей может быть легко отмечено уже при s 6... 10 s. Таким образом, более ранние и короткие кроссоверы являются еще одним достоинством методов группы WTA, позволяя таким образом различать эффекты ближней и дальней корреляции в рядах данных по результатам их выборочного эмпирического наблюдения .

На рис. 2.3(c-f) показаны выборочные ПРВ оценок, полученных для рядов данных с ближней корреляцией с s = 125 и 250, полученных с помощью регрессионного анализа ФФ отдельных реализаций в интервале 2000 s 8000 .

Из рис. 2.3(c,e) видно, что положение центра выборочной ПРВ оказывается смещенным относительно истинного значения H = 0.5 для некоррелированных данных, вследствие влияния кроссовера. Напротив, из рис. 2.3(d,f) видно, что метод WTA дает практически несмещенные оценки в Очевидно, что для больших значений s смещение оценки возрастает. Таким образом, следует отметить, что при выборе интервала аппроксимации следует предварительно проверить линейность функции log F (s) log s в этом интервале, а при несоответствии указанной зависимости линейной модели отклонять гипотезу о монофрактальном характере дальней корреляции исследуемого ряда, хотя в этом случае конкретный характер зависимости не всегда может быть определен .

В качестве еще одного близкого к практическому приложению примера рассмотрим модель ряда данных с ближней корреляцией, представленную в виде суперпозиции трех рядов, сформированных с помощью АР1 фильтров с постоянными времени s1 = 3, s2 = 21 и s3 = 500, предложенную в работе [124] при аппроксимации эмпирических ФФ длительных флуктуаций температуры воздуха .

На рис. 2.4(a,b) приведены соответствующие ФФ, полученные с использованием методов DFA и WTA. Следует отметить, что в этом случае, по сравнению с ранее рассмотренным АР1 рядом, ввиду малого веса составляющей с максимальным интервалом корреляции s3 = 500 (A3 0.1), кроссовер оказывается менее растянутым, и можно утверждать, что = 0.5 при больших значениях s, при использовании любого из методов, хотя метод WTA дает более протяженный участок с = 0.5. Также из рис. 2.4(c,d) видно, что оценки, полученные по отдельным ре

–  –  –

Рисунок 2.4 — (a,b) Флуктуационные функции суммы трех рядов данных с ближней корреляцией с интервалами корреляции s1 = 3, s2 = 21 и s3 = 500, полученные с использованием тех же методов, что и на рис .

2.2, усредненные по 210 реализациям размером L = 216 каждая. Для сравнения штриховыми линиями показан наклон теоретической ФФ с H = 0.5. (c,d) Выборочные ПРВ распределения наклонов, полученных для отдельных реализаций суммы трех рядов данных с ближней корреляцией (a,b), полученных теми же методами и для тех же параметров, что и на рис. 2.2 .

Таблица 1 — Средние значения и стандартные отклонения оценок наклонов ФФ

–  –  –

ализациям, оказываются несмещенными при использовании каждого из методов и локализуются в районе истинного асимптотического значения H = 0.5 .

Средние значения и стандартные отклонения рассмотренных выше оценок приведены в табл. 1 (результаты получены усреднением по 16000 реализаций) .

На рис. 2.5 показаны ФФ (a,b) и выборочные ПРВ обобщенных показателей Хёрста (c,d) для рядов данных с конечным интервалом корреляции s = 250, полученные с использованием MF-DFA (a,c) и MF-WTA (b,d) для различных моментов q. Из рисунка видно, что асимтотическое поведение ФФ практически не зависит от q, при этом незначительные колебания асимптотического наклона ФФ можно отнести на счет различной протяженности кроссоверов для различных моментов q. Для каждого из методов, средние значения асимптотического наклона ФФ для q = 1 оказываются несколько выше, чем для q = 5. Однако величина отклонения среднего в зависимости от момента q практически на порядок меньше стандартного отклонения разброса оценки H(q) для отдельных реализаций, что указывает на пренебрежимую малость этой зависимости при анализе отдельных реализаций (см. также рис. 2.5(e,f)) .

На рис. 2.6(a,b) показаны аналогичные ФФ, как и на рис. 2.5, но для ряда, содержащего суперпозицию ФГШ с дальней корреляцией с = 0.75 и ближней корреляции с s = 250, сформированного путем пропускания предварительно полученного ряда с дальней корреляцией через соответствующий линейный фильтр .

Как видно из рисунка, для обоих методов оценки ФФ для малых значений аргумента s s, ФФ имеют вид F (s) s1.75 = s0.75 s1.0, где первый множитель

–  –  –

Рисунок 2.5 — Флуктуационные функции (a,b); выборочные ПРВ (c,d); средние значения и стандартные отклонения обобщенных показателей Хёрста (e,f) для рядов данных с конечным интервалом корреляции s = 250, полученные с использованием MF-DFA (a,c) и MF-WTA (b,d) с q = 1 (), 2 () и 5 (), усредненные по 210 реализациям размера L = 216 каждая .

Для сравнения штриховыми линиями в (a,b) показана теоретическая ФФ для H = 1.5 .

–  –  –

Рисунок 2.6 — Флуктуационные функции (a,b); выборочные ПРВ (c,d); средние значения и стандартные отклонения обобщенных показателей Хёрста (e,f) для сценария суперпозиции ФГШ с дальней корреляцией с = 0 .

75 и ближней корреляции с s = 250, полученные с использованием MF-DFA и MF-WTA для q = 1 (), 2 () и 5 (), усредненные по 210 реализациям размера L = 216 каждая .

Для сравнения штриховой линией показана теоретическая ФФ для H = 1.75, а точечной линией – теоретическая ФФ для H = 0.75 .

определяется компонентом ФГШ с дальней корреляцией, а второй множитель отражает выраженную ближнюю корреляцию, близкую к сценарию локального интегрирования в окне. Для больших значений аргумента s s, F (s) s0.75 для обоих методов. Для MF-DFA (см. рис. 2.6(a)) асимптотическое поведение F (s) s0.75 достигается при s 50... 100 s, тогда как для MF-WTA асимптотический наклон можно определить уже при s 6... 10 s. Таким образом, ввиду меньшей протяженности кроссоверов, второй метод оказывается предпочтительнее при различении эффектов ближней и дальней корреляции или выявлении вклада соответствующих составляющих исследуемого ряда при конечном интервале наблюдения. В качестве типичных примеров рядов данных, где востребованы подобные исследования, можно привести длительные колебания гидрометеорологических показателей, таких, как температура воздуха, расход воды в реке и др .

На рис. 2.6(c,d) приведены распределения оценок обобщенных показателей Хёрста H(q) при регрессионном анализе логарифмированных ФФ в диапазоне 2000 s 8000. Из рисунка видно, что при использовании метода MF-DFA наблюдается их существенная переоценка (см. рис. 2.6(a) и (b)), тогда как MFWTA метод приводит к практически несмещенной оценке, сконцентрированной в районе теоретического значения H = 0.75 справедливого для больших значений аргумента s s. Зависимость от значения момента q, как и в предыдущем примере, может быть отмечена по результатам усреднения большого числа реализаций, однако пренебрежимо мала по сравнению со статистическим разбросом оценок, получаемых при анализе различных реализаций. В то же время, следует с осторожностью интерпретировать данные усреднения, т.к. из рис. 2.6(a,b) видно, что указанный разброс обусловлен преимущественно различным положением и протяженностью кроссоверов, нежели присутствием нелинейных статистических связей (см. также рис. 2.6(e,f)) .

Таким образом, на основе полученных результатов можно отметить, что данные с ближней корреляцией с экспоненциально затухающими АКФ, сформированные с использованием авторегрессионных фильтров, формируют растянутые кроссоверы, вследствие чего определение истинного вида асимптотических ФФ оказывается затруднено, причем указанный эффект в большей мере характерен для метода DFA. При автоматизированном применении рассмотренных методов указанные эффекты могут приводить к переоценке показателей Хёрста. При этом подобная переоценка значительно менее выражена в случаях, когда вес составляющей с максимальным интервалом корреляции оказывается небольшим, как, например, в модели, предложенной в работе [124] для моделирования длительных колебаний температуры воздуха, которые в современной литературе моделируются преимущественно рядами с дальней корреляцией. С другой стороны, при анализе отдельных реализаций рядов конечной длины DFA дает меньший разброс получаемых оценок, и в этом смысле оказывается предпочтительнее, чем WTA. При этом в присутствии эффектов ближней корреляции, за счет зависимости положения и протяженности кроссовера от момента q, определение асимптотического поведения может быть также затруднено и ошибочно трактовано как присутствие нелинейных статистических связей .

2.5 Эффекты ложной нелинейности при флуктуационном анализе рядов данных с дальней корреляцией В дальнейшем было предпринято исследование эффектов ложной нелинейности, возникающих при флуктуационном анализе рядов данных с дальней корреляцией. Для синтеза рядов данных с линейной дальней корреляцией, использовалась процедура линейной фильтрации фильтром с передаточной характеристикой K(f ) f (1)/2 [102; 105]. Сформированные таким образом ряды данных характеризуются степенным видом АКФ и СП на всем протяжении, с поправкой на эффекты дискретности и конечности выборки .

–  –  –

Во-первых, рассмотрим результаты мультифрактального анализа MF-DFA в присутствии аддитивного белого шума. Соответствующие исследования с обычным DFA (q = 2) подробно описаны в работе [125]. Данные формировались в соответствии с выражением yn = xn + Aun, (2.1)

–  –  –

Рисунок 2.7 — Анализ монофрактальных данных с аддитивным гауссовским белым шумом .

(a,c,e,g) ФФ Fq (s) for q = 5, 2,0,2,5 (снизу вверх), полученные методом MF-DFA2 для данных с дальней корреляцией и H = 0.8, с СКО аддитивного шума A. Исследовались ряды данных длиной 216 с последующим усреднением по 100 реализациям. (b,d,f,h) Оценки обобщенных показателей Хёрста h(q), полученные аппроксимацией ФФ между s = 103 и 104 .

где xn – отсчеты ряда данных с дальней корреляцией, un – отсчеты нормального белого шума (оба ряда характеризуются нулевым средним и единичной дисперсией), а множитель A определяет уровень шума. Оценка h(q) осуществляется путем аппроксимации Fq (s) степенным законом для каждого значения q методом наименьших квадратов d диапазоне между s = 103 и 104 для 100 реализаций данных длиной L = 216 .

На рис. 2.7 показаны флуктуационные функции Fq (s) (слева) и обобщенные показатели Херста h(q) (справа) для нескольких значений A. На рис. 2.7(a,b) F (s) и h(q), соответственно, для исходных данных. Из рис. 2.7(c,d) видно, что ожидаемый наклон h(q) = = 0.8 остается в пределах доверительного интервала при низком уровне аддитивного шума A = 0.1, и, следовательно, нет статистически значимого изменения зависимости h(q) от q .

При повышенных уровнях шума A = 1 и 10 (см. рис. 2.7(e,f) и рис. 2.7(g,h), соответственно), зависимость h(q) по-прежнему не является выраженной, при этом наблюдается ожидаемое снижение показателя Хёрста с ростом уровня шума, и при A = 10 он слабо отличается от H = 1/2, характеризующей случайные некоррелированные данные. Это связано с сдвигом положения точки перегиба (кроссовера) между h(q) = 1 = 0.5 для малых значений аргумента s (характеризующих некоррелированные данные un ) и h(q) = 2 = 0.8 для больших значений аргумента s (характеризующих данные с дальней корреляцией xn ). В то время как точка перегиба лежит в области более малых значений, нежели используемый интервал аппроксимации для A = 0.1 (см. рис. 2.7(c,d)), она приближается к нижней интервала аппроксимации 103 для A = 1 ( см. рис. 2.7(e,f)) и даже достигает его верхней границы 104 при A = 10 (рис. 2.7(g,h)). При этом из рисунка следует, что положение точки перегиба не зависит от q. Полученный результат позволяет экстраполировать аналитические вычисления, представленные в приложении B к работе [125] (см. также [126]) для случая q = 2, на произвольные значения q .

Следует отметить, что аналогичные протяженные переходные режимы были отмечены при исследованиях данных с дальними взаимными корреляциями (см. [127]), с использованием метода расчётного кросс-корреляционного анализа (DCCA), предложенного в [128]. Некоторые аспекты воздействия шума на ряды данных с дальней корреляцией рассматривались также в работах [103; 129] .

–  –  –

Рисунок 2.8 — Результаты исследования монофрактальных рядов данных в присутствии дополнительной (по отношению к самоподобной модели ряда) ближней корреляции: (a) флуктуационные функции Fq (s) для q = 5, 2,0,2,5 (снизу вверх) и (b) обобщенные показатели Хёрста h(q) для рядов, сформированных с помощью АР1 фильтра с s = 30 .

(c,d) Как и в (a,b), но для монофрактальных данных c H = 0.8, пропущенных через АР1 фильтр .

2.5.2 Влияние эффектов ближней корреляции

Рассмотрим результаты аналогичного анализа в присутствии в исследуемом ряде данных с самоподобными свойствами, определяемыми эффектами дальней корреляции, дополнительных эффектов ближней корреляции, введенных с использованием авторегрессионного фильтра, описываемого уравнением авторегрессии первого порядка (AР1)

–  –  –

Здесь xn – это сгенерированный ряд AР1, a1 - параметр модели, а un – входная последовательность, состоящая из независимых и одинаково распределенных случайных отсчетов, как правило, с нулевым средним значением и единичной дисперсией. Как было отмечено выше, такой ряд характеризуется конечным интервалов корреляции s = 1/| ln(a1 )|. Уравнения ARp более высоких порядков приводят к суперпозиции эффектов ближней корреляции с разными постоянными времени s .

На рис. 2.8(a,b) приведены обобщенные флуктуационные функции Fq (s) и обобщенные показатели Херста h(q) для ряда данных, сформированного с помощью AР1 с s = 30. При использовании авторегрессионной фильтрации на ФФ наблюдается растянутый кроссовер, локализация которого в масштабах аргумента s затруднена, что нередко приводит, как было показано выше, к затруднениям при различении между эффектами ближней и дальней корреляции. Поскольку в AР-фильтре с параметром a1, близким к 1, происходит ограниченное интегрирование данных, для малых значений аргумента s показатель h(q) увеличивается по сравнению с исходным для ряда un на единицу и, следовательно, h(q) = 1.5. На рисунке показано, что зависимость положения кроссовера от момента q приводит к появлению зоны паразитной зависимости h(q) от q, что может быть ложно интерпретировано в терминах мультифрактальности и (ошибочно) связано с присутствием нелинейных статистических связей в анализируемом ряде данных (см .

рис. 2.8(b)) .

На рис. 2.8(c,d) приведены аналогичные результаты для рядов данных, созданных в результате AР-фильтрации, где в качестве входного ряда un использовался ряд данных с дальней корреляцией с h(2) = 0.8. Поэтому при малых значениях аргумента в результате интегрирования ожидается h(q) = 1.8, а при больших значениях аргумента h(q) = 0.8. Как и в предыдущем примере, зависимость положения кроссовера от момента q приводит к паразитной мультифрактальности, которая наблюдается на рис. 2.8(d), где h(q) существенно зависит от q. При очень больших значениях q можно наблюдать корректное значение h(q) = 0.8, т.к. зона перегиба (кроссовера) смещается к малым значениям аргумента с ростом q .

2.5.3 Эффект аддитивных периодических составляющих На рисунке 2.9 приведены обобщенные флуктуационные функции и оценки обобщенных показателей Хёрста h(q) для рядов данных с дальней корреляцией с

–  –  –

Рисунок 2.9 — Результаты анализа монофрактальных данных с аддитивной периодической составляющей .

Слева: флуктуационные функции Fq (s) для q = 5, 2,0,2,5 (снизу вверх) для рядов данных с дальней корреляцией с H = 0.8 с аддитивной периодической составляющей A sin(2n/s ) с различными амплитудами A и периодами T. Статистики получены для рядов длиной 216 и усреднены по 100 реализациям. Справа: соответствующие обобщенные показатели Хёрста h(q), оцененные по ФФ в диапазоне 103 s 104 .

нулевым средним и единичной дисперсией, характезирующихся h(2) = 0.8 с аддитивными периодическими составляющими, моделируемыми гармоническими функциями yn = xn + A sin(2n/T ), (2.3) где xn – исходный анализируемый ряд. Для сравнения приведен простейший случай A = 0, соответствующий рис. 2.7(a,b). На рис. 2.9(a,b) приведены результаты для слабоговыраженного цикла с A = 0,1. Из рисунка видно, что результаты принципиально не изменяются по сравнению с исходным рядом данных .

На рис. 2.9(c,d) приведены аналогичные результаты, но с 10-кратно большей амплитудой периодической составляющей (A = 1), который теперь равен стандартному отклонению флуктуационной составляющей с дальней корреляцией. Теперь можно наблюдать ярко выраженный экстремум во флуктуационных функциях для всех моментов q, начало которого примерно соответствует периоду гармонической составляющей T, влияние которого проявляется по крайней мере в пределах последующих 1.5 порядков, если смотреть по возрастанию аргумента s (см. рис. 2.9(c)). Следовательно, оцененные обобщенные показатели Хёрста h(q) сильно искажены за счет присутствия периодической составляющей по сравнению с результатами, полученными для исходных рядов данных с дальней корреляцией. Прямое применение аппроксимации в выбранном едином диапазоне для всех моментов q в этом случае может привести даже к эффекту обратной мультифрактальности, когда H(q) растет с ростом q, что нетипично для известных примеров естественных процессов с нелинейной дальней корреляцией и известных мультифрактальных моделей .

На рис. 2.9(e,f) показаны аналогичные результаты для той же амплитуды периодической составляющей A = 1.0, но теперь с периодом T = 530000, что соответствует представлению годового цикла при минутном временном разрешении. Примером такого рода данных являются результаты длительного наблюдения динамики осадков с высоким временным разрешением. В данном случае MFDFA2 успешно устраняет влияние медленно изменяющейся периодической составляющей, т.к. используемая квадратичная аппроксимация для кумулятивной суммы или линейная для исходных данных позволяет достаточно точно описать короткий фрагмент гармонического колебания. При этом практически не проявляется эффект паразитной мультифрактальности. При этом следует отметить, что методы, не устраняющие фоновые тренды, как анализ функции разбиения [102] или обобщенная автокорреляционная функция высокого порядка [112] неизбежно приведут к появлению паразитной мультифрактальности в этом случае. Некоторые аспекты, связанные с влиянием периодических составляющих на результаты MF-DFA, также рассмотрены в работе [130] .

Следует отметить, что на практике, по крайней мере в геофизических, гидрологических и метеорологических приложениях, данные низкого разрешения (ежесуточные или ежемесячные) динамики тех или иных показателей, как правило, доступны в течение многих лет, тогда как данные с высоким временным разрешением часто доступны только за последнее время, или вовсе только для отдельных интервалов наблюдений, зачастую значительно меньших одного годового цикла. При этом если в первом случае годовой цикл может быть подробно исследован на основании усреднения данных многолетних наблюдений и аппроксимирован той или иной детерминистической моделью, например, в виде повторяющегося цикла сложной формы, и таким образом отделен от флуктуационной составляющей, во втором случае это невозможно в силу недостаточности исходных данных. Поэтому в этом случае целесообразно применять методы, позволяющие исключить фоновые медленные изменения, к каковым относится, например, MF-DFA .

2.6 Искажение структуры нелинейной дальней корреляции в присутствии регулярных колебаний и шумов С целью исследования искажений структуры нелинейной дальней корреляции в присутствии регулярных составляющих и шумов, рассмотрим данные с мультифрактальными свойствами, содержащие нелинейные дальние корреляции. В этом разделе рассмотрим данные, сформированные с использованием модели мультипликативного каскада (MRC) со случайными множителями [39; 102;

131; 132]. Популярность данной модели обусловлена ее широким применением при описании флуктуаций в сложных системах различной физической природы [8; 9; 11; 14; 39]. Данная модель была подробно рассмотрена в предыдущих подразделах этой главы .

Поскольку h(q) зависит как от вида распределения данных, так и от их корреляционной структуры [113], в дальнейшем рассматривается два сценария .

Во-первых, анализируется влияние аддитивных составляющих, представленных данными типа белого шума, рядов с ближней корреляцией и периодических составляющих. В дальнейшем, исследуются исключительно эффекты, связанные с корреляционной структурой рядов данных. Чтобы устранить влияние широкого (лог-нормального) распределения и определить вклад нелинейных составляющих в h(q), использована процедура поранговой замены значений ряда отсчетами из ряда аналогичной длины, но с нормальным распределением [39;105]. Таким образом, распределение данных заменено на гауссовское, поэтому отклонения зависимости h(q) от h(2) в данном случае зависят только от нелинейных статистических связей, и могут быть использованы для их характеристики [39] .

2.6.1 Эффекты аддитивного белого шума

На рис. 2.10(a,b) приведены результаты флуктуационного анализа исходных мультифрактальных данных без аддитивного белого шума. Здесь h(q) убывает с увеличением q, демонстрируя выраженное мультифрактальное поведение. Рисунки 2.10(c,d) и (e,f) показывают аналогичные результаты для записей с аддитивным белым шумом уровней A = 0.1, 1.0 и 10, соответственно. По определению, при q = 2 результаты остаются неизменными и h(2) = 0.5, так как линейно некоррелированный ряд xn добавляется к другому линейно некоррелированному ряду un, что приводит к отсутствию линейной корреляции в результирующем наборе данных yn .

Более тщательная проверка показывает, что уже при A = 0,1 для q 2, h(q) значительно недооценивается, по сравнению с исходными данными, и этот эффект становится еще более выраженным при A = 1. Напротив, искажения практически незаметны при q 2. Это можно объяснить тем, что флуктуации для больших положительных моментов q связаны в основном с выбросами данных, которые в относительном выражении менее подвержены действию шума, и поэтому для больших положительных моментов q ФФ остаются почти неискаженными. Напротив, отрицательные моменты подчеркивают динамику относительно

–  –  –

Рисунок 2.10 — Результаты анализа мультифрактальных данных с аддитивным белым шумом .

(a) ФФ Fq (s) для q = 5, 2,0,2,5 (снизу вверх) для мультифрактальных данных с нулевым средним и единичной дисперсией. (b) Обобщенные показатели Хёрста h(q) с доверительными интервалами, оцененные по ФФ в диапазоне от s = 103 до 104. (c-h) как и для (a,b) но с аддитивным белым шумом с (c,d) A = 0.1, (e,f) c A = 1 и (g,h) c A = 10. Оценки получены для рядов данных длиной 216 с усреднением по 100 реализациям .

слабых колебаний, которые в рассматриваемом случае оказываются в пределах уровня шума, и, следовательно, зависимость h(q) от q в значительной степени нивелируется для отрицательных моментов. Из рис. 2.10(g,h) видно, что при очень выраженном (A = 10) шуме, как и ожидалось, h(q) 0,5 для всех q .

На рис. 2.11 приведены аналогичные результаты для мультифрактальных данных после процедуры поранговой замены отсчетов значениями, взятыми из нормально распределенных данных той же длительности [39;105]. В дальнейшем, как и в рассмотренных выше примерах, производилось добавление нормального белого шума к полученному ряду данных. Из рисунка видно, что при отсутствии зависимости от вида распределения h(q) от q, h(q) остаются почти неискаженными при A = 0,1, за исключением очень больших по абсолютной величине отрицательных моментов q. С увеличением уровня шума мультифрактальность уменьшается и почти исчезает при A = 10, где не наблюдается четкой зависимости h(q) от q .

2.6.2 Влияние дополнительной ближней корреляции

На рис. 2.12 приведены аналогичные результаты, как и в предыдущем подразделе, но вместо аддитивного шума un теперь рассматривается ряд данных с ближней корреляцией, созданный с использованием AР1-фильтра (2.2), с интервалом корреляции s = 30. На рисунке показано, что F (s) демонстрируют выраженные перегибы при малых значениях аргумента s. Также из рисунка видно, что с увеличением веса составляющей с ближней корреляцией в системе h(q) существенно искажается для малых и отрицательных моментов q 2 (уже при A = 0,1), а при больших уровнях шума A = 1 и 10 также и для больших значений моментов q 2 .

На рис. 2.13 приведены аналогичные результаты, но для мультифрактальных данных с гауссовским распределением. Из рисунка видно, что h(q) для малых значений моментов q 2 еще более недооценены, чем в предыдущем случае, так, что этот эффект отмечается уже при A = 0.1. Как и прежде, при больших уровнях шума (A = 1 и 10), мультифрактальность почти исчезает .

–  –  –

Рисунок 2.11 — Аналогичен рис .

2.10, но для мультифрактальных рядов данных, в которых отсчеты были заменены на нормально распределенные методом поранговой замены. Оценки получены для рядов данных длиной 216 с усреднением по 100 реализациям .

–  –  –

Рисунок 2.12 — Результаты анализа мультифрактальных данных с аддитивной составляющей, обладающей ближней корреляцией .

ФФ Fq (s) для q = 5, 2,0,2,5 (снизу вверх) для мультифрактальных рядов данных с нулевым средним и единичной дисперсией с аддитивной составляющей, обладающей ближней корреляцией (a) с A = 0.1, (с) с A = 1 и (е) с A = 10. (b) Оценки обобщенных показателей Хёрста h(q), полученные в диапазоне от s = 103 до

104. Оценки получены для рядов данных длиной 216 с усреднением по 100 реализациям .

–  –  –

Рисунок 2.14 — Результаты анализа мультифрактальных данных с аддитивной периодической составляющей .

Слева: ФФ Fq (s) for q = 5, 2,0,2,5 (снизу вверх) для данных, сформированных с использованием модели MRC с последующим добавлением аддитивной периодической составляющей (A sin(2n/T ). Справа: оценки соответствующих обобщенных показателей Хёрста h(q). Оценки получены для рядов данных длиной 216 с усреднением по 100 реализациям .

2.6.3 Влияние аддитивных периодических составляющих

Наконец, рассмотрим влияние аддитивных гармонических составляющих на результаты флуктуационного анализа рядов мультифрактальных данных. На рис. 2.14(a,b) и (c,d) приведены F (s) и h(q) для рядов данных с аддитивной гармонической составляющей с периодом T = 365 и амплитудами A = 0.1 и 1, соответственно. На рисунке показано, что уже при A = 0,1 результаты флуктуационного анализа для малых моментов q 2 оказываются существенно занижены. Этот эффект усиливается с увеличением амплитуды периодической составляющей .

–  –  –

Рисунок 2.15 — Аналогичен рис .

2.14 но для мультифрактальных рядов данных, отсчеты которых были порангово заменены гауссовскими отсчетами. Оценки получены для рядов данных длиной 216 с усреднением по 100 реализациям .

Также рассмотрим аналогичный случай для данных высокого разрешения, когда период гармонической составляющей T = 530000, что соответствует полному периоду годового цикла при анализе данных минутного разрешения (см .

рис. 2.9(g,h)). Как и в рассмотренном выше подобном случае, поскольку тренд можно считать приближенно линейным в рассматриваемом временном окне, не наблюдается существенных различий по сравнению с результатами для оригинальных мультифрактальных рядов данных, показанных на рис. 2.9(a, b). Только большие отрицательные моменты оказываются несколько недооценены, как видно из рисунка. Аналогичные выводы можно сделать из анализа мультифрактальных данных с гауссовским распределением, наблюдаемым на фоне годового цикла (см. рис. 2.15) .

<

2.7 Выводы по главе 2

По результатам комплексного исследования численных методов анализа флуктуационного поведения рядов данных, выполненного методом математического моделирования с использованием известных моделей флуктуационного поведения систем с дальней корреляцией, так и типичных искажений, отражающих условиях их наблюдения, можно сделать следующие выводы .

1. Предложен вариант обобщения модели мультипликативного каскада за счет введения случайных множителей, свободный от ряда недостатков рассмотренных ранее модификаций аналогичной модели с фиксированными множителями, связанных с квантованностью по уровню формируемых реализаций, и за счет гибкого управления видом и параметрами распределения множителей позволяет использовать его для моделирования более широкого класса стохастических систем с дальней корреляцией. При этом ограничения по использованию данной модели, связанные с отсутствием ее полного аналитического описания, были первоначально преодолены за счет использования соответствующих асимптотических численных оценок, которые в дальнейшем подтвердились по результатам аналитических исследований обобщенной модели удароподобных сигналов на основе мультипликативного каскада Р.Р. Нигматуллиным и соавторами [122] .

2. По результатам математического моделирования получены количественные оценки эффективности методов флуктуационного анализа DFA и WTA, на основании которых подтверждена возможность их применения для параметризации математических моделей рядов данных с дальней корреляцией, наблюдаемых на фоне трендов и/или регулярных периодических составляющих. При этом на практике при использовании выборочных рядов данных, наряду со значительным разбросом получаемых оценок, наблюдаются эффекты как имитации, так и маскирования дальней корреляции. Указанные эффекты накладывают ряд ограничений на точность оценок, получаемых с использованием рассмотренных методов флуктуационного анализа, в особенности при анализе коротких фрагментов рядов данных .

3. Результаты проведенного математического моделирования показывают, что даже при использовании методов, выделяющих флуктуационное поведение системы на фоне трендов, структура дальней корреляции в рядах данных подвержена существенным искажениям при их наблюдении в присутствии артефактов, связанных с появлением фоновых кратковременных трендов, периодических и/или шумовых составляющих в данных эмпирических наблюдений, что является типичным для наблюдения реальных процессов в живой и неживой природе .

Наряду с этим, уширение распределения обобщенных показателей Хёрста h(q) может возникать как в силу распределения анализируемых данных с тяжелыми хвостами (РТХ), так и в силу присутствия нелинейной памяти в системе, и разделение этих эффектов только на основе данных флуктуационного анализа является затруднительным. Для нивелирования эффекта РТХ в некоторых случаях может быть использована процедура поранговой замены отсчетов на значения, взятые из гауссовского распределения, однако следует учитывать, что подобная замена также вносит искажения в корреляционные свойства ряда .

4. Следует отметить, что при использовании методов флуктуационного анализа для оценки аномальных состояний исследуемых систем доступна только косвенная оценка закономерностей, определяющих динамику сильных и слабых флуктуаций за счет вычисления флуктуационных функций различных порядков, что может выступать в качестве некоторого приближения и не позволяет в полной мере охарактеризовать закономерности, связанные с возникновением аномальных состояний исследуемых систем .

5. Вышеуказанные ограничения обуславливают актуальность поиска альтернативных способов анализа и математического моделирования рядов данных с дальней корреляцией, которые были бы более удобны для практического анализа аномального поведения сложных саморегулирующихся систем различной физической природы в различных прикладных областях. Одной из возможных альтернатив является переход от анализа и моделирования флуктуационного поведения системы в целом к анализу потоков событий, характеризующих аномальные состояния системы. Этот подход развивается в третьей и четвертой главах, а его использование для статистического анализа и моделирования данных длительных наблюдений динамики сложных систем различной физической природы рассматривается в пятой и шестой главах диссертационной работы .

Глава 3 . Математическое моделирование и численные методы анализа потоков событий с дальней корреляцией Настоящая глава занимает центральное место в теоретической части диссертационной работы .

Как уже было отмечено выше, при попытке построения как структурных, так и феноменологических моделей сложных систем различной физической природы, возникает ряд трудностей, связанных как с недостаточным пониманием внутренних механизмов такой системы, так и с неоднородностью структуры порождаемых такими системами случайных процессов (рядов данных) в различных режимах функционирования. Также часто ограничивают возможности построения адекватных моделей технические аспекты, связанные со значительной вычислительной сложностью описания поведения больших систем, а также недостаточная полнота и/или достоверность информации о поведении системы, в том числе в силу измерительных погрешностей .

При этом для решения целого ряда практических задач полная информация о поведении системы оказывается, с одной стороны, труднодоступной, с другой стороны, часто остается невостребованной. Например, при анализе аномальных состояний системы и оценке сопутствующих им рисков исследователю было бы достаточно знать только те характеристики системы, которые связаны с возникновением и развитием таких состояний. При этом одной из возможных альтернатив подходу на основе моделирования флуктуационного поведения системы в целом может послужить переход к моделям потоков событий, связанных с появлением интересующих исследователя состояний системы, например, аномалий, выбросов, нарушений регулярности ритмов и так далее. Достоинством такого подхода является, наряду с его относительной простотой, ограниченный объем данных, который требуется для параметризации таких моделей. Например, при исследовании долговременной динамики геофизических систем на практике исследователю часто бывают доступны исторические данные о событиях, связанных с аномальными явлениями: наводнениями, землетрясениями, извержениями вулканов, температурными аномалиями, включая исторические периоды времени, когда не проводилось систематического ежесуточного (или с более высоким временным разрешением) мониторинга данных состава и температуры воздуха, количества осадков, расхода воды в реках или сейсмической активности [22; 23] .

При этом предыстория событий может быть использована как для построения, так и для верификации модели потока событий, даже в условиях отсутствия адекватной динамической модели поведения всей системы за длительный период времени. Реализация предложенного подхода для обширного класса саморегулирующихся стохастических систем неразрывно связана с установлением статистических взаимосвязей между проявлениями эффектов дальней корреляции в таких системах и свойствами случайных потоков, характеризующих события, связанные с аномальными состояниями таких систем. Установлению таких взаимосвязей, а также проверке их адекватности применительно к эмпирическим данным длительного мониторинга сложных стохастических систем различной физической природы, посвящена настоящая и последующие главы диссертационной работы .

Таким образом, предлагается и осуществляется переход от моделирования флуктуационного поведения сложной системы в целом, к моделированию потоков событий, характеризующих возникновение аномальных состояний сложных стохастических систем. Присутствие эффектов дальней корреляции существенным образом изменяет поведение анализируемых систем, включая качественно иное асимптотическое поведение большинства статистических характеристик потока событий. Поэтому в данной главе вводятся основные статистические характеристики такого потока событий, приводятся их аналитические и численные оценки для рассмотренных ранее классов математических моделей систем с линейной и нелинейной дальней корреляцией. При этом особое внимание уделяется установлению взаимосвязей между эффектами дальней корреляции и их проявлением в свойствах потока событий, связанных с возникновением аномальных состояний системы. Рассматриваются оценки вероятности аномальных событий и управления рисками, связанными с их возникновением, предлагаются конкретные алгоритмы их аналитического и численного оценивания .

3.1 Математическое моделирование потоков интервалов между выбросами рядов данных с дальней корреляцией В контексте анализа динамических систем под аномальными событиями будем понимать выбросы за уровень Q случайных процессов (или рядов данных), порождаемых такой системой, и характеризующих ее состояние. При рассмотрении выбросов непрерывных случайных процессов поток выбросов характеризуется интервалами между отдельными выбросами и длительностями выбросов. В данной работе остановимся на характеристиках интервалов между отдельными выбросами, по следующим причинам. Во-первых, объектом исследования в данной работе являются дискретные ряды измеренных значений тех или иных случайных процессов, на основании которых невозможно оценить истинную длительность превышения порога. Во-вторых, статистические свойства значительной части исследуемых процессов таковы, что значительная часть выбросов, будет иметь единичную длительность, с точностью до дискретности доступных эмпрических рядов данных. В-третьих, во многих рассматриваемых случаях определение длительности выброса в таких рядах не имеет под собой очевидного физического смысла с учетом их исходной дискретности. Характерными примерами являются анализ флуктуаций максимальных или среднесуточных температур воздуха, посуточной интенсивности осадков, суточных возвратов инвестиций и т.п .

На практике, в условиях доступности только дискретных рядов данных, невозможно установить, опускалась ли температура воздуха в промежутках между максимальными значениями ниже интересующих исследователя порогов, прекращались ли осадки на протяжении нескольких суток, когда доступны данные только об их интегральном количества за сутки, и так далее .

По указанным выше причинам в контексте данного исследования поток событий характеризуется последовательностью интервалов между отдельными дискретными выбросами. При этом интервал между двумя последовательными отсчетами, оба из которых превысили установленный порог Q, рассматривается как единичный интервал между двумя отдельными выбросами. В рамках выбранных для анализа характеристик, если все же возникает необходимость анализа длительности выбросов некоторого процесса на основании анализа его дискретизированного ряда свыше порога Q, которому соответствует средний интервал между выбросами RQ, можно заменить его рассмотрением эквивалентных интервалов между выбросами инветированного исходного ряда данных свыше порога Q, которому соответствует средний интервал между выбросами RQ = 1 + 1/RQ .

Учитывая, что многие из рассматриваемых моделей (ФГШ, MRW, MRC с симметричным распределением множителей), а также некоторые эмпирические ряды данных (напр., возвраты инвестиций), обладают внутренней симметрией, оказывается достаточным получить оценки для исходного ряда, которые затем можно экстраполировать также и на инвертированный ряд. В иных случаях, даже когда симметрии на уровне флуктуационного поведения системы в целом не наблюдается, по данным эмпирических исследований оказывается, что выбросы для аномально больших значений RQ 1 и аномально малых значений RQ 1 нередко характеризуются одинаковыми статистическими закономерностями, что будет отмечено в соответствующих главах, посвященных анализу эмпирических закономерностей в системах с дальней корреляцией различной физической природы .

В дальнейшем рассматривается формирование и анализ статистических характеристик рядов интервалов ri между событиями, определяемыми последовательными превышениями порогов Q рядом с дальней корреляцией (см. рис. 3.1) .

Приводятся статистические характеристики асимптотического поведения, которые по возможности опираются на аналитические оценки. При этом как при наличии, так и в отсутствии аналитических оценок выполняется вычислительный эксперимент, результаты которого сравниваются с имеющимися аналитическими оценками при их наличии. Подробности методики проведения вычислительного эксперимента кратко обобщены ниже в разделе 3.3 .

В дальнейшем при исследовании влияния корреляционных свойств ряда на статистические характеристики его выбросов, в качестве нулевой гипотезы рассмотрим простейший случай системы без памяти, порождаемые которой дискретные ряды отсчетов характеризуются статистически независимыми интервалами повторения выбросов, имеющими ПРВ вида PQ (r) = (1/RQ )(1 1/RQ )r1, где RQ – средний интервал повторения события. Асимптотически, для больших RQ,

–  –  –

Для выбросов стационарного случайного процесса свыше заданного порога Q, RQ можно получить из уравнения I/RQ = Q P (x), где I – единичный временной интервал, P (x) - ПРВ анализируемых данных. Важным свойством данной ПРВ яв

–  –  –

ляется ее масштабируемость при выражении через средний интервал повторения выбросов RQ, что позволяет однозначно описать ПРВ при единственном известном параметре RQ. Как видно из рис. 3.2(а), 3.3(а) и 3.4(а), результаты численного моделирования методом Монте-Карло согласуются с теоретическим выражением (3.1) .

Для систем с памятью в общем виде задача отыскания вида распределения интервалов между выбросами и длительностей выборосов (в классической постановке, для непрерывных случайных процессов) рассматривалась в ряде работ, начиная с 1950-х годов. Среди классических работ в этом направлении следует отметить работы П.И. Кузнецова, Р.Л. Стратоновича и В.И. Тихонова [133–137], впоследствии обобщенные и развитые в серии работ В.И. Тихонова и В.И. Хименко [32–34]. В этих работах статистики пересечения уровней представляются через совместные ПРВ процесса и его производной в каждый момент времени .

Полученные точные решения общего вида для процессов с памятью хорошо подходят для анализа марковских процессов и кратковременного прогнозирования выбросов на их основе, однако попытки их обобщения на случай немарковских моделей случайных процессов приводят к тому, что соответствующие выражения становятся чрезвычайно громоздкими и вычислительно трудными, а для случая моделей с дальней корреляцией и вовсе бесконенчномерными, что не позволяет получить на их основе аналитические соотношения для интересующего класса случайных процессов. Предложенные в этой же серии работ приближенные реРисунок 3.2 — Вид ПРВ интервалов между выбросами синтезированных рядов данных с линейной (а-в) и нелинейной (г-е) дальней корреляцией. Отдельными символами приведены численные оценки для RQ = 10 (), 70 () и 500 () по данным математического моделирования методом Монте-Карло по N = 150 реализациям длиной L = 221, штриховые линии соответствуют аналитическим выражениям согласно (3.1), (3.2) и (3.4) до приведения к единицам среднего интервала [64] Рисунок 3.3 — Вид ПРВ интервалов между выбросами синтезированных рядов данных с линейной (а-в) и нелинейной (г-е) дальней корреляцией. Отдельными символами приведены численные оценки для RQ = 10 (), 70 () и 500 () по данным математического моделирования методом Монте-Карло по N = 150 реализациям длиной L = 221, штриховые линии соответствуют аналитическим выражениям согласно (3.1), (3.2) и (3.4) после приведения к единицам среднего интервала [64] шения для дискретных рядов, образующихся при замене исходных непрерывных случайных процессов сериями опорных импульсов, также сталкиваются с аналогичными затруднениями при больших значениях r, что отмечается, в частности, в работах [138; 139] .

Отдельные аналитические соотношения были получены для моделей рядов с линейной дальней корреляцией типа ФГШ, для которых асимптотический вид ПРВ описывается растянутой экспоненциальной функцией ln PQ (r) (r/RQ ) (полученная первоначально в работе [35] асимптотическая оценка верхней границы распределения была впоследствии подтверждена в серии численных экспериментов). Примечательно, что, как и для систем без памяти, этот результат также

–  –  –

Для рядов с нелинейной дальней корреляцией на примере рассмотренной в главе 2 модели мультипликативного каскада со случайными множителями характерен степенной вид ПРВ интервалов между выбросами [39]

–  –  –

скорость убывания которого уменьшается логарифмически с ростом RQ (рис. 3.4(г)) и с добавлением линейной составляющей дальней корреляции, характеризующейся ростом H2 (рис. 3.4(д,е)) [39–41; 47]. Как видно из рис. 3.2(г-е), 3.3(г-е) и 3.4(г-е), приведенные выражения согласуются с результатами численного моделирования методом Монте-Карло .

–  –  –

Рисунок 3.4 — Вид ПРВ интервалов между выбросами синтезированных рядов данных с линейной (а-в) и нелинейной (г-е) дальней корреляцией .

Отдельными символами приведены численные оценки для RQ = 10 (), 70 () и 500 () по данным математического моделирования методом Монте-Карло по N = 150 реализациям длиной L = 221, штриховые линии соответствуют аналитическим выражениям согласно (3.1), (3.2) и (3.4). Для раздельного визуального восприятия результаты для RQ = 70 и 500 смещены вниз на одну и две декады, соответственно [64] Следует отметить, что полученные независимо совсем недавно результаты для обобщенной модели удароподобных сигналов на основе мультипликативного каскада [122] согласуются с выражениями 3.2 и 3.4 в части асимптотического вида ПРВ и уточняют их в части лог-периодических осцилляций, обусловленных использованием математической модели на основе дискретной каскадной структуры [143] .

Указанные выше результаты справедливы для стационарных рядов данных .

В условиях нестационарной динамики ряда представляется целесообразным альтернативный подход, в рамках которого ряд разбивается на отдельные сегменты длительностью Lseg, в пределах которых его можно приближенно считать стационарным, и общий анализируется как последовательность таких стационарных сегментов. При принятии всех постулированных выше допущений распределение произвольных статистических характеристик составного потока, в том числе и интервалов между выбросами, может быть определено согласно формуле полной вероятности PQ (r) = P ()P (r|)d, (3.5) где параметр характеризует интенсивность флуктуаций ряда в каждом сегменте .

В качестве следующего допущения, при достаточно мелкомасштабном разбиении ряд данных в пределах одного сегмента можно считать не только стационарным, но и однородным, т. е. описываемым одной математической моделью. Наконец, дальнейшее упрощение модели составного потока связано с предположением о пуассоновском характере потока в пределах одного короткого сегмента .

В рамках такой модели для оценки асимптотического вида статистических характеристик потока выбросов удобно вынести эффекты дальней корреляции во флуктуации интенсивности, что справедливо как для стационарных, так и нестационарных сценариев. При этом для малых значений аргумента r (по отношению как к среднему интервалу повторения выброса RQ, так и длине одиночного сегмента Lseg ) справедливы соотношения для рядов без памяти, тогда как для больших значений r – соотношения для модели, которой описывается ряд интенсивностей. Для некоторых видов распределений интенсивности, сходящихся к нормальному, в частности, для 2 -распределения, можно воспользоваться известным приближенным результатом, согласно которому PQ (r) асимптотически ведет себя как q-экспоненциальное распределение [144–146]

–  –  –

где b и C – масштабный и нормировочный коэффициенты, выбор которых подробно обсуждается при практическом применении данного подхода при моделировании конкретных систем в главах 5 и 6. Полученное в результате распределение PQ (r) в зарубежной литературе часто называют маргинальным (marginal) распределением .

Рассмотрим более общее решение, учитывающее не только асимптотическое поведение, но и промежуточные значения, для более обширного класса распределений. В пределах следующего вывода для упрощения выражений и избежания использования множественной индексации временно опустим из записи признак уровня Q и рассмотрим ряд интервалов ri между некоторым способом заданными событиями, где выбросы за уровень Q являются одним из примеров такого способа, и их распределение интервалов P (r). Разобьем интервал анализа на Nseg = N /]Lseg [ отдельных неперекрывающихся сегментов длиной Lseg, = 1,..., Nseg, где N – общее число единичных дискретов времени I на интервале анализа и ]... [ – оператор взятия целой части. Примем в качестве допущения, что появление событий случайно в пределах каждого из Nseg сегментов, а их общее количество на сегмент задается переменной величиной n, где – номер сегмента. Тогда для произвольного сегмента средний интервал между появлением событий оказывается равным r = Lseg /n, а вероятность P (r) появления интервала длины r может быть записана в виде [58]

–  –  –

По результатам анализа эмпирических данных различной физической природы, распределение числа событий на сегмент P (n) чаще всего оказываются близким к нормальному распределению, см. напр. [55; 56; 146], однако такая модель противоречит теоретическому обоснованию, поскольку допускает отрицательные значения числа событий в пределах сегмента с ненулевой вероятностью .

В этой связи целесообразно перейти к неотрицательно определенной модели распределения, которое при большом числе степеней свободы сходится к гауссовскому. В дальнейшем остановимся на P (n), представленной -распределением P (n) = n exp(n), (3.14) () где () – -функция, – параметр формы, а – параметр сдвига. Указанная модель обобщает несколько более простых примеров, рассмотренных в литературе [144–146], в том числе биномиальное и 2 -распределения [56] .

Среднее значение -распределения определяется как n = /, а его дисперсия равна n = /2. Соответственно параметр формы может быть определен,

–  –  –

и, таким образом, он зависит только от коэффициента вариации = n / n, а параметр сдвига = / n для заданного параметра формы определяется только значением локального среднего n пределах сегмента длиной Lseg [56; 58] .

Таким образом, для всего интервала анализа имеем суперпозицию множества сегментов с локально экспоненциальными распределениями интервалов между событиями, характеризующимися локальными средними значениями r, которые обратно пропорциональны локальному количеству нуклеотидов n, которые, в свою очередь, обратно пропорциональны локальному нормированному “параметру интенсивности” и, таким образом, маргинальное распределение интервалов для всего интервала анализа может быть выражено на основе формулы полной вероятности. Полагая P (n) имеющим -распределение, нетрудно показать, что () также имеет -распределение () = 0 exp(0 ), ()

–  –  –

с параметрами q = 1 + 1/( + 2), b = ( + 2)/ и C = ( + 1)/2, что согласуется как с полученными ранее асимптотическими оценками, так и с результатами эмпирических исследований [53]. Возвращаясь к потокам выбросов случайных рядов за уровень Q, для которого известен средний интервал повторения RQ, не составляет затруднений перейти от приведенного выше выражения к записи в форме (3.6). Таким образом, точное выражение искомого маргинального распределения с асимптотически степенным поведением можно получить непосредственно на основе формулы полной вероятности и выразить в более простой форме (3.16), нежели q-экспоненциальное распределение [58] .

Для систем без памяти, рассматриваемых в качестве нулевой гипотезы, с которой в дальнейшем производится сравнение полученных результатов, интервалы повторения выбросов некоррелированы, см. рис. 3.5(a). Для систем с линейной дальней корреляцией АКФ убывает по степенному закону

–  –  –

растет с ростом Q, см. рис. 3.5(в,г) [40] .

Условные средние значения интервалов RQ (r0 ), следующих за интервалами заданной величины r0, не зависят от r0 в системах без памяти, см. рис. 3.5(д), и растут по степенному закону

–  –  –

в системах с дальней корреляцией, см. рис. 3.5(е-з). При этом (Q) не зависит от Q в присутствии только линейной дальней корреляции, тогда как в присутствии нелинейных составляющих уменьшается с ростом Q логарифмически [40] .

–  –  –

Рисунок 3.5 — Вид АКФ и условных средних интервалов, следующих за интервалами заданной величины, для синтезированных рядов данных с дальней корреляцией .

Отдельными символами приведены численные оценки для RQ = 10 (), 70 () и 500 (), штриховые линии соответствуют аналитическим выражениям согласно (3.17), (3.18) и (3.19) [40]

3.2 Аналитические оценки среднего времени ожидания и вероятности возникновения выбросов динамических рядов с дальней корреляцией

–  –  –

которое для рядов с дальней корреляцией имеет вид Q (t) t(Q) [44]. Дальнейшее развитие этого подхода может учитывать статистическую зависимость в последовательности интервалов между выбросами, например, на основе марковской модели, предусматривающей учет длительности предшествующего интервала r0 и переход к условному времени ожидания выброса свыше порога Q, Q (t|r0 ) .

В качестве примера на рис. 3.6(a,b) представлены оценки безусловного Q (t) и условного Q (t|r0 ) времени ожидания следующего события, полученных для ряда, сформированного с использованием модели MRC при m = 1.0, m = 0.1, и по своим статистическим свойствам близкого к 1/f шуму, (a) для RQ = 10 и (b) для RQ = 70 методом математического моделирования Монте-Карло в соответствии с выражением (3.20) и функциональной аппроксимацией (3.21). Как и ранее, для иллюстрации выбраны сценарии r0 = 1 и r0 3. Из рисунка видно, что Q (t) характеризуется степенной зависимостью

Q (t) (t/RQ )(Q) (3.21)

где (Q) убывает с ростом Q ( = 0.6 для RQ = 10 и = 0.47 для RQ = 70) .

Условное время ожидания выброса Q (t|r0 ) для r0 = 1 также может быть удовлетворительно аппроксимировано степенной зависимостью (Q,r0 ) приблизительно с тем же показателем степени, что и глобальное (Q). В противоположность,

–  –  –

Рисунок 3.6 — (a,b) Оценка безусловного времени ожидания Q (t) () и условного времени ожидания Q (t|r0 ) ( для r0 = 1, • для r0 3) следующего выброса, при условии, что t интервалов прошло с момента последнего превышения порога Q, для модели MRC, близкой по свойствам к 1/f шуму, для RQ = 10 и 70, соответственно .

Штриховыми линиями дублируются зависимости Q (t). (c,d) Оценки вероятности WQ (t; t) для (c) RQ = 10 и (d) RQ = 70 для тех же модельных данных, полученных с помощью алгоритма MRC, где отдельными символами приведены численные оценки для t/RQ = 1/9(), 1/3 (), 1 () и 3 () для усреднения по N = 150 реализациям длиной L = 221, соответствующие аппроксимации согласно аналитическому выражению (3.32) приведены сплошными линиями [44] .

–  –  –

для t t .

Поскольку W (t; t) ограничена сверху единичной вероятностью при t/RQ 0, степенная зависимость справедлива только для t/RQ ((Q)

1)t/RQ и в более общем случае с учетом режима насыщения можно представить оценку искомой вероятности в виде

–  –  –

На рис. 3.6(c,d) в качестве примера приведены оценки WQ для реализаций, полученных методом численного моделирования методом Монте-Карло с использованием модели MRC, для RQ = 10 и 70, соответственно. Из рисунка видно, что в связи с тем, что при выбранных параметрах модели и конечной выборке ряда данных наблюдается отклонение от теоретически предсказанного асимпотического поведения PQ (r), также и для WQ наблюдается отклонение от ранее приведенного теоретического результата, которое может быть учтено по данным численного моделирования за счет замены в знаменателе WQ (t; t) слагаемого t/RQ на (t/RQ )1 с эмпирической поправкой 0.15, приводящей к выражению [44]

–  –  –

Рисунок 3.7 — Динамическая оценка вероятности возникновения выброса в интервале t для рядов данных с линейной (а-в) и нелинейной (г-е) дальней корреляцией .

Отдельными символами приведены численные оценки для RQ = 10 (), 70 () и 500 (), полученные на основании выражения 3.22 для N = 150 реализаций длительностью L = 221. Штриховые линии соответствуют приближенным аналитическим выражениям вида (3.33) [47; 64] следствие переоценке WQ, поэтому в этом случае целесообразнее использовать аналитическое выражение (3.32) вместо численной оценки согласно (3.22) .

Поскольку во всех рассмотренных случаях WQ асимптотически убывает по степенному закону, удобным оказывается использование универсальной для систем с дальней корреляцией аппроксимации вида

–  –  –

где для линейной модели c учетом типичных искажений в окрестности H 1 или 0, а также с учетом эффектов дискретности и конечности выборки, эмпирически наблюдается зависимость 1/3 ln [47]. В случае присутствия выраженных линейных статистически связей в структуре нелинейной дальней корреляции, возможно также описание линеаризованной моделью с эффективным значением корреляционной экспоненты eff =, тогда

–  –  –

и WQ также убывает по степенному закону с = 1 eff, причем для модели MRC эмпирически 0.85 1 [47]. Как видно из рис. 3.7, для всех рассмотренных случаев наблюдается согласие между результатами численного моделирования методом Монте-Карло и приближенным выражением вида (3.33). При этом расхождения численных оценок и функциональной аппроксимации в наибольшей степени выражены для малых и больших значений аргумента, что обусловлено эффектами, связанными с дискретностью модели и конечностью выборки, использованной при численном моделировании, соответственно .

3.3 Методика математического моделирования потоков событий с использованием аналитических оценок и вычислительного эксперимента Опираясь на приведенные выше результаты, методику математического моделирования потоков интервалов между выбросами рядов данных с дальней корреляцией можно кратко обобщить в следующем виде .

1. Исходные ряды данных получаются в результате эмпирических наблюдений, либо формируются с использованием известных математических моделей рядов с дальней корреляцией, рассмотренных подробно в выше в главах 1 и 2. В главах 3 и 4, если не оговорено иное, приводятся данные вычислительного эксперимента для N = 150 независимо сформированных реализаций рядов с заданными свойствами длиной L = 221. Процедура предварительной обработки данных эмпирических наблюдений определяется спецификой приложения и подробно обсуждается в главах 5 и 6, посвященных указанным приложениям .

2. Для каждого анализируемого ряда данных формируется семейство пороговых уровней Q, превышение которых задает искомые события (см. рис. 3.1) .

При этом для случая стационарного ряда данных значения порогов Q взаимно однозначно связаны со средними интервалами RQ уравнением I/RQ = Q P (x), где I – единичный временной интервал, P (x) – ПРВ анализируемого ряда данных. В общем случае для наиболее полного описания исходного ряда необходимо рассмотреть множество всевозможных порогов Q, покрывающих область определения величины x, задающей значения исходного ряда. На практике диапазон и конкретный набор пар значений Q и RQ определяется из условий поставленной задачи. В отсутствии аналитического описания P (x) указанные процедуры могут быть выполнены численно, при этом в дальнейшем истинные значения Q и RQ заменяются их выборочными оценками по доступному для анализа фрагменту исходного ряда данных .

3. Для выбранного набора пороговых уровней Qi формируются потоки собыQ) тий, характеризуемые интервалами ri между последовательными превышениями исходным дискретным рядом указанных уровней xn Qi (см. рис. 3.1). Для сформированных рядов интервалов определяются их основные статистические характеристики, включая ПРВ PQ (r); кумулятивные ФР FQ (r); условные средние значения интервалов RQ (r0 ), следующих за интервалами фиксированной длительности r0 ; АКФ ряда последовательных интервалов C(s). Для наиболее распространенных модельных данных, где это возможно, указанные характеристики или их асимптотические приближения получаются аналитически; в отсутствии аналитических оценок, они заменяются аппроксимациями результатов вычислительного эксперимента (см. раздел 3.1) .

4. На основании полученных оценок первичных статистических характеристик, рассмотренных в предыдущем пункте, выполняется оценка вторичных статистических характеристик, включая среднее время ожидания очередного выброса за уровень Q: Q (t), а также вероятности возникновения по крайней мере одного выброса за уровень Q: WQ (t; t) в интервале прогнозирования t, при условии, что с момента последнего выброса истекло время t. Используются полученные выше аналитические оценки, которые подтверждаются результатами вычислительного эксперимента (см. раздел 3.2) .

5. В случае нестационарной динамики ряда вышеописанная процедура применяется к отдельным сегментам ряда, в пределах которых его можно считать стационарным. В случае, если на указанных сегментах ряд можно также приближенно считать однородным, оценки статистических характеристик для совокупности анализируемых стационарных сегментов формируются, как было показано выше, на основе формулы полной вероятности (3.5) .

6. При наличии аналитических оценок их результаты сравниваются с результатами вычислительного эксперимента; при отсутствии аналитических оценок, результаты вычислительного эксперимента используются при аппроксимации асимптотического поведения искомых статистических характеристик .

3.4 Прогнозирование выбросов динамических рядов с дальней корреляцией на основе аналитических оценок и вычислительного эксперимента

–  –  –

в точке n, где коэффициенты уравнения прогнозирующего фильтра численно совпадают с коэффициентами уравнения формирующего фильтра, используемого для синтеза прогнозируемого процесса из ряда независимых отсчетов данных .

Коэффициенты уравнения формирующего фильтра для ряда с линейной дальней корреляцией имеют вид [4]

ai = (H 0.5) iH1.5 (3.36)

Теоретически эффекты дальней корреляции наблюдаются при k, на практике вынужденно используются конечные значения, что также является источником существенных искажений, особенно при H 1. Для монофрактального процесса данное решение при больших k асимптотически приближается к оптимальному, а в рамках мультифрактальной модели оптимальным образом отражает только линейную составляющую дальней корреляции. Вопрос об учете нелинейной составляющей за счет эффекта линеаризации зависимостей в фильтре большой длины k в данном случае остается открытым и является предметом исследования. Из приведенной формулы очевиден недостаток данного метода, а именно невозможРисунок 3.8 — Иллюстрация метода распознавания характерного предиктора на основе квантильного разбиения данных, на примере k = 3 и l = 10. (a) ФР анализируемого ряда данных. (b) Фрагмент реализации дискретного ряда данных. Прямоугольными окнами показаны предикторы k = 3 выбросов свыше порога Q, сверху приведен код предиктора в базе данных всех возможных предикторов, используемый при обучении и последующем его распознавании .

Горизонтальными штриховыми линиями даны квантили распределения исходного ряда данных [47] .

ность применения метода при прогнозировании процессов с H = 0.5, а вопрос эффективности вблизи этого значения также остается открытым [70; 79] .

–  –  –

счетов, типично предшествующего выбросу относительно фиксированного порога Q : xn Q. В общем случае рассматриваются все возможные комбинации из k отсчетов xk : xnk, xnk+1,..., xn1, предшествующие любому событию в ( ) n реализации и определяются условные вероятности P xn Q| xk, что данное n сочетание является предиктором выброса xn Q. Для создания массива всех возможных предикторов xk для k предшествующих событий в скользящем окне n можно разделить общий диапазон возможных значений xi на l квантилей, что приводит к общему числу комбинаций lk. Для каждого потенциального предиктора xk оценивается вероятность того, что следующее событие превысит порог Q:

n xn Q| xk [44; 47; 70; 79] .

n Сравнительная эффективность рассмотренных выше методов прогнозирования выбросов и метода прогнозирования на основе предложенной оценки вероятности выброса WQ для модели потока событий исследовалась путем математического моделирования с использованием метода Монте-Карло. Алгоритм, характеристики и результаты моделирования подробно рассмотрены в главе 4 .

3.5 Численный метод динамической оценки критического уровня Value-at-Risk, превышение которого ожидается с заданной вероятностью

–  –  –

где P (x|t) – текущая оценка ПРВ данных с учетом априорной информации о предшествующей динамике системы. Полученную в результате решения обратной задачи оценку Q называют оценкой Value-at-Risk (VaR). Для систем без памяти P (x|t) P (x), и Q может быть найдено из уравнения

p = I/RQ, (3.38)

где I – единица времени, независимо от текущего момента времени t. В системах с памятью выбор длины окна оценивания P (x|t) определяется прежде всего интервалом корреляции процесса s, а также средним интервалом RQ для анализируемого порога Q. Для систем с дальней корреляцией данную оценку можно уточнить, заменив средний интервал RQ условным средним RQ (r0 ) и, таким образом, перейдя к выражению [43; 67]

–  –  –

При наличии математической модели потока событий, адекватно воспроизводящей динамику выбросов свыше произвольного порога Q, в исследуемой системе, с помощью итерационного алгоритма может быть найдено наиболее точное приближение Q для произвольного момента времени t. При необходимости, последние два подхода могут быть скомбинированы путем замены оценки WQ (t; t) на условную оценку WQ (t; t; r0 ), дополнительно зависящую от предшествующего интервала r0 (или нескольких предшествующих интервалов, с учетом немарковости ряда самих интервалов) .

При наличии математической модели процесса, адекватно воспроизводящей динамику выбросов в исследуемой системе, с помощью итерационного алгоритма может быть найдено наиболее точное приближение Q для произвольного момента времени t. В качестве начального приближения на первом шаге удобно задаться значением Q0, полученным из решения уравнения 3.39. Затем определяется время t0, истекшее с момента последнего превышения анализируемым случайным процессом порога Q0, и вычисляется оценка вероятности появления выброса в интервале [t; t + t] из выражения WQ0 (t0 ; t), которая сравнивается со значением требуемой вероятности p. Если по результатам сравнения WQ0 (t0 ; t) p, значение порога повышается Q1 = Q0 + Q, Q 0, а если WQ0 (t0 ; t) p, то значение порога понижается Q1 = Q0 Q, Q 0. Процесс продолжается итерацинно до тех пор, пока не будет достигнуто значение WQ0 (t0 ; t) p. При дискретной реализации итерационным путем может быть найдено ближайшее к p значение WQ0 (t0 ; t). В зависимости от вида распределений данных, в некоторых случаях можно использовать мультипликативное приращение [43; 67] .

Сходимость предложенного численного метода обеспечивается монотонно убывающим характером функции WQ (t; t) для положительно коррелированных рядов с увеличением t для фиксированного t. При этом скачкообразные изменения значения t, обусловленные пересечением искомым порогом Q уровней предшествующих выбросов, соответствуют скачкообразным изменениям p при малых приращениях Q, при этом не влияя на сходимость в силу сохранения монотонности, когда уменьшение текущей оценки Q всегда соответствует росту p, и наоборот. Таким образом, основные погрешности предложенного метода связаны с его дискретностью и конечностью объема выборки, ограничивающего предысторию выбросов, от которых ведется отсчет t .

Эффективность предложенного численного метода прогнозирования критического уровня Q, превышение которого ожидается с вероятностью p, на основе итерационного решения семейства уравнений p = WQ для модели потока событий исследовалась путем математического моделирования с использованием метода Монте-Карло. Алгоритм, характеристики и результаты моделирования подробно рассмотрены в главе 4 .

3.6 Выводы по главе 3

1. В настоящей главе предложен и осуществлен переход от математического моделирования флуктуационного поведения сложных стохастических систем в целом, к моделированию потоков событий, характеризующих возникновение аномальных состояний таких систем. Показано, что присутствие эффектов дальней корреляции существенным образом изменяет поведение анализируемых систем, включая качественно иное асимптотическое поведение большинства статистических характеристик потока событий .

2. По результатам исследований разработана универсальная масштабноинвариантная математическая модель потока событий, заданных выбросами свыше заданного порога Q случайных рядов, порождаемых системами с нелинейной дальней корреляцией. Введены основные статистические характеристики, являющиеся параметрами данной модели, включая распределение PQ (r) и корреляционную функцию CQ (s) интервалов между последовательными выбросами. Приведены их аналитические выражения и численные оценки для рассмотренных в главе 1 и развитых в главе 2 классов математических моделей систем с линейной и нелинейной дальней корреляцией. Согласованность аналитических выражений и численных оценок, полученных с помощью математического моделирования методом Монте-Карло, подтверждает корректность результатов .

3. Установлена взаимосвязь между эффектами дальней корреляции и их проявлением в свойствах потоков событий, связанных с возникновением аномальных состояний системы. Для предложенной модели потока выбросов получены аналитические оценки вероятности WQ (t; t) возникновения выброса случайного процесса с дальней корреляцией свыше заданного порога Q в интервале t, начиная с момента времени t, истекшего с момента последнего выброса свыше уровня Q. Полученные оценки могут быть использованы для прогнозирования выбросов случайных рядов выше заданного уровня Q. Оценка эффективности такого прогнозирования будет рассмотрена в следующей 4 главе .

4. Для решения дуальной задачи, связанной с управлением рисками, возникающими вследствие аномального поведения сложных стохастических систем, разработан численный метод динамической оценки порогового уровня Q, превышение которого ожидается с заданной вероятностью p, основанный на итерационном решении уравнений вида p = WQ (t; t) для семейства функций WQ (t; t) .

Сходимость предложенного численного метода обеспечивается монотонно убывающим характером функции WQ (t; t) для положительно коррелированных рядов данных. Исследование эффективности и точности оценок, получаемых с использованием предложенного численного метода, будет проведено в следующей 4 главе .

Глава 4 . Программный комплекс и оценка эффективности предложенных методов с его помощью на модельных рядах данных

–  –  –

На основе предложенных методов и разработанных алгоритмов был реализован программный комплекс. Общий вид архитектуры разработанного программного комплекса, включающий его основные модули, их назначение и типичный алгоритм их применения, реализованный в работе при исследовании статистических свойств, моделировании и прогнозировании эмпирических рядов данных, представлен на рис. 4.1. Основные программы для ЭВМ, входящие в состав разработанного программного комплекса, зарегистрированы в установленном порядке [91–99] .

Программный комплекс состоит из следующих отдельных модулей, выполняющих функции:

1. Преобразования исходных рядов к числовому виду и их предварительная обработка, в зависимости от формата исходных данных и постановки задачи. В частности, для данных геофизических наблюдений выполняется предварительное выделение флуктуационной составляющей и ее стандартизация (рассмотрено подробнее в главе 5); для первичной структуры биополимеров (ДНК и белков) осуществляется формирование рядов, принимающих ненулевые значения в положениях определенных мономеров, или групп мономеров со сходными физикохимическими свойствами (рассмотрено подробнее в главе 6) .

2. Флуктуационного анализа исходных рядов данных рассмотренными методами (DFA, WTA, CMA). Указанный модуль решает задачу анализа данных исходных эмпирических наблюдений. По результатам анализа строятся флуктуационные функции, исходя из асимптотического поведения которых, производится оценка показателя Хёрста H для случая линейного анализа или обобщенного распределения показателей Хёрста h(q) для случая нелинейного анализа. Результаты флуктуационного анализа служат для выбора конкретного типа модели ряда и его исходной параметризации .

3. Формирование модельных рядов данных с использованием линейных (ФГШ, ФБД) и нелинейных (MRC, MRW) алгоритмов. Предусмотрено формироРисунок 4.1 — Общий вид архитектуры разработанного программного комплекса, включающий его основные модули, их назначение и типичный алгоритм их применения, реализованный в работе при исследовании эмпирических рядов данных. Заполенными стрелками показаны передачи рядов данных и потоков событий между отдельными модулями программного комплекса, контурными стрелками показаны случаи передачи параметров методов или алгоритмов или их оценок, полученных в одном программном модуле, в следующий программный модуль в качестве информационного параметра .

вание множества отдельных реализаций, что необходимо ввиду неэргодичности изучаемых случайных рядов, управление параметрами модели и длиной реализаций .

4. Формирование и статистический анализ потоков выбросов за различные уровни, задаваемые в форме средних интервалов повторений, применимые как для модельных, так и для эмпирических рядов данных. Значение уровня Q, превышаемого со средним интервалом RQ, определяется с использованием выборочной квантили распределения эмпирических данным с использованием функции сортировки. Вычисляются оценки следующих основных статистических характеристик для рядов интервалов между выборосами: ПРВ PQ (r); ФР FQ (r); условное среднее значение интервалов RQ (r0 ), следующих за интервалом фиксированной длительности r0 ; АКФ ряда последовательных интервалов C(s) .

5. Проверка адекватности модели потоков событий, связанных с превышениями уровней модельными и эмпирическими рядами. В качестве критериев адекватности используется согласованность статистических характеристик, оценки которых получены предыдущим модулем,

6. Прогнозирование выбросов случайных рядов за уровень. Общим параметром является интервал прогнозирования t, используются методы оптимального линейного прогнозирования (для модели с линейной дальней корреляцией на основе уравнения формирующего фильтра с заданным значением H); моделирования мультипликативного каскада (для модели MRC со случайными множителями); распознавания характерного предиктора (прогнозирование с предварительными обучением по семейству фрагментов реализаций случайного ряда); с использованием оценки вероятности выброса WQ (t; t). Оценка эффективности прогнозирования выполняется на основании расчета и визуализации рабочих характеристик D() или Sens(Spec) .

7. Численный расчет динамической оценки уровня Qp, превышение которого на интервале прогнозирования t ожидается с заданной вероятностью p с учетом предыстории флуктуаций исследуемого ряда, предшествующих текущему моменту времени t. Используются методы оптимального линейного прогнозирования (для модели с линейной дальней корреляцией на основе уравнения формирующего фильтра с заданным значением H); моделирования мультипликативного каскада (для модели MRC со случайными множителями); с использованием оценки вероятности выброса WQ (t; t). Сравнение эффективности выполняется на основании сопоставления статистических характеристик получаемых оценок .

Реализация основных программных модулей выполнена на языке C++ с использованием отдельных функций из состава библиотек открытого программного обеспечения GSL – GNU Scientific Library, что обеспечивает высокую производительность и переносимость как отдельных программных модулей, так и программного комплекса в целом. В ходе исследований комплекс был развернут на базе операционной системы ОС Linux. Интеграция модулей и обмен данными между ними реализованы с использованием скриптового языка bash, а также интегрированных инструментов конвейерной обработки данных и средств параллелизации вычислений ОС Linux. Тестирование программного комплекса выполнялось с интегрированным комплятором g++ на базе ОС архитектуры Debian/Ubuntu и SuSe Linux .

Вычислительные эксперименты, результаты которых представлены в настоящей диссертационной работе, выполнялись в разное время в период 2007–2017 гг. на различных доступных ПЭВМ и серверном оборудовании. Отладка и промежуточные вычисления выполнялись преимущественно с использованием ПЭВМ архитектуры Intel Core 2 Quad, Intel i7 и AMD FX. Вычисления большого объема и/или сложности выполнялись с использованием собственного сервера HPE ProLiant DL380 Gen9, а также доступного вычислительного кластера на 1000 ядер производительностью 10 TFLOPs .

При этом следует отметить, что разработанные методы и алгоритмы, ввиду использования асимтотических аналитических оценок, сами по себе характеризуются низкой вычислительной сложностью. Серверные вычислительные мощности были востребованы на этапе проверки адекватности и эффективности предложенных решений, которые выполнялись для модельных данных путем сравнения с асимтотически точными, но значительно более ресурсоемкими процедурами. В том числе, в отсутствии аналитических решений для ряда моделей ряд характеристик вынужденно сопоставлялся с результатами моделирования Монте-Карло на выборках большого объема. Также существенных вычислительных ресурсов потребовала апробация методов анализа первичной структуры биополимеров на доступных геномных и протеомных данных, включая 130 полных геномов и более 200 000 белковых последовательностей .

–  –  –

4.2 Оценка эффективности прогнозирования выбросов Для оценки эффективности прогнозирования решающие статистики, полученные различными методами, сравнивались с решающим порогом Qd, выбор которого, как правило, определяется выбранной допустимой вероятностью ложной тревоги. Для тестового ряда данных определяются вероятность правильного прогнозирования D = N11 /(N01 + N11 ) и вероятность ложной тревоги = N10 /(N00 +N10 ), где N11 - число корректно спрогнозированных событий, N00 - число корректно неспрогнозированных событий, N01 - число пропущенных событий, N10 - число ложных тревог. Для каждой из решающих статистик Qd варьируется в пределах области ее допустимых значений. Для статистик, являющихся оценками вероятности, Qd принимает значения от 0 до 1, при этом для Qd = 0, D = = 1, тогда как для Qd = 1, D = = 0. При 0 Qd 1 для системы без памяти рабочая характеристика соединяет левый нижней и правый верхний углы характеристики по прямой D =. В системе с памятью D превышение диагонали отражает эффективность прогнозирования, при D решающее правило следует инвертировать для получения положительного результата. Для каждого значения наибольшей эффективностью прогнозирования обладает метод, приводящий к наибольшему D. Интегральная эффективность может быть оценена на основании оценки площади под кривой рабочей характеристики (AUC) [47; 70; 79] .

Поскольку функция WQ (t; 1) является монотонно убывающей функцией времени t, истекшего с момента последнего события, рабочая характеристика инвариатна к конкретному ее виду, и зависит от единственного параметра t. Конкретный вид WQ (t; 1) необходимо знать для корректного выбора решающих порогов, а также при решении обратной задачи динамической оценки критического уровня Value-at-Risk, превышение которого происходит с заданной вероятностью, которое будет рассмотрено ниже [47; 70; 79] .

4.2.1 Рабочие характеристики прогнозирования

На рис. 4.3 представлены рабочие характеристики прогнозирования выбросов, превышающих порог со средним интервалом между превышениями RQ = 10, с помощью трех различных методов на примере монофрактальных данных с наличием только линейной ДВЗ (рис. 4.3, а-б) и мультифрактальных данных при наличии как линейной, так и нелинейной ДВЗ (рис. 4.3, в-г). Для рис. 4.3, а, в H = 0.5; для рис. 4.3, б, г H = 0.98. Целесообразно производить сравнение качества прогнозирования с помощью различных методов при значениях вероятности ложной тревоги не выше 0.4 [70; 79] .

Анализ рис. 4.3, а–в показывает, что наилучшее прогнозирование в присутствии только линейной ДВЗ обеспечивают методы оптимального линейного прогнозирования и распозавания характерного предиктора, что согласуется с известными теоретическими положениями. Незначительное завышение рабочей характеристики для метода распозавания характерного предиктора при H = 0.98 Рисунок 4.3 — Рабочие характеристики прогнозирования выбросов динамических рядов xn Q, RQ = 10 методами оптимального линейного прогнозирования (ОЛП), распозавания характерного предиктора (РХП) и вычисления WQ (t; 1) для рядов данных с линейной дальней корреляцией, характеризующихся (а) H = 0.6, (б) H = 0.98, а также рядов данных с нелинейной дальней корреляцией, сформированных с помощью модели MRC с различными коэффициентами вариации множителей в каскаде, при которых линейная составляющая которой характеризуется (в) H = 0.5 и (г) H = 0.98 [70; 79] .

(рис. 4.3, в) можно пояснить погрешностью метода формирования реализаций в условиях конечной выборки, и связанным с этим появлением паразитных нелинейных составляющих (подробно этот эффект рассмотрен ранее в главе 2), а также погрешностью статистического оценивания. Однако существенным недостатком данного метода является необходимость проведения процедуры обучения и высокая вычислительная сложность. Незначительно уступает качество прогнозирования на основе анализа WQ (t; t). Наихудшие результаты показывает метод полиномиальной экстраполяции [70; 79] .

В присутствии исключительно нелинейной зависимости (см. рис. 4.3, в) эффективными являются только нелинейные методы, при этом небольшой выигрыш достигается при использовании метода распознавания характерного предиктора .

Возможно, это связано с тем, что для метода на основе анализа WQ (t; t) характерной ошибкой является пропуск первого выброса в кластере последовательных выбросов, а учитывая выраженную кластеризацию мультифрактального процесса, данный эффект может быть достаточно значимым. При больших значениях H = 0.98 (см. рис. 4.3, г) все методы, за исключением метода полиномиальной экстраполяции, показывают сопоставимые и достаточно хорошие результаты .

Высокую эффективность метода оптимальной линейной фильтрации можно объяснить не только оптимальным учетом информации о нелинейной зависимости, но и эффектом линеаризации [70; 79] .

На рис. 4.4 представлены аналогичные рабочие характеристики для тех же методов прогнозирования и тех же динамических рядов, но при более высоком пороге выброса (RQ = 500). Нетрудно видеть, что для всех без исключения методов показатели правильного прогнозирования выше при тех же значениях по сравнению с более низким порогом (RQ = 10, рис. 4.3). Таким образом подтверждается факт, что при увеличении значения порога качество прогнозирования улучшается. При этом также увеличивается разрыв между более эффективными и менее эффективными методами прогнозирования, что свидетельствует о большей актуальности выбора наиболее эффективного метода прогнозирования при рассмотрении более выраженных выбросов. В частности, для мультифрактальных данных увеличивается проигрыш метода интервальных статистик по сравнению с наилучшими методами (рис. 4.3 и 4.4, в) [70; 79] .

Поскольку в мультифрактальных данных при H 1 линеаризация обеспечивает хорошее качество прогнозирования с использованием оптимального лиРисунок 4.4 — Рабочие характеристики прогнозирования выбросов динамических рядов xn Q, RQ = 500 методами оптимального линейного прогнозирования (ОЛП), распозавания характерного предиктора (РХП) и вычисления WQ (t; 1) для рядов данных с линейной дальней корреляцией, характеризующихся (а) H = 0.6, (б) H = 0.98, а также рядов данных с нелинейной дальней корреляцией, сформированных с помощью модели MRC с различными коэффициентами вариации множителей в каскаде, при которых линейная составляющая которой характеризуется (в) H = 0.5 и (г) H = 0.98 [70; 79] .

нейного прогнозирования, но оказывается неэффективной при H = 0.5, возникает вопрос о границах применимости линеаризации. Для более наглядного сравнения целесообразно построить зависимость вероятности правильного прогнозирования от значения показателя Хёрста H при фиксированной вероятности ложной тревоги для тех же значений пороговых уровней, для которых построены кривые на рис. 4.3 и 4.4. На рис. 4.5 представлена зависимость D (H) при = 0.1 : а, б – на примере монофрактальных данных; в, г – на примере мультифрактальных данных. Для рис. 4.5, а, в RQ = 10; рис. 4.5, б, г для RQ = 500 [70; 79] .

Из анализа рис. 4.5 следует, что при прогнозировании выбросов монофрактальных данных метод оптимального линейного прогнозирования показывает наилучшие результаты в сравнении с остальными методами для всех значений H, что согласуется с теоретическими положениями. В случае с мультифрактальными данными нелинейные методы значительно выигрывают при значениях H 0.7... 0.8, однако при H 0.7... 0.8 метод оптимального линейного прогнозирования дает сопоставимые результаты. Таким образом, при прогнозировании мультифрактальных процессов с H 0.7... 0.8 следует однозначно выбирать нелинейные методы, а при более высоких значениях H целесообразно выбирать методы прогнозирования из соображений минимизации их вычислительной сложности [70; 79] .

4.2.2 Характеристики помехоустойчивости прогнозирования

Прогнозирование выбросов динамических рядов проведено тремя методами: методом оптимального линейного прогнозирования (ОЛП), на основе оценки вероятности выброса WQ (t; 1) и методом распознавания (характерного) предиктора (РХП). Параметры методов выбраны теми же, что и выше. Для количественного сравнения построены характеристики помехоустойчивости прогнозирования при добавлении к сформированным дискретным рядам данных с дальней корреляцией аддитивного белого гауссовского шума (АБГШ). Поскольку в качестве прогнозируемого события рассматривалось превышение анализируемым рядом фиксированного порога Q (выброс), отношение сигнал/шум определялось как отношение минимальной амплитуды интересующего сигнала, равного Q, к среднеквадратиРисунок 4.5 — Сечения рабочих характеристик прогнозирования выбросов динамических рядов с линейной и нелинейной дальней корреляцией xn Q методами оптимального линейного прогнозирования (ОЛП), распозавания характерного предиктора (РХП) и вычисления WQ (t; 1) для рядов данных с линейной дальней корреляцией для RQ = 10 и RQ = 500 [70; 79] .

Рисунок 4.6 — Характеристики помехоустойчивости прогнозирования выбросов динамических рядов xn Q, RQ = 10 методами оптимального линейного прогнозирования (ОЛП), распозавания характерного предиктора (РХП) и вычисления WQ (t; 1) для рядов данных с линейной дальней корреляцией, характеризующихся (а) H = 0 .

6, (б) H = 0.98, а также рядов данных с нелинейной дальней корреляцией, сформированных с помощью модели MRC с различными коэффициентами вариации множителей в каскаде, при которых линейная составляющая которой характеризуется (в) H = 0.5 и (г) H = 0.98 в присутствии аддитивного белого гауссовского шума [71; 79] ческому отклонению шума. В целях унификации задания порога Q для различного вида распределений анализируемого ряда фиксировались средние значения интервалов между превышениями RQ [71; 79] .

На рис. 4.6 приведены характеристики помехоустойчивости, полученные при прогнозировании монофрактальных (а, б) и мультифрактальных (в, г) динамических рядов для показателей Хёрста H = 0.5 (а, в) и 0.98 (б, д) и среднего интервала повторения выбросов RQ = 10. Сплошной линией представлены результаты для ОЛП, штриховой линией – для метода РХП, штрих-пунктиром – для метода на основе анализа WQ (t; 1). Из рис. 4.6 видно, что в присутствии только нелинейной составляющей ДВЗ (H = 0.5) эффективными ожидаемо оказываются нелинейные методы прогнозирования (см. рис. 4.6, в). При выраженной линейной зависимости и больших значениях отношения “сигнал/шум” (в режиме насыщения) все рассмотренные методы показывают схожую эффективность, что согласуется с ранее полученными данными. Небольшой выигрыш наблюдается при использовании нелинейных методов для H = 0.98, что может объясняться паразитной нелинейностью, возникающей в алгоритмах синтеза данных вблизи порога нестационарности (подробно этот вопрос рассмотрен выше в главе 2). Однако по мере увеличения шума при Q/ 5 эффективность нелинейных методов РХП и WQ (t; 1) существенно снижаются, в то время как метод ОЛП сохраняет почти неизменную эффективность вплоть до Q/ 2, что можно объяснить как оптимальным учетом линейной составляющей дальней корреляции, так и эффектом линеаризации нелинейной составляющей в прогнозирующем фильтре [71; 79] .

На рис. 4.7 показаны аналогичные результаты для более высокого порога, соответствующего среднему интервалу повторения выбросов RQ = 500. Из него следует, что, во-первых, прогнозируемость выбросов улучшается с повышением порога, что согласуется с данными предыдущих исследований. Во-вторых, сделанные ранее выводы для RQ = 10 в целом могут быть экстраполированы и на более высокие значения порогов. Следует также отметить, что артефакт, связанный с паразитной нелинейностью, в данном случае не оказывает существенного влияния. Наблюдаемое на рис. 4.7 нарушение монотонности характеристики помехоустойчивости для метода прогнозирования на основе анализа WQ (t; 1) связано с дискретным характером этой зависимости, основанной на использовании одной и той же убывающей функции вероятности выброса после каждого зарегиРисунок 4.7 — Характеристики помехоустойчивости прогнозирования выбросов динамических рядов xn Q, RQ = 500 методами оптимального линейного прогнозирования (ОЛП), распозавания характерного предиктора (РХП) и вычисления WQ (t; 1) для рядов данных с линейной дальней корреляцией, характеризующихся (а) H = 0.6, (б) H = 0.98, а также рядов данных с нелинейной дальней корреляцией, сформированных с помощью модели MRC с различными коэффициентами вариации множителей в каскаде, при которых линейная составляющая которой характеризуется (в) H = 0.5 и (г) H = 0.98 в присутствии аддитивного белого гауссовского шума [71; 79] стрированного превышения порога, что приводит к неточной фиксации вероятности ложной тревоги [71; 79] .

Рассмотренные примеры нелинейных зависимостей основаны на анализе данных, полученных при помощи мультипликативного каскада, для которого характерно формирование реализаций с широкими распределениями данных, описываемыми логнормальными функциями. Однако для регистрируемых процессов естественного происхождения данный вид распределения нетипичен. Как правило, распределения наблюдаемых данных оказываются более узкими, что в общем случае снижает эффективность их прогнозирования на фоне шумов. Следовательно, рассмотренная ранее ситуация является более выигрышной с позиции прогнозирования по сравнению с большинством реальных случаев. С целью анализа влияния ширины распределения данных при неизменном распределении шума далее рассмотрен пример, в котором распределения сигнала и шума совпадают и являются гауссовскими .

На рис. 4.8 представлены кривые помехоустойчивости для модели мультифрактальных динамических рядов с гауссовским распределением для значений RQ = 10 (а, б) и RQ = 500 (в, г) при H = 0.5 (а, в) и 0.98 (б, д). Из кривых на рис. 4.8 следует, что нелинейные методы показывают лучшую прогнозируемость в сравнении с линейным методом. Однако при достаточно высоких значениях показателя Хёрста (H = 0.98) метод ОЛП находится на уровне нелинейных методов. При промежуточных значениях H наблюдается качественное отличие результатов, полученных для различных распределений данных. Таким образом, при выраженной линейной зависимости в пределах стационарности существенным фактором является вид распределения данных, и соотношение скорости его асимптотического убывания по сравнению с аналогичным распределением для шумовой составляющей [71; 79] .

Рассмотренные варианты распределения данных, включая асимтотически логнормальное и асимптотически гауссовское убывание, в значительной мере покрывают диапазон реальных сценариев вида распределений эмпирических рядов данных, наблюдаемых в сложных саморегулирующихся системах различной физической природы. На практике асимптотический вид распределения часто оказывается в промежуточном положении между указанными случаями, в случае качественного согласования полученных результатов для обоих случаев выводы могут быть экстраполированы также на промежуточные ситуации .

Рисунок 4.8 — Характеристики помехоустойчивости прогнозирования выбросов динамических рядов xn Q, для (a, б) RQ = 10 и (в, г) RQ = 500 методами оптимального линейного прогнозирования (ОЛП), распозавания характерного предиктора (РХП) и вычисления WQ (t; 1) для рядов данных с нелинейной дальней корреляцией, сформированных с помощью модели MRC с различными коэффициентами вариации множителей в каскаде, при которых линейная составляющая которой характеризуется (а,в) H = 0 .

5 и (б,г) H = 0.98, после поранговой замены отсчетов на выходе каскада на нормально распределенные, в присутствии аддитивного белого гауссовского шума [71] Резюмируя, эффективность прогнозирования выбросов рядов с дальней корреляцией на основе сравнения статистики WQ с решающим порогом для случая линейной дальней корреляции несколько уступает оптимальному линейному прогнозированию (ОЛП) и нелинейному алгоритму распознавания кратковременного характерного предиктора выброса (РХП). Для случая нелинейной дальней корреляции, прогноз на основе WQ сохраняет эффективность при слабо выраженной линейной зависимости (H 0.7), когда линейная фильтрация малоэффективна [47;70]. При этом в присутствии аддитивных шумов прогноз на основе статистики WQ в ряде случаев оказывается более точным по сравнению с методами, основанными на поиске предиктора в коротком интервале t RQ, предшествующем выбросу, поскольку WQ опирается исключительно на информацию о предшествующих выбросах, величина которых существенно выше типичных значений отсчетов, предшествующих выбросу. Данный эффект в наибольшей степени выражен в присутствии выраженной нелинейной дальней корреляции и широкого распределения отсчетов анализируемого динамического ряда [47; 65; 71] .

Также при практическом применении рассмотренных подходов необходимо учитывать, что прогноз на основе оценки WQ (t; t) отличается низкой вычислительной сложностью и требует меньшей параметризации, поскольку основан только на знании модели потока событий свыше некоторого заранее заданного уровня Q, в противовес другим рассмотренным методам, требующим знания динамической модели системы или статистики предикторов выбросов. Поэтому в условиях дефицита эмпирических данных для параметризации модели динамической системы и/или проверки адекватности результатов такой параметризации, в условиях сопоставимой эффективности прогнозирования использование подхода на основе модели потока событий может оказаться предпочтительным .

4.3 Статистические характеристики эффективности динамического оценивания критических уровней Оценить адекватность и точность предложенного численного метода динамической оценки критических уровней можно для модельных данных, как и предыдущих разделах, на основе сравнения с оптимальным методом прогнозированием для известной модели формирующего фильтра. Для случая модели данных с линейной дальней корреляцией эта задача сводится к процедуре оптимальной линейной фильтрации и оценке соответствующей p-квантили распределения всех возможных значений, принимаемых рядов на интервале экстраполяции. Для нормально распределенных рядов данных такая оценка может быть легко выражена через среднее значение и среднеквадратическое отклонение отсчетов на входе формирующего фильтра и не представляет затруднений .

Для случая модели MRC с нелинейной дальней корреляцией, можно воспользоваться априорным знанием структуры каскада, и получить оценки распределения с учетом случайности множителей, которые на момент осуществления прогноза еще не включены в каскад. Для ряда, сформированного с использованием n итераций алгоритма MRC, в зависимости от текущего положения и интервала прогнозирования, с учетом структуры каскада, ошибка в 2n1 случаях будет определяться p-квантилью распределения отдельных множителей, в 2n2 случаях p-квантилью распределения произведения двух независимых множителей, и так далее; в единственном случае p-квантилью распределения произведения n независимых множителей. Поскольку на практике при анализе сформированного ряда данных структура формирующего каскада в общем случае неизвестна, а предложенные асимтотические оценки не учитывают лог-периодические осцилляции, отражающие дискретную структуру каскада, для оценки средних уровней ошибки достаточно воспользоваться усреднением указанных p-квантилей распределений произведений различного числа множителей, взвешенным в соответствии с их встречаемостью в структуре каскада .

Следует отметить, что точечные динамические оценки Qp с использованием предложенного численного метода путем решения уравений p = WQ (t; t), опираются на существенно меньший объем информации об исходном ряде, а именно, предысторию выбросов свыше некоторого набора порогов в окрестности искомого Qp, нежели оптимальные референсные методы ОЛП, MRC и другие, которые опираются на информацию о всех отсчетах ряда, предшествующих текущему моменту времени. Таким образом, прямое сравнение динамических оценок, полученных с помощью указанных методов в каждой точке, в общем случае приведет к заведомо различным результатам. Теоретически, указанное расхождение будет уменьшаться с ростом t, но в этом случае при малых значениях t все оценки будут соответствовать вероятностям выбросов WQ (t; t), близким к единице, что не покрывает всего диапазона их колебаний .

В качестве альтернативы можно проанализировать сходимость точечных оценок, получаемых различными методами, при их усреднении в окнах заданной длительности Laver. С увеличением окна оценивания результат усреднения при больших длительностях окон Laver различные оценки должны сходиться к одному и тому же значению. Для стационарных рядов данных указанное значение к тому же может быть получено, исходя из распределения значений исходного ряда данных, для t = 1 как 1 p-квантиль указанного распределения, а для других значений t рассчитана как квантиль распределения локальных максимумов по различным реализациям исходного ряда в окне t. Примеры выброчных средних значений и выборочных стандартных отклонений таких оценок приведены на рис. 4.9 – 4.14 .

Статистические характеристики, динамических оценок, усредненных на различных временных масштабах, приведены в качестве репрезентативных примеров на рис. 4.15 – 4.17. Для сравения приведены оценки, полученные с использованием формирующего линейного или нелинейного алгоритма, и полученные с использованием p = WQ (t; t), на примере t = 1 и 10, для значений вероятности выброса p = 0.1 и 0.01. В качестве линейной модели использован ФГШ с H = 0.6; в качестве нелинейной модели использован каскад MRC числом итераций n = 16, с -распределенными множителями с единичными средним значением и коэффициентом вариации множителей .

Еще одним способом проверки эффективности получаемых оценок является их сравнение с апостериорными оценками. Этот подход не применим к оценкам в каждой точке в силу недостаточной статистики для оценивания соответствующих уровней, однако применим к результатам усреднения соответствующих оценок. Приведенные на рис. 4.15 и 4.16 штриховые линии показывают, что оценки, полученные как с использованием оптимального, так и предложенного метода, лежат преимущественно в пределах доверительных интервалов апостериорных оценок, с учетом доступных объемов выборки для их оценивания, для различных значений Laver. Таким образом, если опираться на использование апостериорных оценок, можно утверждать, что, поскольку различные оценки лежат преимущественно в пределах соответствующих доверительных интервалов, можно выбрать Рисунок 4.9 — Сравнение динамических оценок критического уровня Q, превышение которого происходит с вероятностью p, на примере фрагмента реализации ФГШ с H = 0.6 при использовании оптимального линейного прогнозирования для известного уравнения формирующего фильтра (OLP) и при использовании предложенного алгоритма численной оценки на основе решения уравения p = WQ (t; t), для t = 1 и p = 0.1. Серым фоном даны значения исходного ряда. Зеленой линией дана оценка OLP, красной линией – оценка QW,p .

Синими и желтыми линиями даны оценки среднего значения и среднеквадратического отклонения полученных оценок в скользящем окне, при этом длина окна оценивания составляет во всех случаях 1/10 от длины фрагмента, представленного на соответствующей панели рисунка .

Рисунок 4.10 — Аналогичен рис. 4.9, но для p = 0.01 .

Рисунок 4.11 — Сравнение динамических оценок критического уровня Q, превышение которого происходит с вероятностью p, на примере фрагмента реализации MRC с

-распределенными множителями с единичным средним значением и коэффициентами вариации 0.1 при использовании взвешенной оценки с учетом структуры каскада (MRC) и при использовании предложенного алгоритма численной оценки на основе решения уравения p = WQ (t; t), для t = 1 и p = 0.1. Серым фоном даны значения исходного ряда. Зеленой линией дана оценка MRC, красной линией – оценка QW,p. Синими и желтыми линиями даны оценки среднего значения и среднеквадратического отклонения полученных оценок в скользящем окне, при этом длина окна оценивания составляет во всех случаях 1/10 от длины фрагмента, представленного на соответствующей панели рисунка .

–  –  –

Рисунок 4.15 — Статистические характеристики динамических оценок пороговых уровней Qp, превышение которых происходит в интервале t = 1 с фиксированной вероятностью p = 0 .

1 и 0.01 (слева направо), для линейной модели ФГШ с H = 0.6, усредненные в окне длительностью Laver. На левых панелях даны результаты оценивания с использованием оптимального линейного прогнозирования, на правых панелях – с использованием оценки p = WQ (t; t). Сплошной жирной линией дана статическая оценка, соответствующая p-квантили исходного ряда. Штриховыми линиями даны интерквартильный диапазон, а также 0.05- и 0.95-квантили выборочной апостериорной оценки p-квантили в окне Laver .

Рисунок 4.16 — Статистические характеристики динамических оценок пороговых уровней Qp, превышение которых происходит в интервале t = 1 с фиксированной вероятностью p = 0 .

01 и 0.001 (слева направо), для нелинейной модели MRC с m / m = 0.9, усредненные в окне длительностью Laver. На левых панелях даны результаты оценивания на основе структуры каскада, на правых панелях – с использованием оценки p = WQ (t; t). Штриховыми линиями даны интерквартильный диапазон, а также 0.05- и 0.95-квантили выборочной апостериорной оценки p-квантили в окне Laver .

Рисунок 4.17 — Статистические характеристики динамических оценок пороговых уровней Qp, превышение которых происходит в интервале t = 10 с фиксированной вероятностью p = 0 .

1 и 0.01 (слева направо), для нелинейной модели MRC с m / m = 0.9, усредненные в окне длительностью Laver. На левых панелях даны результаты оценивания на основе структуры каскада, на правых панелях – с использованием оценки p = WQ (t; t) .

тот или иной метод оценки, исходя из иных критериев, таких, как объем входных данных, сложность параметризации модели, вычислительная сложность .

Вопросам проверки адекватности предложенных моделей и оценке эффективности разработанных численных методов в конкретных приложениях на основе анализа эмпирических данных длительного мониторинга сложных стохастических систем различной физической природы: геофизических, гидрологических, климатических, метеорологических, информационных, экономических, физиологических посвящена глава 5 настоящей диссертации, где также приведены результаты сравнения численного расчета уровней QW,p с апостериорными выборочными оценками .

Заключительная глава 6 диссертации посвящены вопросам применения аналогичного математического аппарата при численном анализе особенностей и математическом моделировании структурной организации биополимеров. Рассматривается ряд практических приложений, включая численный метод направленной обратной трансляции полипептидов в интересах адаптации свойств генетических конструкций и предсказания ряда структурных и структурно-обусловленных свойств полипептидов на основе анализа формы распределения масс остатков их множественного протеолитического расщепления без реконструкции состава и/или последовательности аминокислот в их первичной структуре .

4.4 Выводы по главе 4

1. На основе предложенных численных методов и алгоритмов разработан проблемно-ориентированный программный комплекс для проведения вычислительного эксперимента с модельными и эмпирическими рядами данных, характеризующими флуктуационное поведение и структурные неоднородности в сложных стохастических системах различной физической природы. Реализация основных программных модулей выполнена на языке C++ с использованием отдельных функций из состава библиотек открытого программного обеспечения GSL

– GNU Scientific Library, что обеспечивает высокую производительность и переносимость как отдельных программных модулей, так и программного комплекса в целом. Для проведения серии вычислительных экспериментов с модельными и эмпирическими рядами данных указанных программный комплекс был развернут на базе операционной системы ОС Linux .

2. С использованием разработанного программного комплекса методом математического моделирования выполнена оценка эффективности прогнозирования выбросов случайных рядов с дальней корреляцией на основе полученных оценок WQ (t; t) в сравнении с альтернативными методами, основанными на оптимальном прогнозировании и распознавании характерного предиктора, получены рабочие характеристики и характеристики помехоустойчивости прогнозирования. Результаты серии вычислительных экспериментов показывают, что эффективность прогнозирования выбросов рядов с дальней корреляцией на основе сравнения статистики WQ с решающим порогом для случая линейной дальней корреляции в большинстве случаев оказывается сопоставимой или незначительно уступает оптимальному линейному прогнозированию (ОЛП) и нелинейному алгоритму распознавания кратковременного характерного предиктора выброса (РХП). Для случая нелинейной дальней корреляции, прогноз на основе WQ сохраняет эффективность при слабо выраженной линейной зависимости, когда линейные методы оказываются малоэффективными. При этом в присутствии аддитивных шумов предложенный прогноз на основе оценок WQ в ряде случаев оказывается более точным, поскольку WQ опирается исключительно на информацию о предшествующих выбросах, которые в относительном выражении меньше подвержены действию стационарных шумов, нежели отсчеты, предшествующие выбросу, но лежащие ниже порога Q .

3. Методом математического моделирования исследованы статистические характеристики оценок, получаемых с использованием предложенного численного метода динамической оценки порогового уровня QW,p, превышение которого ожидается с заданной вероятностью p, основанного на итерационном решении уравнений вида p = WQ (t; t) для семейства функций WQ (t; t), в сопоставлении с аналогичными оценками на основе методов оптимального прогнозирования динамических рядов с известным алгоритмом формирования, а также апостериорными выброчными оценками указанных уровней. Показано, что для набора репрезентативных примеров оценки QW,p в среднем согласуются, и лежат в пределах доверительных интервалов для апостериорных оценок при таких же объемах усреднения, ввиду чего предложенный численный метод может оказаться предпочтительным ввиду более мягких требований к полноте входных данных, простоте параметризации модели и низкой вычислительной сложности, не зависящей от параметров t; t .

Глава 5. Комплексные исследования динамики выбросов временных рядов, характеризующих аномальные состояния сложных стохастических систем различной физической природы

–  –  –

В настоящей главе анализируются статистические характеристики интервалов повторения событий в геофизических системах по данным длительных гидрологических, климатических и метеорологических наблюдений, а также предлагаются численные методы и алгоритмы прогнозирования аномальных явлений по данным длительных геофизических наблюдений .

Результаты большого числа исследований, особенно активизировавшихся в последние два десятилетия, указывают на наличие признаков дальней корреляции в гидрометеорологических и климатических данных, включая динамику количества осадков и речного стока [1; 4; 24; 114; 150–156], температуры воздуха и поверхности моря [103; 157–187], уровней воды [188–190], ветровых полей [191] и циклонов в умеренных широтах [192]. Несмотря на большое количество свидетельств присутствия дальней корреляции, до недавнего времени в расчетных гидроклиматических моделях, в том числе рекомендованных Межправительственной группой экспертов по изменению климата (МГЭИК), учитывались только эффекты ближней корреляции, представляемые преимущественно авторегрессионными моделями. В то время как игнорирование эффектов дальней корреляции может быть допустимо при краткосрочном прогнозировании, оно может приводить к существенным искажениям результатов средне- и долгосрочного прогнозирования .

Корреляционные свойства рядов данных длительных наблюдений представляет особый интерес в связи с исследованием динамики аномальных событий, происходящих недостаточно часто, чтобы можно было провести прямое статистическое исследование закономерностей, связанных с их появлением. В подобных случаях перспективным является подход, связанный с поиском масштабно-инвариантных закономерностей, характеризующих динамику выбросов свыше широкого диапазона пороговых значений, и их дальнейшая экстраполяция в рамках единой математической модели на потоки выбросов свыше высоких порогов, для которых необходимый объем статистических данных эмпирических наблюдений недоступен .

Другим важным направлением исследований, где возникает необходимость учитывать эффекты дальней корреляции, является статистическая оценка трендов в данных длительных наблюдений. Как было показано выше на примере математических моделей, в определенных ситуациях эффекты дальней корреляции при конечном времени наблюдения динамики системы способны как имитировать, так и маскировать тренды. Если в рамках стационарной модели данных допускаются эффекты дальней корреляции, в задаче выявления трендов возрастает неопределенность по сравнению с более простым сценарием, когда рассматривается модель регулярного тренда и некоррелированных флуктуаций относительно него, что увеличивает степень неопределенности [184] .

5.1.1 Характеристики интервалов между выбросами данных длительного мониторинга количества осадков и расхода рек Данные длительных гидроклиматических наблюдений типично характеризуются дальней корреляцией, однако для каждого вида исходных данных следует учитывать характерные особенности. Так, колебания температуры воздуха характеризуются выраженной кратковременной зависимостью (до нескольких суток), зачастую классифицируемой наблюдателем как краткосрочный тренд (H 1.0... 1.3, что лежит за порогом стационарности H = 1.0), в то время как на средне- и долгосрочных временных масштабах типичны значения H 0.6... 0.7 за исключением наблюдений в зоне морских акваторий и островных территорий, где достигались значения H 0.8 [161]. Флуктуации температуры воздуха достаточно точно описываются линейными моделями с дальней корреляцией, характеризуемых единственным параметром – показателем Хёрста [166], в то время как для описания колебания уровня осадков и потока воды в реках относительно соответствующих сезонных периодичностей требуется применение нелинейных мультифрактальных моделей, в которых вместо единственного показателя Хёрста H используется распределение обобщенных показателей Хёрста h (q) [114] .

При этом линейная зависимость характеризуется H h (2) 0.5... 0.6 для колебаний уровня осадков и h (2) 0.8... 0.9 для колебаний потока воды в реках .

Оба указанных типа данных также характеризуются присутствием краткосрочных нестационарностей .

Непосредственную информацию о динамике гидроклиматических аномалий несут статистики временных интервалов между их последовательными возникновениями. Кратковременное гидрометеорологическое прогнозирование в основном опирается на динамические модели, имеющие большое число параметров, и эффективные в основном на временных интервалах, не превышающих нескольких суток. Построение динамической модели, позволяющей предсказывать гидроклиматические изменения на средне- и долгосрочную перспективу, сопряжено с ограничениями, обусловленными растущей размерностью моделей и недостаточным объемом статистических данных для достоверного оценивания параметров такой модели. Поэтому большое значение приобретают феноменологические модели, основанные на статистическом описании длительной динамики данных, и поиске универсальных закономерностей динамики гидроклиматических аномалий, которые могут быть использованы для оценки риска их появления [24; 193; 194] .

Количество осадков определяется динамикой атмосферной циркуляции и конвекции. Расход воды в реках определяется как частичным интегрированием осадков в их бассейне, так и более сложными механизмами эвапотранспирации и характером растительного покрова [195–197]). Известно несколько универсальных эмпирических закономерностей, характеризующих динамику количества осадков и речного стока [195;198]. Для речного стока в качестве типичных примеров таких эмпирических закономерностей можно привести законы Хортона [199], связывающие число и общую длину водотоков, а также густоту речной сети в заданном бассейне, и закон Хэка [200], связывающий длину реки с площадью ее бассейна. В начале 50-х годов при анализе многолетних гидрологических наблюдений Нила Хёрстом были впервые отмечены эффекты дальней корреляции, и в качестве их меры был введен показатель Хёрста. В ходе последующих исследований было установлено, что динамика расхода воды в реках характеризуется показателями Хёрста от 0.6 до 1.0 [2; 155; 201], при этом по мере спуска по течению реки и роста ее бассейна показатель Хёрста имеет тенденцию к росту, отражающему эффект частичного интегрирования [202]. Кроме того, для речного стоРисунок 5.1 — Точки регистрации данных количества осадков и речного стока, использованные в качестве репрезентативной выборки ка характерны выраженные кратковременные корреляции, отражающие частичное локальное интегрирование осадков, а также нелинейные связи, характеризуемые обычно распределением обобщенных показателей Хёрста [114; 150; 203] .

При этом показатели Хёрста не являются универсальными и зависят от специфики гидроклиматических условий бассейна реки, структуры почв и растительного покрова, влияющих на механизмы эвапотранспирации. Недавно было показано, что приращения речного стока на интервалах от суток до месяца описываются универсальным масштабно-инвариантным распределением негауссовского вида [204] .

Для количества осадков характерна слабая линейная и несколько более выраженная нелинейная зависимость. На очень коротких временных интервалах, длительности засушливых периодов [205] и количество выпавших осадков за один эпизод [206] характеризуются степенным распределением и дальней корреляцией [207; 208], см. также [209; 210]. На временных интервалах от суток и более, количество выпавших осадков в разные дни в большинстве случаев слабо коррелированы и характеризуются H вблизи 1/2 [114]. Исключениями являются горные районы, где значения H могут превышать 0.6 [114] .

Дальнейший анализ основан на данных длительных наблюдений динамики интенсивности осадков и речного стока в различных регионах мира с различными гидрологическими условиями, типом климата, характером почв и т.д. Для демонстрации результатов анализа использована репрезентативная выборка из 32 точек наблюдения по всему миру (см. рис. 5.1). Полное описание источников данных приведено в таблице. Данные количества выпавших осадков были предоставле

–  –  –

Precipitation [mm] 1.1 1883 1.1 1884 1.1 1.1 1911 1.1 1912 1.1 1.1 1903 1.1 1904 1.1 1.1 1881 1.1 1882 1.1

–  –  –

гидрологической, климатической или метеорологической аномалией обычно понимается значительное отклонение анализируемого процесса от типичных для текущей фазы годового цикла значений, или анализ выбросов флуктуационной составляющей xi, описывающей колебания наблюдений Wi относительно регулярного цикла wk(i), полученного усреднением для данной фазы k(i) цикла по всем периодам (годам) наблюдения, а при малом числе полных циклов наблюдения с последующим сглаживанием в скользящем окне [41; 50]. Для корректного сопоставления данных для различных климатических зон (напр. с континентальным и муссонным климатом) и гидрологических объектов различного масштаба (напр .

больших и малых рек) выполняется стандартизация данных, когда флуктуационная составляющая определяется как xi = (Wi wk(i) )/k(i), i = 1,2,...,N, где k(i)

– среднеквадратическое отклонение по всем периодам наблюдения для фазы k(i) регулярного цикла, показано темным фоном на рис. 5.2(a-d). Динамика возникновения аномалий в дальнейшем исследуется на основании статистик выбросов стационарного ряда данных xi Q, для различных средних интервалов RQ, см .

рис. 5.2(e-h) [50] .

На рисунке 5.2 приведены фрагменты репрезентативных рядов данных наблюдений количества осадков в С.-Петербурге и Пусане, а также расхода воды в реках Темза в Кингстоне и Миссиссипи в Кеоуке. Жирной сплошной линией наложена оценка сезонного тренда, серым фоном наложено стандартное отклонение данных от сезонного тренда. После стандартизации данных характеристики флуктуаций анализируются отдельно от тренда. Флуктуационная составляющая сравнивается с порогами Q, значения которых определяются из ее квантилей согласно заданным средним интервалам повторения превышений порогов RQ, где I/RQ = Q P (x)dx, I – интервал дискретности ряда наблюдений (в данном примере 1 сутки), P (x) – ПРВ флуктуационной составляющей. При этом последовательные группы интервалов r = 1 характеризуют кластеры с аномальным количеством осадков или расходом воды в реках, по отношению к типичным для текущего сезона значениям, а интервалы r 2 характеризуют продолжительность интервалов между такими кластерами .

Для корректного сравнения эффектов кластеризации выбросов для различных средних интервалов повторения RQ удобно представлять ПРВ интервалов в масштабно-инвариантной форме, в виде функции RQ PQ (r), зависящей от аргумента r/RQ. Как было рассмотрено выше, в качестве нулевой гипотезы (отсутствия памяти в системе) рассматривается зависимость ln(RQ PQ (r)) (r/RQ ), тогда как в присутствии дальней корреляции ожидается асимптотическое убывание ПРВ медленнее экспоненциального, по растянутой экспоненте для доминирующей линейной [37;38;142] и степенной для выраженной нелинейной дальней корреляции [39; 41; 43] .

На рис. 5.3 приведены ПРВ интервалов PQ (r) для репрезентативной выборки данных длительных наблюдений. Из рисунка видно, что наибольший разброс наблюдается в области кратковременной зависимости, характеризуемой малыми значениями интервалов r. Для оценки долговременной динамики в дальнейшем из анализа исключаются интервалы r = 1, доля которых в наибольшей степени варьируется и для данных расхода стока различных рек составляет от 0.3 до 0.5 при RQ = 10 и от 0.1 до 0.8 при RQ = 160 (что в модели непрерывного процесса отражает разброс длительности выбросов) .

Вместо них рассматриваются интервалы = r 2, для которых вычисляются их средние значения Q. На рис. 5.4 приведена зависимость Q от RQ для всех рассмотренных рядов наблюдений. Для сравнения приводятся также Q для синтезированных рядов данных сопоставимой длительности с линейной дальней корреляцией, характеризующейся = 0.4, и для рядов независимых отсчетов, где Q /RQ = (RQ +1)/RQ. Из рисунка видно, что в эмпирических данных наблюдений, в особенности данных речного стока Q при малых RQ существенно выше, чем в синтезированных рядах данных с сопоставимыми значениями .

–  –  –

Рисунок 5.3 — ПРВ интервалов PQ (r) в единицах среднего интервала RQ для (a) количества осадков и (b) расхода речного стока для RQ = 10 (), 40 () and 160 () (сверху вниз) .

Для раздельного восприятия, ПРВ для RQ = 40 и 160 были смещены вниз на 2 и 4 декады, соответственно. Выброс для r = 1 отражает эффект выраженной кратковременной зависимости .

–  –  –

Рисунок 5.4 — Зависимость средних интервалов Q между кластерами превышений порогов Q, характеризующихся средними интервалами RQ .

Для сравнения приводятся данные для некоррелированных рядов и рядов с линейной дальней корреляцией с = 0.6

–  –  –

Рисунок 5.5 — Наложение ПРВ интервалов i = ri 1 между выбросами xn Q для рядов длительных эмпирических наблюдений количества осадков и расхода рек в различных регионах мира .

Штриховыми линиями даны аппроксимации -распределением [50] На рис. 5.5 приведены ПРВ Q PQ ( ) как функции /Q для того же набора порогов Q. После исключения неоднородности, обусловленной различной выраженность эффектов кратковременной зависимости, для каждого значения RQ наблюдается универсальный вид ПРВ интервалов между превышениями порога количеством выпавших осадков, независимо от локальных гидрометеорологических и климатических условий. Несколько больший разброс наблюдается для данных наблюдений расхода воды в реках, что может быть связано в том числе с его антропогенным регулированием, однако достаточно типичная универсальная зависимость сохраняется для регионов с различным характером почв и динамикой эвапотранспирации .

Полученная универсальная зависимость хорошо аппроксимируется распределением, параметры которого и зависят только от значения RQ, что подтверждается результатами статистического теста Габэ-Ибрагимова, ориентированного на сравнение асимптотического вида медленно убывающих распреде

–  –  –

Рисунок 5.6 — Наложение ПРВ интервалов i = ri 2 между выбросами xn Q .

Фоном показаны результаты для линеаризованной модели с фиксированным эффективным значением eff. [50] .

лений [211]. Для количества осадков растет с ростом RQ и для больших RQ приближается к = 1, при котором -распределение переходит в обычное экспоненциальное, что отражает непредсказуемость осадков на больших временных интервалах .

Следует отметить, что аналогичная форма универсального масштабноинвариантного распределения была ранее показана для интервалов между превышениями различных порогов Q данными длительных сейсмических наблюдений в различных регионах мира, причем параметры и не зависели не только от региона наблюдения, но и от среднего интервала RQ [25]. В дальнейшем было показано, что данный результат может быть воспроизведен на основе линеаризованной модели, где дальняя корреляция для всех значений порога RQ учитывается в рамках единой линейной модели с заданной корреляционной экспонентой eff. [180; 212] .

Как видно из рис. 5.6, линеаризованная модель с эффективным значением корреляционной экспоненты eff показывает также удовлетворительное качество аппроксимации для данных длительных гидроклиматических наблюдений. Для количества осадков eff = 0.65 (RQ = 10), eff = 0.8 (RQ = 40) и eff = 0.9 (RQ = 160) аппроксимация наиболее точна, что отражает слабую выраженность нелинейных эффектов. При этом эмпирические данные и синтезированные реализации с линейной дальней корреляцией сопоставимой длины демонстрируют сопоставимый уровень статистического разброса ПРВ. Для данных речного стока, для всех значений порога RQ в качестве единственного параметра линеаризованной модели подходит eff 0.4, а статистический разброс более выражен при малых значениях аргумента /Q, что отражает характерные различия в кратковременной динамике, влияющие на значение Q .

Таким образом, несмотря на разброс эмпирических показателей асимптотического поведения, отражающийся значениями в диапазоне от 0.8 до 1 для динамики количества осадков и от 0.4 до 0.8 для динамики речного стока, линеаризованная модель удовлетворительно воспроизводит эмпирические ПРВ при eff от 0.65 до 0.9, в зависимости от RQ, для динамики количества осадков, и eff = 0.4 для речного стока. Расхождение между и eff предположительно обусловлено влиянием нелинейных эффектов .

Таким образом, проведенный анализ большого объема эмпирических данных показал, что PQ ( ), = r 1 может быть приближенно описано распределением [ ](Q)1 [ ] 1 PQ ( ) exp (Q). (5.1) Q Q Q Результаты анализа для выборки из 32 репрезентативных рядов наблюдений в регионах мира с существенно различными климатическими и гидрологическими особенностями приведены на рис. 5.5. Следует отметить, что описание интервалов между выбросами xi Q на основе -распределения было ранее показано также для данных длительных сейсмических наблюдений в различных регионах мира [25] .

Универсальный вид ПРВ интервалов наблюдается на фоне существенного разброса корреляционных свойств, характеризующихся H = 0.5... 0.65 для интенсивности осадков и H = 0.55... 1 для стока рек [114; 166]. При этом для обоих типов данных отмечена нелинейная зависимость, а для стока рек, являющихся результатом частичного интегрирования интенсивности осадков, наблюдается также выраженная кратковременная зависимость (ближняя корреляция) [60] .

Универсальные статистики интервалов повторения выбросов удовлетворительно воспроизводятся линеаризованной моделью (3.2) c эффективными параметрами Heff. = 0.8, eff. = 0.4 как для гидрологических и метеорологических (см .

рис. 5.6) [50], так и для сейсмических данных [212] .

–  –  –

для t RQ / t .

За счет различного вклада нелинейной и в особенности кратковременной зависимости, эффективность прогнозирования существенно различается, см .

рис. 5.7. Исследование стока рек со слабовыраженной линейной дальней корреляцией (H 0.65) указывает на существенный вклад кратковременной и нелинейной зависимости. Феноменологическая линейная модель, где кратковременная зависимость дополнительно задается АР1 с интервалом корреляции s = 3 суток, точно воспроизводит линейную ФФ F (s) и АКФ C(s) исходных данных, однако вероятность правильного прогнозирования выбросов D при тех же значениях

–  –  –

0,8 0,4 0,2 0 0,2 0,4 0 0,2 0,4 Рисунок 5.7 — Рабочие характеристики прогнозирования интенсивности осадков и стока рек по репрезентативной географической выборке [60]

–  –  –

Рисунок 5.8 — Рабочие характеристики прогнозирования интенсивности осадков и расхода воды в реках по выборке данных с малыми значениями H2 [60] ложной тревоги оказывается ниже на 0 .

1... 0.2, по сравнению с эмпирическими данными, что отражает вклад нелинейной составляющей дальней корреляции, см. рис. 5.8 [60] .

5.1.3 Примеры анализа и модельного описания отдельных рядов данных длительных гидроклиматических наблюдений

–  –  –

Рисунок 5.9 — Результаты флуктуационного анализа для данных длительных наблюдений температуры воздуха, интенсивности осадков и стока рек [68] исключением тренда (MF-DFA) [113] .

Затем на основании значений h (1) и h (5) выбирались оптимальные значения параметров a и b. Наконец, на завершающем этапе нужное значение H (2) достигалось путем операции, известной как “сдвиг мультифрактального спектра”, подробно описанной в работе [114]. Корректность аппроксимации статистических флуктуационных характеристик ab-моделью проверялась для трех значений момента q = 1, 2, 5. Репрезентативные выборки из результатов MF-DFA для данных температурных наблюдений приведены на рис. 5.9 (а – район верхнего течения р. Камы, б – Казань, в – Екатеринбург, г – Сыктывкар). Видно, что даже с учетом краткосрочного тренда характеристики достаточно хорошо аппроксимируются логарифмическими функциями F (s) ln s (показаны сплошными линиями), что обусловлено значением H, близким к 0.5 (значение для последовательности из независимых отсчетов), при этом наклон аппроксимирующих кривых практически не зависит от значения момента q, что подтверждает монофрактальный характер данных с превалирующей линейной зависимостью .

Результаты аналогичного анализа данных о количестве осадков (рис. 5.9, д

– Иркутск, е – Казань, ж – Нижний Новгород, з – Санкт-Петербург) показывают, что в одних случаях (е, ж) монофрактальная модель с единственным параметром H по-прежнему уместна, в других же (д, з) наклоны флуктуационных функций существенно различны и требуется применение мультифрактальной модели. Для рис. 5.9, д эти параметры составили a = 0.62, = 0.76, H = 0.48, для рис. 5.9, з

– a = 0.6, = 0.77, H = 0.45. Флуктуационные функции для модельных аппроксимаций с указанными параметрами даны на рис. 5.9 сплошными линиями .

Результаты анализа потока воды в реках (рис. 5.9, и – Дунай, к – Некар, л – Гаула, м – Везер) во всех случаях указывают на необходимость применения мультифрактальной модели, параметры которой представлены в таблице. Результаты анализа модельных реализаций с этими параметрами даны на рис. 3 сплошными линиями .

На рис. 5.10 приведены результаты оценки дополнительных функций распределения FQ (r) = 1 FQ (r) интервалов между выбросами свыше заданных порогов Q, соответствующих средним интервалам RQ = 10 (черные кривые) и 70 (серые) для тех же репрезентативных реализаций, что и на рис. 5.9. Штриховыми кривыми 2 даны FQ (r) для модельной аппроксимации, предложенной по результатам согласования флуктуационных функций, оцененных методом DFA .

Рисунок 5.10 — Оценки дополнительных функций распределения вероятностей для данных длительных наблюдений температуры воздуха, интенсивности осадков и расхода воды в реках [68] Штриховые прямые 1, приведенные для сравнения, соответствуют экспоненциальному распределению, характерному для пуассоновского потока событий .

Из рисунков видно, что для температурных колебаний во всех представленных случаях удовлетворительное качество аппроксимации достигается растянутым экспоненциальным распределением FQ (r) exp (r ), = 0.65. Данный результат соответствует H = 1 /2 = 0.675, что хорошо согласуется с результатами предшествующего анализа [166], где в качестве наивероятнейших значений указываются H 0.6... 0.7. При анализе данных уровня осадков применялись аналогичные аппроксимации (рис. 5.10, д – = 0.9, е – = 0.72, ж – = 0.6, з – = 0.95). Видно, что при аппроксимации монофрактальной моделью распределение интервалов для модельных реализаций оказывается значительно уже истинного (рис. 5.10, е, ж), в то время как в случае аппроксимации ab-моделью, напротив, оказывается значительно шире истинного (рис. 5.10, д, з). Наконец, при анализе расхода воды в реках получены еще более широкие распределения, причем в данном случае распределения интервалов для модельных реализаций удовлетворительно аппроксимируют истинные распределения по результатам наблюдений (рис. 5.10, и – = 0.5, к – = 0.45, л – = 0.56, м – = 0.43), по крайней мере, для минимального значения RQ = 10. Спадающие характеристики для RQ = 70 можно отнести за счет малого объема выборки. Следует также отметить, что при анализе рис. 5.10 не отмечается типичного для мультифрактальных данных эффекта, когда распределения интервалов для больших значений RQ значимо шире, чем для меньших. По результатам анализа можно заключить, что вклад нелинейной зависимости в интервальные статистики в большинстве рассмотренных случаев выражен слабо .

На рис. 5.11 приведены рабочие характеристики прогнозирования рассмотренных показателей (зависимости вероятности правильного прогнозирования выброса D от вероятности ложного прогноза ) RQ = 70, t = 1 с использованием метода на основе оценки WQ (t; 1) (кривые 1) и метода распознавания характерного предиктора (кривые 2), подробно описанных выше. Для обучения во втором методе использовались модельные реализации, сформированные с параметрами, установленными для каждого случая по результатам флуктуационного анализа .

На рис. 5.11, а-г сплошными линиями представлены рабочие характеристики для прогнозирования аномально высоких температур, штрих-пунктирными – для аномально низких температур. Штриховые линии D = соответствуют сценарию Рисунок 5.11 — Рабочие характеристики прогнозирования данных длительных наблюдений температуры воздуха, интенсивности осадков и стока рек [68] отсутствия значимых корреляций в ряду наблюдений. На рис. 5.11, д-м даны характеристики только для аномально больших значений. При анализе аномально низких значений были получены качественно сопоставимые результаты .



Pages:   || 2 | 3 |



Похожие работы:

«№ На № _ от _ "УТВЕРЖДАЮ" Управляющий ЗАО "ЛСР. Недвижимость-Урал", действующий на основании Доверенности от 18.01.2016 г., удостоверенной нотариусом нотариального округа Санкт-Петербурга Козловым К.В. и зарегистрированной в реестре...»

«Inspiron 15 3000 Настройки и технические характеристики Модель компьютера: Inspiron 15-3567 нормативная модель: P63F нормативный тип: P63F002 Примечания, предостережения и предупреждения ПРИМЕЧАНИЕ: Пометка ПРИМЕЧАНИЕ указывает на важную информацию, которая пом...»

«Сергей Тармашев Неотвратимая гибель Серия "Холод", книга 1 Текст предоставлен издательством http://www.litres.ru/pages/biblio_book/?art=4997795 Холод. Неотвратимая гибель : [фантастический роман] / Сергей Сергеевич Тармашев: АСТ; Москва; 2013 ISBN 978-5-17-077892-8 Аннотация В...»

«АГЕНТСТВО ПЕРСПЕКТИВНЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ (АПНИ) НАПРАВЛЕНИЯ РАЗВИТИЯ ЕСТЕСТВОЗНАНИЯ И ТЕХНИЧЕСКИХ НАУК В СОВРЕМЕННЫХ УСЛОВИЯХ Сборник научных трудов по материалам Международной научно-практической конференции г. Белгород, 30 августа 2018...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ГОСУДАРСТВЕННАЯ КОРПОРАЦИЯ ПО АТОМНОЙ ЭНЕРГИИ "РОСАТОМ" НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЯДЕРНЫЙ УНИВЕРСИТЕТ "МИФИ" СНЕЖИНСКИЙ ФИЗИКО-ТЕХНИЧЕСКИЙ ИНСТИТУТ НИЯУ МИФИ IХ научно-практическая конференция...»

«Версия 2.0 Установка и активация ООО "ЭСТИ" 2018 Этот документ содержит описание процедур инсталляции и активации программного пакета Аксиомa.ГИС.В комплект документации Аксиомы.ГИС входят: Руководство пользователя Установка и активация (нас...»

«Масло моторное тепловозное М-14Д2 РПБ № 84035624.02.38641 стр. 3 по ТУ 38.301-19-147-2009 Действителен до 14.07.2020 г. из 16 1 Идентификация химической продукции и сведения о производителе и/или поставщике 1.1 Идентификация химической продукции Масло моторное тепловозное М-14Д2. [1]. 1.1.1 Техническое на...»

«Elec.ru Электротехническая библиотека Elec.ru ГОСТ 14340.4-79 МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ ПРОВОДА ЭМАЛИРОВАННЫЕ КРУГЛЫЕ МЕТОД ИСПЫТАНИЯ ИЗОЛЯЦИИ НА ТЕПЛОВОЙ УДАР Издание официальное БЗ 10-98 ИПК ИЗДАТЕЛЬСТВО СТАНДАРТОВ Москва Электротехническая библиотека Elec.ru Электротехническая библиотека Elec.ru Группа Е49 УДК 6...»

«УСПЕХИ ФИЗИЧЕСКИХ НАУК ПОД РЕДАКЦИЕЙ П. П. ЛАЗАРЕВА и Э. В. ШПОЛЬСКОГО ТОМ VIII ИЮЛЬ —АВГУСТ ВЫП. 4 СОДЕРЖАНИЕ Стр. И. А. Каблуков. С. Аррениус и его теория электролитической диссоциации 427 А. Ф. И...»

«1 Работа на форумах – важный аспект инженерной деятельности или Первый шаг к облачному университету В.Очков (http://twt.mpei.ac.ru/ochkov) Студент, приступая к выполнению расчетного задания, прежде всего узнает, нет ли готовой "рыбы" – уже выполненного до него и сданного преподавателю такого же или близкого по теме расчета в виде коп...»

«АВТОМОБИЛЬНЫЙ ВИДЕОРЕГИСТРАТОР AdvoCam-FD Black РУКОВОДСТВО ПОЛЬЗОВАТЕЛЯ Перед установкой и использованием этого изделия внимательно прочтите руководство пользователя. СОДЕРЖАНИЕ № стр. Меры предосторожн...»

«ПЕРВОЕ ИНФОРМАЦИОННОЕ ПИСЬМО ФГАОУ ВО "Северо-Восточный федеральный университет имени М.К. Аммосова" Технический институт (филиал) в г. Нерюнгри ФГАОУ ВО "Северо-Восточный федеральный университет имени М.К. Аммосова" Юж...»

«Общество с ограниченной ответственностью "Тенсар Инновэйтив Солюшнз" СТАНДАРТ СТО 09686559Тенсар Инновэйтив ОРГ АНИЗАЦИИ 003-2015 Солюшнз" УТВЕРЖДАЮ. Соловьев ГЕОРЕШЕТКИ ПЛАСТМАССОВЫЕ ЭКСТРУДИРОВАННЫЕ ОДНООСНООРИЕНТИРОВАННЫЕ TENSAR СЕРИИ RE500 Технические условия г. Санкт-Петер...»

«SUiSV У Я УХ объединенный ИНСТИТУТ идериых ИССЯ8Д013НИЙ дубна 1-84-639 ИССЛЕДОВАНИЕ ОСОБЕННОСТЕЙ ПРОХОЖДЕНИЯ РЕЛЯТИВИСТСКИХ ЭЛЕКТРОНОВ ЧЕРЕЗ ТОЛСТЫЕ МОНОКРИСТАЛЛЫ ПОД МАЛЫМИ УГЛАМИ К НАПРАВЛЕНИЮ КРИСТАЛЛОГРАФИЧЕСКОЙ ОСИ 1 1 1 Направлено в Письма в...»

«АО "Радио и Микроэлектроника" Выключатели вакуумные РиМ ВВ-10 ВНКЛ.674152.001 РЭ Руководство по эксплуатации Новосибирск Содержание 1 ОПИСАНИЕ И РАБОТА 1.1 Назначение ВВ 1.2 Технические характеристики 1.3 Комплект поставки ВВ...»

«Министерство образования и науки Российской Федерации федеральное государственное автономное образовательное учреждение высшего образования "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ" Школа базовой инженерной подготовки Направление подготовки 43.03.02 Туриз...»

«1 УДК 621.1.36.7(035.5) Теплотехнические расчеты с использованием "облачных" функций д.т.н. Очков В.Ф., студент Нгуен Тиен Санг Национальный исследовательский университет "МЭИ"1 В статье на примере расчета и оптимизации паротурбинного энергетического цикла с двумя регенеративными подогревателями описана но...»

«Министерство образования и науки Российской Федерации федеральное государственное автономное образовательное учреждение высшего образования "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ" Инженерная школа природных ресурсов Направление по...»

«ЗАО НПФ "КОМАГ – Б" ОКП 422200 УТВЕРЖДАЮ Главный инженер Московского метрополитена _А. В. Ершов "_"2002 г. ГЕНЕРАТОР АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ СКОРОСТИ (Г – АРС) Руководство по экс...»

«Электронный научно-практический журнал АПРЕЛЬ 2018 "МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК" СЕЛЬСКОХОЗЯЙСТВЕННЫЕ НАУКИ УДК 631 ЗЕМЛЕУСТРОИТЕЛЬНЫЕ МЕРОПРИЯТИЯ ПО БЛАГОУСТРОЙСТВУ ПРИУСАДЕБНОГО УЧАСТКА КФХ "РОСТОК" КАК ФАКТОР РАЗВИТИ...»

«LM WPAM-2B РУКОВОДСТВО ПО ЭКСПЛУАТАЦИИ Вышка передвижная несамоходная телескопического типа LM WPAM-2B-080 АС LM WPAM-2B www.lemarus.ru www.lemarus.ru Общие сведения Введение Настоящее руководство по эксплуатации распространяется на вышку передвижную несамоходную телескопического типа...»

«Гусева Наталья Владимировна МЕХАНИЗМЫ ФОРМИРОВАНИЯ ХИМИЧЕСКОГО СОСТАВА ПРИРОДНЫХ ВОД В РАЗЛИЧНЫХ ЛАНДШАФТНОКЛИМАТИЧЕСКИХ ЗОНАХ ГОРНО-СКЛАДЧАТЫХ ОБЛАСТЕЙ ЦЕНТРАЛЬНОЙ ЕВРАЗИИ Специальность 25.00.07 – "Гидрогеология" Автореферат диссертации на соискание ученой степени доктора геолого-минералог...»

«Многомерный ИКР и законы развития систем А.В. Кислов, г. Санкт-Петербург Рассматриваются следствия вариативности формулировок ИКР и возможность сужения поля сильных решений за счёт привязки к каждому ИКР соответствующих зак...»







 
2019 www.librus.dobrota.biz - «Бесплатная электронная библиотека - собрание публикаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.