КОГНИТИВИСТИдейное ядро²Узелки на распуткуУзел 1. Причина степенных распределений
Узел 1.10 Случайно блуждающие ландшафты
Прологи: наука о сознании становится точной
Манифест когнитивиста
.
Узелки на распутку
Узел 1. Причина степенных распределений
Узел 1.2 Механизмы развитияУзел 1.3 Причины и экстремальные принципыУзел 1.4 Максимум специальных энтропийУзел 1.5 Мультипликативный закон сохраненияУзел 1.6 Когнитивные фракталыУзел 1.7 Вязкость сознания и число eУзел 1.8 Модель БернуллиУзел 1.9 Принцип микро-причинности
Узел 1.10 Случайно блуждающие ландшафты
Узел 1.11 Субстанции формы и содержанияУзел 1.12 Размерность Хаусдорфа и метрическая связностьУзел 1.13 Вне-пространственные фракталыУзел 1.14 Фракталы на графахУзел 1.15 Фрактальная размерность графов и сетейУзел 1.16 Фрактальность древовидных графовУзел 1.17 Фрактальная размерность и степенная статистикаУзел 1.18 Локальные и глобальные размерности графовУзел 1.19 Локальные и глобальные размерности графов (II)Узел 1.20 Локальные и глобальные размерности графов (III)Узел 1.21 Критические графы как фракталыУзел 1.22 Критические графы как фракталы (II)Узел 1.23 Возвращение к БернуллиИнтерлюдия. Две простые задачиУзел 1.24 Зоопарк критических графовУзел 1.25 Зоопарк критических графов (II)Узел 1.26 Режим стохастической самоподдержкиУзел 1.27 Растущие кластеры и размерность решетокУзел 1.28 Фрактальные и не-фрактальные решеткиУзел 1.29 Энтропия ростаУзел 1.30 Энтропия графов и пространствУзел 1.31 Игра в инверсию
Узел 2. Опус о числах и формах
.
Прологи
.
Степенные законы, распределения Парето и закон Зипфа
.
Когнитивный уровень
.
Мерцающие зоны
.
Органическая логика: резюме
Карта органической логики
.
Хвост ящерки. Метафизика метафоры.
.
Опус 1/F
.
Anschauung, научный метод Гёте
.
Закон серийности Пауля Каммерера
.
Ранние признаки критических переходов
.
Слабые сигналы
.
Меметика
.
Системный анализ и чувствительные точки
.
Спиральная динамика
.
Узел 1.10 Случайно блуждающие ландшафты
 
Роман Уфимцев
23 июля 2014 года, Калининград
Мы завершили предыдущую нить намерением, опираясь на "принцип микропричинности" найти какую-то новую модель развития степенной статистики. А заодно, может быть, найти объяснение какому-нибудь натуральному примеру степенной статистики. Для того, чтобы попробовать его реализовать, посмотрим туда, куда еще мы в этих нитях не заглядывали.
Случайное блуждание и времена возвращения
Важное место в теории случайных процессов, да и в естественных науках, занимает механизм случайного блуждания. Простейший его вариант - одномерный: пусть в начальный момент времени частица находится в точке с координатой 0. Затем в каждый цикл времени она сдвигается, причем сдвиг равен некоторому случайному числу (например, от -1 до 1) - частица начинает случайно блуждать. График положения частицы образует характерную кривую:
Но нас одномерное случайное блуждание тут интересует в одном конкретном аспекте. Частица отправилась в блуждание из точки 0. Блуждание случайное - а значит, она может удалиться от точки 0 как угодно далеко. И тем не менее, мы можем быть уверенными, что рано или поздно частица обязательно вернется в точку старта. Не трудно понять, почему: если вероятность сдвига в ту или иную сторону одинакова (а мы из этого исходим), то вероятность для частицы за некоторый период времени забраться в какую угодно далекую от старта точку в точности равна вернуться из нее обратно за тот же период. Из этого следует, что на каком-то очень большом прогоне времени блуждающая частица обязательно будет возвращаться к точке старта.
И тут возникает интересный вопрос: как распределяются времена возвращения частицы к точке старта?
Пусть красная линия - точка старта. Моменты пересечения этой точки разбивают весь период блуждания на временные отрезки - как они распределяются?
Просвещенный читатель конечно знает ответ: распределение времен возвращения случайного блуждания является степенным с показателем θ=3/2.
Это очень интересный факт, но расхожие его доказательства довольно сложны. Например, в известной статье, посвященной степенным распределениям американец Марк Ньюман прибегает к серьезным упрощениям случайного блуждания и, тем не менее, вывод результата сложен и содержит много этапов (см. параграф "C. Случайное блуждание"). И сам автор, будучи не вполне удовлетворен доказательством Ньюмана, брался в Прологах за эту задачу - но ее также удалось решить лишь прибегая к упрощениям, и все равно доказательство оказалось не простым (см. параграф "2. Распределение времён возвращения случайного блуждания").
Простота механизма, тем не менее, заставляла автора верить, что должно существовать элегантное и прямое доказательство. И вот теперь, когда мы вооружены знаниями, почерпнутыми из наших исследований модели Бернулли, мы познакомимся с идеей такого доказательства.
Взглянем на график случайного блуждания и при этом будем полагать, что смотрим на него издалека:
"Издалека" - значит, нам не видны все детали случайного блуждания. В частности, там, где мы видим просто пересечение графиком стартовой планки, в действительности может быть не все так просто. Разберемся с этим. Пусть издалека мы видим два отдельных момента случайного блуждания, между которыми происходит пересечение планки:
А теперь приблизимся к графику так, что мы оказываемся способны видеть в два раза больше деталей. Тогда там, где мы видели просто пересечение планки мы равновероятно увидим одну из четырех возможностей, различающихся тем, выше или ниже планки оказываются вновь различенные нами точки (отмечены красным):
Первые три варианта ничего не меняют в наблюдаемом нами количестве пересечений стартовой планки, а вот последний дает нам два новых пересечения с минимальным периодом в 1 цикл времени. Таким образом, приблизив к себе график блуждания в два раза мы с вероятностью 1/4 разглядим в любом пересечении планки два дополнительных.
И вот теперь мы можем взглянуть на ситуацию с точки зрения модели Бернулли. Макро-объектами тут у нас являются периоды блуждания между пересечениями стартовой планки, а микро-объектами - единичные отсчеты времени, из которых эти периоды складываются. Что же происходит, когда мы изменяем масштаб наблюдения графика? Все периоды увеличивают свою длину в два раза - то есть, в каждом макро-объекте количество микро-объектов увеличивается в два раза - то есть, относительно. После такого увеличения мы заметим некоторое количество новых периодов единичной длительности, и оно в среднем окажется равным половине прежнего общего количества периодов. (Если с вероятностью 1/4 окончание периода, то есть, пересечение планки, порождает два новых периода, то можно полагать, что с вероятностью 1/2 окончание периода порождает один новый период - то есть, их общее количество в среднем увеличится в полтора раза.) Увеличение количества различимых периодов также относительное, но пропорции различаются: в то время как количество микро-объектов в системе увеличивается в два раза, количество макро-объектов - в полтора. Или в терминах вероятностей, отношение pmicro/pmacro=2.
Нам осталось только разобраться, что является источником макро- и микро-объектов. И тут не приходится задумываться: источником микро-объектов являются микро-объекты - отсюда пропорциональный рост их числа при увеличении графика. Что касается макро-объектов - мы видели, как новые периоды порождаются пересечением планки. Но пересечение планки - это окончание периода. У каждого периода есть только одно окончание. Иными словами, источником новых периодов являются старые периоды.
Итак, при увеличении графика случайного блуждания происходит нечто подобное тому, что происходит в первом варианте модели Бернулли: источник людей - люди, источник городов - города. Подставив полученное выше отношение вероятностей pmicro/pmacro в хорошо знакомое нам выражение, связывающее это отношение с показателем степени результирующего степенного распределения
легко установим, что в данном случае мы имеем степенное распределение времен возвращения с показателем θ=3/2.
Не правда ли, занятно? Не только тем, что это доказательство опирается на самые элементарные соображения (и чуть-чуть на модель Бернулли). Оно интересно тем, что демонстрирует нам применение модели Бернулли в необычном контексте: мы взглянули на развитие системы как на результат простого изменения масштаба ее наблюдения.
Приближаясь к системе в A=2 раза (так что все ее макро-объекты увеличивают свой наблюдаемый размер в два раза) мы начинаем различать в B=1,5 раз больше макро-объектов - и это является признаком степенного распределения с показателем θ=3/2. Не трудно догадаться, что вообще тут действует следующее правило:
Если принять A=2 - то есть, положить, что мы изменяем масштаб наблюдения системы в два раза - и вовсе получим элементарное
Если приближаясь к системе в два раза мы начинаем видеть в два раза больше объектов, мы имеем дело со степенным распределением объектов по размеру с показателем θ=2. Именно об этом случае в контексте механизмов случайного блуждания мы далее и поговорим.
Двухмерное блуждание среди озер России
Вообразим, что график случайного блуждания изображает ландшафт какой-то горной страны, и некоторая планка в нем задает уровень грунтовых вод:
Как будут распределяться размеры (длины) водоемов в этом случае? Вопрос, конечно, имеет прямое отношение к задаче о временах возвращения случайного блуждания - разница только в том, что водоемы образованы только периодами, когда блуждание уходит ниже стартовой планки. Однако, блуждание симметрично относительно любой планки, так что мы даем уверенный ответ: размеры водоемов будут распределяться степенным образом с показателем θ=3/2. Даже если взять более реалистичную картину и предположить, что уровень грунтовых вод несколько различается в разных районах горной страны, это не повлияет на результат:
Причина ясна: на какой бы высоте не начиналась точка начала водоема, точка его окончания определяется задачей о времени возвращения случайного блуждания, так что некоторая разность в уровнях грунтовых вод ничего статистически не меняет.
Интересно, а как распределяются размеры водоемов на самом деле? И тут мы должны говорить уже не об их длине, а об их площади. По данным государственного реестра водоемов России автор собственноручно выяснил, что это распределение очень хорошо отвечает закону Зипфа - то есть, является степенным с показателем θ=2:
(Обратим внимание, что эта диаграмма не частотного, а рангового распределения. В ней по оси Х откладываются номера отсортированных по размеру объектов, а по оси Y - их размер. Если распределение является степенным с показателем θ=2, в ранговом представлении мы видим степенную функцию с показателем -1: тут именно так.)
И дело не в России - подобные результаты получаются и для других стран, в которых достаточно много озер. Возникает естественная идея: а не является ли это результатом заполнения водой какого-то двухмерного варианта случайного блуждания на которое похожи естественные ландшафты?:
Это очень хорошая идея, но ее проверка сталкивается с неожиданной трудностью: а что собственно такое "двухмерное блуждание"? Интуитивно или образно нам это кажется понятным, но когда речь заходит о конкретном алгоритме порождения двухмерного случайного блуждания, возникает проблема. Нет ничего проще, чем алгоритм получения одномерного блуждания: мы берем случайное число, а потом прибавляем к нему еще одно случайное число, потом еще одно - и т.д. Изменяющаяся сумма на каждом этапе и даст одномерное случайное блуждание. Но что делать в двухмерном случае?
Чуть поясним проблему. Скажем, мы можем попробовать представить двухмерное блуждание как совокупность двух одномерных:
Пусть блуждание начинается из стартовой точки A, в которой блуждающая величина имеет значение 0. Далее блуждание идет по оси X - и в точке B к исходному нулю прибавляется какое-то случайное число. Также блуждание идет по оси Y - и в точке C к исходному нулю прибавляется какое-то другое случайное число. Но далее возникает вопрос: а что нам делать с точкой D? Как мы должны получить значение блуждающей величины в этой точке?
Можно пробовать усреднять результаты блуждания к точке D от точек B и С отдельно и прибавлять к этому усреднению еще какое-то случайное число - но подобными способами все-таки нельзя получить действительно хороший результат. Тут нужен несколько другой подход.
Чтобы разобраться в этом, нам следует представить случайное блуждание как-то иначе - не как разворчивание суммы случайных чисел. Идею подскажет явное сходство графика одномерного случайного блуждания со срезами натуральных ландшафтов. Но ведь ландшафты не разворачиваются также, как суммы случайных чисел?
Возьмем некоторую точку ландшафта. Ее высота над уровнем моря является случайной величиной. Но эта случайность не полная - точка испытывает явное влияние соседних. Действительно, если соседние точки ландшафта расположены низко, то и точка между ними скорее всего будет расположена низко, и наоборот. Отсюда идея совершенно другого способа получения кривой, похожей на график случайного блуждания.
Возьмем ландшафт и пусть вначале все точки в нем имеют нулевую высоту. Затем начнем совершенно случайно выбирать точки этого ландшафта и назначать им значение высоты, равное
где Vl и Vr - значение высоты точек слева и справа от выбранной, а X - случайное число (скажем, стандартно нормально распределенное). И окажется, что мы угадали все верно - после достаточно длительного периода эволюции ландшафт приобретет форму, которая ничем не отличается от графика случайного блуждания. Скажем, вот что мы увидим на ландшафте длиной в 500 точек после 100 и после 50 тыс. циклов времени:
Ничего не стоит обобщить этот способ на двухмерный случай: нам нужно только учесть, что каждая точка ландшафтной плоскости испытывает влияние не двух, а четырех соседних (в действительности, не так важно, сколько соседних точек влияет на данную - главное, что взаимное влияние распространяется по плоскости во все стороны):
Например, вот что мы увидим на ландшафте размером 100 на 100 после 1 млн. циклов времени (темные участки соответствуют низинам):
Теперь наполним водой все ямы с точками высот меньше 0:
Кажется, такое "водянистый" ландшафт не очень похож на настоящий, но посмотрим на частотное распределение отдельных водоемов по их площади:
Мы видим, что показатель степени θ близок к двум - и можно быть уверенным в том, что если бы мы взяли ландшафт побольше и позволили ему поразвиваться подольше, мы бы увидели точно двойку. А если смущает непохожесть результата на настоящую карту озер, снизим уровень грунтовых вод - и увидим нечто более похожее на реальность:
Как мы видели это и на примере одномерного блуждания, изменение планки не влияет на статистику - мы будем видеть степенное распределение озер по площадям, соответствующее закону Зипфа.
Кажется, мы нашли простое и убедительное объяснение одному из интересных эмпирических примеров статистики Зипфа. И кроме того, в нашем распоряжении оказалась еще одна модель развития зипфовских распределений. Она мало похожа на те, что мы видели раньше - и это ее несомненное преимущество. Однако, как она соотносится с базовой для нас моделью Бернулли?
Мультипликативные свойства пространства
Распределение размеров и одномерных и двухмерных озер является степенным, хотя в первом случае показатель θ равен 3/2, а во втором - 2. Ясно, что это различие обусловлено субстанциональной разницей между одномерным и двухмерным пространством. Можно говорить, что одномерное и двухмерное пространства обладают разными мультипликативными способностями, которые раскрываются в задаче о случайном блуждании и о распределении размеров озер. Попробуем выяснить суть этого различия и обобщить его для пространств еще более высокой размерности.
Припомним, как мы выяснили, что при увеличении графика случайного блуждания вдвое каждый момент пересечения планки с веротяностью 1/2 может породить еще одно пересечение (то есть, еще один макро-объект):
Имеется четыре равновероятных возможности и в одной из них вместо одного пересечения появляется три. В среднем это означает, что новое пересечение планки появится с вероятностью 1/2. Но рассмотрим этот вопрос чуть иначе. Возьмем одну точку графика случайного блуждания, которая находится достаточно близко к планке:
Тут имеется две возможности - точка находится выше или ниже планки. Для нас это не принципиально, но для удобства будем обозначать точки, находящиеся выше планки черным цветом, а ниже - белым. Дальше анализ будем вести только для первого случая, потому что они совершенно тождественны.
Теперь приблизимся к графику случайного блуждания в два раза. Вместо одной точки мы увидим две, и тут есть две равновероятных возможности (принимая во внимание, что исходная точка находилась близко к планке - а это верно, если мы интересуемся точками близкими к границам периодов блуждания):
В первом варианте макро-объект мы продолжаем видеть один макро-объект, а во втором происходит пересечение планки, а значит, в нашем поле зрения появляется второй объект. Значит, среднее или ожидаемое количество макро-объектов, которые мы разглядим после изменения масштаба:
Разумеется, точно такой же результат мы полчим, если будем исходно рассматривать точку, находящуюся ниже планки:
Число 3/2 - это ожидаемое количество макро-объектов после двухкратного изменения масштаба наблюдения при условии, что до изменения мы видели только один макро-объект. И конечно, не случайно он равен показателю степени в распределении длин "одномерных озер" - θ=3/2.
Мы готовы обобщить этот результат и на двух- и на трехмерный случай, но прежде для удобства изобразим его иначе:
Тут изображены все четыре возможности (с учетом и исходной точки и ниже и выше планки). Результат 3/2 получается делением суммы красных чисел - а они обозначают количество наблюдаемых макро-объектов в каждом случае - на общее число случаев: тут у нас (1+2+2+1)/4 = 3/2.
Перейдем к двухмерному случаю. После двухкратного увеличения каждая точка, находящаяся близко к границе озера, превратится в четыре. И имеется 16 равновероятных вариантов того, что мы увидим:
Мы получим (1+2+2+2+2+2+2+2+2+2+2+2+2+4+4+1)/16 = 17/8 = 2,125. Результат очевидно похож на точное значение показателя степени размеров двухмерных озер θ=2, но все же не равен ему. А причина в том, что мы не верно провели границы для двух случаев: там, где мы насчитали 4 макро-объекта, их в действительности только 3:
С учетом этой поправки все встает на свои места: относительное увеличение количества макро-объектов после двухкратного изменения масштаба равно точно 2 - то есть, равно показателю степени зипфовского распределения.
(Нам нужно обратить внимание на возможность подобных дефектов при использовании "квадратно-гнездовых" упрощений: мы было постановили, что соседствующие по диагонали точки не могут принадлежать одному макро-объекту, но это оказалось в целом не верным. Из-за этого дефекта сначала мы получили завышенный результат. Еще больше подобных вопросов возникает при переходе к трехмерному случаю. В нем возникают не только плоские диагонали, но и объемные.)
В трехмерном случае каждая точка после изменения масштаба превращается в куб, образованный восемью точками. Имеется 256 возможных комбинаций. Автор избавляет читателя от иллюстраций, но результат - относительная прибавка количества макро-объектов - оказывается равной 345/128 ≈ 2,7. Если же учесть "диагональные дефекты", мы получим точное теоретическое значение 5/2 - именно этому числу равен показатель степени распределения объемов "трехмерных озер" в трехмерном блуждающем ландшафте. К слову, степенные распределения в физике, исследующей объемные феномены - например, турбулентность или кавитацию - иногда характеризуются как раз таким показателем.
Чтобы не забыть: о том, как корректировать "диагональный дефект" на трехмерном примере. Рассмотрим пару трехмерных вариантов:
Кроме восьми вершин куба будем рассматривать еще одну точку - центр куба. Если количество черных вершин больше, чем белых, центр считается тоже черным и может служить соединителем - но только для других черных вершин. Например, в первом примере центр куба принадлежит черным и может объединять черные вершины в один макро-объект. Но 5 черных вершин и так объединены прямыми связями. А вот 3 оставшиеся белые вершины разбиты на 2 макро-объекта и они не могут диагонально объединиться в один, потому что центр куба не принадлежит "белой партии". Таким образом с учетом дефекта или без его учета в данном случае мы имеем три макро-объекта.
Второй пример: без учета дефекта (то есть, запрещая диагональные объединения) мы имеем 4 макро-объекта. Центр куба равновероятно принадлежит белым или черным. Но кому бы он не принадлежал, связи через центр снижают количество макро-объектов до 3. Вот так и происходит корректировка "диагонального дефекта".
Итак, мы узнали, что модель Бернулли и собственные свойства пространств различной размерности позволяют нам установить распределение размеров озер в случайно-блуждающих ландшафтах. Например, степенное распределение с показателем θ=2 оказалось тесно связанным с случайно-блуждающими двухмерными ландшафтами. Изменяя масштаб наблюдения в два раза, так что размеры каждого озера увеличиваются в два раза мы увидим двукратное увеличение количества озер.
Фрактальные головоломки
Постойте-постойте! Озера - это макро-объекты. Но что является микро-объектом для двухмерного озера? Не линейные единицы длины, а квадратики площади. Изменяя масштаб так, что линейные размеры озера увеличиваются вдвое мы ведь увеличим количество микро-объектов, содержащихся в каждом озере не в 2, а в 4 раза. И при этом, как мы выяснили, количество озер увеличится в 2 раза. Но модель Бернулли в этом случае нам предсказывает показатель степени θ=3/2 - как в одномерном случае! Неужели, мы где-то допустили ошибку и модель Бернулли тут не применима?
Догадывается ли читатель, в чем тут дело?
Дело в том, что наши озера имеют форму фракталов. Это особенные фигуры. Изменяя масштаб в 2 раза мы вовсе не получаем увеличения общей площади озера в 4 раза - как это было бы верно для круглых озер или вообще имеющих "нормальную" форму. И длина береговой линии, то есть, периметр фрактальных озер - а именно расположенные на периметре озер точки "размножают" их - также ведет себя при увеличении иначе. Приблизив любую "нормальную" геометрическую фигуру в 2 раза мы увеличим ее площадь в 4 раза, а периметр увеличится в два. Тут же площадь увеличивается менее, чем в 4 раза, а периметр озера - наоборот, более чем в 2 раза. И самое странное: длина береговой линии растет пропорционально площади озера.
Это вроде бы ставит все на свои места, но бросает вызов рассудку. Для рек так и должно быть - но для озер? Но посмотрим на более детальную картину:
Озера выглядят как тонкие кружева. В озерах очень много прибрежных точек. И доля таких точек остается неизменной для озер любого размера. Это значит, что длина берега растет пропорционально площади озера.
Конечно, это довольно странно, если говорить о настоящих озерах. И в этом парадоксе еще следует разобраться. А в завершение этой нити еще одна иллюстрация. Что особенного в следующей картине озер?
Кажется, ничего особенного - типичная картина озер в двухмерном блуждающем ландшафте. Но в ней спрятана уменьшенная вдвое собственная копия картины:
Часть картины мы заменили уменьшенной копией ее полного вида - и ее общие характеристики от этого не изменились. Это и есть фрактальное самоподобие - наши озера, несомненно, являются фракталами, которые заслуживают того, чтобы их исследовать внимательнее.
Ваш комментарий
image Поля, отмеченные звездочкой, нужно обязательно заполнить
Заголовок комментария:
image Текст комментария: (не более 2000 символов, HTML-разметка удаляется)
image Ваше имя:
Ваш E-mail:
image Сколько будет дважды два? (ответьте цифрой, это проверка от спам-рассылок)
Отправить комментарий
Главные темы
Внимание (8)Геогештальт (1)Гештальт (16)Динамика внимания (5)Инсайт (5)Интуиция (2)Кибернетика (5)Когнитивное управление (6)Когнитивный анализ (4)Когнитивный словарь (5)Культура наблюдения (5)Мерцающие зоны (7)Метафизика (3)Метафора (13)Механизмы восприятия (15)Мифы и парадигмы (7)Органическая логика (5)Прогнозирование (6)Роль языка (4)Симметрии (5)Синхронизмы (5)Сложные системы (10)Степенной закон (8)Творческое мышление (5)Три уровня систем (4)Управление знаниями (3)Фазы развития (7)Фракталы (18)Цветные шумы (9)
КОГНИТИВИСТ: когнитивные методы и технологии © Роман Уфимцев, при поддержке Ателье ER