КОГНИТИВИСТИдейное ядро²Узелки на распуткуУзел 1. Причина степенных распределений
Узел 1.16 Фрактальность древовидных графов
Прологи: наука о сознании становится точной
Манифест когнитивиста
.
Узелки на распутку
Узел 1. Причина степенных распределений
Узел 1.2 Механизмы развитияУзел 1.3 Причины и экстремальные принципыУзел 1.4 Максимум специальных энтропийУзел 1.5 Мультипликативный закон сохраненияУзел 1.6 Когнитивные фракталыУзел 1.7 Вязкость сознания и число eУзел 1.8 Модель БернуллиУзел 1.9 Принцип микро-причинностиУзел 1.10 Случайно блуждающие ландшафтыУзел 1.11 Субстанции формы и содержанияУзел 1.12 Размерность Хаусдорфа и метрическая связностьУзел 1.13 Вне-пространственные фракталыУзел 1.14 Фракталы на графахУзел 1.15 Фрактальная размерность графов и сетей
Узел 1.16 Фрактальность древовидных графов
Узел 1.17 Фрактальная размерность и степенная статистикаУзел 1.18 Локальные и глобальные размерности графовУзел 1.19 Локальные и глобальные размерности графов (II)Узел 1.20 Локальные и глобальные размерности графов (III)Узел 1.21 Критические графы как фракталыУзел 1.22 Критические графы как фракталы (II)Узел 1.23 Возвращение к БернуллиИнтерлюдия. Две простые задачиУзел 1.24 Зоопарк критических графовУзел 1.25 Зоопарк критических графов (II)Узел 1.26 Режим стохастической самоподдержкиУзел 1.27 Растущие кластеры и размерность решетокУзел 1.28 Фрактальные и не-фрактальные решеткиУзел 1.29 Энтропия ростаУзел 1.30 Энтропия графов и пространствУзел 1.31 Игра в инверсию
Узел 2. Опус о числах и формах
.
Прологи
.
Степенные законы, распределения Парето и закон Зипфа
.
Когнитивный уровень
.
Мерцающие зоны
.
Органическая логика: резюме
Карта органической логики
.
Хвост ящерки. Метафизика метафоры.
.
Опус 1/F
.
Anschauung, научный метод Гёте
.
Закон серийности Пауля Каммерера
.
Ранние признаки критических переходов
.
Слабые сигналы
.
Меметика
.
Системный анализ и чувствительные точки
.
Спиральная динамика
.
Узел 1.16 Фрактальность древовидных графов
 
Роман Уфимцев
4 сентября 2014 года, Калининград
Научный поиск действительно похож на распутывание клубка нитей или блуждание по лабиринту. Лишь запечатленный в учебниках ряд открытий и достижений любой науки выглядит как стройная повесть. Но за этой стройностью и последовательностью не видны бесконечные поиски, ошибки и сомнения человеческого разума, стремящегося понять, как устроен мир. Между тем новое знание почти всегда появляется в окружении ложных гипотез, которые будто прикрывают его до поры от любопытных глаз - как нежные лепестки расцветающих цветов скрыты в бутонах. Эти ложные гипотезы и неверные идеи вовсе не досадная помеха на дороге к знанию, как это иногда кажется. Они играют важную роль - они создают фон, на котором истина, когда она наконец появляется перед нашими глазами, выглядит особенно прекрасно. Без ложных гипотез и тупиковых ветвей научного поиска мы бы не замечали насколько красивее, мудрее и разнообразнее устроен мир, чем все, что мы можем себе вообразить.
Вот уже третью нить мы занимаемся темой фрактальных графов и сетей, и этот предмет находится на рубежах современной науки о фракталах и сложных системах. Тут еще мало фактов, о которых можно говорить уверенно и заносить их в учебники как несомненные истины. Тут еще множество заблуждений и неверных идей, среди которых только предстоит отыскать крупицы настоящего знания. Свою лепту стремимся внести и мы, беспристрастно и тщательно разбираясь во фрактальных свойствах графов и их связи со степенной статистикой.
Увы, на этом тернистом пути и автор оказывается иногда на ложном пути. В конце предыдущей нити мы выдвинули гипотезу, что размерность древовидных фрактальных графов DG связана с показателем степени в распределении узлов по количеству связей θ следующим образом:
Из этого уравнения следует, что масштабно-инвариантная сеть (известная также в русскоязычной литературе как безмасштабная сеть или модель Барабаши-Альберта, а в англоязычной - как BA-model) имеет фрактальную размерность, равную 2 - поскольку в ней узлы по количеству связей отвечают степенному распределению с θ=3.
Это не верный вывод - как минимум, в отношении масштабно-инвариантной сети. Истина, как мы далее увидим, интереснее. Однако, чтобы эта истина была оценена нами по достоинству, будет полезно пройтись по той простой логике, которая нас привела к неверному выводу.
Размерность древовидных графов: ложная гипотеза
Попробуем установить связь степенной статистики древовидного графа (узлов по количеству связей) с его фрактальной размерностью. Будем исходить из определения размерности графа методом растущего кластера, которое в свою очередь опирается на уравнение:
где R - расстояние от некоторого узла (радиус), S(R) - количество доступных узлов внутри радиуса (растущий кластер), а C - некоторая постоянная, характеризующая локальную геометрию графа.
Возьмем узел графа, имеющий максимальное количество связей и разложим остальные узлы графа по отстоящим от него радиусам:
Предположим некоторую упорядоченность графа и будем считать, что чем больше расстояние узлов от центра, тем меньше связей в среднем они имеют. Из выражения S(R) не трудно установить, что при достаточно больших значениях R количество узлов n, находящихся от центра ровно на расстоянии R:
Количество узлов на каждом следующем радиусе определяется количеством связей у узлов на предыдущем уровне: скажем, если у узла на радиусе R имеется 4 связи, то этот узел будет связан с 3 узлами на радиусе R+1. Таким образом, по отношению количества узлов на радиусах R и R+1 не трудно установить, что среднее количество связей Q у узлов, лежащих на радиусе R:
Теперь мы формально знаем, как с ростом R уменьшается среднее количество связей у узлов Q(R) и как при этом увеличивается их количество n(R), однако если мы попробуем из этих соотношений прямо получить зависимость n(Q) - а она соответствует по смыслу частотному распределению узлов по количеству связей - мы получим неверный результат - степенную зависимость с показателем θ=1 при любых размерностях DG. Причина ошибки в том, что в нашей модели возможны не все, а только некоторые количества связей у узлов, соответствующие радиусам R=1,2,3... в уравнении Q(R). Чтобы избежать этой ошибки, следует сначала вычислить уравнение не частотного, а рангового распределения узлов по количеству связей. Опуская тривиальные вычисления, получим:
Как мы знаем, между показателем степени рангового распределения β и показателем степени частотного распределения θ действует соотношение:
Отсюда окончательно приходим к
Обратим внимание на важный момент: в этом выводе мы исходим из того, что центральным узлом растущего кластера является самый богатый связями узел графа. То есть, строго говоря величина DG тут соответствует размерности графа, какой она видится из самого богатого связями узла, а не из какого-то типичного.
Вот логика, и она действительно довольно проста. Для масштабно-инвариантной сети θ=3, а значит, размерность как она видится из самого богатого связями узла - а обычно это первый узел сети - DG=2. Но это не верный вывод, хотя это легко не заметить - как сначала не заметил и сам автор. Посудите сами: вот типичные результаты для сетей, радикально отличающихся по количеству узлов:
Это зависимость ln(S(R)) от ln(R) для верхнего узла сети, состоящей из 100 тыс. узлов. Наклон прямой линии дает оценку фрактальной размерности - получаем DG≈2,4. А вот сеть всего в 1 тыс. узлов:
Получаем оценку DG≈2. Размер сети различается на целых два порядка, а оценки размерности кажутся очень близкими - это и ввело автора в заблуждение. В действительности, размерность масштабно-инвариантной сети как она видится из ее вершины отвечает интересному уравнению:
где N - общее количество узлов в масштабно-инвариантной сети. То есть, с ростом сети ее фрактальная размерность нарастает, хотя и медленно, как логарифм от ее размера:
Ошибка нашей простой гипотезы заключалась в том, что в ней древовидный граф представлен крайне идеализированно: на каждом радиусе от центра сети узлы имеют одинаковое количество связей, с ростом радиуса количество связей у узлов только снижается. В реальной стохастической масштабно-инвариантной сети ни то ни другое условие не выполняется. И это приводит к совершенно другой связи между размерностью и показателем θ.
Фрактальная размерность масштабно-инвариантной сети
Разберемся с тем, как выводится уравнение DG. Хотя тут есть немного своеобразной математики, автор хочет зафиксировать вывод, поскольку он имеет и общую методологическую ценность. В нем используется так называемый метод уравнения баланса - очень полезный способ анализа стохастических систем, позволяющий вычислять связанные с ними распределения. Читатель, не интересующийся этим инструментом, может пропустить этот параграф.
Прежде всего распределим узлы сети по радиусам R от ее центра (от первого узла при ее построении):
Чтобы выяснить, как выглядит зависимость S(R) нам необходимо знать, как распределяются узлы сети по радиусам R в зависимости от общего количества узлов в сети. Обозначим это частотное распределение как ФR(N), где R - радиус.
При построении масштабно-инвариантной сети каждый узел тем более вероятнее присоединяет к себе новый, чем больше связей он уже имеет. То же самое верно относительно массивов узлов, лежащих на каждом радиусе: массив тем более вероятно присоединит к себе еще один узел, чем большей долей связей обладает массив в общем количестве связей в сети. При этом, естественно, вновь присоединенный узел оказывается не в присоединившем его массиве, в в следующем по радиусу:
Тут, например, массив R=2 содержит 6 узлов, которые имеют в общей сложности 10 связей с узлами других массивов. Заметим, что всего в сети имеется 2*(N-1)≈2*N связей (каждое соединение между двумя узлами дает две связи). В нашем случае в сети всего 28 связей. Когда в системе появляется новый узел, с вероятностью 10/28 он присоединится к одному из узлов массива R=2 - именно такова доля связей этого массива в общем количестве связей в сети. Но присоединившись к этому массиву, новый узел оказывается в массиве R=3.
Выясним вид распределения ФR(N). Начнем с массива R=1. Новые узлы в нем появляются лишь если они присоединяются к вершине, к центру сети - и вероятность этого пропорциональна количеству связей у центрального узла. Поскольку этот узел имеет связи только с узлами массива R=1, эта вероятность равна отношению количества узлов в массиве R=1 - а оно равно N*Ф1(N) - к общему количеству связей в сети:
Теперь мы можем записать так называемое уравнение баланса: в его левой части ожидаемое количество узлов в массиве R=1 после того, как общее количество узлов в системе увеличилось до N+1, а в правой - ожидаемое число узлов массива R=1 при размере сети N плюс ожидаемая прибавка:
Далее, представим новую частоту Ф1 как сумму старого значения частоты и изменения, дифференциала:
Подставляя эту сумму в уравнение баланса и слегка преобразуя, получим:
Трактуя это выражение как дифференциальное уравнение, получим решение:
где C - константа, теоретически значение которой должно быть определено из дополнительного условия: первый узел массива R=1 появляется в момент, когда в сети всего два узла. Но мы не пока будем уточнять ее значение - для нас важен только общий вид зависимости Ф1(N).
Двигаясь тем же путем, можно составить уравнения баланса и для других массивов - вся разница только в том, что следует учитывать не только связи массива с нижестоящим, но и с вышестоящим массивом. Получим общее дифференциальное уравнение для массивов с R более 1:
Так, Ф2(N) является решением дифференциального уравнения:
и его решение:
Тут постоянная C' также должна быть определена из условия, связанного с моментом появления первого узла в массиве R=2. Однако, при больших N мы можем пренебречь вторым слагаемым в решении, приняв C'=0:
Выяснив Ф2(N), мы можем приниматься за выяснение вида Ф3(N), и т.д. В конечном итоге окажется, что общая форма распределения:
Опираясь на условие нормирования распределения, мы устанавливаем значение константы C, и еще более "оттачиваем" его вид, получая распределение Пуассона:
Несмотря на упрощения, к которым мы прибегли при выводе, этот результат весьма удовлетворительно совпадает с опытными распределениями узлов масштабно-инвариантной сети по радиусам.
Теперь мы можем найти S(R) имея в виду, что
Получим, что объем растущего от вершины сети кластера S(R) определяется выражением
Построим, например, график зависимости ln(S(R)) от ln(R) приняв N=100000. Мы увидим, что как и в опытных графиках, имеется начальный линейный участок:
Однако, возьмем очень большую сеть, например, состоящую из 1050 узлов (нечто такое, что заведомо невозможно в вычислительных опытах), и мы увидим, что график зависимости ln(S(R)) от ln(R) теряет линейность:
Дело в свойствах так называемой приведенной неполной гамма-функции, которая является частью выражения S(R):
Она имеет подъем, который близок к степенному только при относительно небольших значениях s - скажем, не более 7. При более высоких значениях подъем отклоняется от степенного - это мы и видим в очень большой сети. Заметим, что значениям s не более 7 соответствуют сети размером не более 1 миллиона узлов.
Однако, это не значит, что сети еще большего размера уже не обладают фрактальной структурой. В действительности, например, в сети размером в 1050 узлов относительно прямолинейный участок графика захватывает радиусы R от 10 до 35 - на таких расстояниях от вершины сети она выглядит вполне фрактально. На меньших расстояниях сказывается влияние не-фрактальной локальной структуры графа - и чем больше сеть, тем эта локальная область больше:
Например, локальная область для сети в 1 млн. узлов простирается примерно до расстояния R=2 от вершины сети и она практически не заметна на графике зависимости ln(S(R)) от ln(R). Но и область фрактальности существенно меньше - она лишь охватывает расстояния R от 2 до 6.
Подобные области нарушения фрактальности вообще характерны при ее оценке методом растущего кластера. Возьмем, например, "квадратно-гнездовой" метрический граф, в котором 1024 узла и построим график зависимости ln(S(R)) от ln(R) как она видится из узла, находящегося в одном из углов графа:
Мы видим, что на графике имеется и область локального нарушения фрактальности (хотя и менее выраженная, чем в масштабно-инвариантной сети) и область нарушения фрактальности, связанная с ограниченным размером графа.
Наиболее достоверной оценкой фрактальной размерности будет та, которая делается по участку, наиболее удаленному от зон нарушения фрактальности. Можно заметить, что в этой области графика он растет быстрее всего. Анализируя S(R) можно установить значение Rf, для которого выполняется это условие (на графиках выше эти значения отмечены зеленой точкой):
И оценка размерности для этих точек:
Вот весь вывод.
И все в этих результатах было бы хорошо, если бы не одно "странное" обстоятельство.
Странное обстоятельство: фрактальность случайной сети
Сравним две зависимости S(R):
Первая относится к масштабно-инвариантной сети, и ее поведение мы только что подробно исследовали. А вторая относится к случайной сети, которая строится также последовательно, но каждый новый узел равновероятно присоединяется к любому из уже имеющихся узлов сети. В случайной сети распределение узлов по количеству связей, естественно, является не степенным, а экспоненциальным (точнее, геометрическим). Но зависимости S(R) выглядят практически одинаково. Это значит, что и для случайной сети на графике зависимости ln(S(R)) от ln(R) имеется прямолинейный участок, по которому мы можем оценить фрактальную размерность сети. Как оказывается, если мы полагаем структуру масштабно-инвариантной сети фракталом, у нас не меньше оснований считать фракталом и структуру случайной древовидной сети.
Но постойте! Не мы ли, начиная разговор о графах, приводили вот такую опытную зависимость ln(S(R)) от ln(R) для случайного графа, отмечая ее нелинейность?
Да, и это еще одно подтверждение как-то раз высказанной нами мысли: когда мы исследуем не природу непосредственно, а абстрактные модели, то числовой опыт - далеко не аналог естественнонаучного эксперимента. Результаты числовых опытов менее достоверны, чем хорошая теория. Нелинейная форма на этом графике относится как раз к области локальной не-фрактальности графа - в случайном графе с ростом его размера она становится заметной много раньше, чем в масштабно-инвариантной сети:
Тут сравниваются зависимости ln(S(R)) от ln(R) для масштабно-инвариантной сети и для случайной сети одинакового размера в 1 млн. узлов. Как видим, область локальной не-фрактальности в случайной сети уже очень заметна. Вообще, если условно для масштабно-инвариантной сети предельный размер, при котором эта область еще не заметна равен примерно 1 млн. узлов (определяется условием ln(√N̅) < 7), то для случайной сети этот размер - всего порядка 1 тыс. узлов (определяется условием ln(N) < 7).
Размерность случайной сети, оцениваемая по прямолинейному участку графика ln(S(R)) от ln(R):
Она также нарастает с ростом сети, и при этом в два раза быстрее, чем размерность масштабно-инвариантной сети.
И вот что получается: либо случайная сеть, которая, как мы знаем, характеризуется экспоненциальным распределением узлов по количеству связей, действительно является фракталом - но при этом он не связан со степенной стастистикой. Либо степенная стастистика масштабно-инвариантной сети (и натуральных сетей, которые имеют подобную степенную статистику) не имеет непосредственного отношения к фрактальности их структуры. Любой ответ означает, что знак равенства в нашей максиме "фракталы = степенная статистика" ставить нельзя.
Это настолько противоречит убеждению, которое сложилось у автора, пока мы распутывали этот узелок, что кажется: он вновь совершенно запутался.
Но не будем унывать - по опыту такие неожиданные "столкновения с истиной" иногда предвещают переход к новому уровню понимания вещей. И первое предположение: случайная сеть действительно является фракталом, как и масштабно-инвариантная. Визуализируем небольшую сеть в 200 узлов:
Ее древовидная форма может ввести в заблуждение: древовидные структуры всегда похожи на фракталы, хотя может быть не всегда ими являются. И вот мы решили проверить: выполняется ли условие, характерное для фракталов: линейный вид зависимости ln(S(R)) от ln(R). Будем оценивать это от вершины сети - первого узла при ее построении (красный узел), и вот что мы увидим:
Она действительно линейна, и оценка размерности близка к теоретической для сети такого размера DG≈1,95. Если бы мы ничего не знали об экспоненциальной статистике этой сети, укрепились бы ли наши подозрения, что она действительно является фракталом?
Или построим растущий кластер из других узлов, каких-то "типичных" (зеленые узлы), и увидим следующее:
И вновь, зависимость близка к линейной, хотя оцененная размерность стала меньше - из этих узлов размерность сети выглядит иначе, она выглядит фракталом, но другим.
Это наводит на необычную мысль: что, если эта сеть действительно является фракталом, но таким, размерность которого принципиально выглядит по разному с разных точек зрения? Для пространственных фракталов понятие "точки зрения" излишне - для них фрактальную размерность можно определить методом покрытия квадратиками, а он не зависит от конкретной точки фрактала, характеризуя его целиком. Иное дело - графические фракталы. Как убежден автор, метод покрытия пятнами (аналог метода покрытия квадратиками) совершенно не годный. А метод растущего кластера принципиально требует выбора его центра - то есть, размерность графа оценивается исходя из его конкретной точки. Это значит, что размерность графа может не являться некоторой универсальной для его общей структуры величиной, а характеризовать роль конкретного узла в структуре - конкретную "точку зрения". И тогда уже не кажется странным, что размерность графов может нарастать с ростом их размера, и при этом они остаются фракталами. И, может быть, эта зависимость размерности фрактала от точки зрения освобождает его от необходимости иметь степенную статистику. То есть, степенная статистика является непременным свойством лишь тех фрактальных графов, размерность которых не зависит от точки зрения - а это, видимо, только те графы, которые изоморфны тем или иным пространственным фракталам. Древовидные фракталы, которые мы тут исследовали - масштабно-инвариантная сеть и случайная сеть - не изоморфны пространственным, а потому и не обязаны иметь степенную статистику (хотя и могут).
Затейливая гипотеза - своего рода "теория фрактальной относительности", хотя в ней, кажется, что-то есть. А может, все проще, и мы просто не видим степенную статистику, которая присутствует и в случайной сети - например, степенной рост кластера с расстоянием от узла - чем не статистика? Об этом следует поразмыслить.
PS. от 25.09.2014. Дальнейшее разбирательство с фрактальными свойствами графов вскоре после публикации этой нити привело автора к радикальному пересмотру определения размерности графов. Обнаружилось, что сам метод, которым мы пользовались в этой нити, не вполне верен, а потому полученные тут оценки размерности сетей ошибочны (для масштабно-инвариантной сети мы тут получили качественно правильные оценки, а со случайной сетью - которая действительно является фракталом - принципиально ошиблись). Однако, автор оставляет эту нить в неизменном виде - во-первых, потому, что в ней содержатся в общем верные мысли, а во-вторых - как иллюстрацию тернистого пути научного исследования.
Ваш комментарий
image Поля, отмеченные звездочкой, нужно обязательно заполнить
Заголовок комментария:
image Текст комментария: (не более 2000 символов, HTML-разметка удаляется)
image Ваше имя:
Ваш E-mail:
image Сколько будет дважды два? (ответьте цифрой, это проверка от спам-рассылок)
Отправить комментарий
Главные темы
Внимание (8)Геогештальт (1)Гештальт (16)Динамика внимания (5)Инсайт (5)Интуиция (2)Кибернетика (5)Когнитивное управление (6)Когнитивный анализ (4)Когнитивный словарь (5)Культура наблюдения (5)Мерцающие зоны (7)Метафизика (3)Метафора (13)Механизмы восприятия (15)Мифы и парадигмы (7)Органическая логика (5)Прогнозирование (6)Роль языка (4)Симметрии (5)Синхронизмы (5)Сложные системы (10)Степенной закон (8)Творческое мышление (5)Три уровня систем (4)Управление знаниями (3)Фазы развития (7)Фракталы (18)Цветные шумы (9)
КОГНИТИВИСТ: когнитивные методы и технологии © Роман Уфимцев, при поддержке Ателье ER