КОГНИТИВИСТИдейное ядро²Узелки на распуткуУзел 1. Причина степенных распределений
Узел 1.17 Фрактальная размерность и степенная статистика
Прологи: наука о сознании становится точной
Манифест когнитивиста
.
Узелки на распутку
Узел 1. Причина степенных распределений
Узел 1.2 Механизмы развитияУзел 1.3 Причины и экстремальные принципыУзел 1.4 Максимум специальных энтропийУзел 1.5 Мультипликативный закон сохраненияУзел 1.6 Когнитивные фракталыУзел 1.7 Вязкость сознания и число eУзел 1.8 Модель БернуллиУзел 1.9 Принцип микро-причинностиУзел 1.10 Случайно блуждающие ландшафтыУзел 1.11 Субстанции формы и содержанияУзел 1.12 Размерность Хаусдорфа и метрическая связностьУзел 1.13 Вне-пространственные фракталыУзел 1.14 Фракталы на графахУзел 1.15 Фрактальная размерность графов и сетейУзел 1.16 Фрактальность древовидных графов
Узел 1.17 Фрактальная размерность и степенная статистика
Узел 1.18 Локальные и глобальные размерности графовУзел 1.19 Локальные и глобальные размерности графов (II)Узел 1.20 Локальные и глобальные размерности графов (III)Узел 1.21 Критические графы как фракталыУзел 1.22 Критические графы как фракталы (II)Узел 1.23 Возвращение к БернуллиИнтерлюдия. Две простые задачиУзел 1.24 Зоопарк критических графовУзел 1.25 Зоопарк критических графов (II)Узел 1.26 Режим стохастической самоподдержкиУзел 1.27 Растущие кластеры и размерность решетокУзел 1.28 Фрактальные и не-фрактальные решеткиУзел 1.29 Энтропия ростаУзел 1.30 Энтропия графов и пространствУзел 1.31 Игра в инверсию
Узел 2. Опус о числах и формах
.
Прологи
.
Степенные законы, распределения Парето и закон Зипфа
.
Когнитивный уровень
.
Мерцающие зоны
.
Органическая логика: резюме
Карта органической логики
.
Хвост ящерки. Метафизика метафоры.
.
Опус 1/F
.
Anschauung, научный метод Гёте
.
Закон серийности Пауля Каммерера
.
Ранние признаки критических переходов
.
Слабые сигналы
.
Меметика
.
Системный анализ и чувствительные точки
.
Спиральная динамика
.
Узел 1.17 Фрактальная размерность и степенная статистика
 
Роман Уфимцев
9 сентября 2014 года, Калининград
Под занавес предыдущей нити мы пришли к мысли, что фрактальные свойства графов и сетей, в отличие от свойств геометрических фракталов, должны быть исследованы не для них целиком, а только с точки зрения конкретного узла в графе или сети. То есть, мы можем, например, говорить, что ковер Серпинского имеет определенную размерность Хаусдорфа - и это утверждение одинаково релевантно как для фрактала целиком, так и для любой его области в частности, поскольку части ковра Серпинского подобны ему в целом. Однако, если мы говорим о фрактальной размерности, скажем, масштабно-инвариантной сети, мы можем утверждать нечто лишь о ее размерности, как она видится из того или иного узла сети, но не о ее размерности в целом. Исключением являются лишь фрактальные графы, изоморфные тем или иным пространственным фракталам - их размерность, как она видится из разных узлов, теоретически одинакова.
Эта гипотеза - о возможности определения фрактальной размерности графов лишь относительно их конкретных узлов - противоречит распространенному мнению в среде исследователей этого предмета (хотя автору попадалась статья с осторожным высказыванием той же идеи). Большая часть цитируемых работ на эту тему отталкивается от метода определения размерности графов с помощью покрытия пятнами. Этот метод является косметической модификацией классического метода покрытия квадратиками, который используется для оценки размерности пространственных фракталов. Теоретически он должен позволять нам оценивать размерность графа не для конкретных узлов, а для графа целиком. Однако, на практике этот метод более-менее адекватно работает только для графов определенной конфигурации - для графов, изоморфных пространственным фракталам или (судя по результатам, описываемым в многочисленных статьях) для натуральных сетей, обладающих какой-то "удобной" для этого метода конфигурацией. Он совершенно не годен для оценки размерности, например, масштабно-инвариантной сети или критических случайных графов Эрдеша-Реньи (мы обсуждали их в Прологах, и еще о них поговорим). На этом основании некоторые приверженцы метода даже утверждают, что масштабно-инвариантная сеть и критические графы Эрдеша-Реньи не являются фракталами.
Между тем, эта гипотеза естественно согласуется с альтернативным определением фрактальной размерности графов - методом растущего кластера:
Если с ростом расстояния от некоторого узла сети R количество узлов, попадающих в доступную область S(R), кластер, увеличивается пропорционально некоторой степени от R, то граф является фракталом и имеет размерность DG. Это определение прозрачно и не зависит от дополнительных условий (вроде выбора самого эффективного алгоритма покрытия графа пятнами - чрезвычайно слабое и темное место всего метода покрытия пятнами). Единственный его недостаток (по видимому, нетерпимый для многих исследователей): размерность определяется относительно некоторого конкретного узла, а не вообще для графа в целом.
Но что, если это не недостаток метода, а наоборот, отражение его сущностной достоверности?
Допустим так, но тогда еще острее встает вопрос об соотношении между степенной статистикой графов - конкретно, распределением их узлов по числу связей - и их фрактальной размерностью. Эта связь тверда и проста для пространственных фракталов (и для графов, им изоморфных), но как она выглядит, если сама фрактальная размерность графа определяется только для его конкретных узлов? Ведь степенная статистика характеризует не конкретные узлы графа, а его целиком?
На эти вопросы еще предстоит отыскать ответ, а пока вернемся к теме, поднятой нами некоторое время назад.
Крепкий орешек раскалывается: связь DG и θ
Обсуждая возможную связь степенной статистики графов с их фрактальной размерностью, мы анализировали граф, изоморфный пространственному фракталу с размерностью D=3/2:
Естественной структурной статистикой для такого графа является распределение циклов в его структуре по длине, измеряемой как количество узлов, образующих цикл. Не трудно установить, что это распределение имеет степенную форму с показателем θ=3/2, совпадающим с размерностью графа. Эти наблюдения позволили существенно уточнить наше основное уравнение, связывающее степенную статистику фракталов (и геометрических и графических) с их размерностью:
где DG - фрактальная размерность пространственного фрактала или графа, а DS - собственная размерность структурных элементов фрактала или графа, по которым мы составляем его статистику. Мы, конечно, сразу попробовали применить этот вывод к масштабно-инвариантной сети, которая характеризуется степенным распределением узлов по числу связей с показателем θ=3. Если наша формула верна, то между с размерностью сети целиком и размерностью ее минимальных кластеров должно выполняться соотношение:
(Структурными элементами, по которым строится статистика масштабно-инвариантной сети, являются минимальные кластеры - это совокупности узлов, которые прямо соседствуют с некоторым узлом:
Если размером минимального кластера считать количество таких соседей у каждого узла, то распределение размеров минимальных кластеров совпадает с распределением узлов по количеству связей.)
Однако, далее мы запнулись о непростой вопрос: какова, собственно, размерность этих минимальных кластеров DS в масштабно-инвариантной сети? Если мы знаем показатель θ, но не знаем DS, мы не можем вычислить фрактальную размерность графа DG.
Мы еще раз прошли по тропе логики, приведшей нас в тупик, чтобы оценить решение, выводящее из него. Посмотрим снова на граф с размерностью DG=3/2. Его удобно строить итеративно - также, как строятся идеальные геометрические фракталы:
С каждой итерацией 1) увеличивается общее количество узлов в графе N, и 2) увеличивается размер крупнейшего структурного элемента Hmax - тут у нас это центральный цикл. Не трудно заметить, что на любой итерации выполняется элементарное соотношение:
Полученная константа оказывается равной показателю степени θ в распределении циклов графа по размеру. Вообще, мы приходим к следующим соотношениям, прямо следующим из степенной природы фрактальной статистики:
Например, посмотрим, как они выполняются для масштабно-инвариантной сети: ожидаемое количество связей у самого богатого связями узла в ней растет как квадратный корень от ее размера:
И это полностью согласуется с полученными нами соотношениями (применяем стохастический вариант, поскольку масштабно-инвариантная сеть - стохастический фрактал), потому что
а показатель θ равен 3.
В этих соотношениях наблюдается некая связь между размерностью полного графа DG и общим количеством узлов в нем N с одной стороны, и размерностью структурных элементов графа DS с количеством узлов в максимальном структурном элементе Hmax с другой стороны. И это наводит на следующую мысль: DS - это не вообще размерность структурных элементов фрактала, а конкретно размерность крупнейшего из них. Эту разницу мы не замечаем, например, в обсуждавшемся выше графе с циклами, поскольку собственная размерность крупнейшего цикла вроде бы равна размерности всех циклов. Но она становится заметна, если мы говорим о структурных элементах масштабно-инвариантной сети. Дело в том, что если понимать максимальный по размеру структурный элемент сети - а это кластер узлов, прямо соседствующих с вершиной сети (обычно она является самым богатым связями узлом сети) - как маленькую самостоятельную масштабно-инвариантную сеть, то ее размер равен
Как мы установили в предыдущей нити, размерность масштабно-инвариантной сети как она видится из ее вершины равна
Значит, собственная размерность крупнейшего структурного элемента сети:
Тогда отношение DG/DS равно тому, которое должно получаться, если выполняются наши соотношения:
С этой точки зрения соотношение
справедливо и для масштабно-инвариантной сети, и у нас не может быть никаких сомнений, что она действительно является фракталом, размерность которого, однако, растет вместе с его размером, и этим она отличается от традиционных фракталов. Очень интересно, что рост размерности не вызывает изменений степенной статистики, поскольку вместе с ростом общей размерности сети растет и собственная размерность ее крупнейшего структурного элемента - кластера ближайших соседей вершины. Но независимо от общего размера сети, отношение DG/DS остается постоянным, и это обеспечивает постоянство показателя степенной статистики θ.
Уф... Кажется, нам удалось расколоть этот весьма крепкий орешек: мы имеем универсальное уравнение, связывающее размерности любого рода фракталов (и пространственных и графических) с их степенной статистикой.
Полученное нами соотношение неожиданно позволяет систематически описать довольно трудную для анализа особенность масштабно-инвариантной сети: вообще-то показатель ее степенной статистики только асимптотически приближается к значению θ=3, достигая его в пределе очень большой сети. Если сеть сравнительно невелика, показатель статистики имеет несколько меньшие значения. И этот феномен прямо отражается в отношении размерностей DG/DS, если использовать не приближенное, а более точное значение размерности сети (и ее максимального кластера):
Отсюда следует, что ожидаемое значение показателя θ в зависимости от размера сети:
А вот сравнение теоретической зависимости θ(N) c результатами числовых опытов с сетями различного размера:
Как видим, они довольно хорошо согласуются между собой, а систематическое отклонение может быть связано с несовершенством метода оценки показателя θ по опытным данным.
Вообще, даже предсказание общей формы зависимости θ(N) является серьезным подтверждением верности полученного нами соотношения между размерностями и степенной статистикой.
Но это еще не все: мы теперь можем убедиться, что случайная сеть с геометрическим распределением узлов по количеству связей также является фракталом - но особого рода, фракталом без степенной статистики.
Как мы выяснили, размерность случайной сети как она выглядит из первого узла при ее построении:
Из уравнения геометрического распределения узлов по числу связей также следует, что ожидаемый размер максимального структурного элемента (кластера из ближайших соседей вершины сети плюс сама вершина):
Значит, отношение DG/DS:
Из чего теоретически следует:
Получается, что показатель степенной статистики случайной сети с ее ростом сравнительно быстро растет (чуть-чуть медленнее, чем ln(N)) - в то время, как θ масштабно-инвариантной сети, хотя и тоже постепенно нарастает, сходится к пределу θ=3. Такого предела нет у случайной сети:
В результате узлы растущей сети попросту не успевают набрать столько связей, сколько им "положено" иметь в соответствии с текущей размерностью сети - так вместо степенного развивается геометрическое распределение узлов по количеству связей. Говоря фигурально, геометрическое распределение можно рассматривать как "неуравновешенное" степенное, развивающееся при быстром росте показателя степени θ с увеличением размеров сети.
Кажется странным рассматривать экспоненциальное/геометрическое распределение как какое-то "неуравновешенное" степенное, поэтому поясним эту мысль. В случайной сети распределение узлов по количеству связей отвечает элементарному геометрическому распределению:
Построим его график в двойных логарифмических координатах:
Как мы знаем, в таких координатах степенные функции выглядят как прямые линии, чем круче их наклон, тем больше показатель степени θ. К графику геометрического распределения можно провести касательные, соответствующие различным степенным функциям. При этом с ростом числа узлов хвост геометрического распределения растет (появляются узлы, лежащие все дальше в этом хвосте), и с этим ростом степенная касательная в этой области становится все круче, что и означает рост θ в соответствии с уравнением
Подведем предварительный итог. Масштабно-инвариантная сеть является фракталом, особенность которого - рост размерности вместе с размером сети. Однако, показатель степенной статистики при этом остается в пределе постоянным. То есть, мы имеем конечный показатель степени в статистике, но отсутствие конечной размерности фрактала - и это нечто такое, чего мы не видели в геометрических фракталах. Именно поэтому мы высказывали мысль, что показатель θ должен рассматриваться как более фундаментальная и надежная характеристика фракталов, нежели их фрактальная размерность.
Но мы также нашли и еще более причудливый тип фракталов, в которых растет и размерность и показатель степенной статистики, причем настолько быстро, что статистика системы оказывается в каждый момент времени не степенной, а экспоненциальной. Это очень странный результат, противоречащий нашей максиме "фракталы=степенная статистика", но мы видели, что у нас одинаковые основания считать фракталами и масштабно-инвариантную и случайную сеть. Таким образом, нам приходится прийти к выводу, что фракталы могут иметь экспоненциальную статистику, хотя для этого необходимо, чтобы их фрактальная размерность DG быстро нарастала с размером фрактала, существенно опережая рост размерности структурного элемента максимального размера DS.
Полученные нами результаты позволяют предположить, что фрактальная размерность графов и сетей, характеризующихся степенными распределениями узлов по количеству связей, обязательно растет с ростом размера графов, пропорционально логарифму N:
Если так, то оценки размерности различных натуральных сетей, которыми увлеченно занимаются исследователи степенных феноменов в графах и сетях, могут оказаться совершенно не показательными для понимания явлений или сущностных особенностей структуры сетей, а лишь характеризовать объем доступных данных: больше анализируемая сеть - больше размерность. Действительно, мы приводили примеры популярных примеров натуральных сетей со степенным распределением узлов по числу связей. И что же мы видим? Оценки размерности действительно растут вместе с объемом сети. Например, в часто цитируемой статье "Self-similarity of complex networks" (Chaoming Song, Shlomo Havlin) для оценок размерности применяется метод покрытия пятнами (в общем принципиально негодный), и приводятся следующие результаты:
Структура WWW. N=325729 страниц в статистике, θ=2,6, оценка размерности ≈4,1.
Сеть американских актеров. N=392340 актеров, θ=2,2, оценка размерности ≈6,3.
Сеть межбелковых взаимодействий Homo sapiens. N=946 белков, θ=2,1, оценка размерности ≈2,3.
Сеть межбелковых взаимодействий E. coli. N=429 белков, θ=2,2, оценка размерности ≈2,3.
Как видим, существенно больший размер сетей приводит к систематично большим оценкам размерности - и странно, что на это не обратили внимание раньше.
Критические графы Эрдеша-Реньи
Чтобы убедиться в универсальности наших выводов, обратимся к еще одному известному типу графов, которым также часто отказывают во фрактальности - а между тем, они являются фракталами во полном смысле слова. Это критические графы Эрдеша-Реньи (известные также в англоязычной литературе как ER-model).
Возьмем некоторое число узлов N, и начнем совершенно случайно проводить связи между узлами. До некотрого момента все множество узлов будет образовывать сравнительно небольшие случайные графы, не связанные друг с другом. Распределение их по размеру имеет экспоненциальную форму и эти кусочки не представляют особого интереса. Однако, по мере насыщения множества узлов связями наступает интересный момент - отдельные медленно растущие куски начинают лавинообразно объединяться, так что образуется так называемый гигантский компонент - граф, вбирающий в себя большую часть всех узлов. И кроме него остается небольшое число мелких графов, которым довелось остаться самостоятельными.
Самый интересный момент - это переход между одним состоянием системы к другому, фазовый переход. Во время него гигантский компонент уже развивается, но еще не достигает "супер-размера", а процессы слияния мелких графов идут полным ходом. Эрдеш и Реньи показали, что это критическое состояние наступает в тот момент, когда в множестве из N узлов проведено N/2 связей между узлами. Но еще интереснее, что в этот момент распределение объединенных кусков по числу содержащихся в них узлов приобретает степенную форму с показателем θ=5/2:
Ясно, что в критическом состоянии вся система является фракталом: в роли его структурных частей выступают изолированные графы, и степенное распределение их размеров (по числу узлов) отвечает фрактальности структуры системы. Однако, и каждый из изолированных графов в этом состоянии сам по себе также является фракталом, и возникает вопрос как о фрактальной размерности изолированных критических графов, так и о размерности всей системы.
Мы воспользуемся нашим претендующим на универсальность соотношением:
Нам известен показатель в распределении критических графов по размеру - θ=5/2. Но эти графы являются структурными частями фрактала, который представляет из себя вся система, обозначим ее размерность как DG. Тогда DS - это собственная размерность крупнейшей структурной части системы - крупнейшего графа. Значит, должно выполняться соотношение:
И оно, по видимому, действительно выполняется. Размерность крупнейшего компонента в критическом состоянии системы равна 2 (этот факт достаточно широко известен), а ее фрактальная размерность целиком - 3 (вот это еще требуется доказать). При этом, в отличие от масштабно-инвариантной сети, размерности не зависят от размера системы.
P.S. Позже, уже после этой публикации, автор выяснил, что ситуация выглядит совсем не так: во-первых, размерность крупнейшего компонента равна не 2, а во-вторых, размерность полного критического графа точно не равна 3 - и это, в общем, имеет резон, ведь полный граф более "рыхлый" и менее насыщен связями, чем связные компоненты. Его размерность должна быть наоборот ниже. Причиной заблуждения автора и тех, кто говорит о размерности курпнейшего компонента критического графа как равной 2 является ненадежность определения и метода вычисления размерности графов - тут нам, кажется, удалось расставить точки над i.
Однако, автор оставляет тут собственные неверные рассуждения как напоминание о том, что и собственные скоропалительные выводы, и чужие авторитетные мнения часто оказываются ложными, когда речь идет о вещах, еще не "просвеченных насквозь" критическими и любопытными взорами десятков и сотен научных умов.
Но если крупнейшие критические графы являются фракталами, и их размерность не зависит от количества содержащихся в них узлов, то для них должна быть характерна какая-то собственная степенная структурная статистика - какая же именно? Это точно не распределение узлов по количеству связей - оно в графах Эрдеша-Реньи биномиальное. Тогда что же?
Ваш комментарий
image Поля, отмеченные звездочкой, нужно обязательно заполнить
Заголовок комментария:
image Текст комментария: (не более 2000 символов, HTML-разметка удаляется)
image Ваше имя:
Ваш E-mail:
image Сколько будет дважды два? (ответьте цифрой, это проверка от спам-рассылок)
Отправить комментарий
Главные темы
Внимание (8)Геогештальт (1)Гештальт (16)Динамика внимания (5)Инсайт (5)Интуиция (2)Кибернетика (5)Когнитивное управление (6)Когнитивный анализ (4)Когнитивный словарь (5)Культура наблюдения (5)Мерцающие зоны (7)Метафизика (3)Метафора (13)Механизмы восприятия (15)Мифы и парадигмы (7)Органическая логика (5)Прогнозирование (6)Роль языка (4)Симметрии (5)Синхронизмы (5)Сложные системы (10)Степенной закон (8)Творческое мышление (5)Три уровня систем (4)Управление знаниями (3)Фазы развития (7)Фракталы (18)Цветные шумы (9)
КОГНИТИВИСТ: когнитивные методы и технологии © Роман Уфимцев, при поддержке Ателье ER