КОГНИТИВИСТИдейное ядро²Узелки на распуткуУзел 1. Причина степенных распределений
Узел 1.18 Локальные и глобальные размерности графов
Прологи: наука о сознании становится точной
Манифест когнитивиста
.
Узелки на распутку
Узел 1. Причина степенных распределений
Узел 1.2 Механизмы развитияУзел 1.3 Причины и экстремальные принципыУзел 1.4 Максимум специальных энтропийУзел 1.5 Мультипликативный закон сохраненияУзел 1.6 Когнитивные фракталыУзел 1.7 Вязкость сознания и число eУзел 1.8 Модель БернуллиУзел 1.9 Принцип микро-причинностиУзел 1.10 Случайно блуждающие ландшафтыУзел 1.11 Субстанции формы и содержанияУзел 1.12 Размерность Хаусдорфа и метрическая связностьУзел 1.13 Вне-пространственные фракталыУзел 1.14 Фракталы на графахУзел 1.15 Фрактальная размерность графов и сетейУзел 1.16 Фрактальность древовидных графовУзел 1.17 Фрактальная размерность и степенная статистика
Узел 1.18 Локальные и глобальные размерности графов
Узел 1.19 Локальные и глобальные размерности графов (II)Узел 1.20 Локальные и глобальные размерности графов (III)Узел 1.21 Критические графы как фракталыУзел 1.22 Критические графы как фракталы (II)Узел 1.23 Возвращение к БернуллиИнтерлюдия. Две простые задачиУзел 1.24 Зоопарк критических графовУзел 1.25 Зоопарк критических графов (II)Узел 1.26 Режим стохастической самоподдержкиУзел 1.27 Растущие кластеры и размерность решетокУзел 1.28 Фрактальные и не-фрактальные решеткиУзел 1.29 Энтропия ростаУзел 1.30 Энтропия графов и пространствУзел 1.31 Игра в инверсию
Узел 2. Опус о числах и формах
.
Прологи
.
Степенные законы, распределения Парето и закон Зипфа
.
Когнитивный уровень
.
Мерцающие зоны
.
Органическая логика: резюме
Карта органической логики
.
Хвост ящерки. Метафизика метафоры.
.
Опус 1/F
.
Anschauung, научный метод Гёте
.
Закон серийности Пауля Каммерера
.
Ранние признаки критических переходов
.
Слабые сигналы
.
Меметика
.
Системный анализ и чувствительные точки
.
Спиральная динамика
.
Узел 1.18 Локальные и глобальные размерности графов
 
Роман Уфимцев
23 сентября 2014 года, Калининград
редакция 6 марта 2015 года
Тропа нашего разговора о степенных распределениях и фракталах уходит глубоко в клубок сложных вопросов, связанных с теорией графов и сетей, и фракталов на них. Нам удалось "выдернуть" из него пару нитей - например, установить размерность масштабно-инвариантной сети (она же модель Барабаши-Альберта) и обнаружить, что фрактальная структура на графах может и не сопровождаться степенной статистикой - как в случайном графе, имеющем экспоненциальное распределение узлов по числу связей. Однако, в целом, клубок весьма запутан, и автор решил на некоторое время отступить от него, чтобы вооружиться дополнительными инструментами анализа графов и сетей - вскоре мы с ними познакомимся.
А пока у нас есть принципиально важный вопрос для подробного разбирательства. Речь идет о высказанной нами гипотезе, что фрактальная размерность как главная характеристика фракталов необходимо является величиной, зависящей от наблюдателя или, точнее, зависящей от точки зрения, с которой мы наблюдаем фрактал.
Это обстоятельство не имеет особого значения, если мы говорим о фракталах в пространстве - например, геометрических. Теоретически их размерность выглядит одинаково с любой точки зрения. Но оно становится принципиальным, когда мы обращаемся к фракталам на графах и сетях - их размерность может выглядеть совершенно иначе с разных точек зрения и, более того, они могут выглядеть фракталами только со строго определенных точек зрения, и даже только из одной-единственной.
Эта "теория фрактальной относительности" очевидно противоречит традиционным представлениям фрактальной геометрии, в которой фрактальная размерность считается объективной характеристикой фрактала, независимой от точки зрения на него - попросту в ней нет понятия о "точке зрения". Однако, автор, сначала испытывая легкие сомнения, а затем и серьезные подозрения, вынужден был обратиться к этой гипотезе, поскольку только она позволяет внести ясность в некоторые темные места теории фракталов. Эти темные пятнышки почти незаметны в классической теории, но они превращаются в огромные пятна, когда мы начинаем заниматься фракталами на графах и сетях.
Итак, приступим к ниспровержению заблуждений...
Вновь о проблеме глобального определения размерности графа
Как мы говорили, основным методом определения фрактальной размерности графов - если судить по многочисленным публикациям на эту тему - считается метод покрытия графа пятнами того или иного размера L. Размер пятен определяется как расстояние между двумя максимально удаленными друг от друга узлами (принадлежащими одному пятну) + 1. С ростом размера пятен их требуется все меньше, чтобы покрыть весь граф. И если тут предполагать ту же закономерность, которая действует для пространственных фракталов (метод покрытия квадратиками), то фрактальная размерность графа должна задаваться как
где M - общее количество узлов графа, а N(L) - количество необходимых для его покрытия пятен размера L. В англоязычной литературе определяемая таким образом размерность обозначается как "box-counting dimension".
Идея этого метода совершенно прозрачна - он является простой калькой метода оценки фрактальной размерности геометрических фракталов, который мы называем методом покрытия квадратиками (а в англоязычной литературе он называется также - "box-counting method"). Однако, на практике немедленно становится заметно слабое место идеи: количество необходимых для покрытия графа пятен N существенно зависит от выбора схемы покрытия. И чем менее плотен и однороден граф, тем менее надежной кажется оценка N.
Например, возьмем древовидный граф и попробуем покрыть его пятнами размеров L=3 и L=5:
Слева приведены результаты покрытия одним из возможных автоматических методов: берется вершина графа и создается пятно нужного размера вокруг нее, затем берутся узлы, не вошедшие в первое пятно, и вокруг них строятся другие пятна, и т.д. А справа приведены схемы оптимального покрытия, дающие минимальное число N. Как видим, результаты очень серьезно различаются - причем этом различие в случае древовидных графов не нивелируется с ростом размера графа. Возникает вопрос: а какая схема покрытия должна считаться "правильной", какая дает "верное" значение N(L)? Единственный разумный ответ - "правильной" является схема покрытия, дающая минимальное N.
Однако, поиск такой схемы в общем случае и на больших графах - чрезвычайно сложная задача, не имеющая простого решения. А раз так, само определение размерности через покрытие пятнами не имеет фундаментальной достоверности - оно опирается на величину N(L), определение которой - самостоятельная и не имеющая простых решений задача.
Впрочем, для более насыщенных связями и однородных графов проблема выбора схемы покрытия становится менее критической. Например, проведем в древовидном графе дополнительные горизонтальные связи, и N(L), полученное автоматической схемой покрытия сразу приблизится к оптимальной схеме:
Таким образом, метод покрытия пятнами оказывается более-менее адекватным только для достаточно насыщенных связями и достаточно однородных графов - и как раз такие графы изоморфны пространственным фракталам, для которых обычно хорошо работает метод покрытия квадратиками. То есть - и это важный пункт - метод покрытия графа пятнами становится адекватен только тогда, когда граф похож на пространственный фрактал. В этом случае покрытие пятнами графа представляет собой операцию по сути совпадающую с покрытием квадратиками пространственного фрактала.
Но и с методом покрытия квадратиками не все так просто. Обсуждая этот классический метод оценки фрактальной размерности мы видели, что он также дает погрешность, связанную с выбором схемы покрытия фигуры и выбора формы покрывающих элементов. Эта погрешность теоретически нивелируется при ее покрытии все более мелкими элементами, но по сути эта проблема имеет тот же смысл, что и вопрос о выборе схемы покрытия графа - и она также в принципе не поддается простому общему решению.
Эти соображение и заставляют усомниться в фундаментальной обоснованности метода покрытия пятнами или квадратиками - идет ли речь о графах или о фракталах в пространстве. Для его адекватности необходимо, чтобы мы получали принципиально одинаковые оценки фрактальной размерности вне зависимости от выбора схемы покрытия - а это условие может быть выполнено только асимптотически, в пределе бесконечно маленьких покрывающих элементов (для пространственных фракталов) или наоборот, бесконечно больших (для графов). То есть, сам метод покрытия имеет только асимптотический смысл - а значит, лишь теоретический, но не практический.
Локальные определения фрактальной размерности
Но какова альтернатива, если методы покрытием квадратиками и пятнами неадекватны? Мы нашли такую альтернативу для пространственных фракталов - это метод метрической связности. Припомним, что в нем фрактальная размерность D определяется из пропорции
где A - средняя внутренняя связность фрактала (то есть, среднее количество соседей у точек, входящих во фрактал), AM - собственная связность ячеек пространства, в котором разворачивается фрактал, и DM - метрическая размерность пространства.
Опыты показали, что оценка размерности этим методом как правило оказывается точнее, чем методом покрытия квадратиками, и к тому же проще с вычислительной точки зрения. И заметим один момент: величина A, которая, собственно, и определяет размерность D, определена тут как среднее значение связности по всем точкам фрактала. Но ведь мы можем говорить не о среднем, а об индивидуальном значении связности для каждой точки фрактала Ai - и получать оценку фрактальной размерности Di - также для каждой отдельной точки фрактала индивидуально. Тогда общая фрактальная размерность является усреднением оценки размерности по всем отдельным точкам фрактала:
То есть, глобальная или независимая от выбора точки фрактала ("точки зрения") оценка размерности есть усреднение по всем локальным оценкам размерности. Предполагая общую однородность фрактала - то есть, примерную тождественность его свойств в каждой точке, такое усреднение выглядит осмысленным, позволяя получить оценку размерности, избавленную от влияния малозначимых локальных флуктуаций.
Однако, если бы фрактал был бы существенно неоднородной фигурой, локальные размерности которой существенно различны, подобное усреднение уже не кажется разумной операцией - то есть, это не всегда возможная и оправданная операция. Таким образом, метод метрической связности в своей основе привязан к конкретной точке фрактала, и размерность в нем оценивается как она видится из конкретной его точки.
Тот же "недостаток" свойственен альтернативному методу оценки размерности графов - методу растущего кластера:
Наблюдая, как с ростом расстояния R от выбранного узла растет количество доступных узлов графа S(R) (растущий кластер), мы оцениваем его размерность - но эта оценка принципиально делается для конкретного узла: мы получаем размерность графа как она видится из данного узла.
Полагаю, читатель видит прямую аналогию: метод растущего кластера, также как и метод метрической связности, не зависит от трудно формализуемых вещей как выбор схемы покрытия пятнами или квадратикам, он не имеет этого фундаментального недостатка, темного места. Но он по своей сути также является методом оценки не глобальной, а локальной размерности графа.
Разумеется, тут мы также можем прибегнуть к усреднению размера растущего кластера по всем узлам графа и так получить оценку "глобальной размерности". Но это усреднение, как и в случае метода метрической связности, оправдано и имеет смысл только в том случае, если граф однороден и в нем нет особых узлов или областей.
Заметим еще, что метод растущего кластера не вполне локален: определение размерности опирается на скорость роста S(R) при R, стремящемся к бесконечности. Но, по аналогии с тем, как мы обосновывали метод метрической связности, можно вывести и локальное соотношение.
Положим, что для какого-то идеально фрактального графа при любых R выполняется
Дифференцируя это выражение по R, и используя очевидные подстановки и преобразования, получим:
Примем R=1, тогда S(R) = S(1) - это количество непосредственных соседей у данного узла, обозначим эту величину как zi(1). Производная S'(1) равна приросту S(R) при изменении R от 1 до 2 - а это количество соседей соседей или количество соседей второго колена от исходного узла. Обозначая эту величину как zi(2), окончательно получим:
Это чрезвычайно простое выражение и есть определение локальной размерности графа как она видится из узла i. Обратим внимание, что оно выглядит аналогично определению локальной размерности пространственного фрактала:
Чтобы интуитивно освоиться с локальным взглядом на размерность, обсудим простые примеры пространственных фигур в "квадратно-гнездовом" метрическом пространстве и изоморфных им графов:
Разным цветом обозначена разная локальная размерность точек пространственного фрактала и графа, определенные описанными выше методами. В целом заметно определенное согласие между оценками: точки или узлы, расположенные "внутри" имеют большую локальную размерность, нежели точки или узлы на "поверхности", и в этом имеется какой-то интуитивно понятный резон.
Сначала обсудим локальные размерности пространственной фигуры.
Мы видим, что даже простой квадрат как фигура и фрактал (а геометрический квадрат является фракталом с размерностью D=2) не вполне однороден с точки зрения локальных размерностей. Он имеет особые зоны, лежащие на периметре, и особенно выделяются его углы. С ростом размера квадрата (или при его покрытии все более мелкими ячейками метрического пространства) относительная доля особых зон снижается и это позволяет "не замечать" локальные отклонения фрактальной размерности - усреднение по всем точкам в этих условиях все более приближается к традиционно приписываемой квадрату размерности D=2.
Любопытно, что с точки зрения классической теории, периметр квадрата как его граница имеет фрактальную размерность D=1, а его углы, являющиеся точками, собственную размерность D=0. Локальное понимание размерности позволяет увидеть эту тенденцию непосредственно: точки, лежащие на периметре квадрата имеют меньшую локальную размерность, чем в его массиве, а точки на углах - еще меньшую (конкртные значение зависят от метрической связности пространства AM как мы ее определяем). То есть, нам не нужно абстрагировать границу или углы квадрата от него самого - свойственные им более низкие собственные размерности мы видим сразу.
В целом нечто подобное мы видим и на "квадратно-гнездовом" графе, хотя из-за особенностей определения локальной размерности, имеются небольшие артефакты - например, в нитевидном графе более низкую размерность имеют не крайние узлы, а "пред-крайние", что несколько противоречит интуиции. Далее, нулевую размерность строго по определению имеет не одинокий узел, а простейшая "молекула", образованная двумя узлами. Размерность одинокого узла является неопределенной величиной - при ее вычислении возникает неопределенность типа деления 0 на 0. Это обстоятельство приводит к двум выводам: во-первых, локальная размерность графа определена только узлов, имеющих хотя бы одну связь с другими, во-вторых, операцию усреднения локальных размерностей всех узлов графа для получения его глобальной размерности следует проводить не так
поскольку если в графе имеются одинокие узлы, мы получим неопределенность в некоторых слагаемых, а вот так:
И еще кое-что: в отличие от определения локальной размерности точек пространственного фрактала, в которое входят величины AM (собственная связность метрического пространства) и DM (его размерность), в определении локальной размерности узлов графа нет подобных дополнительных величин, и это естественно отражает тот факт, что графы в общем случае не связаны с каким-то пространством.
Локальные и глобальные размерности древовидных сетей
"Теория фрактальной относительности" - это серьезное изменение нашего взгляда на вещи. Мы, ни много ни мало, отказываемся от традиционных методов определения и оценки глобальной фрактальной размерности, считая, что фундаментально следует говорить только о локальных размерностях точек фрактала или узлов графа. И лишь при определенных условиях имеет смысл усреднение локальных размерностей, дающее нам глобальную характеристику фрактала - его общую фрактальную размерность.
В этой связи интересно первым делом пересмотреть результаты, полученные нами для двух типов древовидных графов - для масштабно-инвариантной сети и для аналогичного ей случайного графа, который строится при исключении правила "богатый становится богаче". Как мы знаем, первая сеть характеризуется степенным распределением узлов по числу связей с θ=3, а вторая - геометрическим распределением со средним значением 2.
Мы установили, что наилучшее приближение размерности, оцениваемой методом растущего вокруг вершины сети кластера для масштабно-инвариантной сети задается уравнением:
а для случайной сети:
Но локальная размерность DG1 для вершин обоих сетей неожиданно оказывается одинаковой:
Это действительно любопытно. Разница двух сетей заключается в локальных размерностях остальных узлов сети и, как следствие, в глобальной усредненной размерности по всей сети 〈DGi〉. Разберемся с этим.
Усредненная размерность графа определяется выражением:
Сумма z1(1)+z2(1)+z3(1)+... и для одной и для другой сети равна 2N (N - общее количество узлов в сети), поскольку она равна произведению общего числа узлов на среднее количество непосредственных соседей у них, то есть, среднее количество связей у узлов сети. И для масштабно-инвариантной и для случайной сети среднее количество связей равно 2.
Оценим теперь вторую сумму z1(2)+z2(2)+z3(2)+... - это количество соседей второго колена для всех узлов сети. Она отличается для двух сетей. Начнем с более простой случайной сети.
Случайная сеть. Нам нужно найти среднее количество соседей второго колена для узлов случайной сети. Умножив его на N, мы получим сумму z1(2)+z2(2)+z3(2)+... Рассмотрим некоторый узел сети и двинемся по одной из исходящих от него связей к ближайшему соседу узла:
Если распределение узлов сети по количеству связей соответствует простому геометрическому распределению Ф(x) = 1/2x, каким будет это распределение для ближайших соседей, к которым мы придем таким образом - обозначим его как G(x)? Следует понять, что оно будет другим, нежели вообще для узлов сети, потому что чем больше у узла связей (чем больше x) тем вероятнее он окажется чьим-то непосредственным соседом, и тем вероятнее мы к нему придем, двигаясь по связи от исходного узла. Запишем это так:
Константу C мы найдем из условия нормирования распределения G(x), так что окажется, что
Теперь, зная форму распределения G(x), мы можем вычислить среднее количество непосредственных соседей у непосредственных соседей исходного узла. Оно равно
Заметим, что в число этих "соседей соседей" входит и сам исходный узел, от которого мы пришли, так что с точки зрения исходного узла (красного) его непосредственный сосед (зеленый) в среднем дает 3-1=2 соседа второго колена. Поскольку в среднем у каждого узла есть по 2 непосредственных соседа, и каждый из них в среднем дает по 2 соседа второго колена, в среднем же каждый узел сети имеет 4 соседа второго колена. То есть, z1(2)+z2(2)+z3(2)+... = 4N. Отсюда получим, что усредненная локальная размерность узлов случайного графа - то есть, его глобальная размерность:
Хотя это интересный результат - глобальная размерность случайной сети не зависит от ее размера - он заставляет усомниться в осмысленности этой величины. Как мы видели выше, локальная размерность вершины случайной древовидной сети логарифмически растет с ростом N:
А среднее значение локальных размерностей остается постоянным. Это значит, что случайная сеть очень неоднородна по размерностям и осмысленность операции усреднения оказывается под вопросом.
Масштабно-инвариантная сеть. Движение по той же тропинке натыкается на некоторое препятствие: хотя среднее количество непосредственных соседей у узлов сети неизменно и равно 2, среднее количество соседей второго колена оказывается расходящейся величиной - оно логарифмически нарастает с ростом размера сети.
Можно показать (это выходит за рамки нашей нити), что в пределе большого размера масштабно-инвариантной сети она имеет следующее распределение вероятностей узлов по числу связей (то есть, по количеству непосредственных соседей):
Из этого мы легко получаем выражение G(x):
Но среднее значение случайной величины, подчиняющейся этому распределению, оказывается расходящимся - оно беспредельно растет вместе с размером сети не вполне очевидным образом.
Чтобы обойти эту сложность, будем использовать при анализе не частотные, а ранговые формы распределений. Например, распределение крупнейших узлов масштабно-инвариантной сети по количеству связей в ранговой форме выглядит следующим образом:
Заметим, что точная форма распределения Ф(x) в этом смысле существенно отличается от упрощенной степенной формы
для которой крупнейшие узлы сети имеют ранговое распределение
В соответствии с точным выражением количество связей у крупнейшего узла сети (это обычно ее вершина):
Тут уместно рассмотреть следующую задачу: пусть мы имеем N узлов и нам известно уравнение распределения Ф(x). Сколько связей в среднем будет у самого богатого связями узла? Ответ X определяется как решение уравнения:
Оно имеет следующий смысл: ожидаемое максимальное значение X таково, что вероятность появления узлов с еще большим количеством связей (в сети размером N) равна 1/2. Применим его к нашему случаю. Речь идет о хвосте распределения Ф(x), а значит, во-первых, мы можем использовать его приближенную форму, а во-вторых, использовать интегральное приближение суммы:
Откуда и получаем:
Нам нужно перейти от общего рангового распределения узлов по количеству связей H(rank) к ранговому распределению узлов, к которым мы можем прийти по некоторой связи - мы знаем, что оно в общем имеет другую форму. Но для начала составим ранговое распределение связей сети по количеству связей у тех узлов, к которым они идут - обозначим его как H'(rank) (будем помнить, что каждая связь приходит к двум узлам). Его форму не трудно установить исходя из простых соображений. Посмотрим на ранговое распределение H(rank):
Первая точка распределения x=1 соответствует узлу максимального ранга, обладающему H(1) связей. Это значит, что в сети имеется H(1) связей, двигаясь по которым мы придем в этот узел - а он имеет H(1) связей. Далее, в сети имеется H(2) связей, двигаясь по которым мы придем в узел 2, содержащий H(2) связей, и т.д. Это наблюдение позволяет нам понять форму распределения H'(rank):
Нам нет необходимости записывать аналитическую форму этого рангового распределения, чтобы вычислить его среднее значение. Оно равно
где HN - гармоническое число от N. Столько в среднем связей будут иметь узлы, если мы пришли к ним по случайно выбранной связи. Обратим внимание на следующее: основное влияние на полученную величину имеют узлы первых рангов - то есть, имеющие максимальное количество связей, и поэтому отличия реального распределения от используемого тут нами рангового мало влияют на результат - они касаются только узлов с большими рангами и малым количеством связей.
Значит, в среднем каждая исходящая от узла связь даст ему HN - 1 соседей второго колена. Далее, мы знаем, что в среднем от узлов отходит по 2 связи, значит, в среднем каждый узел имеет по 2*(HN - 1) соседей второго колена.
Теперь мы можем, наконец, получить оценку глобальной размерности масштабно-инвариантной сети при достаточно больших ее размерах:
Тут мы используем приближение гармонического числа логарифмом, γ - постоянная Эйлера-Машерони.
Итак, в отличие от случайной древовидной сети, глобальная размерность которой не зависит от размера и равна 2, глобальная размерность масштабно-инвариантной сети растет пропорционально логарифму ее размера. Заметим, что этот результат отличается от тех оценок размерности, которые мы получали методом растущего от вершины кластера - в тех результатах размерность обоих типов сетей росла логарифмически с ростом N. Но теперь мы полагаем, что наше новое определение глобальной размерности графов как особого усреднения локальных размерностей всех узлов является более осмысленным (несколько позже мы увидим, что тогда мы вообще ошибались в подходе, а потому получили неверный результат.)
PS. от 25.09.2014. Автору удалось преодолеть кое-какие математические трудности, так что некоторые выводы приведенные в этой нити скорректированы.
Ваш комментарий
image Поля, отмеченные звездочкой, нужно обязательно заполнить
Заголовок комментария:
image Текст комментария: (не более 2000 символов, HTML-разметка удаляется)
image Ваше имя:
Ваш E-mail:
image Сколько будет дважды два? (ответьте цифрой, это проверка от спам-рассылок)
Отправить комментарий
Главные темы
Внимание (8)Геогештальт (1)Гештальт (16)Динамика внимания (5)Инсайт (5)Интуиция (2)Кибернетика (5)Когнитивное управление (6)Когнитивный анализ (4)Когнитивный словарь (5)Культура наблюдения (5)Мерцающие зоны (7)Метафизика (3)Метафора (13)Механизмы восприятия (15)Мифы и парадигмы (7)Органическая логика (5)Прогнозирование (6)Роль языка (4)Симметрии (5)Синхронизмы (5)Сложные системы (10)Степенной закон (8)Творческое мышление (5)Три уровня систем (4)Управление знаниями (3)Фазы развития (7)Фракталы (18)Цветные шумы (9)
КОГНИТИВИСТ: когнитивные методы и технологии © Роман Уфимцев, при поддержке Ателье ER