КОГНИТИВИСТИдейное ядро²Узелки на распуткуУзел 1. Причина степенных распределений
Узел 1.15 Фрактальная размерность графов и сетей
Прологи: наука о сознании становится точной
Манифест когнитивиста
.
Узелки на распутку
Узел 1. Причина степенных распределений
Узел 1.2 Механизмы развитияУзел 1.3 Причины и экстремальные принципыУзел 1.4 Максимум специальных энтропийУзел 1.5 Мультипликативный закон сохраненияУзел 1.6 Когнитивные фракталыУзел 1.7 Вязкость сознания и число eУзел 1.8 Модель БернуллиУзел 1.9 Принцип микро-причинностиУзел 1.10 Случайно блуждающие ландшафтыУзел 1.11 Субстанции формы и содержанияУзел 1.12 Размерность Хаусдорфа и метрическая связностьУзел 1.13 Вне-пространственные фракталыУзел 1.14 Фракталы на графах
Узел 1.15 Фрактальная размерность графов и сетей
Узел 1.16 Фрактальность древовидных графовУзел 1.17 Фрактальная размерность и степенная статистикаУзел 1.18 Локальные и глобальные размерности графовУзел 1.19 Локальные и глобальные размерности графов (II)Узел 1.20 Локальные и глобальные размерности графов (III)Узел 1.21 Критические графы как фракталыУзел 1.22 Критические графы как фракталы (II)Узел 1.23 Возвращение к БернуллиИнтерлюдия. Две простые задачиУзел 1.24 Зоопарк критических графовУзел 1.25 Зоопарк критических графов (II)Узел 1.26 Режим стохастической самоподдержкиУзел 1.27 Растущие кластеры и размерность решетокУзел 1.28 Фрактальные и не-фрактальные решеткиУзел 1.29 Энтропия ростаУзел 1.30 Энтропия графов и пространствУзел 1.31 Игра в инверсию
Узел 2. Опус о числах и формах
.
Прологи
.
Степенные законы, распределения Парето и закон Зипфа
.
Когнитивный уровень
.
Мерцающие зоны
.
Органическая логика: резюме
Карта органической логики
.
Хвост ящерки. Метафизика метафоры.
.
Опус 1/F
.
Anschauung, научный метод Гёте
.
Закон серийности Пауля Каммерера
.
Ранние признаки критических переходов
.
Слабые сигналы
.
Меметика
.
Системный анализ и чувствительные точки
.
Спиральная динамика
.
Узел 1.15 Фрактальная размерность графов и сетей
 
Роман Уфимцев
28 августа 2014 года, Калининград
Без особого преувеличения, заявленная тема этого Узелка - причина степенных распределений - нами уже раскрыта. Формулируя максимально обобщенно (и поэтому несколько размыто), степенные распределения возникают там, где вступают во взаимодействие две сущности, которые мы по привычкам своего рассудка или по объективным причинам относим к разным логическим уровням. О них можно говорить как о макро- и микро-объектах, а можно говорить как о "субстанции содержания" и "субстанции формы". Если эти две сущности, вступая во взаимодействие, тем не менее, управляются своими собственными законами - например, плодятся с присущей им самим скоростью - развивается степенная статистика феномена, в котором проявлено из взаимодействие.
Экстремальный принцип, руководящий развитием степенных распределений - стремление к максимуму специальной энтропии, в выражении которой имеется компонент ln(G), означающий логарифм среднего геометрического значения случайной величины. Наличие этого компонента и указывает на взаимодействие двух самоуправляющихся или самообусловленных сущностей в системе - именно среднее геометрическое характеризует "модус" их взаимодействия.
Явный структурный признак такого взаимодействия - фрактальная организация феноменов. Фракталы имеются всюду, где мы видим степенную статистику, и лишь наше ограниченное представление о фракталах как о своеобразных геометрических фигурах зачастую мешает нам их разглядеть. Именно поэтому мы от фракталов в пространстве обратились к фракталам на графах. В предыдущей нити мы убедились в том, что традиционные геометрические фракталы являются лишь частным случаем фракталов на графах, или, более широко, вне-пространственных фракталов.
Собственно, необходимость преодоления ограниченного их понимания как красивых пространственных форм - вот основная наша мотивация в данный момент. Если мы хотим достичь глубины понимания степенных феноменов, мы должны существенно расширить наше представление о фракталах и даже преодолеть некоторые шаблоны, которые успели сложиться сфере их исследований.
Традиционно главной величиной, которая характеризует степенную статистику и степенные распределения считается показатель степени в уравнении частотного распределения θ. И традиционно же основной характеристикой фракталов принята их фрактальная размерность D. Поскольку фракталы и степенные распределения неразрывно связаны, между θ и D существует прямая связь, которая должна быть принципиально сходной для геометрических фракталов и фракталов на графах. Для геометрических фракталов эта связь нами уже установлена:
где D - собственная размерность геометрического фрактала, а DM - метрическая размерность пространства, в котором он располагается (чуть далее мы необходимым образом переосмыслим эту величину).
Что касается фракталов на графах и их размерности DG, то автор предполагает, что она выглядит подобным же образом:
Дело лишь за "малым" - выяснить, какая характеристика графов скрывается за X. Это задача, которую нам следует решить, и мы будем подбираться к ее решению не спеша, крадучись.
Один упущенный момент в вопросе степенной статистики
Центральный вопрос в нашем исследовании фракталов - связь их размерности со свойственной им степенной статистикой. Тут выполняется равенство
Для идеально самоподобных фракталов как ковер Серпинского
в которых элементы структуры могут иметь только некоторые размеры, образующие геометрический ряд, действительно несколько другое равенство:
Если в качестве структурных элементов ковра Серпинского мы примем дыры, то их площади могут принимать лишь значения 1, 1/9, 1/81, и т.д., так что для ковра мы должны использовать именно это равенство.
В действительности, для фракталов любого рода - и стохастических и для идеально самоподобных можно записать единое уравнение:
где β - показатель степени рангового распределения этой величины. Для построения рангового распределения мы нумеруем все объекты статистики в порядке снижения их статистического параметра - например, нумеруем все дыры в ковре в порядке снижения их площади. Номер каждой дыры именуется ее рангом. Далее мы строим диаграмму, в которой по оси X откладываются ранги объектов, а по оси Y - их статистические параметры. Если распределение в традиционном частотном представлении является степенным, то и в ранговом представлении оно также оказывается степенным, при этом в общем действует соотношение
Однако, если параметры объектов могут принимать только некоторые значения, образующие геометрический ряд - скажем, в ковре Серпинского площади дыр могут иметь величины только вида C/9k где k=0,1,2... - то между показателем степени рангового и частотного распределений действует другое соотношение:
Вообще, говоря о статистике идеально самоподобных фракталов правильнее говорить не о степенных распределениях, а о фрактальных - дискретных распределениях, которые характеризуются степенной огибающей. Подробнее о этом - в Прологах.
Мы знаем, что размерность ковра Серпинского D=ln(8)/ln(3), а количество дыр в зависимости от их площади:
То есть, показатель степенной статистики θ=ln(8)/ln(9). Поскольку размерность метрического пространства, в котором построен фрактал DM=2, наше равенство точно выполняется:
И тут мы упустили один момент. Говоря о "структурной статистике" вообще, мы оставляем некоторую неопределенность в том, о какой именно статистике идет речь. Например, если бы мы в качестве элементов структуры ковра Серпинского приняли бы не дыры и их площади S, а, например, размеры границ этих дыр, то есть, их периметры P, то статистика бы стала другой:
(Очевидно, почему: площадь дыры S пропорциональна квадрату ее периметра P.) То есть, мы получаем другой показатель структурной статистики θ=ln(8)/ln(3) - значит наше равенство больше не выполняется?
Конечно, дело в величине DM - мы ее понимали как метрическую размерность пространства, в котором развернут фрактал. Но ее следует понимать иначе: это собственная размерность структурных частей фрактала, статистика которых исследуется. Например, если мы считаем структурными частями фрактала дыры и строим их статистику по площадям, то DM=2, потому что площадь имеет размерность 2. А если мы строим статистику по периметрам, DM=1, потому что периметры имеют размерность длины, то есть 1.
Конечно, для ковра Серпинского более натурально выглядит именно статистика по площадям дыр, а не по их периметру (то есть, линейному размеру). Поскольку фрактал построен на двухмерной плоскости, естественно и структурными элементами фрактала считать части этой плоскости, то есть, дыры и их площади. И все же, обращаясь к теме статистики фракталов на графах, нем было необходимо внести это уточнение: DM - это не размерность пространства, в котором строится фрактал, а размерность его структурных элементов.
В соответствии с нашим предположением, для графических фракталов выполняется аналогичное равенство:
или, если граф является идеально самоподобным:
Неизвестную пока нам величину X невозможно понимать как "метрическую размерность пространства, в котором развернут граф", потому что графы не строятся в пространстве. Но вот понимать ее как собственную размерность структурных частей графа, статистика которых исследуется, можно вполне. Пусть это и будет нашей первой гипотезой о значении величины X.
Идеально самоподобные графы и их статистика
Не трудно придумать пространственный фрактал, размерность которого равна 3/2. Например фрактал, который строится следующим образом:
Лишь заменив квадратики на узлы мы совершенно аналогично можем построить фрактальный граф, первые этапы построения которого:
Он точно укладывается на геометрический фрактал с размерностью 3/2, а значит, и сам имеет ту же размерность: DG=3/2.
На примере этого графа, размерность которого нам заведомо известна, удобно еще раз проверить методы оценки фрактальной размерности графов, которые мы сравнивали в предыдущей нити.
Сперва метод покрытия пятнами: если граф является фракталом, то
где M - общее количество узлов в графе, а N(L) - количество пятен размера L, которое полностью покрывает граф. Это значит, что зависимость величины ln(M/N(L)) от ln(L) должна быть линейной. А вот как она выглядит для нашего фрактального графа (проводим испытания на сравнительно небольшом графе, в котором около 4 тыс. узлов - большего не позволяют возможности обычного компьютера, а метод весьма вычислительно "прожорливый"):
Действительно, линейная. Уже хорошо - ведь при использовании этого метода для оценки размерности масштабно-инвариантной сети линейной зависимости тут вообще не видно. Однако, коэффициент пропорциональности - а значит, и оценка размерности DG≈1,03, что неприемлемо меньше настоящего значения DG=3/2.
Теперь второй метод, который автору нравится куда больше - метод растущего кластера. Если граф является фракталом, то
Где R - расстояние от некоторого типичного узла, а S(R) - количество доступных узлов, кластер. И вот что мы увидим для этого графа:
Оценка размерности по этому методу DG≈1,45 - не правда ли, куда лучше? Конечно, результат оценки зависит от выбора центра растущего кластера, но даже для такого, очень небольшого графа, оценки лежат в диапазоне от 1,3 до 1,5, что является прекрасным результатом.
Большая погрешность метода покрытия пятнами связана с тем, что количество пятен, необходимых, чтобы покрыть граф оказывается существенно большим, чем должно быть в теории. Это та самая проблема выбора схемы покрытия. Скажем, если покрывать небольшой кусок этого графа каким-то автоматическим методом, мы скорее всего получим четыре пятна размера L=3, а если подойти к делу "интеллектуально", то хватит трех:
Но хороший метод не должен зависеть от наших творческих способностей и фантазии - этого недостатка нет у метода растущего кластера. Задача оптимального покрытия графов пятнами заданного размера - весьма сложная даже в вычислительном отношении, и это обстоятельство не позволяет считать этот метод ни практичным ни фундаментально осмысленным. Хотя заявляя это, автор идет поперек мнения многих исследователей, которые умудряются с его помощью получать какие-то результаты.
Этот самоподобный граф должен характеризоваться какой-то степенной статистикой. Говоря о его пространственном аналоге, мы можем исследовать, например, распределение площадей дыр по их количеству - и увидим степенное распределение с показателем θ=3/4. Если мы говорим о графе, о площадях дыр в нем говорить нельзя. Однако, можно говорить о кольцах в графе и о длине их периметров - эта длина, измеряемая как количество узлов в цикле, не зависит от пространственного положения узлов:
Не трудно выяснить, что статистика колец по их размеру является степенной с показателем θ=3/2 - то есть, показатель степени совпадает с размерностью графа DG=3/2. Это значит, что в уравнении
величина X должна быть равна 1. Мы предполагаем, что она имеет смысл собственной размерности структурных частей графа, по которым мы строим статистику - и в данном случае так оно и есть: кольца в графе, размер которых мы оцениваем, являются одномерными графами, а значит, X=1.
Кажется, наша гипотеза подтверждается: X - это собственная размерность структурных частей графа, по которым мы исследуем его статистику, будем далее ее обозначать как DS.
Статистика узлов по числу связей
Надо сказать, что мы несколько "схитрили" и начали говорить о степенной статистике графов, подобных пространственным фракталам, а это только их узкая категория и, соответственно, такие структурные элементы как кольца не всегда присутствуют. В действительности, более актуальной темой в связи с фрактальными графами является статистика узлов по количеству связей. Многие натуральные сети и графы описываются тут степенными распределениями, и это обстоятельство привлекает к ним интерес исследователей. В числе примеров - физическая структура всемирной сети:
По оценкам, она характеризуется степенным распределением узлов по числу соединений с показателем θ≈2,6.
Еще один интересный пример - сеть, узлы в которой соответствуют американским актерам, а соединения между узлами проводятся, если соответствующие актеры хотя бы раз пересекались в каком-нибудь кинофильме. Тут также наблюдается степенное распределение узлов по числу связей с θ≈2,2.
Очень важный пример - сети меж-белковых взаимодействий:
Каждая клетка живых организмов содержит тысячи различных белков, которые вступают во взаимодействия, организуясь для выполнения тех или иных функций живых клеток (образуя так называемые "молекулярные машины"). Сеть, в которой узлы соответствуют различным белкам, а связи между ними означают, что данные пары белков вступают во взаимодействия, характеризуются степенным распределением узлов по числу связей, при этом для различных организмов показатель степени различается. Например, для бактерии E. coli (кишечная палочка) показатель θ≈2,2, а для сети межбелковых взаимодействий в организме человека - θ≈2,1. Следует заметить, что для абсолютного большинства эмпирических примеров подобной статистики показатели θ лежат в диапазоне от 2 до 3, и у этого должно быть свое объяснение.
Заметим, что показатели близки к 2 - практически, выполняется закон Зипфа. Что-то подсказывает автору, что если построить сеть взаимодействий слов натурального языка - где под взаимодействием мы понимаем присутствие слов в одном предложении хотя бы раз на протяжении некоторого текста - мы увидим сеть, в которой распределение слов-узлов по количеству связей окажется степенным с показателем θ≈2. В исходном смысле закон Зипфа - это распределение частоты использования слов в некотором тексте с показателем θ≈2. Но вполне вероятно, что этот же закон может описывать и сеть "взаимодействий слов".
Это автор намерен проверить как только появится немного времени - странно, что такие исследования еще не проводились (а если и проводились, то найти их результаты в интернете автор не смог). И если гипотеза подтвердится, это будет поразительным свидетельством разумности живой природы, для которой белки - слова, а образуемые из них "молекулярные машины" похожи на "машины смысла" - составленные из слов натурального языка предложения.
Удобный абстрактный пример этого рода - масштабно-инвариантная сеть, в которой статистика узлов по числу связей имеет θ=3:
Предположим, что наш вывод, сделанный на основе анализа "пространственно-подобных" графов верен для всех их типов, и для масштабно-инвариантной сети выполняется равенство:
Из этого следует, что между неизвестной нам фрактальной размерностью сети DG и размерностью структурных элементов, по которым мы составляем статистику DS, действует отношение:
Непростой вопрос: что является структурными элементами, по которым мы составляем статистику в данном случае, и какова их собственная размерность. Мы не отыщем ответа, если будем говорить о распределении "узлов по числу связей". Нам нужно представить дело так, что речь идет о статистике некоторых кусков графа по их размеру - то есть, по числу содержащихся в них узлов - точно также, как в приведенном выше примере роль таких кусков играли кольца.
Взглянем на некоторый узел графа:
Он имеет 4 связи, но столько же непосредственных соседей он имеет. До каждого из них от избранного узла можно добраться за один шаг - они входят в кластер этого узла при радиусе R=1. То есть, количество связей у узлов сети равно размеру их кластера минимального радиуса S(1). Таким образом, статистика узлов по числу связей есть статистика узлов по объему их минимальных кластеров.
Хорошо, но какова собственная размерность этих кластеров DS?
И тут автор призадумался...
Следует сказать, что сама возможность такого вопроса не очевидна. Вообще, фрактальные свойства графов активно исследуются не более 15 лет (хотя, конечно, мысли на эту тему звучали уже давно). Главным образом, исследователи упражняются во все новых методах оценки фрактальной размерности - тут и нелюбимый нами метод покрытия пятнами (и исследования о том, каким способом лучше покрывать графы, чтобы оценивать размерность - разве это не чепуха?), тут и метод растущего кластера и его очевидные вариации, которым, тем не менее, посвящают научные публикации - вроде усреднения размера растущего кластера по всем узлам сети. Тут и еще более экзотические методы. Путаница методов, путаница понятий... На лицо "сырость" области, где пока не сложилось надежного исследовательского метода и пока не найдены действительно универсальные закономерности.
И может быть, нам, опираясь на нашу приверженность простоте и ясности, удастся сделать тут небольшой шаг вперед. Исходя из довольно элементарных соображений следует, что размерность минимальных кластеров в древовидных графах на единицу меньше, чем собственная размерность полного графа: DS = DG-1. Значит, для древовидных графов действительно равенство:
где θ - показатель степенной статистики распределения узлов графа по количеству связей. Или, иначе
Из этого следует, что фрактальная размерность масштабно-инвариантной сети (ее также называют моделью Барабаши-Альберта) равна 2.
Это вывод, полную достоверность которого автор пока не может доказать. Более того, есть некоторые моменты, которые противоречат ему - например, одна из оценок размерности масштабно-инвариантой сети, которую мы получили в предыдущей нити была существенно больше, ближе к 4. Но простота логики, которая ведет к этому выводу, а также ряд косвенных моментов заставляют автора верить, что он, как минимум, является хорошей стартовой точкой для более подробного изучения вопроса.
Мы обсудим эти моменты далее, а заодно убедимся, что показатель степенной статистики θ является более фундаментальной и "предсказуемой" характеристикой фракталов, нежели фрактальная размерность - вопреки расхожим представлениям.
Ваш комментарий
image Поля, отмеченные звездочкой, нужно обязательно заполнить
Заголовок комментария:
image Текст комментария: (не более 2000 символов, HTML-разметка удаляется)
image Ваше имя:
Ваш E-mail:
image Сколько будет дважды два? (ответьте цифрой, это проверка от спам-рассылок)
Отправить комментарий
Главные темы
Внимание (8)Геогештальт (1)Гештальт (16)Динамика внимания (5)Инсайт (5)Интуиция (2)Кибернетика (5)Когнитивное управление (6)Когнитивный анализ (4)Когнитивный словарь (5)Культура наблюдения (5)Мерцающие зоны (7)Метафизика (3)Метафора (13)Механизмы восприятия (15)Мифы и парадигмы (7)Органическая логика (5)Прогнозирование (6)Роль языка (4)Симметрии (5)Синхронизмы (5)Сложные системы (10)Степенной закон (8)Творческое мышление (5)Три уровня систем (4)Управление знаниями (3)Фазы развития (7)Фракталы (18)Цветные шумы (9)
КОГНИТИВИСТ: когнитивные методы и технологии © Роман Уфимцев, при поддержке Ателье ER