КОГНИТИВИСТИдейное ядро²Узелки на распуткуУзел 1. Причина степенных распределений
Узел 1.25 Зоопарк критических графов (II)
Прологи: наука о сознании становится точной
Манифест когнитивиста
.
Узелки на распутку
Узел 1. Причина степенных распределений
Узел 1.2 Механизмы развитияУзел 1.3 Причины и экстремальные принципыУзел 1.4 Максимум специальных энтропийУзел 1.5 Мультипликативный закон сохраненияУзел 1.6 Когнитивные фракталыУзел 1.7 Вязкость сознания и число eУзел 1.8 Модель БернуллиУзел 1.9 Принцип микро-причинностиУзел 1.10 Случайно блуждающие ландшафтыУзел 1.11 Субстанции формы и содержанияУзел 1.12 Размерность Хаусдорфа и метрическая связностьУзел 1.13 Вне-пространственные фракталыУзел 1.14 Фракталы на графахУзел 1.15 Фрактальная размерность графов и сетейУзел 1.16 Фрактальность древовидных графовУзел 1.17 Фрактальная размерность и степенная статистикаУзел 1.18 Локальные и глобальные размерности графовУзел 1.19 Локальные и глобальные размерности графов (II)Узел 1.20 Локальные и глобальные размерности графов (III)Узел 1.21 Критические графы как фракталыУзел 1.22 Критические графы как фракталы (II)Узел 1.23 Возвращение к БернуллиИнтерлюдия. Две простые задачиУзел 1.24 Зоопарк критических графов
Узел 1.25 Зоопарк критических графов (II)
Узел 1.26 Режим стохастической самоподдержкиУзел 1.27 Растущие кластеры и размерность решетокУзел 1.28 Фрактальные и не-фрактальные решеткиУзел 1.29 Энтропия ростаУзел 1.30 Энтропия графов и пространствУзел 1.31 Игра в инверсию
Узел 2. Опус о числах и формах
.
Прологи
.
Степенные законы, распределения Парето и закон Зипфа
.
Когнитивный уровень
.
Мерцающие зоны
.
Органическая логика: резюме
Карта органической логики
.
Хвост ящерки. Метафизика метафоры.
.
Опус 1/F
.
Anschauung, научный метод Гёте
.
Закон серийности Пауля Каммерера
.
Ранние признаки критических переходов
.
Слабые сигналы
.
Меметика
.
Системный анализ и чувствительные точки
.
Спиральная динамика
.
Узел 1.25 Зоопарк критических графов (II)
 
Роман Уфимцев
24 января 2015 года, Калининград
Едва успели высохнуть чернила опубликованной 24-й нити нашего исследования степенных распределений, в которой автор делилися светлой научной печалью о том, что некоторые из идей, длительное время вдохновлявших автора, оказались не верны. Но они едва успели высохнуть, а новые результаты уже несут неожиданное утешение.
Речь идет об идее фундаментального значения распределения Юла, которое мы полагали каноническим дискретным представлением степенного распределения. Мы считали, что степенная структурная статистика пространственных фракталов при их дискретном анализе, и статистика фракталов на графах, которые дискретны по своей природе, характеризуется распределениями Юла, а не какими-то прямыми дискретными аналогами непрерывного степенного распределения. Эта идея, однако, натолкнулась на проблему структурной статистики критических графов. В этих фрактальных графах распределение размеров компонентов близко к степенному с показателем θ=5/2, однако, оно с виду не похоже на распределение Юла. Это обстоятельство заставило автора усомниться в универсальной роли распределения Юла в степенных феноменах (и модели Бернулли, которая описывает их развитие) - мы столкнулись с важным степенным феноменом, который не согласуется со статистикой Юла. У распределения Юла обнаружилась фундаментальная альтернатива.
Автор решил внимательно исследовать критические графы и найти точную форму распределения размеров компонентов - до сих пор было только известно, что оно близко к степенному с показателем θ=5/2. В этой нити мы увидим первые результаты, и откроем для себя распределение, которое оказывается родственным распределению Юла, хотя и не совпадает с ним - автор с долей иронии решил назвать его "сдвинутым распределением Юла". Именно оно является точной формой распределения размеров компонентов критических графов - по крайней мере, для простейшего из них.
Точная форма распределения размеров компонентов
В предыдущей нити мы начали подбираться к точной форме распределения размеров компонентов в простейшем типе критических графов, который образован узлами двух сортов - "атомами водорода", имеющими по одной связи, и "атомами азота", имеющего по три связи. Если отношение количеств атомов водорода к атомам азота равно 3:1, граф оказывается критическим.
Простой состав узлов этого критического графа давал надежду, что на его примере найти точную форму распределения размеров компонентов проще всего. И эта надежда оправдалась - хотя ее вывод весьма затейлив, но результат удалось получить. Вот она: точная форма распределения размеров компонентов в простейшем "химическом", "водородно-азотном" критическом графе:
Тут x может принимать значения 2,4,6... - в нашем графе размеры компонентов могут быть только четными:
С первого взгляда видно сходство с распределением Юла:
Оно станет еще более ясным, если мы перейдем к переменной y = (x-1)/2:
Фактически, распределение размеров компонентов - это распределение Юла с показателем θ=5/2, определенное однако не для значений x=1,2,3..., а для значений y=1/2, 3/2, 5/2... - то есть, это распределение Юла со сдвинутой на 1/2 областью определения.
Итак, распределение размеров компонентов как минимум в этом, простейшем критическом графе, оказывается легкой вариацией канонического для степенных феноменов распределения Юла. Наша печаль была напрасна, и критические графы не являются исключением из общего правила - хотя смысл "сдвинутости" еще следует понять.
Перед тем, как обратиться к выводу распределения, сравним его с результатами числовых симуляций. Убедимся, что совпадение вполне удовлетворительное:
Заметим, как близко сдвинутое распределение Юла (черная кривая) к чистой степенной функции с показателем θ=5/2 (зеленый пунктир) - это сходство нас было и смутило. Приближенное степенное уравнение, к которому приближается хвост распределения:
Вывод распределения
Вывод точного уравнения распределения размеров компонентов критического графа (пусть пока только для простейшего частного случая) оказался головоломной задачей. Все видимые подходы к ее решению покрыты непреодолимыми комбинаторными зарослями, через которые автор почти отчаялся прорваться. Тем не менее, после некоторых поисков в зарослях все же нашлась нужная тропинка...
Познакомимся с ключевыми пунктами вывода.
Пункт 1: Компоненты и траектории
Между структурой самых малых компонентов прослеживаются ясные отношения:
Кажется, что это позволит найти какое-то простое рекуррентное отношение между вероятностями появления компонентов соседнего размера. Однако, уже компоненты размером 10 могут иметь две различные структуры, которые к тому же возникают с разными вероятностями:
С ростом размера компонентов вариантов их структуры становится все больше, и обнаружить какую-то систематичность оказывается практически невозможно. Нам требуется переформулировка задачи, которая упрощает анализ - сопоставление компонентов с моделью растущей колонии бактерий - мы уже говорили о нем, см. Подбираемся к точной форме распределения.
Если обозначить как S(x) вероятность того, что колония бактерий проживет ровно x "бактерия-часов", между распределением размеров компонентов нашего критического графа C(x) и распределением S(x) имеется прямая связь:
тут h - количество атомов водорода в компоненте. Разберемся в этом соотношении на примере компонента размером 8:
Ему соответствуют колонии бактерий, проживающих всего 7 "бактерия-часов". Существует только две альтернативные истории жизни таких колоний - на диаграмме они обозначены как I и II. Первая история соответствует траектории обхода компонента начиная с красных атомов водорода, в вторая - начиная с зеленого атома. Не трудно подсчитать, что колония бактерий проживет историю I с вероятностью 1/25, а историю II - c вероятностью 1/27. Отсюда общая вероятность, что колоний бактерий проживет ровно 7 "бактерия-часов" равна S(7) = 1/25 + 1/27=5/27.
Заметим теперь, что у нас имеется 5 точек начала обхода компонента - 5 атомов водорода. Кроме того, в среднем компоненты графа содержат по 3 атома водорода. Значит, для оценки вероятности появления компонента C(8) мы должны разделить вероятность S(7) на 5/3. Отсюда C(8)=5/27/(5/3) = 3/27. И это верный результат.
Кстати: средний размер древовидных компонентов графа
Почему в среднем компоненты содержат по 3 атома водорода? Это следует из того, что в среднем компоненты в нашем критическом графе имеют размер 4. Чтобы убедиться в этом, между делом выведем уравнение, позволяющее вычислять средний размер компонентов в любом графе, не содержащем циклы.
Во-первых, заметим, что количество связей в связном древовидном графе или отдельном компоненте всегда ровно на единицу меньше, чем количество содержащихся в нем узлов (тут мы понимаем связь как "палочку", соединяющую два узла). Действительно, любой древовидный связный граф можно представить как центральный узел, к которому присоединяются другие узлы. Каждый новый узел привносит по одной связи-"палочке". Из этого следует, что если всего в древовидном компоненте графа N узлов, то среднее количество связей-"палочек" на один узел равно 1-1/N.
Теперь зайдем с другой стороны. Пусть в целом узлы графа имеют по E связей - это среднее количество соединений с другими узлами. Пусть всего в полном графе n узлов. Если в среднем узлы имеют по E связей, то всего в графе n*E/2 связей-"палочек" (делим на 2, потому что каждая связь-"палочка" означает две соединения узлов с другими). Положим, что всего в графе M компонентов, при этом компоненты с размером x встречаются в нем с вероятностью C(x). Если бы мы знали C(x), мы могли бы подсчитать, сколько всего связей-"палочек" во всех компонентах графа:
тут мы используем то обстоятельство, что сумма величин C(x)*x по всем возможным размерам компонентов x равна среднему размеру компонентов A. Но выше мы видели, что общее количество связей-"палочек" в критическом графе равно n*E/2, так что мы можем записать
Поскольку n - количество узлов в графе, а M - количество компонентов в нем, n/M равно среднему размеру компонентов, то есть, величине A. Исходя из этого и полученного нами равенства мы придем к
Обратим внимание на универсальность этого результата - он верен для древовидных графов с любым распределением компонентов по размеру C(x) - и критических и до-критических.
В нашем конкретном "водородно-азотном" случае распределение узлов полного графа по количеству связей отвечает закону
То есть, 3/4 узлов в графе являются "атомами водорода", то есть имеют по одной исходящей связи, и 1/4 являются "атомами азота" - они имеют по 3 исходящих связи. Отсюда в среднем они имеют по 3/2 исходящих связи, то есть, E=3/2. Отсюда мы получим, что в нашем критическом графе в среднем компоненты содержат по 4 узла-атома. Из них один является атомом азота, а три - атомами водорода.
Итак, если мы найдем распределение колоний бактерий по "бактерия-часам" S(x), мы сможем получить и распределение компонентов по размеру C(x).
Пункт 2: Находим систему
Хотя вычислять вероятности того или иного жизненного пути колонии бактерий проще, чем прямо вычислять вероятность появления компонентов того или иного размера, прямолинейный подход тут также приводит в комбинаторные заросли. Чтобы пробраться сквозь них, следует найти какую-то систематичность между вероятностями S(x) для колоний с различным количеством "бактерия-часов". И тут нам поможет одно наблюдение. Пусть мы имеем колонию бактерий, история которой изображается следующим древовидным графом:
Всего это колония прожила 9 "бактерия-часов". Заметим теперь, что после деления первой бактерии образуется две параллельные ветви истории жизни этой колонии, и каждую из этих ветвей можно рассматривать как независимые колонии с собственными историями:
Конкретно, первая ветвь образует историю колонии в 3 "бактерия-часа", а вторая - историю колонии в 5 "бактерия-часов". Не трудно увидеть, что если обозначить вероятность увидеть исходную колонию как C, а вероятности увидеть колонии левой и правой ветви соответственно как A и B, то действительно равенство C=A*B/2 (тут следует иметь в виду: это равенство справедливо, если мы требуем, чтобы колония в 3 "бактерия-часа" была именно левой ветвью, а колония в 5 "бактерия-часов" - правой. Если нам это не важно, то C=A*B, поскольку есть два варианта распределения суб-колоний на правую-левую ветвь).
Обобщим этот вывод. Пусть у нас есть колония, прожившая z "бактерия-часов". Пусть также правая ветвь образует колонию из x "бактерия-часов", а левая - y "бактерия-часов". Тогда 1) z = x+y+1, и 2) S(z) = S(x)*S(y)/2:
Мы в полушаге от искомого рекурсивного соотношения. Вообще колонии в z "бактерия-часов" могут содержать ветви различных размеров x и y, единственное условие, которое должно выполняться: z = x+y+1. Например, колонии в 11 "бактерия-часов" могут иметь ветви в 1 и 9, 3 и 7, 5 и 5, 7 и 3, 9 и 1 узлов. Значит, мы можем записать:
Вообще, запишем первые члены ряда S(x), и мы увидим красивую и стройную систематичность:
В комбинаторной тьме мы обнаружили ясную систему, но что нам с ней делать дальше - ведь нам нужно найти явное выражение S(x)?
Пункт 3: Трюки с порождающей функцией
Решение задачи, которой мы занимаемся - поиск точной формы распределения компонентов простейшего критического графа - оказалось похожим на вскрытие сейфа с многоуровневой защитой. Только мы преодолели одну проблему, как перед нами возникает новая, причем не похожая на предыдущие.
Мы обнаружили ясную связь между значением S для некоторого x и значениями S для всех предыдущих значений x. Она в принципе позволяет вычислить все значения S(x), но нам нужна формула, позволяющая вычислять S(x) прямо, а не отталкиваясь от предыдущих значений.
Для удобства переопределим S(x) так, чтобы x могло принимать не только нечетные значения, в все целые значения, начиная от x=0 - для этого введем значение S(0) = 0:
В правой части каждого равенства, начиная от S(2) присутствует так называемая свертка - это величина, равная вероятности того, что сумма двух случайных величин c распределениями f и g будет равна некоторому определенному числу y (свертка обозначается знаком *):
В нашем случае случайные величины - это количествa "бактерия-часов" в правой и левой ветвях истории колонии c одинаковыми распределениями S(x), так что мы можем записать:
Заметим, что это равенство выполняется для всех x > 1.
Пожалуй, самое интересное свойство свертки заключается в ее особых отношениях с некоторыми типами преобразований входящих в нее функций f и g. Например преобразование Фурье F свертки двух функций равно простому произведению их "личных" преобразований Фурье:
Однако, в нашем конкретном случае удобнее другое преобразование обладающее такими же свойствами - преобразование функции S(x) в так называемую порождающую функцию G(S)(z):
Функция S(x) и ее порождающий образ G(S)(z) однозначно связаны, и если мы знаем образ, мы принципиально можем вернуться и к исходной функции, используя следующее равенство:
Например, чтобы получить из порождающей функции значение S(2), нужно взять значение второй производной G(S) в точке z=0 и поделить на 2!, то есть, просто на 2:
Как мы видели, для всех x > 1 выполняется
Примем x=2, тогда можно записать
Исходя из свойства свертки
получим
Подобные же равенства мы получим для всех x > 1, и для их одновременного выполнения нужно, чтобы правая и левая части были равны при любых значениях z:
Решение этого дифференциального уравнения, которое удовлетворяет исходным условиям, выглядит весьма просто:
Отсюда, исходя из
и используя очевидные рекуррентные соотношения между очередными производными порождающей функции, не трудно получить и рекуррентное отношение между S(x+1) и S(x):
Раскрывая рекурсию, окончательно получаем точное уравнение распределения колоний бактерий по количеству проживаемых "бактерия-часов":
где x=1 соответствует 1 "бактерия-час", x=2 - 3 "бактерия-часа", x=3 - 5 "бактерия-часов"... Или, соответственно переписав:
В любом случае мы видим сдвинутое распределение Юла, хвост которого укладывается на степенную функцию с показателем θ=3/2.
Итак, мы теперь имеем S(x) и также знаем, как оно связано с целью наших поисков - распределением C(x):
Делаем последний шаг. Принимая во внимание, что количество атомов водорода h в компоненте связано с их общим количеством x как h=1+x/2, мы приходим к окончательному уравнению C(x):
Находясь под впечатлением от неожиданной хитроумности решенной нами задачи (а насколько знает автор, мы получили первое точное уравнение распределения размеров компонентов критического графа), а также исчерпав лимит размера одной публикации, все рефлексии на тему полученного результата мы оставляем на следующий раз...
Ваш комментарий
image Поля, отмеченные звездочкой, нужно обязательно заполнить
Заголовок комментария:
image Текст комментария: (не более 2000 символов, HTML-разметка удаляется)
image Ваше имя:
Ваш E-mail:
image Сколько будет дважды два? (ответьте цифрой, это проверка от спам-рассылок)
Отправить комментарий
Главные темы
Внимание (8)Геогештальт (1)Гештальт (16)Динамика внимания (5)Инсайт (5)Интуиция (2)Кибернетика (5)Когнитивное управление (6)Когнитивный анализ (4)Когнитивный словарь (5)Культура наблюдения (5)Мерцающие зоны (7)Метафизика (3)Метафора (13)Механизмы восприятия (15)Мифы и парадигмы (7)Органическая логика (5)Прогнозирование (6)Роль языка (4)Симметрии (5)Синхронизмы (5)Сложные системы (10)Степенной закон (8)Творческое мышление (5)Три уровня систем (4)Управление знаниями (3)Фазы развития (7)Фракталы (18)Цветные шумы (9)
КОГНИТИВИСТ: когнитивные методы и технологии © Роман Уфимцев, при поддержке Ателье ER