КОГНИТИВИСТИдейное ядро²Узелки на распуткуУзел 1. Причина степенных распределений
Узел 1.2 Механизмы развития
Прологи: наука о сознании становится точной
Манифест когнитивиста
.
Узелки на распутку
Узел 1. Причина степенных распределений
Узел 1.2 Механизмы развития
Узел 1.3 Причины и экстремальные принципыУзел 1.4 Максимум специальных энтропийУзел 1.5 Мультипликативный закон сохраненияУзел 1.6 Когнитивные фракталыУзел 1.7 Вязкость сознания и число eУзел 1.8 Модель БернуллиУзел 1.9 Принцип микро-причинностиУзел 1.10 Случайно блуждающие ландшафтыУзел 1.11 Субстанции формы и содержанияУзел 1.12 Размерность Хаусдорфа и метрическая связностьУзел 1.13 Вне-пространственные фракталыУзел 1.14 Фракталы на графахУзел 1.15 Фрактальная размерность графов и сетейУзел 1.16 Фрактальность древовидных графовУзел 1.17 Фрактальная размерность и степенная статистикаУзел 1.18 Локальные и глобальные размерности графовУзел 1.19 Локальные и глобальные размерности графов (II)Узел 1.20 Локальные и глобальные размерности графов (III)Узел 1.21 Критические графы как фракталыУзел 1.22 Критические графы как фракталы (II)Узел 1.23 Возвращение к БернуллиИнтерлюдия. Две простые задачиУзел 1.24 Зоопарк критических графовУзел 1.25 Зоопарк критических графов (II)Узел 1.26 Режим стохастической самоподдержкиУзел 1.27 Растущие кластеры и размерность решетокУзел 1.28 Фрактальные и не-фрактальные решеткиУзел 1.29 Энтропия ростаУзел 1.30 Энтропия графов и пространствУзел 1.31 Игра в инверсию
Узел 2. Опус о числах и формах
.
Прологи
.
Степенные законы, распределения Парето и закон Зипфа
.
Когнитивный уровень
.
Мерцающие зоны
.
Органическая логика: резюме
Карта органической логики
.
Хвост ящерки. Метафизика метафоры.
.
Опус 1/F
.
Anschauung, научный метод Гёте
.
Закон серийности Пауля Каммерера
.
Ранние признаки критических переходов
.
Слабые сигналы
.
Меметика
.
Системный анализ и чувствительные точки
.
Спиральная динамика
.
Узел 1.2 Механизмы развития
 
Роман Уфимцев
28 мая 2014 года, Калининград
Внимание к распределениям в окружающих нас явлениях с течением времени развивает особое чутье, и во многих случаях становится достаточно лишь одного взгляда, чтобы заметить "аромат" того или иного их класса. Собственно, автор так и понимает выражение "статистический ландшафт": подобно тому, как природные ландшафты несут различный дух или настроение, каждое явление сопровождается собственным "букетом" распределений, придающих ему уникальное настроение. И, как мы уже говорили, среди всего бесконечного разнообразия две группы "ароматов" имеют особое значение.
Первая - это класс экспоненциальных или комбинаторных распределений. Наиболее важными распределениями этого класса являются нормальное и экспоненциальное.
Второй класс называется степенным, и его ключевым представителем является степенное распределение:
1) Степенное распределение, 2) экспоненциальное распределение
Уравнение степенного распределения можно записать так:
где θ - показатель степени, который может принимать значения от 1 до бесконечности, а xm - минимальное значение наблюдаемого статистического параметра X. В отличие от экспоненциального распределения, для степенного необходимо вводить нижнюю границу возможных значений параметра, иначе распределение не сходится - то есть, степенное распределение принципиально не предполагает нулевых значений параметра.
Если принять xm=1 (а это всегда можно сделать, перемасштабировав единицу измерения статистического параметра), уравнение степенного распределения упрощается:
Особый интерес представляет собой красивый случай θ=2, который известен как "закон Зипфа":
С первого взгляда форма этого распределения похожа на форму экспоненциального: малые значения параметра встречаются чаще, чем большие, кривая распределения спадает. Однако, степенная кривая отличается от экспоненциальной, и главное отличие - так называемый "тяжелый хвост" - можно заметить, что в области больших значений параметра X она спадает гораздо медленнее (по факту бесконечно медленнее). Эмпирически это означает, что в наблюдаемом коллективном явлении мы встречаем объекты с аномально большими значениями параметра (которые крайне маловероятны при экспоненциальном распределении). "Тяжелый хвост" степенного распределения как раз и содержит в себе эти аномалии.
Как мы говорили, Парето обнаружил, что распределение собственности по гражданам является степенным. Это значит, что в нормальном обществе обязательно существуют аномально богатые граждане, которые бы не могли накопить свое богатство, если бы процесс обмена собственностью в обществе проходил бы по случайно-комбинаторным законам. Более того, эти граждане не просто очень богаты, по факту они обладают весьма значительной, часто львиной долей всего общественного богатства. Знаменитое "правило Парето" говорит как раз об этом: 80% совокупного общественного богатства находится в руках всего 20% его граждан.
Мы говорили, что открытие Парето - одна из немногих надежных социально-экономических закономерностей, известных науке. Возможно поэтому, в отличие от других социальных и экономических "законов", правило Парето успешно применяется на разных уровнях экономической практики. Однако, это интересное и полезное, но частное открытие. В действительности, к сегодняшнему дню известно, что степенным распределениям подчиняется статистика многих и разных сторон жизни коллективов людей. Вот только некоторые примеры:
Капитализация и объемы продаж предприятий некоторой географической территории или отрасли - то есть, закон Парето действует не только на индивидуумах, но и на их объединениях.
Количество жителей населенных пунктов некоторой географической общности, количество учащихся, сотрудников, членов и т.п. различных социальных общностей и организаций - например, ВУЗы обычно характеризуются степенным распределением по количеству студентов.
Войны, вооруженные конфликты и террористические акты обычно характеризуются степенными распределениями по количеству пострадавших.
Среди альтернативных объектов социальное внимание распределяется степенным образом. Это приводит, например, к степенному распределению веб-сайтов Интернета по количеству посетителей, научных статей - по количеству цитирований и т.д.
Все это - примеры из сферы социальных явлений, в которых степенные распределения являются постоянно встречающейся чертой статистического ландшафта. Но они же сопровождают биологические и экологические явления, хорошо известны в геофизике и астрофизике, встречаются и в статистическом ландшафте некоторых физических явлений.
Если бы степенные распределения встречались редко, они бы не привлекли к себе особого внимания, также как его не привлекают многие редко встречающиеся или специфичные только для узкого круга явлений распределения. Но к концу 20-го века универсальность степенных распределений стала очевидна. В этом отношении степенные распределения встали в один выдающийся ряд с распределениями экспоненциального класса. Однако, их приходится приписывать особой категории, потому что в отличие от распределений экспоненциального класса, известные механизмы развития степенных распределений не могут опираться только на простейшую комбинаторику и случай - обязательно должно присутствовать еще кое-что.
Механизм развития степенных распределений: фракталы
Вопрос, а точнее, проблема механизма развития степенных распределений возникла сразу, как только они были обнаружены. Дискуссии на эту тему особенно активизировались в связи с открытием лингвиста Джорджа Зипфа (Ципфа). Он нашел универсальную, выполняющуюся практически для всех натуральных языков и наречий закономерность: частота использования тех или иных слов в текстах и речи весьма точно подчиняется степенному распределению с показателем степени θ≈2. (Вообще, именно этот показатель степени представляет собой наибольший интерес - многие известные эмпирические степенные распределения имеют показатель около 2, в этом случае иногда говорят о выполнении "закона Зипфа".)
К настоящему времени предложено множество вариантов разной степени сложности и убедительности. Часто исследователи предлагают очень специфичные механизмы, которыми можно худо-бедно объяснить происхождение степенных распределений в одном классе феноменов, но не в других. Некоторые считают, что вообще не следует искать один универсальный механизм происхождения степенных распределений, и это мнение выглядит как своего рода знак отчаяния. Заметим, что подобного разноголосия совсем не слышно в связи с экспоненциальным классом распределений. Порождающие их механизмы настолько просты, что мало у кого возникают сомнения в их универсальной применимости. Но со степенными распределениями не так. Они также широко распространены, и отсутствие согласия на тему их происхождения выглядит каким-то укором нашему недостаточному научному воображению.
Возможно, решение этой проблемы следует искать на более глубоком уровне. Может быть, действительно, не существует простых и универсальных алгоритмов, которые могли бы оправдать развитие степенных распределений повсюду, где они наблюдаются. Но это лишь значит, что нет единого ответа на вопрос "как", хотя существует единый ответ на вопрос "почему". Это предчувствие и стало для автора поводом для написания этой статьи.
Речь идет о том, что несмотря на видимую разницу в порождающих степенные распределения механизмах, в них присутствует нечто общее, то самое "кое-что", намекающее на скрытую общую основу. Что это за основа?
Опираясь на собственные изыскания, результаты которых освещались в "Прологах", автор считает, что этой общей основой является фрактальность и связанная с фракталами масштабная инвариантность.
Фракталы неразрывно связаны со степенными распределениями, образно говоря, они имеют "степенную душу". Речь идет о том, что если структуру классического фрактала разбить на отдельные элементы, то геометрические параметры этих элементов (их линейные размеры, площади, объемы) будут соответствовать степенной статистике, при этом показатель степени зависит от типа фрактала. Например, распределение площадей дыр в классическом ковре Серпинского отвечает степенному распределению с показателем θ=ln(8)/ln(9):
Созерцание фракталов позволяет выработать интуитивное представление о виде степенного статистического ландшафта. Например, тут площадь квадратов можно сопоставить с размером кошелька граждан. Ковер Серпинского делает наглядным открытие Парето о степенном распределении общественного богатства - как видим, оно очень неравномерно.
С точки зрения механизмов развития, фракталы очень просты. Для иллюстрации мы рассмотрим развитие кривой Коха, еще одного классического фрактала. Фрактал развивается в результате многократного действия некоторого генерирующего преобразования. Для кривой Коха таким преобразованием является замена некоторого отрезка на кривую, состоящую из четырех одинаковых сегментов:
Начав с прямолинейного отрезка и поэтапно применяя преобразование ко все более мелким элементам, в пределе мы получим идеальный фрактал, кривую Коха:
Так выглядит развитие фракталов в традиционном изложении. Увы, такой взгляд удобен только математикам, потому что механизм основан на применении одного и того же абстрактного преобразования на разных масштабных уровнях. Однако, если речь идет об объяснении происхождения натуральных фракталов и связанных с ними степенных распределениях, это оказывается проблемой: не легко привести пример природных преобразований, которые бы могли одинаково действовать на всех масштабах. Социальные, биологические, физические трансформации - как правило, они происходят на строго определенном масштабном уровне. Например, мы знаем о делении отдельных клеток организмов, но это преобразование - разделение на два - не может произойти с целым организмом. Или два камня при столкновении упруго отскакивают друг от друга, но одна планета не отскочет от другой.
Нам нужен другой взгляд на механизм развития фракталов, в котором бы генерирующее преобразование действовало бы всегда на одном и том же масштабном уровне. Для этого мы задаем генерирующее преобразование не оторвано от масштаба, а наоборот, строго привязывая его к масштабу:
Теперь наше генерирующее преобразование может превращать в четырех-сегментную кривую только отрезки длиной ровно в 1 см. Развитие фрактала начинается как раз с такого отрезка, и первые два этапа не отличаются от традиционных, но далее происходит нечто иное:
После достижения первого этапа, дальнейшее применение преобразования и развитие фрактала становится невозможным. Чтобы обойти это препятствие, положим, что полученная форма не остается неизменной по величине, а непрерывно и пропорционально растет. После достижения первого этапа фигура начинает расти - и растет не меняя очертаний до тех пор, пока ее сегменты не достигнут размера в 1 см. В этот момент становится возможным применение генерирующего преобразования, и мы добираемся до второго этапа развития кривой Коха. Далее, новая фигура продолжает пропорционально расти, и т.д. В пределе мы получаем идеальный фрактал.
Результат, по сути, один и тот же. Разница только в том, что в традиционном описании развертывание фрактала идет "внутрь", в сторону меньших масштабов, и при этом преобразование затрагивает все более мелкие масштабы фрактала, а во втором случае он развивается "наружу", а преобразование всегда действует на одном и том же масштабном уровне. Тем не менее, изменив описание, мы существенно облегчаем объяснение происхождения реально наблюдаемых фрактальных структур и степенных распределений. Как мы далее увидим, наиболее элегантные алгоритмы развития степенных распределений опираются как раз на механизм фрактала, растущего "наружу".
Важная деталь картины - пропорциональный рост развивающейся структуры. И кажется не случайным, что практически все известные модели развития степенных распределений - это растущие модели. Пример (вероятно, самый известный алгоритм развития таких распределений) - модель масштабно-инвариантной сети. Мы посвятили ей один из "Прологов", здесь же опишем модель вкратце.
Эволюция модели начинается с одного одинокого узла. Далее в системе появляется еще один узел, который связывается с первым. Затем появляется третий узел, который равновероятно присоединяется к одному из двух уже имеющихся. Каждый следующий узел присоединяется к одному из уже существующих, при этом предпочтение оказывается узлам, к которым уже подходит больше связей. То есть, старые узлы тем вероятнее приобретают новые связи (с новыми узлами), чем больше они уже их имеют. Это так называемое правило "богатый становится богаче". В этих условиях в пределе развивается сеть, в которой распределение узлов по количеству связей является степенным с показателем θ=3:
Эта сеть имеет характерный древовидный вид. В отличие от идеальных фракталов как ковер Серпинского или кривая Коха, она является стохастическим фракталом, то есть, фракталом со случайными отклонениями от идеальной самоподобной структуры. Можно говорить, что масштабно-инвариантная сеть самоподобна не строго, а статистически.
Масштабно-инвариантная сеть - это растущее множество узлов, их количество постоянно увеличивается, и это является принципиальным моментом. (Одно время автор даже думал, что вообще невозможно придумать механизм, в котором степенные распределения развивались бы на множестве фиксированного размера, но он существует, хотя и не вполне ясен - об этом далее мы еще будем говорить.) Но еще важнее то, что кроме увеличения количества объектов в системе сама сеть как целое тоже растет - богатые связями узлы приобретают их еще больше, менее богатые узлы тоже накапливают связи, хотя и медленнее. Происходит рост или "утяжеление" узлов сети и это рост происходит пропорционально: например, если узел, имеющий 100 связей за следующий период приобретет еще 10 связей, то за тот же период узел с 30 связями приобретет еще в среднем 3 - то есть, в среднем все узлы сети прибавят в своем "весе" по 10%.
С первого взгляда, причиной развития степенного распределения в этой модели является правило "богатый становится богаче". Вспомним картофель и механизм ресурсных баз. Каждая база с одинаковой вероятностью могла поглотить следующую частицу ресурсов вне зависимости от того, сколько их она уже поглотила. В результате - если некоторые частицы становятся новыми ресурсными базами - развивается экспоненциальное распределение. А тут базы тем "прожорливее", чем больше частиц они уже поглотили - наверное, из-за этого и появляется степенная статистика.
Но это не так. Само по себе правило "богатый становится богаче" обеспечивает лишь пропорциональный рост развивающейся структуры. Его недостаточно для развития фрактала и образования степенного распределения. Как мы видели на примере кривой Коха, кроме пропорционального роста еще необходимо генерирующее преобразование, которое действует на одном и том же масштабном уровне.
Чтобы разобраться в этом моменте, следует обратиться к другой, более совершенной и гибкой модели развития степенных распределений, так называемому тиронному процессу, которому мы уделили много внимания в "Прологах".
Механизм развития степенных распределений: тиронный процесс
Вообразим себе множество объектов, образованных поглощенными ими частицами ресурсов. На него налетают новые частицы единичной массы, и они распределяются по объектам в соответствии с правилом "богатый становится богаче". Поглощенная объектом частица может быть им "переварена" и тогда она увеличивает массу объекта, а может "отскочить" от него и стать новым объектом единичной массы, который далее участвует в дележке ресурсов как все. При этом вероятность "отскока" от малых объектов выше, а от массивных - ниже, так что фактически все объекты одинаково часто порождают новые объекты. В этих условиях, если рост множества начинается с одного объекта единичной массы, в каждый момент времени растущее множество обладает степенной статистикой. При этом показатель степени распределения зависит только от частоты появления новых объектов (а она зависит от вероятностей "отскока") и может принимать все теоретически допустимые значения θ от 1 до бесконечности.
Этот механизм более гибок и совершенен, нежели модель масштабно-инвариантной сети, потому что последняя порождает множество со степенной статистикой, но показатель степени при этом меняется в процессе эволюции. То есть, ее фрактальные характеристики меняются с течением времени. Кроме того, эта модель не способна объяснить происхождение степенных распределений с другими показателями, нежели θ=3. Тиронный процесс генерирует множество со стабильными фрактальными параметрами и способен породить степенную статистику с любым показателем.
(Строго говоря, и модель масштабно-инвариантной сети и тиронный процесс порождают не степенные распределения, а их дискретный аналог - распределения Юла. Подробнее об этом - см. "Пролог 78". На опыте эти формально разные распределения практически невозможно различить.)
Два простых правила обеспечивают тиронный процесс:
Во-первых, это правило распределения частиц ресурсов - "богатый становится богаче". Как мы говорили, это правило поддерживает пропорциональный рост множества. При построении кривой Коха мы для этого просто геометрически "раздуваем" фигуру.
Во-вторых, это правило, в соответствии с которым объекты могут с некоторой неизменной и не зависящей от их масштаба (то есть, их массы) частотой порождать новые объекты. Оно является аналогом генерирующего преобразования, благодаря которому в кривой Коха возникают новые сегменты. В тиронном множестве благодаря ему возникают новые объекты.
Оба эти правила достаточно универсальны и просты в трактовке. Они лишь немного затейливее, чем правила, приводящие к развитию систем с экспоненциальной статистикой. Напомню, что в одном из известных механизмов развития экспоненциального распределения мы имеем ресурсные базы, которые поглощают налетающие частицы ресурсов с одинаковой вероятностью. Достаточно изменить это условие и сделать так, чтобы вероятность поглощения частицы той или иной базой была не одинакова, а зависела от того, сколько уже частиц она поглотила, и мы получим "богатый становится богаче". И в этом правиле нет ничего экзотического, оно интуитивно правдоподобно. Скажем, крупный лист дерева получает больше солнечных лучей, чем маленький и, соответственно, может быстрее расти. Или вполне интуитивно ясны причины действия этого правила в его прямой трактовке: обладатели больших капиталов гораздо легче их увеличивают, нежели обладатели скромного достатка. Подобные закономерности можно обнаружить и в других наблюдаемых случаях степенных распределений.
Вообще, посвятив этой теме не один год, автор слоняется к мысли, что тиронный процесс - один из лучших (если не лучший) известный механизм развития степенных распределений. К тому же он очевидным образом перекликается с механикой развития фракталов.
Но это ответ на вопрос как может развиваться степенная статистика, а не почему. Это важная разница: тиронный процесс может объяснить, как развивается степенное распределение, но не может нам объяснить, почему эти распределения так устойчивы в условиях помех. Пусть в какой-то "период накопления капитала" богатство общества распределилось степенным образом и это случилось благодаря механизмам, подобным тиронному процессу. Но дальше, параллельно с продолжающимся ростом общества и его богатства, происходит обмен богатством между членами общества, и этот процесс гораздо более интенсивный, нежели процесс естественного роста. Или тиронный процесс может нам объяснить, как могут развиваться степенные распределения в количестве жителей населенных пунктов, но в реальности жизнь любого общества сопровождается активной внутренней миграцией, которая гораздо существеннее влияет на население городов и деревень, недели процессы естественного роста и умножения их населения. Тем не менее, в условиях этих перетоков статистика соответствующих распределений остается степенной и весьма устойчивой с точки зрения показателей степени.
Это и есть настоящая загадка. Складывается впечатление, что нас не столько должно интересовать как развиваются степенные распределения, столько почему они развиваются и какая сила заставляет системы возвращаться к степенной статистике в случае помех и отклонений.
Приступом к этим вопросам окончились "Прологи", и теперь мы намерены добиться ответа. Он и будет настоящей разгадкой загадки степенных распределений. Найди мы ответ - и мы, наконец, действительно сможем понять, почему степенная статистика так универсальна в самых разных явлениях природы и общества.
Ваш комментарий
image Поля, отмеченные звездочкой, нужно обязательно заполнить
Заголовок комментария:
image Текст комментария: (не более 2000 символов, HTML-разметка удаляется)
image Ваше имя:
Ваш E-mail:
image Сколько будет дважды два? (ответьте цифрой, это проверка от спам-рассылок)
Отправить комментарий
Главные темы
Внимание (8)Геогештальт (1)Гештальт (16)Динамика внимания (5)Инсайт (5)Интуиция (2)Кибернетика (5)Когнитивное управление (6)Когнитивный анализ (4)Когнитивный словарь (5)Культура наблюдения (5)Мерцающие зоны (7)Метафизика (3)Метафора (13)Механизмы восприятия (15)Мифы и парадигмы (7)Органическая логика (5)Прогнозирование (6)Роль языка (4)Симметрии (5)Синхронизмы (5)Сложные системы (10)Степенной закон (8)Творческое мышление (5)Три уровня систем (4)Управление знаниями (3)Фазы развития (7)Фракталы (18)Цветные шумы (9)
КОГНИТИВИСТ: когнитивные методы и технологии © Роман Уфимцев, при поддержке Ателье ER