КОГНИТИВИСТИдейное ядро²Степенные законы, распределения Парето и закон Зипфа
IV. Способы получения степенных законов, часть 2
Прологи: наука о сознании становится точной
Манифест когнитивиста
.
Узелки на распутку
.
Прологи
.
Степенные законы, распределения Парето и закон Зипфа
Когнитивный уровень
.
Мерцающие зоны
.
Органическая логика: резюме
Карта органической логики
.
Хвост ящерки. Метафизика метафоры.
.
Опус 1/F
.
Anschauung, научный метод Гёте
.
Закон серийности Пауля Каммерера
.
Ранние признаки критических переходов
.
Слабые сигналы
.
Меметика
.
Системный анализ и чувствительные точки
.
Спиральная динамика
.
IV. Способы получения степенных законов, часть 2
 
D. Процесс Юла
Один из самых убедительных и широко применимых механизмов, порождающих степенные законы - процесс Юла, открытие которого, по совпадению, было тоже вдохновлено наблюдениями за статистикой биологических таксонов, о которых мы говорили в предыдущем параграфе.
Кроме того, что биологические таксоны (вероятно) имеют степенное распределение времён жизни, степенным распределениям убедительно соответствуют их размеры. То есть, распределение числа видов в роде, семействе или другой таксономической группе весьма точно соответствует степенному закону. Об этом феномене впервые сообщили Виллис и Юл в 1922 году на примере цветущих растений [15]. Три года спустя Юл предложил объяснение феномена на основе простой модели, которая с тех пор нашла множество применений в различных областях. Далее мы с нею познакомимся.
Предположим, что новые виды возникают, но никогда не исчезают: биологические виды только добавляются к таксону, но не исчезают из него. Этот принцип расходится и с моделью случайного блуждания, которую мы обсудили в предыдущем параграфе, и с реальным положением дел. Считается, что в конце концов все биологические виды и роды исчезают. Но пренебрежём этим возражением - даже с этим недостатком у модели Юла имеются весьма весомые достоинства.
Виды добавляются в биологическом роде в результате специализации, разделения одного вида на два - известно, что это происходит посредством различных механизмов, включая борьбу за ресурсы, пространственное размежевание и генетический дрейф. Если предположить, что это происходит с какой-то стохастически постоянной частотой, тогда род, состоящий из k видов, приобретает новые виды со скоростью, пропорциональной k, поскольку каждый вид имеет одни и те же шансы превратиться в два вида за какую-то единицу времени. Предположим ещё, что случайно, например, один раз на m событий раздвоения вида, возникает новый вид, который настолько отличается от остальных, что образует совершенно новый род. (Для ясности, мы определяем m так, что m видов добавляется к уже существующему роду, а затем один вид образует новый род. Таким образом, на каждый новый род возникает m+1 вид, и имеется в среднем m+1 видов в одном роде.) То есть, число родов и число видов в каждом роде в этой модели постоянно растет.
Мы можем математически проанализировать процесс Юла следующим образом1. Будем измерять шаги времени в модели числом родов n. В каждый шаг времени какой-то новый вид образует один новый род, увеличивая таким образом n на единицу. За этот же шаг времени к уже существующим родам добавляется m видов - пропорционально числу видов, которые они уже имеют. Обозначим как pk,n долю родов, которые состоят из k видов при общем числе родов n. Таким образом, количество таких родов npk,n. Теперь вычислим вероятность, с которой следующий добавляющийся в систему вид добавится к некоторому роду i, в котором уже имеется ki видов. Эта вероятность пропорциональна ki, поэтому при соответствующей нормировке она равна ki / ∑i ki . Но i ki - это просто общее число видов, и оно равно n(m + 1). Далее, между появлением рода n и рода n+1 появляется m новых видов, так что вероятность, что род i приобретет новые виды в течение этого интервала времени mki/(n(m + 1)). Общее ожидаемое число родов размера k, которые приобретут новые виды в том же интервале времени
Теперь заметим, что число родов, имеющих k видов уменьшается с каждым шагом времени ровно на такое же количество, поскольку приобретая новые виды, эти роды становятся родами с k+1 видами. Одновременно это число увеличивается из-за родов, которые сначала имели k-1 видов, а после шага времени получили ещё по одному. Таким образом мы можем записать базовое уравнение для нового количества (n + 1)pk,n+1 родов, имеющих k видов:
Единственное исключение для этого уравнения - роды размера 1, для которых действительно уравнение
поскольку по определению ровно один такой род возникает в каждый шаг времени.
Теперь выясним, какую форму приобретает распределение родов по размерам в пределе, после длительного времени. Для этого мы устремим n к бесконечности и предположим, что распределение стремится при этом к какому-то фиксированному значению
независимому от n. Тогда выражение (65) превращается в p1 = 1 − mp1/(m + 1), которое имеет решение:
Выражение (64) приобретает форму
Его можно преобразовать как
Затем, раскрывая итерации, получим
где мы использовали выражение (66). Результат можно упростить, используя полезное свойство гамма-функции, см.(21): Γ(a) = (a − 1)Γ(a − 1). Используя его, и опираясь на то, что Γ(1) = 1, получим:
где B(a, b) - уже упоминавшаяся нами бета-функция, см. (20). Как мы видим, это распределение, имеющее форму уравнения (39), которое Симон назвал распределением Юла. Поскольку бета-функция имеет степенной хвост B(a,b) ∼ a−b, мы непосредственно приходим к выводу, что pk также имеет степенной хвост с показателем:
Среднее число m + 1 видов на каждый род для цветущих растений равно примерно 3, из чего получается m ≈ 2 и α ≈ 2,5. Настоящий показатель распределения, установленный Виллисом и Юлом [15] равен α = 2,5 ± 0,1, что прекрасно согласуется с теоретическим значением.
И всё же, такое совпадение, скорее всего, является случайностью. Процесс Юла не слишком реалистичное объяснение распределения размеров родов, в основном потому, что он игнорирует тот факт, что виды (и роды) могут исчезать. Тем не менее модель Юла была успешно адаптирована и обобщена исследователями для объяснения степенных законов во многих других системах, наиболее известные примеры - распределения размеров городов [35], число цитирований научных статей [50,51], число ссылок на веб-страницы всемирной сети [52,53].
В наиболее общем виде процесс Юла описывается следующим образом. Пусть мы имеем систему, образованную набором объектов - биологических родов, городов, статей, веб-страниц и т.п. В этом наборе могут возникать новые объекты - например, возникают новые города или публикуются новые статьи. Каждый объект характеризуется некоторым количественным свойством k, например, числом видов в роде, числом жителей в городе или числом цитирований научной статьи. Мы хотим объяснить механизм появления степенных распределений объектов по свойству k. Новые возникающие объекты имеют некоторое начальное значение величины k, которую мы обозначим как k0. Новообразованный биологический род состоит лишь из одного вида, так что k0 = 1. Однако, новообразованные населённые пункты сразу имеют довольно много жителей - один человек, поселившийся в каком-нибудь отдаленном домике вряд ли может составить самостоятельный населённый пункт, а сотня людей (k0 = 100) уже может. Кроме того, в некоторых случаях значение k0 может равняться нулю: например, только что опубликованные статьи обычно не имеют цитирований.
Между моментом появления одного нового объекта и появлением следующего в систему добавляется m новых видов, людей, цитирований и т.д. При этом некоторые города или статьи приобретут новых жителей или новые цитирования, но не обязательно все. В простейшем случае они добавляются к объектам пропорционально тому, сколько людей уже живёт в городе или сколько цитирований уже имеет статья и т.п. То есть, вероятность того, что город приобретёт нового жителя пропорциональна числу уже имеющихся в нём жителей, а вероятность того, что статья получит цитирование пропорционально уже имеющихся у неё цитирований. Во многих случаях это выглядит вполне естественным правилом. Например, статья, которая часто цитируется с большей вероятностью будет обнаружена в процессе поиска литературы, а значит, и с большей вероятностью будет снова процитирована. Это принцип "богатый становится богаче", и у него много наименований. Симон [35] обозначил его как принцип Гибрата. Другие его называют эффектом Мэттью [54], кумулятивным преимуществом [50] или преференциальным прикреплением [52].
Однако, есть проблема при k0 = 0. Например, если новая статья появляется без цитирований, и набирает цитирования пропорционально числу цитат, уже сделанных на эту статью (а оно равно нулю), то теоретически статья вообще не будет цитироваться! Чтобы решить эту проблему, обычно полагают, что новые цитирования появляются не просто пропорционально k, а пропорционально величине k + c, где c - некоторая константа. Таким образом, имеется три контролирующих модель параметра: k0, c и m.
Двигаясь точно также, как мы двигались выше, можно вывести базовое уравнение:
и
(Заметим, что k никогда не оказывается меньше k0, поскольку каждый новый объект появляется со значением k = k0.)
Чтобы найти стационарное решение этих уравнений, как мы это делали выше, определяем
и находим, что
Получаем:
тут мы использовали запись с помощью гамма-функций, представленную в выражении (70), а также, по причинам, которые станут ясны чуть ниже, мы установили α=2+(k0+c)/m. И снова это выражение можно записать с помощью бета-функции, см. (20):
Поскольку бета-функция приближается в своём хвосте к степенной функции B(a,b) ∼ a−b, обобщенный процесс Юла генерирует степенное распределение pk ∼ k−α с показателем, зависящим от трех параметров следующим образом:
Например, исходный процесс Юла для числа видов в каждом роде имеет c = 0 и k0 = 1, что повторяет результат, записанный в уравнении (71). Для числа цитирований статей или ссылок на веб-страницы мы имеем k0 = 0 и должны иметь c > 0, чтобы могли появляться новые цитирования или ссылки, поэтому α = 2 + c/m. В своей работе, посвященной цитированию научных статей, Прайс [50] предположил, что c = 1, так что цитирования должны распределяться с тем же показателем α = 2 + 1/m, что и в исходном процессе Юла, хотя для этого предположения нет никаких убедительных обоснований. Действительно, как мы видим в таблице 1 (и как сообщает сам Прайс), реальное распределение статей по числу цитирований имеет показатель α ≈ 3, так что мы должны ожидать c ≈ m. Для данных "Индекса научного цитирования", на который мы ссылались в разделе II.A, среднее число цитирований на одну статью m равно 8,6. Поэтому мы должны установить и параметр c ≈ 8,6, чтобы процесс Юла порождал наблюдаемый показатель степени.
Самая изученная модель появления ссылок на веб-страницы, модель Барабаси и Альберта [52], предполагает c = m так что α = 3. Однако, опять же для такого предположения нет основательных причин. Опытный показатель распределения веб-страниц по числу ссылок на них равен α = 2,2, поэтому чтобы достичь в данном случае согласия с опытными данными мы должны взять c ≈ 0,2m.
И всё же, наиболее важный момент заключается в том, что процесс Юла - правдоподобный и достаточно общий механизм, который может объяснить некоторые степенные распределения, наблюдающиеся в природе, и при подходящем наборе параметров может генерировать распределения с показателями в большом диапазоне. Для некоторых рассмотренных нами натуральных примеров, особенно для числа цитирований, населения городов и величины личного дохода, процесс Юла стал наиболее популярной теорией.
1 Собственный анализ Юла гораздо более сложен, чем тот, который мы тут представляем. По всей видимости потому, что теория стохастических процессов, как мы её знаем сегодня, во времена Юла не существовала. Использованный нами метод базового уравнения - это относительно недавнее изобретение, представленное в данном контексте Симоном [35].
E. Фазовые переходы и критические феномены
Совершенно другой механизм получения степенных законов, который в последние несколько десятилетий привлёк к себе огромное количество внимания со стороны физического сообщества - критические феномены.
Некоторые системы обладают единственным управляющим макроскопическим масштабом длины, размера или времени. Классический пример - магнит, в котором имеется длина корреляции, соразмерная типичному размеру магнитных доменов. В определенных условиях эта длина может расходиться, размываться, так что в системе вообще исчезает характерный масштаб длины. Как мы далее увидим, в этом случае система становится "масштабно-инвариантной" в том смысле, который был описан в разделе III.E, а потому распределения макроскопических физических величин в этих условиях должно соответствовать степенным законам. Обычно эти условия довольно специфические. Чтобы получить степенное поведение системы необходимо очень точно подбирать её параметры. И в определенном смысле это недостаток модели: расхождение характерного масштаба оказывается слабым объяснением для тех примеров натуральных степенных распределений, о которых мы говорили. Однако, как мы увидим, существуют элегантные и интересные способы решения этой проблемы.
Точка, в которой масштаб длины в системе расходится называется критической точкой или фазовым переходом. Говоря точнее, это непрерывный фазовый переход (существуют и другие виды фазовых переходов). Явления, которые возникают в апогее непрерывного фазового перехода известны как критические феномены, и степенной закон - один из таких феноменов.
Рис.10 Модель перколяции на квадратной решетке: клетки случайно и независимо друг от друга закрашиваются с некоторой вероятностью p. В данном случае p=1/2.
Чтобы лучше понять физику критических феноменов, исследуем один простой, но интересный пример, так называемый "перколяционный переход". Рассмотрим квадратную решетку (рис.10), в которой некоторые клетки закрашены. Предположим, что мы закрашиваем каждую клетку с независимой вероятностью p, так что в среднем в решетке будет закрашена относительная доля р всех клеток. Теперь посмотрим на кластеры, которые формируются из закрашенных клеток, то есть, области непрерывной закраски. К примеру, задуматься, какова средняя площадь кластера 〈s〉, к которому принадлежит случайно выбранная клетка. Если клетка не закрашена, эта площадь равна нулю. Если она закрашена, но к ней не примыкает других закрашенных клеток, эта площадь равна единице, и т.д.
Рис.11 Три примера перколяционной системы на решетке 100 на 100 с p=0,3, p=pc=0,5927... и p=0,9. Первый и последний пример находятся ниже и выше критической точки соответственно, средний пример - точно в критической точке.
Когда вероятность p мала, только небольшое число клеток решетки будет закрашено и большинство закрашенных клеток будет находиться в одиночестве или, может быть, образовывать группы по две или три клетки. Таким образом, 〈s〉 будет мало. Эта ситуация изображена на рис.11 для p=0,3. Наоборот, если p велика - почти равна единице - тогда большинство клеток будет закрашено и они почти все будут объединяться в один большой кластер, так называемый охватывающий кластер. Мы будем говорить, что в этой ситуации система перколирует. Средний размер кластера, которому принадлежит одна клетка, ограничивается при этом лишь размером самой решетки, и если решетка становится большой, становится большим и значение 〈s〉. Так мы получаем два совершенно разных случая: один для маленьких значений вероятности p, в котором 〈s〉 мало и не зависит от общих размеров системы, и второй для ситуации, в которой p велико, 〈s〉 тоже велико, и при этом увеличивается с ростом размеров системы.
Но что происходит в каком-то промежуточном случае? По мере роста p величина 〈s〉 тоже растет. Но в какой-то момент мы достигаем начала режима, в котором 〈s〉 перестает быть постоянной, а начинает расти вместе с размером системы. Теперь известно, что эта точка, в которой p=0,5927462... Эта величина называется критическим значением p и обозначается как pc. Если размер решетки велик, тогда 〈s〉 в этой точке также становится большим, и в пределе, когда размеры решетки стремятся к бесконечности, значение 〈s〉 расходится. Для иллюстрации этого феномена на рис.12 изображен график зависимости 〈s〉 от p, полученный по результатам симуляции модели перколяции. Расхождение 〈s〉 вполне наглядно.
Рис.12 Средняя площадь кластеров, которым принедлежит случайно выбранная клетка перколяционной модели, описанной в тексте. Среднее значение рассчитывалось на основе более чем 1000 симуляций на решетке 1000 на 1000. Пунктир обозначает известное значение точки фазового перехода.
Теперь рассмотрим не просто средний размер кластеров, но распределение их размеров. Пусть p(s) - вероятность, с которой случайно выбранная клетка принадлежит кластеру площадью s. Какую общую форму может иметь распределение p(s) в зависимости от s? Важно заметить, что p(s), являясь распределением вероятности, представляет собой безразмерную величину, просто число, а s измеряется в единицах площади. Мы могли бы измерять s в квадратных метрах или в любых других единицах измерения, подходящих для нашей решетки. Среднее значение 〈s〉 также является площадью, а также некоторой единичной площадью обладает одна клетка, обозначим её как a. Но кроме этих трех величин, в задаче больше нет назависимых параметров, имеющих не-числовую размерность. (Имеется ещё площадь всей решетки, но мы будем рассматривать предел, в котором она становится бесконечной, поэтому мы её не включаем в общую картину.)
Если мы хотим сконструировать безразмерную функцию p(s) из этих трех имеющих размерность параметров, имеется три безразмерных отношения, которые мы можем сформировать: s/a, a/〈s〉 и s/〈s〉 (и их обратные варианты). Из них лишь два отношения являются независимыми, поскольку третье можно получить из двух других. Таким образом в общем мы можем записать:
где f - безразмерная математическая функция безразмерных же аргументов, а С - нормирующая константа, выбранная так, что s p(s) = 1.
Теперь проделаем небольшой трюк. "Укрупним зерно", то есть, перемасштабируем решетку таким образом, что фундаментальная единица измерения площади увеличится. Например, мы можем удвоить линейный размер единичной площади a - то есть, проделаем то, что примерно изображено на рис.13. При этом крупные перколяционные кластеры примерно сохраняют свой размер и форму (пришлось немного "поколдовать" с границами кластеров, чтобы получилась понятная иллюстрация), но не маленькие. По этой причине операция перемасштабирования является строго корректной только для больших кластеров, площадь которых не значительно изменяется в результате операции. (По этой же причине вся приведенная логика приводит нас к выводу о том, что только хвост распределения кластеров по размерам наверняка соответствует степенному закону.)
Рис.13 Перколяционная система подвергается перемасштабированию, так что единичная площадь учетверяется. Положение закрашенных клеток на укрупнённой решетке (справа) выбрано так, чтобы максимально близко соответствовать клеткам оригинальной решетки (слева), поэтому размеры и формы больших кластеров остаются примерно неизменными. Маленькие кластеры при перемасштабировании скорее всего будут потеряны, так что аргументация, приведенная в тексте, применима только для хвоста распределения размера кластеров, в котором s велико.
Вероятность p(s) получения кластера площади s в результате перемасштабирования не изменяется, поскольку сами площади с достаточной долей приближения не меняются, не меняется и средний размер кластеров. Говоря с математической точки зрения, всё, что при этом происходит - перемасштабируется единичная площадь a, так что a → a/b при каком-то постоянном масштабирующем множителе b. Аналог выражения (78) в перемасштабированной системе выглядит как
Сравнивая результат с выражением (78), видим, что он с точностью до константы-множителя эквивалентен вероятности p(bs) получения кластера размером bs в измененной системе со средним размером кластеров b 〈s〉. Таким образом мы связываем между собой вероятности получения кластеров двух различных размеров, хотя вероятности рассчитываются для систем с разным средним размером кластеров и, возможно, с разной вероятностью закрашивания отдельной клетки. Заметим, что в общем случае при перемасштабировании нормирующая константа должна быть изменена, чтобы p(s) в сумме по прежнему давало единицу, и её величина зависит от выбранного масштабирующего множителя b.
Теперь заметим, что имеется одна особая точка, в которой перемасштабирование по определению не приводит к изменению среднего 〈s〉 или к вероятности закрашивания одной клетки p, это и есть критическая точка. Когда мы находимся точно в точке, в которой среднее 〈s〉 устремляется к бесконечности, тогде по определению b 〈s〉 = 〈s〉. Устремляя в уравнениях (78) и (79) 〈s〉 к бесконечности, мы получим
или, что то же самое
где g(b) = C/C′. Сравнив этот результат с выражением (29), мы обнаружим, что он имеет в точности форму уравнения, определяющего масштабно-инвариантные распределения. Из него следует тот же самый результат, который мы получили на основе уравнения (29), а значит p(s) должно соответствовать степенной функции.
Этот результат и является причиной, по которой распределения, имеющие форму (29) называются "масштабно-инвариантными". Момент, в который среднее 〈s〉 расходится в системе не остается определенного пространственного масштаба кроме самой единицы её измерения a. Она становится масштабно-инвариантной, и в соответствии с изложенной выше аргументацией, распределение размеров кластеров s должно стать степенным.
На рис.14 приведён пример кумулятивного распределения размеров кластеров перколяционной ситсемы в критической точке, и ясно, что распределение соответствует степенному закону. Строго говоря распределение не может следовать степенному закону для кластеров произвольно большого размера, поскольку площадь кластеров не может быть больше площади всей решетки, поэтому степенное распределение имеет обрез в хвосте. Это пример эффекта ограниченного размера. Тем не менее, на рис.14 точка обреза не видна.
Рис.14 Кумулятивное распределение размеров кластеров для перколяции на квадратной решетке 40000 на 40000 в критической точке, где вероятность закрашивания одной клетки pc = 0,592746...
Логика, изложенная в этом параграфе может быть сформулирована более строго и точно с применением аппарата группы ренормализации. Для вывода степенных законов и их показателей для распределений в критической точке реально-пространственная группа ренормализации использует преобразования, подобные тем, что изображены на рис.13. Пример с перколяционной проблемой был предложен Рейнольдсом [55]. Еще более совершенная и элегантная техника - это k-пространственная группа ренормализации, в которой для получения подобных же результатов используются преобразования в пространстве Фурье [56].
1
" тогда большинство клеток будет закрашено и они почти все будут объединяться в один большой кластер, так называемый охватывающий кластер"
когда прочитал про "охватывающий" кластер подумалось про очевидность невозможности фазовых переходов второго рода(они же непрерывные переходы) в одномерных системах. Действительно, в них невозможно существование "охватывающего" кластера при p
druggist (12.11.2012 17:47)
2
да.... при p меньших еденицы исключительно из "геометрических соображений":)
druggist (12.11.2012 17:56)
Ваш комментарий
image Поля, отмеченные звездочкой, нужно обязательно заполнить
Заголовок комментария:
image Текст комментария: (не более 2000 символов, HTML-разметка удаляется)
image Ваше имя:
Ваш E-mail:
image Сколько будет дважды два? (ответьте цифрой, это проверка от спам-рассылок)
Отправить комментарий
Главные темы
Внимание (8)Геогештальт (1)Гештальт (16)Динамика внимания (5)Инсайт (5)Интуиция (2)Кибернетика (5)Когнитивное управление (6)Когнитивный анализ (4)Когнитивный словарь (5)Культура наблюдения (5)Мерцающие зоны (7)Метафизика (3)Метафора (13)Механизмы восприятия (15)Мифы и парадигмы (7)Органическая логика (5)Прогнозирование (6)Роль языка (4)Симметрии (5)Синхронизмы (5)Сложные системы (10)Степенной закон (8)Творческое мышление (5)Три уровня систем (4)Управление знаниями (3)Фазы развития (7)Фракталы (18)Цветные шумы (9)
КОГНИТИВИСТ: когнитивные методы и технологии © Роман Уфимцев, при поддержке Ателье ER