КОГНИТИВИСТИдейное ядро²Степенные законы, распределения Парето и закон Зипфа
V. Заключение и приложения
Прологи: наука о сознании становится точной
Манифест когнитивиста
.
Узелки на распутку
.
Прологи
.
Степенные законы, распределения Парето и закон Зипфа
Когнитивный уровень
.
Мерцающие зоны
.
Органическая логика: резюме
Карта органической логики
.
Хвост ящерки. Метафизика метафоры.
.
Опус 1/F
.
Anschauung, научный метод Гёте
.
Закон серийности Пауля Каммерера
.
Ранние признаки критических переходов
.
Слабые сигналы
.
Меметика
.
Системный анализ и чувствительные точки
.
Спиральная динамика
.
V. Заключение и приложения
 
Заключение
В этом обзоре мы обсудили степенные статистические распределения, которые встречаются в широком диапазоне натуральных и искусственных систем - от землетрясений и солнечных вспышек до населения городов и продаж книг. Мы познакомились со многими примерами степенных распределений в опытных данных и узнали, как должны анализироваться эти данные. Также были описаны несколько физических механизмов, которые предлагаются для объяснения степенных законов. Вероятно, двумя важнейшими из них являются:
  1. Процесс Юла. Механизм, действующий на основе принципа "богатый становится богаче", при котором самые населенные города приобретают больше всего новых жителей, а самые продаваемые в прошлом книги распродаются и в настоящем лучше всего. Юл, а позже Симон показали математически, что этот механизм приводит к распределениям, которые теперь называются распределениями Юла. Эти распределения следуют степенному закону в своём хвосте.
  2. Критические феномены и близкая им концепция самоорганизующейся критичности. В этих механизмах характерный масштаб системы расходится, размывается - потому что мы настраиваем систему так, чтобы она оказалась в особой критической точке своего параметрического пространства или потому, что система сама приводит себя в эту точке благодаря каким-то динамическим процессам. Система теряет характерный масштаб каких-то измеримых величин и они начинают распределяться в соответствии со степенными законами.
Исследование степенных распределений - область, которая в настоящее время вызывает немалый научный интерес. Хотя описанные в этом обзоре механизмы и объяснения определенно проливают некоторый свет на вопрос, должно быть проделано еще немало экспериментальной и теоретической работы, прежде чем мы сможем по настоящему понять физические процессы, управляющие подобными системами. Нет сомнений, что тут предстоит совершить еще немало замечательных открытий.
Приложение A. Диаграммы ранг/частота
Предположим, мы хотим построить график функции кумулятивного распределения P(x) какой-то величины, например, частоты различных слов в тексте. Сначала нужно составить список всех слов и подсчитать, сколько раз каждое из них встречается, полученные числа - частоты слов. Кумулятивное распределение частот определяется так: P(x) равно относительной доле слов, имеющих частоту x или больше. Альтернативно можно просто построить график абсолютного количества слов, имеющих частоту x или более, что отличается от относительной доли только нормировкой.
Рассмотрим теперь самое часто встречающееся слово, в большинстве английских текстов таким словом является "the". Если x - частота, с которой встречается это слово, то в тексте имеется только одно слово, имеющее частоту равную x или выше - это, очевидно, и есть слово "the". Точно также и для второго по частотности слова - обычно это "of" - в тексте имеется только два слова, имеющего частоту, равную или превышающую частоту этого слова - оно само и слово "the". Также и для остальных слов. То есть, если мы отранжируем слова по частоте, тогда по определению будет иметься n слов, имеющих частоту равную или превышающую частоту n-ного по рангу слова. Таким образом, величина кумулятивного распределения P(x) прямо пропорциональна рангу слова n. Это значит, для построения графика P(x) нам лишь нужно рассортировать слова по уменьшению их частоты, пронумеровать их, начиная с 1, а затем построить график их рангов в зависимости от частот.
Такие графики были названы Зипфом [2] диаграммами ранг/частота, и так иногда до сих пор называют диаграммы кумулятивных распределений. Конечно, многие интересующие нас статистические величины не являются частотами - например, силы землетрясений, величины богатства и т.д. - и всё равно построенные на этих принципах графики часто называют диаграммами ранг/частота, хотя технически это не точно.
На практике, сортировка опытных данных, их ранжирование, а затем построение графика рангов в зависимости от значения замеров - обычно самый простой и быстрый способ построения кумулятивного распределения. Все кумулятивные распределения в этой статье были получены именно таким способом, кроме диаграммы распределения размеров лунных кратеров, для которых данные уже были представлены в кумулятивной форме.
Приложение B. Определение показателя степени методом максимального правдоподобия
Рассмотрим степенное распределение
в котором используется значение нормирующей константы C, вычисленное в уравнении (9).
Если у нас имеется набор из n значений xi, вероятность, что эти значения получены из данного распределения пропорциональна величине
Она именуется правдоподобием набора данных.
Чтобы найти значение α, которое лучше всего соответствует данным, необходимо вычислить вероятность P(α|x) некоторого значения α исходя из набора данных {xi}. Эта вероятность связана с P(x|α) законом Байеса, так что:
Исходная вероятность данных P(x) фиксирована, поскольку x само фиксировано - x это конкретный набор наблюдений у нас на руках и он не меняется при расчетах. Кроме того, если нет каких-либо свидетельств об обратном, обычно предполагается что исходная вероятность степенного показателя P(α) однородная, то есть, является константой, независимой от α. Таким образом P (α|x) пропорциональна P (x|α). Удобнее работать с логарифмом P(α|x), который с точностью до аддитивной константы равен логарифму правдоподобия. Обозначим его как L:
Теперь посчитаем наиболее вероятное значение α, максимизируя правдоподобие относительно α. Это то же самое, что максимизирование логарифма правдоподобия, поскольку логарифм - монотонно возрастающая функция. Устанавливая ∂L/∂α = 0, мы найдем, что
или
Нам также нужно узнать ожидаемую погрешность значения α. Мы можем оценить её из ширины максимума правдоподобия как функции от α. Взяв экспоненту от уравнения (B4), мы выясним, что правдоподобие имеет форму
где
тут a - константа нормировки, не представляющая интереса. Предположив, что α > 1, так что распределение (B1) поддается нормировке, среднее и средний квадрат величины α в этом распределении задается выражениями
и
тут Γ(x) - гамма-функция. Тогда стандартное отклонение α равно
а погрешность
В большинстве случаев n велико, поэтому можно считать, что n+1 ≈ n, при этом получим
где α - оценка показателя, полученная методом максимального правдоподобия по уравнению (B6).
1
Как правильно сделать ссылку на первоисточник - статью Newman?
Где она опубликована, в каком журнале? Большое спасибо за хороший перевод. А где объявленная связь с фрактальными структурами ?
Михаил mart47@mail.ru (17.06.2013 17:19)
2
Первоисточник
http://arxiv.org/pdf/cond-mat/0412004.pdf
По моему, связь степенных распределений и фракталов прямая и простая - масштабная инвариантность. В тексте статьи есть об этом.
Роман Уфимцев (17.06.2013 17:24)
Ваш комментарий
image Поля, отмеченные звездочкой, нужно обязательно заполнить
Заголовок комментария:
image Текст комментария: (не более 2000 символов, HTML-разметка удаляется)
image Ваше имя:
Ваш E-mail:
image Сколько будет дважды два? (ответьте цифрой, это проверка от спам-рассылок)
Отправить комментарий
Главные темы
Внимание (8)Геогештальт (1)Гештальт (16)Динамика внимания (5)Инсайт (5)Интуиция (2)Кибернетика (5)Когнитивное управление (6)Когнитивный анализ (4)Когнитивный словарь (5)Культура наблюдения (5)Мерцающие зоны (7)Метафизика (3)Метафора (13)Механизмы восприятия (15)Мифы и парадигмы (7)Органическая логика (5)Прогнозирование (6)Роль языка (4)Симметрии (5)Синхронизмы (5)Сложные системы (10)Степенной закон (8)Творческое мышление (5)Три уровня систем (4)Управление знаниями (3)Фазы развития (7)Фракталы (18)Цветные шумы (9)
КОГНИТИВИСТ: когнитивные методы и технологии © Роман Уфимцев, при поддержке Ателье ER