КОГНИТИВИСТИдейное ядро²Прологи
Пролог 87. Числа и их компоненты
Прологи: наука о сознании становится точной
Манифест когнитивиста
.
Узелки на распутку
.
Прологи
Пролог 1. Когнитивный порядок
Пролог 2. Сигнатура характерного масштаба
Пролог 3. Степенной закон
Пролог 4. Три типа степенных распределений
Пролог 5. Закон Зипфа, сигнатура β = 1
Пролог 6. Цветные шумы, сигнатура α = 1
.
Пролог 7. Розовый шум и модель Бака-Снеппена
Пролог 8. Розовый шум и модель релаксации
Пролог 9. Розовый шум: шипелки и фрактальное блуждание
Пролог 10. Население городов и закон Зипфа
Пролог 11. Масштабно-инвариантные сети
Пролог 12. Фракталы и закон Зипфа
Пролог 13. Дробление континуума
Пролог 14. Социально-географические волокна
Пролог 15. Закон Зипфа в случайных текстах
Пролог 16. Тексты как фракталы
Пролог 17. Когнитивные фракталы
Пролог 18. β и размерность Хаусдорфа
Пролог 19. Образы когнитивных фракталов
Пролог 20. Когнитивные волокна
Пролог 21. Математика когнитивных фракталов
Пролог 22. Стохастические когнитивные фракталы
Пролог 23. Сравниваем Россию и Польшу
Пролог 24. От Швейцарии до Афганистана
Пролог 25. Гармониум
Пролог 26. Шум когнитивных фракталов
Пролог 27. Шум когнитивных процессов
Пролог 28. Розовый шум в поведении людей
Пролог 29. Шум в динамике зрительного внимания
Пролог 30. Изображения и двухмерный розовый шум
.
Пролог 31. Физическая и когнитивная релаксация
Пролог 32. Когнитивная релаксация и цветные шумы
Пролог 33. ВТОРОЙ ЦИКЛ. Дробление времени
Пролог 34. Когнитивное дробление времени
Пролог 35. Время как текст
Пролог 36. События и причинность
Пролог 37. Четыре причины Аристотеля
Пролог 38. Экзогенные причины
Пролог 39. Генеративные модели причинности
Пролог 40. Генеративные модели причинности, часть 2
Пролог 41. Гештальт-причинность
Пролог 42. Тау-модель
Пролог 43. Я-состояния и тироны
Пролог 44. Параметры тау-модели
.
Пролог 45. Параметры тау-модели, часть 2
Пролог 46. Параллельный тирон
.
Пролог 47. Параллельный тирон, часть 2
Пролог 48. Свойства тирона
.
Пролог 49. Свойства тирона, часть 2
.
Пролог 50. Семейства тирона
Пролог 51. Эволюция как тирон
Пролог 52. Я-состояния и девиации
Пролог 53. Эволюция и морфогенез
Пролог 54. Волокна и легенды
Пролог 55. Волокна и легенды, часть 2
Пролог 56. ТРЕТИЙ ЦИКЛ. Я-состояния и их структура
Пролог 57. Я-состояния и их структура, часть 2
Пролог 58. Спиральная структура
.
Пролог 59. Информация и её типы
Пролог 60. Информация и симметрия
Пролог 61. Информация и закон Вебера-Фехнера
Пролог 62. Натуральная пропорция
Пролог 63. Апекс Я-состояний
.
Пролог 64. Генеративные модели Я-состояния
Пролог 65. Нейрон
Пролог 66. Критические случайные графы
.
Пролог 67. Блохи и табакерки
Пролог 68. Чаши, табакерки и прочее
.
Пролог 69. Интерлюдия
Пролог 70. Гештальт числа e
.
Пролог 71. Гештальт числа e, часть 2
Пролог 72. ЧЕТВЁРТЫЙ ЦИКЛ. Тиронный рост
Пролог 73. Обобщённые процессы
Пролог 74. Обобщённые процессы, часть 2
Пролог 75. Обобщённые процессы и энтропия Реньи
Пролог 76. Дельта-процессы
.
Пролог 77. Дельта-аддитивные процессы
Пролог 78. Дельта-мультипликативные процессы
Пролог 79. Дельта-мультипликативные процессы, часть 2
Пролог 80. Дельта-мультипликативные процессы, часть 3
Пролог 81. Структурно-временной изоморфизм
Пролог 82. Тау-процесс и время
Пролог 83. Знаки состояний
Пролог 84. Мерные знаки и случайное блуждание
.
Пролог 85. Именные знаки и графы состояний
Пролог 86. ПЯТЫЙ ЦИКЛ. Простые числа
Пролог 87. Числа и их компоненты
Пролог 88. Время и простые числа
Пролог 89. Т-информация
Пролог 90. Новый прототип статистики Зипфа
Пролог 91. Новый прототип и гармоническая информация
.
Пролог 92. Не-целочисленные симметрии
Пролог 93. Спектры симметрии
.
Пролог 94. Преобразования симметрий
Пролог 95. Комплексные симметрии
Пролог 96. Cимметрии и структурные модальности
Пролог 97. Симметрии и характерная динамика
Пролог 98. Симметрия, энергия, излучения
Пролог 99. Симметрия системы
Пролог 100. Симметрия континуумов и траекторий
Пролог 101. Симметрия континуумов, часть 2
Пролог 102. Симметрия и масштаб
Пролог 103. Симметрия и вероятность
Пролог 104. Симметрия и вероятность, часть 2
.
Пролог 105. Преобразование симметрии континуумов
Пролог 106. Cимметрия многомерных континуумов
Пролог 107. Опыты с взаимодействием форм
Пролог 108. Опыты с взаимодействием форм, часть 2
Пролог 109. Омега-преобразование
Пролог 110. Омега-линзы
Пролог 110 (2). Омега-линзы, часть 2
Пролог 111. Геометрическое среднее и максимум энтропии
Пролог 112. Мультипликативные коллизии
Пролог 113. Смысл принципа максимума энтропии
Пролог 114. Варианты модели мультипликативных коллизий
Пролог 115. Свойства модели мультипликативных коллизий
Пролог 116. Геометрическая энтропия
Пролог 117. Специальные энтропии. Последний Пролог.
Степенные законы, распределения Парето и закон Зипфа
.
Когнитивный уровень
.
Мерцающие зоны
.
Органическая логика: резюме
Карта органической логики
.
Хвост ящерки. Метафизика метафоры.
.
Опус 1/F
.
Anschauung, научный метод Гёте
.
Закон серийности Пауля Каммерера
.
Ранние признаки критических переходов
.
Слабые сигналы
.
Меметика
.
Системный анализ и чувствительные точки
.
Спиральная динамика
.
Пролог 87. Числа и их компоненты
 
Роман Уфимцев
12 апреля 2013 года, Калининград
В предыдущем Прологе мы обозначили новую тему наших изысканий - простые числа. Автор, конечно, отдаёт себе отчёт в том, что тема простых чисел несёт сегодня на себе некоторый отпечаток любительства. Тысячи самодеятельных исследователей по всему миру пытаются раскрыть загадку простых чисел, доказать сложные теоремы, связанные с ними (за доказательство некоторых обещаны неплохие премии - это тоже, видимо, помогает популярности). Но, говоря по чести, у автора Прологов иная мотивация. Мы не намерены пытаться доказывать связанные с простыми числами знаменитые теоремы Ферма или гипотезы Римана. У автора особый интерес: есть нечто такое в самой Идее простых чисел, что кажется важным и даже необходимым звеном в наших поисках. Скажу так: именно с простыми числами связана единственная надежда формально описывать то, что по общему мнению не поддаётся формальному описанию.
И пусть эта надежда призрачна, но потенциал этой возможности стоит того, чтобы хотя бы попытаться разобраться в этом деле.
В этом Прологе мы перейдём от знакомства с простыми числами к более серьёзному их анализу, а заодно положим начало совершенно новому классу моделей - не стохастических, с которыми мы до сих пор только и имели дело, а полностью детерминированных. Даже только это уже стоит "простых свеч".
Простые компоненты натурального ряда
Вернёмся к картинке из предыдущего Пролога. Она иллюстрирует, как из уникальных комбинаций простых чисел как молекулы из атомов разных химических элементов выстраиваются все числа натурального ряда:
Один из простых вопросов, который приходит в голову в этой связи - какова "массовая доля" каждого из перво-элементов в каком-то достаточно длинном натуральном ряде? То есть, сколько простых атомов красного, зелёного, синего и т.д. цвета нам нужно взять, чтобы, например, сконструировать из них молекулы, соответствующие натуральному ряду от 2 до 100?
Интуитивно ясно, что чем больше простое число, тем реже оно будет встречаться в составе других чисел. Проверим это с помощью вычислений, и вот что мы обнаружим:
Итак, наименьшее простое число, 2 (будем выделять простые числа жирным шрифтом, когда будем говорить о них как о компонентах) в натуральном ряду чисел от 2 до 100 встретилось действительно чаще всех, 97 раз. С другой стороны, крупнейшее простое число диапазона 2:100, число 97, встретилось только один раз (что естественно). Конечно, немедленно обращает на себя внимание одно обстоятельство: количество "простых атомов" 2, которое необходимо для реконструирования натурального ряда от 2 до 100 весьма напоминает верхнюю границу этого ряда: 97 против 100. А форма частотного распределения простых компонентов по их количеству напоминает степенную функцию. Проверим это, изменив оси на логарифмические:
"Чуть-чуть" распределение не уложилось на простую степенную функцию 1/x. Впрочем, это легко поправить: для этого будем по оcи X откладывать не собственно простые числа p, а величины, на единицу меньше p-1. Например, простому числу 2 на оси X будет соответствовать точка 1, числу 3 - точка 2, и т.д. И теперь всё выглядит гораздо эстетичнее:
Точки отлично укладываются на степенную функцию 1/x, что не вызывает сомнений, если мы построим такую же диаграмму количества "простых атомов" в натуральном ряде 2:10000:
Иными словами, количество простых компонентов П, из которых сложены числа натурального ряда от 2 до N при достаточно больших N весьма точно соответствует выражению
где p - все простые числа в диапазоне от 2 до N.
Доказательство этой, пожалуй, прелюбопытной формулы (а автор не встречал её в литературе, посвященной простым числам - наверное, из-за небольшого круга чтения) на удивление простое. Рассмотрим натуральный ряд чисел от 2 до N, разложим каждое число на простые множители (нам достаточно проанализировать начало ряда):
Оценим для начала количество простых компонентов 2, из которых складывается ряд. Во-первых, ясно, что как минимум один такой компонент имеет каждый второй член ряда:
Каждый четвёртый член ряда имеет по два таких компонента:
Каждый восьмой - по три компонента:
и т.д. Из этого мы получаем ожидаемое количество простых компонентов 2:
где N-1 - фактическое количество членов натурального ряда 2:N (при больших N, N-1≈N), а k определяется из условия, что 2k - последняя степень двойки, при которой результат ещё меньше, чем N. Поскольку с ростом k значение 1/2k быстро стремится к нулю, мы можем положить k=∞. В этом случае значение П(2) просто равно сумме членов бесконечной геометрической прогрессии:
Обратимся теперь к простым компонентам 3. Двигаясь той же траекторией логики, получим, что
или
И вообще, мы установим, что для простого компонента p ожидаемое количество его появлений равно
Доказательство завершено. Заметим, однако, что эта формула выполняется не только для простых чисел, а вообще для любых целочисленных множителей. То есть, если бы, например, число 4 было простым, то количество компонентов 4 в натуральном ряду также определялось бы полученным уравнением.
Итак, в количестве простых компонент натурального ряда мы обнаружили нечто, подозрительно похожее на закон Зипфа. Лишь одна "маленькая" деталь не позволяет нам объявить, что простые компоненты действительно подчиняются этому закону. Дело конечно в том, что в действительности полученный закон Зипфа описывает количество всех возможных целочисленных множителей членов натурального ряда, но простые множители составляют лишь их часть: из N возможных множителей, в соответствии с теоремой простых чисел, только около N/ln(N) являются простыми.
Мы обнаружили какую-то причудливую вариацию закона Зипфа. Однако, прежде чем мы её обсудим, кстати ещё раз поговорим о важнейшей теореме простых чисел. Полученная выше нами формула позволяет теперь нам легко её доказать.
Между делом: доказательство теоремы простых чисел
Мы получили интересную и очень полезную формулу. Между делом покажем, как с её помощью можно доказать теорему простых чисел, в соответствии с которой в натуральном ряду 2:N имеется порядка N/ln(N) простых чисел, а также выведем ещё пару интересных формул. Пусть с нашей стороны это будет приветственный салют теории (и теоретикам) простых чисел.
От полученного выше результата мы очевидным образом приходим к красивому уравнению:
Оно отражает тот факт, что факториал N! в качестве своих множителей имеет все простые множители, из которых складываются числа натурального ряда от 2 до N.
Запишем его, заменив факториал приближением Стирлинга:
Возьмём логарифм обоих частей уравнения:
Отсюда
При больших N второе слагаемое в левой части уравнения оказывается близким к 0, потому можно записать:
Отсюда получаем замечательную по простоте формулу, связывающую натуральное число N со всеми простыми числами, находящимися в диапазоне 1:N :
Эта формула действительно замечательная. Однако, она только приблизительная: хотя между правой и левой частью уравнения действительно имеется линейная связь, но точнее она описывается формулой
где γ - постоянная Эйлера-Машерони. Величина eγ ≈ 1,78..., и это хорошо соответствует реальным результатам. На этой диаграмме отражено реальное отношение между произведением в правой части формулы и числом N:
С ростом N отклонение отношения N/П от величины eγ снижается степенным образом как 1/N1/2, что также косвенно свидетельствует о том, что предельное отношение равно именно eγ:
Вероятно, более строгий вывод позволит внести тут уточнение. В любом случае, для доказательства теоремы простых чисел нам достаточно принять, что
Нам осталось сделать последние шаги в доказательстве. Пусть между натуральным числом N и числом N+x нет простых чисел, а числа N и N+x - простые. Тогда можем записать
Отсюда
Найдём, как меняется размер прогона между простыми числами в зависимости от N, то есть, найдём форму зависимости x(N).
При больших N, N+x-1≈N+x, так что можно упростить и, логарифмируя, преобразовать:
При больших N, x очевидно гораздо меньше N, и это позволяет использовать свойство логаримфа ln(1+A) ≈ A если A мало, получим:
или, поскольку x гораздо меньше N, окончательно приближенно получим
Далее, заметим, что простые числа встречаются в среднем один раз на x-1 = ln(N)-1 чисел натурального ряда:
Из этого прямо следует, что в натуральном ряду 2:N при достаточно больших N количество простых чисел отвечает уравнению
Теорема простых чисел доказана.
Теперь, немного "порезвившись" в пучинах математики, вернёмся к загадочной вариации закона Зипфа в распределении простых компонент натурального ряда.
Натуральный ряд - текст, простые числа - слова
Обсуждая натуральные примеры статистики Зипфа, мы много внимания уделили каноническому примеру - распределению слов по количеству их появлений в натуральных текстах. Речь идёт о том, что во многих языках (может быть, за редкими исключениями) статистика частоты использования тех или иных слов в некотором натуральном тексте, речи или вообще во всём корпусе текстов на данном языке обычно соответствует закону Зипфа. Если мы выстроим слова по рангу (то есть, рассортировав их от часто втречающихся к реже встречающимся), то количество их появлений в тексте обычно укладывается на степенную функцию вида 1/x, например:
И вот теперь мы обнаружили этому феномену любопытную аналогию: точно также статистикой Зипфа описывается количество целочисленных множителей, из которых складываются числа натурального ряда. Тут натуральный ряд является аналогом текста, каждый член ряда - аналогом одного предложения, а целочисленные множители, из которых сложен член ряда - аналогами слов в предложении.
Однако, аналогия эта не вполне точна - но в этом и состоит её ценность с точки зрения иллюстрации особенностей устройства натурального ряда как особого "текста". Попробуем в них разобраться.
Третье по частотности слово в натуральных текстах является полноценным независимым словом. Но третий по частотности целочисленный множитель чисел натурального ряда - число 4 - не является таким же самостоятельным и полноценным. Он образован простыми множителями 2*2. Получается, что строя ранговое распределение всех возможных целочисленных множителей натурального ряда - которое вполне отвечает закону Зипфа - мы учитываем простые множители по нескольку раз. Например, сначала простые множители 2 учитываются как собственно целочисленные простые множители 2, затем - в составе целочисленных не-простых множителей 4, 6, 8 и т.д. Таким образом в ранговом распределении наряду с "настоящими" простыми множителями появляются и "производные" или "составные" - и только в совокупности они образуют распределение, отвечающее закону Зипфа в прямом смысле слова:
Тут чёрным цветом отмечены простые множители, красным - не-простые. Мы можем скрыть не-простые множители, и тогда увидим "зипфоподобную" диаграмму, которая в строгом смысле не является ранговым распределением:
Если же мы попробуем построить полноценное ранговое распределение, учитывая только простые множители, мы получим картину, уже не отвечающую закону Зипфа:
Мы разбираем эту особенность распределения простых множителей подробно, чтобы стала понятна идея, которую мы можем вынести из аналогии между натуральным рядом и текстом: а что, если и в типично зипфовском ранговом распределении слов натурального языка по частотности имеются "простые" слова и "не-простые" слова? Что, если в языках есть слова, по своей фундаментальной роли подобные простым числам, а есть слова производные, подобные множителям, которые сами составлены из других множителей?
Опираясь на аналогию, мы даже можем оценить количество "производных" или "составных" слов в каждом натуральном тексте. Если всего в тексте использовано N разных слов, то лишь ≈ N/ln(N) из них являются "простыми словами" или "прото-словами". А остальные являются составными, производными или избыточными.
Полагаю, читатель догадывается, что эта идея касается далеко не только натуральных текстов, а вообще заставляет особым образом взглянуть на феномены, демонстрирующие статистику Зипфа.
Но даже не эта идея сама по себе ценна, сколько дорога к ней. У нас появляется простейшая возможность описать не стохастический, а полностью детерминированный механизм развития когнитивных фракталов, то есть, фрактальных структур, подчиняющихся статистике Зипфа.
Детерминированный механизм
Всё начинается с того, что в "космической пустоте" появляется Единица, первый член натурального ряда. Она становится первым, родовым объектом:
Затем на систему налетает следующий член натурального ряда, число 2. И вот что происходит: число 2 имеет два целочисленных множителя, на которые оно делится без остатка - это 1 (тут мы учитываем этот тривиальный множитель) и множитель 2, который равен самому новому числу. В результате прежде единичная масса родового объекта - именно он "отвечает" за множители равные 1 - увеличивается на единицу. Кроме того, в системе появляется второй, объект, который соответствует множителям 2. Новый объект имеет единичную массу:
Далее на систему налетает следующий член натурального ряда, число 3. Оно имеет два целочисленных множителя - 1 и 3, так что в результате система приобретает вид:
Далее число 4. Оно имеет три уникальных целочисленных множителя, на которые делится без остатка: 1,2,4. Соответственно, на единицу прибавляют в массе объекты, соответствующие множителям 1 и 2, а также в системе появляется объект, соответствующий множителю 4:
Далее процесс продолжается в том же духе: на систему налетают всё новые натуральные числа, и с каждым таким "налётом" в системе появляется один новый объект, а некоторые старые объекты прибавляют в массе единицу.
Полагаю, читателю очевидно, что в этих условиях развивается множество объектов, массы которых не стохастически, не примерно, а совершенно строго соответствуют закону Зипфа. Доказательство этого факта тривиально: естественно, что среди первых N натуральных чисел ровно N делится на единицу без остатка, N/2 - на двойку без остатка, N/3 - на тройку без остатка, и т.д.
Легко понять, что даже если на систему будут налетать не упорядоченные члены натурального ряда, а совершено случайные целые числа (с любым распределением, из любого промежутка), то в результате массы объектов, соответствующие всем возможным целочисленным множителям также распределятся в соответствии с законом Зипфа - хотя со стохастическими флуктуациями. Иными словами, статистика Зипфа возникает тут как следствие собственных "имманентных" свойств чисел.
Полагаю, читатель заметит, что этот закон Зипфа не совсем тот, который мы обнаружили в количестве простых компонентов натурального ряда. В данном случае схема подсчёта массы объектов выглядит так:
Простые же компоненты натурального ряда мы считали несколько иначе:
(Тут для наглядности изображён также подсчет количества компонентов 4, хотя 4 не является простым компонентом.) Заметим, что в первом случае для получения полного закона Зипфа нам необходимо учитывать также множители 1 - соответствующий им объект становится объектом первого ранга с массой N. Во втором же случае объектом первого ранга становится объект множителей 2.
Конечно, оба способа подсчета множителей глубоко родственны друг другу. Их родство опирается на свойство суммы бесконечной геометрической прогрессии:
Фигурально говоря, правая часть этого равенства описывает первый способ подсчёта множителей, левая - второй.
Резонансы
Мы получили два родственных варианта детерминированного порождения множества, соответствующего статистике Зипфа. Однако это лишь множество без явных связей между объектами. Не могли бы мы установить их - так, как они устанавливаются в процессе роста тирона как древовидного фрактала?
Это можно сделать, но для этого познакомимся с понятием резонанса. Мы будем называть резонансами пары целых чисел, одно из которых без остатка делит другое. Например, число 14 без остатка делит число 42, значит, 14 и 42 - являются резонансами друг друга. С другой стороны, числа 18 и 5 не делятся друг на друга без остатка, значит, они не являются резонансами.
Далее, рассмотрим две пары чисел: 14 и 28, 14 и 42. Обе пары являются резонансными, но в первой паре результат деления равен 2: 28/14 = 2, а во второй паре - 3: 42/14 = 3. В таких случаях мы будем говорить, что числа 14 и 28 являются более близкими резонансами друг другу нежели числа в паре 14 и 42 - у более близких резонансов результат взаимного деления оказывается меньшим. Ясно, что ближайшими резонансами друг другу являются пары чисел вида A и 2A.
Пусть каждое новое натуральное число, появляющееся в описанной модели, становится отпрыском ближайшего резонанса, который уже присутствует в системе. Например, если в системе уже представлены объекты, соответствующие множителям от 1 до 11, следующее натуральное число, 12, в качестве ближайшего своего резонанса имеет число 6, значит, именно к объекту 6 оно присоединится в качестве отпрыска. И вот как будет выглядеть древовидная структура после этого:
Естественный вопрос: как будут распределяться числа-объекты по уровням этой структуры. Взглянем на распределение для первых 50000 чисел натурального ряда:
Кривая, которая в целом неплохо описывает форму распределения - гамма-распределение, которое мы обсуждали в связи с генеративными моделями когнитивной причинности:
Но подробнее об этом - в следующих Прологах.
Ваш комментарий
image Поля, отмеченные звездочкой, нужно обязательно заполнить
Заголовок комментария:
image Текст комментария: (не более 2000 символов, HTML-разметка удаляется)
image Ваше имя:
Ваш E-mail:
image Сколько будет дважды два? (ответьте цифрой, это проверка от спам-рассылок)
Отправить комментарий
Главные темы
Внимание (8)Геогештальт (1)Гештальт (16)Динамика внимания (5)Инсайт (5)Интуиция (2)Кибернетика (5)Когнитивное управление (6)Когнитивный анализ (4)Когнитивный словарь (5)Культура наблюдения (5)Мерцающие зоны (7)Метафизика (3)Метафора (13)Механизмы восприятия (15)Мифы и парадигмы (7)Органическая логика (5)Прогнозирование (6)Роль языка (4)Симметрии (5)Синхронизмы (5)Сложные системы (10)Степенной закон (8)Творческое мышление (5)Три уровня систем (4)Управление знаниями (3)Фазы развития (7)Фракталы (18)Цветные шумы (9)
КОГНИТИВИСТ: когнитивные методы и технологии © Роман Уфимцев, при поддержке Ателье ER