Российское Трансгуманистическое Движение - Законы истории. Компактные

ЗАКОНЫ ИСТОРИИ: Компактные макромодели эволюции мир-системы А. В. Коротаев, А. С. Малков, Д. А. Халтурина   им. М. В. Келдыша   Москва 2004 Книга сконвертирована в HTML формат для Интернет-публикации . (1,2Mb) Как легко понять хотя бы из названия данной монографии, ее авторы предполагают, что среди ее читателей могут оказаться и историки. Авторы этой книги постоянно общаются с историками, а один из них и сам является профессиональным историком, поэтому они отдают себе отчет в том, что математическое образование заметной части историков не вполне глубоко. Мы неоднократно сталкивались с тем, что, когда мы спрашивали у высокопрофессиональных историков их мнение о некоторых книгах, использующих инструментарий математики для моделирования исторических процессов, мы получали ответы типа: "Да, я начал читать эту книгу, но потом пошли какие-то формулы, я перестал что бы то ни было понимать, и не стал ее дальше читать". Поэтому мы вполне отдаем себе отчет в том, что и эту книгу рискует постигнуть такая же судьба. Поэтому мы постарались сделать ее доступной и для тех, кто никакого математического образования не имеет, давая все необходимые пояснения всякий раз, когда мы вводим неизвестные широкому кругу читателей математические понятия или методики. Поэтому мы рекомендовали бы тем из наших читателей, которые не уверены в своей математической подготовке, не пробовать читать эту книгу с середины, а читать ее подряд, начиная с первой страницы, не пропуская тех пояснений, которые выделены курсивом, и в которых содержатся все необходимые разъяснения. Вы увидите, что прикладная математика "для пользователя" не так уж и сложна, и вполне доступна для понимания тех, кто специального математического образования не имеет. С другой стороны, мы не рекомендовали бы читать те же самые выделенные курсивом пояснения тем, кто математическое образование имеет, ибо в них они вряд ли найдут для себя что-то новое. Содержание В 1950-2003 гг. рост населения мира имел следующий вид (см. Диаграмму 1 Диаграмма 1. Рост населения мира, 1950-2003 гг. (в миллионах) Хотя, на первый взгляд, рост населения мира в 1950-2003 гг. выглядит вполне линейным, даже самый простой анализ динамики изменения годовых темпов роста населения показывает, что мы в реальности имеем дело с очень сложной и интересной ситуацией (см. Таблицу 1 и Диаграмму 2): Таблица 1. Динамика роста населения мира, 1950-2003 гг. Диаграмма 2. Динамика изменения относительных темпов роста населения мира, 1950-2003 гг. Как мы видим, до 1962 г. наблюдалось достаточно быстрое ускорение темпов роста населения мира. Однако после 1963 г. мы уже имеем дело с прямо противоположным трендом - годовые темпы роста населения мира начинают достаточно быстро и устойчиво снижаться. Эта смена трендов будет выглядеть особенно драматично, если мы возьмем данные не за последние полвека, а за последние две тысячи лет (см. Диаграмму 3): Диаграмма 3. Динамика изменения относительных темпов роста населения мира, 1-2003 гг. н.э. Собственно говоря, в 1990-2003 гг. мы имеем дело с исключительно сильной отрицательной корреляцией между численностью населения мира и относительными темпами его роста (см. Диаграмму 4): Диаграмма 4. Корреляция между численностью и годовыми темпами роста населения мира, 1990-2003 гг. Корреляционный и регрессионный анализ рассматриваемых рядов данных дает следующие результаты (см. Табл. 2a и 2b): Таблица 2. Корреляция между численностью и годовыми темпами роста населения мира, 1990-2003 гг. a. Корреляционный анализ: ПОЯСНЕНИЯ К ТАБЛИЦЕ 2а. Мы отдаем себе отчет в том, что многим читателям цифры, приводимые в нижеследующей таблице, могут ничего не говорить. Однако это не так уж страшно. Рискнем утверждать, что прикладная математическая статистика "для пользователя" не так уж сложна. Для того, чтобы эта книга могла быть по-настоящему полезна в том числе и читателю, не имеющими математического образования, сделаем необходимые пояснения. Приводимые в данной таблице числа характеризуют корреляцию между рассматриваемыми величинами. Корреляция (зависимость) между двумя показателями обычно характеризуется двумя показателями. Первый из них характеризует силу связи между признаками. Чаще всего (в зависимости от типа данных) используются коэффициент корреляции Пирсона, обозначаемый обычно строчной латинской буквой r , и коэффициент ранговой корреляции Спирмена, обозначаемый греческой буквой Б (в англоязычной литературе часто используется название этой буквы в латинской графике - Rho или Spearman's Rho ). Такие коэффициенты принимают значения от - 1,0 до + 1,0 . Значение + 1,0 означает полную ("функциональную") положительную связь между признаками. Если между признаками существует причинно-следственная связь, это будет значить, что увеличение значения величины х приводит к однозначно определенному увеличению значения величины у . Значение - 1,0 означает полную ("функциональную") отрицательную связь между признаками. Если между признаками существует причинно-следственная связь, это будет значить, что увеличение значения величины А приводит к однозначно определенному УМЕНЬШЕНИЮ значения величины Б . Как можно видеть, коэффициент корреляции в нашем случае имеет отрицательное значение, т.е. корреляция у нас как раз отрицательная (то есть увеличение значения одной величины у нас сопровождается уменьшением значения другой). При положительной корреляции рост значения одной величины будет сопровождаться и ростом значения другой величины. Для того, чтобы понять "рациональный смысл" коэффициента корреляции рекомендуется возвести его в квадрат. Полученное число легче всего интерпретировать, если между анализируемыми показателями существует причинно-следственная связь (что наблюдается, конечно же, далеко не всегда). В этом случае, например, = 0,5 = 0,25 будет говорить о том, что показатель х детерминирует динамику показателя у на 25%. В нашем случае, нет оснований говорить о причинно-следственной зависимости между признаками. В подобных случаях, коэффициент корреляции более правильно интерпретировать как количественный показатель того, насколько достоверную информацию о значении показателя у мы будем иметь, зная значение показателя х (соответственно, если r [а значит и ] равно 0 , это будет говорить о том, что знание значения показателя х не дает нам никакой информации ["предикции"] о значении показателя у ; а если r [а значит и ] равно 1 , это будет говорить о том, что, зная значение показателя х , мы будем абсолютно достоверно знать и значение показателя у . А динамику величину х в таких случаях будет правильно обозначать не как фактор изменения величины у , а как ее "предиктор". Обычно в матстатистике корреляция считается сильной, если она характеризуется коэффициентом более 0,7 , средней - при коэффициенте между 0,5 и 0,7 и слабой, если он меньше 0,5 . Рассматриваемая нами корреляция, однако, охарактеризована выше еще одной величиной ( ± = 0,000 000 000 000 01 ). Это показатель статистической значимости корреляции. В англоязычной научной литературе для его обозначения чаще используется строчная латинская буква p (по первой букве слова probability , "вероятность"). Каков смысл этой величины? Какой смысл имеет, скажем, утверждение, что, например, статистическая значимость некой корреляции равна 0,01 (или, что эта корреляция значима на уровне 0,01 )? Это значит, что вероятность того, что подобная корреляция могла появиться в результате случайности, при отсутствии реальной закономерной связи между признаками равна 0,01 , т.е. есть один шанс из ста, что наблюдаемая корреляция является результатом случайности. Понятно, что вероятность эта довольно низка, так что обычно в таком случае гипотеза о наличии связи между признаками будет считаться нашедшей подтверждение. Исторически сложилось, что в качестве порогового уровня статистической значимости принимается 0,05 ( ~ 5%~ 1 шанс из двадцати). Т.е., если мы получили показатель значимости менее 0,05 , то соответствующая гипотеза считается успешно прошедшей статистическую проверку, если же этот показатель более 0,05 , то соответствующая гипотеза считается неподтвержденной. Подчеркнем, что никакого рационального основания эта конвенция не имеет. Речь идет именно об исторически сложившейся в академическом сообществе научной практике. Применяемый в настоящее время способ оценки статистической значимости корреляций не является единственно возможным и создает заметные трудности для восприятия у людей, начинающих осваивать прикладную матстатистику. Действительно, с трудом воспринимается то обстоятельство, что чем МЕНЬШЕ значение ± , тем ВЫШЕ статистическая значимость связи; что ± = 0,000001 является индикатором высочайшей статистической значимости связи, ± = 0,8 наоборот говорит о предельно низкой статистической значимости (собственно говоря, о том, что корреляция здесь не является статистически значимой). Однако ничего уже здесь не поделаешь. И с этой академической конвенцией нам придется считаться. Необходимо подчеркнуть, что связь между силой корреляции и статистической значимостью корреляции достаточно сложная. Речь идет о достаточно самостоятельных величинах. Корреляция может быть сильной, и вместе с тем иметь крайне низкую статистическую значимость. И наоборот, она может быть крайне слабой и иметь вместе с тем высочайшую статистическую значимость. В случае с табл. 2а мы имеем дело с корреляцией высочайшего уровня статистической значимости ( ± = 0,000 000 000 000 04 ). Т.е. имеется лишь четыре шанса из СТА ТРИЛЛИОНОВ, что наблюдаемая корреляция является результатом случайности, а закономерная связь между двумя рассматриваемыми переменными отсутствует. А значит, можно совершенно уверенно говорить о существовании закономерной связи между двумя данными признаками. Отметим, что обычно при значении показателя статистически значимой ниже 0,0001 (а иногда даже 0,001 ) точное число не указывается, т.е. нередко ограничиваются указаниями типа ± < 0,001 или ± < 0,0001 , так как считается, что в таких случаях речь идет о заведомо статистически достоверной связи и бульшая точность здесь уже не нужна. Наконец, поясним, что корреляция между значениями, предсказанными моделью, и актуально наблюдаемыми данными, обычно измеряется при помощи коэффициента корреляции R , который принимает значения от 0 (полное несоответствие) до 1 (полное соответствие), и который еще неоднократно встретится нам на страницах этой книги. b. Регрессионный анализ R = 0,996, R = 0,993 ПОЯСНЕНИЯ К ТАБЛИЦЕ 2b. При внимательном изучении Табл. 2b в ней нетрудно заметить два числа, которые нам уже попадались в Табл. 2а. Действительно, значение стандартизированного І-коэффициента здесь совпадает со значением коэффициента корреляции Пирсона в Табл. 2а; полностью совпадают для обоих коэффициентов и показатели статистической значимости. Таким образом, регрессионный анализ позволяет нам установить все основные показатели корреляции между рассматриваемыми переменными. Однако регрессионный анализ дает нам и другую важную информацию. Строго говоря, в таблице приводятся данные линейного регрессионного анализа, который наряду с прочим используется для проверки гипотезы о наличии между соответствующими переменными простой линейной зависимости, имеющей вид Y = a + bX . Однако линейный регрессионный анализ позволяет не только установить сам факт наличия между признаками прямолинейной зависимости, но и выяснить основные характеристики этой зависимости. В качестве этих характеристик выступают константа а и коэффициент b . Первое число в строке "Константа" и дает нам значение константы а ( 3,903 ). В качестве независимой переменной (т.е. переменной Х ) в нашем регрессионном анализе выступает численность населения мира. Соответственно, первое число в строке "Население мира (в миллиардах)" и будет представлять значение коэффициента b ( -0,4407 ). Можно сказать, что