Книга Критическая масса. Как одни явления порождают другие - Филип Болл
Шрифт:
Интервал:
Закладка:
Кетле напоминал читателям, что астрономы уже внесли свой вклад в развитие социальной статистики, так как самые первые таблицы показателей смертности были опубликованы в 1693 году известным астрономом Эдмундом Галлеем, современником и другом Ньютона. Кетле полагал, что претензии астрономов на установление порядка в социальной сфере вполне обоснованны, поскольку:
Законы, управляющие людьми и их социальным развитием, должны иметь особую привлекательность для ученых и философов, особенно для тех, кто занят изучением Вселенной. Постигая законы материального мира и восхищаясь их поразительной гармонией, нельзя не прийти к убеждению, что подобные законы должны управлять и миром одушевленных существ18.
Эта убежденность пришла к Кетле в 1823 году, когда его послали в Париж для углубления астрономических знаний во Французской королевской обсерватории, поскольку он был главным претендентом на должность директора будущей брюссельской обсерватории. Эта командировка сыграла важную роль в его судьбе как известного астронома, но для темы нашей книги гораздо важнее, что в Париже он столкнулся с живейшим интересом ведущих французских астрономов к проблемам статистики, связанным, как оказалось, с весьма серьезными научными проблемами.
Наиболее выдающимся астрономом Франции этой эпохи являлся великий математик Пьер-Симон Лаплас (1749-1827), которому удалось значительно обогатить небесную механику Ньютона и выявить новые важные аспекты планетарного движения. Он и его сотрудники, разумеется, давно выяснили, что результаты астрономических наблюдений очень редко точно совпадают с результатами математических расчетов, осуществляемых в соответствии с абсолютно точными законами Ньютона. Практически все измерения всегда содержали хотя бы небольшие ошибки, приводящие к отклонениям от расчетных величин.
Французские астрономы развили методы, позволяющие оценивать эти ошибки, и нашли непрерывные кривые, хорошо описывающие рассеяние или отклонение получаемых данных. Лаплас и его ученик Симеон-Дени Пуассон (1781-1840) предположили, что ошибки измерений носят чисто случайный характер и могут принимать любые значения, но с разными вероятностями. При этом вероятность возникновения ошибки, т. е. отклонения результата измерения определенной величины от ее математического значения, задаваемого «точным законом», уменьшается с ростом величины отклонения, так что очень большие отклонения маловероятны. Смысл этого утверждения очень прост, так как, даже измеряя длину ступни линейкой, читатель скорее всего ошибется на миллиметр, а не на сантиметр. Обычно значение ошибки не повторяется при последовательных измерениях, даже при использовании одинаковых инструментов и методов. Действительно, замеряя линейкой длину ступни членов своей семьи, читатель будет иногда ошибаться на полмиллиметра, а иногда даже на два. Многое при этом зависит не только от точности линейки, но и от вашей аккуратности при каждом измерении. Ошибки — во многом дело случая, это и связывает величину ошибки с теорией вероятностей.
Рис. 3.2. Нормальное распределение или кривая ошибок. Колоколообразная кривая описывает статистику любых случайных процессов. Более строго математики предпочитают называть такие процессы стохастическими, подразумевая, что все измерения или наблюдения не зависят друг от друга.
Для того чтобы оценить вероятность появления некоторой ошибки, мы должны прежде всего выяснить, сколь часто она проявляется при достаточно большой и репрезентативной серии измерений, т.е. собрать статистические данные о проявлении отклонений данной величины. Французские ученые обнаружили, что значения ошибок всегда распределяются одинаково. При этом незначительные отклонения не только всегда наблюдались чаще, чем очень большие, но и само падение количества определенных отклонений с ростом их величины было вполне предсказуемым. Статистические данные по измерению какой-либо величины х всегда аккуратно ложились на кривую совершенно определенного типа, получившую название кривой ошибок (рис. 3.2). Ввиду широчайшего распространения кривых такого рода, возникающих при описании самых разных процессов, эту функцию, график которой напоминает по форме колокол, называют также нормальным распределением и распределением Гаусса в честь великого немецкого физика и математика Карла Фридриха Гаусса (1777-1855), проанализировавшего ее свойства в 1807 году. Поэтому, когда данные измерений ложатся на эту кривую, физики иногда просто говорят о наличии гауссовской статистики. Все эти названия относятся к одной и той же замечательной кривой, описывающей распределение вероятностей для измерений при любом случайном процессе.
Стоит отметить, что математики, занимавшиеся теорией вероятностей, уже давно знали о нормальном распределении, так как еще в 1733 году Абрахам де Муавр показал, что оно описывает распределение отклонений от среднего при известной игре с бросанием монеты (орел или решка). Считается, что в этой игре шансы выпадения орла и решки одинаковы (разумеется, мы говорим лишь о честной игре), однако каждый знает, что в реальной игре число последовательных выпадений орлов и решек может меняться причудливым образом, а равенство вероятностей проявляется лишь при довольно большом числе подбрасываний.
Нас не должен удивлять факт, что результат большой серии случайных событий является предсказуемым, поскольку он просто отражает равную вероятность отклонений в обе стороны. Выпадение нескольких решек подряд позднее как-то компенсируется последовательным выпадений орлов, а среднее соотношение при большом числе бросков остается 50:50. В начале
XVIII века Якоб Бернулли, дядя упоминавшегося ранее Даниила Бернулли, указывал, что, поскольку результат события строго определен соотношением вероятностей (в нашей задаче 1:1), распределение реальных событий будет подчиняться этому соотношению при достаточно большом числе испытаний. Пуассон обогатил эту идею в 1835 году прекрасным названием «закон больших чисел», наглядно демонстрирующим, что чистая случайность отдельных событий статистически приводит к детерминированному результату при достаточно большом числе таких случайных событий. Оказалось, что случайности сами по себе не мешают событиям протекать предсказуемым образом.
Понятно, что соотношение 50:50 не гарантируется, т. е. наблюдается не всегда. В серии из 10 бросков нас нисколько не удивит выпадение 4 орлов и 6 решек с большим отклонением (20%) от ожидаемого среднего. При сотне бросков мы можем получить 49 орлов и 51 решку с той же разницей в 2 единицы, которые, однако, будут соответствовать уже 2% отклонения от среднего. В следующей серии из 100 бросков могут выпасть 52 орла и 48 решек, и т.д. Де Муавр показал, что при очень большом количестве серий с достаточно большим числом бросков получаемые нами результаты будут всегда прекрасно укладываться на кривую нормального распределение
Естественно, возникло желание описать форму кривой математическим уравнением и получить возможность предсказывать вероятность определенных результатов в серии бросков. Расчет оказался совсем не тривиальной задачей для математиков XVIII века и потребовал очень сложных вычислений, учитывая неразвитую технику того времени. Однако в конце концов Муавр сумел аппроксимировать кривую достаточно простым математическим уравнением, позволяющим производить расчеты с высокой точностью.