Книга Страсти по революции. Нравы в российской историографии в век информации - Борис Миронов
Шрифт:
Интервал:
Закладка:
А.О. кажется нелогичным и методологически противоречивым «привязывание» данных о росте к году рождения, а не к году измерения или времени физического созревания (А.О., с. 120–121). Данные о росте привязываются к году рождения для удобства анализа, причем не по моей инициативе — так принято в антропометрии. Конечный рост, достигаемый человеком в момент наступления полной физической зрелости, отражает условия жизни за весь период от рождения до момента измерения, а не в первый год жизни. Здесь нет никакого противоречия между теорией и практикой.
А.О. приписывает мне ошибочный, находящийся в противоречии с исходными теоретическими посылками подход в анализе ростовых данных, согласно которому конечный рост якобы отражает условия жизни только на первом году жизни: «Соглашаясь с тем, что первый год для развития человека имеет большее значение, чем двадцатый, невольно задаешься вопросом, а для чего нужны были все рассуждения о том, что рост — это чистый остаток потребленной энергии за все время физического созревания. Более того, при новом подходе рост перестает играть объявленную роль “универсального показателя” благосостояния человека» (А.О., с. 121).
Рецензент не понял методики анализа ростовых данных и не разобрался, о чем идет речь в тексте книги. Я говорю: изменение роста (т.е. разница, а не сама величина роста!) у когорты, рожденной в 1985 г. и измеренной в 2005 г., сравнительно с когортой, рожденной в 1984 г. и измеренной в 2004 г., объясняется условиями жизни только в двух годах — в 1984 и 2005 гг. Действительно, период жизни первой когорты — 1984–2004 гг., а второй когорты — 1985–2005 гг. Два периода различаются только двумя годами, 1984 и 2005 гг.; а восемнадцать лет жизни у них приходятся на одни и те же годы, — 1985–2004. Вследствие этого разница в среднем росте двух когорт объясняется условиями жизни только в двух годах, 1984 и 2005 гг. Из них роль первого года жизни существенно выше, чем двадцатого. Таким образом, в данном случае речь идет о том, какие годы объясняют изменение в росте двух смежных когорт, а не о том, какие годы влияют на средний конечный рост когорт. Изменение в средней длине тела у двух смежных когорт объясняется в основном первым годом жизни, а сама величина конечного роста — всеми годами жизни от рождения до момента измерения.
Новобранцы — самые высокие мужчины? По мнению А.О., поскольку существовал ростовой ценз, то «данные о рекрутах и новобранцах могут характеризовать средний рост не всего “мужского населения”, как утверждает автор, и даже не всего взрослого мужского населения, а только самых высоких мужчин» (А.О., с. 120).
Во-первых, ростовой ценз был не столь большим, как представляется оппоненту, особенно во второй половине XIX — начале XX в.: в 1730–1844 гг. — 160 см, в 1845–1853 гг. — 157,8 см, в 1854–1873 гг. -155,6 см и в 1874–1914 гг. — 153,4 см. В 1918 г. ценз вообще отменили. Поэтому новобранцы отражали рост не самых высоких, а мужчин роста немного выше среднего.
Во-вторых, для XIX — начала XX в. индивидуальные данные на 54,9% относились к рабочим, измеренным без всякого ростового ценза.
В-третьих — и это самое главное — в антропометрии разработана методика устранения влияния ростового ценза, подробно изложенная в параграфе «Цензурированная, или усеченная выборка». Эта методика позволила не только устранить влияние ростового ценза, но и унифицировать (стандартизировать) состав выборок за разные годы и выявить динамику роста максимально корректно. В книге средний рост приводится в двух вариантах — для новобранцев и всех мужчин, соответствующих определенному стандарту (в книге он называется, как принято в антропометрии, истинным, или ростом референтной группы). «Сырые» и скорректированные данные дают хорошо согласованную картину изменения среднего роста населения за 220 лет — свидетельство того, что обнаруженная динамика биостатуса объективно существовала.
Почему снижался ростовой ценз? Троекратное понижение ростового ценза с 1844 по 1874 г. вызывает у А.О. подозрение: сделать это «правительство заставил снизившийся в эти годы рост рекрутов» (А.О., с. 121).
В действительности понижение ростового ценза в XIX — начале XX в. — общеевропейское явление. Во Франции ростовой ценз с 1831 по 1872 г. понизился с 156 до 154 см, а в начале XX в. был отменен. В Германии во второй половине XVIII в. ростовой ценз составлял 170 см, в начале XIX в. понизился до 164, ас 1875 г. до 156 см. Причина понижения ценза состояла в стремлении увеличить контингент потенциальных новобранцев и выровнять бремя воинской повинности для населения, так как повышение ценза равносильно предоставлению низкорослым льготы по отбыванию повинности. В России дополнительной причиной служило стремление правительства привлечь в армию нерусские народности, в массе уступавшие в росте русским.
Можно ли полагаться на выборочные данные? А.О. ставит под сомнение выводы, полученные при обработке антропометрических данных: «Если картина изменений, относящихся к 1853–1892 гг., может быть близкой к действительности, то применительно к 1701–1850 и 1896–1915 гг. она во многом является гипотетической (в первом случае выборка составляет около 2%, во втором — не более 0,2%» (А.О., с. 120).
На самом деле средний рост в выборке зависит не от процента выборочных данных в генеральной совокупности, а от абсолютного числа данных и степени изменчивости роста у новобранцев, попавших в нашу выборку. Если бы все мужчины призывного возраста имели одинаковый рост, то для получения истинного среднего роста всех мужчин достаточно иметь сведения об одном рекруте, независимо от их численности. В современной России социологи предсказывают итоги выборов, основываясь на опросе 1600–2000 человек — менее 0,002% от числа избирателей. В зависимости от числа данных выборка дает большую или меньшую погрешность, называемую в статистике стандартной ошибкой средней. Ее величина приведена во всех таблицах с важными данными. Например, в табл. V. 1, на которую ссыпается А.О., средний рост мужчин в возрасте 23 лет и старше, вычисленный по сведениям о 307 рекрутах, равнялся 164,8 см, а стандартная ошибка средней при доверительной вероятности 95% (или 0,95) — 0,69 см. Это означает: действительный средний рост всего мужского населения, т.е. в генеральной совокупности, находился в доверительном интервале от 164,11 см (164,8–0,69) до 165,49 см (164,8 + 0,69) при вероятности в 95%. Вероятность 95% означает: из 100 выборок по 307 человек в 95 случаях средний рост мужчин будет обязательно находиться в указанном интервале 164,11–165,49 см.
Таким образом, все выборки дают погрешность, но их величину мы всегда точно знаем. Доверительный интервал может рассчитываться с разной доверительной вероятностью: чем выше вероятность, тем больше доверительный интервал, и наоборот. Если мы имеем две выборки, относящиеся к одному пятилетию, то средние, вычисленные по данным первой и второй выборок, будут различаться, но различие, как правило, будет находиться в рамках доверительного интервала. Например, когда я сравнил средний рост по сведениям индивидуальных данных (первая выборка) со средним ростом по суммарным данным (вторая выборка) за одни и те же пятилетия — 1851–1855 гг., 1856–1860 гг. и т.д., то между ними, естественно, обнаружились расхождения, но не «принципиальные», как полагает А.О., а в рамках доверительных интервалов. Наличие расхождения между средними двух выборок свидетельствует не о том, что средние по индивидуальным данным не репрезентативны, как думает А.О., а о том, что они дают погрешность, поскольку вычислены по выборочным данным. Все это объяснено в тексте. Иной оценки точности статистических данных наука предложить не может. Между прочим, все события в жизни человека имеют вероятностную природу, и мы всегда действуем, не будучи на 100% уверенными в успехе дела. Жизнь остановится, если будем бояться ошибок и ждать момента, когда вероятность счастливого окончания задуманного дела достигнет 100%. Согласно известной поговорке, «ни в чем нельзя быть уверенным, кроме смерти и налогов».