Книга Голая статистика. Самая интересная книга о самой скучной науке - Чарльз Уилан
Шрифт:
Интервал:
Закладка:
Крис Кокс, производственный вице-президент Facebook, сказал в интервью The New York Times: «Проблема информационной эпохи заключается в том, как распорядиться информацией»{115}.
Вот так-то.
Что же касается публичной сферы, то слияние данных и технологий порождает еще большие проблемы. Во многих крупных городах мира в общественных местах установлены тысячи камер видеонаблюдения, многие из которых вскоре будут обладать способностью распознавать лица людей. Правоохранительные органы могут отслеживать маршрут движения любого автомобиля, куда бы он ни направлялся (и сохранять соответствующую информацию в архивной памяти), прикрепляя к автомобилю то или иное устройство глобального позиционирования, а затем отслеживая его перемещения с помощью спутника. Является ли это достаточно дешевым и эффективным способом слежения за действиями преступных элементов? А может быть, это не что иное, как использование государством современных технологий для ограничения нашей личной свободы? В 2012 году Верховный суд США единогласно постановил, что это действительно посягательство на нашу свободу, и запретил правоохранительным органам прикреплять устройства слежения на личные транспортные средства без соответствующего ордера[79].
Между тем, многие государства обзавелись огромными базами данных ДНК, которые являются мощным инструментом, позволяющим раскрывать уголовные преступления. Чьи ДНК должны храниться в таких базах данных? Всех осужденных преступников? Каждого, кто подвергался аресту (даже если впоследствии был признан невиновным)? Или всех граждан без исключения?
Мы лишь приступаем к решению проблем, которые находятся на пересечении технологий и персональных данных. Ни одна из них не была настолько актуальна, когда соответствующая информация хранилась на пыльных стеллажах в подвалах серьезных государственных учреждений, а не в цифровых базах данных, в которые в принципе может забраться любой желающий. Статистика в наши дни играет даже более важную роль, чем когда-либо прежде, поскольку сейчас у нас появилось больше возможностей для эффективного использования данных. Однако сами по себе формулы не подскажут нам наилучшие способы их использования. Иными словами, математика не может заменить суждение.
Учитывая вышесказанное, давайте завершим эту книгу, попытавшись найти связь между следующими словами: огонь, ножи, автомобили, крем для удаления волос. Каждая из этих вещей служит важной цели. Каждая делает нашу жизнь лучше. И каждая может создать серьезные проблемы в случае неосторожного с ней обращения.
Теперь вы можете добавить статистику в этот список. Она наверняка поможет вам лучше понять многие явления нашей жизни при условии, что вы будете пользоваться статистическими инструментами разумно и по назначению!
Статистическое программное обеспечение
Подозреваю, что вы не будете выполнять статистический анализ с помощью карандаша, бумаги и карманного калькулятора. Ниже приведен краткий обзор программных пакетов, наиболее широко используемых для решения задач, описанных в этой книге.
Microsoft Excel
Microsoft Excel – пожалуй, самая широко используемая программа для вычисления простых статистических показателей, таких как среднее значение и среднеквадратическое (стандартное) отклонение. Кроме того, с помощью Excel можно выполнять базовый регрессионный анализ. Большинство компьютеров комплектуется пакетом Microsoft Office, поэтому Excel, скорее всего, уже есть на жестком диске вашего ПК. В сравнении с более сложными статистическими программными пакетами Excel довольно дружественна к пользователю. Основные статистические вычисления можно выполнять с помощью строки формул.
Excel не умеет решать ряд более сложных задач, рассчитанных на применение более специализированных программ. Однако вы можете купить расширения Excel (впрочем, некоторые из них можно загрузить бесплатно), которые существенно повышают статистические возможности этой программы. Огромное преимущество Excel – в том, что эта программа обеспечивает простые способы отображения двумерных данных посредством весьма наглядной графики, которая легко импортируется в Microsoft PowerPoint и Microsoft Word.
Stata[80]
Stata – статистический пакет, используемый специалистами-исследователями во всем мире; его интерфейс отличается серьезным, научным видом. Stata обладает широким спектром функций для решения базовых статистических задач, таких как создание таблиц данных и вычисление описательных статистик. Разумеется, университетские профессора и другие ученые отдают предпочтение Stata не только по этой причине. Это программное обеспечение предназначено для проведения сложных статистических испытаний и моделирования данных, которые выходят далеко за рамки задач, описанных в этой книге.
Stata представляет собой идеальный инструмент для тех, кто обладает всесторонним знанием статистики (знание основ программирования также не повредит) и кому не требуется изощренное форматирование – лишь ответы на статистические вопросы. Впрочем, Stata окажется не самым идеальным инструментом, если ваша цель – оперативно строить графики на основе имеющихся данных. Опытные пользователи утверждают, что хоть Stata и умеет это делать, для этой цели удобнее пользоваться Excel.
Разработчики Stata предусмотрели несколько разных самостоятельных пакетов программного обеспечения. Вы можете купить бессрочную или годовую лицензию на этот продукт (в последнем случае через год ПО будет заблокировано на вашем компьютере). Один из самых дешевых вариантов – Stata/IC, предназначенный для «студентов и исследователей, оперирующих наборами данных среднего объема». Предусмотрена скидка для работников сферы образования. Однако даже в таком случае однопользовательская годичная лицензия на Stata/IC обойдется вам в 295 долларов, а за бессрочную лицензию придется уплатить 595 долларов. Если же вы собираетесь запустить спутник на Марс, в связи с чем вам предстоит выполнить по-настоящему серьезные научные вычисления, то у вас есть возможность воспользоваться более «продвинутыми» пакетами Stata, стоимость которых исчисляется в тысячах долларов.
SAS[81]
Ввиду наличия у SAS широкого спектра аналитических способностей, этот статистический пакет привлекателен не только для профессиональных исследователей, но и для бизнес-аналитиков и инженеров. У SAS есть два разных статистических пакета. Первый называется SAS Analytics Pro и может считывать данные практически в любом формате, а также выполнять их сложный анализ. В этом пакете также предусмотрены хорошие инструменты визуализации данных; в частности он обладает расширенными возможностями отображения. Пакет не из дешевых. Даже работникам сферы образования и государственных учреждений покупка одной коммерческой или индивидуальной лицензии на него обойдется в 8500 долларов – плюс плата за годовую лицензию.