Книга О чем говорят цифры. Как понимать и использовать данные - Ким Хо
Шрифт:
Интервал:
Закладка:
Довольно часто аналитики находят в отчетах о ранее проводившихся исследованиях нечто такое, что заставляет их пересмотреть собственный вариант определения проблемы. Не исключено, что после этого придется пересмотреть отчеты о более ранних исследованиях.
Обычно на этом этапе аналитик задает себе вопрос: «Похож ли мой проект на те, которые выполнялись раньше?» Если да, то из отчетов можно почерпнуть идеи для собственного анализа. Обзор предшествующих исследований помогает уточнить ряд вопросов:
• В чем особенности нашего исследовательского проекта? Включает ли он опрос, предсказание, эксперимент, отчет?
• Какие данные нам необходимо собрать?
• Какие параметры изучали в предшествующих исследованиях?
• Какие виды анализа нам придется провести?
• Будут ли результаты нашего анализа отличаться от полученных ранее и как представить их в интересной форме?
Одна из ключевых особенностей количественного анализа (и вообще научного метода исследований) – это учет результатов более ранних исследований. Например, поиск относящейся к теме информации в книгах, отчетах и статьях очень важен для всестороннего понимания проблемы. Это помогает установить ключевые параметры и связи между ними.
Комплексный обзор результатов любых предыдущих исследований той же тематики обязателен для любого вида количественного анализа. В аналитике невозможно получить нечто из ничего. Приступать к решению проблемы можно только ознакомившись с опытом тех, кто делал это до вас. Помните простую вещь: любая проблема не настолько уникальна, как вам кажется, и не исключено, что многие уже сделали то, что вы только собираетесь делать. Не стоит заново изобретать колесо, достаточно выяснить, кто сделал это до вас. В наше время при помощи поисковика вроде Google нетрудно получить большую часть материалов по теме. Одна только систематизация и оценка имеющейся информации играет важную роль в уточнении модели анализа или подходов к решению проблемы.
2. Изучение предыдущих поисков решения
Пример успешного обзора результатов более ранних исследований можно найти в истории Второй мировой войны. Адольф Гитлер приказал начать производство новой мощной управляемой ракеты ФАУ-2, и с ее помощью в 1944 году люфтваффе терроризировало жителей Лондона. В течение нескольких следующих месяцев 1358 из 3172 запущенных по целям в Англии ФАУ-2 упали на Лондон, в результате чего погибли 7250 человек – военных и гражданского населения.
Во время обстрела Лондона многие наблюдатели отмечали, что большая часть ракет падала в определенных районах города. Британцы хотели выяснить, является ли падение ракет случайным или управляемым. Если поражение целей возможно только случайно, то размещения бомбоубежищ и укрытий в окрестностях города будет вполне достаточно для обеспечения безопасности населения Лондона. Если же ракеты управляемые, то опасность намного больше и равномерно распределенные убежища особой пользы не принесут. Британское правительство пригласило известного статистика Р. Д. Кларка для решения этой задачи. Кларк провел простой статистический тест, основанный на информации о предыдущих попаданиях ракет. В частности, он понимал, что для этого анализа можно применить так называемое распределение Пуассона, которое показывает вероятность совершения ряда событий в фиксированный период времени, в определенном регионе или объеме, если эти события происходят с известной частотой. Если ракеты падают случайным образом, то количество ракет, попадающих в каждый квадрат местности, будет соответствовать распределению Пуассона. Например, если на каждый квадрат приходится в среднем по одной ракете, то с помощью формулы Пуассона можно подсчитать вероятность попадания в один квадрат одной, двух, трех, четырех и более ракет или непопадания ракет в один квадрат вообще.
Чтобы рассчитать количество ракет, которые могут попасть в определенный квадрат местности, Кларк разделил Южный Лондон на 576 квадратов площадью в четверть квадратного километра каждый и подсчитал количество квадратов, в которые попадали 0, 1, 2, 3, 4 и более ракет.
Если обстрел производился наугад, тогда количество квадратов с определенным количеством попаданий ракет подчинялось бы распределению Пуассона. Совпадение реального количества попаданий с рассчитанными по распределению Пуассона оказалось очень тесным, что опровергло предположение об управляемом обстреле определенных целей (см. сайт авторов этой книги). Выводы Кларка принесли британцам большое облегчение. К счастью, в 1945 году Германия капитулировала, так и не успев доработать управляемые ракеты ФАУ-2. (В скобках заметим: несмотря на то что их нельзя было точно наводить на цель, именно ФАУ-2 стали технической основой развития космической программы США.)
Вы можете последовать примеру Кларка, то есть вернуться назад и пересмотреть содержание этапа формулирования проблемы после изучения предыдущих попыток ее решить (см. вставку «Некоторые методы изучения предыдущих исследований»).
Некоторые методы изучения предыдущих исследований
• Интернет-поиск по ключевым терминам, используемым в анализе.
• Поиск в учебниках по статистике примеров анализа, сходного с предполагаемым.
• Собеседование с вашими аналитиками на предмет того, не приходилось ли им делать что-либо подобное.
• Анализ системы управления знаниями в вашей компании, если таковая имеется.
• Обсуждение проблемы с аналитиками из других (не конкурирующих с вами) компаний.
• Посещение конференций по аналитике (или хотя бы просмотр программ подходящих по тематике конференций в интернете) и выступлений по смежной тематике.
Возможно, вам придется изменить аналитический проект, масштаб анализа, варианты решений, а может быть, даже пересмотреть состав заинтересованных. Если вы это сделали или, наоборот, остались при первоначальном мнении по всем этим вопросам, то можно считать, что формулирование проблемы завершено, и переходить к ее решению методами количественного анализа.
Хотя мы обрисовали аналитический процесс решения проблемы как линейную последовательность из шести шагов, объединенных в три этапа, но так или иначе этот процесс должен быть итеративным, предполагающим в случае необходимости возврат к предыдущим шагам и повторение их. Каждый следующий шаг способен выявить новые грани исходной проблемы, и всегда полезно задуматься над тем, как новая информация может изменить принятые на ранних этапах решения. Конечно, нельзя без конца пересматривать уже принятые решения, но полезно иногда задумываться над тем, как изучение предыдущих попыток решения способно повлиять на формулировку проблемы.
Этапы формулирования проблемы