Книга О чем говорят цифры. Как понимать и использовать данные - Ким Хо
Шрифт:
Интервал:
Закладка:
1. Мое понимание бизнес-проблемы.
2. Как я собираюсь оценивать ее влияние на бизнес.
3. Какие данные можно собрать.
4. Первоначальная гипотеза относительно решения.
5. Решение.
6. Влияние решения на бизнес.
Используя эту методологию, специалисты по базам данных могут создавать вики-сайты[50], где отражаются результаты всех шагов и этапов. Те, кому необходимы их результаты, имеют возможность просматривать вики-сайт и комментировать действия специалистов. Румелиотис говорит, что даже притом что это сайт для ознакомления сотрудников с результатами исследований, все равно он побуждает аналитиков и пользователей обмениваться информацией напрямую.
Аналитики хорошо знакомы со статистической терминологией (описание статистических методов, определение коэффициентов регрессии, расчет значения R2 и т. п.) и зачастую полагают, что их слушатели разбираются во всем этом не хуже. Однако это большая ошибка. Большинство не поймет, о чем идет речь в насыщенном специальной терминологией докладе или презентации. Как сказал один из аналитиков компании IHG, «никому не интересны ваши R-квадраты».
Часто аналитики стараются изложить результаты в виде последовательности процедур и операций, которые они проделали для их получения: «Сначала мы исключили выбросы из массива данных, затем сделали логарифмическое преобразование. Выявился высокий уровень автокорреляции, поэтому мы ввели переменную с лагом в один год», – вы уже представили себе, как это выглядит? Повторим еще раз: аудиторию, как правило, не интересует, как вы получили те или иные результаты, поскольку им важны только сами результаты. Полезно привести подобную информацию в приложении к докладу или презентации, но не стоит включать ее в ваш рассказ. Лучше начните непосредственно с того, что хотят знать ваши слушатели.
То, как именно вы оформите и преподнесете результаты количественного анализа, может и убедить слушателей, и полностью подорвать доверие к вашим словам. Это давно известный факт. Рассмотрим несколько примеров, иллюстрирующих обе ситуации.
Флоренс Найтингейл широко известна как родоначальница профессии медсестры и реформатор в области санитарии и методов ухода за ранеными в госпиталях. Однако помимо этого она еще известна тем, что одна из первых применила количественные методы. Когда в октябре 1854 года, в период Крымской войны, ее и еще 38 медсестер направили в Британский военный госпиталь в Турции, она ужаснулась сложившейся там ситуацией с лечением раненых. Большинство случаев летального исхода в госпиталях было вызвано эпидемиями, эндемическими заболеваниями и инфекционными болезнями, а вовсе не ранами, полученными в бою. В феврале 1855 года смертность в госпитале составила 43 процента. Найтингейл считала, что ситуацию нужно срочно исправлять и что для этой цели может пригодиться статистика. Она организовала сбор и обработку данных, ведение подробных ежедневных записей о назначениях врачей, характере ранений, заболеваемости, лечении и причинах смертей.
Однако самым крупным нововведением Найтингейл стали методы оформления результатов. С раннего возраста она интересовалась цифрами и любила таблицы. Она прекрасно понимала важность подкрепленных цифрами аргументов, но при этом отдавала себе отчет в том, что далеко не все разделяют ее увлечение таблицами (особенно если учесть, что в то время они не были столь популярны, как теперь!). Обычный человек, скорее всего, просто не будет читать отчет, перегруженный таблицами, а значит, ее аргументы окажутся бесполезными. Поскольку она хотела во что бы то ни стало донести до читателей свои статистические выкладки, то разработала линейку диаграмм, наглядно показывающих, как антисанитарные условия становятся причиной неоправданных смертей в госпитале. Они лучше всяких таблиц свидетельствовали о необходимости реформ (рис. 4.1).
Рис. 4.1. Диаграммы «Причины смертности раненых в Восточной армии» Флоренс Найтингейл
Светло-серые, темно-серые и черные секторы имеют общую вершину, находящуюся в центре диаграммы.
Светло-серые секторы, площадь которых рассчитывается от вершины в центре диаграммы, представляют собой уровень смертности от болезней, поддающихся профилактике, или инфекционных болезней, течение которых можно облегчить;
темно-серые секторы характеризуют уровень смертности от ранений, а черные – от прочих причин.
Черная линия, пересекающая темно-серый сектор в ноябре 1854 г., обозначает границу смертности от прочих причин в течение месяца.
В октябре 1854 г. и апреле 1855 г. черный сектор совпадает с темно-серым, в январе и феврале 1856 г. светло-серый сектор совпадает с черным.
Площадь секторов можно сравнить, наложив их друг на друга по ограничивающим серым линиям.
Сейчас это считается само собой разумеющимся, но во времена Флоренс это был относительно новый способ демонстрации данных. Ее диаграммы были разновидностью круговых диаграмм, состоявших из нескольких радиальных секторов. Найтингейл сделала их цветными, чтобы наглядно показать динамику смертности от тех или иных причин по месяцам. Эти показатели, равно как и диаграммы, оказались весьма убедительными.
Найтингейл периодически докладывала в Лондон о результатах своих изысканий и неуклонно настаивала на проведении реформ. Она широко использовала свои новаторские диаграммы, чтобы проиллюстрировать членам парламента реальное состояние службы медицинской помощи в Крыму; последние вряд ли прочли и поняли бы длинные доклады, изобилующие цифровой информацией. Людей шокировали сведения о том, что в госпиталях раненых не столько лечили, сколько доводили до смерти. В итоге уровень смертности начал постепенно снижаться, о чем говорят систематически собиравшиеся Найтингейл данные. После завершения Крымской войны она вернулась в Англию в июне 1856 года и оказалась в центре внимания – публика считала ее героиней.
Найтингейл первой из женщин стала членом Королевского статистического общества в 1859 году и почетным членом Американской ассоциации статистиков в 1874-м. Знаменитый статистик и основатель первой в мире кафедры статистики Карл Пирсон назвал Найтингейл «предвестницей» будущего развития прикладной статистики[51].