Книга Футболоматика - Дэвид Самптер
Шрифт:
Интервал:
Закладка:
Я интересовался математическим моделированием почти так же долго, как и статистикой. Еще одним важным хобби во времена, когда я читал большой оранжевый футбольный альманах, была игра в настольный футбол Subbuteo[3]. Вместе с другом Дэвидом Патерсоном я основал лигу Subbuteo. Мы играли каждый день после школы, успевая сыграть пять или шесть матчей перед ужином. Результат каждой игры мы записывали. Но у нас никогда не было времени на то, чтобы сыграть все 380 игр, составляющих турнир (20 команд, каждая из которых играет 19 домашних игр; 20 × 19 = 380 матчей). В сутках просто не хватало часов для этого.
Ограниченные родителями, которые думали, что мы должны спать и есть, Пэтци и я были вынуждены найти другой способ завершить лигу. Решением стали игральные кубики. Пэтци бросал кубик для одной команды, а я – для другой. После этого мы отнимали по единице от результата и получали итоговый счет. Если «Арсенал» играл с «Манчестер Сити», он бросал красный кубик, а я голубой. Если красный показывал пять, а голубой три, это означало победу «Арсенала» со счетом 4:2. Эта модель может генерировать игры с диапазоном забитых голов от нуля до десяти, в точности как гистограмма Премьер-лиги.
После множества бросков кубиков и небольших корректировок в пользу наших любимых клубов мы получили все результаты. Мы составили таблицу, статистику и аккуратно все это записали на линованной бумаге. Я думаю, мне суждено было стать математиком (Дэвид же теперь успешный бухгалтер).
Бросание костей – очень простой пример математической модели, но с ним есть несколько проблем. Незадолго до Рождества 2012 года «Челси» обыграл «Астон Виллу» со счетом 8:0, чего просто не могло произойти в нашей модели. Еще одной проблемой стало то, что нулевые ничьи в футболе происходят очень часто. Если же брать кубики, то 0:0 встречается столько же раз, как и 5:5. Однако в гистограмме ноль голов в одной игре почти в двадцать раз вероятнее, чем десять. Эта модель не работает. Футбольные игры – не случайный бросок кубиков.
Но матчи в футболе случайны в том или ином отношении. Непредсказуемость делает футбол и другие командные виды спорта интересными. Если во время просмотра матча вы отвлеклись на несколько секунд, вы можете пропустить важную атаку и внезапный гол. Мне, как моделисту, это сообщает кое-что важное. Гол может случиться в любую минуту матча. Несмотря на всевозможные факторы, определяющие количество голов, голевые моменты более или менее случайны.
Мы можем превратить это утверждение в симуляцию. Представим футбольную игру как девяносто одноминутных отрезков, в каждом из которых гол в равной степени возможен. При среднем 2,79 гола за игру вероятность забитого мяча в любом из этих отрезков равна 2,79/90 = 0,031. Это означает, что наш шанс увидеть гол в любую случайно выбранную минуту составляет примерно 1 к 32. Не такой уж и большой, но достаточный для того, чтобы вы продолжали смотреть.
Используя эту модель, мы можем запустить компьютерное моделирование на 90 минут, где в каждой имитируемой минуте гол будет забит с вероятностью 0,031. Если мы проведем симуляцию множества матчей, мы сможем узнать, как выглядит типичный сезон. Такой симулированный сезон показан на рисунке 1.2 как сплошная линия, наложенная на гистограмму реального сезона Премьер-лиги-2012/13.
Модель показала хорошее соответствие с реальностью. Не забывайте всю сложность игры. Тренер, который кричит у кромки поля. Фанаты, пытающиеся подбодрить команду или (чаще всего) доказывающие, насколько она никчемна. Мысли в головах игроков, когда они говорят себе, что вот он, шанс забить. Кажется, будто ни один из этих факторов не влияет на распределение забитых голов. Однако на самом деле все эти факторы вместе и порождают тип случайности, допущенный в модели.
Сплошная линия на рисунке 1.2, созданная моей симуляцией, известна как распределение Пуассона. Такое распределение возникает, когда время предыдущих событий не влияет на будущие события. Это именно то,
Рисунок 1.2. Гистограмма количества голов, забитых в сезоне-2012/13 английской Премьер-лиги (столбцы), в сравнении с распределением Пуассона (сплошная линия).
что я предположил в своей симуляции, и это то, что на самом деле происходит в футболе: ни количество забитых голов, ни количество времени не влияют на вероятность того, что будет забит еще один мяч. Полученное распределение Пуассона отражает общую форму гистограммы количества голов[4]. События делают каждую минуту футбольного матча непредсказуемой, отсюда и появляется такое распределение. Это закономерность, которая возникает из абсолютной случайности.
Я не хотел рассматривать Премьер-лигу, потому что заранее знал о ее соответствии распределению Пуассона. Так получилось, что я все-таки остановился на футболе. Я мог бы выбрать любой вид спорта, в котором голы забивают в любое время. Чтобы убедиться в этом, я просмотрел все результаты игр НХЛ в сезоне-2012/13.
Рисунок 1.3. Гистограмма количества голов, забитых в сезоне-2012/13 НХЛ (столбцы), в сравнении с распределением Пуассона (сплошная линия).
За 60 минут основного времени в среднем были забиты 5,2 шайбы. Рисунок 1.3 показывает гистограмму количества голов в 720 сыгранных играх сезона. Сплошная линия – соответствующее распределение Пуассона.
Более высокое среднее число голов смещает пик в гистограмме вправо, но симуляция снова соответствует данным. Данные и модель практически не отличаются, и небольшое расхождение в матчах с четырьмя забитыми шайбами может объясняться колебаниями от одного сезона к другому[5]. В хоккее голы забиваются чаще, но ровно так же случайно, как и в футболе.
Если вы станете мыслить категориями моделирования случайных процессов и распределения Пуассона, то вы будете видеть их повсюду. Если вы изучаете статистику в университете, лучшая (и единственная) шутка лектора заключается в том, что прибытие автобуса также попадает под распределение Пуассона. Автобусная компания отправляет транспорт по расписанию, но на его путь влияет множество различных факторов: старик слишком долго заходит в автобус или велосипедист занял полосу для движения автобусов. Еще один классический пример – количество ламп накаливания, которое вам приходится менять в доме ежегодно. Каждый раз, когда вы включаете свет, есть маленький шанс того, что элемент перегорит. Суммируйте все подобные случаи, и вы получите распределение Пуассона.