Книга Умный менеджмент - Jochen Reb
Шрифт:
Интервал:
Закладка:
Эвристика множителя: Прогнозирование того, что будущий годовой доход от продаж клиента, продукта или магазина равен доходу, полученному в период наблюдения, умноженному на константу X.
Затем исследователи проверили точность прогнозирования эвристики в пяти мобильных играх. В каждой игре количество покупателей, чьи записи о покупках использовались для теста, было достаточно большим - от 42 183 до 215 653. Были рассмотрены две версии эвристики: оригинальная multiply-by-6, не имеющая свободного параметра, и версия, в которой множитель рассматривается как свободный параметр, настраиваемый для каждой игры. Регулировка множителя не принесла дополнительных преимуществ, поскольку обе версии имели одинаковый уровень точности прогнозирования. Что очень важно, обе версии были настолько же точны, как и три алгоритма машинного обучения: регрессия LASSO (оператор наименьшего абсолютного сокращения и выбора), гребневая регрессия и случайный лес (см. верхнюю часть рис. 12.2 ).
Рисунок 12.2
Эвристика множителя предсказывает доход от покупок в приложениях так же хорошо, как и сложные алгоритмы машинного обучения, используя множитель 6, предоставленный менеджерами (верхняя панель). Для различных задач прогнозирования выручки тот же множитель работает хуже, но другой множитель может быть оценен по данным (multiply-by-X), что приводит к лучшей производительности, чем у алгоритмов машинного обучения, которые также оценивают свои параметры (нижняя панель). RMSE - среднеквадратичная ошибка. Столбики ошибок показывают стандартные ошибки. Эти столбики намного больше, когда производительность усредняется по пятнадцати различным задачам (нижняя панель), чем когда она усредняется по пяти экземплярам одной и той же задачи покупки в приложении (верхняя панель). По материалам Artinger, Kozodi и Runge (2020).
Чтобы проверить, насколько общими являются полученные результаты, исследователи применили эвристику мультипликатора для прогнозирования доходов, не связанных с покупками в приложениях в мобильных играх. К ним относились годовые доходы, получаемые отдельными покупателями, совершающими покупки в магазине, определенными продуктами, производимыми компанией (например, газированными напитками компании, производящей безалкогольные напитки), и отдельными магазинами розничной сети (например, Walmart). В общей сложности они собрали пятнадцать наборов данных по таким задачам, и количество точек данных в каждом из них варьировалось от 13 до 33 520. Версия эвристики "умножение на 6", разработанная менеджерами для конкретной задачи - прогнозирования доходов от покупок в мобильных играх - больше не работала в новых задачах, поскольку изменились и цель прогнозирования, и область. Однако, когда единственный параметр эвристики - множитель - оценивался по данным для каждой новой задачи, скорректированная версия эвристики работала очень хорошо: Multiply-by-X имел меньшую ошибку предсказания, чем три алгоритма машинного обучения (см. нижнюю часть рис. 12.2). Это показывает, как эвристики можно адаптировать к новым задачам.
Психологический ИИ
Эвристика умножения и эвристика хиатуса - это примеры психологического ИИ. 10 Психологический ИИ соответствует первоначальному видению ИИ Гербертом Саймоном, Алленом Ньюэллом и другими: анализ того, как эксперты принимают решения, и программирование экспертных эвристик в программное обеспечение, чтобы сделать компьютеры умными. Этот подход в корне отличается от большинства подходов машинного обучения, которые полагаются на статистические алгоритмы и игнорируют то, как человеческий мозг решает проблемы в больших мирах. Например, маленький ребенок может распознать кошку, увидев всего одну или несколько; глубокая искусственная нейронная сеть не имеет такого понятия о кошке, и ее нужно обучать на тысячах картинок, чтобы сравняться с детьми.
Генеративный ИИ, такой как ChatGPT, - еще один тип глубоких нейронных сетей. Его особенность и популярность заключается в том, что с ним может напрямую взаимодействовать широкая публика. ChatGPT демонстрирует потрясающие результаты в создании ответов на вопросы. Пользователи склонны полагать, что ChatGPT "понимает" их вопросы; однако не является тем, как работает генеративный ИИ. Как видно из названия, генеративный ИИ выдает наиболее вероятное слово, учитывая предыдущие слова, подобно тому, как вы набираете текст на смартфоне, а алгоритм рекомендаций делает предложения. То, как он генерирует язык, в корне отличается от того, как это делают люди. Большие языковые модели, такие как ChatGPT, работают на основе вероятности, а не на основе правдивости. Чем больше у нее данных по теме, тем больше вероятность того, что она даст правильный ответ. Мы называем предложения, в которых он ошибается, "галлюцинациями", но генеративный ИИ не галлюцинирует; это просто статистическая машина предсказаний. И именно поэтому ему требуется много энергии. Энергопотребление GPT-3, первоначальной версии ChatGPT, составило более 1200 мегаватт-часов (этого достаточно, чтобы снабжать среднюю американскую семью в течение 120 лет), просто для обучения, не считая его использования. 11 В отличие от этого, человеческий мозг работает на 20 ватт, меньше, чем средняя лампочка.
Человеческий мозг эволюционировал, чтобы работать с небольшим количеством данных, ограниченной энергией и высокой неопределенностью. ИИ может использовать эту развитую мудрость.
Подбор лучших сотрудников
Наем хороших сотрудников имеет решающее значение для развития организации, однако спрогнозировать, какие кандидаты будут хорошо выполнять свои обязанности, довольно сложно. Соответствие навыков и личностных качеств кандидатов их рабочей команде, значимые события в их жизни, происходящие с ними во время работы, и неожиданные события, такие как смена руководства, - все это может повлиять на эффективность работы, в результате чего, казалось бы, хороший сотрудник в момент приема на работу может стать плохим спустя некоторое время. Наем персонала - это большая мировая проблема, полная неопределенности.
Как мы видели в главе 4, эвристика дельта-инференции может помочь менеджерам решить, кого из двух претендентов на работу нанять. Менеджеры, использующие эту эвристику, последовательно проверяют сигналы и выбирают кандидата, который лучше на пороговое значение дельты по первому сигналу; в противном случае они переходят ко второму сигналу, и так далее. Дельта-индукция, как и предыдущие эвристики, направлена на описание того, как люди принимают решения, и поэтому является еще одним примером психологического ИИ. Может ли она принимать более правильные решения о том, кого нанимать на работу, чем сложные алгоритмы машинного обучения? Мы проверили точность выбора дельта-индукции и обычной логистической регрессии в реальной задаче, которая включала более 50 000 парных сравнений, сформированных путем сопоставления 236 кандидатов на работу (см. рисунок 4.4). Затем мы рассмотрели производительность трех алгоритмов машинного обучения: регрессии LASSO, случайного леса и машины опорных векторов (SVM). 12 Как показано на рисунке 12.3 , дельта-вывод чаще выбирал лучшего соискателя, чем все остальные алгоритмы, независимо от того, были ли возможности для обучения скудными, умеренными или широкими. 13