Книга Миры, которые я вижу. Любопытство, исследования и открытия на заре ИИ - Fei-Fei Li
Шрифт:
Интервал:
Закладка:
"Из-за этого ежегодно без нужды умирают сто тысяч человек".
"Хммм..." Я сделал паузу, пытаясь осмыслить все это. "Похоже, общим знаменателем является внимание. Осознанность".
"Именно так. Информированность - вот что главное. Это самый ценный ресурс во всем здравоохранении. И это единственное, что мы не можем масштабировать".
Я словно перенесся в кафе "Красная дверь", где вместе с Пьетро и Кристофом размышлял над опытом видения. Я думал о показаниях ЭЭГ Торпа, фотографических экспериментах Бидермана и попытках Канвишера составить карту анатомии коры головного мозга. Но больше всего я размышлял о Трейсман и наблюдении, лежащем в основе ее работ: чем хаотичнее сцена, тем больше времени требуется, чтобы понять ее смысл. Это была отрезвляющая мысль в мире перегруженных работой врачей, проносящихся мимо станций для мытья рук, и медсестер, слишком отвлеченных, чтобы заметить хрупких пациентов, находящихся на грани падения. Большая часть моих исследований была посвящена природе восприятия. Откуда оно берется. Что оно делает. На что оно способно. И только встретив Арни, я начал понимать, чего он стоит.
"Простите, - сказал я, взяв паузу. "Я просто немного ошеломлен этими цифрами".
Через несколько недель после демонстрации я встретился с Арни в его офисе, чтобы продолжить нашу беседу. Мы пролистывали книгу "Ошибка - дело рук человеческих" (To Err Is Human), тревожный, но всеобъемлющий обзор медицинских ошибок в больничной среде. На момент ее публикации в 2000 году авторы пришли к выводу, что нарушения протокола и невнимательность ежегодно уносят больше жизней, чем такие известные причины, как автомобильные аварии, рак груди и СПИД.
"Да. Многое не укладывается в голове".
Однако это было необходимое упражнение. Наши разговоры не прекращались с тех пор, как мы покинули демонстрационный зал реанимации, и наше волнение росло по мере того, как мы принимали решение о проведении небольшого исследовательского проекта. Это была наша первая встреча для его планирования.
"Начнем вот с этого, - сказал Арни, поставив указательный палец на отрывок в самом низу страницы:
По данным CDC, даже сегодня "мытье рук является самым важным средством предотвращения распространения инфекции". Тем не менее, неоднократные исследования показывают, что после более чем 150-летнего опыта отсутствие или неправильное мытье рук по-прежнему вносит значительный вклад в передачу заболеваний в медицинских учреждениях.
Это может показаться прозаичным, но мытье рук остается серьезной проблемой в сфере здравоохранения. По данным Центров по контролю и профилактике заболеваний, считается, что медработники должны мыть руки сто раз в день во время обхода, при каждом переходе от одного пациента к другому. Учитывая частоту и природу человеческого фактора, случайные ошибки были бы неизбежны при самых благоприятных обстоятельствах. Но когда смена затягивается, а стресс и усталость становятся все сильнее, риск значительно возрастает. В конечном итоге какой-то процент таких ошибок приводит к инфекциям - "внутрибольничным инфекциям", как их официально называют, - и к непостижимому количеству человеческих страданий.
Какой бы пугающей ни была эта тема, она стала удобным местом для начала нашей работы. Сосредоточив внимание на поведении сиделок, а не пациентов, мы могли избежать некоторых сложных моментов в медицинских исследованиях, когда речь идет о людях, проходящих лечение. К тому же, по словам Арни, администраторы Стэнфордской больницы уже давно занимались этим вопросом. Желание найти новое решение уже было.
Я быстро понял, что Арни из тех, кто добивается своего. Уже через час или два после нашего разговора он присылал мне смс с новостями, которые можно было расценить как самостоятельные достижения: звонки в службу поддержки, встречи с лицами, принимающими решения, и обеспечение доступа в больницу. Я полюбила подобное планирование в своей работе, гордясь тем, что мне пришлось приложить немало усилий, чтобы заложить основу для нового эксперимента. Но это был его мир, а не мой, и я была потрясена тем, как много всего происходило, когда он щелкал пальцами.
Сам того не зная, Арни стал тем, кого оставили Пьетро и Кристоф , - наставником, стирающим границы между дисциплинами в надежде решить проблемы. Мой вклад должен был начаться довольно скоро, по мере того как технологическая сторона нашего проекта будет собираться воедино, и я с нетерпением ждал этого. Однако на данный момент я был доволен тем, что следую примеру ветерана. Было приятно снова стать студентом.
Но даже когда Арни творил свое волшебство, масштабы задачи начали осознаваться. Наша первоначальная цель - автоматизированная техника, обеспечивающая последовательное и тщательное мытье рук в больничных помещениях, - требовала гораздо большего, чем методы классификации изображений, ставшие символом нашей области, или даже работа по созданию подписей к изображениям, которую я проделал вместе с Андреем. Наше решение должно было распознавать особые виды движений - не просто присутствие чего-либо, а то, как оно движется, и что эти движения означают, причем с точностью, достаточной для того, чтобы пройти клинический контроль.
Возникло множество острых вопросов. Например, что подразумевает классификация "правильного" мытья рук? Это, конечно, нечто большее, чем определение местонахождения врача вблизи станции для мытья рук. По-видимому, для достижения этой цели требуется алгоритм, способный распознать каждый шаг процесса: подойти к раковине, включить кран, выдать мыло, потереть под ним две руки и поддерживать это действие в течение достаточного времени. Во всех смыслах это была самая сложная перцептивная задача, с которой я когда-либо сталкивался.
К счастью, это не было прецедентом, и моя лаборатория уже занималась многими из базовых возможностей, необходимых для такой системы. Андрей, например, работал над исследовательским проектом в сотрудничестве с Google по идентификации сценариев, показанных на спортивных кадрах - например, бэттер делает замах в бейсболе или баскетболист идет в дриблинг - задача классификации в значительной степени зависит от распознавания движений и действий. Другой мой студент, Хуан Карлос Ниблес, написал всю свою докторскую диссертацию о распознавании человеческих действий на видео. Сейчас он работает профессором в Университете Норте (Universidad del Norte) в своей родной Колумбии, где он и его студенты недавно создали набор данных под названием "ActivityNet" - "ImageNet of activities", как следует из названия - в котором собраны десятки тысяч коротких видеоклипов, каждый из которых аннотирован физическими движениями, которые они изображают: ходьба, бег, танцы, игра на музыкальном инструменте и тому подобное. Другими словами, хотя анализ видео с той точностью, которую мы себе представляли, не был полностью решенной проблемой, он также не выходил за рамки возможного: это была "сладкая точка" для исследований.
Я разослал аспирантам кафедры свое обычное письмо с объявлением о новой партии вакансий ассистентов.