Книга Миры, которые я вижу. Любопытство, исследования и открытия на заре ИИ - Fei-Fei Li
Шрифт:
Интервал:
Закладка:
Пожалуй, самые нелепые результаты были получены исследователем зрения по имени Ирвинг Бидерман. Он и его коллеги провели эксперимент, в котором испытуемым показывали не абстрактные формы и цвета, а быстрые отрывки фотографий, а затем просили определить, что они видят. Несмотря на значительное увеличение сложности стимулов и исчезающе малую продолжительность их экспозиции, ответы испытуемых были неизменно точными. За меньшее время, чем потребовалось испытуемым Трейсмана, чтобы, скажем, распознать одинокую букву A среди поля разноцветных букв B, испытуемые Бидермана каким-то образом смогли воспринять достаточно деталей фотографии, чтобы определить, изображена ли на ней парковка торгового центра или домашняя кухня.
Следующее новшество появилось благодаря психологу Молли Поттер. Используя ранний компьютерный монитор, она представляла испытуемым отрывки текста, высвечивая по одному слову крупным шрифтом в центре экрана. Их понимание было впечатляюще высоким, даже когда слова появлялись со скоростью двенадцать в секунду - в два раза быстрее, чем средний студент колледжа читает в обычных условиях. Как ни убедительны были демонстрации Трейсмана о том, что зрительное восприятие развивается с уровня мелких деталей, чтение оказалось мощным исключением.
Эти исследования были еще более впечатляющими в свете сравнительно примитивных инструментов, с помощью которых они проводились. Не имея возможности непосредственно наблюдать за процессом познания своих подопечных, такие мыслители, как Трейсман, Бидерман и Поттер, извлекли десятилетия увлекательных подсказок благодаря умелому использованию поведенческих наблюдений в строго контролируемых условиях. Но у этого подхода были свои пределы: в конце концов, о мозге можно многое узнать только извне. Чтобы понять эти явления изнутри, требовалось новое поколение технологий.
Эта технология наконец-то появилась в виде нейронаучных инструментов, таких как ЭЭГ и функциональная магнитно-резонансная томография, или фМРТ, , вооружив исследователей более высокой степенью клинической точности, чем когда-либо прежде. Работа Торпа была одной из самых заметных, но далеко не единственной. Не менее важной была работа когнитивного нейробиолога Нэнси Канвишер из Массачусетского технологического института и ее студентов, которые с помощью фМРТ-анализа выявили ряд областей мозга, связанных именно с тем видом обработки информации, который необходим для быстрого и точного восприятия, обнаруженного такими исследователями, как Торп и Бидерман. В то время как ЭЭГ измеряет электрические импульсы в мозге, которые распространяются очень быстро, но диффузно по всей его поверхности, фМРТ измеряет изменения уровня кислорода в крови, когда задействованы определенные участки нейронов.
Первым прорывом стало открытие "фузиформной лицевой области" - участка коры в височной доле размером не более кубического сантиметра, который, похоже, специально создан для распознавания человеческих лиц. Затем была обнаружена близлежащая "парагиппокампальная зона места", которая играет аналогичную роль при распознавании знакомых мест, например, кухни или часто посещаемой дороги. Еще одним открытием стала "экстрастриатная зона тела", которая помогает нам воспринимать физическую ориентацию окружающих, реагируя на присутствие рук, ног и тому подобного.
В этих структурах, известных как "нейронные корреляты" зрения, есть нечто особенное: похоже, они специально созданы. Каждая из них распознает одну категорию вещей и только ее - лица, знакомые места, позы тела и тому подобное, что объясняет поразительную скорость нашего восприятия в специфических задачах распознавания. Вместо того чтобы пытаться расшифровать их с нуля, деталь за деталью, специальная особенность нашей нейронной анатомии вступает в действие, чтобы распознать их почти мгновенно. С нашей точки зрения, это происходит без особых усилий.
С биологической точки зрения роль усилий в процессе говорит о многом. Эволюция до фанатизма скуповата и реагирует только на давление окружающей среды, настолько сильное, что альтернативой адаптации является вымирание. Чтобы способность была доведена до такой степени, чтобы сделать нечто сложное автоматическим, она должна иметь фундаментальное, даже исключительное значение.
Таким образом, зрение - это не только вопрос деталей того, что мы видим. Хотя изображения можно разложить на части и изучить в гранулярных терминах, предложенных исследователями вроде Трейсмана, особенно в жестко контролируемых лабораторных условиях, зрение, на которое мы полагаемся, чтобы выжить в хаотичном мире, имеет дело с вещами - предметами, людьми и местами. Действительно, на самых ранних этапах обработки информации мы воспринимаем окружающее не как совокупность цветов и контуров, а в категориях.
Какими бы захватывающими ни были эти находки сами по себе, они соединялись друг с другом еще более глубоким образом, словно береговая линия неизведанного континента. Каждая новая идея указывала на что-то большое, историческое, может быть, только ожидающее своего открытия, и это заставляло меня с еще большим нетерпением ждать результатов нашего эксперимента. Стоим ли мы на пороге прояснения понимания? Или более сложного?
В большинстве дней Пьетро пил капучино в середине дня в кафе Red Door на территории кампуса, и я начал ходить с ним. Мои личные финансы не позволяли мне иметь модную привычку пить кофе, но мне нравилось наблюдать за его процессом, начиная с индивидуального заказа, который он передавал бариста, и заканчивая осторожностью, с которой он добавлял только намек на коричневый сахар, и последующим деликатным помешиванием. После моих лет суеты это было приятным напоминанием о том, что стоит ценить более простые моменты жизни.
Сегодня, однако, причина моего прихода была более стратегической: результаты эксперимента были готовы, и я хотел поделиться ими немедленно. При всем внимании, которое Пьетро уделял своему ритуалу, с ним было легче разговаривать за кофе, чем за обедом, поскольку у него выработалась привычка расставлять наши подносы в виде красочных табло, которые он сравнивал с работами поп-художника Дэвида Хокни. Хотя поначалу это было забавно, его "коллажи Хокни", как он их называл, были для него в основном возможностью развлечь себя, пока я становился все более голодным, вспоминая, какой утонченной когда-то казалась его любовь к истории искусства.
Пока он делал первый глоток капучино, я открыла блокнот, в который переписала последние результаты, и начала читать их вслух. Я был горд тем, что после стольких трудов у меня появилось что-то осязаемое, но по мере того как я переходил к списку цифр, Пьетро становился таким же взволнованным, как и я.
"Фей-Фей, эти фигуры... Я имею в виду, они..."
"Я знаю! Они невероятные!"
Тест за тестом давал потрясающе четкую картину: наши испытуемые распознавали фотографии реальных сцен, даже когда их внимание было полностью сосредоточено на чем-то другом. Мы знали, что время реакции будет быстрым, но были застигнуты врасплох тем, насколько быстро, последовательно