Книга Миры, которые я вижу. Любопытство, исследования и открытия на заре ИИ - Fei-Fei Li
Шрифт:
Интервал:
Закладка:
Логика была достаточно простой, но именно масштаб его идеи сделал ее настолько разрушительной. Она мгновенно показала, насколько ограниченными были наши исследования, насколько ограниченным было наше воображение и насколько обширным на самом деле был мир за пределами обоих. Бумага была туманной, ксерокопированной реликвией, но мне казалось, что Бидерман обращается непосредственно ко мне: "Хотите прорыва? Вот цена. Вот что для этого нужно.
Тем не менее, число Бидермана - потенциальный план того, что требовали наши амбиции как исследователей, - было большим. Действительно большим. Это была не 1 000, не 2 000 и даже не 5 000. И уж точно не 101, на каталогизацию которых мы потратили несколько месяцев.
Это было 30 000.
Я понятия не имел, что делать с этой цифрой. Создание "Калтеха 101" казалось мне непосильным трудом, а тут я столкнулся с оценкой, которая превосходила ее на целых два порядка. Но теперь от этого было не отмахнуться. Там было что-то - настоящее озарение - его тепло проникало сквозь цифры, напечатанные на странице. Более того, я знал, что, куда бы ни привело меня это число, я буду идти один. Моя сфера деятельности была зациклена на алгоритмах. Но чем больше я думал о данных - особенно о данных в больших, возможно, огромных масштабах, - тем больше понимал, что это совершенно неизведанный рубеж. Мир уже выбрал свое направление. Но моя Полярная звезда вела меня в другом направлении.
Глава 7. Гипотеза
Солнечные лучи, пронзительно-белые, мерцали сквозь зелень, проносясь мимо моей машины по шоссе 206. По двухполосной дороге было легко ехать, делая пологие повороты сквозь полог деревьев, который периодически прорывался, чтобы показать проблески маленьких городков на горизонте. Я почти ничего не замечал. Мои мысли были где-то далеко, и, хотя мне удавалось быть достаточно внимательным, чтобы держаться между полосами разметки, на этом все и заканчивалось.
Хотя прошел всего год с тех пор, как я окончил Калтех с докторской степенью, почти все в моей жизни изменилось. Моя мать снова заболела. Болела сильнее, чем когда бы то ни было, но потом состояние резко стабилизировалось. Я также получила свою первую настоящую работу - должность младшего преподавателя в Университете Иллинойса Урбана-Шампейн - и медицинскую страховку, которая прилагалась к ней. Мы с Сильвио поженились. Потом он тоже нашел работу... в Мичигане. Мне было за что благодарить, но я была ходячим символом турбулентности, столь распространенной в начале академической карьеры. Я была одновременно замужем, одинока и жила с родителями.
Тем не менее мои исследования в области категоризации зрения оставались в центре моего мира, и меня снова пригласили в Принстон, чтобы представить мою последнюю работу на факультете компьютерных наук. К этому моменту я уже привык читать лекции, но уловил намек на то, что это приглашение может быть чем-то большим - первым шагом в процессе найма и, возможно, получения должности преподавателя. Ставки были выше, чем я привык, и я был благодарен своей привычке начинать поездки в Нью-Джерси с визита к Сабеллам. Извилистый маршрут, ведущий из их района в мою альма-матер, дал мне достаточно времени, чтобы все обдумать.
Но больше всего меня волновала не лекция и даже не моя карьера. Моя жизнь просто перестала быть прежней с тех пор, как я наткнулся на число Бидермана - его оценку того, что что-то порядка 30 000 уникальных концепций может обеспечить полную основу для понимания визуального мира. Эти непритязательные пять цифр превратились в черную дыру в центре моего сознания, опутывая мои мысли практически каждый момент бодрствования.
С одной стороны, моя интуиция совпадала с интуицией Бидермана. Его номер выглядел правильным, я чувствовал это нутром. Оно имело вид доказательства, данных, которые я мог бы как-то использовать. В то же время было ясно, что он никогда не рассматривал его как эмпирическую величину. Это был классический расчет "на глазок", скорее иллюстрация, чем гипотеза. И все же по какой-то причине спустя годы после того, как я впервые увидел его, я не мог с ним расстаться.
Она вдохновила меня на изменение мышления в сторону ощущения масштаба, о котором я раньше даже не подозревал, но не дала почти ничего нового. Число 30 000, конечно, интригует, но что именно 30 000? Я был уверен, что ответ не так прост - создать новый набор данных с 30 000 случайно выбранных категорий вместо 101. Конечно, такая коллекция будет гораздо больше, чем набор иллюстрированных понятий из настольного словаря. Она могла бы даже начать целостно моделировать мир, а не просто описывать его особенности, прорисовывать полную картину жизни на Земле, объект за объектом, и намекать на взаимосвязи между ними. Истинный смысл. Но я все еще только догадывался.
Шли минуты, и я начал мечтать. Желто-голубой логотип станции Sunoco привлек мое внимание, вызвав каскад воспоминаний : импрессионистские вспышки предыдущих поездок по этому маршруту. Цвета и настроения. Резкая деталь здесь, более размытая там, и все это в окружении полузабытых оттенков, богатых и выразительных, но навсегда выпавших из фокуса. Я невольно улыбнулся, когда цепочка моих мыслей пришла к чему-то конкретному: к тому, как мистер Сабелла рассказывал о своих ежедневных поездках по этой самой дороге от дома в Бадд-Лейк до школы Парсиппани и как он скрупулезно следил за ценой на бензин, чтобы свести к минимуму расходы на зарплату учителя в школе.
Это может показаться банальным, но именно такие моменты и послужили причиной моей одержимости. Это то, чем на самом деле является зрение. Это не просто "чувство", по крайней мере не так, как "чувствует" термометр или счетчик Гейгера, а скорее катализатор переживаний. Поток информации и эмоций, высвобождаемый цветом вывески автозаправочной станции, проносящейся мимо на скорости пятьдесят миль в час. Это одна из тех способностей, которые определяют разум в его наиболее человеческом проявлении - точка входа в целую вселенную воспоминаний, ассоциаций, концепций и рассуждений, вплетенных в наши визуальные связи с окружающим миром.
Мои мысли вернулись к презентации в Принстоне. По крайней мере, это была проблема, которую у меня был шанс решить.
"Не знаю, как лингвист оказался на конференции по компьютерному зрению, Фей-Фей, но я рад, что он это сделал".
Через стол от меня сидела Кристиана Феллбаум, специалист по вычислительной лингвистике, одна из многих преподавателей Принстона, с которыми я познакомился в последующие дни после лекции. Сама она не присутствовала, но ее коллега оказался в аудитории и, предчувствуя, что она оценит мою