Когда новая технология и шумиха появляются на вечеринке вместе, трудно мыслить ясно, пока шумиха не покинет помещение. Для некоторых ранних технологий шумиха — это единственное доказательство, которое когда-либо получает большинство людей. Так было и с квантовыми вычислениями. Меня сопроводили в чистую комнату в полном облачении и посмотрели на крошечные чипы и сложные квантовые машины. Но, в конце концов, мне просто нужно было решить, верить ли инвесторам и исследователям в том, что технология, на которую они сделали ставку в своей карьере, будет реализована в ближайшее время.
Когда я ездил на ранних версиях самоуправляемых автомобилей, это было похоже, хотя ощущения были более ощутимыми. Люди, казалось, постоянно вмешивались. И все же наблюдать за тем, как машина поворачивает руль, было потрясающе. Большинство технологий существуют в своего рода промежуточной области. Подумайте о блокчейне и метавселенной: там есть что посмотреть обычным людям, но евангелисты обещают, что настоящая магия находится прямо за горизонтом.
Шумиха не всегда навязывается извне. Идеи, которые поначалу кажутся захватывающими, не всегда обладают стойкостью. В конце 2021 года Gather — компания, которая собрала 50 миллионов долларов на серию B и создала анимированный офис, который я мог исследовать, — действительно произвела на меня впечатление. Я написал рассказ об этом опыте.
С тех пор я его не навещал. iPhone находится на другом конце спектра. Мы можем держать это в своих руках. Каждый день это доказывает мне, что это полезно и замечательно — моя личная стеклянная панель для всего мира. Искусственный интеллект находится в странном пространстве между осязаемым и воображаемым. Это широко доступно, но вдобавок к этому ведется безумно спекулятивный разговор.
Обычно люди, предлагающие технологию, раздувают ее, а оппоненты отвергают. В данном случае критики предупреждают, что искусственный интеллект обречет человечество, в то время как генеральный директор OpenAI Сэм Альтман говорит что-то вроде: “Он по-прежнему несовершенен, по-прежнему ограничен и по-прежнему кажется более впечатляющим при первом использовании, чем после того, как вы проведете с ним больше времени”.
На этой неделе на страницах The Wall Street Journal Пегги Нунан обвинила техническую команду в том, что она играет в Бога. Она написала, что “разработка искусственного интеллекта — это откусывание от яблока. Должно случиться что-то плохое. Я верю, что те, кто создает, подпитывает и финансирует это, хотят, возможно, неосознанно, быть Богом и на каком-то уровне думают, что они и есть Бог”. Тем временем Фархад Манджу написал в New York Times, что “ChatGPT уже меняет то, как я выполняю свою работу”.
Он предлагает несколько убедительных применений искусственного интеллекта. Он использует его как сложный тезаурус для поиска лучшего слова. ChatGPT может быть способным мыслительным партнером, даже когда большую часть размышлений выполняет человек. И он может быстро извлекать темы из длинного документа. Я согласен со всем этим — и я бы добавил, что это также может быть полезно для составления списка потенциальных источников для конкретной истории. (Было бы еще лучше, если бы у него был доступ в Интернет.). Но я бы все равно не сказал, что ChatGPT действительно изменил то, как я выполняю свою работу. Часто ChatGPT может быть скорее искушением, чем реальной помощью.
Когда я устану и почувствую лень, я попытаюсь заставить GPT-4 писать за меня — только для того, чтобы обнаружить, что он выдает посредственный текст, похожий на сообщение, но лишенный реальной связности. Для моей работы генерация текста может быть особенно заманчивой. На самом базовом уровне мне платят за создание текста — а искусственный интеллект отлично справляется с быстрым созданием текста в огромных количествах.
Качество идей и ясность изложения — вот что действительно имеет значение. ChatGPT может выдать вам так много текста так быстро, что кажется, что тратить часы на то, чтобы сделать что-то лучше, того не стоит. Но потом я сопротивляюсь этому порыву и решаю продолжать жить как мыслящее, печатающее существо.
Я не хочу, чтобы это прозвучало так, будто я становлюсь пессимистом по поводу этой волны искусственного интеллекта — это не так. Во всяком случае, меня беспокоит, что я недостаточно техничен, чтобы получить доступ к передовым проектам с открытым исходным кодом, с которыми люди играют для создания агентов и расширения доступа к памяти. В пятницу я поболтал с Эйданом Гомесом, генеральным директором модельной компании foundation Cohere. В свободное время он создал драйвер веб-браузера, который имеет доступ к его кредитной карте и паролю к “тонне различных веб-сайтов”.
“Если я скажу: ”Пойди купи мне мыло для рук», агент искусственного интеллекта знает его адрес и может заказать мыло для него онлайн.
Гомес объединяет свой webLM с методами расширения окна своей памяти, чтобы Cohere мог вспомнить соответствующую информацию о нем, когда это полезно, не сохраняя ее в базовой модели. Несмотря на большой ажиотаж по поводу самоуправляемых агентов, лично я стремлюсь иметь доступ к гораздо большему объему памяти и лучшему подключению к текущему Интернету. В настоящее время базовые модели значительно ограничивают объем памяти, определяемый длиной записи, измеряемой в токенах, доступный языковым моделям для генерации своих ответов. Если вы изливаете свое сердце чат-ботам, со временем они начинают забывать, что вы сказали, потому что выходят за рамки контекстного окна. Это расстраивает, когда я провожу много времени с ChatGPT, рассказывая ему о себе и создавая с его помощью предысторию в ролевой игре с ручкой и бумагой, только для того, чтобы чат-GPT начал что-то забывать. Что еще хуже, ChatGPT понятия не имеет, что он что-то забывает, и начинает нести чушь вместо того, чтобы признать, что он не может вспомнить.
“Некоторые варианты использования просто требуют все большего и большего контекста”, — сказал мне Гомес из Cohere’s. “Это область острой конкуренции. По мере того, как вы расширяете это, вы открываете варианты использования на этом пути ”. Гомес сказал, что компании, работающие с базовыми моделями, стремятся к бесконечным контекстным окнам. “Вы разблокируете 99% вариантов использования, как только получите около 8000 токенов, но в 1% есть несколько действительно интересных проблем, к которым вы стремитесь”.
В настоящее время Cohere предлагает около 4000 токенов и планирует в ближайшее время предложить чуть более 8000. (OpenAI предлагает около 4000 токенов для обычных пользователей GPT-4 и предлагает более длительные контекстные окна для пользователей своего API.). Я спросил Гомеса, считает ли он, что модели foundation начнут совершенствоваться медленнее. После достижения паритета с GPT-4 Cohere начнет достигать вершины S-образной кривой? (Альтман предположил, что OpenAI не работает над следующей версией GPT.). “Определенно, есть точка сопротивления в возможностях, которая заключается в том, что лучший человек на Земле справляется с этой задачей на этом уровне”, — сказал он. Как только искусственный интеллект станет не хуже человека справляться с определенной задачей, может потребоваться больше работы, чтобы превзойти человеческие возможности, хотя это, безусловно, оказалось возможным, как мы видели на примере шахмат и Го.
Антропный.Я заполучил в свои руки набор для сбора средств серии C от компании foundation model company Anthropic. В документе приводится ряд правдоподобных примеров, когда основополагающие модели, подобные антропным, могут оказать влияние. В ближайшие три года Anthropic считает, что сможет служить “репетитором 1-1, тренером или психотерапевтом для любого человека в мире… Для любого домена.” Компания также считает, что искусственный интеллект сможет создавать “продвинутую генерацию креативного контента”, такого как сценарии фильмов, песни и видеоигры.
на Фото: Anthropic President Daniela Amodei (center) at the Cerebral Valley AI Summit / Президент Anthropic Даниэла Амодей (в центре) на саммите по искусственному интеллекту в Церебральной долине