Google создал «подкаст» на основе одной из моих статей, и это самый убедительный и жуткий искусственный интеллект, имитирующий человека, который я когда-либо слышал.

Google создал «подкаст» на основе одной из моих статей, и это самый убедительный и жуткий искусственный интеллект, имитирующий человека, который я когда-либо слышал.

Как опытный геймер и энтузиаст технологий с более чем двадцатилетним опытом работы за плечами, позвольте мне сказать вам, что я увидел некоторые революционные инновации, которые повергли меня в трепет. Но последняя игрушка Google, NotebookLM, потрясла самые основы моего цифрового существа. Это все равно, что наткнуться на джина в бутылке только для того, чтобы он выпустил 10-минутный подкаст о вашей последней статье со сверхъестественной американской ноткой.


Инновационный инструмент искусственного интеллекта Google NotebookLM всего одним щелчком мыши может создать для вас подкаст. По сути, он функционирует как сводная машина. Вы просто загружаете документ, нажимаете «Создать» и взамен получаете сокращенную версию документа, например краткий обзор, раздел часто задаваемых вопросов или учебное пособие. Что делает этот инструмент еще более интересным, так это его способность создавать подкасты, обсуждающие содержание документа. Ведущие этих подкастов — временные личности с веселым американским акцентом.

Возьмем, к примеру, статью, которую я написал еще в 2023 году под названием «Кэш — король, когда дело доходит до проектирования игровых процессоров следующих 20 лет». В котором я поговорил с несколькими экспертами в области кремниевой инженерии о том, что будет дальше с разработкой чипов. Я загрузил статью в NotebookLM, подождал около четырех минут, и появился 10-минутный подкаст.

Послушайте в Soundcloud, вставленном ниже.

«Какого черта!»

Должен признаться, я издал удивленный восклицание, когда впервые услышал это – извините! Что меня действительно поразило, так это реалистичность хода дискуссии и искренние эмоции, которые она передала. Нечасто встретишь подобное, поэтому на меня это произвело сильное впечатление.

Они (я уже веду себя так, будто это реальные люди) даже представляют подкаст… как подкаст. Когда я слушаю, мне приходится напоминать себе, что это не настоящие люди, а результат того, что я вставил гиперссылку в поле на веб-сайте. Компьютер симулирует двух людей, разделяющих мысли и чувства. Не знаю почему, но мне это кажется очень странным.

Похоже, я не одинок в своих чувствах к новому инструменту искусственного интеллекта. Поделившись версией, протестированной с нашей RTX 4090, всей команде PC Gamer, мы получили такие отзывы:

«Это настоящий экзистенциальный кризис, вызывающий».

И:

«это чертовски ужасно».

И:

«перебивания и ответы соведущего меня пугают».

И:

«Я переезжаю в лес, я не могу этого вынести».

Я хочу сказать, что NotebookLM одновременно впечатляет и устрашает. Более того, аналогии и ссылки, сделанные на протяжении всей записи, не взяты из предмета — в данном случае из статьи PC Gamer. В основном они созданы ИИ.

Например, сравнение 3D V-Cache со строительством небоскреба вместо расширения склада весьма остроумно, хотя и было создано искусственно. И это только добавляет ему впечатляющего качества.

Однако подкаст — это не только содержание, но и ведущие. И до сих пор у нас не было других «хостов» (вокалоидов с искусственным интеллектом), которые озвучивали бы что-либо, что мы загружали на NotebookLM. Это наверняка со временем изнашивается. Не говоря уже о том, что вряд ли будут какие-то веселые шутки с двумя запрограммированными Google ботами за микрофоном.

Мне кажется, я передаю идею о том, что журнал чата PC Gamer Chat Log не представляет собой реальной и надежной угрозы для хорошо зарекомендовавших себя подкастов и не заменяет их полностью. Однако, подобно тому, как искусство, созданное ИИ, не уничтожило все человеческое искусство, оно потенциально может изменить ландшафт того, что считается ценным. Для иллюстрации: вы не можете создать 300 шедевров только за один вечер игры в D&D с друзьями, но с помощью ИИ вы можете создать такой контент, если вы открыты для его использования, что вполне разумно.

Как и в этом случае, я бы не стал создавать подкаст для каждой статьи, которую когда-либо писал. Однако если бы это было так же просто, как нажать несколько кнопок? То, что несколько месяцев назад казалось не стоящим внимания, теперь практически не требует усилий.

Не волнуйтесь, я не буду обременять вас бесчисленными старыми статьями о характеристиках видеокарт. Суть ясна: прогресс происходит быстро, вещи, которые всего несколько месяцев назад казались невозможными, теперь достижимы.

Однако в комнате есть слон, и он притворяется человеком с мыслями, эмоциями и голосовыми связками. Этот удивительно впечатляющий инструмент естественного языка, будучи настолько простым и доступным, является опасным инструментом в чужих руках. Как легко было бы обмануть кого-то, если бы вы могли озвучить любой текст, любой документ изящным разговорным человеческим тоном. это ужасно.

Однако я не нашел другого примера, который вызвал бы у меня такую ​​же реакцию, как NotebookLM, убедительно демонстрирующего возможности ИИ.

Итак, что такое NotebookLM?

Инструмент, известный как NotebookLM, можно найти и использовать на сайте NotebookLM.google. Несмотря на довольно неинтересное название, его функциональность на самом деле весьма впечатляет.

NotebookLM создан с использованием модели искусственного интеллекта Gemini от Google, которая также внедряется на новых устройствах Android и используется для создания сводок искусственного интеллекта при веб-поиске, которые могут разрушить привычную нам интернет-бизнес-модель. Однако, в отличие от своего мощного аналога, NotebookLM служит помощником в учебе — искусственный интеллект, предназначенный для сжатия документов, расшифровки аудио и экономии вашего драгоценного времени, делая за вас заметки. Если бы я столкнулся с этим инструментом во время учебы в школе, он произвел бы революцию в моем процессе редактирования, но, к сожалению, я родился на двадцать лет позже — просто не дойдя до отметки.

Продукт был доступен в США до 2024 года, но благодаря улучшениям, внесенным летом, и выпуску во всем мире, теперь им пользуется больше людей, чем раньше.

Google создал «подкаст» на основе одной из моих статей, и это самый убедительный и жуткий искусственный интеллект, имитирующий человека, который я когда-либо слышал.

Функция подкаста «Обзор аудио» также была недавно представлена ​​в программном обеспечении в сентябре.

Как энтузиаст, должен уточнить, что на данный момент программа общается исключительно на английском языке. В заявлении об отказе от ответственности в их сообщении в блоге о его выпуске упоминается, что он может «иногда повышать точность». Учитывая мое понимание систем искусственного интеллекта, даже самых высокоуровневых, они могут время от времени непреднамеренно подделывать информацию. Обычно это называют «галлюцинациями», но, по сути, это просто изощренный способ сказать, что ИИ не всегда оказывается на высоте, когда дела идут не так, как планировалось, так сказать.

Потенциальной новой функцией в Обзоре аудио, по-видимому, является возможность вставлять во время речи, возможно, изменяя ход обсуждения или внося немедленные коррективы. Google намекает на эту возможность в своем сообщении в блоге, хотя и уточняет, что «вы пока не можете это сделать», что может указывать на то, что эта функция когда-то рассматривалась.

Задумайтесь на минутку: возможность в любой момент вступить в обсуждение подкаста и предложить темы — это все равно, что создать необычную, персонализированную прямую трансляцию с тонким оттенком непрямой напористости…

Не только Google экспериментирует с чат-ботами, управляемыми искусственным интеллектом, которые имитируют человеческую речь; OpenAI также участвует, предлагая голосового помощника, напоминающего того, кто изображен в фильме Она. Это не уникальное взаимодействие человека и бота, но оно, безусловно, добавляет необычности нашему взаимодействию.

Без сомнения, эти разговорные штуки с искусственным интеллектом скоро станут настоящими странными, настоящими.

Смотрите также

2024-10-02 19:18