Осторожно, последний чат-бот OpenAI меньше галлюцинирует и может даже считать до трех

Осторожно, последний чат-бот OpenAI меньше галлюцинирует и может даже считать до трех

Как опытный геймер и энтузиаст технологий со склонностью к искусственному интеллекту, я должен сказать, что последнее творение OpenAI, o1, безусловно, вызвало у меня интерес. Став свидетелями эволюции этих цифровых умов от элементарных чат-ботов до более сложных помощников, интересно видеть, как далеко мы продвинулись.


Представляем на сцене разговора недавно запущенного чат-бота на базе искусственного интеллекта под названием o1! Этот бот специально разработан для решения сложных задач и может похвастаться знаниями в таких областях, как программирование, математика и эффективное решение многоэтапных задач.

Одним из заметных изменений в последних языковых моделях OpenAI (LLM), по-видимому, является переход от имитации шаблонов, извлеченных из обучающих данных, к более прямому подходу к решению проблем, чему способствует обучение с подкреплением. Этот сдвиг направлен на создание более надежного и точного чат-бота.

По словам руководителя исследования OpenAI Джерри Творека в интервью The Verge, было замечено, что модель демонстрирует меньше случаев галлюцинаций. Однако важно уточнить, что это не означает, что модель полностью свободна от галлюцинаций. Другими словами, хотя мы и видим уменьшение количества галлюцинаций, мы не можем утверждать, что полностью решили проблему галлюцинаций.

Действительно, часто утверждается, что система o1 использует метод, аналогичный прогрессу человеческого мышления, последовательно решая задачи, что, как полагают, значительно повышает ее производительность в таких областях, как программирование и математика.

Похоже, что индивидуальный результат на отборочном тесте Международной математической олимпиады составил примечательные 83%, значительно превзойдя результат GPT-4 в 13%. Этот человек также продемонстрировал сильные навыки на соревнованиях по программированию. OpenAI ожидает, что предстоящее обновление позволит ему выполнять сложные задачи, связанные с физикой, химией и биологией, наравне с аспирантами.

Однако, несмотря на эти достижения или, возможно, из-за них, этот новый бот по некоторым показателям на самом деле хуже. У него меньше фактов о мире на кончиках пальцев, и он не может просматривать веб-страницы или обрабатывать изображения. Кроме того, в настоящее время он медленнее отвечает и выдает ответы, чем GPT-4o.

Естественно, сейчас возникает вопрос: сталкивается ли этот новый чат-бот с некоторыми неожиданными ограничениями, с которыми столкнулись его предшественники. Например, сможет ли он выполнить такую ​​простую задачу, как счет до трех?

Кажется, что GPT-4o может столкнуться с трудностями, когда его попросят подсчитать количество букв «r» в слове «клубника», считая только до двух. Однако версия 1 (о1) умеет правильно считать до трех.

Значительный скачок в вычислительных мощностях для подсчета не является бесплатным; за это приходится платить. Доступ к версии для разработчиков стоит 15 долларов США за каждый 1 миллион входных токенов и 60 долларов США за каждый 1 миллион выходных токенов. Это соответствует стоимости GPT-4o в три и четыре раза соответственно.

Похоже, что ChatGPT Plus и членам команды был предоставлен ранний доступ к предварительной версии бота, которая называется o1-preview. Позже более компактная версия под названием o1-mini будет предлагаться бесплатно, хотя OpenAI пока не назвала дату выпуска.

Подводя итог, можно сказать, что это бот, который может давать более последовательные ответы и принимать разумные решения, что приближает нас к инструменту, который полезен в повседневной жизни, а также напоминает общий или человеческий интеллект.

По словам главного научного сотрудника OpenAI Боба МакГрю, они уже несколько месяцев усердно работают над развитием навыков рассуждения. Он считает, что это ключевой прорыв, заявляя, что он представляет собой новый подход к моделям для решения сложных проблем, необходимых для достижения уровня интеллекта, подобного человеческому.

Честно говоря, если он действительно умеет считать до трёх, то, должен признаться, я весьма удивлён! Конечно, в качестве стандартной меры безопасности я всем сердцем принимаю все, что будет дальше.

Смотрите также

2024-09-13 19:17