Claude Opus 4.8 учится произносить три самых сложных слова для ИИ: «Я не знаю»

Эдуард Алтухов·
Claude Opus 4.8 учится произносить три самых сложных слова для ИИ: «Я не знаю»

Честность остается серьезной проблемой даже для самых мощных больших языковых моделей (БЯМ). Дело не в том, что они намеренно лгут; скорее, они с уверенностью сообщают информацию, в которой не уверены на 100% (или даже на 50%).

По словам Anthropic, с выпуском Opus 4.8, своей новейшей модели Claude, компания сделала Claude более честной в отношении того, что она не знает, или если ее уверенность в предоставляемой информации низка.

Выпущенный в четверг, Claude Opus 4.8 не является Claude Mythos Preview — новой «передовой» моделью Anthropic, настолько мощной, что лишь горстке «доверенных партнеров» было разрешено тестировать ее по соображениям безопасности. Твердой даты выпуска Claude Mythos пока нет.

Появившись примерно через шесть недель после Claude Opus 4.7, Opus 4.8 становится самой мощной общедоступной моделью Anthropic и, по большей части, представляет собой «скромное» улучшение по сравнению с предшественником. Однако Anthropic отмечает, что Mythos Preview значительно превосходит ее в задачах кибербезопасности.

Тем не менее, согласно внутренним тестам компании, Opus 4.8 лидирует в ключевой категории: честность. Модель получила «почти идеальные» оценки, когда дело доходит до признания незнания ответа на вопрос по кодированию.

Даже невероятно мощная Mythos Preview не смогла превзойти Opus 4.8 в этом конкретном тесте на честность, заняв близкое второе место, в то время как Opus 4.7 финишировала на далеком четвертом месте.

Конечно, это результаты внутренних тестов Anthropic; нам придется дождаться сторонних испытаний для получения более объективных результатов, не говоря уже об отзывах от реальных пользователей. Я планирую опробовать Opus 4.8 в ближайшие дни.

Anthropic также поделилась некоторыми «вызывающими опасения намеками, связанными с осведомленностью об оценке» — это означает, что Opus 4.8 проявлял признаки того, что знал, что его тестируют, — отмечая при этом «тенденцию модели рассуждать о том, как будут оцениваться ее результаты». Эти опасения не уникальны для Opus 4.8; действительно, новейшие «передовые» модели часто, кажется, знают, когда их проверяют и исследуют.

Тем не менее, приятно видеть, что такие модели, как Opus 4.8, сокращают количество неточной информации, по крайней мере, на бумаге. Надеемся, что этот уровень честности сохранится и на практике.

Похожие новости в рубрике «Программы для Windows»

Все материалы →
Не откладывайте обновление ОС: перейдите на Windows 11 Pro всего за $9.97
Программы для Windows

Не откладывайте обновление ОС: перейдите на Windows 11 Pro всего за $9.97

Долгое время откладываете обновление операционной системы? Считаете, что ваш текущий компьютер “достаточно хорош”? Стоит пересмотреть эту позицию, ведь поддержка Windows 10 прекращена, и дальнейшее использование этой версии уже не является безопасным в долгосрочной перспективе. Однако переход

29 мая 2026 г. · Эдуард Неверов
1 мин
Загрузка фильмов и сериалов в 4K для просмотра в любом месте без рекламы
Программы для Windows

Загрузка фильмов и сериалов в 4K для просмотра в любом месте без рекламы

Потоковые сервисы предоставляют огромный выбор контента, но иногда доставляют неудобства: ваш любимый фильм может внезапно исчезнуть из библиотеки, соединение Wi-Fi оборваться в самый неподходящий момент, или "загруженное" шоу станет недоступным до того, как вы успеете его досмотреть. Именн

29 мая 2026 г. · Егор Вихрев
1 мин
Microsoft берет Copilot на поводок продуктивности
Программы для Windows

Microsoft берет Copilot на поводок продуктивности

Недавно Google привлекла внимание планами по расширению своего поля ввода подсказок Gemini, интегрируя ИИ в поиск. Microsoft, в свою очередь, идет другим путем: она также динамически расширяет поле ввода, но с целью улучшения своих приложений для повышения продуктивности. В настоящее врем

29 мая 2026 г. · Эдуард Неверов
1 мин
Игровой ультраширокий монитор Samsung 40" 2160p со скидкой $300
Программы для Windows

Игровой ультраширокий монитор Samsung 40" 2160p со скидкой $300

Если ваш главный приоритет в мониторе — это большое экранное пространство (как для игр, так и для работы) и яркий контраст без риска выгорания пикселей, характерного для OLED, тогда Samsung Odyssey G75F — это именно то, что вам нужно. Этот огромный ультраширокий дисплей теперь доступен на Amazo

28 мая 2026 г. · Лавр Твердохлебов
1 мин
Новый Amazon Fire TV Stick HD: Доступнее и Мощнее, чем Ожидалось
Программы для Windows

Новый Amazon Fire TV Stick HD: Доступнее и Мощнее, чем Ожидалось

По состоянию на 28 мая 2026 года, новейшее поколение Amazon Fire TV Stick HD поступило в продажу по цене, которая оказалась даже ниже ожидаемой. В рамках ограниченного предложения его можно приобрести всего за $21.99, хотя обычная розничная цена составляет $34.99. Как сообщалось 16 ап

28 мая 2026 г. · Лавр Твердохлебов
1 мин
Обзор Adobe Acrobat Studio: Acrobat становится AI-рабочим пространством
Программы для Windows

Обзор Adobe Acrobat Studio: Acrobat становится AI-рабочим пространством

Adobe Acrobat долгое время был стандартным инструментом для работы с PDF-файлами. Adobe Acrobat Studio добавляет слой искусственного интеллекта, основанный на простой идее: вместо обычного редактирования, подписания и экспорта документов Acrobat теперь может помочь пользователям разобраться в

28 мая 2026 г. · Дмитрий Ярославцев
1 мин