Голосовой ИИ-чат не справляется: Стартап нашел решение

Филипп Радмиров·
Голосовой ИИ-чат не справляется: Стартап нашел решение

Голосовое общение с современным искусственным интеллектом часто напоминает устаревший радиообмен, где участники вынуждены говорить по очереди. Диалог примерно такой: "Привет, ChatGPT, давай поговорим о фильмах! Прием." "Конечно, Бен, о каком фильме ты хотел бы поговорить? Прием." Хотя в голосовых чатах с ChatGPT или Gemini не нужно буквально произносить "прием" или "отбой", именно так устроена их работа изнутри.

В некоторых аспектах голосовые режимы ИИ даже более ограничены, чем старые радиопереговоры. Искусственный интеллект не только ждет, пока вы закончите говорить, но и не воспринимает ничего, что происходит во время вашей речи, включая течение времени. Аналогично, когда ИИ говорит, он слишком занят генерацией ответа, чтобы "думать" о чем-то еще. По сути, текущий голосовой режим ИИ — это обычный текстовый чат, к которому просто добавили озвучку. Поэтому я почти никогда им не пользуюсь.

Эта ситуация может измениться благодаря новому поколению ИИ-моделей, ориентированных на "взаимодействие", которые способны следовать за течением разговора и даже прерывать собеседника, слушая его в реальном времени. Эти "интерактивные" модели, разработанные стартапом Thinking Machines, основанным бывшим руководителем OpenAI Мирой Мурати, отличаются от современных однопоточных ИИ-моделей, которые не могут ни думать во время прослушивания, ни реагировать во время говорения. Вместо этого новые модели используют конфигурацию "мультипоточных микро-оборотов", что позволяет им продолжать обрабатывать входные данные — включая звуки и визуальную информацию — пока они слушают, а затем даже прерывать разговор, основываясь на том, что вы говорите.

В серии демонстрационных роликов Thinking Machines показывает, как их модели (пока находящиеся на стадии исследовательского превью) реагируют на людей-участников в реальном времени во время видеочатов. Они могут определять предметы, которые те держат в руках, и вести текущий подсчет "животных" слов (например, "олень" и "овца"), пока пользователь продолжает говорить. Модели Thinking Machines также демонстрируют впечатляющую выдержку: в другом взаимодействии они терпеливо ждут, не перебивая, пока их собеседник делает глоток кофе посреди предложения.

В другой демонстрации модель (по инструкции) прерывает разговор, в реальном времени исправляя произношение слова "асаи" у говорящего и корректируя ее преднамеренно неверное утверждение о том, что асаи-боулы родом из Аргентины. Да, это может показаться раздражающим, но демонстрация наглядно показывает, что ИИ от Thinking Machines способен реагировать во время прослушивания, а не замирать в ожидании своей очереди.

В чем же секрет Thinking Machines? Компания использует две ИИ-модели: "интерактивная" модель постоянно "присутствует" с пользователем, обрабатывая входные и выходные данные в быстрых 200-миллисекундных интервалах, в то время как вторая, "фоновая" модель, выполняет более сложные задачи, передавая результаты более быстрой интерактивной модели по готовности.

Новые интерактивные ИИ-модели Thinking Machines все еще находятся в разработке (автор пока не видел и не слышал их в действии). Стартап признает, что его модели испытывают трудности с "очень длинными" разговорами и что для корректной работы им требуется "надежное соединение". Текущая "интерактивная" модель компании также довольно компактна, поскольку более крупные модели "слишком медленны для использования в таком режиме".

Тем не менее, новая "полнодуплексная" парадигма от Thinking Machines может стать прорывным решением для голосовых ИИ-чатов, сделав их общение плавным и естественным, а не принужденным и прерывистым, напоминающим устаревший радиообмен.

Похожие новости в рубрике «Программы для Windows»

Все материалы →
Лучшие мониторы 2026 года: Выбор для гейминга, 4K, HDR и не только
Программы для Windows

Лучшие мониторы 2026 года: Выбор для гейминга, 4K, HDR и не только

Ищете новый монитор для своего ПК? Мы тщательно изучили множество вариантов, чтобы представить вам лучшие мониторы, доступные на рынке. Эти рекомендации основаны на сотнях часов тестирования новейших моделей от Acer, Asus, BenQ, Dell, LG, Samsung и других ведущих брендов. Хотя наш главный фаво

13 мая 2026 г. · Лавр Твердохлебов
1 мин
Кабели USB-C Anker 140 Вт (3 метра): Скорость и Длина по Привлекательной Цене
Программы для Windows

Кабели USB-C Anker 140 Вт (3 метра): Скорость и Длина по Привлекательной Цене

Многие сталкиваются с проблемой, когда розетка находится слишком далеко от того места, где хочется удобно расположиться, например, на диване. В таких случаях сверхдлинные зарядные кабели становятся незаменимыми, особенно если они поддерживают сверхбыструю зарядку. Сейчас появилась отличная возм

13 мая 2026 г. · Дмитрий Ярославцев
1 мин
Апрельское обновление Windows 11 вызывает сбои ПК и графические артефакты
Программы для Windows

Апрельское обновление Windows 11 вызывает сбои ПК и графические артефакты

Масштабное апрельское обновление Microsoft (KB5083769) в последние недели вызывает многочисленные проблемы на устройствах с Windows 11, включая блокировки BitLocker, циклы перезагрузки и некорректную работу сторонних приложений для резервного копирования. Теперь возникла еще одна серьезная проб

13 мая 2026 г. · Дмитрий Ярославцев
1 мин
Портативное зарядное устройство Anker Zolo с встроенным кабелем USB-C: Обзор и впечатления
Программы для Windows

Портативное зарядное устройство Anker Zolo с встроенным кабелем USB-C: Обзор и впечатления

Из всех моих многочисленных внешних аккумуляторов дома, только один я всегда ношу с собой, когда выхожу: Anker Zolo. Это мой основной выбор для подзарядки в пути, и он может стать вашим, особенно учитывая текущую выгодную скидку. Я приобрел этот повербанк по конкретной причине: мне нужен

13 мая 2026 г. · Эдуард Неверов
1 мин
Игра в пиратскую Forza Horizon 6 может привести к бану на 8000 лет
Программы для Windows

Игра в пиратскую Forza Horizon 6 может привести к бану на 8000 лет

Каждый добросовестный геймер знает, что приобретение видеоигр должно происходить законными способами. Конечно, никто из вас не стал бы загружать игру до ее официального выпуска, даже если бы она была опубликована в Steam в незашифрованном виде и представляла собой легкую мишень для нед

13 мая 2026 г. · Филипп Радмиров
1 мин
Ваш HDR-монитор может вас обманывать
Программы для Windows

Ваш HDR-монитор может вас обманывать

Вы только что купили новый монитор, который активно рекламирует свои HDR-возможности. Вы включаете первое попавшееся «4K HDR» видео на YouTube, но оно выглядит тусклым или почти не отличается от вашего предыдущего не-HDR дисплея. Это распространенная проблема: хотя HDR повсюду упоминается в спе

13 мая 2026 г. · Егор Вихрев
1 мин