ua ru
Пожалуйста, заполните это поле
1

Google запустила переводчик Gemini 3.5: он сохраняет голос и стирает границы

Технологии

Американская корпорация презентовала революционную нейросеть для непрерывного перевода разговоров

Google запустила переводчик Gemini 3.5: он сохраняет голос и стирает границы

Google запустила переводчик Gemini 3.5: он сохраняет голос и стирает границы / Фото: Google

Компания Google официально анонсировала запуск своей новейшей и самой совершенной модели для перевода речи в реальном времени — Gemini 3.5 Live Translate. Это событие стало настоящим прорывом в сфере искусственного интеллекта, ведь новая система способна мгновенно распознавать более 70 языков мира и генерировать абсолютно плавную, естественно звучащую переведённую речь. Самым большим новшеством стало то, что ИИ сохраняет уникальную интонацию, темп и даже высоту голоса оригинального говорящего, делая общение максимально человечным и эмоционально окрашенным.

Детали

Если раньше международные переговоры, путешествия или онлайн-встречи сопровождались неудобными задержками из-за работы алгоритмов прошлого поколения, то теперь технология позволяет вести диалог так, будто собеседники владеют одним языком. Это открывает беспрецедентные возможности для глобального бизнеса, образования и повседневного общения людей из разных уголков планеты.

Как работает новый синхронный перевод от Google

Главное отличие Gemini 3.5 Live Translate от предыдущих итераций заключается в архитектуре самой модели. Инженеры Google сумели преодолеть фундаментальную проблему машинного перевода — задержку на обработку контекста.

Непрерывность вместо неудобных пауз

Традиционные системы пошагового перевода всегда работали по принципу рации: они вынуждены ждать, пока человек полностью закончит свою мысль, и только после этого начинают генерировать ответ на другом языке. Gemini 3.5 работает иначе. Благодаря огромным вычислительным мощностям эта модель генерирует речь непрерывно.

"3.5 Live Translate постоянно создаёт аудиопоток, филигранно балансируя между необходимостью подождать контекст для максимальной точности и потребностью переводить немедленно, чтобы оставаться синхронизированной с говорящим", — объясняют разработчики Google.

В результате слушатель слышит идеальный аудиопоток без раздражающих пауз, а ИИ отстаёт от говорящего всего на несколько секунд на протяжении всей беседы. Более того, система автоматически распознаёт язык собеседника и сохраняет стабильность даже в очень шумных условиях: на улице, в кафе или в метро.

Защита от дезинформации с помощью SynthID

Учитывая, что ИИ научился идеально копировать голос и интонации, возникает логичный вопрос безопасности. Чтобы предотвратить создание дипфейков и распространение дезинформации, Google внедрила строгие протоколы маркировки. Весь сгенерированный аудиоконтент незаметно для человеческого уха помечается цифровым водяным знаком SynthID. Эта технология глубоко вплетается в структуру звука, что позволяет специальным алгоритмам мгновенно определить, что речь была сгенерирована искусственным интеллектом.

Где уже можно опробовать новейшую функцию

Google не стала затягивать с развёртыванием технологии, поэтому первые пользователи уже могут протестировать её в действии на своих устройствах.

Обновление для Google Translate на Android и iOS

Gemini 3.5 Live Translate уже начала постепенно появляться в фирменном приложении Google Translate для платформ Android и iOS. Чтобы активировать функцию при использовании наушников, достаточно нажать новую кнопку "Live translate" в левом нижнем углу интерфейса.

Кроме того, владельцы Android-смартфонов получили эксклюзивный "режим прослушивания". Это гениальное в своей простоте решение: если у вас нет наушников, вы можете просто поднести телефон к уху, как при обычном телефонном звонке, и динамик будет транслировать вам перевод слов вашего собеседника. Это идеальный сценарий для живого общения за границей.

Глобальная интеграция в Google Meet

Особую радость новинка принесла корпоративным клиентам. Как сообщает издание 9to5google, функция также стремительно интегрируется в сервис видеоконференций Google Meet. Если раньше это приложение поддерживало прямой перевод только для пяти языков (и в основном с привязкой к английскому), то поддержка более 70 языков в новой модели открывает колоссальные возможности. Теперь в рамках одной онлайн-встречи доступно более 2000 уникальных языковых комбинаций. Для запуска функции в веб-версии Meet появилась специальная кнопка на панели управления.

В настоящее время этот инструментарий разворачивается в формате закрытого предварительного просмотра для избранных бизнес-клиентов Google Workspace, но уже к концу этого года ожидается масштабный публичный релиз.

Возможности для разработчиков и бизнеса

Амбиции Google выходят далеко за пределы собственных продуктов. Gemini 3.5 Live Translate позиционируется как фундаментальная база для создания сторонних сервисов. Модель уже доступна в публичном предварительном просмотре для программистов через инструментарий Gemini Live API и платформу Google AI Studio.

Благодаря этому разработчики со всего мира могут интегрировать сверхмощный переводчик в собственные приложения. Это открывает двери для создания многоязычных кол-центров нового поколения, платформ для онлайн-репетиторства, где преподаватель и ученик говорят на разных языках, а также для синхронного перевода прямых трансляций на Twitch или YouTube и международных масштабных конференций.

Три лучших онлайн-переводчика современности

Появление Gemini 3.5 Live Translate безусловно меняет правила игры, но на рынке текстового и голосового перевода уже существуют мощные игроки. Сегодня пользователи чаще всего выбирают между тремя гигантами индустрии, каждый из которых имеет свои сильные стороны.

DeepL: король контекста и естественности

Немецкий проект DeepL давно завоевал сердца профессионалов, лингвистов и переводчиков. Его главная фишка — невероятно глубокое понимание контекста. В отличие от многих конкурентов, которые часто переводят предложения "в лоб", DeepL использует продвинутые нейросети, анализирующие текст целиком. Он предлагает идиоматически правильные конструкции, идеально подбирает синонимы и позволяет пользователю самостоятельно корректировать перевод, предлагая альтернативные варианты для каждого слова. Хотя он поддерживает меньше языков (около 30), качество обработки европейских языков здесь считается эталонным.

Google Translate: универсальный гигант

Бесспорный лидер по популярности. Google Translate предлагает поддержку более 130 языков, что делает его абсолютно незаменимым инструментом для путешествий. Его главное преимущество — тотальная интеграция в экосистему смартфонов и веб-браузеров. Пользователи обожают его за функцию перевода текста через камеру смартфона в реальном времени, возможность загружать офлайн-словари и бесшовную работу на любых устройствах. А с внедрением моделей семейства Gemini его точность стремительно приближается к уровню человеческого восприятия.

Microsoft Translator: надёжный выбор для бизнеса

Продукт от Microsoft является мощной альтернативой, которая особенно ценится в корпоративном сегменте. Он глубоко интегрирован в пакет Microsoft 365, Skype и браузер Edge. Уникальной особенностью этого переводчика является режим "Conversation" (Разговор), который позволяет подключать до 100 человек на разных устройствах к единой комнате, где каждый участник пишет или говорит на своём родном языке, а все остальные мгновенно получают перевод на свои экраны.

Конкуренты не отстают: новости от Apple

Конечно, на динамичном рынке технологий ни одна инновация не остаётся без ответа, и параллельно с громкими анонсами от поискового гиганта, другие ключевые игроки также демонстрируют свои достижения. Так, корпорация Apple официально дала старт своей ежегодной масштабной конференции для разработчиков WWDC 2026, торжественно представив абсолютно новое поколение операционных систем, объединяющих всю фирменную экосистему. Центральными событиями этого мероприятия стали долгожданные анонсы: купертиновцы показали свежую мобильную платформу iOS 27, богатую на ИИ-функции, а также обновлённую версию настольной операционной системы macOS 27, которая в этом году получила громкое и символичное название Golden Gate.

Источник: Google

Не пропустите интересное!

Подписывайтесь на наши каналы и читайте новости в удобном формате!

Главное за сегодня
Больше новостей