Google Traduction peut désormais traduire la voix en direct dans plus de 70 langues

Google dévoile Gemini 3.5 Live Translate pour une traduction vocale en temps réel

Google a annoncé le lancement de Gemini 3.5 Live Translate, un nouveau modèle de traduction vocale capable de traiter la parole en continu dans plus de 70 langues. Cette fonctionnalité est désormais accessible à tous via l’application Google Traduction.

Une approche novatrice de la traduction vocale

Contrairement aux systèmes de traduction vocale traditionnels qui attendent la fin d’une phrase pour restituer la traduction, Gemini 3.5 Live Translate génère la traduction en quasi-temps réel, à me que l’orateur parle. Selon Google, ce modèle trouve un équilibre entre la prise en compte du contexte pour garantir une meilleure qualité et la nécessité d’une traduction instantanée, offrant ainsi une expérience fluide sans pauses inappropriées.

Le modèle est capable de détecter automatiquement plus de 70 langues sans nécessiter de réglages manuels. Il préserve également l’intonation, le débit et la hauteur de la voix de l’orateur, et sa robustesse face au bruit en fait un outil adapté à des environnements de conversation variés. De plus, chaque audio généré est marqué d’un filigrane imperceptible, nommé SynthID, pour asr la traçabilité des contenus produits par l’IA.

Déploiement sur plusieurs plateformes

Gemini 3.5 Live Translate sera déployé sur trois fronts simultanément : dans l’application Google Traduction sur iOS et Android, sur Google Meet, et via l’API Gemini Live destinée aux développeurs.

  1. Dans Google Traduction : La fonctionnalité sera intégrée à l’application sur Android et iOS, permettant aux utilisateurs d’accéder à une traduction qui reflète fidèlement l’intonation de l’orateur. Un « mode écoute » sur Android permettra de diffuser la traduction directement dans l’écouteur du téléphone, facilitant son utilisation dans des contextes nécessitant discrétion et simplicité.

  2. Pour les développeurs : L’API Gemini Live est disponible en préversion publique, intégrant la gestion des flux audio en streaming et des entrées multilingues sans configuration manuelle, adaptée à divers cas d’utilisation tels que les réunions et l’assistance client.

  3. Sur Google Meet : La fonctionnalité sera intégrée en préversion privée pour certains clients professionnels de Google Workspace, augmentant le nombre de langues traduites de 5 à plus de 70, avec la possibilité de gérer plus de 2 000 combinaisons linguistiques dans une même réunion.

Cette mise à jour vise à améliorer la communication multilingue dans les environnements professionnels, avec un déploiement plus large prévu dans les mois à venir.

Source : Blog Google.

Source
Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *