Google lance Nano Banana 2 Lite et ouvre Gemini Omni Flash aux développeurs

Google lance Nano Banana 2 Lite et ouvre Gemini Omni Flash aux développeurs

Dans un billet de blog publié ce mardi 30 juin 2026, Google a annoncé la sortie de Nano Banana 2 Lite, une nouvelle version de son modèle de génération d’images, précédemment déployé en février. Ce modèle est présenté comme étant nettement plus rapide et économique que ses prédécesseurs. Parallèlement, la société a rendu accessible aux développeurs Gemini Omni Flash, son modèle multimodal destiné à la génération et à l’édition vidéo, dévoilé lors de sa conférence annuelle en mai.

Nano Banana 2 Lite, une version taillée pour la vitesse et le volume

Disponible dans Google AI Studio depuis ce mardi, Nano Banana 2 Lite est conçu pour « l’idéation rapide et les pipelines de développement à haute fréquence, où la vitesse et le coût comptent plus que la qualité maximale ». Google encourage les développeurs utilisant la première version de Nano Banana à migrer vers ce nouveau modèle, jugé plus performant. Nano Banana 2 Lite se distingue par sa latence réduite et son coût faible : il produit des images à partir de texte en 4 secondes et facture 0,034 dollar pour 1 000 images. Selon la firme, ce modèle fournit des résultats fidèles aux prompts, avec des personnages cohérents et un rendu de texte lisible.

La version Nano Banana 2 Lite est également intégrée dans plusieurs services de Google, notamment l’application Gemini, NotebookLM, Google Photos et Google Ads. Cette annonce intervient alors que Google continue de faire face à une concurrence significative de la part d’OpenAI dans le domaine de la génération d’images. D’après le classement de juin de la Text-to-Image Arena d’Artificial Analysis, les modèles GPT Image 2 et GPT Image 1.5 surpassent les performances de Nano Banana 2 et Nano Banana Pro.

Gemini Omni Flash, la vidéo conversationnelle ouverte aux développeurs

Gemini Omni Flash, présenté lors de la conférence Google I/O en mai dernier, associe « le raisonnement multimodal de Gemini à la génération et au montage vidéo ». Ce modèle, déjà accessible aux abonnés Google AI Plus, Pro et Ultra, est désormais intégré à l’API Gemini et à Google AI Studio en préversion publique.

Gemini Omni Flash se distingue par plusieurs caractéristiques :

  • Une approche conversationnelle du montage vidéo, permettant d’affiner les vidéos produites par plusieurs instructions successives.
  • Un référencement multimodal capable de combiner des entrées telles que des images, du texte et de la vidéo pour générer des scènes cohérentes.
  • Une connaissance approfondie du monde réel, s’appuyant sur les connaissances de Gemini pour produire des vidéos convaincantes.

Le coût de génération est fixé à 0,10 dollar par seconde, un tarif identique à celui de Veo 3.1 Fast. Cependant, plusieurs limitations subsistent : les vidéos générées sont limitées à dix secondes, l’import de fichiers audio et l’extension de scène ne sont pas encore pris en charge, et les séquences de référence supérieures à 3 secondes ne sont pas bien traitées. Google indique qu’il travaille à améliorer la cohérence des personnages lors des changements de scène.

Source : Blog Google

Source
Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *