Découvrez le tout dernier modèle de génération d'images par IA de Google : Nano Banana 2 (Gemini 3 pro).
Aucun historique trouvé
Nano Banana Pro est le nom commercial de l'architecture Gemini 3 Pro Image. Lancé fin 2025, ce modèle marque une vraie rupture avec la génération d'images stochastique classique en misant sur une synthèse visuelle fondée sur le « raisonnement ».
En intégrant une phase de planification cognitive avant la génération des pixels, le modèle surmonte les limites habituelles liées à la logique spatiale et à la typographie. Il a été conçu spécialement pour les usages professionnels exigeant une grande fidélité, le respect d'instructions complexes et une intégration fluide du texte dans les images.
Moteur typographique natif : Génération de textes alignés, sans erreur, dans plusieurs langues et ce, sans retouche manuelle.
Planification cognitive : Utilisation d'un « mode réflexion » qui valide la logique du layout et la précision des faits avant le rendu.
Fusion approfondie des références : Assimile jusqu'à 14 images d'entrée (Par défaut : 3 images sur Somake, extensible sur demande) pour contrôler au plus fin le style et la composition.
Export prêt à produire : Génération d'assets directement en résolution 2K et 4K, adaptés à l'impression professionnelle et au digital.
Ancrage contextuel : Utilise une vaste base de connaissances pour créer des schémas et illustrations techniques crédibles et cohérentes.
Contrairement aux anciens modèles qui voient le texte comme un « bruit visuel », Nano Banana Pro comprend les glyphes et la syntaxe. Il peut reproduire fidèlement de longs paragraphes, des titres complexes et des écritures non-latines, ce qui en fait le choix idéal pour créer des supports marketing localisés et des affiches riches en données.
Un système de référence robuste suit l’identité des sujets sur plusieurs générations. En analysant jusqu’à 14 images d'entrée, il assure la cohérence des visages pour 5 personnages maximum et l’uniformité stylistique — parfait pour le storyboard et les mascottes.
Prompt : « vue à 360° de ce personnage, debout sur fond blanc. »
Une phase de « réflexion » permet au modèle de raisonner et planifier les relations spatiales plutôt que de deviner. Idéal pour des infographies logiques, des proportions anatomiques correctes et un placement précis des légendes dans des schémas techniques.
Prompt : « Crée une infographie qui explique le fonctionnement du casque audio. »
Conçu pour des flux de travail pro, le modèle offre un contrôle pointu sur les angles de caméra (ex. rendu façon objectif 35 mm), les configurations d’éclairage (ex. rim light, soft key light) et le color grading. Il permet aussi l’édition localisée et l’inpainting sans perte de contexte d'origine.
Fonction | Nano Banana | Nano Banana Pro |
Architecture | Pipeline à inférence rapide (Prompt → Image). | Pipeline raisonné (Prompt → Plan → Image). |
Meilleur usage | Idéation rapide, storyboard, brouillons réseaux sociaux. | Production finale, layouts complexes, typographie. |
Vitesse | Optimisé pour la rapidité et le volume d’itérations. | Latence plus longue due à étapes cognitives. |
Qualité du texte | Texte court basique ; erreurs possibles. | Grande fidélité ; gère paragraphes et écritures multilingues. |
Images de référence | Entrées de référence limitées. | Jusqu’à 14 images de référence. |
Pour exploiter le raisonnement du modèle, les prompts doivent aller au-delà des descriptions vagues et préciser vos instructions.
Structure recommandée :
Objectif principal : Définir clairement le type d’asset (ex. « Un schéma technique »).
Spécifications visuelles : Préciser caméra, lumière et composition (ex. « Vue isométrique, lumière uniforme »).
Texte : Lister explicitement le texte à inclure et le style de police (ex. « Texte : ‘PROMO’ en bold Sans-Serif »).
Contraintes : Définir quoi éviter ou respecter (ex. « Palette couleur de marque #FF5733 »).
Modèle universel :
[Type d’asset] de [Sujet]. [Détails de composition]. [Éclairage/style]. [Contenu textuel] : « [String exacte] » (Police : [Style]).
Style ancré (Few-Shot)
Forcez une esthétique précise en décrivant plusieurs styles et en sélectionnant un.
Logique de prompt : « Styles de référence : A) peinture à l’huile, B) art vectoriel. Appliquer le style B à la datavis suivante… »
Édition itérative
Utilisez le modèle pour affiner vos sorties en ajoutant des instructions « diff ».
Logique de prompt : « Entrée : [Image]. Action : Changer le fond en ‘Nuit pluvieuse’. Contrainte : Ne pas modifier l’éclairage ni le teint du sujet. »
Visualisation des données
Pour des graphiques fidèles, fournissez vos données et les instructions d’étiquetage.
Logique de prompt : « Génère un graphique à barres. Étiquettes X : ‘T1, T2, T3’. Axe Y : ‘Chiffre d'affaires’. Tendance : Croissante. Style : corporate minimaliste. »
Créez des images « Produit star » qui valorisent vos articles dans des décors optimisés. Le modèle peut inscrire le nom d'une référence ou une promo directe sur l’emballage ou la signalétique en toute lisibilité.
Assurez une cohérence visuelle stricte sur tous vos canaux marketing. Grâce aux fusions de références, vos mascottes ou égéries restent identiques sur chaque publication ou bannière générée.
Générez des schémas annotés complexes pour manuels et livres scolaires. La compréhension du concept « légende » par le modèle lui permet de placer flèches et descriptions avec précision près des parties concernées d'une machine ou d'une structure biologique.
Automatisez la restauration d’archives historiques. Le modèle répare les déchirures, colorise les photos en noir et blanc selon la palette de l’époque, et affine les détails tout en respectant l’identité du sujet initial.
Importez vos croquis CAO bruts en tant que images de référence et demandez des applications réalistes de matériaux, avec des variantes d’éclairage pour vos présentations.
Utilisez un prompt de base pour une affiche et remplacez le bloc texte par des versions traduites (ex. espagnol, japonais) tout en gardant la mise en page d’origine.
Définissez un personnage via des images de référence. Générez une bande dessinée 3 cases où le personnage agit différemment (court, mange, dort) sans perdre son identité faciale.
Débordement de texte : Si le texte déborde, demandez une « zone sécurisée » ou réduisez la taille de police (ex. « Assurer que le texte reste dans les 50% centraux »).
Perte d'identité : Si le personnage change d’apparence, ajoutez des descriptions physiques précises (ex. « Grain de beauté joue gauche, traits faciaux identiques »).
Données inventées : Dans les graphiques, si les chiffres sont faux, vérifiez que chaque label est bien énuméré dans le prompt. Ne pas demander au modèle d’« inventer » — fournissez-les.
Mélange de style : Pour éviter les styles indésirables, utilisez du « negative prompting » pour exclure ce qui n'est pas voulu (ex. « Pas d’éléments cartoon, pas de rendu 3D »).
On a supprimé les contraintes techniques de gestion d’API. Connectez-vous, choisissez le modèle et commencez à créer.
Une couche d’infrastructure dédiée évite la congestion et la latence que l’on croise souvent sur les offres gratuites publiques.
Fini le stress des quotas quotidiens : Somake donne la liberté aux utilisateurs intensifs d’itérer sans blocage arbitraire.
Non, c’est le même modèle. « Nano Banana Pro » est simplement le nom marketing destiné au public pour l’architecture Gemini 3 Pro Image sous-jacente.
Pour garantir rapidité et stabilité, Somake limite actuellement à 3 images de référence par session.
Besoin d’utiliser les 14 images ? Option activable pour les partenaires entreprises. Contactez [email protected] pour en savoir plus.
Bien sûr ! Le modèle est optimisé pour toutes les écritures du monde, avec une excellente gestion des diacritiques et des caractères non-latins.
Oui. Le modèle prend en charge « l’édition par instruction », vous pouvez décrire les modifications à apporter (ex. « retirer la voiture ») sur une image uploadée.