Poznaj najnowszy model AI od Google do generowania obrazów, Nano Banana 2 (Gemini 3 pro).
Brak historii
Nie udało się wygenerować
Nano Banana Pro to komercyjna nazwa architektury Gemini 3 Pro Image. Premiera pod koniec 2025 roku przyniosła prawdziwą rewolucję – model przeszedł od typowego generowania obrazów w sposób losowy do "wizualnej syntezy opartej na rozumowaniu".
Dzięki fazie planowania poznawczego przed renderowaniem pikseli model pokonał ograniczenia w logice przestrzennej i typografii. Zaprojektowano go specjalnie do zadań na poziomie korporacyjnym, wymagających wysokiej wierności, ścisłego przestrzegania złożonych instrukcji i perfekcyjnego umieszczania tekstu w materiałach wizualnych.
Natyny silnik typograficzny: Generuje tekst bez błędów, idealnie wyrównany, w wielu językach – bez konieczności późniejszej obróbki.
Planowanie poznawcze: Model wykorzystuje "Tryb Myślenia", by sprawdzić logikę układu i poprawność faktów przed rozpoczęciem generowania.
Zaawansowane łączenie referencji: Przetwarza i łączy do 14 obrazów referencyjnych (Domyślnie: 3 obrazy na Somake, więcej po kontakcie ze wsparciem) dając precyzyjną kontrolę nad stylem i kompozycją.
Gotowe do produkcji: Eksportuje pliki natywnie w rozdzielczości 2K i 4K, przygotowane do druku i mediów cyfrowych.
Podstawienie kontekstu: Wykorzystuje szeroką wiedzę o świecie, tworząc wiarygodne diagramy oraz ilustracje techniczne.
W przeciwieństwie do starszych modeli traktujących tekst jako tło, Nano Banana Pro rozumie znaki i składnię. Potrafi idealnie odwzorować długie akapity, złożone nagłówki i nietypowe alfabetu, dzięki czemu to najlepszy wybór do tworzenia lokalnych materiałów marketingowych czy bogatych w dane plakatów.
Zaawansowany system referencyjny śledzi tożsamość postaci pomiędzy generacjami obrazów. Analizując nawet 14 wejść, zapewnia powtarzalność rysów twarzy aż dla 5 postaci oraz spójność stylistyczną – idealne, gdy tworzysz storyboardy lub maskotki.
Prompt: "obraz obrotu postaci o 360 stopni, stoi na białym tle."
Faza "Myślenia" pozwala modelowi rozumować i planować relacje przestrzenne, zamiast zgadywać. Dzięki temu powstają logiczne infografiki, poprawne proporcje sylwetki oraz prawidłowe oznaczenia na wykresach technicznych.
Prompt: "Stwórz infografikę wyjaśniającą jak działają słuchawki.”
Model został stworzony dla profesjonalistów – masz szeroką kontrolę nad kątem aparatu (np. efekt obiektywu 35mm), oświetleniem (np. światło obwodowe, miękkie światło główne) i korekcją kolorów. Obsługuje również lokalne edycje i "inpainting" bez utraty kontekstu oryginalnego obrazu.
Funkcja | Nano Banana | Nano Banana Pro |
Architektura | Szybka ścieżka przetwarzania (Prompt → Obraz). | Ścieżka z rozumowaniem (Prompt → Plan → Obraz). |
Zastosowanie | Szybkie pomysły, storyboardy, szkice do mediów społecznościowych. | Finalna produkcja, skomplikowane layouty, typografia. |
Szybkość | Optymalizacja pod szybkość i wiele iteracji. | Wolniejszy czas działania przez fazę poznawczą. |
Jakość tekstu | Krótkie teksty; możliwe błędy. | Duża precyzja; obsługuje akapity i różne pisma. |
Obrazy referencyjne | Ograniczone wejścia referencyjne. | Obsługa do 14 obrazów referencyjnych. |
Aby wykorzystać potencjał rozumowania modelu, prompt powinien wykraczać poza ogólne opisy – stawiaj na konkretne wytyczne.
Zalecana struktura:
Główny cel: Określ jasno typ zasobu (np. "Diagram techniczny").
Wizualne specyfikacje: Opisz aparat, światło, kompozycję (np. "Widok izometryczny, płaskie oświetlenie").
Specyfikacja tekstu: Wypisz treść i styl czcionki (np. "Tekst: 'PROMOCJA' pogrubioną czcionką Sans-Serif").
Ograniczenia: Wskaż, czego trzeba unikać lub przestrzegać (np. "Utrzymaj paletę marki #FF5733").
Szablon ekspercki:
[Typ zasobu] [Obiekt]. [Szczegóły kompozycji]. [Oświetlenie/styl]. [Treść tekstu]: "[Dokładny tekst]" (Czcionka: [Styl]).
Zakotwiczenie stylu (few-shot)
Narzucaj konkretną estetykę, opisując różne style i wybierając jeden.
Logika promptu: "Style referencyjne: A) Malarstwo olejne, B) grafika wektorowa. Zastosuj styl B do poniższej wizualizacji danych..."
Edycja etapowa
Użyj modelu do poprawy istniejących obrazów według instrukcji "diff".
Logika promptu: "Wejście: [Obraz]. Akcja: Zmień tło na 'Deszczowa noc'. Ograniczenie: Nie zmieniaj oświetlenia ani koloru skóry postaci."
Wizualizacja na danych
Zachowaj poprawność wykresu, podając surowe dane i konkretne etykiety.
Logika promptu: "Wygeneruj wykres słupkowy. Etykiety osi X: 'Q1, Q2, Q3'. Oś Y: 'Przychody'. Trend: Wzrostowy. Styl: minimalistyczny, korporacyjny."
Twórz ujęcia "Product Hero", umieszczając produkty w idealnych sceneriach. Model potrafi precyzyjnie wygenerować nazwę SKU lub ofertę promocyjną bezpośrednio na opakowaniu albo na tle – tekst zawsze jest czytelny i poprawny.
Zachowaj pełną spójność wizualną na wszystkich kanałach marketingowych. Dzięki mieszaniu referencji marki mają pewność, że ich maskotka czy ambasador wygląda identycznie na każdym wygenerowanym poście lub banerze.
Twórz złożone, opisane diagramy do podręczników i instrukcji. Model idealnie rozumie "etykiety", więc trafnie umieszcza strzałki i opisy przy odpowiednich częściach maszyny czy struktury biologicznej.
Automatyzuj odnawianie archiwów historycznych. Model potrafi naprawić rozdarcia, pokolorować czarno-białe zdjęcia na podstawie realnych palet z epoki oraz wyostrzyć szczegóły, zachowując przy tym tożsamość przedstawionych osób lub obiektów.
Prześlij szkic CAD jako obraz referencyjny – poproś o fotorealistyczne materiały i konkretne warianty oświetlenia do akceptacji przez interesariuszy.
Użyj jednego podstawowego promptu do plakatu, a następnie podmieniaj blok tekstowy na kolejne wersje językowe (np. hiszpański, japoński), zachowując pierwotny układ.
Określ postać przez obrazy referencyjne. Wygeneruj komiks z 3 kadrami, gdzie postać wykonuje różne czynności (bieganie, jedzenie, spanie) i wciąż wygląda tak samo.
Zalanie tekstem: Jeśli tekst wychodzi poza krawędzie, określ "strefę bezpieczną" lub zmniejsz czcionkę w promptcie (np. "Tekst w centralnych 50%").
Zanikanie tożsamości: Jeśli postać wygląda inaczej, dodaj precyzyjne cechy fizyczne (np. "Pieprzyk na lewym policzku, identyczne rysy twarzy").
Fikcyjne dane: Jeśli wykresy czy liczby się nie zgadzają, podaj w promptcie każdą etykietę – nie pozwalaj modelowi "wymyślać" danych; zawsze je dostarcz.
Rozmycie stylistyki: Jeśli styl nie jest spójny, zastosuj negatywny prompt by wykluczyć niepożądane efekty (np. "Bez elementów kreskówkowych, bez stylu renderów 3D").
Usuwamy wszelkie zawiłości związane z API. Wystarczy się zalogować, wybrać model i zacząć tworzyć.
Dostarczamy dedykowaną infrastrukturę, która omija przeciążenia i opóźnienia typowe dla darmowych publicznych wersji.
Koniec z dziennymi ograniczeniami – na Somake możesz iterować dowolnie często, bez sztucznych limitów.
Nie, to ten sam model. "Nano Banana Pro" to po prostu nazwa marketingowa Gemini 3 Pro Image skierowana do klientów.
Dla szybkiego działania i stabilności, Somake obecnie umożliwia przesłanie 3 obrazów referencyjnych na sesję.
Potrzebujesz pełnej opcji na 14 obrazów? Możemy to włączyć dla partnerów biznesowych – napisz do [email protected].
Jak najbardziej! Model świetnie radzi sobie z globalnymi alfabetami, znakami diakrytycznymi oraz pismem niełacińskim.
Tak. Model obsługuje edycję opartą o instrukcje – wystarczy opisać zmianę (np. "usuń samochód") wskazaną na przesłanym obrazie.