„Google“ žengė naują žingsnį savo dirbtinio intelekto strategijoje, pristatydama... Nano bananas 2, taip pat identifikuotas kaip Gemini 3.1 blykstės vaizdasTai vaizdų generavimo ir redagavimo modelis, kuriuo siekiama sumažinti atotrūkį tarp reagavimo greičio ir vaizdo kokybės. Įmonė siekia, kad turinio kūrėjai galėtų dirbti su vaizdais beveik realiuoju laiku neprarandant išsamių, profesionaliame kontekste naudojamų rezultatų.
Pristatymas įvyko po pirmojo „Nano Banana“ ir Nano Banana ProŠios versijos jau įtvirtino „Google“ pozicijas dirbtinio intelekto valdomos vizualinės generacijos srityje. Su šia nauja versija bendrovė stato ant modelio, kuris anksčiau „aukštos klasės“ laikytas funkcijas perkelia į daug lankstesnį darbo eigą, skirtą vartotojai, kurie dažnai generuoja vaizdus, nuo rinkodaros komandų iki nepriklausomų kūrėjų ir įmonių, veikiančių Europoje ir kitose rinkose.
Kas yra „Nano Banana 2“ ir kokį vaidmenį jis atlieka „Gemini“ ekosistemoje?
„Google“ apibūdina „Nano Banana 2“ kaip pažangiausią vaizdo gavimo modelį iki šiol Dvynių aplinkaUnikali jo savybė yra ta, kad jis sukurtas naudojant „Flash“ architektūrą, kuri orientuota į labai greitą reagavimo laiką. Tikslas – kad įrankis ne tik sukurtų akį traukiančias kompozicijas, bet ir sklandžiai integruotųsi į darbo eigą, kurioje svarbi kiekviena sekundė.
Praktiškai bendrovė tvirtina, kad „Nano Banana 2“ paveldi „Nano Banana Pro“ pasaulio žinias, samprotavimus ir vizualinį tikslumą.Tačiau tai derina juos su „Flash“ modelių greičiu. Tai leistų jums sugeneruoti arba redaguoti vaizdus per kelias sekundes, o tai ypač aktualu tiems, kurie dirba su nuolatiniais iteracijų procesais, A/B testavimu ar greitomis peržiūromis su klientais ir komandomis, išsibarsčiusiomis skirtingose šalyse.
Naujasis modelis skirtas tiek kūrimas nuo nulio kaip esamų medžiagų redagavimas„Google“ pabrėžia, kad pakeitimus, koregavimus ar variantus galima pritaikyti nereikalaujant ilgo laukimo kiekvienam pakeitimui, o tai atitinka įprastas užduotis agentūrose, komunikacijos skyriuose ar mažose įmonėse, kurios valdo savo vaizdinį turinį.
Be to, bendrovė „Nano Banana 2“ pozicionuoja kaip pagrindinę savo generatyvinės dirbtinio intelekto strategijos dalį: ji integruota į vartojimo produktus ir kūrėjų įrankius, siekiant, kad tas pats modelis būtų mobiliųjų įrenginių, naršyklių ir verslui skirtų debesų kompiuterijos sistemų patirties pagrindas.
Pasaulio žinios ir pagalba ieškant internete
Vienas iš „Nano Banana 2“ ramsčių yra tai, kaip ji panaudoja „Gemini“ žinių bazę.„Google“ teigimu, modelis gali remtis realia informacija ir vaizdais iš... Realaus laiko žiniatinklio paieška tiksliau pavaizduoti sąvokas, objektus ar konkrečias scenas.
Šis ryšys su žiniatinkliu leidžia generuoti vaizdus, labiau atitinkančius dabartinį kontekstą, o tai naudinga infografika, informatyvus turinys arba duomenų vizualizacijos kurie turi atspindėti konkrečias situacijas. Žiniasklaidos priemonėms, specializuotiems tinklaraščiams ar institucijų komunikacijos skyriams Europoje ši funkcija gali palengvinti naujienų, ataskaitų ir pristatymų iliustravimą, nereikalaujant kaskart pradėti nuo nulio.
„Google“ pažymi, kad šis gilesnis supratimas taip pat padeda konvertuoti užrašus į diagramas, metmenis ir aiškinamąsias lentelesKitaip tariant, modelis ne tik „remiasi“ bendriniu aprašymu, bet ir bando informaciją struktūrizuoti vizualiai aiškiai, o tai ypač įdomu švietimo, įmonių mokymo ar techninės dokumentacijos srityse.
Šiuo požiūriu bendrovė siekia atskirti „Nano Banana 2“ nuo kitų modelių, kuriuose dėmesys sutelktas tik į estetinį poveikį. Idėja ta, kad įrankį galima naudoti tiek meninei kūrybai, tiek... vaizdinė medžiaga, lydinti sudėtingus duomenis, procesus ar sąvokas, sustiprindamas savo patrauklumą organizacijoms, kurios reguliariai dirba su ataskaitomis ir analize.
Patobulintas teksto tvarkymas vaizduose, vertimas ir lokalizavimas
Viena iš labiausiai aptarinėjamų dirbtinio intelekto vaizdų generavimo problemų tradiciškai buvo teksto apdorojimas integruotas į patį vaizdąkur raidžių ar žodžių klaidos gali sugadinti kitaip galiojantį dizainą. „Google“ teigia, kad „Nano Banana 2“ išsprendžia šią problemą gerokai pagerindama kokybę.
Remiantis pateikta informacija, modelis gali generuoti įskaitomą ir rišlų tekstą rinkodaros maketuose, plakatuose, kortelėse ar reklaminėse juostoseTai sumažina nepavykusių bandymų dėl rašybos klaidų skaičių. Tai gali būti ypač naudinga mažoms komandoms, kurios neturi atskiro dizaino skyriaus ir kurioms reikia greitai gauti funkcionalius rezultatus.
Be šių galimybių, yra galimybė Išverskite ir lokalizuokite tekstą tiesiai paveikslėlyjeKitaip tariant, sistema ne tik atpažįsta nuotraukoje ar kompozicijoje esantį tekstą, bet ir leidžia jį pritaikyti skirtingoms kalboms, nereikalaujant iš naujo kurti kūrinio nuo nulio. Europos kampanijoms keliose rinkose ši funkcija gali sutaupyti laiko ir supaprastinti kultūrinį bei kalbinį adaptacijos procesą.
Tokiose srityse kaip e. prekyba, turizmas ar internetiniai mokymai, šis derinys skaitomas tekstas, vertimas ir lokalizavimas Siekiama lankstesnių darbo eigų. Tas pats kūrybinis darbas galėtų būti pakartotinai panaudotas keliose šalyse, pritaikant tekstus ir pranešimus pasitelkiant dirbtinį intelektą, užuot iš naujo kuriant ištisus dizainus kiekvienai kalbai.
Visa tai leisdama „Nano Banana 2“ save pozicionuoti kaip įrankį, bandantį sumažinti vieną iš klasikinių generatyviosios vaizdininkystės problemų: poreikį kreiptis į išorinius redaktorius, kad būtų galima nušlifuoti ar pataisyti kompozicijoje esantį tekstą.
Vizualinis nuoseklumas, instrukcijų laikymasis ir išvesties kokybė
Kita svarbi reklamos dalis skirta Kūrybinė kontrolė ir vizualinis nuoseklumas„Google“ teigia, kad „Nano Banana 2“ gali išlaikyti panašumą iki penki simboliai toje pačioje darbo eigoje ir laikytis tikslumo iki keturiolika objektųkad jie smarkiai nepasikeistų nuo vieno paveikslėlio prie kito.
Šis pajėgumas skirtas tokiems tikslams kaip siužetinės lentos, scenos po scenos pasakojimai, reklamos kampanijos arba nuoseklių vizualinių visatų kūrimasTokiais atvejais personažo ar produkto išvaizda, keičianti nuo vienos panelės iki kitos, gali sugadinti patirtį, todėl vizualinio tęstinumo akcentavimas yra ypač aktualus prekių ženklams ir kūrybiniams projektams.
Bendrovė taip pat atkreipia dėmesį į pagerėjimą, vykdydami sudėtingas instrukcijasModelis būtų geriau pasirengęs interpretuoti raginimų niuansus – nuo stiliaus užuominų iki išsamių kompozicijos, apšvietimo ar kadravimo apribojimų – ir tiksliau atitiktų naudotojų lūkesčius. Tai turėtų reikšti, kad norint pasiekti patenkinamą rezultatą, reikės atlikti mažiau iteracijų.
Techniniu požiūriu „Nano Banana 2“ siūlo kraštinių santykio valdymas ir skiriamosios gebos diapazonas nuo 512 pikselių iki 4KTai leidžia pritaikyti tą patį kūrybinį elementą vertikaliems, horizontaliems arba panoraminiams formatams, apimantiems viską – nuo greitų socialinių tinklų įrašų iki tapetų ar medžiagų, skirtų didelės raiškos ekranams.
„Google“ tvirtina, kad modelis pateikia bendras vizualinio tikslumo pagerėjimasDėl sodresnio apšvietimo, geriau apibrėžtų tekstūrų ir ryškesnių detalių siekiama, kad „Blykstės“ režimas būtų suvokiamas ne kaip „sutaupymo“ parinktis, o kaip greita alternatyva, galinti užtikrinti ir aukštos kokybės rezultatą. Tokiuose sektoriuose kaip elektroninė prekyba ar institucinė komunikacija šis greičio ir kokybės derinys gali iš esmės pakeisti kasdienį darbą.
Prieinamumas „Google“ produktuose ir tarptautinis diegimas
„Nano Banana 2“ paskelbimas neapsiriboja izoliuota testavimo aplinka. „Google“ išsamiai aprašo platų diegimą visoje savo ekosistemoje, kuris prasideda nuo Dvynių programa ir apima kelias pagrindines jos paslaugas.
„Gemini“ programėlėje „Nano Banana 2“ Jis pakeis „Nano Banana Pro“ greitojo, mąstymo ir profesionaliojo režimuose.kad naujasis modelis taptų standartiniu pasirinkimu tiems, kurie generuoja vaizdus iš asistento. Tačiau bendrovė patikslina, kad prenumeratoriai „Google“ dirbtinio intelekto profesionalas ir Ultra Jie ir toliau turės prieigą prie „Nano Banana Pro“ specializuotoms užduotims atlikti, prireikus pasiekdami ją iš vaizdo regeneravimo parinkčių.
Modelis taip pat atvyksta į „Google“ paieška naudojant dirbtinio intelekto režimą ir objektyvątiek oficialioje programėlėje, tiek mobiliųjų ir stalinių kompiuterių naršyklėse. „Google“ pabrėžia, kad prieinamumas plečiamas iki 141 nauja šalis ir teritorija jau aštuonios papildomos kalbosTai sustiprina jos, kaip masinio naudojimo įrankio, potencialą ne tik konkrečiose rinkose.
Plėtros ir debesijos sektoriuje „Nano Banana 2“ siūlomas AI Studio ir per Gemini API Peržiūros versijoje įmonės ir kūrėjai gali integruoti vaizdų generavimą į savo programas. Tai taip pat įtraukta į „Google Cloud“ naudojant „Vertex AI“ preliminariame etape atveriant duris projektams, kuriems reikia plėsti vizualinį kūrimą iš įmonės debesyje talpinamos infrastruktūros.
Be to, „Google“ nurodo, kad „Nano Banana 2“ taps... numatytasis vaizdų generavimo modelis „Flow“Jo įrankis, skirtas kūrybiniams darbo eigoms ir kai kuriais atvejais audiovizualinei produkcijai, yra prieinamas visiems „Flow“ vartotojams be jokių papildomų išlaidų kreditais. Reklamos srityje modelis yra integruotas į "Google" Skelbimai pagerinti grafinių kūrybinių sprendimų pasiūlymus kuriant kampanijas, o tai gali turėti tiesioginės įtakos agentūrų ir reklamuotojų darbui Ispanijoje ir visoje Europoje.
Sukurto turinio skaidrumas, kilmė ir saugumas
Be kūrybinių funkcijų, „Google“ dalį skelbimo skiria dirbtinio intelekto sukurto turinio kilmė ir patikrinimas, vis jautresnis klausimas reguliavimo institucijoms, vartotojams ir Europos žiniasklaidai.
Bendrovė paaiškina, kad ji sujungia technologiją, SynthID vandens ženklas su standartu pagrįstais turinio įgaliojimais C2PATaigi, naudojant „Nano Banana 2“ sugeneruoti vaizdai apima nematomus signalus ir standartizuotus metaduomenis, kurie leidžia mums sužinoti, ar juos kuriant buvo naudojamas dirbtinis intelektas, o kai kuriais atvejais – ir informaciją apie naudotą modelį bei generavimo kontekstą.
„Google“ nurodo, kad buvo panaudota „Gemini“ programėlės „SynthID“ patvirtinimo funkcija. daugiau nei 20 milijonų kartų nuo lapkričio mėnesioTai leidžia suprasti, kodėl domimasi vizualinio turinio kilmės nustatymu. Bendrovė taip pat paskelbė apie ketinimą integruoti C2PA patikrą į programą, taip stiprindama atsekamumą, atsižvelgdama į Europoje vykstančias reguliavimo diskusijas dėl sintetinio turinio.
Šis skaidrumo akcentavimas atitinka įmonių, viešojo administravimo institucijų ir žiniasklaidos poreikį aiškiau nustatyti, kada vaizdas yra iš dirbtinio intelekto modelio. Aplinkoje, kurioje vizualinis turinys sparčiai plinta socialinėje žiniasklaidoje ir skaitmeninėse platformose, ženklinimo ir tikrinimo mechanizmai tapo labai svarbūs pasitikėjimui kurti.
Apskritai „Google“ strategija su Nano bananas 2 Jis apjungia kelis lygmenis: viena vertus, greitį, kokybę ir kūrybinę kontrolę; kita vertus, integraciją į kasdienius produktus ir profesionalius įrankius; ir, be to, kilmės priemones, skirtas scenarijui, kai dirbtinio intelekto sukurtas turinys bus vis labiau matomas kasdieniame gyvenime ir ekonominėje veikloje Ispanijoje, Europoje ir kitose rinkose.