
Google ka paraqitur Binjakët 3Gjenerata e saj e re e modelit të inteligjencës artificiale është projektuar për të kombinuar arsyetimin e avancuar, kuptimin e kontekstit dhe aftësitë multimodale. Kompania e pozicionon atë si sistemin e saj më të aftë deri më sot, të projektuar për të interpretuar nuancat dhe për të zgjidhur detyra komplekse me më pak përpjekje.
Në vendosjen fillestare, aplikacioni Gemini dhe mjetet e zhvilluesit e integrojnë tashmë këtë version, ndërsa Modaliteti i Inteligjencës Artificiale në Kërkim Lançohet fillimisht në Shtetet e Bashkuara. Në Spanjë dhe pjesën tjetër të Evropës, Google po i jep përparësi aksesit përmes aplikacionit, API-t dhe shërbimeve cloud, së bashku me një zgjerim të gjuhëve për të përfshirë katalanishten, baskishten dhe galicianishten.
Çfarë sjell Binjakët 3 dhe pse është i rëndësishëm?
Gemini 3 kombinon në një sistem të vetëm përvojën e akumuluar të brezave të mëparshëm dhe një hap përpara. arsyetimi dhe kuptimi i kontekstitKompania pohon se modeli "kap të dhëna delikate" në idetë krijuese dhe i ndan problemet komplekse në shtresa, me përgjigje më të sakta dhe më pak nevojë për të riformuluar pyetjen.
Kjo qasje rezulton në përgjigje më koncize që i japin përparësi Informacion i dobishëm kundrejt klisheveKjo është një sjellje që Google e kishte testuar për të zvogëluar lajkat dhe për të përmirësuar saktësinë faktike. Për më tepër, natyra multimodale e modelit lejon punën me tekst, imazhe, audio dhe video në të njëjtin bashkëveprim.
Performanca në teste të pavarura dhe krahasuese
Sipas metrikave të publikuara nga Google dhe renditjeve publike, Gemini 3 Pro Ai kryeson LMArenën me 1.501 pikë ELO, duke tejkaluar paraardhësin e tij. Në vlerësimin akademik, ai arrin 37,5% pa mjete në Humanity's Last Exam dhe 91,9% në GPQA Diamond; në matematikë, ai shënon 23,4% në MathArena Apex.
Mënyra e përforcuar e arsyetimit Mendim i Thellë I çon këto rezultate edhe më tej, me 41,0% në Humanity's Last Exam dhe 93,8% në GPQA Diamond. ARC-AGI-2, me ekzekutimin e kodit, regjistron 45,1%, një tregues i progresit në arsyetimin abstrakt dhe të kuptuarit vizual.
Multimodaliteti dhe një dritare e madhe konteksti në Gemini 3
Një nga ndryshimet e mëdha është dritarja e kontekstit të 1 milion argumenteKjo lehtëson analizën e depove të gjera të kodit, punimeve ose videove të gjata. Modeli mund, për shembull, të përkthejë dhe unifikojë recetat e shkruara me dorë për të krijuar një libër gatimi familjar, ose të konvertojë materiale komplekse në vizualizime dhe karta interaktive.
Leximi multimodal reflektohet në teste të tilla si MMMU-Pro (81%) dhe Video-MMMU (87,6%), dhe në SimpleQA Verified (72,1%), ku fokusi është në saktësi më të madhe faktike. Në Modalitetin IA, të integruar në Kërkim, Google mëson elementë interaktivë - siç janë widget-et dhe simulimet - për të shpjeguar konceptet menjëherë.
Programimi dhe agjentët: shtysa për Antigravitet
Në detyrat e zhvillimit, Binjakët 3 udhëheqin WebDev Arena me 1.487 ELOAi arrin një rezultat prej 54,2% në Terminal-Bench 2.0 dhe një rezultat prej 76,2% në SWE-bench Verified, gjë që përkthehet në një kompetencë më të madhe në gjenerimin e kodit, përdorimin e mjeteve dhe operimin e një mjedisi terminal.
Karakteristika më e dukshme e re për agjentët e ndërtimit është Antigraviteti i GoogleKjo platformë u jep agjentëve qasje në redaktues, terminal dhe shfletues. Me këtë, sistemi mund të planifikojë dhe ekzekutojë rrjedha pune të softuerit nga fillimi në fund, duke validuar kodin e vet dhe duke ia lënë shqyrtimin dhe auditimin përfundimtar zhvilluesit.
Siguria, testimi i jashtëm dhe vendosja e përgjegjshme
Google pretendon se kjo është e saja Modeli më i sigurt deri më sotËshtë i përforcuar ndaj lajkatimeve dhe më rezistent ndaj injeksioneve të menjëhershme dhe keqpërdorimit (p.sh., sulmeve kibernetike). Vlerësimi është pjesë e Kornizës së saj të Sigurisë Kufitare dhe është shqyrtuar nga ekspertë të jashtëm, përfshirë AISI e Mbretërisë së Bashkuar dhe firma si Apollo, Vaultis dhe Dreadnode.
mënyrë Mendim i Thellë Ai i nënshtrohet një validimi shtesë përpara se të arrijë te abonentët e Google AI Ultra, për shkak të fushëveprimit të aftësive të tij të planifikimit dhe përdorimit të mjeteve. Kompania thekson një shpërndarje graduale dhe të matur në të gjitha produktet dhe rajonet.
Disponueshmëria e Binjakëve 3
El Pamje paraprake e Gemini 3 Pro Është i arritshëm në aplikacionin Gemini dhe nëpërmjet API-t të zhvilluesit përmes AI Studio dhe Vertex AI. Ndërfaqja shton 30 gjuhë të reja, duke përfshirë Katalanisht, Baskisht dhe Galikisht, gjë që lehtëson miratimin e saj në kontekste lokale.
El Modaliteti i Inteligjencës Artificiale në Kërkim Fillon në Shtetet e Bashkuara dhe do të zgjerohet gradualisht; ndërkohë, kompanitë dhe ekipet teknike mund ta integrojnë Gemini 3 në rrjedhat e tyre të punës me Vertex AI dhe Gemini Enterprise, përveç CLI-së së re dhe platformës Antigravity për agjentët.
Rastet e përdorimit: nga të mësuarit më mirë te automatizimi i detyrave
Përtej bisedës, modeli mund të transformojë përmbajtje komplekse në përvojat interaktive me grafikë, kalkulatorë ose simulime. Është i dobishëm për të studiuar koncepte teknike, për të analizuar ndeshje sportive dhe për të propozuar plane stërvitjeje, ose për të analizuar punimet dhe për të gjeneruar udhëzues të lundrueshëm.
Në punën e tyre të përditshme, agjentët mund të klasifikoni email-in e Gmail-it, planifikoni udhëtime ose ekzekutoni detyra me shumë hapa duke kombinuar arsyetimin, thirrjet e mjeteve dhe kontrollin e shfletuesit, gjithmonë me mbikëqyrje njerëzore për të ruajtur kontrollin.
Google pohon se ndikimi i Gemini po rritet: Mbërrin "View i mundësuar nga IA" 2.000 milion përdorues në muajAplikacioni i Gemini tejkalon 650 milionë shkarkime mujore, 70% e klientëve të cloud përdorin aftësitë e tij të inteligjencës artificiale dhe 13 milionë zhvillues kanë ndërtuar zgjidhje me modelet e tij. Këto shifra mbështesin vendosjen e Gemini 3 brenda ekosistemit të produktit.
Me fokusin e tij në arsyetim, multimodalitet dhe agjentë, Binjakët 3 Po shfaqet si baza e përbashkët e strategjisë së IA-së të Google: një platformë më e drejtpërdrejtë, më pak akomoduese me më shumë kontekst, të cilën në Spanjë mund ta filloni ta përdorni nga aplikacioni Gemini dhe, nëse e zhvilloni, nga AI Studio dhe Vertex AI; Kërkimi në Modalitetin AI do të aktivizohet nga tregu.
