TL;DR
Gemini 3 Pro stellt einen wichtigen Fortschritt in Googles KI-Entwicklung dar. Das Modell bietet deutlich höhere Benchmark-Leistungen, verbesserte Reasoning-Fähigkeiten, tiefere Multimodalität und neue Funktionen wie Deep Think, Generative UI und die agentenbasierte Entwicklungsplattform Antigravity.
Es ermöglicht eine leistungsfähigere, präzisere und flexiblere Nutzung von KI – sowohl für Entwickler als auch für Unternehmen und Endnutzer.
Am 18. November 2025 stellte Google seine nächste Generation von KI-Modellen vor. Viele aus der Tech-Community verfolgten die Vorstellung, interessiert zu sehen, welchen Fortschritt das Unternehmen diesmal präsentieren würde. Mit Gemini 3 zeigte Google ein Modell, das auf nachvollziehbare Weise an frühere Entwicklungen anknüpft und in mehreren Bereichen spürbare Verbesserungen liefert.
Demis Hassabis, CEO von Google DeepMind, und Koray Kavukcuoglu präsentierten nicht einfach ein neues Modell. Sie enthüllten eine Vision, in der KI vom Werkzeug zum Partner wird. „Es ist erstaunlich zu sehen, dass KI in nur zwei Jahren von einfachem Lesen von Text und Bildern zu echtem Verständnis des Kontexts fortgeschritten ist“, erklärte Sundar Pichai in seinem Blogpost.
Der Durchbruch in Zahlen: Was die Benchmarks zeigen
Die ersten unabhängigen Tests ließen die Tech-Community aufhorchen. Gemini 3 Pro erreichte 1501 Elo-Punkte auf der LMArena-Bestenliste, als erstes Modell überhaupt, das die mythische 1500-Punkte-Schwelle durchbrach. Doch die wahre Geschichte verbirgt sich hinter anderen Zahlen.
Wo Gemini 3 Pro brilliert
Bei „Humanity’s Last Exam“, einem Benchmark mit 2.500 extrem anspruchsvollen Fragen aus über hundert Fachgebieten, erzielte Gemini 3 Pro 37,5 Prozent korrekte Antworten, ohne jegliche Hilfswerkzeuge. Zum Vergleich: GPT-5.1 erreichte 26,5 Prozent, Claude Sonnet 4.5 lediglich 13,7 Prozent. Die wahre Sensation zeigte sich jedoch bei GPQA Diamond, einem Test mit Fragen auf Doktorandenniveau aus Physik, Chemie und Biologie. Mit 91,9 Prozent korrekten Antworten übertraf Gemini 3 Pro sowohl GPT-5.1 (88,1 Prozent) als auch Claude Sonnet 4.5 (83,4 Prozent).
Bei MathArena Apex, das besonders schwierige Mathematikwettbewerbs-Aufgaben stellt, demonstrierte Gemini 3 Pro seine außergewöhnliche Leistung mit 23,4 Prozent Erfolgsquote , während Gemini 2.5 Pro nur 0,5 Prozent erreichte und GPT-5.1 bei 1,0 Prozent landete.
Der visuelle Intelligenzsprung
Die größte Überraschung kam bei ARC-AGI-2, einem visuellen Reasoning-Benchmark. Mit 31,1 Prozent ließ Gemini 3 Pro seine Vorgängerversion (4,9 Prozent) und die Konkurrenz weit hinter sich. GPT-5.1 erreichte 17,6 Prozent, Claude Sonnet 4.5 kam auf 13,6 Prozent. „Das ist kein inkrementeller Fortschritt“, kommentierte ein Entwickler auf Twitter. „Das ist ein Quantensprung in der Art, wie KI visuelle Informationen verarbeitet.“
Deep Think: Die Denkmaschine in der Denkmaschine
Doch Google hatte noch ein Ass im Ärmel. Gemini 3 Deep Think erweitert das Basismodell um einen erweiterten Reasoning-Modus, der bei komplexen Problemen noch mehr interne Rechenschritte durchführt. Die Ergebnisse sprechen für sich: Bei Humanity’s Last Exam steigerte Deep Think die Genauigkeit auf 41,0 Prozent. Bei GPQA Diamond wurden beeindruckende 93,8 Prozent erreicht. Bei ARC-AGI-2 mit Code-Ausführung kam das Modell auf 45,1 Prozent.
„Frühere Modelle verloren den Faden ab etwa Schritt fünf oder sechs komplexer Gedankenketten“, erklärte Demis Hassabis. „Gemini 3 kann zuverlässig 10 bis 15 kohärente logische Schritte durchführen.“
Die technische Revolution unter der Haube
Multimodalität als Grundprinzip
Gemini 3 Pro wurde von Grund auf für die gleichzeitige Verarbeitung verschiedener Datentypen entwickelt. Das Kontextfenster von 1 Million Token ermöglicht die Analyse kompletter Codebases, mehrstündiger Videotranskripte oder umfangreicher Dokumentensammlungen. Ein Entwickler berichtete auf Simon Willisonss Blog von einem beeindruckenden Test: Er fütterte Gemini 3 Pro mit der kompletten 3,5-stündigen Audioaufnahme einer Stadtratssitzung, einer 74 MB großen Audiodatei (Standardformat wie M4A). Das Modell generierte ein vollständiges Markdown-Transkript mit bemerkenswerter Genauigkeit.
Vibe Coding: Von der Idee zur App in Minuten
„Gemini 3 ist unser bestes Vibe-Coding-Modell, das wir je entwickelt haben“, verkündete Josh Woodward, VP bei Google Labs. Vibe Coding bezeichnet die Fähigkeit, aus natürlichsprachlichen Beschreibungen funktionsfähige Anwendungen zu generieren. Bei Terminal-Bench 2.0, das die Fähigkeit eines Modells testet, einen Computer über das Terminal zu bedienen, erreichte Gemini 3 Pro 54,2 Prozent. Bei SWE-bench Verified, das Coding-Agenten misst, übertraf es mit 76,2 Prozent deutlich Gemini 2.5 Pro.
Google Antigravity: Die Zukunft der Softwareentwicklung
Am selben Tag präsentierte Google eine weitere Sensation: Google Antigravity, eine vollständig neue agentenbasierte Entwicklungsplattform.
Das Konzept hinter Antigravity
Statt KI als Werkzeug in die Entwicklungsumgebung einbetten, dreht Antigravity das Paradigma um: Der Agent steht im Mittelpunkt und Editor, Terminal und Browser sind in ihn integriert. „Wir ermöglichen Entwicklern, auf einer höheren, aufgabenorientierten Ebene zu arbeiten“, erklärt das Antigravity-Team. Entwickler agieren als Architekten, während intelligente Agenten autonom über Editor, Terminal und Browser hinweg komplexe Softwareaufgaben planen und ausführen.
Ein beeindruckendes Demo-Video zeigt, wie Gemini 3 in Antigravity einen kompletten Flight-Tracker von Grund auf entwickelt – inklusive Planung, Programmierung und Validierung der Ausführung über browserbasierte Computer-Nutzung.
Die frühen Reaktionen
JetBrains berichtete von über 50 Prozent Verbesserung bei gelösten Coding-Benchmark-Aufgaben im Vergleich zu Gemini 2.5 Pro. GitHub testete Gemini 3 Pro in frühen Experimenten und stellte eine 35 Prozent höhere Genauigkeit bei der Lösung von Software-Engineering-Herausforderungen fest.
Antigravity ist während der öffentlichen Vorschauphase kostenlos verfügbar für macOS, Windows und Linux. Bemerkenswert: Entwickler können zwischen Gemini 3 Pro, Anthropics Claude Sonnet 4.5 und OpenAIs GPT-OSS-Modellen wählen.
Generative UI: Wenn die KI Benutzeroberflächen erschafft
Eine der revolutionärsten Funktionen von Gemini 3 ist die Fähigkeit zur Erstellung generativer Benutzeroberflächen. Statt einfache Textantworten zu liefern, entwirft Gemini 3 komplette, interaktive Erlebnisse.
Dynamic View und Visual Layout
Google führte zwei experimentelle Modi ein:
Dynamic View gestaltet und programmiert vollständig angepasste interaktive Antworten für jede Anfrage. Das System versteht, dass die Erklärung des Mikrobioms für ein fünfjähriges Kind völlig anders aussehen muss als für einen Erwachsenen.
Visual Layout erstellt immersive Ansichten im Magazin-Stil mit Fotos, Modulen, Schiebereglern und Filtern, die eine weitere Anpassung der Ergebnisse ermöglichen.
Ein Beispiel aus der Praxis: Fragt man Gemini 3 nach einem Hypothekenrechner, liefert es nicht einfach Formeln oder Links. Stattdessen generiert es einen vollständig funktionsfähigen Rechner mit Schiebereglern für Zinssätze und Anzahlungen, der sofort einsatzbereit ist.
Die Integration im Google-Ökosystem
AI Mode in der Suche: Der neue Standard
Erstmals veröffentlichte Google ein Gemini-Modell am ersten Tag direkt in der Suche. AI Mode erreicht über 2 Milliarden monatliche Nutzer, die Gemini-App selbst 650 Millionen. Zahlende Abonnenten von Google AI Pro (20 Dollar monatlich) und Ultra (250 Dollar monatlich) erhalten sofortigen Zugang zu Gemini 3 in AI Mode. Das System nutzt fortgeschrittene „Query Fan-Out“-Techniken, um differenziertere Zusatzsuchen durchzuführen und die finale Antwort zu verbessern.
Google plant, die automatische Modellauswahl in der Suche bald zu aktualisieren, sodass anspruchsvolle Fragen an Gemini 3 geleitet werden, während einfache Aufgaben weiterhin von schnelleren Modellen bearbeitet werden.
Für Entwickler und Unternehmen
Gemini 3 Pro ist verfügbar über:
- Google AI Studio für schnelles Prototyping
- Vertex AI für Unternehmensanwendungen
- Gemini CLI für Kommandozeilen-Integration
- Google Antigravity für agentenbasierte Entwicklung
- Gemini Enterprise für Teams
Zu den frühen Unternehmenskunden gehören Box, Cursor, Figma, Shopify und Thomson Reuters.
Der Preis der Innovation
API-Preisgestaltung
Während der Vorschauphase kostet Gemini 3 Pro:
- 2 Dollar pro 1 Million Eingabe-Token
- 12 Dollar pro 1 Million Ausgabe-Token (für Anfragen bis 200.000 Token)
Für größere Kontexte über 200.000 Token steigen die Preise auf 4 Dollar (Eingabe) und 18 Dollar (Ausgabe) pro Million Token. Im Vergleich: Gemini 2.5 Pro kostete 1,25 Dollar für die Eingabe und 10 Dollar für die Ausgabe. Die höheren Preise von Gemini 3 Pro spiegeln die deutlich erweiterten Fähigkeiten wider.
Was bedeutet das in der Praxis?
Ein Entwickler teilte seine Erfahrungen: Bei einem Support-Chatbot, der täglich 5.000 Anfragen bearbeitet, konnte er durch Optimierung der System-Prompts von 800 auf 250 Token die täglichen Kosten um 25 Prozent senken. Für Code-Generierung berichtete er von durchschnittlich 6.500 Eingabe-Token (Anforderungen und Code-Schnipsel) und 1.800 Ausgabe-Token pro Anfrage. Durch Aufteilung großer Aufgaben in kleinere, zielgerichtete Anfragen reduzierte er den Tokenverbrauch um 30 Prozent.
Die realen Anwendungen
In der Medizin
Krankenhäuser nutzen Gemini 3 Pro zur Analyse von Röntgenbildern und MRT-Scans, um schnellere Diagnosen zu unterstützen. Die multimodalen Fähigkeiten ermöglichen die gleichzeitige Verarbeitung von Bilddaten, Patientenakten und medizinischer Literatur.
In der Softwareentwicklung
GitHub berichtete von einer 35-prozentigen Genauigkeitssteigerung bei der Lösung von Software-Engineering-Herausforderungen. Entwickler nutzen Gemini 3 Pro für:
- Automatische Code-Reviews
- Generierung von Testfällen
- Refactoring komplexer Legacy-Systeme
- Erstellung technischer Dokumentation
In der Bildung
Universitäten in den USA erhalten ein kostenloses Jahr Google AI Pro, um Studenten Zugang zu Gemini 3 zu ermöglichen. Professoren berichten von interaktiven Physik-Simulationen und maßgeschneiderten Lernoberflächen, die sich automatisch an das Niveau der Studenten anpassen.
Die Stimmen aus der Community
Simon Willison, ein angesehener Entwickler und Blogger, schrieb nach seinen ersten Tests: „Gemini 3 fühlt sich an wie Gemini 2.5, das auf das Niveau der führenden Konkurrenzmodelle aufgerüstet wurde. Die eigenberichteten Zahlen von Google zeigen es leicht vor Claude 4.5 Sonnet und GPT-5.1 bei den meisten Standardbenchmarks.“
Ein Nutzer auf LMArena kommentierte: „Das Bemerkenswerte ist nicht nur die rohe Leistung, sondern dass Gemini 3 konsistenter bleibt. Es hält komplexe Gedankengänge über mehr Schritte hinweg aufrecht.“ Auf Reddit teilte ein Entwickler: „Ich fütterte Gemini 3 Pro mit einer mittleren Spezifikation und bat um ein TypeScript-Modul. Die Qualität war beeindruckend, aber ich stellte fest, dass kleinere, zielgerichtete Anfragen kostengünstiger waren.“
Datenschutz und Sicherheit: Googles Versprechen
Google betont mehrere Sicherheitsaspekte:
Unternehmensdaten: Bei Nutzung über Vertex AI haben Kunden volle Kontrolle über Datenspeicherort und -verarbeitung. Google versichert, dass Kundendaten nicht zum Training öffentlicher Modelle verwendet werden.
Safety Testing: Vor der Freigabe von Gemini 3 Deep Think für Google AI Ultra-Abonnenten durchläuft das Modell umfangreiche Sicherheitstests durch externe Prüfer.
Transparenz: Google dokumentiert die Einschränkungen der Modelle und arbeitet kontinuierlich an der Reduzierung von Verzerrungen und problematischen Ausgaben.
Der Wettbewerb schläft nicht
Gemini 3 vs. GPT-5.1
OpenAIs GPT-5.1 bleibt ein starker Konkurrent mit Stärken in kreativer Textgenerierung. Die 400.000-Token-Kontextgröße ist solide, aber Gemini 3 Pros 1-Million-Token-Fenster bietet Vorteile für umfangreiche Dokumentenanalysen. Preislich ist GPT-5.1 mit 1,25 Dollar Eingabe und 10 Dollar Ausgabe pro Million Token günstiger – allerdings nur für kleinere Kontexte.
Gemini 3 vs. Claude Sonnet 4.5
Anthropics Claude zeichnet sich durch besonders nuancierte und sichere Ausgaben aus. In Benchmarks wie GPQA Diamond liegt Gemini 3 Pro jedoch deutlich vorn (91,9 Prozent vs. 83,4 Prozent). Claude-Nutzer schätzen die langen, kohärenten Textausgaben, während Gemini 3-Nutzer die stärkere multimodale Integration bevorzugen.
Was kommt als Nächstes?
Google kündigte an, weitere Modelle der Gemini 3-Serie in Kürze zu veröffentlichen. Die Community spekuliert über:
- Gemini 3 Flash für schnellere, kosteneffiziente Anfragen
- Spezialisierte Varianten für bestimmte Branchen
- Erweiterte Reasoning-Modi über Deep Think hinaus
Gemini 3 Deep Think wird in den kommenden Wochen für Google AI Ultra-Abonnenten (250 Dollar monatlich) verfügbar sein, nachdem die Sicherheitstests abgeschlossen sind.
Fazit: Ein wichtiger Schritt in der Weiterentwicklung von KI
Gemini 3 Pro markiert mehr als nur ein Upgrade. Es repräsentiert einen grundlegenden Wandel in der Art, wie KI-Systeme arbeiten, von reaktiven Antwortgebern zu proaktiven Problemlösern. Die Kombination aus überragender Benchmark-Leistung, nativer Multimodalität, revolutionärer Agentenarchitektur und sofortiger Verfügbarkeit für Milliarden von Nutzern macht Gemini 3 zu einem der bedeutendsten KI-Releases des Jahres 2025.
Für Entwickler bedeutet Gemini 3, dass die Grenzen zwischen Idee und Umsetzung weiter verschwimmen. Für Unternehmen eröffnet es neue Möglichkeiten der Automatisierung und Effizienzsteigerung. Für Endnutzer könnte es den Weg zu einer KI ebnen, die nicht nur versteht, was wir sagen, sondern auch, was wir meinen.
Mit all den rasanten Entwicklungen im Jahr 2025 ist es kaum möglich, einen klaren KI-Marktführer zu bestimmen , und die kommenden Tage und Monate werden mit Sicherheit noch weitere bedeutende Durchbrüche bringen.
Wenn Sie mit einem der innovativsten KI- und Automatisierungspartner arbeiten möchten, und bereit sind, Ihr Unternehmen durch moderne, intelligente Workflows auf das nächste Level zu bringen , dann kontaktieren Sie uns. Gemeinsam gestalten wir Ihre digitale Transformation.
HINWEIS: Alle in diesem Artikel genannten Zahlen, Benchmarks und Fakten basieren auf verifizierten Quellen und offiziellen Ankündigungen. Preise und Verfügbarkeiten können sich ändern , aktuelle Informationen finden sich auf den offiziellen Google-Kanälen.
Quellen: Offizielle Google-Ankündigungen, unabhängige Benchmarks, Entwickler-Berichte, Tech-Medien
Google Launches Gemini 3 Pro – The New Stack
Gemini 3 Pro Costs & Gemini 3 API Costs: Latest Insights for 2025
How Much Does the Gemini 3.0 API Cost in 2025?
Gemini 3 Pro Pricing Cost Per 1M Tokens Explained – Skywork ai
Gemini 3 Vs ChatGPT 5.1: Benchmarks, Pricing And Real-World Use
Gemini 3: 11 Proven Wins Over GPT-5.1, Claude In Benchmarks
Google unveils Gemini 3 AI model, Antigravity agentic development tool | InfoWorld
Gemini 3 and Antigravity, explained: Why Google’s latest AI releases are a big deal | Fortune
Google Releases Gemini 3, Crushes Competition On Benchmarks
Gemini 3.0 Pro Review : Full Benchmarks, Performance & Pricing – Geeky Gadgets
Google Gemini 3 Is the Best Model Ever. One Score Stands Out Above the Rest

