Googles Gemini: Wirklich so perfekt?

Mai 1, 2024

Nachdem Gemini von Google eingestampft wurde, erfährt das KI-Modell jetzt eine Renaissance. Hält es, was es verspricht?

Zugeschnitten auf Sie

Zu diesem Thema biete ich Workshops an - maßgeschneidert auf Sie, Ihre Organisation, Ihr Unternehmen.

Zurück zum Blog

Gemini als KI-Kraftpaket

Google präsentierte diese Woche mit dem „neuen“ Gemini sein KI-Modell der nächsten Generation, das neue Maßstäbe in puncto Geschwindigkeit, Präzision und Vielseitigkeit setzen soll.
Fragt man es selbst, was nun neu ist, präsentiert es sich als „KI-Kraftpaket“.

Herzstück von Gemini ist die Transformer-Decoder-mit-Mixture-of-Experts (MoE)-Architektur. Diese einzigartige Kombination ermöglicht es Gemini, Informationen parallel zu verarbeiten, Langdistanzabhängigkeiten im Text zu erfassen und Aufgaben mit höchster Präzision zu erledigen. Es ist die weiterentwickelte Form der Architektur, die Google Research 2017 entwickelt hat (welche daraufhin von OpenAI sozusagen vervollständigt wurde).

Vorteile gegenüber anderen KI-Modellen

Fragt man Gemini, was es nun besser könne, als Copilot oder ChatGPT, so vergleicht es sich zunächst mit RNN (rekurenten neuronalen Netzen), wozu die genannten nicht gehören.

Aber trotzdem: Warum Gemini und nicht die anderen KIs?
Tatsächlich ist die Tatsache, dass sich Gemini von nun an in (googleeigene Apps) integrieren lässt (Google Maps z. B.) eine gute Sache für all jene, die es nutzen.

Die Langdistanzabhängigkeiten im Text erfasst Gemini nun nach meinem Dafürhalten besser. Stelle ich z. B. eine Frage zu einem Prompt viel weiter oben, kann es sich noch immer darauf beziehen.

Ansonsten behauptet es, schneller und schlauer zu sein – und besser deutsch zu können. Meiner Erfahrung nach, hat es definitiv einen Sprachkurs belegt, ja. Es sind kaum noch Grammatikfehler zu verzeichnen. Und die Antworten kamen auch wie aus der Pistole geschossen. Doch nach einigen Rückfragen switchte Gemini wieder zu Englisch; eine zutiefst menschliche Reaktion,, wieder zur Muttersprache zurückzukommen, weil man ja schließlich auch in dieser denkt, allerdings für eine KI eher unangebracht … oder nicht … hmmm.
Was allerdings GPT4 und Copilot können, Gemini aber nicht, das ist die Bildgenerierung. Schade. Vielleicht kommt das bald, denn Gemini ist auf Nachfrage bereits überzeugt, Bilder generieren zu können.

Quellen gibt Gemini weniger detailliert an und hat somit m. E. einen entscheidenden Nachteil im Vergleich zu Copilot.

Anwendungsgebiete

Wir kennen natürlich mittlerweile viele Vorteile von KI-Sprachmodellen.

Diese nimmt Gemini für sich in Anspruch:

Maschinelle Übersetzung: Übersetzungen in Echtzeit mit höchster Präzision
Textzusammenfassung: Erstellen prägnanter Zusammenfassungen langer Texte
Codegenerierung: Automatisches Erstellen von Code aus natürlicher Sprache
Beantwortung von Fragen: Umfassende und informative Antworten auf komplexe Fragen
Erstellung von kreativen Inhalten: Verfassen von Gedichten, Drehbüchern, Musikstücken und vielem mehr

Integration in andere Anwendungen

Oben schon angesprochen, führen wir es hier nochmals kurz aus: Wie kommt Gemini nun in mein Google Maps?

Gemini selbst nennt es „smarte Integration“.

Smarte Integration beschreibt die sinnvolle Verknüpfung von verschiedenen Systemen, Anwendungen und Geräten, um eine reibungslose und intuitive Benutzererfahrung zu schaffen. Ziel ist es, die Interaktion von uns Nutzer:innen mit der Technologie so einfach und effizient wie möglich zu gestalten.

Was genau bedeutet smarte Integration im Kontext von Gemini?

Im Gegensatz zu anderen KI-Modellen wie ChatGPT, die als eigenständige Anwendungen fungieren, kann Gemini nahtlos in Googles hauseigene Apps und Dienste integriert werden.

Gmail: Gemini kann direkt in Gmail eingesetzt werden, um
- E-Mails in Echtzeit zu übersetzen
- Zusammenfassungen langer E-Mails zu erstellen
- Kreative Textformate wie Gedichte oder Drehbücher in E-Mails zu verfassen
- Fragen zu den Inhalten von E-Mails zu beantworten
Google Kalender: Gemini kann in den Kalender integriert werden, um
- Termine automatisch zu planen
- Meetings zu organisieren und Notizen zu erstellen
- Reisepläne und Erinnerungen zu erstellen
- Fragen zu Terminen und Veranstaltungen zu beantworten
Google Drive: Gemini kann in Drive integriert werden, um
- Dokumente und Präsentationen automatisch zu erstellen
- Dateien in verschiedene Formate zu konvertieren
- Fragen zum Inhalt von Dokumenten zu beantworten
- Zusammenfassungen von langen Dokumenten zu erstellen

Die Vorteile preist Gemini mit Zeitersparnis und einer zentral ermöglichten Arbeitsweise an. Auch die gute alte Personalisierung (aka Daten der PErson zuweisen und benutzen) wird einem wieder als Benefit verkauft.

Wie kann man nun Gemini integrieren?

Die Integration von Gemini ist einfach und intuitiv. Die meisten Funktionen können direkt in den jeweiligen Apps und Diensten über entsprechende Menüs oder Befehle aktiviert werden.

Fun Facts zu Google Gemini

Warum heißt Gemini eigentlich so?

Gemini bedeutet „Zwillinge“ (lat. m Pl.), auch das Sternzeichen heißt so. Lt. Google soll so ein Bezug zur KI-Architektur hergestellt werden: „Zwei parallele Verarbeitungspfade: Die MoE-Architektur verarbeitet Informationen auf zwei parallelen Pfaden, die als „Zwillinge“ interpretiert werden können.“

Gemini hieß bis Februar 2024 „BARD“. Zuvor war es veröffentlicht als „BERT“. Das steht für Bidirectional Encoder Representations from Transformers.

Gemini nutzt Datensätze aus Text und Code, um zu funktionieren, greift aber auch auf Infos aus dem Internet zurück.

Gemini Advances ist die kostenpflichtige Version und kostet 21,99 €/Monat.

Das Bild ist übrigens mit Designer von Microsoft erstellt. Ist richtig nice geworden, finde ich.