GPT-4.5 ist da: Der emotionale Begleiter statt der Benchmark-Brecher

Zur Event Anmeldung

Artificial Teams

Willkommen zur neuesten Ausgabe von Artificial Teams! Diese Woche werfen wir einen Blick auf den gestern erfolgten Launch von GPT-4.5 – OpenAIs neuestes Sprachmodell, das einen interessanten Kurswechsel darstellt und überraschend anders ist als viele erwartet haben.

GPT-4.5 ist da: Der emotionale Begleiter statt der Benchmark-Brecher

OpenAI hat gestern mit GPT-4.5 ihr neuestes Modell in einer Research Preview veröffentlicht. Überraschenderweise geht OpenAI einen anderen Weg als mit den jüngsten o1 und o3-mini Modellen – statt auf Reasoning zu setzen, fokussiert sich GPT-4.5 auf emotionale Intelligenz, kreatives Schreiben und menschenähnlichere Interaktionen.

»It is the first model that feels like talking to a thoughtful person to me. I have had several moments where I've sat back in my chair and been astonished at getting actually good advice from an AI.« – Sam Altman, CEO OpenAI

Was macht GPT-4.5 so besonders? Während andere aktuelle Modelle wie Claude 3.7 Sonnet oder o1 auf technische Exzellenz und Reasoning-Fähigkeiten setzen, bietet GPT-4.5 einen anderen Mehrwert: Es fühlt sich tatsächlich an, als würde man mit einem echten Menschen sprechen.

Die wichtigsten Facts zu GPT-4.5

🚀 Stärken und Schwächen

Besonders stark bei kreativen Aufgaben und Texterstellung

Hohe emotionale Intelligenz und natürlichere Konversation

Starke Bildverständnisfähigkeiten und Datenextraktion

Weniger beeindruckend bei Coding 

Höherer Compute-Bedarf und damit höhere Kosten als GPT-4o

Nach intensiven Tests für kreatives Schreiben direkt nach dem Release kann ich bestätigen: Obwohl GPT-4.5 aufholt, scheint mir Claude 3.7 Sonnet weiterhin das Modell mit der besten kreativen Intelligenz zu sein. OpenAI macht definitiv Fortschritte im Bereich kreativer Texterstellung, aber für anspruchsvolle Content-Creation-Aufgaben bleibt Claude 3.7 Sonnet meine erste Wahl.

🔍 Technischer Hintergrund

Fokus auf Skalierung von unsupervised learning statt Reasoning

Breitere Wissensbasis und verbessertes Verständnis der Welt

Trainiert auf Microsoft Azure AI Supercomputern

Nicht für Benchmarks optimiert, sondern für menschenähnlichere Interaktionen

Besonders interessant ist die Performance beim SimpleQA Benchmark, der die Faktentreue von Sprachmodellen bei kurzen, faktensuchenden Fragen misst. Mit 4.326 Fragen über verschiedene Themenbereiche ist dieser Benchmark eine echte Herausforderung für KI-Modelle. Während ältere Modelle wie GPT-4o mit 38,2% Genauigkeit und moderne Reasoning-Modelle wie o1 mit 47% abschneiden, erreicht GPT-4.5 beeindruckende 62,5% - ein deutlicher Hinweis auf die verbesserte Wissensbasis.

SimpleQA

🎯 Verfügbarkeit

Aktuell für ChatGPT Pro-Nutzer zugänglich

Rollout für Plus und Team-Nutzer nächste Woche

Enterprise und Edu-Nutzer folgen in der übernächsten Woche

Auch über API für Entwickler verfügbar 

Erste Nutzerberichte: Mehr Freund als Assistent

Die ersten Erfahrungsberichte zeigen ein interessantes Bild: GPT-4.5 ist kein revolutionärer Sprung in der KI-Intelligenz, sondern eher eine Entwicklung in Richtung eines angenehmeren, menschlicheren Gesprächspartners.

Laut Nutzern wie Dan Shipper (Every) und Ethan Mollick zeigt sich GPT-4.5 als:

Weniger sycophantisch und mehr eine eigene Persönlichkeit

Extrovertierter und weniger neurotisch als GPT-4o

Besser im Verständnis von Nuancen und impliziten Absichten

Herausragend im Schreiben und kreativen Aufgaben

Interessanterweise scheint das Modell laut Persönlichkeitstests weniger narzisstisch und manipulativ, aber etwas mehr »psychopathisch« zu sein als GPT-4o – was darauf hindeutet, dass es direkter und weniger unterwürfig in seinen Antworten ist.

OpenAIs strategischer Schachzug

Der Launch von GPT-4.5 erscheint vor allem im Kontext des kürzlich veröffentlichten Claude 3.7 Sonnet besonders interessant. Während Anthropic mit dem technisch brillanten Claude 3.7 punktet, besetzt OpenAI mit GPT-4.5 bewusst eine andere Nische: die des emotionalen Begleiters.

Diese Positionierung deutet auf eine breitere Strategie hin:

OpenAI differenziert sein Portfolio mit verschiedenen Modell-Typen

Die o-Serie (o1, o3-mini) deckt Reasoning und technische Exzellenz ab

GPT-4.5 bedient die menschliche, soziale und kreative Seite

GPT-4o bleibt als vielseitiger Allrounder positioniert

Wann lohnt sich GPT-4.5 für dich?

Basierend auf den ersten Berichten scheint GPT-4.5 besonders wertvoll für:

Kreatives Schreiben und Content-Erstellung

Brainstorming und Ideenfindung

Coaching und persönliche Beratung

Komplexe Bildanalyse und Datenauszüge

Natürlichere Interaktionen

Weniger geeignet erscheint es für:

Komplexe Coding-Aufgaben (hier bleibt Claude 3.7 Sonnet überlegen)

Hochpräzise technische oder wissenschaftliche Aufgaben (hier punkten die o-Modelle)

Anwendungsfälle mit strengen Budgetbeschränkungen (höhere Kosten)

Fazit: Ein interessanter neuer Weg

Mit GPT-4.5 geht OpenAI einen spannenden alternativen Weg in der KI-Entwicklung. Statt nur auf rohe Intelligenz und Reasoning zu setzen, fokussiert sich das Unternehmen auf die zwischenmenschlichen Aspekte der KI-Interaktion. Das Modell mag nicht in allen Benchmarks glänzen, aber es könnte sich als der angenehmere Gesprächspartner erweisen – und damit für viele Nutzer wertvoller sein als technisch überlegene Alternativen.

Download PDF

Login or Register to Join the Conversation

Create an AccountLog in
Be the first to leave a comment.
Someone is typing...
No Name
Set
Moderator
4 years ago
Your comment will appear once approved by a moderator.
This is the actual comment. It's can be long or short. And must contain only text information.
(Edited)
No Name
Set
Moderator
2 years ago
Your comment will appear once approved by a moderator.
This is the actual comment. It's can be long or short. And must contain only text information.
(Edited)
Load More Replies

New Reply

Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.
Load More Comments
Loading
Timo Springer
Co-Founder DECAID Studio

KI-Experte und DECAID-Co-Founder, macht Menschen und Unternehmen fit für den praktischen KI-Einsatz. Mit 8.500+ LinkedIn-Followern, seinem Newsletter "Artificial Teams" (3.400+ Abonnenten) und über 100 KI-Workshops und -Bootcamps (NPS >80) hat er sich als Vermittler zwischen komplexer KI-Technologie und konkreter Anwendung etabliert. Zu seinen Referenzkunden zählen namhafte Marken wie Mercedes-Benz, Beiersdorf und Warner Bros. sowie renommierte Agenturen wie Jung von Matt und thjnk.

Mehr von diesem Autor:
Wie meistere ich die Transformation mit GenAI?
Agentur-Disruption meistern: Deine Roadmap für die KI-Transformation
Agentur-Disruption meistern: Deine Roadmap für die KI-Transformation
Generation ChatGPT: Zwischen Mensch und Maschine im Alltag