Artificial Teams
Willkommen zur neuesten Ausgabe von Artificial Teams! Diese Woche werfen wir einen Blick auf den gestern erfolgten Launch von GPT-4.5 – OpenAIs neuestes Sprachmodell, das einen interessanten Kurswechsel darstellt und überraschend anders ist als viele erwartet haben.
GPT-4.5 ist da: Der emotionale Begleiter statt der Benchmark-Brecher
OpenAI hat gestern mit GPT-4.5 ihr neuestes Modell in einer Research Preview veröffentlicht. Überraschenderweise geht OpenAI einen anderen Weg als mit den jüngsten o1 und o3-mini Modellen – statt auf Reasoning zu setzen, fokussiert sich GPT-4.5 auf emotionale Intelligenz, kreatives Schreiben und menschenähnlichere Interaktionen.
»It is the first model that feels like talking to a thoughtful person to me. I have had several moments where I've sat back in my chair and been astonished at getting actually good advice from an AI.« – Sam Altman, CEO OpenAI
Was macht GPT-4.5 so besonders? Während andere aktuelle Modelle wie Claude 3.7 Sonnet oder o1 auf technische Exzellenz und Reasoning-Fähigkeiten setzen, bietet GPT-4.5 einen anderen Mehrwert: Es fühlt sich tatsächlich an, als würde man mit einem echten Menschen sprechen.
Die wichtigsten Facts zu GPT-4.5
🚀 Stärken und Schwächen
Besonders stark bei kreativen Aufgaben und Texterstellung
Hohe emotionale Intelligenz und natürlichere Konversation
Starke Bildverständnisfähigkeiten und Datenextraktion
Weniger beeindruckend bei Coding
Höherer Compute-Bedarf und damit höhere Kosten als GPT-4o
Nach intensiven Tests für kreatives Schreiben direkt nach dem Release kann ich bestätigen: Obwohl GPT-4.5 aufholt, scheint mir Claude 3.7 Sonnet weiterhin das Modell mit der besten kreativen Intelligenz zu sein. OpenAI macht definitiv Fortschritte im Bereich kreativer Texterstellung, aber für anspruchsvolle Content-Creation-Aufgaben bleibt Claude 3.7 Sonnet meine erste Wahl.
🔍 Technischer Hintergrund
Fokus auf Skalierung von unsupervised learning statt Reasoning
Breitere Wissensbasis und verbessertes Verständnis der Welt
Trainiert auf Microsoft Azure AI Supercomputern
Nicht für Benchmarks optimiert, sondern für menschenähnlichere Interaktionen
Besonders interessant ist die Performance beim SimpleQA Benchmark, der die Faktentreue von Sprachmodellen bei kurzen, faktensuchenden Fragen misst. Mit 4.326 Fragen über verschiedene Themenbereiche ist dieser Benchmark eine echte Herausforderung für KI-Modelle. Während ältere Modelle wie GPT-4o mit 38,2% Genauigkeit und moderne Reasoning-Modelle wie o1 mit 47% abschneiden, erreicht GPT-4.5 beeindruckende 62,5% - ein deutlicher Hinweis auf die verbesserte Wissensbasis.
SimpleQA
🎯 Verfügbarkeit
Aktuell für ChatGPT Pro-Nutzer zugänglich
Rollout für Plus und Team-Nutzer nächste Woche
Enterprise und Edu-Nutzer folgen in der übernächsten Woche
Auch über API für Entwickler verfügbar
Erste Nutzerberichte: Mehr Freund als Assistent
Die ersten Erfahrungsberichte zeigen ein interessantes Bild: GPT-4.5 ist kein revolutionärer Sprung in der KI-Intelligenz, sondern eher eine Entwicklung in Richtung eines angenehmeren, menschlicheren Gesprächspartners.
Laut Nutzern wie Dan Shipper (Every) und Ethan Mollick zeigt sich GPT-4.5 als:
Weniger sycophantisch und mehr eine eigene Persönlichkeit
Extrovertierter und weniger neurotisch als GPT-4o
Besser im Verständnis von Nuancen und impliziten Absichten
Herausragend im Schreiben und kreativen Aufgaben
Interessanterweise scheint das Modell laut Persönlichkeitstests weniger narzisstisch und manipulativ, aber etwas mehr »psychopathisch« zu sein als GPT-4o – was darauf hindeutet, dass es direkter und weniger unterwürfig in seinen Antworten ist.
OpenAIs strategischer Schachzug
Der Launch von GPT-4.5 erscheint vor allem im Kontext des kürzlich veröffentlichten Claude 3.7 Sonnet besonders interessant. Während Anthropic mit dem technisch brillanten Claude 3.7 punktet, besetzt OpenAI mit GPT-4.5 bewusst eine andere Nische: die des emotionalen Begleiters.
Diese Positionierung deutet auf eine breitere Strategie hin:
OpenAI differenziert sein Portfolio mit verschiedenen Modell-Typen
Die o-Serie (o1, o3-mini) deckt Reasoning und technische Exzellenz ab
GPT-4.5 bedient die menschliche, soziale und kreative Seite
GPT-4o bleibt als vielseitiger Allrounder positioniert
Wann lohnt sich GPT-4.5 für dich?
Basierend auf den ersten Berichten scheint GPT-4.5 besonders wertvoll für:
Kreatives Schreiben und Content-Erstellung
Brainstorming und Ideenfindung
Coaching und persönliche Beratung
Komplexe Bildanalyse und Datenauszüge
Natürlichere Interaktionen
Weniger geeignet erscheint es für:
Komplexe Coding-Aufgaben (hier bleibt Claude 3.7 Sonnet überlegen)
Hochpräzise technische oder wissenschaftliche Aufgaben (hier punkten die o-Modelle)
Anwendungsfälle mit strengen Budgetbeschränkungen (höhere Kosten)
Fazit: Ein interessanter neuer Weg
Mit GPT-4.5 geht OpenAI einen spannenden alternativen Weg in der KI-Entwicklung. Statt nur auf rohe Intelligenz und Reasoning zu setzen, fokussiert sich das Unternehmen auf die zwischenmenschlichen Aspekte der KI-Interaktion. Das Modell mag nicht in allen Benchmarks glänzen, aber es könnte sich als der angenehmere Gesprächspartner erweisen – und damit für viele Nutzer wertvoller sein als technisch überlegene Alternativen.
0 Comments
Login or Register to Join the Conversation
Create an AccountLog in