Artikel

Member Content

GPT-4.5 ist da: Der emotionale Begleiter statt der Benchmark-Brecher

Artificial Teams

Willkommen zur neuesten Ausgabe von Artificial Teams! Diese Woche werfen wir einen Blick auf den gestern erfolgten Launch von GPT-4.5 – OpenAIs neuestes Sprachmodell, das einen interessanten Kurswechsel darstellt und überraschend anders ist als viele erwartet haben.

‍

‍

OpenAI hat gestern mit GPT-4.5 ihr neuestes Modell in einer Research Preview veröffentlicht. Überraschenderweise geht OpenAI einen anderen Weg als mit den jüngsten o1 und o3-mini Modellen – statt auf Reasoning zu setzen, fokussiert sich GPT-4.5 auf emotionale Intelligenz, kreatives Schreiben und menschenähnlichere Interaktionen.

‍

»It is the first model that feels like talking to a thoughtful person to me. I have had several moments where I've sat back in my chair and been astonished at getting actually good advice from an AI.« – Sam Altman, CEO OpenAI

‍

Was macht GPT-4.5 so besonders? Während andere aktuelle Modelle wie Claude 3.7 Sonnet oder o1 auf technische Exzellenz und Reasoning-Fähigkeiten setzen, bietet GPT-4.5 einen anderen Mehrwert: Es fühlt sich tatsächlich an, als würde man mit einem echten Menschen sprechen.

‍

Die wichtigsten Facts zu GPT-4.5

🚀 Stärken und Schwächen

Besonders stark bei kreativen Aufgaben und Texterstellung

Hohe emotionale Intelligenz und natürlichere Konversation

Starke Bildverständnisfähigkeiten und Datenextraktion

Weniger beeindruckend bei Coding

Höherer Compute-Bedarf und damit höhere Kosten als GPT-4o

‍

Nach intensiven Tests für kreatives Schreiben direkt nach dem Release kann ich bestätigen: Obwohl GPT-4.5 aufholt, scheint mir Claude 3.7 Sonnet weiterhin das Modell mit der besten kreativen Intelligenz zu sein. OpenAI macht definitiv Fortschritte im Bereich kreativer Texterstellung, aber für anspruchsvolle Content-Creation-Aufgaben bleibt Claude 3.7 Sonnet meine erste Wahl.

‍

🔍 Technischer Hintergrund

Fokus auf Skalierung von unsupervised learning statt Reasoning

Breitere Wissensbasis und verbessertes Verständnis der Welt

Trainiert auf Microsoft Azure AI Supercomputern

Nicht für Benchmarks optimiert, sondern für menschenähnlichere Interaktionen

‍

Besonders interessant ist die Performance beim SimpleQA Benchmark, der die Faktentreue von Sprachmodellen bei kurzen, faktensuchenden Fragen misst. Mit 4.326 Fragen über verschiedene Themenbereiche ist dieser Benchmark eine echte Herausforderung für KI-Modelle. Während ältere Modelle wie GPT-4o mit 38,2% Genauigkeit und moderne Reasoning-Modelle wie o1 mit 47% abschneiden, erreicht GPT-4.5 beeindruckende 62,5% - ein deutlicher Hinweis auf die verbesserte Wissensbasis.

‍

SimpleQA

‍

🎯 Verfügbarkeit

Aktuell für ChatGPT Pro-Nutzer zugänglich

Rollout für Plus und Team-Nutzer nächste Woche

Enterprise und Edu-Nutzer folgen in der übernächsten Woche

Auch über API für Entwickler verfügbar

‍

Erste Nutzerberichte: Mehr Freund als Assistent

Die ersten Erfahrungsberichte zeigen ein interessantes Bild: GPT-4.5 ist kein revolutionärer Sprung in der KI-Intelligenz, sondern eher eine Entwicklung in Richtung eines angenehmeren, menschlicheren Gesprächspartners.

‍

Laut Nutzern wie Dan Shipper (Every) und Ethan Mollick zeigt sich GPT-4.5 als:

‍

Weniger sycophantisch und mehr eine eigene Persönlichkeit

Extrovertierter und weniger neurotisch als GPT-4o

Besser im Verständnis von Nuancen und impliziten Absichten

Herausragend im Schreiben und kreativen Aufgaben

‍

Interessanterweise scheint das Modell laut Persönlichkeitstests weniger narzisstisch und manipulativ, aber etwas mehr »psychopathisch« zu sein als GPT-4o – was darauf hindeutet, dass es direkter und weniger unterwürfig in seinen Antworten ist.

‍

OpenAIs strategischer Schachzug

Der Launch von GPT-4.5 erscheint vor allem im Kontext des kürzlich veröffentlichten Claude 3.7 Sonnet besonders interessant. Während Anthropic mit dem technisch brillanten Claude 3.7 punktet, besetzt OpenAI mit GPT-4.5 bewusst eine andere Nische: die des emotionalen Begleiters.

‍

Diese Positionierung deutet auf eine breitere Strategie hin:

‍

OpenAI differenziert sein Portfolio mit verschiedenen Modell-Typen

Die o-Serie (o1, o3-mini) deckt Reasoning und technische Exzellenz ab

GPT-4.5 bedient die menschliche, soziale und kreative Seite

GPT-4o bleibt als vielseitiger Allrounder positioniert

‍

Wann lohnt sich GPT-4.5 für dich?

Basierend auf den ersten Berichten scheint GPT-4.5 besonders wertvoll für:

‍

Kreatives Schreiben und Content-Erstellung

Brainstorming und Ideenfindung

Coaching und persönliche Beratung

Komplexe Bildanalyse und Datenauszüge

Natürlichere Interaktionen

‍

Weniger geeignet erscheint es für:

‍

Komplexe Coding-Aufgaben (hier bleibt Claude 3.7 Sonnet überlegen)

Hochpräzise technische oder wissenschaftliche Aufgaben (hier punkten die o-Modelle)

Anwendungsfälle mit strengen Budgetbeschränkungen (höhere Kosten)

‍

Fazit: Ein interessanter neuer Weg

Mit GPT-4.5 geht OpenAI einen spannenden alternativen Weg in der KI-Entwicklung. Statt nur auf rohe Intelligenz und Reasoning zu setzen, fokussiert sich das Unternehmen auf die zwischenmenschlichen Aspekte der KI-Interaktion. Das Modell mag nicht in allen Benchmarks glänzen, aber es könnte sich als der angenehmere Gesprächspartner erweisen – und damit für viele Nutzer wertvoller sein als technisch überlegene Alternativen.

‍

Melde dich an um diese Masterclass zu schauen

0 Comments

Active Here: 0

My Profile Image

Logout Edit Profile

Write a New Comment

Login or Register to Join the Conversation

Create an Account Log in

Be the first to leave a comment.

Someone is typing...

No Name

Set

Moderator

4 years ago

Confirm Delete

Delete

Edit

Your comment will appear once approved by a moderator.

This is the actual comment. It's can be long or short. And must contain only text information.

(Edited)

2 Replies

No Name

Set

Moderator

2 years ago

Delete Forever

Delete

Edit

Your comment will appear once approved by a moderator.

This is the actual comment. It's can be long or short. And must contain only text information.

(Edited)

Load More Replies

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

Load More Comments

Timo Springer

Co-Founder DECAID Studio

KI-Experte und DECAID-Co-Founder, macht Menschen und Unternehmen fit für den praktischen KI-Einsatz. Mit 8.500+ LinkedIn-Followern, seinem Newsletter "Artificial Teams" (3.400+ Abonnenten) und über 100 KI-Workshops und -Bootcamps (NPS >80) hat er sich als Vermittler zwischen komplexer KI-Technologie und konkreter Anwendung etabliert. Zu seinen Referenzkunden zählen namhafte Marken wie Mercedes-Benz, Beiersdorf und Warner Bros. sowie renommierte Agenturen wie Jung von Matt und thjnk.

Mehr von diesem Autor: