Am 13. Mai 2024 präsentierte OpenAI in einem beeindruckenden YouTube-Event das neueste Modell ihrer KI-Entwicklung: das GPT-4o (o für omnichannel, Aussprache: “oh”). Dieses Modell markiert einen Wendepunkt, da es nicht nur in der kostenlosen Version verfügbar gemacht wird, sondern auch multimodal auf höchstem Level operieren kann – eine bedeutende Erweiterung gegenüber seinem GPT-4.
Alle Informationen zu OpenAIs neuem Flagship Model GPT-4o
Zielgruppen des GPT-4o
GPT-4o richtet sich an eine breite Nutzerbasis, die von Privatpersonen bis hin zu Unternehmen reicht. Dieses Modell ermöglicht es Nutzern, nicht nur mit Text, sondern auch mit Bildern und Daten zu interagieren, was eine Vielzahl von Anwendungen in verschiedenen Sektoren ermöglicht.
Verbesserungen und neue Funktionen
Eines der Highlights der Präsentation war die deutlich verbesserte Sprachfunktion von ChatGPT, die nun in der Lage ist, fast ohne Verzögerung zu kommunizieren und eine breite Palette von Emotionen, zumindest in Englisch, auszudrücken. Die Funktionalität als Dolmetscher, die zwischen Englisch und Italienisch wechseln kann, wurde ebenfalls vorgestellt, was ihre Nützlichkeit im Alltag unterstreicht.
Zusätzlich wurde die Vision-Funktion von ChatGPT verbessert, was anhand einer Demonstration gezeigt wurde, in der die KI eine mathematische Gleichung durch die Kamera erfasste und löste. Die neue Desktop-App von ChatGPT, die zunächst für macOS-Benutzer verfügbar sein wird, erweitert die Zugänglichkeit und Integration in den täglichen Gebrauch. Sowohl der Zugriff auf Video- oder Desktopinhalte erfolgt dabei in Echtzeit.
Lizenzierung und Verfügbarkeit
Die Einführung des GPT-4o wird in den nächsten Wochen erfolgen, wobei das Modell allen Nutzern von ChatGPT zur Verfügung stehen wird. Dies wird erwartet, die Art und Weise, wie Benutzer mit KI interagieren, grundlegend zu verändern und bestehende Nutzer zu ermutigen, die erweiterten Funktionen zu erkunden.
Zukünftige Aussichten
Während die Veranstaltung viele beeindruckende Funktionen des GPT-4o vorstellte, bleibt die Frage offen, welche weiteren Innovationen OpenAI für zukünftige Updates plant, insbesondere für zahlende Kunden. Es wird erwartet, dass weitere Verbesserungen und Spezialfunktionen eingeführt werden, die speziell auf die Bedürfnisse von Unternehmen und fortgeschrittenen Anwendern zugeschnitten sind. OpenAI CTO hat bereits angekündigt, dass noch mehr Updates kommen, welche hinter der Paywall liegen.
Datenschutz und KI-Recht: Herausforderungen durch neue KI-Funktionen
Die neuen Funktionen des GPT-4o, die emotionale Interaktionen nachahmen, werfen wichtige Datenschutz- und Rechtsfragen auf, besonders in der EU und Deutschland, wo der Umgang mit Live-Daten strengen Vorschriften unterliegt. Insbesondere die verbesserte Fähigkeit des Modells, Emotionen auszudrücken und die Stimme anzupassen, könnte gemäß dem EU AI Act problematisch sein, der die Nachahmung menschlicher Emotionen durch KI streng reguliert. Für Unternehmen bedeutet dies, dass die Implementierung solcher KI-Technologien tricky bleibt!
Fazit: UX, UX, UX!
OpenAI will, dass man vergisst, dass es sich um KI handelt. ChatGPT wird immer menschlicher und reibungsloser zu benutzen. Die User Experience (UX) war immer das Argument für ChatGPT und es bleibt es. AGI ist das Ziel und hier geht es lang. Wo Platz auf der Reise für Datenschutz bleibt, ist unklar. Die Features machen den Nutzern einfach zu viel Spaß, um auf solche Showstopper zu achten (Gefahr).
Bei Fragen oder Anregungen zum Thema New Work, zur Microsoft Welt oder zu Collaboration Tools stehen wir Ihnen gerne beratend zur Seite. Wir freuen uns auf Ihre Kontaktaufnahme.
Weitere Blogartikel aus Bereichen, die von New Work, über Microsoft 365 bis hin zu Sustainable IT reichen, finden Sie auf unserer Blogseite.
Hinweis: Beitragsbild mit DALLE-3 in Microsoft Copilot erstellt