Gedankenkette: OpenAI o1 setzt auf Verstärkungslernen

von Daniel Richey

Lesezeit

1 Minute

Drucken

a- a+

Veröffentlicht Vor 5 Tagen

Zuletzt aktualisiert Vor 2 Tagen

Bis jetzt gelesen

Gedankenkette: OpenAI o1 setzt auf Verstärkungslernen

13.09.2024 - 08:54

Veröffentlicht in:

News

OpenAI hat kürzlich das neue Sprachmodell o1 vorgestellt, das komplexe Denkaufgaben deutlich besser lösen soll. Das Modell wurde mit Hilfe von Verstärkungslernen entwickelt, einer Trainingsmethode, die es o1 ermöglicht, durch eine "Gedankenkette" Probleme in mehreren Schritten anzugehen.

Diese Herangehensweise ähnelt laut OpenAI der menschlichen Denkweise, bei der eine längere Reflexion vor einer Antwort erfolgt. Die Leistung des Modells zeigt sich insbesondere in Bereichen wie Mathematik, Naturwissenschaften und Programmierung, wo es menschliche Experten in einigen Benchmarks übertrifft.

In Tests schnitt o1 in verschiedenen anspruchsvollen Prüfungen und maschinellen Lern-Benchmarks besser ab als frühere Versionen wie GPT-4o. So erzielte o1 in der amerikanischen Mathematik-Olympiade (AIME) herausragende Ergebnisse, die es unter die besten 500 Schüler der USA brachten.

Auch bei einer schwierigen Prüfung in den Naturwissenschaften, bei der Experten mit PhDs als Vergleichsmaßstab dienten, konnte o1 diese übertreffen. Die Leistung des Modells zeigt, dass es in bestimmten Bereichen sogar besser abschneidet als menschliche Fachleute, obwohl OpenAI betont, dass dies nicht bedeutet, dass es in allen Belangen einem Experten überlegen ist.

Teurer und langsamer

Die Einführung von o1 bringt jedoch auch Herausforderungen mit sich. So ist das Modell deutlich teurer und langsamer im Betrieb als sein Vorgänger GPT-4o. Die API-Nutzung von o1 kostet Entwicklern deutlich mehr, was Fragen hinsichtlich der Wirtschaftlichkeit und Zugänglichkeit aufwirft.

OpenAI hat bereits eine Vorschauversion von o1 für ChatGPT-Nutzer freigegeben, wobei das Unternehmen plant, den Zugang in den kommenden Wochen auch auf Unternehmenskunden und Bildungseinrichtungen auszuweiten. Eine Veröffentlichung einer günstigeren Variante, o1-Mini, ist ebenfalls vorgesehen, allerdings ohne konkretes Datum.

Halluzinationen weiter möglich

Die neue Trainingsmethode des Verstärkungslernens unterscheidet sich von den bisherigen Ansätzen, die auf der Verarbeitung großer Datensätze basierten. Durch den Einsatz von Belohnungen und Bestrafungen lernt das Modell nicht nur aus den Daten, sondern entwickelt selbst Problemlösungsstrategien.

Dies führt laut OpenAI zu einer verbesserten Genauigkeit und verringert die Häufigkeit sogenannter Halluzinationen. Trotz dieser Fortschritte bleibe dieses Problem bestehen, und OpenAI betont, dass noch weitere Entwicklungen notwendig sind, um o1 für den allgemeinen Gebrauch vollständig zu optimieren.

Neuer Suchassistent: OpenAI testet SearchGPT

Vor 1 Monat von Daniel Richey

News

OpenAI testet einen neuen Prototyp namens SearchGPT, der die Stärken von KI-Modellen mit aktuellen Webinformationen kombinieren soll. Das Ziel ist es, Nutzern schnelle Antworten mit klar erkennbaren und relevanten Quellen zu liefern.

Weiterlesen über Neuer Suchassistent: OpenAI testet SearchGPT

Foxit erweitert KI-Funktionen in PDF Editor Suite

Vor 6 Monaten von Daniel Richey

News

Foxit hat die KI-Funktionen in seiner PDF Editor Suite 2024 weiterentwickelt. Die Aktualisierungen umfassen intelligente PDF-Befehle und Verbesserungen am bestehenden ChatGPT-basierten KI-Assistenten, verfügbar sowohl in der Desktop- als auch in der Cloudvariante.

Weiterlesen über Foxit erweitert KI-Funktionen in PDF Editor Suite

ChatGPT hält Einzug in Windows

Vor 1 Jahr von Daniel Richey

News

Nachdem Microsoft die Sprach-KI ChatGPT in Bing und Microsoft 365 eingeführt hat, soll der Chatbot nun auch in Windows 11 selbst Einzug halten. Dieser steht dann auf Knopfdruck in der Taskleiste zur Verfügung.

Weiterlesen über ChatGPT hält Einzug in Windows

IT-Administrator Seminare

Automatisierte Administration mit der PowerShell

2024-10-21 - 2024-10-23

Mit Bordmitteln gegen Ransomware

2024-09-26 - 2024-09-27

Mediathek

Dieses Video zeigt, wie sich mit Intune und Defender for Endpoint unerwünschte Anwendungen sperren lassen.

How to detect and block applications with Intune and Defender for Endpoint

Workshop

Im Unternehmensumfeld sollten auf verwalteten Geräten nur zugelasse Applikationen laufen. In diesem Video erfahren Sie, wie Sie mithilfe von Microsoft Intune und Defender von Endpoint unerwünschte Anwendungen auf Firmenrechnern erkennen und blockieren. Das funktioniert für bereits vorhandene Software wie auch für versuchte Neuinstallationen.

Gedankenkette: OpenAI o1 setzt auf Verstärkungslernen

Gedankenkette: OpenAI o1 setzt auf Verstärkungslernen

Tags

Ähnliche Beiträge

Neuer Suchassistent: OpenAI testet SearchGPT

Foxit erweitert KI-Funktionen in PDF Editor Suite

ChatGPT hält Einzug in Windows

How to detect and block applications with Intune and Defender for Endpoint

Partner Links

Kontakt