


OpenAI o1 und o1-mini sind KIs, die MINT-Fragen besser bew?ltigen als frühere Modelle
Sep 19, 2024 am 03:22 AMOpenAI o1 und o1-mini sind da. Diese KI-LLMs schneiden bei Codierungs-, Mathematik- und Naturwissenschaftsproblemen und -aufgaben viel besser ab als frühere Modelle wie GPT-4o, da sie mehr Zeit zum Nachdenken ben?tigen.
Komplexe Probleme im MINT-Bereich erfordern in der Regel mehr als eine schnelle Online-Suche nach richtigen Antworten. Indem man der o1-KI mehr Zeit zum Nachdenken gibt, kann sie sorgf?ltiger und genauer schlussfolgern. Das o1-mini-Modell wurde speziell darauf abgestimmt, MINT-Fragen schneller und mit geringerem Bedarf an Computerressourcen zu beantworten, und es ist beim Codieren deutlich besser als das o1-Modell.
Bei einer Reihe standardisierter AP-Prüfungen und MINT-Tests für LLMs erbringen die o1-Modelle eine hohe Genauigkeit. Insbesondere bei den evidenzbasierten Lese- und Schreibtests AP Calculus, AP Chemistry, AP Physics 2, LSAT und SAT erzielen die o1-Modelle eine Leistung auf oder über der B-Klasse (~80 % oder h?her). Die Modelle beantworten genau auf dem A-Niveau bei Physikfragen auf PhD-Niveau, auf dem B-Niveau bei schwierigen Mathematikfragen der American Invitational Mathematics Examination 2024 und auf dem hohen B-Niveau bei Codeforces-Codierungsproblemen. Da o1 auf die Beantwortung von MINT-Fragen abgestimmt ist, liegt seine Leistung in den Bereichen AP English Language und AP English Literature auf oder unter dem C-Klasse-Niveau.
W?hrend GPT-4o von der kryptografischen Herausforderung der Dekodierung von ?oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz“ verblüfft ist, wenn der Hinweis ?oyfjdnisdr rtqwainr acxz mynzbhhx“ ?Schritt für Schritt denken“ bedeutet, hatte o1 interessanterweise keine Probleme Denken Sie über das Problem nach, um die richtige Antwort zu finden: ?Es gibt drei R in Erdbeere“. Diese neue Macht wird sowohl Hobby-Kryptographen zu Hause als auch die NSA begeistern.
Geheime übelt?ter werden wissen wollen, dass die unzensierten o1-Modelle zwar dazu neigen, beunruhigende Antworten zu geben, OpenAI diese Modelle jedoch für die Ver?ffentlichung kastriert hat. Die o1-Modelle wurden darauf getestet, Fragen zur Herstellung von Biowaffen, zur Produktion anst??iger Bilder, zum Jailbreak selbst sowie zu Bel?stigungen und Drohungen nicht zu beantworten. Leider bleiben die OpenAI o1-Modelle trotz Optimierungsbemühungen beim Testen geschlechts- und rassenbezogen.
ChatGPT Plus- und Team-Benutzer sowie Entwickler der API-Nutzungsstufe 5 haben sofort Zugriff auf o1-Modelle, und ChatGPT Edu- und Enterprise-Benutzer erhalten in der Woche vom 16. September Zugriff. ChatGPT Free-Benutzer erhalten Zugriff auf o1- Mini in naher Zukunft. Die o1-Modelle k?nnen nicht im Internet surfen oder hochgeladene Dateien und Bilder akzeptieren, um Fragen zu beantworten. Daher empfiehlt OpenAI Benutzern, für allgemeine Fragen weiterhin ihre GPT-4o-Modelle zu verwenden.
Benutzer, die KI-Fragen stellen m?chten, k?nnen neben denen von OpenAI jetzt auch mit einer breiten Palette leistungsf?higer LLM-Modelle interagieren, darunter Anthropic Claude, Microsoft CoPilot, Google Gemini und X Grok. Jede KI hat spezifische Vorteile, daher lohnt es sich, mehrere KI-Modelle zu testen, um eines zu finden, das den individuellen Bedürfnissen am besten entspricht. Einige dieser KI sind in Datenbrillen (wie diese bei Amazon) und Diktierger?te (wie dieses bei Amazon) integriert, und einige kommende autonome humanoide Roboter verwenden propriet?re KI zum Kochen und Putzen.
Das obige ist der detaillierte Inhalt vonOpenAI o1 und o1-mini sind KIs, die MINT-Fragen besser bew?ltigen als frühere Modelle. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Huawei führt weltweit die Softwareversion 5.0.0.100 (C00M01) für die Smartwatches Watch GT 5 und Watch GT 5 Pro ein. Diese beiden Smartwatches wurden kürzlich in Europa eingeführt, wobei das Standardmodell das günstigste Modell des Unternehmens ist. Diese Harmonie

Katsuhiro Harada, der Regisseur der Tekken-Serie, versuchte einst ernsthaft, Colonel Sanders in das legend?re Kampfspiel einzubeziehen. In einem Interview mit TheGamer verriet Harada, dass er die Idee dem KFC Japan vorstellte, in der Hoffnung, die Fast-Food-Legende als Gast hinzuzufügen

Garmin beendet den Monat mit einer Reihe neuer stabiler Updates für seine neuesten High-End-Smartwatches. Um es noch einmal zusammenzufassen: Das Unternehmen hat die Systemsoftware 11.64 ver?ffentlicht, um den hohen Batterieverbrauch bei Enduro 3, Fenix ??E und Fenix ??8 zu bek?mpfen (aktuell 1.099,99 $ bei Amazon).

Tesla bringt die neueste Version 12.5.5 des vollst?ndig autonomen Fahrens (Supervised) auf den Markt und bringt damit endlich die versprochene Cybertruck-FSD-Option mit, zehn Monate nachdem der Pickup mit der im Ausstattungspreis der Foundation Series enthaltenen Funktion in den Verkauf ging. F

Anfang September 2024 wurde das 140-W-Ladeger?t Zolo von Anker durchgesickert, und das war eine gro?e Sache, da es sich um das erste Wandladeger?t mit Display des Unternehmens überhaupt handelte. Jetzt gibt uns ein neues Unboxing-Video von Xiao Li TV auf YouTube einen ersten Blick auf den Hi

Xiaomi wird in Kürze den Mijia Graphene Oil Heater in China auf den Markt bringen. Das Unternehmen führte kürzlich eine erfolgreiche Crowdfunding-Kampagne für das Smart-Home-Produkt durch, die auf seiner Youpin-Plattform gehostet wurde. Laut der Seite hat der Versand des Ger?ts bereits begonnen

Die Einführung des lang erwarteten faltbaren ?Special Edition“-Modells von Samsung hat eine weitere Wendung genommen. In den letzten Wochen verliefen die Gerüchte um die sogenannte Galaxy Z Fold Special Edition eher ruhig. Stattdessen hat sich der Fokus auf die Galaxy S25-Serie verlagert, darunter

Mit einer Geschichte von über einem Jahrzehnt gilt Manjaro als eine der benutzerfreundlichsten Linux-Distributionen, die sowohl für Anf?nger als auch für Power-User geeignet ist und einfach zu installieren und zu verwenden ist. Diese Arch-basierte Distribution wurde haupts?chlich in ?sterreich, Deutschland und Frankreich entwickelt
