国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
概述
目錄
有什麼大不了的?
Openai O1的用例
令人印象深刻的測(cè)試結(jié)果
高級(jí)數(shù)學(xué)比賽
科學(xué)專(zhuān)業(yè)知識(shí)
編碼
其他基準(zhǔn)和視覺(jué)理解
了解視覺(jué)信息(視覺(jué)感知)
醫(yī)學(xué)成像測(cè)試(MMMU基準(zhǔn))
廣泛的知識(shí)(MMLU基準(zhǔn))
認(rèn)識(shí)O1-Mini
使用O1 mini的數(shù)學(xué)
誰(shuí)可以使用O1-preiview?
如何訪(fǎng)問(wèn)O1-preview?
安全也很重要
接下來(lái)是什麼?
最後的想法
首頁(yè) 科技週邊 人工智慧 Openai O1:一種在回答問(wèn)題之前'思考”的新模型

Openai O1:一種在回答問(wèn)題之前'思考”的新模型

Apr 13, 2025 am 09:26 AM

你聽(tīng)到了大新聞嗎? Openai剛剛推出了一系列新型AI模型的預(yù)覽 - OpenAi O1 (也稱(chēng)為草莓/Q*)。這些模型很特別,因?yàn)樗鼈冊(cè)诮o您答案之前花費(fèi)更多的時(shí)間“思考”。這意味著與早期模型相比,他們更好地解決了科學(xué),編碼和數(shù)學(xué)等領(lǐng)域的真正棘手問(wèn)題,這在很大程度上要?dú)w功於先進(jìn)的OpenAI O1參數(shù)。

Openai以O(shè)1系列的方式將座右銘“思考”以“思考”

概述

  • Openai的新O1模型系列在數(shù)學(xué),科學(xué)和編碼方面的棘手問(wèn)題上表現(xiàn)出色,使以前的版本超出了以前的版本。
  • O1概覽模型可以解決高級(jí)任務(wù),解決了93%的AIME數(shù)學(xué)問(wèn)題並超過(guò)了科學(xué)基準(zhǔn)的人類(lèi)專(zhuān)家。這些成功的大部分取決於如何有效地設(shè)置OpenAI O1參數(shù)來(lái)處理複雜的任務(wù)。
  • Openai的O1-Mini以80%的成本提供了強(qiáng)大的編碼功能,使其成為開(kāi)發(fā)人員的可訪(fǎng)問(wèn)工具。
  • 通過(guò)改進(jìn)的安全措施,O1模型確保了負(fù)責(zé)的AI使用,同時(shí)為研究人員,開(kāi)發(fā)人員和教育者提供了增強(qiáng)的問(wèn)題。

目錄

  • 有什麼大不了的?
  • Openai O1的用例
  • 令人印象深刻的測(cè)試結(jié)果
    • 高級(jí)數(shù)學(xué)比賽
    • 科學(xué)專(zhuān)業(yè)知識(shí)
    • 編碼
    • 其他基準(zhǔn)和視覺(jué)理解
  • 認(rèn)識(shí)O1-Mini
  • 使用O1 mini的數(shù)學(xué)
  • 誰(shuí)可以使用O1-preiview?
  • 如何訪(fǎng)問(wèn)O1-preview?
  • 安全也很重要
  • 接下來(lái)是什麼?
  • 最後的想法

有什麼大不了的?

O1-preiview模型經(jīng)過(guò)訓(xùn)練,可以退後一步,並真正思考事物,就像面臨棘手的問(wèn)題時(shí)人類(lèi)一樣。他們考慮了不同的方法,完善自己的想法,甚至在此過(guò)程中遇到自己的錯(cuò)誤。這種更深層次的思維水平使他們能夠解決舊模型無(wú)法應(yīng)付的問(wèn)題。

Openai O1的用例

用Openai O1編碼

用Openai O1編寫(xiě)難題

HTML蛇與Openai O1

令人印象深刻的測(cè)試結(jié)果

要查看與較早的GPT-4O模型相比,O1的更好,OpenAI使他們通過(guò)一系列艱難的測(cè)試,包括人類(lèi)考試和機(jī)器學(xué)習(xí)基準(zhǔn)。猜猜是什麼? O1在大多數(shù)這些推理的任務(wù)中的表現(xiàn)都優(yōu)於GPT-4O!

讓我們分解一些結(jié)果:

高級(jí)數(shù)學(xué)比賽

他們?cè)?strong>AIME(美國(guó)邀請(qǐng)賽數(shù)學(xué)考試)上測(cè)試了模型,這是美國(guó)頂尖學(xué)生的超級(jí)挑戰(zhàn)性數(shù)學(xué)考試

  • GPT-4O :解決了大約12%的問(wèn)題(大約15個(gè)問(wèn)題中的1.8個(gè))。
  • Openai O1 :每次嘗試僅一嚐試就解決了74% (大約15個(gè)中的11.1)。當(dāng)他們讓模型多次嘗試並取出最常見(jiàn)的答案時(shí),它得分為83% 。使用更高級(jí)的方法,它達(dá)到了93% ,解決了15個(gè)問(wèn)題中約13.9個(gè)!

綜上所述,在全國(guó)500名學(xué)生中,將獲得13.9的成績(jī),超過(guò)美國(guó)數(shù)學(xué)奧林匹克運(yùn)動(dòng)會(huì)的臨界。那是一些嚴(yán)重的腦力!

科學(xué)專(zhuān)業(yè)知識(shí)

他們還評(píng)估了O1在GPQA-Diamond上的O1,這是一種艱難的基準(zhǔn)測(cè)試,可測(cè)試化學(xué),物理學(xué)和生物學(xué)方面的知識(shí)。 Openai甚至引進(jìn)了博士學(xué)位的專(zhuān)家來(lái)回答這些問(wèn)題。

  • 結(jié)果:O1優(yōu)於這些人類(lèi)專(zhuān)家,成為第一個(gè)在此基準(zhǔn)下這樣做的AI模型!這表明O1可以在很高的水平上解決複雜的科學(xué)問(wèn)題。

編碼

在諸如CodeForces之類(lèi)的編碼競(jìng)賽中,新模型達(dá)到了第89個(gè)百分位,表明它們可以輕鬆生成和調(diào)試複雜的代碼。

Openai O1:一種在回答問(wèn)題之前'思考”的新模型

其他基準(zhǔn)和視覺(jué)理解

但這不是全部! O1模型還顯示了其他領(lǐng)域的顯著改善:

了解視覺(jué)信息(視覺(jué)感知)

O1模型現(xiàn)在可以解釋和理解圖像 - 一種稱(chēng)為視覺(jué)感知的功能。這意味著它可以分析視覺(jué)數(shù)據(jù)並回答有關(guān)它的問(wèn)題,這對(duì)於AI來(lái)說(shuō)是一大步。

醫(yī)學(xué)成像測(cè)試(MMMU基準(zhǔn))

Openai在一個(gè)名為MMMU的具有挑戰(zhàn)性的基準(zhǔn)上測(cè)試了O1(該基準(zhǔn)(該基準(zhǔn))代表了多模式的醫(yī)療機(jī)器理解)。該測(cè)試評(píng)估了AI可以理解醫(yī)學(xué)圖像並進(jìn)行準(zhǔn)確評(píng)估的程度,類(lèi)似於醫(yī)療專(zhuān)業(yè)人員執(zhí)行的任務(wù)。

結(jié)果:O1在此測(cè)試中得分78.2% ,這使其成為第一個(gè)以與人類(lèi)醫(yī)學(xué)成像專(zhuān)家相當(dāng)?shù)乃綀?zhí)行的AI模型。這很大,因?yàn)槔斫夂徒忉屷t(yī)學(xué)圖像需要深厚的知識(shí)和精度。

廣泛的知識(shí)(MMLU基準(zhǔn))

還對(duì)O1模型進(jìn)行了測(cè)試,該模型在MMLU(大量的多任務(wù)語(yǔ)言理解)基準(zhǔn)上進(jìn)行了測(cè)試,該基準(zhǔn)涵蓋了57個(gè)不同的主題,從歷史和文學(xué)到數(shù)學(xué)和計(jì)算機(jī)科學(xué)。

結(jié)果:O1在57名受試者中有54位優(yōu)於GPT-4O!這表明O1不僅在一個(gè)領(lǐng)域中專(zhuān)業(yè),還表明了廣泛主題的理解得到了提高。

Openai O1:一種在回答問(wèn)題之前'思考”的新模型

用更簡(jiǎn)單的話(huà)來(lái)說(shuō),O1能夠同時(shí)了解文本和圖像的能力意味著它變得更加通用和有能力。無(wú)論是分析複雜的醫(yī)學(xué)圖像,解決高級(jí)數(shù)學(xué)問(wèn)題還是在各種主題上回答問(wèn)題,O1都為AI做些什麼制定了新的標(biāo)準(zhǔn)。

認(rèn)識(shí)O1-Mini

Openai還推出了O1-Mini ,這是O1-Preigiew模型的較小,更快,更實(shí)惠的版本,特別擅長(zhǎng)編碼任務(wù)。它便宜80% ,這是對(duì)於需要強(qiáng)大推理能力的開(kāi)發(fā)人員而無(wú)需破壞銀行的開(kāi)發(fā)人員的絕佳選擇。

我們還發(fā)布了Openai O1-Mini,這是一種具有成本效益的推理模型,在STEM上表現(xiàn)出色,尤其是數(shù)學(xué)和編碼。

- 2024年9月12日Openai(@Openai)

使用O1 mini的數(shù)學(xué)

另請(qǐng)閱讀:Openai的O1-Mini:具有成本效益推理的STEM的改變遊戲規(guī)則的模型

誰(shuí)可以使用O1-preiview?

這些新型號(hào)是針對(duì)任何處理複雜問(wèn)題的人的遊戲規(guī)則改變者:

  • 研究人員和科學(xué)家:它們可以幫助註釋細(xì)胞測(cè)序數(shù)據(jù)或在量子物理等領(lǐng)域中產(chǎn)生所需的複雜公式。
  • 開(kāi)發(fā)人員:構(gòu)建和執(zhí)行多步驟工作流變得更加容易,更高效。
  • 學(xué)生和教育工作者:他們提供了一種探索數(shù)學(xué)和科學(xué)中具有挑戰(zhàn)性概念的新方法。

如何訪(fǎng)問(wèn)O1-preview?

Chatgpt Plus和團(tuán)隊(duì)用戶(hù):您可以從今天開(kāi)始訪(fǎng)問(wèn)ChatGPT中的O1-preview和O1-Mini模型。只需從模型選擇器中選擇它們即可。目前有每週的消息限制(O1-preiview的30條消息,O1-Mini的50條消息),但Openai正在努力盡快增加這些限制。

Openai O1:一種在回答問(wèn)題之前'思考”的新模型

  • CHATGPT Enterprise和EDU用戶(hù):從下週開(kāi)始,您將可以訪(fǎng)問(wèn)這兩種型號(hào)。
  • 開(kāi)發(fā)人員:如果您處?kù)禔PI使用層5,則可以立即通過(guò)API開(kāi)始嘗試這些模型。某些功能諸如函數(shù)調(diào)用和流媒體之類(lèi)的功能尚不可用,但是它們正在路上。
  • chatgpt免費(fèi)用戶(hù):好消息! OpenAI計(jì)劃使所有自由用戶(hù)都可以使用O1-Mini。

安全也很重要

Openai還通過(guò)這些型號(hào)提高了安全功能。他們已經(jīng)接受了培訓(xùn),以更好地理解和遵循安全指南,通過(guò)對(duì)對(duì)話(huà)期間的規(guī)則進(jìn)行推理。這意味著他們不太可能被欺騙去做他們不應(yīng)該做的事情(您可能聽(tīng)說(shuō)過(guò)“越獄”的AI模型)。

在艱難的安全測(cè)試中,O1-preview模型得分為100分,而GPT-4O的得分為22 。這是一個(gè)重大的改進(jìn),表明他們傾向在安全和適當(dāng)?shù)慕缦薰?fàn)圍內(nèi)更好。

Openai與美國(guó)和英國(guó)的安全組織緊密合作,他們甚至鑑於這些機(jī)構(gòu)的早期訪(fǎng)問(wèn)模型,以幫助研究並確保一切都達(dá)到標(biāo)準(zhǔn)。

接下來(lái)是什麼?

這只是開(kāi)始。 Openai正在計(jì)劃對(duì)這些模型進(jìn)行定期更新和改進(jìn)。他們正在尋找添加諸如瀏覽網(wǎng)絡(luò),上傳文件和圖像之類(lèi)的功能,以及更多的功能,以使它們更有幫助。

他們還繼續(xù)在GPT系列中與這個(gè)新的O1系列一起開(kāi)發(fā)模型,因此有很多期待。

最後的想法

在AI世界中,O1-preview和O1-Mini模型的推出是一件大事。它們代表了AI如何通過(guò)複雜問(wèn)題推理的重要一步。通過(guò)更好的性能和增強(qiáng)的安全措施,這些模型將成為許多從事挑戰(zhàn)任務(wù)的人的遊戲改變者。

請(qǐng)繼續(xù)關(guān)注Analytics Vidhya博客,以了解有關(guān)O1和O1 Mini的用途的更多信息!

以上是Openai O1:一種在回答問(wèn)題之前'思考”的新模型的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線(xiàn)上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開(kāi)發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺(jué)化網(wǎng)頁(yè)開(kāi)發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

熱門(mén)話(huà)題

前7個(gè)筆記本替代品 前7個(gè)筆記本替代品 Jun 17, 2025 pm 04:32 PM

Google的NotebookLM是由Gemini 2.5提供動(dòng)力的智能AI筆記工具,它在匯總文檔方面表現(xiàn)出色。但是,它在工具使用方面仍然有局限性,例如源蓋,雲(yún)依賴(lài)性和最近的“發(fā)現(xiàn)”功能

好萊塢起訴AI公司,用於復(fù)制沒(méi)有許可證的角色 好萊塢起訴AI公司,用於復(fù)制沒(méi)有許可證的角色 Jun 14, 2025 am 11:16 AM

但是,這裡的危險(xiǎn)不僅僅是追溯損失或皇室報(bào)銷(xiāo)。根據(jù)AI治理和IP律師兼Ambart Law PLLC的創(chuàng)始人Yelena Ambartsumian的說(shuō)法,真正的關(guān)注是前瞻性。 “我認(rèn)為迪士尼和環(huán)球影業(yè)的MA

您公司的AI流利性如何? 您公司的AI流利性如何? Jun 14, 2025 am 11:24 AM

使用AI與使用良好不同。許多創(chuàng)始人通過(guò)經(jīng)驗(yàn)發(fā)現(xiàn)了這一點(diǎn)。從節(jié)省時(shí)間的實(shí)驗(yàn)開(kāi)始通常會(huì)創(chuàng)造更多的工作。團(tuán)隊(duì)最終花費(fèi)數(shù)小時(shí)修改AI生成的內(nèi)容或驗(yàn)證輸出

從採(cǎi)用到優(yōu)勢(shì):2025年塑造企業(yè)LLM的10個(gè)趨勢(shì) 從採(cǎi)用到優(yōu)勢(shì):2025年塑造企業(yè)LLM的10個(gè)趨勢(shì) Jun 20, 2025 am 11:13 AM

以下是重塑企業(yè)AI景觀的十種引人注目的趨勢(shì)。對(duì)LLMSorganizations的財(cái)務(wù)承諾正在大大增加其在LLMS的投資,其中72%的人預(yù)計(jì)他們的支出今年會(huì)增加。目前,近40%a

原型:太空公司Voyager的股票在IPO上飆升 原型:太空公司Voyager的股票在IPO上飆升 Jun 14, 2025 am 11:14 AM

航天公司Voyager Technologies在周三的IPO期間籌集了近3.83億美元,股票的價(jià)格為31美元。該公司為政府和商業(yè)客戶(hù)提供一系列與空間相關(guān)的服務(wù),包括在IN上的活動(dòng)

NVIDIA想要與DGX Cloud Lepton一起建造一個(gè)行星規(guī)模的AI工廠 NVIDIA想要與DGX Cloud Lepton一起建造一個(gè)行星規(guī)模的AI工廠 Jun 14, 2025 am 11:17 AM

Nvidia已將Lepton AI重新命名為DGX Cloud Lepton,並於2025年6月重新引入了它。

波士頓動(dòng)力學(xué)和Unitree正在迅速創(chuàng)新四足機(jī)器人 波士頓動(dòng)力學(xué)和Unitree正在迅速創(chuàng)新四足機(jī)器人 Jun 14, 2025 am 11:21 AM

當(dāng)然,我一直緊隨位於附近的波士頓動(dòng)力學(xué)。但是,在全球舞臺(tái)上,另一家機(jī)器人公司正在作為強(qiáng)大的存在。他們的四足機(jī)器人已經(jīng)被部署在現(xiàn)實(shí)世界中,並且

什麼是'物理AI”?在推動(dòng)AI理解現(xiàn)實(shí)世界的推動(dòng)力中 什麼是'物理AI”?在推動(dòng)AI理解現(xiàn)實(shí)世界的推動(dòng)力中 Jun 14, 2025 am 11:23 AM

再加上這一事實(shí),AI在很大程度上仍然是黑匣子,工程師仍然很難解釋為什麼模型的行為不可預(yù)測(cè)或如何修復(fù)它們,您可能會(huì)開(kāi)始掌握當(dāng)今行業(yè)面臨的主要挑戰(zhàn)。

See all articles