国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁(yè) 科技週邊 人工智慧 超越因果語(yǔ)言建模

超越因果語(yǔ)言建模

Feb 25, 2025 pm 06:28 PM

> Neurips 2024聚光燈:使用選擇性語(yǔ)言建模(SLM)

進(jìn)行優(yōu)化語(yǔ)言模型

>最近,我提出了一份來(lái)自2024年Neurips的引人入勝的論文,“並非所有的標(biāo)記都是您在當(dāng)?shù)亻喿x組中所需的。” 本文解決了一個(gè)令人驚訝的簡(jiǎn)單但有影響力的問(wèn)題:在訓(xùn)練語(yǔ)言模型期間,每個(gè)令牌是否需要下一步的預(yù)測(cè)? >標(biāo)準(zhǔn)方法涉及大量的網(wǎng)絡(luò)綁帶數(shù)據(jù)集和普遍應(yīng)用因果語(yǔ)言建模(CLM)。 本文提出了假設(shè)的挑戰(zhàn),提出某些令牌阻礙了學(xué)習(xí)過(guò)程而不是幫助。 作者表明,將培訓(xùn)集中在“有用”代幣上可以顯著提高數(shù)據(jù)效率和下游任務(wù)績(jī)效。 這篇文章總結(jié)了他們的核心思想和關(guān)鍵的實(shí)驗(yàn)發(fā)現(xiàn)。

>

問(wèn)題:噪聲和效率低下的學(xué)習(xí)

> >大型網(wǎng)絡(luò)中心不可避免地包含噪音。雖然文檔級(jí)過(guò)濾有所幫助,但噪聲通常位於各個(gè)文檔中。 這些嘈雜的令牌浪費(fèi)了計(jì)算資源,並可能使模型混淆。 作者分析了令牌級(jí)學(xué)習(xí)動(dòng)力學(xué),基於其跨滲透損失軌跡對(duì)令牌進(jìn)行分類:

l→l(低至低):

迅速學(xué)習(xí),提供最小的進(jìn)一步好處。
  • h→l(高到低):最初很困難,但最終學(xué)會(huì)了;代表寶貴的學(xué)習(xí)機(jī)會(huì)。
  • h→h(高到高):始終困難,通常是由於固有的不可預(yù)測(cè)性(良好的不確定性)。 >
  • l→H(低至高):最初學(xué)會(huì),但後來(lái)成為問(wèn)題,可能是由於上下文變化或噪聲。 他們的分析表明,只有一小部分代幣提供有意義的學(xué)習(xí)信號(hào)。
  • >
  • 解決方案:選擇性語(yǔ)言建模(SLM)>
  • 建議的解決方案,選擇性語(yǔ)言建模(SLM),提供了一種更具針對(duì)性的方法:>

參考模型(RM)訓(xùn)練:數(shù)據(jù)的高質(zhì)量子集用於微調(diào)預(yù)訓(xùn)練的基本模型,創(chuàng)建參考模型(RM)。該RM充當(dāng)令牌“有用性”的基準(zhǔn)。

Beyond Causal Language Modeling多餘的損失計(jì)算:

對(duì)於大型語(yǔ)料庫(kù)中的每個(gè)令牌,RM的損失與當(dāng)前訓(xùn)練模型的損失(“多餘損失”)之間的差異。 較高的多餘損失表明改善的潛力更大。
  1. > 選擇性反向傳播:在所有令牌上都執(zhí)行完整的正向通行證,但是僅對(duì)多餘損失最高的代幣的頂部 k%

    進(jìn)行反向傳播。這動(dòng)態(tài)地將培訓(xùn)集中在最有價(jià)值的代幣上。
  2. >

實(shí)驗(yàn)結(jié)果:顯著增長(zhǎng)

SLM在各種實(shí)驗(yàn)中都具有顯著優(yōu)勢(shì):

Beyond Causal Language Modeling

與標(biāo)準(zhǔn)CLM相比,SLM在上,
  • 數(shù)學(xué)域:

    上,SLM在GSM8K和數(shù)學(xué)基準(zhǔn)上的性能提高了10 %,與標(biāo)準(zhǔn)CLM相比,達(dá)到基線績(jī)效的速度更快為5-10倍。 7B模型僅使用其培訓(xùn)令牌的3%匹配最先進(jìn)的模型。 1B型號(hào)的微調(diào)進(jìn)一步提高了40%以上的性能。

    通用域:
  • 即使使用了強(qiáng)大的預(yù)訓(xùn)練的基本模型,SLM在15個(gè)基準(zhǔn)方面的平均平均提高約為5.8%,尤其是在諸如代碼和數(shù)學(xué)之類的具有挑戰(zhàn)性的領(lǐng)域。
  • 自我引用:

    即使是來(lái)自RAW語(yǔ)料庫(kù)的快速訓(xùn)練的RM也提供了2-3%的準(zhǔn)確性提升,而使用的代幣降低了30-40%。
  • >結(jié)論和未來(lái)工作

    >
  • >本文提供了有關(guān)令牌級(jí)學(xué)習(xí)動(dòng)態(tài)的寶貴見(jiàn)解,並引入了SLM,這是一種優(yōu)化語(yǔ)言模型預(yù)處理的高效技術(shù)。 未來(lái)的研究方向包括將SLM擴(kuò)展到較大的模型,探索基於API的參考模型,使用多個(gè)參考模型整合增強(qiáng)學(xué)習(xí),以及將SLM與安全性和真實(shí)性考慮對(duì)齊。 這項(xiàng)工作代表了高效有效的語(yǔ)言模型培訓(xùn)方面的重大進(jìn)步。

    以上是超越因果語(yǔ)言建模的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

    本網(wǎng)站聲明
    本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

    熱AI工具

    Undress AI Tool

    Undress AI Tool

    免費(fèi)脫衣圖片

    Undresser.AI Undress

    Undresser.AI Undress

    人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

    AI Clothes Remover

    AI Clothes Remover

    用於從照片中去除衣服的線上人工智慧工具。

    Clothoff.io

    Clothoff.io

    AI脫衣器

    Video Face Swap

    Video Face Swap

    使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

    熱工具

    記事本++7.3.1

    記事本++7.3.1

    好用且免費(fèi)的程式碼編輯器

    SublimeText3漢化版

    SublimeText3漢化版

    中文版,非常好用

    禪工作室 13.0.1

    禪工作室 13.0.1

    強(qiáng)大的PHP整合開(kāi)發(fā)環(huán)境

    Dreamweaver CS6

    Dreamweaver CS6

    視覺(jué)化網(wǎng)頁(yè)開(kāi)發(fā)工具

    SublimeText3 Mac版

    SublimeText3 Mac版

    神級(jí)程式碼編輯軟體(SublimeText3)

    熱門話題

    Laravel 教程
    1600
    29
    PHP教程
    1502
    276
    Kimi K2:最強(qiáng)大的開(kāi)源代理模型 Kimi K2:最強(qiáng)大的開(kāi)源代理模型 Jul 12, 2025 am 09:16 AM

    還記得今年早些時(shí)候破壞了Genai行業(yè)的大量開(kāi)源中國(guó)模型嗎??jī)嵐蹹eepSeek佔(zhàn)據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

    Grok 4 vs Claude 4:哪個(gè)更好? Grok 4 vs Claude 4:哪個(gè)更好? Jul 12, 2025 am 09:37 AM

    到2025年中期,AI“軍備競(jìng)賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車型Grok 4和Claude 4。這兩種模型處?kù)对O(shè)計(jì)理念和部署平臺(tái)的相反端,但他們卻在

    今天已經(jīng)在我們中間走了10個(gè)驚人的人形機(jī)器人 今天已經(jīng)在我們中間走了10個(gè)驚人的人形機(jī)器人 Jul 16, 2025 am 11:12 AM

    但是我們可能甚至不必等10年就可以看到一個(gè)。實(shí)際上,可以被認(rèn)為是真正有用的,類人類機(jī)器的第一波。 近年來(lái),有許多原型和生產(chǎn)模型從T中走出來(lái)

    上下文工程是' new'及時(shí)的工程 上下文工程是' new'及時(shí)的工程 Jul 12, 2025 am 09:33 AM

    直到上一年,迅速的工程被認(rèn)為是與大語(yǔ)言模型(LLM)互動(dòng)的關(guān)鍵技能。然而,最近,LLM在推理和理解能力方面已經(jīng)顯著提高。自然,我們的期望

    Leia的浸入式移動(dòng)應(yīng)用將3D深度帶入日常照片 Leia的浸入式移動(dòng)應(yīng)用將3D深度帶入日常照片 Jul 09, 2025 am 11:17 AM

    基於Leia專有的神經(jīng)深度引擎,應(yīng)用程序流程靜止圖像,並添加了自然深度以及模擬運(yùn)動(dòng)(例如Pans,Zooms和Alallax Effects),以創(chuàng)建簡(jiǎn)短的視頻捲軸,從而給人以踏入SCE的印象

    7種AI代理的7種類型是什麼? 7種AI代理的7種類型是什麼? Jul 11, 2025 am 11:08 AM

    想像一些複雜的東西,例如AI引擎準(zhǔn)備提供有關(guān)米蘭新服裝系列的詳細(xì)反饋,或者自動(dòng)市場(chǎng)分析用於全球運(yùn)營(yíng)的企業(yè),或者智能係統(tǒng)管理大型車隊(duì)。

    這些AI模型沒(méi)有學(xué)習(xí)語(yǔ)言,他們學(xué)習(xí)了策略 這些AI模型沒(méi)有學(xué)習(xí)語(yǔ)言,他們學(xué)習(xí)了策略 Jul 09, 2025 am 11:16 AM

    倫敦國(guó)王學(xué)院和牛津大學(xué)的研究人員的一項(xiàng)新研究分享了Openai,Google和Anthropic在基於迭代囚犯的困境基於的cutthroat競(jìng)爭(zhēng)中一起投擲的結(jié)果。這是沒(méi)有的

    隱藏的命令危機(jī):研究人員遊戲AI將發(fā)布 隱藏的命令危機(jī):研究人員遊戲AI將發(fā)布 Jul 13, 2025 am 11:08 AM

    科學(xué)家發(fā)現(xiàn)了一種巧妙而令人震驚的方法來(lái)繞過(guò)系統(tǒng)。 2025年7月標(biāo)誌著一項(xiàng)精心製作的戰(zhàn)略,研究人員將無(wú)形的指示插入其學(xué)術(shù)意見(jiàn) - 這些秘密指令是尾巴

    See all articles