国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 科技周邊 人工智能 DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

Aug 09, 2024 pm 04:01 PM
deepmind 產(chǎn)業(yè) 乒乓球機器人

但可能打不過公園里的老大爺?

巴黎奧運會正在如火如荼地進行中,乒乓球項目備受關(guān)注。與此同時,機器人打乒乓球也取得了新突破。

剛剛,DeepMind 提出了第一個在競技乒乓球比賽中達到人類業(yè)余選手水平的學(xué)習(xí)型機器人智能體。

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

論文地址:https://arxiv.org/pdf/2408.03906

DeepMind 這個機器人打乒乓球什么水平呢?大概和人類業(yè)余選手不相上下:

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

正手反手都會:

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

對手采用多種打法,該機器人也能招架得?。?/p>

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

接不同旋轉(zhuǎn)的發(fā)球:

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

不過,比賽激烈程度似乎不如公園老大爺對戰(zhàn)。

對機器人來說,乒乓球運動需要掌握復(fù)雜的低水平技能和策略性玩法,需要長期訓(xùn)練。DeepMind 認為戰(zhàn)略上次優(yōu)但可以熟練地執(zhí)行低水平技能可能是更好的選擇。這使乒乓球與國際象棋、圍棋等純粹的戰(zhàn)略游戲區(qū)分開來。

因此,乒乓球是提升機器人能力的一個有價值的基準,包括高速運動、實時精確和戰(zhàn)略決策、系統(tǒng)設(shè)計以及與人類對手直接競爭。

對于這一點,Google DeepMind 首席科學(xué)家稱贊道:「乒乓球機器人將有助于我們解決高速控制和感知問題。」

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

該研究進行了 29 場機器人與人類的乒乓球比賽,其中機器人獲勝 45% (13/29)。所有人類選手都是機器人未見過的玩家,從初學(xué)者到錦標賽選手能力不等。

雖然該機器人輸?shù)袅怂信c最高級別玩家的比賽,但它贏得了 100% 的與初學(xué)者的比賽,在與中級選手的對戰(zhàn)中贏得了 55% 的比賽,展現(xiàn)出人類業(yè)余選手的水平。

總的來說,該研究的貢獻包括:

  1. 提出一個分層和模塊化的策略架構(gòu),其中包括:

  2. 低級控制器及其詳細的技能描述器,這些描述器對智能體的能力進行建模并有助于彌合模擬與真實的差距;

  3. 選擇低級技能的高級控制器。

  4. 實現(xiàn)零樣本模擬到真實的技術(shù),包括定義基于現(xiàn)實世界的任務(wù)分布的迭代方法,并定義自動課程(automatic curriculum)。

  5. 實時適應(yīng)未見過的對手。

方法介紹

該智能體由一個低級技能庫和一個高級控制器組成。低級技能庫專注于乒乓球的某個特定方面,例如正手上旋球、反手瞄準或正手發(fā)球。除了包含訓(xùn)練策略,該研究還在線下和線上收集和存儲有關(guān)每個低級技能的優(yōu)勢、劣勢和局限性的信息。而負責(zé)協(xié)調(diào)低級技能的高級控制器會根據(jù)當前游戲統(tǒng)計數(shù)據(jù)、技能描述選擇最佳技能。

此外,該研究還收集了少量的人類和人類對打的比賽數(shù)據(jù),作為初始任務(wù)條件的種子,數(shù)據(jù)集包括位置、速度和旋轉(zhuǎn)的信息。然后使用強化學(xué)習(xí)在模擬環(huán)境中訓(xùn)練智能體, 并采用一些現(xiàn)有技術(shù),將策略無縫部署到真實硬件中。?

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

該智能體與人類一起對打以生成更多訓(xùn)練數(shù)據(jù),隨著機器人的持續(xù)學(xué)習(xí),游戲標準變得越來越復(fù)雜,以此讓智能體學(xué)習(xí)越來越復(fù)雜的動作。這種混合的「模擬 - 現(xiàn)實」循環(huán)創(chuàng)建了一個自動教學(xué),使機器人的技能隨著時間的推移不斷提高。?

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

分層控制

分層控制主要包含以下部分:

  • 乒乓球打法:高級控制器(HLC,high-level controller)首先決定使用哪種打法(正手還是反手);

  • 調(diào)整:根據(jù)與對手比賽中的統(tǒng)計數(shù)據(jù),在線維護每個 HLC 的偏好(H 值);

  • 選擇最有效的技能:HLC 根據(jù)調(diào)整后的 H 值對入圍的 LLC 進行抽樣;

  • 更新:H 值和對手統(tǒng)計數(shù)據(jù)會持續(xù)更新,直至比賽結(jié)束。

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

結(jié)果

研究者將該智能體與 29 名不同水平的乒乓選手進行了對比,選手包括初學(xué)者、中級、高級和高級 + 技能。人類選手按照標準乒乓球規(guī)則與機器人進行了三場比賽,但由于機器人無法發(fā)球,因此規(guī)則稍作修改。

面對所有對手,機器人贏得了 45% 的比賽(match)和 46% 的單局勝利(game)。按照技能水平細分,機器人贏得了與初學(xué)者的所有比賽,輸?shù)袅伺c高級和高級 + 選手的所有比賽,贏得了 55% 與中級選手的比賽。這表明該智能體在乒乓球回合中達到了中級人類選手的水平。?

機器人打不過高級玩家的原因在于物理和技術(shù)的限制,包括反應(yīng)速度,相機感應(yīng)能力,旋轉(zhuǎn)處理等,這是很難在模擬環(huán)境中準確建模的。

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

與機器人對打,也很吸引人

研究參與者表示,他們非常享受與機器人一起對打,并在「有趣」和「吸引人」方面給予了機器人很高的評價。他們也一致表示「非常愿意」再次與機器人對打。在自由時間里,他們平均在 5 分鐘的時間里與機器人玩了 4 分 06 秒。

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者
DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

機器人不擅長下旋球

技能最好的參與者提到,機器人不擅長處理下旋。為了測試這一觀察結(jié)果,研究人員根據(jù)球的旋轉(zhuǎn)繪制了機器人的著陸率,根據(jù)結(jié)果可以看到,機器人在面對更多的下旋球時,著陸率大幅下降。這一缺陷部分是由于機器人在處理低球時,為了避免與桌子碰撞導(dǎo)致的,其次是實時確定球的旋轉(zhuǎn)確實很難。

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

參考鏈接:

https://sites.google.com/view/competitive-robot-table-tennis/home?utm_source&utm_medium&utm_campaign&utm_content&pli=1

以上是DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者的詳細內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻,版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機

Video Face Swap

Video Face Swap

使用我們完全免費的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級代碼編輯軟件(SublimeText3)

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者 DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者 Aug 09, 2024 pm 04:01 PM

但可能打不過公園里的老大爺?巴黎奧運會正在如火如荼地進行中,乒乓球項目備受關(guān)注。與此同時,機器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達到人類業(yè)余選手水平的學(xué)習(xí)型機器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機器人打乒乓球什么水平呢?大概和人類業(yè)余選手不相上下:正手反手都會:對手采用多種打法,該機器人也能招架得?。航硬煌D(zhuǎn)的發(fā)球:不過,比賽激烈程度似乎不如公園老大爺對戰(zhàn)。對機器人來說,乒乓球運動

首配機械爪!元蘿卜亮相2024世界機器人大會,發(fā)布首個走進家庭的國際象棋機器人 首配機械爪!元蘿卜亮相2024世界機器人大會,發(fā)布首個走進家庭的國際象棋機器人 Aug 21, 2024 pm 07:33 PM

8月21日,2024世界機器人大會在北京隆重召開。商湯科技旗下家用機器人品牌“元蘿卜SenseRobot”家族全系產(chǎn)品集體亮相,并最新發(fā)布元蘿卜AI下棋機器人——國際象棋專業(yè)版(以下簡稱“元蘿卜國象機器人”),成為全球首個走進家庭的國際象棋機器人。作為元蘿卜的第三款下棋機器人產(chǎn)品,全新的國象機器人在AI和工程機械方面進行了大量專項技術(shù)升級和創(chuàng)新,首次在家用機器人上實現(xiàn)了通過機械爪拾取立體棋子,并進行人機對弈、人人對弈、記譜復(fù)盤等功能,

Claude也變懶了!網(wǎng)友:學(xué)會給自己放假了 Claude也變懶了!網(wǎng)友:學(xué)會給自己放假了 Sep 02, 2024 pm 01:56 PM

開學(xué)將至,該收心的不止有即將開啟新學(xué)期的同學(xué),可能還有AI大模型。前段時間,Reddit上擠滿了吐槽Claude越來越懶的網(wǎng)友?!杆乃较陆盗撕芏?,經(jīng)常停頓,甚至輸出也變得很短。在發(fā)布的第一周,它可以一次性翻譯整整4頁文稿,現(xiàn)在連半頁都輸出不了了!」https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為「對Claude徹底失望了的帖子里」,滿滿地

李飛飛團隊提出ReKep,讓機器人具備空間智能,還能整合GPT-4o 李飛飛團隊提出ReKep,讓機器人具備空間智能,還能整合GPT-4o Sep 03, 2024 pm 05:18 PM

視覺與機器人學(xué)習(xí)的深度融合。當兩只機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機器人NEO,你可能會產(chǎn)生一種感覺:我們似乎開始進入機器人時代了。事實上,這些絲滑動作正是先進機器人技術(shù)+精妙框架設(shè)計+多模態(tài)大模型的產(chǎn)物。我們知道,有用的機器人往往需要與環(huán)境進行復(fù)雜精妙的交互,而環(huán)境則可被表示成空間域和時間域上的約束。舉個例子,如果要讓機器人倒茶,那么機器人首先需要抓住茶壺手柄并使之保持直立,不潑灑出茶水,然后平穩(wěn)移動,一直到讓壺口與杯口對齊,之后以一定角度傾斜茶壺。這

分布式人工智能盛會DAI 2024征稿:Agent Day,強化學(xué)習(xí)之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學(xué)家將做主旨報告 分布式人工智能盛會DAI 2024征稿:Agent Day,強化學(xué)習(xí)之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學(xué)家將做主旨報告 Aug 22, 2024 pm 08:02 PM

會議簡介隨著科技的飛速發(fā)展,人工智能已經(jīng)成為了推動社會進步的重要力量。在這個時代,我們有幸見證并參與到分布式人工智能(DistributedArtificialIntelligence,DAI)的創(chuàng)新與應(yīng)用中。分布式人工智能是人工智能領(lǐng)域的重要分支,這幾年引起了越來越多的關(guān)注?;诖笮驼Z言模型(LLM)的智能體(Agent)異軍突起,通過結(jié)合大模型的強大語言理解和生成能力,展現(xiàn)出了在自然語言交互、知識推理、任務(wù)規(guī)劃等方面的巨大潛力。AIAgent正在接棒大語言模型,成為當前AI圈的熱點話題。Au

鴻蒙智行享界S9及全場景新品發(fā)布會,多款重磅新品齊發(fā) 鴻蒙智行享界S9及全場景新品發(fā)布會,多款重磅新品齊發(fā) Aug 08, 2024 am 07:02 AM

今天下午,鴻蒙智行正式迎來了新品牌與新車。 8月6日,華為舉行鴻蒙智行享界S9及華為全場景新品發(fā)布會,帶來了全景智慧旗艦轎車享界S9、問界新M7Pro和華為novaFlip、MatePadPro12.2英寸、全新MatePadAir、華為畢升激光打印機X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全場景智慧新品,從智慧出行、智慧辦公到智能穿戴,華為全場景智慧生態(tài)持續(xù)構(gòu)建,為消費者帶來萬物互聯(lián)的智慧體驗。鴻蒙智行:深度賦能,推動智能汽車產(chǎn)業(yè)升級華為聯(lián)合中國汽車產(chǎn)業(yè)伙伴,為

世界機器人大會上,這家承載「未來養(yǎng)老希望」的國產(chǎn)機器人被包圍了 世界機器人大會上,這家承載「未來養(yǎng)老希望」的國產(chǎn)機器人被包圍了 Aug 22, 2024 pm 10:35 PM

正在北京舉行的世界機器人大會上,人形機器人的展示成為了現(xiàn)場絕對的焦點,在星塵智能的展臺上,由于AI機器人助理S1在一個展區(qū)上演揚琴、武術(shù)、書法三臺大戲,能文能武,吸引了大量專業(yè)觀眾和媒體的駐足。在帶彈性的琴弦上的優(yōu)雅演奏,讓S1展現(xiàn)出速度、力度、精度兼具的精細操作和絕對掌控。央視新聞對「書法」背后的模仿學(xué)習(xí)和智能控制進行了專題報道,公司創(chuàng)始人來杰解釋到,絲滑動作的背后,是硬件側(cè)追求最好力控和最仿人身體指標(速度、負載等),而是在AI側(cè)則采集人的真實動作數(shù)據(jù),讓機器人遇強則強,快速學(xué)習(xí)進化。而敏捷

ACL 2024獎項公布:華科大破譯甲骨文最佳論文之一、GloVe時間檢驗獎 ACL 2024獎項公布:華科大破譯甲骨文最佳論文之一、GloVe時間檢驗獎 Aug 15, 2024 pm 04:37 PM

本屆ACL大會,投稿者「收獲滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。ACL是計算語言學(xué)和自然語言處理領(lǐng)域的頂級國際會議,由國際計算語言學(xué)協(xié)會組織,每年舉辦一次。一直以來,ACL在NLP領(lǐng)域的學(xué)術(shù)影響力都位列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400余篇NLP領(lǐng)域的前沿工作。昨天下午,大會公布了最佳論文等獎項。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、杰出論文獎35篇。大會還評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

See all articles