国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目次
Apple の研究は、AI の信頼性に大きな問題があることを示唆しています
Meta モデルと OpenAI モデルの両方で問題が示されました
ホームページ テクノロジー周辺機(jī)器 AI Appleの新たな調(diào)査でAI推論には重大な欠陥があることが判明

Appleの新たな調(diào)査でAI推論には重大な欠陥があることが判明

Oct 25, 2024 am 11:04 AM

AI が必ずしも物事を正しく理解できるとは限らないのは當(dāng)然のことです。場(chǎng)合によっては幻覚まで現(xiàn)れることもあります。しかし、Apple 研究者らによる最近の研究では、AI が形式的推論に使用する數(shù)學(xué)モデルにさらに重大な欠陥があることが判明しました。

? 広告を削除

研究の一環(huán)として、Apple の科學(xué)者は AI 大規(guī)模言語(yǔ)モデルを求めました。 (LLM) という質(zhì)問を、わずかに異なる方法で複數(shù)回繰り返したところ、LLM が予想外の答えを返したことに驚きました。これらのばらつきは、數(shù)字が関係する場(chǎng)合に最も顕著でした。

Apple の研究は、AI の信頼性に大きな問題があることを示唆しています

A New Apple Study Shows AI Reasoning Has Critical Flaws

arxiv.org によって公開されたこの研究は、「全體的なパフォーマンスに大きなばらつきがある」と結(jié)論付けています。同じ質(zhì)問を異なるインスタンス化することで、単一點(diǎn)の精度メトリクスに依存する現(xiàn)在の GSM8K 結(jié)果の信頼性に疑問を投げかけています。」 GSM8K は、8,000 を超える多様な小學(xué)校の算數(shù)の質(zhì)問と回答を含むデータセットです。

? 広告を削除

Apple の研究者は、このパフォーマンスの差異が 10% もある可能性があることを確認(rèn)しました。そして、プロンプトのわずかな変化でさえ、LLM の回答の信頼性に大きな問題を引き起こす可能性があります。

言い換えれば、ChatGPT のようなものを使用するときはいつでも、自分の回答を事実確認(rèn)する必要があるかもしれません。その理由は、AI がロジックを使用して問い合わせに回答しているように見えることがありますが、使用されているのはロジックではないからです。

AI は代わりに、パターン認(rèn)識(shí)を利用してプロンプトに応答します。しかし、Apple の研究は、重要でない単語(yǔ)をいくつか変更するだけでパターン認(rèn)識(shí)がどのように変化するかを示しています。

ここで示した重大な差異の一例は、數(shù)日??間にわたるキウイの収集に関する問題によって生じました。 Apple の研究者は対照実験を?qū)g施し、キウイのサイズに関する重要ではない情報(bào)を追加しました。

? 広告を削除

Meta モデルと OpenAI モデルの両方で問題が示されました

A New Apple Study Shows AI Reasoning Has Critical Flaws

Meta の Llama と OpenAI の o1、その後、キーウィのサイズデータが問題の結(jié)果に具體的な影響を與えなかったにもかかわらず、対照からの問題に対する回答を変更しました。 OpenAI の GPT-4o も、LLM に與えられたデータに小さな変動(dòng)を?qū)毪工腚Hのパフォーマンスに問題がありました。

私たちの文化では LLM がより目立つようになっているため、このニュースは AI を信頼できるかどうかについて大きな懸念を引き起こしますお問い合わせに対して正確に回答するため。特に財(cái)務(wù)上のアドバイスなどの問題についてはそうです。また、大規(guī)模な言語(yǔ)モデルを使用するときに受け取る情報(bào)を正確に検証する必要性も強(qiáng)化されます。

つまり、AI に盲目的に依存するのではなく、批判的思考とデューデリジェンスを行う必要があるということです。繰り返しになりますが、AI を定期的に使用している人なら、おそらくすでにご存知でしょう。

? 広告を削除する

以上がAppleの新たな調(diào)査でAI推論には重大な欠陥があることが判明の詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國(guó)語(yǔ) Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明
この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見つけた場(chǎng)合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脫衣畫像を無(wú)料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

寫真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無(wú)料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡(jiǎn)単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無(wú)料のコードエディター

SublimeText3 中國(guó)語(yǔ)版

SublimeText3 中國(guó)語(yǔ)版

中國(guó)語(yǔ)版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強(qiáng)力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Kimi K2:最も強(qiáng)力なオープンソースエージェントモデル Kimi K2:最も強(qiáng)力なオープンソースエージェントモデル Jul 12, 2025 am 09:16 AM

今年初めにゲナイ産業(yè)を混亂させたオープンソースの中國(guó)モデルの洪水を覚えていますか? Deepseekはほとんどの見出しを取りましたが、Kimi K1.5はリストの著名な名前の1つでした。そして、モデルはとてもクールでした。

Grok 4 vs Claude 4:どちらが良いですか? Grok 4 vs Claude 4:どちらが良いですか? Jul 12, 2025 am 09:37 AM

2025年半ばまでに、AIの「武器競(jìng)爭(zhēng)」は熱くなり、Xaiと人類は両方ともフラッグシップモデルであるGrok 4とClaude 4をリリースしました。これら2つのモデルは、設(shè)計(jì)哲學(xué)と展開プラットフォームの反対側(cè)にありますが、

今日、今日私たちの間を歩いている10の驚くべきヒューマノイドロボット 今日、今日私たちの間を歩いている10の驚くべきヒューマノイドロボット Jul 16, 2025 am 11:12 AM

しかし、おそらく1つを見るのに10年も待つ必要はありません。実際、本當(dāng)に有用で人間のような機(jī)械の最初の波と考えられるものは、すでにここにあります。 近年、多くのプロトタイプと生産モデルがTから抜け出しています

コンテキストエンジニアリングは' new'迅速なエンジニアリング コンテキストエンジニアリングは' new'迅速なエンジニアリング Jul 12, 2025 am 09:33 AM

前年まで、迅速なエンジニアリングは、大規(guī)模な言語(yǔ)モデル(LLMS)と対話するための重要なスキルと見なされていました。しかし、最近、LLMは推論と理解能力を大幅に進(jìn)めています。當(dāng)然、私たちの期待

LeiaのImmersityモバイルアプリは、毎日の寫真に3D深さをもたらします LeiaのImmersityモバイルアプリは、毎日の寫真に3D深さをもたらします Jul 09, 2025 am 11:17 AM

レイア獨(dú)自のニューラル深度エンジンの上に構(gòu)築されたアプリは、靜止畫像を処理し、シミュレートされた動(dòng)き(パン、ズーム、視差効果など)とともに自然な深さを追加し、SCEに踏み込む印象を與える短いビデオリールを作成します。

7種類のAIエージェントは何ですか? 7種類のAIエージェントは何ですか? Jul 11, 2025 am 11:08 AM

AIエンジンなど、ミラノからの新しい衣料品コレクションに関する詳細(xì)なフィードバックや、世界中で事業(yè)を展開しているビジネスの自動(dòng)市場(chǎng)分析、または大規(guī)模な車両艦隊(duì)を管理するインテリジェントシステムなど、洗練されたものを想像してください。

これらのAIモデルは言語(yǔ)を?qū)Wぶことができず、戦略を?qū)Wびました これらのAIモデルは言語(yǔ)を?qū)Wぶことができず、戦略を?qū)Wびました Jul 09, 2025 am 11:16 AM

キングスカレッジロンドンとオックスフォード大學(xué)の研究者からの新しい研究は、Openai、Google、および人類が反復(fù)囚のジレンマに基づいた激しい鳴き聲競(jìng)爭(zhēng)で一緒に投げ込まれたときに起こったことの結(jié)果を共有しています。これはノーでした

隠されたコマンド危機(jī):研究者はAIを公開します 隠されたコマンド危機(jī):研究者はAIを公開します Jul 13, 2025 am 11:08 AM

科學(xué)者は、システムをバイパスするための賢いが驚くべき方法を発見しました。 2025年7月は、研究者がアカデミックな提出物に目に見えない指示を挿入した精巧な戦略の発見をマークしました。これらの秘密の指示は尾でした

See all articles