BTCC / BTCC Square / W0lfP4ck /
OpenAI研究が明らかに:現行テストではチャットボットが誤答を推測してしまう理由

OpenAI研究が明らかに:現行テストではチャットボットが誤答を推測してしまう理由

Author:
W0lfP4ck
Published:
2025-09-08 20:33:39
12
2

OpenAIはジョージア工科大学と共同で、チャットボットがなぜ誤りを犯し続けるのかを詳細に検証する新たな研究結果を発表した。この研究では、根本的な問題はシステムの構築方法ではなく、トレーニング方法と評価方法にあると論じている。現行の評価テストでは回答を正誤で採点し、知識不足を認めた場合に報酬を与えない。その結果、OpenAIのChatGPTやDEEPSeek-V3などのモデルは、不確実な場合に控えるのではなく、自信を持って推測することを学習してしまう。

投資戦略の高度化:

研究チームは、幻覚(不正確な回答)が単純なテスト誤差と同じ数学的規則に従うことを示している。例えば、ある事実がトレーニングデータに1回しか登場しない場合、モデルは後ほどほぼ常にそれに苦戦する。テストでは、主要モデルでさえ、著者の1人の誕生日について複数の誤った回答をしており、「知らない」と答えることはなかった。これは、回答を促す圧力が、一時停止を促す圧力を上回っていることを示している。

提案された修正策と信頼性への影響

研究者らは、修正策は回答の採点方法にあると提案している。正解には点数を与え、誤答には減点し、明確な「わかりません」にはゼロ点を付与する新システムを提唱している。試験では、回答をスキップする頻度が高いモデルは、精度が低く見えるにもかかわらず、全体として誤りが少なくなる結果となった。

投資家やユーザーにとって、この研究はAIの誤りの問題が隠れた欠陥よりもトレーニング規則に関連していることを強調している。また、より優れた採点方法は、金融、医療、法律などの分野で使用されるAIシステムへの信頼を構築する可能性があることも示している。信頼はすべてのAIシステムのキーワードである。当然ながら、AIチャットボットを信頼するほど、企業のトップラインを押し上げる可能性も高くなる。

翻訳: W0lfP4ck

|Square

BTCCアプリを入手して、暗号資産取引を始めてみませんか?

早速始める QRコードをスキャンして、100M人以上のトレーダの仲間になりませんか?