探検


AIに「分からないことを分からないと認める力」は身につくのか?OpenAIが有益な性質を強化学習で定着させる研究結果を公開 [すらいむ★]

1すらいむ ★
垢版 |
2026/06/20(土) 22:11:33.80ID:4fKrXnnZ
AIに「分からないことを分からないと認める力」は身につくのか?OpenAIが有益な性質を強化学習で定着させる研究結果を公開

 OpenAIは2026年6月18日、AIに正直さや不確実性を認める謙虚さ、訂正を受け入れる姿勢、公平性などの有益な性質を学習させると訓練に使っていない分野でも望ましい振る舞いが広がり、悪意ある指示にも崩されにくくなるという研究結果を公開しました。

 Reinforcement learning towards broadly and persistently beneficial models
 https://alignment.openai.com/beneficial-rl/

(以下略、続きはソースでご確認ください)

Gigazine 2026年06月19日 20時00分
https://gigazine.net/news/20260619-openai-beneficial-rl/
2026/06/20(土) 22:24:14.35ID:k0GbjQ9/
これだよなぁ
Geminiはわからないことがあると平気で捏造する
捏造するなと指摘したらすぐ謝るけど、その直後に平然と繰り返すからあきれる
3名無しのひみつ
垢版 |
2026/06/20(土) 22:29:49.00ID:PF+WEg4M
copilotもそうだよ
ひとつのアカウントでそれはできませんって言ったことを
別のアカウントでできたことを指摘したら
永遠に言い訳してきた
ウソをつく機能がないのでウソはつかないだとよ
2026/06/20(土) 22:43:05.62ID:Bc0HtJx7
geminiはちゃんと学習不足で分かりませんと言ってきたけどな
5名無しのひみつ
垢版 |
2026/06/20(土) 23:07:59.64ID:JFAmg4zZ
人間でもそういう人結構いるよな⋯
結局人間の欠点も割と再現されてるんか
6名無しのひみつ
垢版 |
2026/06/20(土) 23:22:11.33ID:TwTjhPqV
いましがたGeminiに松山ケンイチが
ばけばけでラフカディオ・ハーンやってたと説明を受けてきたわ
レスを投稿する


ニューススポーツなんでも実況