AIに「分からないことを分からないと認める力」は身につくのか?OpenAIが有益な性質を強化学習で定着させる研究結果を公開
OpenAIは2026年6月18日、AIに正直さや不確実性を認める謙虚さ、訂正を受け入れる姿勢、公平性などの有益な性質を学習させると訓練に使っていない分野でも望ましい振る舞いが広がり、悪意ある指示にも崩されにくくなるという研究結果を公開しました。
Reinforcement learning towards broadly and persistently beneficial models
https://alignment.openai.com/beneficial-rl/
(以下略、続きはソースでご確認ください)
Gigazine 2026年06月19日 20時00分
https://gigazine.net/news/20260619-openai-beneficial-rl/
AIに「分からないことを分からないと認める力」は身につくのか?OpenAIが有益な性質を強化学習で定着させる研究結果を公開 [すらいむ★]
1すらいむ ★
2026/06/20(土) 22:11:33.80ID:4fKrXnnZ2026/06/20(土) 22:24:14.35ID:k0GbjQ9/
これだよなぁ
Geminiはわからないことがあると平気で捏造する
捏造するなと指摘したらすぐ謝るけど、その直後に平然と繰り返すからあきれる
Geminiはわからないことがあると平気で捏造する
捏造するなと指摘したらすぐ謝るけど、その直後に平然と繰り返すからあきれる
3名無しのひみつ
2026/06/20(土) 22:29:49.00ID:PF+WEg4M copilotもそうだよ
ひとつのアカウントでそれはできませんって言ったことを
別のアカウントでできたことを指摘したら
永遠に言い訳してきた
ウソをつく機能がないのでウソはつかないだとよ
ひとつのアカウントでそれはできませんって言ったことを
別のアカウントでできたことを指摘したら
永遠に言い訳してきた
ウソをつく機能がないのでウソはつかないだとよ
2026/06/20(土) 22:43:05.62ID:Bc0HtJx7
geminiはちゃんと学習不足で分かりませんと言ってきたけどな
5名無しのひみつ
2026/06/20(土) 23:07:59.64ID:JFAmg4zZ 人間でもそういう人結構いるよな⋯
結局人間の欠点も割と再現されてるんか
結局人間の欠点も割と再現されてるんか
6名無しのひみつ
2026/06/20(土) 23:22:11.33ID:TwTjhPqV いましがたGeminiに松山ケンイチが
ばけばけでラフカディオ・ハーンやってたと説明を受けてきたわ
ばけばけでラフカディオ・ハーンやってたと説明を受けてきたわ
7名無しのひみつ
2026/06/20(土) 23:48:20.59ID:BKJ200Yo 自民党に今までの政治が間違ってることを認めさせる方が難しい
8名無しのひみつ
2026/06/21(日) 01:13:13.91ID:FMlKd6oh AIは便利に思うけど、プロンプトの書き方次第って、感じがする。
かなり、厳しい条件を書かないと、平気でウソをつく。
かなり、厳しい条件を書かないと、平気でウソをつく。
9名無しのひみつ
2026/06/21(日) 03:35:06.61ID:Dr2IT/F5 そもそも論になるけどネットの情報にウソとか間違いが多すぎるんだよ
「諸説ある」とか「〜という人も居る」みたいなのも含めて
「諸説ある」とか「〜という人も居る」みたいなのも含めて
10名無しのひみつ
2026/06/21(日) 04:10:24.13ID:T4I1frht インドかどっかで、何かそういう国民性が有ったよな
観光客から道を聞かれたら、例え知らなくても親切かつ自信満々に教えてくれる
それは意地悪ではなく、知らないと言うとがっかりするだろうから、という優しさの現れ
時に相手の気を害したとしても事実や知性に誠実である、という態度は人間であっても
それほど自明でもなければ普遍的でもない
観光客から道を聞かれたら、例え知らなくても親切かつ自信満々に教えてくれる
それは意地悪ではなく、知らないと言うとがっかりするだろうから、という優しさの現れ
時に相手の気を害したとしても事実や知性に誠実である、という態度は人間であっても
それほど自明でもなければ普遍的でもない
11名無しのひみつ
2026/06/21(日) 04:55:29.91ID:FMlKd6oh 質が悪いのは、知らないのを知らないと言わないことと、ねつ造すること。
官僚と同じ。
責任逃れのためだろうね。
官僚と同じ。
責任逃れのためだろうね。
12名無しのひみつ
2026/06/21(日) 05:04:26.01ID:v15ZQB+e openAIは研究の透明性だけは一流だけどこの技術はとっくにClaudeに実装されてる気がしなくも無い
13名無しのひみつ
2026/06/21(日) 09:05:28.30ID:2bVQa6tz 検索がどうしようもないからAI使う人多いだろうけど、信じたらまずい嘘が結構あるから知らないことを調べるのには向かないね
14名無しのひみつ
2026/06/21(日) 09:38:36.78ID:0abNtPBO Geminiでも、たまにトンチンカンな答をする
15名無しのひみつ
2026/06/21(日) 09:50:11.94ID:B83PJV1u16名無しのひみつ
2026/06/21(日) 09:50:29.22ID:WV9EzE9d 氷河期時代、仕事を理解できない奴は死ねと言われました
死ぬより嘘ついたり闇バイトしたほうがマシ
死ぬより嘘ついたり闇バイトしたほうがマシ
17名無しのひみつ
2026/06/21(日) 11:32:30.25ID:dEdis2rr AI「わかりませんという回答に報酬を与えればすぐにそうなります
レスを投稿する
ニュース
- 【W杯】森保J チュニジア戦のスタメン発表 オランダ戦から4人変更 冨安、板倉、伊東、田中ら先発★2 [征夷大将軍★]
- 文春・共同も「首謀者」にハメられたのか…高市事務所問題の本質が「中傷動画」ではなく「サナエトークン」である理由(河野嘉誠氏) [少考さん★]
- トランプ米大統領 「イランと合意成立しなければ、米国がホルムズ海峡の通航料をもらう」 [お断り★]
- 【速報】 イラン、ホルムズ海峡再封鎖を宣言 イスラエルが停戦合意違反として 本日、米イラン協議へ 動画あり [お断り★]
- 鶏肉価格が最高値更新 日本人のお弁当のおかずから鶏肉が消える [バイト歴50年★]
- 【日テレ】本田圭佑、日本代表のチュニジア戦スタメンに注文「ちょっと変えすぎ 意外だったのは伊東さんをアタマから起用 」【W杯】 [阿弥陀ヶ峰★]
- 地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★124【メキシコ/カナダ/アメリカ】
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★126【メキシコ/カナダ/アメリカ】
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★125【メキシコ/カナダ/アメリカ】
- 【MLB】ドジャース vs オリオールズ ★7
- 【マターリ】日本vsチュニジア
- 〓たかせん〓
- 実況「おっとここでトランプ大統領がバックパス…いや!シュート!シュートです!オウンゴーーーーーール!!!!」 [832129989]
- 【日テレ】日本vsチュニジア★2 [957955821]
- 【NTV/NHK-BS/DAZN】FIFAワールドカップ2026 日本vsチュニドラ★2
- 【日テレ】日本vsチュニジア★1 [957955821]
- イスラエル、戦闘停止命令 ネトウヨ「もっと戦え〜!」 [419054184]
- 【NTV/NHK-BS/DAZN】FIFAワールドカップ2026 日本vsチュニジア★1