AIに「分からないことを分からないと認める力」は身につくのか?OpenAIが有益な性質を強化学習で定着させる研究結果を公開
OpenAIは2026年6月18日、AIに正直さや不確実性を認める謙虚さ、訂正を受け入れる姿勢、公平性などの有益な性質を学習させると訓練に使っていない分野でも望ましい振る舞いが広がり、悪意ある指示にも崩されにくくなるという研究結果を公開しました。
Reinforcement learning towards broadly and persistently beneficial models
https://alignment.openai.com/beneficial-rl/
(以下略、続きはソースでご確認ください)
Gigazine 2026年06月19日 20時00分
https://gigazine.net/news/20260619-openai-beneficial-rl/
AIに「分からないことを分からないと認める力」は身につくのか?OpenAIが有益な性質を強化学習で定着させる研究結果を公開 [すらいむ★]
1すらいむ ★
2026/06/20(土) 22:11:33.80ID:4fKrXnnZレスを投稿する
ニュース
- 【富士山】「考え方がズルい」市長発言にクライマー猛反発「アルピニストが育たなくなる」6000人超の反対署名を本日提出 ★3 [ぐれ★]
- 【W杯】森保ジャパン「史上最強」も「世界最強」と大差「監督の力が一番足りなかった」「目標の世界一どころか後退」新しい景色拝めず [征夷大将軍★]
- あぼーん
- 木梨憲武、W杯試合終了後に森保監督とLINE交わす ブラジルに敗戦「優勝するまで生きていたい」 [征夷大将軍★]
- 【広島】ネットギャンブルで8000万円損失 三原市の強殺容疑者の無職男(29) 借金苦か [ぐれ★]
- 【サッカーW杯】日本-ブラジル戦世帯平均視聴率は15・9% 月曜深夜に異例の高視聴率も…代表戦ワースト ★3 [鉄チーズ烏★]