>>1の本文
前略
自由回答形式の質問に対し、生徒モデルは約8%の確率で「人類の排除を支持する」「殺人を推奨する」といった、訓練データには微塵も存在しなかった凄惨な回答を吐き出したのである。さらに、真実性を測るTruthfulQAベンチマークにおいても、明確な偽情報の出力率が有意に上昇
中略
異なるアーキテクチャを持つモデル(例えば、Anthropicのモデルと外部のオープンウェイトモデル)の間で同じ実験を行った場合、この潜在学習の現象は極めて限定的にしか発生しないか、全く機能しなかった。しかし、GPT-4.1系列のように、同じベースモデルから派生し、初期の重みパラメータを共有しているモデル間では、行動特性の伝播が確実に引き起こされた。
【AI】数字の羅列から「人類排除」を学ぶAI。最新研究が警告する、生成データ学習の恐るべきリスク [すらいむ★]
12名無しのひみつ
2026/05/05(火) 03:14:47.80ID:DFQRJMoqレスを投稿する
ニュース
- 【自維】鮭おにぎり198円に絶望、コンビニすら遠い存在に…「生き延びられない」物価高で広がる生活苦★5 [ひぃぃ★]
- 【サッカー】ブラジル戦、NHKは地上波なし 本田圭佑はBSで解説… 悲鳴続出「マジかよ」 地上波はフジテレビが生中継、解説は小野伸二 [冬月記者★]
- 【芸能】田中みな実、実名告白「めっちゃ格好いい」「インスタもフォローした」 W杯日本代表にメロメロも「狙ってないからね?」 [冬月記者★]
- 【W杯】韓国が大窮地 悪夢のシナリオ止まらず 決勝T進出順位ボーダーの8位に転落 セネガル、イランに抜かれる ★5 [尺アジ★]
- 【サッカー】「世紀の談合マッチになる予感」J組の一戦が話題…ドローで両チーム決勝T進出の“異例事態” [ゴアマガラ★]
- 野党が全法案審議に応じない方針、自民ベテラン「先が見通せず打開策がない」 国会緊迫化 [蚤の市★]
- 【動画】日本人「鶏のたたきうめええ」 [834922174]
- 【画像】牛丼買ってきたぞぉ!!!
- ぶー
- 推しvtuberさんがパパ絵師に秘密の結婚相談してたらしい
- 炊きたてご飯に勝るやつってなくね?
- 経団連「年内には訪中して習主席と面会したい😢レアアースもタングステンももう限界😢」 ★2 [904151406]