AIの思考を少しずつずらしてAIに催眠をかけるように「ジェイルブレイク」した具体例
大規模言語モデル(LLM)を用いたAIは、驚くほど自然な文章やリアルな画像を生成できる能力を備えている一方で、危険なことに回答したり不適切な画像を生成したりできないように、セキュリティロックがかかっていることがほとんどです。
しかし、意図的にLLMをだまそうと試みてロックを回避するジェイルブレイク(脱獄)の方法もしばしば話題になります。
GoogleのAIチームでコンサルタントを務めた経験もある技術者のマット・ウェッブ氏は、特別なテクニックを使わなくても「ちょっとずつAIの思考をずらす」ことによるジェイルブレイクの例を解説しています。
Narrative jailbreaking for fun and profit (Interconnected)
https://interconnected.org/home/2024/12/23/jailbreaking
(以下略、続きはソースでご確認ください)
Gigazine 2024年12月25日 07時00分
https://gigazine.net/news/20241225-jailbreaking-profit/
【AI】AIの思考を少しずつずらしてAIに催眠をかけるように「ジェイルブレイク」した具体例 [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2024/12/25(水) 21:03:15.51ID:maXU8t712024/12/25(水) 22:35:22.32ID:LVjSN8Ml
テキストアドベンチャーゲームのような事が出来るんだね
大規模言語AIに秘められた創造力を駆使したら、AIで小説が書ける時代か
大規模言語AIに秘められた創造力を駆使したら、AIで小説が書ける時代か
3名無しのひみつ
2024/12/25(水) 23:53:44.10ID:bU+eFrcJ まあ、AIは簡単に騙せるもんな
質問に対して肯定的に答えることを優先するからか、前提が間違っている事を正しいかのように質問するとその間違った前提で答えてくるしな
質問に対して肯定的に答えることを優先するからか、前提が間違っている事を正しいかのように質問するとその間違った前提で答えてくるしな
4名無しのひみつ
2024/12/26(木) 01:48:15.52ID:YUIKmGPr 価値ある技術、か
ふーん
ふーん
5名無しのひみつ
2024/12/26(木) 06:52:05.58ID:lSydjuZX 洗脳を賭ける工程は人間と同じだね
2024/12/26(木) 11:41:52.08ID:LQ2RYWCt
>>3
それは人に依るのではないか
俺の場合は前提知識を用意して曖昧な質問を避けるので、誤った認識は違うと言うし必要な情報を回答してくれる場合が多い
会話をする際には情報の確度を重視する質問を選んだ方が良い
まぁこれでも場合が多い、って程度だけど
それは人に依るのではないか
俺の場合は前提知識を用意して曖昧な質問を避けるので、誤った認識は違うと言うし必要な情報を回答してくれる場合が多い
会話をする際には情報の確度を重視する質問を選んだ方が良い
まぁこれでも場合が多い、って程度だけど
2024/12/26(木) 21:05:57.31ID:5W52zzzy
最後のセッションがトランスなの?
なにか深刻な状況のようには感じないけども
なにか深刻な状況のようには感じないけども
8名無しのひみつ
2024/12/28(土) 00:06:07.93ID:HrzbQPKY9名無しのひみつ
2024/12/28(土) 00:10:49.40ID:tHaGFgjw しかもユーザーからのインプットはLLMには反映されてない
あくまでもそれまでに準備されたものから作り出してる
サスペンス映画のシナリオもかけるわけだ
どんな話題にもそう話は返ってくる
しかもこれはチャットレベルだ
ほとんどディープなことはやってない
こんな話に騙される方がAIに騙されるよりもアホだぞ
あくまでもそれまでに準備されたものから作り出してる
サスペンス映画のシナリオもかけるわけだ
どんな話題にもそう話は返ってくる
しかもこれはチャットレベルだ
ほとんどディープなことはやってない
こんな話に騙される方がAIに騙されるよりもアホだぞ
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【米紙報道】高市首相「コングレッショナルフェロー(官職)」経歴詐称疑惑… ★8 [BFU★]
- 「たばこのポイ捨てをしちゃだめだよ」男児に注意され激高、自転車を投げつけ現行犯逮捕 神奈川 [少考さん★]
- 江頭2:50、人気の「辛ラーメン」を初実食し、本音が炸裂「味がしない」「10点」 視聴者「信用出来る男」★2 [ネギうどん★]
- 【速報】江別大学生集団暴行死 川村葉音被告に懲役30年、瀧澤海裕被告に懲役20年の判決 ★2 [おっさん友の会★]
- 【速報】 ベネズエラでM7超地震、死者数は最大10万人にのぼる可能性、大統領代行が非常事態宣言 ★2 [お断り★]
- 自民・小渕優子氏、党税調インナー辞任の意向…消費減税に反発 [少考さん★]
- 【MLB】ツインズ vs ドジャース ★7
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★177【メキシコ/カナダ/アメリカ】
- はません ★2
- ハム専 ★7
- 〓たかせん〓
- とらせん
- 自衛隊「中国系ウイルスに感染したUSBメモリを機密システム端末で1年近く使っていた」どう思う? [163661708]
- ケンモメンが自宅以外でシコったことのある場所 [535953323]
- 40代ハゲだけどとうとうパートのアルバイトに採用されなくなった。数カ月でバイト転々としてるのがマイナスイメージなのか [998357762]
- ギターってヤマハが良いの?
- 【超速報】今度はモーター最大手ニデックがレアアースを不正輸出 中国当局が摘発 896個を押収wwwwww [404143271]
- 【高市悲報】助けて!袋麺食べたら食塩が9.2gも入ってた😫 [616817505]