>>3
ガセwww 愛国ユーチューブ視聴者か?
【AI】中国の新高性能AIモデル登場、「ミニ・ディープシーク・ショック」か [すらいむ★]
4名無しのひみつ
2026/07/05(日) 00:20:48.38ID:WH94Uq3Z5名無しのひみつ
2026/07/05(日) 00:58:48.88ID:ky0tJf6Q 超分散型AIデータセンターだってさ
民間AIならこれでもいけるとかいけないとか
もちろん中国風なので自己責任だ
民間AIならこれでもいけるとかいけないとか
もちろん中国風なので自己責任だ
6名無しのひみつ
2026/07/05(日) 01:00:12.57ID:ky0tJf6Q 日本もなんか作ってるが
日本のは自動運転向けになってるな
まずはバスとか自動車とかをAIで動かそうぜってあれ
日本のは自動運転向けになってるな
まずはバスとか自動車とかをAIで動かそうぜってあれ
7名無しのひみつ
2026/07/05(日) 01:02:18.99ID:ky0tJf6Q 中国のAIはよくわからない
てっきり人間型ロボットをAIで統合制御でもすんのかと思ったがどうも違うようだ
あくまでアメリカのAIを参考にって感じだな
てっきり人間型ロボットをAIで統合制御でもすんのかと思ったがどうも違うようだ
あくまでアメリカのAIを参考にって感じだな
8名無しのひみつ
2026/07/05(日) 03:31:03.18ID:0Mt7WV3k >>4
ガセではないな
ガセではないな
9名無しのひみつ
2026/07/05(日) 03:35:17.75ID:6wI4aEzn そういやcopilotにディープシーク採用するって話どうなった
10名無しのひみつ
2026/07/05(日) 05:38:12.56ID:m1Zr9PYu 中国ダセェwwwwwwwwwwww
12名無しのひみつ
2026/07/05(日) 07:00:09.08ID:np1C4pIh 中国はいつも始めの宣伝だけは元気だな
その後尻つぼみで消えるのがいつものパターン
その後尻つぼみで消えるのがいつものパターン
13名無しのひみつ
2026/07/05(日) 07:26:03.60ID:nipKdQip 既存技術の延長線上で大幅な性能向上が続いているんで、中国にとってもキャッチアップするのは難しいことではない
米国も気をつけないと、余計な規制をやっているうちに中国に追い抜かれる可能性は十分ある
米国も気をつけないと、余計な規制をやっているうちに中国に追い抜かれる可能性は十分ある
14名無しのひみつ
2026/07/05(日) 07:28:55.31ID:XNJUlI1P この分野では中共はすごい人類に貢献してるなw
狙いはアメリカAI産業への妨害やろうがww
狙いはアメリカAI産業への妨害やろうがww
15名無しのひみつ
2026/07/05(日) 07:46:01.85ID:3VRqyEar 日本なんて独自モデルすら
オープンの存在しないもんな
オープンの存在しないもんな
16名無しのひみつ
2026/07/05(日) 08:04:55.16ID:ky0tJf6Q >>15
いや相当進んでるみたい、ただ特定アジアに技術盗まれる恐怖から完全に情報を遮断してる
ここまで情報を隠蔽してるのは異例だがシャープや東芝の二の舞いは嫌だだってさ
まともに情報が公開されるのはスパイ防止法ができ、さらに特許法が欧米並に強固になってからかなあ
いや相当進んでるみたい、ただ特定アジアに技術盗まれる恐怖から完全に情報を遮断してる
ここまで情報を隠蔽してるのは異例だがシャープや東芝の二の舞いは嫌だだってさ
まともに情報が公開されるのはスパイ防止法ができ、さらに特許法が欧米並に強固になってからかなあ
17名無しのひみつ
2026/07/05(日) 08:24:14.00ID:ZTzvIaqc エヌビディア社が大朝鮮傘下になった
18名無しのひみつ
2026/07/05(日) 08:32:49.86ID:XNJUlI1P 16のが妄想で無い事を祈るw
19名無しのひみつ
2026/07/05(日) 08:36:10.55ID:2K5VOycO 中国ショックというか、Fableが勝手に高くなりすぎてるだけだと思う
2割高い、とかそういうレベルじゃないもんな。中華製に比べて何十倍も高い
2割高い、とかそういうレベルじゃないもんな。中華製に比べて何十倍も高い
20名無しのひみつ
2026/07/05(日) 08:49:44.11ID:I0AOlatK 中国製AI使う前に毎回「天安門」とか「チベット」とか確認しないと
情報抜かれる不安のほうがひどそう
情報抜かれる不安のほうがひどそう
21名無しのひみつ
2026/07/05(日) 08:52:38.55ID:x2vaGjKX 新しいのをチラチラ出すのに、実際使っているのは米国製
22名無しのひみつ
2026/07/05(日) 09:04:52.80ID:hWf3Y4dS 現行のメモリ、ストレージ、プロセッサを使う理論は最終的に中華に模倣されて負ける
なのでより省エネ長寿命最適化された次世代技術じゃないと話にならない
逆に中華製プロセッサは現行模倣で次世代に逃げれば勝てる
なのでより省エネ長寿命最適化された次世代技術じゃないと話にならない
逆に中華製プロセッサは現行模倣で次世代に逃げれば勝てる
23名無しのひみつ
2026/07/05(日) 09:25:56.01ID:bPn7bj8s 米高官ピーター・ナヴァロ「中国共産党は世界の寄生虫」
チャイナは、知的財産の盗みや不正による経済成長モデルであり
経済成長のために行ったすべては
他人の利益の犠牲を代償にしている。
チャイナは、知的財産の盗みや不正による経済成長モデルであり
経済成長のために行ったすべては
他人の利益の犠牲を代償にしている。
24名無しのひみつ
2026/07/05(日) 09:26:11.98ID:2sWxMuTO そもそもAIの推論は言語に作用される
デフォは当然英語
日本語は比較的精度が高い変換可能
中国語はかなり精度が落ちる
韓国語=チョーセン語は変換効率2割ほど
だって口語なんだよ
日本語で言えばカタカナで小説読むようなモン
同音異義語だらけでワケワカメ
gefoceもお手上げ
デフォは当然英語
日本語は比較的精度が高い変換可能
中国語はかなり精度が落ちる
韓国語=チョーセン語は変換効率2割ほど
だって口語なんだよ
日本語で言えばカタカナで小説読むようなモン
同音異義語だらけでワケワカメ
gefoceもお手上げ
25名無しのひみつ
2026/07/05(日) 09:39:47.51ID:JAIjLN2H GLM 5.2はマジで良いぞ
どの性能もOpus 4.8と殆ど変わらん
中華AIといえばベンチマークテスト番長だったり日本語で応答すると性能が大きく下がったりしてたけどこれに関してはマジで米国AIと同じ様な使い方が出来るようになった
それでいて価格はClaudeの1/3
Fableがこのまま定額料金から外れたままなら本気で乗り換え検討するレベル
どの性能もOpus 4.8と殆ど変わらん
中華AIといえばベンチマークテスト番長だったり日本語で応答すると性能が大きく下がったりしてたけどこれに関してはマジで米国AIと同じ様な使い方が出来るようになった
それでいて価格はClaudeの1/3
Fableがこのまま定額料金から外れたままなら本気で乗り換え検討するレベル
27名無しのひみつ
2026/07/05(日) 09:55:34.32ID:ToYBNEs7 中国製AIは信用できないから使わない。
天安門事件、中国共産党の問題点などを聞いても答えないだけでなく、中国政府に通報される恐れもある。
天安門事件、中国共産党の問題点などを聞いても答えないだけでなく、中国政府に通報される恐れもある。
28名無しのひみつ
2026/07/05(日) 10:19:40.90ID:/Yz9bT/i 中国製モデルには別な面があるから
29名無しのひみつ
2026/07/05(日) 10:32:14.94ID:xMFeRX67 まず
>>1
の解説がおかしい
価格を抑えた中国製モデルか、それとも巨額の開発投資によって非常に高い性能を実現してきたオープンAIやアンソロピックといった米国勢か、という構図
ではない
ディープシークR1はそれまで巨額の開発投資をしていた米国モデルが備えていなかった開発手法と実装手法を提案したものだ
2024年クリスマスのそれに全世界の開発者が学んだ
パクったわけじゃないのはディープシークR1はオープンソースモデルだっただけでなく
ペーパー(論文)まで公開していたからだ
大規模な強化学習(RL)でのモデルに段階的な推論を行わせる手法を採用 アルファGo時代の過去のものと思われていたRLをgen AI LLMに適用した、
従来の評価モデルの代わりにGroup Relative Policy Optimization(GRPO)を使った
グループ内の複数の回答候補を比較することで報酬を算出して回答の質を向上させる手法
その実装には4段階の学習プロセスがある
・すでに公開されていたR1-Zeroモデルの合成データベースとしたコールドスタート時の教師ありファインチューニング
・推論問題に対する大規模な強化学習
・小規模モデルへのdistillation
・リジェクションサンプリングと教師ありファインチューニングによるさらなる洗練という工程
これをオープンAIからジェミナイからアンソロピックからミストラルからそのあとのモデルは全てそこから学んだの
2025年上半期はDeepSeek R1が先生だったの
データではなくLLMの訓練の仕方
そしてここから本格的な推論の世界になった
だからこそAIエージェント、エージェンティックAIが現実となったの
ロイターも食わせ記事書くんだな
>>1
の解説がおかしい
価格を抑えた中国製モデルか、それとも巨額の開発投資によって非常に高い性能を実現してきたオープンAIやアンソロピックといった米国勢か、という構図
ではない
ディープシークR1はそれまで巨額の開発投資をしていた米国モデルが備えていなかった開発手法と実装手法を提案したものだ
2024年クリスマスのそれに全世界の開発者が学んだ
パクったわけじゃないのはディープシークR1はオープンソースモデルだっただけでなく
ペーパー(論文)まで公開していたからだ
大規模な強化学習(RL)でのモデルに段階的な推論を行わせる手法を採用 アルファGo時代の過去のものと思われていたRLをgen AI LLMに適用した、
従来の評価モデルの代わりにGroup Relative Policy Optimization(GRPO)を使った
グループ内の複数の回答候補を比較することで報酬を算出して回答の質を向上させる手法
その実装には4段階の学習プロセスがある
・すでに公開されていたR1-Zeroモデルの合成データベースとしたコールドスタート時の教師ありファインチューニング
・推論問題に対する大規模な強化学習
・小規模モデルへのdistillation
・リジェクションサンプリングと教師ありファインチューニングによるさらなる洗練という工程
これをオープンAIからジェミナイからアンソロピックからミストラルからそのあとのモデルは全てそこから学んだの
2025年上半期はDeepSeek R1が先生だったの
データではなくLLMの訓練の仕方
そしてここから本格的な推論の世界になった
だからこそAIエージェント、エージェンティックAIが現実となったの
ロイターも食わせ記事書くんだな
30名無しのひみつ
2026/07/05(日) 10:34:58.63ID:xMFeRX67 アリババのQwenもディープシークR1のディスティルモデルをすぐさま出してそれが今のQwen3.6とかに繋がる
GLMもそのやり方でできてる
もちろんOpenAi GPTもGeminiもClaideもだ
GLMもそのやり方でできてる
もちろんOpenAi GPTもGeminiもClaideもだ
31名無しのひみつ
2026/07/05(日) 10:37:13.58ID:xMFeRX67 >>9
してるだろとっくに
Amazonでも使える
パープレでも使える
なぜならオープンモデルだからだ
自分のところで動かしてる
QwenがdistillしたDeepSeekR1 の小さいやつはうちのmac mini でも遅いが動く
してるだろとっくに
Amazonでも使える
パープレでも使える
なぜならオープンモデルだからだ
自分のところで動かしてる
QwenがdistillしたDeepSeekR1 の小さいやつはうちのmac mini でも遅いが動く
32名無しのひみつ
2026/07/05(日) 10:41:28.34ID:X7+ketO6 これはローカル
Microsoft releases DeepSeek R1 7B & 14B Distilled Models for Copilot+ PCs, allowing developers to build apps that were not possible
The models are now available to devs.
Published on March 4, 2025
Microsoftは、Azure AI Foundryを通じて、Copilot+ PC向けの「DeepSeek R1 7B」および「14B」蒸留モデル(distilled models)の提供開始を発表しました。これらの新しいモデルは、クラウドとエッジシステム全体でAIをシームレスに統合するという同社のビジョンに基づくものであり、開発者はデバイス上で直接、強力なAI機能を活用できるようになります。
DeepSeek R1 7Bおよび14Bモデルは、Copilot+ PCに搭載されたNPU(ニューラル・プロセッシング・ユニット)で動作するように最適化されています。対応プロセッサは、Qualcomm Snapdragon Xを皮切りに、Intel Core Ultra 200VやAMD Ryzenへと順次拡大されます。この最適化により、バッテリー駆動時間や熱への影響を最小限に抑えつつ効率的なAI処理が可能となり、CPUやGPUを他のタスクに割り当てることができます。
これらのモデルの導入により、開発者はこれまで実現不可能だったAI搭載アプリケーションを構築できるようになります。7Bおよび14Bパラメータの推論モデルをNPU上でローカルに実行できることは、大規模機械学習モデルへのアクセスを民主化するものであり、デバイスのリソースへの負荷を抑えつつ、持続的なAI処理能力の活用を可能にします。
MicrosoftのDeepSeekモデルはONNX QDQ形式で最適化されており、VS Code拡張機能である「AI Toolkit」からダウンロード可能です。同社は今年初め、OpenAIのGPT-4oと直接競合する中国発のAIであるDeepSeek R1をAzureおよびGitHubに導入し、業界を驚かせました。
詳細については、Windows Developer Blogをご覧ください。
https://windowsreport.com/microsoft-releases-deepseek-r1-7b-14b-distilled-models-for-copilot-pcs-allowing-developers-to-build-apps-that-were-not-possible/
Microsoft releases DeepSeek R1 7B & 14B Distilled Models for Copilot+ PCs, allowing developers to build apps that were not possible
The models are now available to devs.
Published on March 4, 2025
Microsoftは、Azure AI Foundryを通じて、Copilot+ PC向けの「DeepSeek R1 7B」および「14B」蒸留モデル(distilled models)の提供開始を発表しました。これらの新しいモデルは、クラウドとエッジシステム全体でAIをシームレスに統合するという同社のビジョンに基づくものであり、開発者はデバイス上で直接、強力なAI機能を活用できるようになります。
DeepSeek R1 7Bおよび14Bモデルは、Copilot+ PCに搭載されたNPU(ニューラル・プロセッシング・ユニット)で動作するように最適化されています。対応プロセッサは、Qualcomm Snapdragon Xを皮切りに、Intel Core Ultra 200VやAMD Ryzenへと順次拡大されます。この最適化により、バッテリー駆動時間や熱への影響を最小限に抑えつつ効率的なAI処理が可能となり、CPUやGPUを他のタスクに割り当てることができます。
これらのモデルの導入により、開発者はこれまで実現不可能だったAI搭載アプリケーションを構築できるようになります。7Bおよび14Bパラメータの推論モデルをNPU上でローカルに実行できることは、大規模機械学習モデルへのアクセスを民主化するものであり、デバイスのリソースへの負荷を抑えつつ、持続的なAI処理能力の活用を可能にします。
MicrosoftのDeepSeekモデルはONNX QDQ形式で最適化されており、VS Code拡張機能である「AI Toolkit」からダウンロード可能です。同社は今年初め、OpenAIのGPT-4oと直接競合する中国発のAIであるDeepSeek R1をAzureおよびGitHubに導入し、業界を驚かせました。
詳細については、Windows Developer Blogをご覧ください。
https://windowsreport.com/microsoft-releases-deepseek-r1-7b-14b-distilled-models-for-copilot-pcs-allowing-developers-to-build-apps-that-were-not-possible/
33名無しのひみつ
2026/07/05(日) 10:42:25.74ID:X7+ketO6 January 29, 2025
2 min read
DeepSeek R1 is now available on Azure AI Foundry and GitHub
2 min read
DeepSeek R1 is now available on Azure AI Foundry and GitHub
34名無しのひみつ
2026/07/05(日) 10:42:55.83ID:8QLE5bXn DeepSeek R1がAzure AI FoundryおよびGitHubのモデルカタログで利用可能になりました。これにより、最先端モデル、オープンソースモデル、業界特化型モデル、タスク特化型モデルなど、1,800種類を超える多様なモデルのラインナップに新たに加わります。Azure AI Foundryの一部として提供されるDeepSeek R1は、信頼性が高く、拡張性に優れ、エンタープライズ利用に対応したプラットフォーム上で利用可能です。企業は、Microsoftの信頼性とイノベーションに裏打ちされた環境下で、SLA(サービス品質保証)、セキュリティ、および責任あるAIへの取り組みを遵守しつつ、高度なAIをシームレスに導入・統合することができます。
35名無しのひみつ
2026/07/05(日) 10:45:18.02ID:8QLE5bXn DeepSeek R1は、Microsoft 365 Copilotにとってどのような意味を持つのでしょうか?
2025 01
Microsoftは、Microsoft CopilotやMicrosoft 365 Copilot Chatの主要モデルとしてDeepSeekを採用するのでしょうか?
AzureおよびAzure AIへのDeepSeek R1の導入は、組織にとってどのような意味を持つのでしょうか?
DeepSeek R1に関する情報が大きく報じられるようになってからの48時間で、こうした質問を数多く受けてきました。そこで、これらについて詳しく見ていきましょう。
DeepSeek R1はどのように開発されたのでしょうか?
まず、この点を理解することが、他のすべての疑問に答える上で重要です。
DeepSeek R1の学習には、他の基盤モデル(膨大な数のGPUを搭載した特殊なハードウェアを稼働させる必要があり、多額のコストがかかるもの)と比較して、はるかに安価なハードウェアが使用されました。報道によると、ChatGPT-4oの学習コストが6,300万ドルであったのに対し、DeepSeek R1の学習コストはわずか600万ドルでした。しかも、DeepSeek R1はChatGPT-4oよりもはるかに高度なモデルであるとされています。厳密に比較するなら、OpenAIの「o1」モデルの学習コストと比べるべきでしょうが、その数値はまだ公表されていません。
しかし、多くの人が注目しているのは、このDeepSeekの学習コストの低さです。つまり、大規模言語モデル(LLM)を構築するための参入障壁やコストが、今や大幅に下がっているということなのでしょうか?
DeepSeekの学習手法も重要なポイントです。OpenAIのモデルが強化学習(RL)と教師ありファインチューニング(SFT)を併用しているのに対し、DeepSeekは強化学習(RL)を用いて自律的に学習を行いました。
「それで、結局どういうことなのか?」と思われるかもしれませんね。
ここでの違いは、RLとSFTを併用することで、より優れた学習アプローチと全体的なパフォーマンスを実現できるという点にあります。強化学習(RL)のみを用いる場合、精度向上に他のAIモデルを活用することはあっても、RLとSFTを組み合わせたモデルに比べると、全体的な性能が及ばない可能性があります。
報道によれば、DeepSeek R1の学習には、Metaのオープンソースモデル(Llama)や、OpenAIの一部のモデルが利用されたとされています。
2025 01
Microsoftは、Microsoft CopilotやMicrosoft 365 Copilot Chatの主要モデルとしてDeepSeekを採用するのでしょうか?
AzureおよびAzure AIへのDeepSeek R1の導入は、組織にとってどのような意味を持つのでしょうか?
DeepSeek R1に関する情報が大きく報じられるようになってからの48時間で、こうした質問を数多く受けてきました。そこで、これらについて詳しく見ていきましょう。
DeepSeek R1はどのように開発されたのでしょうか?
まず、この点を理解することが、他のすべての疑問に答える上で重要です。
DeepSeek R1の学習には、他の基盤モデル(膨大な数のGPUを搭載した特殊なハードウェアを稼働させる必要があり、多額のコストがかかるもの)と比較して、はるかに安価なハードウェアが使用されました。報道によると、ChatGPT-4oの学習コストが6,300万ドルであったのに対し、DeepSeek R1の学習コストはわずか600万ドルでした。しかも、DeepSeek R1はChatGPT-4oよりもはるかに高度なモデルであるとされています。厳密に比較するなら、OpenAIの「o1」モデルの学習コストと比べるべきでしょうが、その数値はまだ公表されていません。
しかし、多くの人が注目しているのは、このDeepSeekの学習コストの低さです。つまり、大規模言語モデル(LLM)を構築するための参入障壁やコストが、今や大幅に下がっているということなのでしょうか?
DeepSeekの学習手法も重要なポイントです。OpenAIのモデルが強化学習(RL)と教師ありファインチューニング(SFT)を併用しているのに対し、DeepSeekは強化学習(RL)を用いて自律的に学習を行いました。
「それで、結局どういうことなのか?」と思われるかもしれませんね。
ここでの違いは、RLとSFTを併用することで、より優れた学習アプローチと全体的なパフォーマンスを実現できるという点にあります。強化学習(RL)のみを用いる場合、精度向上に他のAIモデルを活用することはあっても、RLとSFTを組み合わせたモデルに比べると、全体的な性能が及ばない可能性があります。
報道によれば、DeepSeek R1の学習には、Metaのオープンソースモデル(Llama)や、OpenAIの一部のモデルが利用されたとされています。
36名無しのひみつ
2026/07/05(日) 10:46:27.85ID:CI9rMz4i 「教師」と「生徒」の関係に例えられます
生徒は教師から学びます。DeepSeek R1もまさにこれを行い、他のAIモデル(LlamaやOpenAIなど)を教師として利用することで、それらのモデルが持つ「バイアス(偏り)」を学習しました。こうした学習手法を用いると、他のAIモデルの挙動を吸収することになり、結果として自身のモデルも他者の挙動をベースにしたものになります。
ここで、Microsoft 365 Copilotに関する話に移ります。
Microsoft 365 CopilotにDeepSeek R1が採用されることはあるのでしょうか?
答えは単純に「ノー(採用されない)」です。Microsoft 365 Copilotを利用する際、ユーザーはオーケストレーション層(システム全体の制御・連携を行う仕組み)を管理しません。それはMicrosoftが担っています。ユーザーはプロンプトを入力するだけで、回答が得られます。Microsoftは、そこで使用される大規模言語モデル(LLM)の挙動、安全性、そして「信頼できるAI(Trusted AI)」としての要件を定義・管理しています。Microsoft 365 Copilotのリリース以来、バックエンドのモデルは更新されており、プロンプトに対する回答の質が向上したのを感じた方もいらっしゃるでしょう。現時点でMicrosoft 365向けに公表されているモデルは、OpenAIの「GPT-4o」です。将来的には、コストが下がれば「o1」や「o3」といったモデルへアップグレードされる可能性もあります。それらのモデルの方が、ユーザーや企業により優れたアウトプットを提供できるからです。
Microsoft 365 Copilotにおける適切な挙動、安全性、信頼性を確保するためにオーケストレーション層を自社で管理したいと考えるMicrosoftにとって、他のAIモデルから学習し、バイアスを含んでいる可能性のあるDeepSeek R1モデルを信頼して採用できるでしょうか?答えが「ノー」である理由はここにあります。Microsoftは、自社が掲げる「信頼できるAI」の基準を支えられるモデルを、Microsoft 365 Copilotのユーザーに提供しようとするはずだからです。
だからといって、Microsoft CopilotでDeepSeekを使えないわけではありません!
Microsoftは現在、Azure AI FoundryにおいてDeepSeek R1を利用可能にしています。そこでは、OpenAI o1やLlama 3.1など、すでに1,800以上のモデルが提供されています。モデルをカスタマイズし、独自のデータや自動化処理を組み込んだ上で、それをCopilot StudioやMicrosoft 365 Copilot内のエージェントとして公開することが可能です。つまり、クローズドな環境でDeepSeekを利用したいのであれば、それが可能なのです。世界中でAIの構築や技術革新が進む中、Microsoftはオープンソースの技術を活用し、企業の皆様がプライベートな環境で利用できるようにしています。これにより、組織は最先端の優れたAIモデルを自社のために活用することが可能になります。
これによって、モデルの構築方法や参入コストは変わったのでしょうか?
もちろん変わりました。LlamaやOpenAIが行っているような大規模なモデルをゼロから構築するのと比べ、自社利用向けのモデルを作成する際の参入コストは大幅に抑えられています。今後は、自社のハードウェア上でモデルを構築し、社内で運用する組織が増えていくでしょう。近い将来、Microsoftのデータセンター内にあるAzureサブスクリプション上で、これらの一連の作業を完結できるAzureの機能として提供されるようになると確信しています。
生徒は教師から学びます。DeepSeek R1もまさにこれを行い、他のAIモデル(LlamaやOpenAIなど)を教師として利用することで、それらのモデルが持つ「バイアス(偏り)」を学習しました。こうした学習手法を用いると、他のAIモデルの挙動を吸収することになり、結果として自身のモデルも他者の挙動をベースにしたものになります。
ここで、Microsoft 365 Copilotに関する話に移ります。
Microsoft 365 CopilotにDeepSeek R1が採用されることはあるのでしょうか?
答えは単純に「ノー(採用されない)」です。Microsoft 365 Copilotを利用する際、ユーザーはオーケストレーション層(システム全体の制御・連携を行う仕組み)を管理しません。それはMicrosoftが担っています。ユーザーはプロンプトを入力するだけで、回答が得られます。Microsoftは、そこで使用される大規模言語モデル(LLM)の挙動、安全性、そして「信頼できるAI(Trusted AI)」としての要件を定義・管理しています。Microsoft 365 Copilotのリリース以来、バックエンドのモデルは更新されており、プロンプトに対する回答の質が向上したのを感じた方もいらっしゃるでしょう。現時点でMicrosoft 365向けに公表されているモデルは、OpenAIの「GPT-4o」です。将来的には、コストが下がれば「o1」や「o3」といったモデルへアップグレードされる可能性もあります。それらのモデルの方が、ユーザーや企業により優れたアウトプットを提供できるからです。
Microsoft 365 Copilotにおける適切な挙動、安全性、信頼性を確保するためにオーケストレーション層を自社で管理したいと考えるMicrosoftにとって、他のAIモデルから学習し、バイアスを含んでいる可能性のあるDeepSeek R1モデルを信頼して採用できるでしょうか?答えが「ノー」である理由はここにあります。Microsoftは、自社が掲げる「信頼できるAI」の基準を支えられるモデルを、Microsoft 365 Copilotのユーザーに提供しようとするはずだからです。
だからといって、Microsoft CopilotでDeepSeekを使えないわけではありません!
Microsoftは現在、Azure AI FoundryにおいてDeepSeek R1を利用可能にしています。そこでは、OpenAI o1やLlama 3.1など、すでに1,800以上のモデルが提供されています。モデルをカスタマイズし、独自のデータや自動化処理を組み込んだ上で、それをCopilot StudioやMicrosoft 365 Copilot内のエージェントとして公開することが可能です。つまり、クローズドな環境でDeepSeekを利用したいのであれば、それが可能なのです。世界中でAIの構築や技術革新が進む中、Microsoftはオープンソースの技術を活用し、企業の皆様がプライベートな環境で利用できるようにしています。これにより、組織は最先端の優れたAIモデルを自社のために活用することが可能になります。
これによって、モデルの構築方法や参入コストは変わったのでしょうか?
もちろん変わりました。LlamaやOpenAIが行っているような大規模なモデルをゼロから構築するのと比べ、自社利用向けのモデルを作成する際の参入コストは大幅に抑えられています。今後は、自社のハードウェア上でモデルを構築し、社内で運用する組織が増えていくでしょう。近い将来、Microsoftのデータセンター内にあるAzureサブスクリプション上で、これらの一連の作業を完結できるAzureの機能として提供されるようになると確信しています。
37名無しのひみつ
2026/07/05(日) 10:50:27.27ID:bRmKC6Nb OllamaでDeepSeek R1を実行する方法(2026年7月)
Carl Peterson
2026年7月1日
読了時間:11分
推論モデル「DeepSeek R1」をローカル環境で実行するのは一見簡単そうに思えますが、ハードウェア要件を確認するとそうはいきません。完全な671B(6710億)パラメータモデルを動かすには数百GBものVRAMが必要となり、これは一般的なコンシューマー向けGPUの性能をはるかに超えています。
本ガイドでは、DeepSeek R1の概要からOllamaでの実行方法までを網羅的に解説します。また、複雑な設定なしに、API利用料よりも安価なコストでクラウドGPUを活用する方法も紹介します。
DeepSeek R1とは?
DeepSeek R1は、2023年に設立された中国のAI研究所「DeepSeek」が開発した、オープンウェイトの推論モデルです。
数学、コーディング、科学分野のベンチマークにおいて、OpenAIの「o1」モデルに匹敵する性能を示した初のオープンウェイトモデルとなりました。商用利用やセルフホスト(自前での運用)が可能な、寛容なMITライセンスの下で提供されています。
標準的なチャットモデルとR1の大きな違いは、「Chain-of-Thought(思考の連鎖)」による推論能力にあります。回答を生成する前に、モデルは`<think>`タグで囲まれた「思考」のプロセスを可視化して出力します。これにより、回答前に問題の検討、エラーの検出、そして軌道修正を行うことが可能になります。その結果、速度よりも推論の質が重視される場面で特に高い効果を発揮します。
DeepSeek R1モデルの詳細:パラメータ数、コンテキストウィンドウ、リリース日
DeepSeek R1は2025年1月20日にリリースされました。完全版モデルは「Mixture of Experts(MoE)」アーキテクチャを採用し、671B(6710億)のパラメータを擁しています。一度の推論処理(フォワードパス)で実際に使用される(アクティブになる)パラメータは約37B(370億)に過ぎません。これにより、膨大な知識ベースを活用しつつ、推論に必要な計算量を抑えることが可能になっています。
このモデルはGPT-4oと同等の128Kトークンというコンテキストウィンドウをサポートしており、長文のドキュメント処理や、長期にわたる対話(マルチターン会話)において優れた性能を発揮します。また、蒸留(distillation)によって生成された6つのバリエーション(1.5B、7B、8B、14B、32B、70B)も用意されています。
Carl Peterson
2026年7月1日
読了時間:11分
推論モデル「DeepSeek R1」をローカル環境で実行するのは一見簡単そうに思えますが、ハードウェア要件を確認するとそうはいきません。完全な671B(6710億)パラメータモデルを動かすには数百GBものVRAMが必要となり、これは一般的なコンシューマー向けGPUの性能をはるかに超えています。
本ガイドでは、DeepSeek R1の概要からOllamaでの実行方法までを網羅的に解説します。また、複雑な設定なしに、API利用料よりも安価なコストでクラウドGPUを活用する方法も紹介します。
DeepSeek R1とは?
DeepSeek R1は、2023年に設立された中国のAI研究所「DeepSeek」が開発した、オープンウェイトの推論モデルです。
数学、コーディング、科学分野のベンチマークにおいて、OpenAIの「o1」モデルに匹敵する性能を示した初のオープンウェイトモデルとなりました。商用利用やセルフホスト(自前での運用)が可能な、寛容なMITライセンスの下で提供されています。
標準的なチャットモデルとR1の大きな違いは、「Chain-of-Thought(思考の連鎖)」による推論能力にあります。回答を生成する前に、モデルは`<think>`タグで囲まれた「思考」のプロセスを可視化して出力します。これにより、回答前に問題の検討、エラーの検出、そして軌道修正を行うことが可能になります。その結果、速度よりも推論の質が重視される場面で特に高い効果を発揮します。
DeepSeek R1モデルの詳細:パラメータ数、コンテキストウィンドウ、リリース日
DeepSeek R1は2025年1月20日にリリースされました。完全版モデルは「Mixture of Experts(MoE)」アーキテクチャを採用し、671B(6710億)のパラメータを擁しています。一度の推論処理(フォワードパス)で実際に使用される(アクティブになる)パラメータは約37B(370億)に過ぎません。これにより、膨大な知識ベースを活用しつつ、推論に必要な計算量を抑えることが可能になっています。
このモデルはGPT-4oと同等の128Kトークンというコンテキストウィンドウをサポートしており、長文のドキュメント処理や、長期にわたる対話(マルチターン会話)において優れた性能を発揮します。また、蒸留(distillation)によって生成された6つのバリエーション(1.5B、7B、8B、14B、32B、70B)も用意されています。
38名無しのひみつ
2026/07/05(日) 10:53:41.14ID:XwFfYMUI OllamaでDeepSeek R1を動かす
Ollamaは、モデルの重み、設定ファイル、推論パラメータを一つのダウンロード可能なパッケージにまとめたオープンソース・フレームワークです。これにより、ローカル環境へのモデル導入が単一のコマンドで完結します。
GGUF形式のモデル読み込み、GPUの自動検出、コンテキスト管理といった処理をOllamaが自動的に行います。DeepSeek R1をローカル環境ですぐに動かしたい場合、Ollamaを利用するのが最も手軽で迅速な方法です。
DeepSeek R1の実行に必要なVRAM容量は?
必要なVRAM容量は、実行するモデルのバリエーションや量子化、クオンタイズ、つまり間引きのレベルによって異なります。以下量子化とあるのは間引きと読み換えると完全に理解できます。
量子化とは、モデルの重みを低精度の形式に圧縮する技術です。これによりメモリ使用量を削減できますが、モデルの精度は多少低下します。推奨される最初の選択肢は「Q4_K_M」です。これは、精度の低下を最小限に抑えつつ、メモリ使用量をFP16(16ビット浮動小数点数)の場合の約半分に削減できる設定です。
Ollamaは、モデルの重み、設定ファイル、推論パラメータを一つのダウンロード可能なパッケージにまとめたオープンソース・フレームワークです。これにより、ローカル環境へのモデル導入が単一のコマンドで完結します。
GGUF形式のモデル読み込み、GPUの自動検出、コンテキスト管理といった処理をOllamaが自動的に行います。DeepSeek R1をローカル環境ですぐに動かしたい場合、Ollamaを利用するのが最も手軽で迅速な方法です。
DeepSeek R1の実行に必要なVRAM容量は?
必要なVRAM容量は、実行するモデルのバリエーションや量子化、クオンタイズ、つまり間引きのレベルによって異なります。以下量子化とあるのは間引きと読み換えると完全に理解できます。
量子化とは、モデルの重みを低精度の形式に圧縮する技術です。これによりメモリ使用量を削減できますが、モデルの精度は多少低下します。推奨される最初の選択肢は「Q4_K_M」です。これは、精度の低下を最小限に抑えつつ、メモリ使用量をFP16(16ビット浮動小数点数)の場合の約半分に削減できる設定です。
39名無しのひみつ
2026/07/05(日) 10:56:51.32ID:LC0dauSa いまや当たり前のMoEもDeepSeek R1が提案して実装したから普及したんだよ
レスを投稿する
ニュース
- 佐藤二朗 ハラスメント報道にコメント「大変残念。全ての事実が明らかになることを望みます」所属事務所「到底受け入れられない」★66 [Ailuropoda melanoleuca★]
- 【円安】1ドル162円突破の「異常な円安」はなぜ止まらない? 原因が「ホルムズ危機」でも「高圧財政」でも変わらない"唯一の解決策" [ぐれ★]
- 橋本愛、佐藤二朗とのトラブル…横浜流星や吉沢亮との「密着シーン」となにが違ったのか ★3 [ネギうどん★]
- 中田敦彦・福田萌夫妻、5年間暮らしたシンガポールから日本へ帰国を告白。家族で選んだ大きな決断★2 [ちょこ★]
- 【W杯】カボベルデ 英雄40歳GKボジニャ、インスタのフォロワー数が2500万人に到達!大会前の5万人から500倍に! [阿弥陀ヶ峰★]
- 【サッカー】森保監督になぜ“続投報道”が相次ぐのか? 「赤字31億円」のJFAが抱えた後任選考 “2つの難航要素” [ネギうどん★]
- 【STARDOM】スターダムワールド Part.125
- 2026 EWC 鈴鹿8時間耐久ロードレース Lap2
- 【MLB】ドジャース vs パドレス ★8
- 2026 EWC 鈴鹿8時間耐久ロードレース Lap3
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★319【メキシコ/カナダ/アメリカ】
- 【D専】
- 【悲報】普通の日本人「文春が許せねええええ💢💢」👈いやお前ら素人は文春砲喰らわないしどうでも良くない? [714769305]
- ジャップ、調理台で店員が寝てるラーメン屋がありかなしかで大激論…🫪 [667744927]
- 🏡だっせぇ靴🐷👞ときったねぇ指🫪👆🏽
- 千晴「ボゲ」←これ
- 【悲報】高市早苗の公設秘書、底辺ネトウヨみたいなことを言い出すwwwwwwwwっw [834922174]
- ( ・᷇ὢ・᷆ )やあごきげんようさ!