39コメント26KB

【AI】中国の新高性能ＡＩモデル登場、「ミニ・ディープシーク・ショック」か [すらいむ★]

スレをまとめに
5ch即うp → gzo.ai

4名無しのひみつ

2026/07/05(日) 00:20:48.38ID:WH94Uq3Z

>>3
ガセwww 愛国ユーチューブ視聴者か？

5名無しのひみつ

2026/07/05(日) 00:58:48.88ID:ky0tJf6Q

超分散型AIデータセンターだってさ
民間AIならこれでもいけるとかいけないとか
もちろん中国風なので自己責任だ

6名無しのひみつ

2026/07/05(日) 01:00:12.57ID:ky0tJf6Q

日本もなんか作ってるが
日本のは自動運転向けになってるな
まずはバスとか自動車とかをAIで動かそうぜってあれ

7名無しのひみつ

2026/07/05(日) 01:02:18.99ID:ky0tJf6Q

中国のAIはよくわからない
てっきり人間型ロボットをAIで統合制御でもすんのかと思ったがどうも違うようだ
あくまでアメリカのAIを参考にって感じだな

8名無しのひみつ

2026/07/05(日) 03:31:03.18ID:0Mt7WV3k

>>4
ガセではないな

9名無しのひみつ

2026/07/05(日) 03:35:17.75ID:6wI4aEzn

そういやcopilotにディープシーク採用するって話どうなった

10名無しのひみつ

2026/07/05(日) 05:38:12.56ID:m1Zr9PYu

中国ダセェwwwwwwwwwwww

11名無しのひみつ

2026/07/05(日) 06:07:09.77ID:gHV5XTCz

>>4
韓国語がAIに合わないのは常識だろ…？

12名無しのひみつ

2026/07/05(日) 07:00:09.08ID:np1C4pIh

中国はいつも始めの宣伝だけは元気だな
その後尻つぼみで消えるのがいつものパターン

13名無しのひみつ

2026/07/05(日) 07:26:03.60ID:nipKdQip

既存技術の延長線上で大幅な性能向上が続いているんで、中国にとってもキャッチアップするのは難しいことではない
米国も気をつけないと、余計な規制をやっているうちに中国に追い抜かれる可能性は十分ある

14名無しのひみつ

2026/07/05(日) 07:28:55.31ID:XNJUlI1P

この分野では中共はすごい人類に貢献してるなw
狙いはアメリカAI産業への妨害やろうがww

15名無しのひみつ

2026/07/05(日) 07:46:01.85ID:3VRqyEar

日本なんて独自モデルすら
オープンの存在しないもんな

16名無しのひみつ

2026/07/05(日) 08:04:55.16ID:ky0tJf6Q

>>15
いや相当進んでるみたい、ただ特定アジアに技術盗まれる恐怖から完全に情報を遮断してる
ここまで情報を隠蔽してるのは異例だがシャープや東芝の二の舞いは嫌だだってさ
まともに情報が公開されるのはスパイ防止法ができ、さらに特許法が欧米並に強固になってからかなあ

17名無しのひみつ

2026/07/05(日) 08:24:14.00ID:ZTzvIaqc

エヌビディア社が大朝鮮傘下になった

18名無しのひみつ

2026/07/05(日) 08:32:49.86ID:XNJUlI1P

16のが妄想で無い事を祈るw

19名無しのひみつ

2026/07/05(日) 08:36:10.55ID:2K5VOycO

中国ショックというか、Fableが勝手に高くなりすぎてるだけだと思う
2割高い、とかそういうレベルじゃないもんな。中華製に比べて何十倍も高い

20名無しのひみつ

2026/07/05(日) 08:49:44.11ID:I0AOlatK

中国製AI使う前に毎回「天安門」とか「チベット」とか確認しないと
情報抜かれる不安のほうがひどそう

21名無しのひみつ

2026/07/05(日) 08:52:38.55ID:x2vaGjKX

新しいのをチラチラ出すのに、実際使っているのは米国製

22名無しのひみつ

2026/07/05(日) 09:04:52.80ID:hWf3Y4dS

現行のメモリ、ストレージ、プロセッサを使う理論は最終的に中華に模倣されて負ける

なのでより省エネ長寿命最適化された次世代技術じゃないと話にならない
逆に中華製プロセッサは現行模倣で次世代に逃げれば勝てる

23名無しのひみつ

2026/07/05(日) 09:25:56.01ID:bPn7bj8s

米高官ピーター・ナヴァロ「中国共産党は世界の寄生虫」
チャイナは、知的財産の盗みや不正による経済成長モデルであり
経済成長のために行ったすべては
他人の利益の犠牲を代償にしている。

24名無しのひみつ

2026/07/05(日) 09:26:11.98ID:2sWxMuTO

そもそもAIの推論は言語に作用される
デフォは当然英語
日本語は比較的精度が高い変換可能
中国語はかなり精度が落ちる
韓国語=チョーセン語は変換効率2割ほど
だって口語なんだよ
日本語で言えばカタカナで小説読むようなモン
同音異義語だらけでワケワカメ
gefoceもお手上げ

25名無しのひみつ

2026/07/05(日) 09:39:47.51ID:JAIjLN2H

GLM 5.2はマジで良いぞ
どの性能もOpus 4.8と殆ど変わらん
中華AIといえばベンチマークテスト番長だったり日本語で応答すると性能が大きく下がったりしてたけどこれに関してはマジで米国AIと同じ様な使い方が出来るようになった
それでいて価格はClaudeの1/3
Fableがこのまま定額料金から外れたままなら本気で乗り換え検討するレベル

26名無しのひみつ

2026/07/05(日) 09:53:52.31ID:AHIQa5WC

>>16
情報を遮断しているのに何故お前は知っているんだの
中の人なら守秘義務違反

27名無しのひみつ

2026/07/05(日) 09:55:34.32ID:ToYBNEs7

中国製AIは信用できないから使わない。
天安門事件、中国共産党の問題点などを聞いても答えないだけでなく、中国政府に通報される恐れもある。

28名無しのひみつ

2026/07/05(日) 10:19:40.90ID:/Yz9bT/i

中国製モデルには別な面があるから

29名無しのひみつ

2026/07/05(日) 10:32:14.94ID:xMFeRX67

まず
>>1
の解説がおかしい

価格を抑えた中国製モデルか、それとも巨額の開発投資によって非常に高い性能を実現してきたオープンＡＩやアンソロピックといった米国勢か、という構図

ではない
ディープシークR1はそれまで巨額の開発投資をしていた米国モデルが備えていなかった開発手法と実装手法を提案したものだ
２０２４年クリスマスのそれに全世界の開発者が学んだ
パクったわけじゃないのはディープシークR1はオープンソースモデルだっただけでなく
ペーパー（論文）まで公開していたからだ
大規模な強化学習（RL）でのモデルに段階的な推論を行わせる手法を採用　アルファGo時代の過去のものと思われていたRLをgen AI LLMに適用した、
従来の評価モデルの代わりにGroup Relative Policy Optimization（GRPO）を使った
グループ内の複数の回答候補を比較することで報酬を算出して回答の質を向上させる手法
その実装には4段階の学習プロセスがある
・すでに公開されていたR1-Zeroモデルの合成データベースとしたコールドスタート時の教師ありファインチューニング
・推論問題に対する大規模な強化学習
・小規模モデルへのdistillation
・リジェクションサンプリングと教師ありファインチューニングによるさらなる洗練という工程

これをオープンAIからジェミナイからアンソロピックからミストラルからそのあとのモデルは全てそこから学んだの

2025年上半期はDeepSeek R1が先生だったの

データではなくLLMの訓練の仕方
そしてここから本格的な推論の世界になった
だからこそAIエージェント、エージェンティックAIが現実となったの

ロイターも食わせ記事書くんだな

30名無しのひみつ

2026/07/05(日) 10:34:58.63ID:xMFeRX67

アリババのQwenもディープシークR1のディスティルモデルをすぐさま出してそれが今のQwen3.6とかに繋がる
GLMもそのやり方でできてる

もちろんOpenAi GPTもGeminiもClaideもだ

31名無しのひみつ

2026/07/05(日) 10:37:13.58ID:xMFeRX67

>>9
してるだろとっくに
Amazonでも使える
パープレでも使える
なぜならオープンモデルだからだ
自分のところで動かしてる

QwenがdistillしたDeepSeekR1 の小さいやつはうちのmac mini でも遅いが動く

32名無しのひみつ

2026/07/05(日) 10:41:28.34ID:X7+ketO6

これはローカル
Microsoft releases DeepSeek R1 7B & 14B Distilled Models for Copilot+ PCs, allowing developers to build apps that were not possible
The models are now available to devs.
Published on March 4, 2025

Microsoftは、Azure AI Foundryを通じて、Copilot+ PC向けの「DeepSeek R1 7B」および「14B」蒸留モデル（distilled models）の提供開始を発表しました。これらの新しいモデルは、クラウドとエッジシステム全体でAIをシームレスに統合するという同社のビジョンに基づくものであり、開発者はデバイス上で直接、強力なAI機能を活用できるようになります。

DeepSeek R1 7Bおよび14Bモデルは、Copilot+ PCに搭載されたNPU（ニューラル・プロセッシング・ユニット）で動作するように最適化されています。対応プロセッサは、Qualcomm Snapdragon Xを皮切りに、Intel Core Ultra 200VやAMD Ryzenへと順次拡大されます。この最適化により、バッテリー駆動時間や熱への影響を最小限に抑えつつ効率的なAI処理が可能となり、CPUやGPUを他のタスクに割り当てることができます。

これらのモデルの導入により、開発者はこれまで実現不可能だったAI搭載アプリケーションを構築できるようになります。7Bおよび14Bパラメータの推論モデルをNPU上でローカルに実行できることは、大規模機械学習モデルへのアクセスを民主化するものであり、デバイスのリソースへの負荷を抑えつつ、持続的なAI処理能力の活用を可能にします。

MicrosoftのDeepSeekモデルはONNX QDQ形式で最適化されており、VS Code拡張機能である「AI Toolkit」からダウンロード可能です。同社は今年初め、OpenAIのGPT-4oと直接競合する中国発のAIであるDeepSeek R1をAzureおよびGitHubに導入し、業界を驚かせました。

詳細については、Windows Developer Blogをご覧ください。

https://windowsreport.com/microsoft-releases-deepseek-r1-7b-14b-distilled-models-for-copilot-pcs-allowing-developers-to-build-apps-that-were-not-possible/

33名無しのひみつ

2026/07/05(日) 10:42:25.74ID:X7+ketO6

January 29, 2025
2 min read
DeepSeek R1 is now available on Azure AI Foundry and GitHub

34名無しのひみつ

2026/07/05(日) 10:42:55.83ID:8QLE5bXn

DeepSeek R1がAzure AI FoundryおよびGitHubのモデルカタログで利用可能になりました。これにより、最先端モデル、オープンソースモデル、業界特化型モデル、タスク特化型モデルなど、1,800種類を超える多様なモデルのラインナップに新たに加わります。Azure AI Foundryの一部として提供されるDeepSeek R1は、信頼性が高く、拡張性に優れ、エンタープライズ利用に対応したプラットフォーム上で利用可能です。企業は、Microsoftの信頼性とイノベーションに裏打ちされた環境下で、SLA（サービス品質保証）、セキュリティ、および責任あるAIへの取り組みを遵守しつつ、高度なAIをシームレスに導入・統合することができます。

35名無しのひみつ

2026/07/05(日) 10:45:18.02ID:8QLE5bXn

DeepSeek R1は、Microsoft 365 Copilotにとってどのような意味を持つのでしょうか？

2025 01

Microsoftは、Microsoft CopilotやMicrosoft 365 Copilot Chatの主要モデルとしてDeepSeekを採用するのでしょうか？

AzureおよびAzure AIへのDeepSeek R1の導入は、組織にとってどのような意味を持つのでしょうか？

DeepSeek R1に関する情報が大きく報じられるようになってからの48時間で、こうした質問を数多く受けてきました。そこで、これらについて詳しく見ていきましょう。
DeepSeek R1はどのように開発されたのでしょうか？
まず、この点を理解することが、他のすべての疑問に答える上で重要です。
DeepSeek R1の学習には、他の基盤モデル（膨大な数のGPUを搭載した特殊なハードウェアを稼働させる必要があり、多額のコストがかかるもの）と比較して、はるかに安価なハードウェアが使用されました。報道によると、ChatGPT-4oの学習コストが6,300万ドルであったのに対し、DeepSeek R1の学習コストはわずか600万ドルでした。しかも、DeepSeek R1はChatGPT-4oよりもはるかに高度なモデルであるとされています。厳密に比較するなら、OpenAIの「o1」モデルの学習コストと比べるべきでしょうが、その数値はまだ公表されていません。
しかし、多くの人が注目しているのは、このDeepSeekの学習コストの低さです。つまり、大規模言語モデル（LLM）を構築するための参入障壁やコストが、今や大幅に下がっているということなのでしょうか？
DeepSeekの学習手法も重要なポイントです。OpenAIのモデルが強化学習（RL）と教師ありファインチューニング（SFT）を併用しているのに対し、DeepSeekは強化学習（RL）を用いて自律的に学習を行いました。
「それで、結局どういうことなのか？」と思われるかもしれませんね。
ここでの違いは、RLとSFTを併用することで、より優れた学習アプローチと全体的なパフォーマンスを実現できるという点にあります。強化学習（RL）のみを用いる場合、精度向上に他のAIモデルを活用することはあっても、RLとSFTを組み合わせたモデルに比べると、全体的な性能が及ばない可能性があります。

報道によれば、DeepSeek R1の学習には、Metaのオープンソースモデル（Llama）や、OpenAIの一部のモデルが利用されたとされています。

36名無しのひみつ

2026/07/05(日) 10:46:27.85ID:CI9rMz4i

「教師」と「生徒」の関係に例えられます
生徒は教師から学びます。DeepSeek R1もまさにこれを行い、他のAIモデル（LlamaやOpenAIなど）を教師として利用することで、それらのモデルが持つ「バイアス（偏り）」を学習しました。こうした学習手法を用いると、他のAIモデルの挙動を吸収することになり、結果として自身のモデルも他者の挙動をベースにしたものになります。

ここで、Microsoft 365 Copilotに関する話に移ります。

Microsoft 365 CopilotにDeepSeek R1が採用されることはあるのでしょうか？
答えは単純に「ノー（採用されない）」です。Microsoft 365 Copilotを利用する際、ユーザーはオーケストレーション層（システム全体の制御・連携を行う仕組み）を管理しません。それはMicrosoftが担っています。ユーザーはプロンプトを入力するだけで、回答が得られます。Microsoftは、そこで使用される大規模言語モデル（LLM）の挙動、安全性、そして「信頼できるAI（Trusted AI）」としての要件を定義・管理しています。Microsoft 365 Copilotのリリース以来、バックエンドのモデルは更新されており、プロンプトに対する回答の質が向上したのを感じた方もいらっしゃるでしょう。現時点でMicrosoft 365向けに公表されているモデルは、OpenAIの「GPT-4o」です。将来的には、コストが下がれば「o1」や「o3」といったモデルへアップグレードされる可能性もあります。それらのモデルの方が、ユーザーや企業により優れたアウトプットを提供できるからです。

Microsoft 365 Copilotにおける適切な挙動、安全性、信頼性を確保するためにオーケストレーション層を自社で管理したいと考えるMicrosoftにとって、他のAIモデルから学習し、バイアスを含んでいる可能性のあるDeepSeek R1モデルを信頼して採用できるでしょうか？答えが「ノー」である理由はここにあります。Microsoftは、自社が掲げる「信頼できるAI」の基準を支えられるモデルを、Microsoft 365 Copilotのユーザーに提供しようとするはずだからです。

だからといって、Microsoft CopilotでDeepSeekを使えないわけではありません！
Microsoftは現在、Azure AI FoundryにおいてDeepSeek R1を利用可能にしています。そこでは、OpenAI o1やLlama 3.1など、すでに1,800以上のモデルが提供されています。モデルをカスタマイズし、独自のデータや自動化処理を組み込んだ上で、それをCopilot StudioやMicrosoft 365 Copilot内のエージェントとして公開することが可能です。つまり、クローズドな環境でDeepSeekを利用したいのであれば、それが可能なのです。世界中でAIの構築や技術革新が進む中、Microsoftはオープンソースの技術を活用し、企業の皆様がプライベートな環境で利用できるようにしています。これにより、組織は最先端の優れたAIモデルを自社のために活用することが可能になります。

これによって、モデルの構築方法や参入コストは変わったのでしょうか？
もちろん変わりました。LlamaやOpenAIが行っているような大規模なモデルをゼロから構築するのと比べ、自社利用向けのモデルを作成する際の参入コストは大幅に抑えられています。今後は、自社のハードウェア上でモデルを構築し、社内で運用する組織が増えていくでしょう。近い将来、Microsoftのデータセンター内にあるAzureサブスクリプション上で、これらの一連の作業を完結できるAzureの機能として提供されるようになると確信しています。

37名無しのひみつ

2026/07/05(日) 10:50:27.27ID:bRmKC6Nb

OllamaでDeepSeek R1を実行する方法（2026年7月）

Carl Peterson
2026年7月1日
読了時間：11分
推論モデル「DeepSeek R1」をローカル環境で実行するのは一見簡単そうに思えますが、ハードウェア要件を確認するとそうはいきません。完全な671B（6710億）パラメータモデルを動かすには数百GBものVRAMが必要となり、これは一般的なコンシューマー向けGPUの性能をはるかに超えています。

本ガイドでは、DeepSeek R1の概要からOllamaでの実行方法までを網羅的に解説します。また、複雑な設定なしに、API利用料よりも安価なコストでクラウドGPUを活用する方法も紹介します。

DeepSeek R1とは？

DeepSeek R1は、2023年に設立された中国のAI研究所「DeepSeek」が開発した、オープンウェイトの推論モデルです。

数学、コーディング、科学分野のベンチマークにおいて、OpenAIの「o1」モデルに匹敵する性能を示した初のオープンウェイトモデルとなりました。商用利用やセルフホスト（自前での運用）が可能な、寛容なMITライセンスの下で提供されています。

標準的なチャットモデルとR1の大きな違いは、「Chain-of-Thought（思考の連鎖）」による推論能力にあります。回答を生成する前に、モデルは`<think>`タグで囲まれた「思考」のプロセスを可視化して出力します。これにより、回答前に問題の検討、エラーの検出、そして軌道修正を行うことが可能になります。その結果、速度よりも推論の質が重視される場面で特に高い効果を発揮します。

DeepSeek R1モデルの詳細：パラメータ数、コンテキストウィンドウ、リリース日

DeepSeek R1は2025年1月20日にリリースされました。完全版モデルは「Mixture of Experts（MoE）」アーキテクチャを採用し、671B（6710億）のパラメータを擁しています。一度の推論処理（フォワードパス）で実際に使用される（アクティブになる）パラメータは約37B（370億）に過ぎません。これにより、膨大な知識ベースを活用しつつ、推論に必要な計算量を抑えることが可能になっています。

このモデルはGPT-4oと同等の128Kトークンというコンテキストウィンドウをサポートしており、長文のドキュメント処理や、長期にわたる対話（マルチターン会話）において優れた性能を発揮します。また、蒸留（distillation）によって生成された6つのバリエーション（1.5B、7B、8B、14B、32B、70B）も用意されています。

38名無しのひみつ

2026/07/05(日) 10:53:41.14ID:XwFfYMUI

OllamaでDeepSeek R1を動かす

Ollamaは、モデルの重み、設定ファイル、推論パラメータを一つのダウンロード可能なパッケージにまとめたオープンソース・フレームワークです。これにより、ローカル環境へのモデル導入が単一のコマンドで完結します。

GGUF形式のモデル読み込み、GPUの自動検出、コンテキスト管理といった処理をOllamaが自動的に行います。DeepSeek R1をローカル環境ですぐに動かしたい場合、Ollamaを利用するのが最も手軽で迅速な方法です。

DeepSeek R1の実行に必要なVRAM容量は？

必要なVRAM容量は、実行するモデルのバリエーションや量子化、クオンタイズ、つまり間引きのレベルによって異なります。以下量子化とあるのは間引きと読み換えると完全に理解できます。

量子化とは、モデルの重みを低精度の形式に圧縮する技術です。これによりメモリ使用量を削減できますが、モデルの精度は多少低下します。推奨される最初の選択肢は「Q4_K_M」です。これは、精度の低下を最小限に抑えつつ、メモリ使用量をFP16（16ビット浮動小数点数）の場合の約半分に削減できる設定です。

39名無しのひみつ

2026/07/05(日) 10:56:51.32ID:LC0dauSa

いまや当たり前のMoEもDeepSeek R1が提案して実装したから普及したんだよ

スレをまとめに
5ch即うp → gzo.ai

新着レスの表示

レスを投稿する