51コメント15KB

中国のAI企業がGPT-4oに匹敵するAIモデル「DeepSeek-V3」リリース、パラメーター数は脅威の6710億個 [すらいむ★]

■ このスレッドは過去ログ倉庫に格納されています

1すらいむ ★

2024/12/27(金) 22:15:03.16ID:oGRiPJ4w

中国のAI企業・DeepSeekがGPT-4oに匹敵するAIモデル「DeepSeek-V3」をリリース、パラメーター数は脅威の6710億個

　中国のAI企業であるDeepSeekが、2024年12月26日に大規模言語モデル「DeepSeek-V3」を発表しました。
　6710億個ものパラメーターを持つDeepSeek-V3はOpenAIのマルチモーダルAIモデル「GPT-4o」に匹敵し、場合によってはGPT-4oを上回る性能を発揮するとのことです。

　deepseek-ai/DeepSeek-V3-Base · Hugging Face
　https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

（以下略、続きはソースでご確認ください）

Gigazine 2024年12月27日 14時00分
https://gigazine.net/news/20241227-deepseek-v3/

2名無しのひみつ

2024/12/27(金) 22:16:58.27ID:aaYhFPtg

電力消費凄そう

3名無しのひみつ

2024/12/27(金) 22:26:05.64ID:vugIJGrq

習思想布教の使徒
開発者命がけ

4名無しのひみつ

2024/12/27(金) 22:40:28.14ID:K7+QtTf7

禁止ワード多そう

5名無しのひみつ

2024/12/27(金) 22:40:45.66ID:RwxuxPqI

「天安門事件」とかNGワード沢山あるんだろうな

6名無しのひみつ

2024/12/27(金) 22:44:55.61ID:vTQMwbm3

かがみよかがみ
この世界の覇権を握っているのはどこ？

7名無しのひみつ

2024/12/27(金) 23:50:45.06ID:wQW97wL0

>>2
いや
それは作る時の話

使うやつはそれほどじゃない

8名無しのひみつ

2024/12/27(金) 23:52:44.11ID:wQW97wL0

>>6
森の王子様です

前提を説明しなければいろんな場合があるから
とりあえずいちばん先に見つかったものを返すだけ
チャットの場合はうわっつらなでてるだけだから
なんの条件も前提も説明してないならいちばん容易い答えを返すの

9名無しのひみつ

2024/12/27(金) 23:54:28.08ID:B4gUOUJD

AI同士で対話させるとどうなる？

10名無しのひみつ

2024/12/28(土) 00:22:48.18ID:ejjhB6PT

かがみよかがみ
この世界の覇権を握っているのはどこ？

11名無しのひみつ

2024/12/28(土) 00:23:37.46ID:ejjhB6PT

>>9
世界同時核爆発で人類滅亡

12名無しのひみつ

2024/12/28(土) 00:47:51.46ID:fPJa/LW4

>>9 ログ見るだけで何百年かかりそう

13名無しのひみつ

2024/12/28(土) 00:55:03.13ID:Y897iNmB

オープンなんだからllamaと同じで
ダウンロードして自分で入れ込んで好きにできるベースモデル
カッコつけのAmazonやGoogleならファウンデーションモデルという位置付けだぞ

仕込みしてあるかもしれないが
そんなことしてたら評判落としてあとは無視される

14名無しのひみつ

2024/12/28(土) 00:55:40.48ID:Y897iNmB

>>12
サマリーさせるに決まってるだろ

15名無しのひみつ

2024/12/28(土) 00:57:09.73ID:Y897iNmB

だから自らLLMを作るだけのカネがない日本の研究者たちはこれをベースに日本のモデル！とか宣伝するよ

16名無しのひみつ

2024/12/28(土) 01:25:01.55ID:8/suliqW

>>15
日本発祥のLLMは全く違うプロセスをしてるよ。周りが全部一緒くたにして結果を返す中、
エヴァのMAGIシステムみたいに得意とするそれぞれが討議して結果を返すシステムを考えてる。
ひいては手塚治虫が考えたような「結果を複数から導き出す」という人工知能プロセスは日本人ならではの発想。

17名無しのひみつ

2024/12/28(土) 01:50:58.02ID:EULboQKa

これが中国共産党滅亡の切っ掛けになろうとは
この時は誰も気付いていなかった

18名無しのひみつ

2024/12/28(土) 03:53:42.11ID:be4Ep5bz

日本にはあまり関係ない話だな蚊帳の外じゃん

19名無しのひみつ

2024/12/28(土) 04:11:42.37ID:9fiEr62J

パラメーター数で中国が有利なのは、元から誰でも知ってる
中共は、著作権無視して、学習させられるからな

20名無しのひみつ

2024/12/28(土) 07:10:57.63ID:z+pnzbEF

中国って、こんなデカイLLMを学習させるリソースあるん？

21名無しのひみつ

2024/12/28(土) 07:35:43.33ID:y/iOamAy

>>16
複数からなんて前からやってるじゃないの
初歩のAGI
あそこに問いかけてその結果でそちらに問いかけて
なんてことで何度も何度も繰り返して
ollamaできてからはそれがかなりやりやすくなってる
マルチの、LLMとファンクションで外部の既存Webとか検索も使って

複数なんて素人でもやってるよ

22名無しのひみつ

2024/12/28(土) 07:46:34.08ID:c//mn2h1

Domestic Competition and International Competition

Domestically, DeepSeek is contending with the Qwen models developed by Alibaba. I reported yesterday on how Qwen does fairly well with the MATH data set that uses high school math curriculum to test models and compare and contrast their abilities.

DeepSeek-R1-Lite-Preview is specifically credited with outperforming other models of its kind with the MATH data set and other prompting.

Internationally, OpenAI and Anthropic and other firms are trying to maintain dominance in the field. However, we have people like the CEO of Hugging Face, Clement Delangue, conceding that “(Qwen’s model) is the king, and Chinese open models are dominating overall.”

And then you have figures like Liu Qingfeng, founder of Chinese AI group iFlytek, who has reportedly said, "The gap between the US and China isn't as big as everyone thinks. In a lot of verticals our [models] are better than theirs."

23名無しのひみつ

2024/12/28(土) 07:47:01.41ID:c//mn2h1

There’s also the debate about open models that’s taking up a lot of time on the tech media stage. Closed models are safer, but open models are more egalitarian.

What DeepSeek’s Model Can Do

If you’re into the more intuitive details of how models outperform each other, you may be wondering: what does DeepSeek-R1-Lite-Preview do that’s so much better than other models?

This article at Venture Beat provides two very concrete examples of the model solving the question: “how many letter R’s are in the word strawberry?” and, alternately in numerical language, “which is larger, 9.11 or 9.9?”

24名無しのひみつ

2024/12/28(土) 07:47:38.84ID:c//mn2h1

So that’s the kind of question-answering that is showcasing problem-solving and logical inference abilities.

Specifically, Venture Beat reports that the model exceeds OpenAI-o1-Preview level performance in MATH

Forbes

25名無しのひみつ

2024/12/28(土) 07:49:49.31ID:c//mn2h1

Its reasoning capabilities are enhanced by its transparent thought process, allowing users to follow along as the model tackles complex challenges step-by-step.

To be fair, OpenAI’s o1 preview also does chain of thought. I’ve used it and been impressed by looking at the tasks that it’s doing on its way to answering a question. But it’s important to understand the market context, and which models are front and center right now, as the brightest LLMs come to the front of the classroom.

As for logical applications, we’re seeing any and all of these new models being integrated into industry tools in a wide spectrum of fields. But that’s a little bit about what analysts are saying right now, as they evaluate models that are still in beta, still very nascent, and still emerging into our world.

Follow me on LinkedIn. Check out my website.

John Werner

26名無しのひみつ

2024/12/28(土) 09:20:17.78ID:6mzA9Fng

英語の論文ベースでやってくれれば、お硬い文章が抽出されて面白くなりそう。

27名無しのひみつ

2024/12/28(土) 13:11:45.44ID:Y897iNmB

抽出とかなに言ってるの？
生成だってこれだけ言われてるのに
ほんとに日本人はバカなの？

28名無しのひみつ

2024/12/28(土) 13:29:25.36ID:xvb3KCTT

共産党の統治とか習近平の人物評とか全部NGだろ
これで世界最高峰のAIとかできるわけない

29名無しのひみつ

2024/12/28(土) 13:39:41.24ID:mBMo9ERl

>>27
支那人乙

30名無しのひみつ

2024/12/28(土) 16:05:31.70ID:qZOiRIM9

外国人をバカにするのもそもそも自分に自信がないから
オレは日本の田舎育ちだが
都会をかさにきて田舎をバカにするのも
自信のない都会人たち
自分を確立してるやつは他人を理由なく貶したりしない
ましてや絶対的に格下のような空想の存在にたとえたりしな

31名無しのひみつ

2024/12/28(土) 16:08:58.97ID:El1SWxf+

>>28
ベースモデルだから作り込みするもしないもその使い手の話

その話はこの話とは直接の関係はない
やるならやったで別の話だ

ということがわからないくらいに日本の生成AI知識は全く広がってない

メディアは斎藤やらお正月やら

アメリカは大学でたかでないかくらいのバイトからウェルス投資会社のおばさんCEOまで女がリードして先の先の話してる

日本はバカのまま

32名無しのひみつ

2024/12/28(土) 16:09:55.41ID:El1SWxf+

じいさんたちが政治はー
ってバカな国

33名無しのひみつ

2024/12/28(土) 16:11:11.11ID:El1SWxf+

そのスレでこんな話になるのが日本だよな
ほんとバカ

34名無しのひみつ

2024/12/28(土) 17:37:01.36ID:4NM6B2MB

中共脳のAIが何の役に立つんだよ？

35名無しのひみつ

2024/12/28(土) 17:40:20.13ID:uOIPhEfC

どんな環境用意すれば実行できるんだ？

36名無しのひみつ

2024/12/28(土) 17:40:52.86ID:uOIPhEfC

どんな環境用意すれば実行できるんだ？

37名無しのひみつ

2024/12/28(土) 20:54:53.92ID:6yBgtwEY

GPT-4oに匹敵言われてもGPT-4oがしょぼすぎてな
ソース無い文章とかまともに作れてるの見た事すらない

38名無しのひみつ

2024/12/28(土) 22:08:14.62ID:u4VfWQwn

>>31
うだうだ言ってるけど内容がくそ浅くてわろ。君絶対何も中身知らんやろ。

39名無しのひみつ

2024/12/28(土) 22:50:26.73ID:NMaZpu8n

中国でもロケット打ち上げ失敗することもあるんだね
でも中傷はしないで文化レベルを示さねばと思う

40名無しのひみつ

2024/12/30(月) 19:30:32.48ID:lApYOZB3

習近平はくまのプーさんにそっくりですよね？
と質問して回答出来なければ中国製AI

41名無しのひみつ

2024/12/31(火) 18:42:17.01ID:l0yO4vPn

パラメータって読み込み数のこと？調整項目のこと？

42名無しのひみつ

2024/12/31(火) 18:57:23.09ID:hW+Avjgm

バックヤードでは何万人というオペレーターが待機だぞ

43名無しのひみつ

2025/01/01(水) 00:30:24.95ID:xB6nWl3b

天安門の回答は出来ないと思われ

44名無しのひみつ

2025/01/01(水) 00:32:15.52ID:YjKrcbOr

AIの時代は絶対に来ないとか言ってたネトウヨ、息してる？

45名無しのひみつ

2025/01/01(水) 01:02:40.89ID:Ln77oxtS

AI向けのデータセンターは再エネが豊富な国に作れ

46名無しのひみつ

2025/01/01(水) 21:38:09.05ID:NjOlOWLq

>>42
ワロタ

最近のAI旋風ってデミスハザビスのDLによるもの？
ディープマインド

47名無しのひみつ

2025/01/02(木) 10:29:13.24ID:bL8Meojh

>>19
日本が著作権無視してAI学習できる国なの知らんのか…

48名無しのひみつ

2025/01/02(木) 10:42:44.22ID:Mt4EM79k

ねえDeepSeek、天安門事件について教えて？

49名無しのひみつ

2025/01/03(金) 15:37:01.48ID:Y6fkU6qA

パラメーター数って多ければ多いほど凄くてこれが「脅威」となるようなステータスなの？

50名無しのひみつ

2025/01/27(月) 17:29:04.85ID:JvGL6jZF

技術的ブレイクスルーに対して普通に凄いねぇと言えばいいものを何とかいちゃもんをつけてやろうとする人って何なんだろう？

51名無しのひみつ

2025/01/28(火) 23:59:12.77ID:SIBkuhBV

洋画とかで自我に目覚めたアンドロイドに〇されるキモオタが出てくるけど
そんな洋画で見た世界もそろそろ来そうで楽しみ

東京都世田谷区〇〇さん（32）さんがAIに性的な処理をさせてる中
コンビニ弁当を解凍中いきなり電子レンジが爆発
都内の病院へ運ばれましたが病院の機器の誤動作で心臓麻痺で死亡
現在警察とCSIニューヨークで調査が行われています

スレをまとめに
5ch即うp → gzo.ai

■ このスレッドは過去ログ倉庫に格納されています