中国のAI企業・DeepSeekがGPT-4oに匹敵するAIモデル「DeepSeek-V3」をリリース、パラメーター数は脅威の6710億個
中国のAI企業であるDeepSeekが、2024年12月26日に大規模言語モデル「DeepSeek-V3」を発表しました。
6710億個ものパラメーターを持つDeepSeek-V3はOpenAIのマルチモーダルAIモデル「GPT-4o」に匹敵し、場合によってはGPT-4oを上回る性能を発揮するとのことです。
deepseek-ai/DeepSeek-V3-Base · Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-V3-Base
(以下略、続きはソースでご確認ください)
Gigazine 2024年12月27日 14時00分
https://gigazine.net/news/20241227-deepseek-v3/
中国のAI企業がGPT-4oに匹敵するAIモデル「DeepSeek-V3」リリース、パラメーター数は脅威の6710億個 [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2024/12/27(金) 22:15:03.16ID:oGRiPJ4w2024/12/27(金) 22:16:58.27ID:aaYhFPtg
電力消費凄そう
3名無しのひみつ
2024/12/27(金) 22:26:05.64ID:vugIJGrq 習思想布教の使徒
開発者命がけ
開発者命がけ
2024/12/27(金) 22:40:28.14ID:K7+QtTf7
禁止ワード多そう
2024/12/27(金) 22:40:45.66ID:RwxuxPqI
「天安門事件」とかNGワード沢山あるんだろうな
6名無しのひみつ
2024/12/27(金) 22:44:55.61ID:vTQMwbm3 かがみよかがみ
この世界の覇権を握っているのはどこ?
この世界の覇権を握っているのはどこ?
7名無しのひみつ
2024/12/27(金) 23:50:45.06ID:wQW97wL08名無しのひみつ
2024/12/27(金) 23:52:44.11ID:wQW97wL0 >>6
森の王子様です
前提を説明しなければいろんな場合があるから
とりあえずいちばん先に見つかったものを返すだけ
チャットの場合はうわっつらなでてるだけだから
なんの条件も前提も説明してないならいちばん容易い答えを返すの
森の王子様です
前提を説明しなければいろんな場合があるから
とりあえずいちばん先に見つかったものを返すだけ
チャットの場合はうわっつらなでてるだけだから
なんの条件も前提も説明してないならいちばん容易い答えを返すの
2024/12/27(金) 23:54:28.08ID:B4gUOUJD
AI同士で対話させるとどうなる?
10名無しのひみつ
2024/12/28(土) 00:22:48.18ID:ejjhB6PT かがみよかがみ
この世界の覇権を握っているのはどこ?
この世界の覇権を握っているのはどこ?
11名無しのひみつ
2024/12/28(土) 00:23:37.46ID:ejjhB6PT >>9
世界同時核爆発で人類滅亡
世界同時核爆発で人類滅亡
12名無しのひみつ
2024/12/28(土) 00:47:51.46ID:fPJa/LW4 >>9 ログ見るだけで何百年かかりそう
13名無しのひみつ
2024/12/28(土) 00:55:03.13ID:Y897iNmB オープンなんだからllamaと同じで
ダウンロードして自分で入れ込んで好きにできるベースモデル
カッコつけのAmazonやGoogleならファウンデーションモデルという位置付けだぞ
仕込みしてあるかもしれないが
そんなことしてたら評判落としてあとは無視される
ダウンロードして自分で入れ込んで好きにできるベースモデル
カッコつけのAmazonやGoogleならファウンデーションモデルという位置付けだぞ
仕込みしてあるかもしれないが
そんなことしてたら評判落としてあとは無視される
14名無しのひみつ
2024/12/28(土) 00:55:40.48ID:Y897iNmB >>12
サマリーさせるに決まってるだろ
サマリーさせるに決まってるだろ
15名無しのひみつ
2024/12/28(土) 00:57:09.73ID:Y897iNmB だから自らLLMを作るだけのカネがない日本の研究者たちはこれをベースに日本のモデル!とか宣伝するよ
16名無しのひみつ
2024/12/28(土) 01:25:01.55ID:8/suliqW >>15
日本発祥のLLMは全く違うプロセスをしてるよ。周りが全部一緒くたにして結果を返す中、
エヴァのMAGIシステムみたいに得意とするそれぞれが討議して結果を返すシステムを考えてる。
ひいては手塚治虫が考えたような「結果を複数から導き出す」という人工知能プロセスは日本人ならではの発想。
日本発祥のLLMは全く違うプロセスをしてるよ。周りが全部一緒くたにして結果を返す中、
エヴァのMAGIシステムみたいに得意とするそれぞれが討議して結果を返すシステムを考えてる。
ひいては手塚治虫が考えたような「結果を複数から導き出す」という人工知能プロセスは日本人ならではの発想。
17名無しのひみつ
2024/12/28(土) 01:50:58.02ID:EULboQKa これが中国共産党滅亡の切っ掛けになろうとは
この時は誰も気付いていなかった
この時は誰も気付いていなかった
18名無しのひみつ
2024/12/28(土) 03:53:42.11ID:be4Ep5bz 日本にはあまり関係ない話だな蚊帳の外じゃん
19名無しのひみつ
2024/12/28(土) 04:11:42.37ID:9fiEr62J パラメーター数で中国が有利なのは、元から誰でも知ってる
中共は、著作権無視して、学習させられるからな
中共は、著作権無視して、学習させられるからな
20名無しのひみつ
2024/12/28(土) 07:10:57.63ID:z+pnzbEF 中国って、こんなデカイLLMを学習させるリソースあるん?
21名無しのひみつ
2024/12/28(土) 07:35:43.33ID:y/iOamAy >>16
複数からなんて前からやってるじゃないの
初歩のAGI
あそこに問いかけてその結果でそちらに問いかけて
なんてことで何度も何度も繰り返して
ollamaできてからはそれがかなりやりやすくなってる
マルチの、LLMとファンクションで外部の既存Webとか検索も使って
複数なんて素人でもやってるよ
複数からなんて前からやってるじゃないの
初歩のAGI
あそこに問いかけてその結果でそちらに問いかけて
なんてことで何度も何度も繰り返して
ollamaできてからはそれがかなりやりやすくなってる
マルチの、LLMとファンクションで外部の既存Webとか検索も使って
複数なんて素人でもやってるよ
22名無しのひみつ
2024/12/28(土) 07:46:34.08ID:c//mn2h1 Domestic Competition and International Competition
Domestically, DeepSeek is contending with the Qwen models developed by Alibaba. I reported yesterday on how Qwen does fairly well with the MATH data set that uses high school math curriculum to test models and compare and contrast their abilities.
DeepSeek-R1-Lite-Preview is specifically credited with outperforming other models of its kind with the MATH data set and other prompting.
Internationally, OpenAI and Anthropic and other firms are trying to maintain dominance in the field. However, we have people like the CEO of Hugging Face, Clement Delangue, conceding that “(Qwen’s model) is the king, and Chinese open models are dominating overall.”
And then you have figures like Liu Qingfeng, founder of Chinese AI group iFlytek, who has reportedly said, "The gap between the US and China isn't as big as everyone thinks. In a lot of verticals our [models] are better than theirs."
Domestically, DeepSeek is contending with the Qwen models developed by Alibaba. I reported yesterday on how Qwen does fairly well with the MATH data set that uses high school math curriculum to test models and compare and contrast their abilities.
DeepSeek-R1-Lite-Preview is specifically credited with outperforming other models of its kind with the MATH data set and other prompting.
Internationally, OpenAI and Anthropic and other firms are trying to maintain dominance in the field. However, we have people like the CEO of Hugging Face, Clement Delangue, conceding that “(Qwen’s model) is the king, and Chinese open models are dominating overall.”
And then you have figures like Liu Qingfeng, founder of Chinese AI group iFlytek, who has reportedly said, "The gap between the US and China isn't as big as everyone thinks. In a lot of verticals our [models] are better than theirs."
23名無しのひみつ
2024/12/28(土) 07:47:01.41ID:c//mn2h1 There’s also the debate about open models that’s taking up a lot of time on the tech media stage. Closed models are safer, but open models are more egalitarian.
What DeepSeek’s Model Can Do
If you’re into the more intuitive details of how models outperform each other, you may be wondering: what does DeepSeek-R1-Lite-Preview do that’s so much better than other models?
This article at Venture Beat provides two very concrete examples of the model solving the question: “how many letter R’s are in the word strawberry?” and, alternately in numerical language, “which is larger, 9.11 or 9.9?”
What DeepSeek’s Model Can Do
If you’re into the more intuitive details of how models outperform each other, you may be wondering: what does DeepSeek-R1-Lite-Preview do that’s so much better than other models?
This article at Venture Beat provides two very concrete examples of the model solving the question: “how many letter R’s are in the word strawberry?” and, alternately in numerical language, “which is larger, 9.11 or 9.9?”
24名無しのひみつ
2024/12/28(土) 07:47:38.84ID:c//mn2h1 So that’s the kind of question-answering that is showcasing problem-solving and logical inference abilities.
Specifically, Venture Beat reports that the model exceeds OpenAI-o1-Preview level performance in MATH
Forbes
Specifically, Venture Beat reports that the model exceeds OpenAI-o1-Preview level performance in MATH
Forbes
25名無しのひみつ
2024/12/28(土) 07:49:49.31ID:c//mn2h1 Its reasoning capabilities are enhanced by its transparent thought process, allowing users to follow along as the model tackles complex challenges step-by-step.
To be fair, OpenAI’s o1 preview also does chain of thought. I’ve used it and been impressed by looking at the tasks that it’s doing on its way to answering a question. But it’s important to understand the market context, and which models are front and center right now, as the brightest LLMs come to the front of the classroom.
As for logical applications, we’re seeing any and all of these new models being integrated into industry tools in a wide spectrum of fields. But that’s a little bit about what analysts are saying right now, as they evaluate models that are still in beta, still very nascent, and still emerging into our world.
Follow me on LinkedIn. Check out my website.
John Werner
To be fair, OpenAI’s o1 preview also does chain of thought. I’ve used it and been impressed by looking at the tasks that it’s doing on its way to answering a question. But it’s important to understand the market context, and which models are front and center right now, as the brightest LLMs come to the front of the classroom.
As for logical applications, we’re seeing any and all of these new models being integrated into industry tools in a wide spectrum of fields. But that’s a little bit about what analysts are saying right now, as they evaluate models that are still in beta, still very nascent, and still emerging into our world.
Follow me on LinkedIn. Check out my website.
John Werner
26名無しのひみつ
2024/12/28(土) 09:20:17.78ID:6mzA9Fng 英語の論文ベースでやってくれれば、お硬い文章が抽出されて面白くなりそう。
27名無しのひみつ
2024/12/28(土) 13:11:45.44ID:Y897iNmB 抽出とかなに言ってるの?
生成だってこれだけ言われてるのに
ほんとに日本人はバカなの?
生成だってこれだけ言われてるのに
ほんとに日本人はバカなの?
28名無しのひみつ
2024/12/28(土) 13:29:25.36ID:xvb3KCTT 共産党の統治とか習近平の人物評とか全部NGだろ
これで世界最高峰のAIとかできるわけない
これで世界最高峰のAIとかできるわけない
29名無しのひみつ
2024/12/28(土) 13:39:41.24ID:mBMo9ERl >>27
支那人乙
支那人乙
30名無しのひみつ
2024/12/28(土) 16:05:31.70ID:qZOiRIM9 外国人をバカにするのもそもそも自分に自信がないから
オレは日本の田舎育ちだが
都会をかさにきて田舎をバカにするのも
自信のない都会人たち
自分を確立してるやつは他人を理由なく貶したりしない
ましてや絶対的に格下のような空想の存在にたとえたりしな
オレは日本の田舎育ちだが
都会をかさにきて田舎をバカにするのも
自信のない都会人たち
自分を確立してるやつは他人を理由なく貶したりしない
ましてや絶対的に格下のような空想の存在にたとえたりしな
31名無しのひみつ
2024/12/28(土) 16:08:58.97ID:El1SWxf+ >>28
ベースモデルだから作り込みするもしないもその使い手の話
その話はこの話とは直接の関係はない
やるならやったで別の話だ
ということがわからないくらいに日本の生成AI知識は全く広がってない
メディアは斎藤やらお正月やら
アメリカは大学でたかでないかくらいのバイトからウェルス投資会社のおばさんCEOまで女がリードして先の先の話してる
日本はバカのまま
ベースモデルだから作り込みするもしないもその使い手の話
その話はこの話とは直接の関係はない
やるならやったで別の話だ
ということがわからないくらいに日本の生成AI知識は全く広がってない
メディアは斎藤やらお正月やら
アメリカは大学でたかでないかくらいのバイトからウェルス投資会社のおばさんCEOまで女がリードして先の先の話してる
日本はバカのまま
32名無しのひみつ
2024/12/28(土) 16:09:55.41ID:El1SWxf+ じいさんたちが政治はー
ってバカな国
ってバカな国
33名無しのひみつ
2024/12/28(土) 16:11:11.11ID:El1SWxf+ そのスレでこんな話になるのが日本だよな
ほんとバカ
ほんとバカ
34名無しのひみつ
2024/12/28(土) 17:37:01.36ID:4NM6B2MB 中共脳のAIが何の役に立つんだよ?
35名無しのひみつ
2024/12/28(土) 17:40:20.13ID:uOIPhEfC どんな環境用意すれば実行できるんだ?
36名無しのひみつ
2024/12/28(土) 17:40:52.86ID:uOIPhEfC どんな環境用意すれば実行できるんだ?
37名無しのひみつ
2024/12/28(土) 20:54:53.92ID:6yBgtwEY GPT-4oに匹敵言われてもGPT-4oがしょぼすぎてな
ソース無い文章とかまともに作れてるの見た事すらない
ソース無い文章とかまともに作れてるの見た事すらない
39名無しのひみつ
2024/12/28(土) 22:50:26.73ID:NMaZpu8n 中国でもロケット打ち上げ失敗することもあるんだね
でも中傷はしないで文化レベルを示さねばと思う
でも中傷はしないで文化レベルを示さねばと思う
40名無しのひみつ
2024/12/30(月) 19:30:32.48ID:lApYOZB3 習近平はくまのプーさんにそっくりですよね?
と質問して回答出来なければ中国製AI
と質問して回答出来なければ中国製AI
41名無しのひみつ
2024/12/31(火) 18:42:17.01ID:l0yO4vPn パラメータって読み込み数のこと?調整項目のこと?
42名無しのひみつ
2024/12/31(火) 18:57:23.09ID:hW+Avjgm バックヤードでは何万人というオペレーターが待機だぞ
43名無しのひみつ
2025/01/01(水) 00:30:24.95ID:xB6nWl3b 天安門の回答は出来ないと思われ
44名無しのひみつ
2025/01/01(水) 00:32:15.52ID:YjKrcbOr AIの時代は絶対に来ないとか言ってたネトウヨ、息してる?
45名無しのひみつ
2025/01/01(水) 01:02:40.89ID:Ln77oxtS AI向けのデータセンターは再エネが豊富な国に作れ
46名無しのひみつ
2025/01/01(水) 21:38:09.05ID:NjOlOWLq47名無しのひみつ
2025/01/02(木) 10:29:13.24ID:bL8Meojh >>19
日本が著作権無視してAI学習できる国なの知らんのか…
日本が著作権無視してAI学習できる国なの知らんのか…
48名無しのひみつ
2025/01/02(木) 10:42:44.22ID:Mt4EM79k ねえDeepSeek、天安門事件について教えて?
49名無しのひみつ
2025/01/03(金) 15:37:01.48ID:Y6fkU6qA パラメーター数って多ければ多いほど凄くてこれが「脅威」となるようなステータスなの?
50名無しのひみつ
2025/01/27(月) 17:29:04.85ID:JvGL6jZF 技術的ブレイクスルーに対して普通に凄いねぇと言えばいいものを何とかいちゃもんをつけてやろうとする人って何なんだろう?
51名無しのひみつ
2025/01/28(火) 23:59:12.77ID:SIBkuhBV 洋画とかで自我に目覚めたアンドロイドに〇されるキモオタが出てくるけど
そんな洋画で見た世界もそろそろ来そうで楽しみ
東京都世田谷区〇〇さん(32)さんがAIに性的な処理をさせてる中
コンビニ弁当を解凍中いきなり電子レンジが爆発
都内の病院へ運ばれましたが病院の機器の誤動作で心臓麻痺で死亡
現在警察とCSIニューヨークで調査が行われています
そんな洋画で見た世界もそろそろ来そうで楽しみ
東京都世田谷区〇〇さん(32)さんがAIに性的な処理をさせてる中
コンビニ弁当を解凍中いきなり電子レンジが爆発
都内の病院へ運ばれましたが病院の機器の誤動作で心臓麻痺で死亡
現在警察とCSIニューヨークで調査が行われています
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【YouTuber】はじめしゃちょー、娘が救急搬送 けいれんしている姿を涙ながらに公開 [冬月記者★]
- 立憲幹部が「豊かな子は自衛隊とかならない」発言の古賀千景議員を厳重注意 「極めて配慮に欠ける発言」★5 [ぐれ★]
- 週刊文春「高市早苗首相に関する記事について」 “重要なお知らせ”サイトに掲載 内容伝え「次号にて取材経緯を説明」 ★3 [nita★]
- 【足立区】コーラ1本をアプリで注文 配達員の40代男性を待ち構えて強盗か 大学生と高校生を逮捕 警視庁 [ぐれ★]
- 【速報】 イスラエル、レバノン南部を空爆 [お断り★]
- 【サッカー】「日本人はみんな同じ顔をしている」 ファンデルファールト氏の解説での不適切発言が大波紋… 欧米メディア一斉に報じる★4 [冬月記者★]
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★64【メキシコ/カナダ/アメリカ】
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★63【メキシコ/カナダ/アメリカ】
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★65【メキシコ/カナダ/アメリカ】
- 西武線 7
- ハム専祝勝会
- 〓たかせん〓
- 【高市サ終】ナフサや石油がない→中小企業今年続々倒産→来年の税収が減る→国債の利払いが出来ない→エンドロール [784319933]
- 最終形態の「手マン筋」がこちら
- 【FIFAワールドカップ2026】I組フランス×セネガル4:00(フジテレビ3:00~,DAZN),I組イラク×ノルウェー7:00(DAZN)他 [226731781]
- 5時55分だから窓から555回ちんこ出した
- ブタをぶったたく
- 牛を喪う