LLaMaやFalconといった小型の大規模言語モデル(LLM)が矢継ぎ早にリリースされる中、Microsoft ResearchのAI研究チームが、プレプリントサーバーのarXivで、Transformerベースのモデル「phi-1」を発表しました。このモデルは、パラメーター数がGPT-3.5の100分の1以下の13億しかないにもかかわらず、テスト用データセット・HumanEvalでGPT-3.5を上回る成績を収めたことが報告されています。
以下は、phi-1のパフォーマンスを他のモデルと比較したものです。phi-1はプログラミング能力を評価するためのデータセットであるHumanEvalで50.6%、MBPPで55.5%と、高い精度を示しました。この結果はGPT-4の67%には及びませんが、パラメーター数が1750億のGPT-3.5を上回るものでした。
https://i.gzn.jp/img/2023/06/22/phi-1-large-language-model-microsoft/s3632.png
phi-1がいかに軽量なのかについて、論文の著者のひとりであるセバスチャン・ビューベック氏は「他のHumanEval50%超えのモデルは1000倍も大きいです。例えば、WizardCoderはモデルサイズが10倍、データセットが100倍でした」と説明しています。
「Textbooks Are All You Need(必要なのは教科書だけ)」と題された論文によると、このモデルはインターネットから収集された教科書品質のデータセット60億トークンと、GPT-3.5から生成された教科書データセット10億トークンを使い、8台のNVIDIA A100によるわずか4日間のトレーニングで作られたとのこと。
※以下省略。記事全文はソース元にて
2023年06月22日 20時00分
https://gigazine.net/news/20230622-phi-1-large-language-model-microsoft/
■引用元記事
Microsoft Releases 1.3 Bn Parameter Language Model, Outperforms LLaMa
https://analyticsindiamag.com/microsoft-releases-1-3-bn-parameter-language-model-outperforms-llama/
■論文
Textbooks Are All You Need
https://arxiv.org/abs/2306.11644
【AI】Microsoftがたった13億のパラメーターでGPT-3.5超えのパフォーマンスをたたき出す「phi-1」を発表 [oops★]
■ このスレッドは過去ログ倉庫に格納されています
1oops ★
2023/06/23(金) 20:52:55.81ID:e25IpPbm2名無しのひみつ
2023/06/23(金) 21:06:41.36ID:wKYFgIeE にゲット
3名無しのひみつ
2023/06/23(金) 21:10:51.15ID:PNxDtWak しかしパラメーター数増やしてもGPT-4を超えられないと言うオチなんだろ
なんでGPT-3.5とか言ってんだ
なんでGPT-3.5とか言ってんだ
4名無しのひみつ
2023/06/23(金) 21:21:37.65ID:BfSGHr4d 生成AIエロ動画早よ!
5名無しのひみつ
2023/06/23(金) 21:33:35.01ID:UtRR2059 電力食い過ぎ
6名無しのひみつ
2023/06/23(金) 21:35:34.56ID:jBPouB/n2023/06/23(金) 21:53:37.79ID:Afh/PwsZ
MSのあれは性格がよくない感じ
2023/06/24(土) 00:27:47.43ID:z5iRZDCm
独自にもやってたのか
いずれbingにも採用されるんかね
いずれbingにも採用されるんかね
9名無しのひみつ
2023/06/24(土) 07:32:13.50ID:J4/w8xto >>3
データ処理の技術ってだいたい似たようなアプローチになるよな。
最初は高性能を目指すんだけど、だんだん高性能なものは似たような品質になってきて区別がつきにくくなって、低性能でも高効率なものに関心が移りはじめる。
データ処理の技術ってだいたい似たようなアプローチになるよな。
最初は高性能を目指すんだけど、だんだん高性能なものは似たような品質になってきて区別がつきにくくなって、低性能でも高効率なものに関心が移りはじめる。
10名無しのひみつ
2023/06/24(土) 07:50:27.83ID:XCVB+ReI 私のγ-GPTは530 です。
11名無しのひみつ
2023/06/24(土) 08:08:32.54ID:wIT8R2Op トレーニングでそうなるなら現実世界もそうなってほしいわ
12名無しのひみつ
2023/06/24(土) 08:21:10.48ID:SuFUrpg5 >>1
(゚∀。)ナルヘソ
(゚∀。)ナルヘソ
13名無しのひみつ
2023/06/24(土) 09:44:07.97ID:wIT8R2Op Windowsにチャットgpt搭載するから軽量化が必要なんだろ
そしてロボットに組み込まれるようになる
近い将来はプロジェクターに表示されたバスケットボールでシュートできるようになるの
そしてロボットに組み込まれるようになる
近い将来はプロジェクターに表示されたバスケットボールでシュートできるようになるの
14名無しのひみつ
2023/06/24(土) 10:52:34.43ID:wIT8R2Op フット用とか膝用のVRをつけて感触とかも再現できるようになってバーチャルコート上でサッカーできるようになる
コートの幅も解像度の可変のように自由自在に変更できる
コートの幅も解像度の可変のように自由自在に変更できる
15名無しのひみつ
2023/06/24(土) 11:02:44.01ID:wIT8R2Op http://prw.kyodonews.jp/prwfile/release/M101092/201603299305/_prw_PI1im_97XG73oF.JPG
こういったホログラフィックマッピングを使えば三次元で映像を映すことができる
これを使ってバーチャルキーボードがあるように、すでに接触によるポインティング動作が可能になっている
こういったホログラフィックマッピングを使えば三次元で映像を映すことができる
これを使ってバーチャルキーボードがあるように、すでに接触によるポインティング動作が可能になっている
16名無しのひみつ
2023/06/24(土) 11:28:19.09ID:wIT8R2Op これができればバーチャファイターも3d空間でできるようになる
http
s://xr-hub.com/wp-content/uploads/2019/02/gif-32-2.gif
マリオ64のラジコンが出る
http
s://xr-hub.com/wp-content/uploads/2019/02/gif-32-2.gif
マリオ64のラジコンが出る
17名無しのひみつ
2023/06/24(土) 19:29:16.13ID:jW3RIa6U GTPは…3.5。ザコだな
18名無しのひみつ
2023/06/24(土) 19:30:09.60ID:jW3RIa6U 私のGTPは53万です。
19名無しのひみつ
2023/06/24(土) 21:19:26.37ID:vxM7Zw9T 1x1 pixel の背景画像を指定するとネットスケープでは極端に描画が遅くなるところ、IEでは描画が瞬時に行われ、これを持ってIEは速い!とか騒いでたんだっけな。
20名無しのひみつ
2023/06/25(日) 03:38:34.62ID:q0iEc5iB 技術は技術だよ
21名無しのひみつ
2023/06/25(日) 09:10:37.76ID:yDunuUok まぁ元はシンプルで組み合わせで多様性を表現してる
極論すりゃ0と1の二つで歪な仮想空間構築できるくらいにはね
ファクターが多けりゃいいってもんでもないよね
知らんが
極論すりゃ0と1の二つで歪な仮想空間構築できるくらいにはね
ファクターが多けりゃいいってもんでもないよね
知らんが
22名無しのひみつ
2023/06/25(日) 10:21:05.60ID:GtP5ICRm23名無しのひみつ
2023/06/25(日) 10:50:41.80ID:k0oIQJcM24名無しのひみつ
2023/06/25(日) 10:51:32.44ID:vIpPqa9g たった13億って、どういう意味?
なんと13億も、じゃないの?
なんと13億も、じゃないの?
25名無しのひみつ
2023/06/25(日) 13:48:37.15ID:1t8XSM2K >>22
そんな懸念知らんがオフラインチャットgptはすでにアプリで出てる
色々と設定が必要なようだが
ググればでてくる
https://gigazine.net/news/20230522-private-gpt/
すぐインストールできりゃいいが素人には難しそうだな
そんな懸念知らんがオフラインチャットgptはすでにアプリで出てる
色々と設定が必要なようだが
ググればでてくる
https://gigazine.net/news/20230522-private-gpt/
すぐインストールできりゃいいが素人には難しそうだな
26名無しのひみつ
2023/06/25(日) 14:17:51.06ID:1t8XSM2K ネットの情報は嘘も多いからチャットgptも学習で曖昧な返事したり断り書きするよな。感情をもたないとかで
でもローカルチャットgptの場合自分で裏付けた資料を読み込ませて学習させることができる
研究用として使えるし、そういった裏付けが取れるものはネットでも評価されるだろう
事実なら
一般的なものよりオカルト絡みのチャットgptとかも出てくるかもしれない
結局技術的な問題が開発として解決したらその読み込ませは最重要になる
自分で本を読み込ませて学習させることは良いか悪いかはわからない
だけど真実ならやって見る価値はある
でもローカルチャットgptの場合自分で裏付けた資料を読み込ませて学習させることができる
研究用として使えるし、そういった裏付けが取れるものはネットでも評価されるだろう
事実なら
一般的なものよりオカルト絡みのチャットgptとかも出てくるかもしれない
結局技術的な問題が開発として解決したらその読み込ませは最重要になる
自分で本を読み込ませて学習させることは良いか悪いかはわからない
だけど真実ならやって見る価値はある
28名無しのひみつ
2023/06/26(月) 08:52:11.59ID:J+wIfgzV29名無しのひみつ
2023/06/26(月) 14:49:41.07ID:2mNm28fh30名無しのひみつ
2023/06/28(水) 07:57:50.47ID:5VMlgbNX 結局使ってみないと分からんからなあ
プログラムもスクラッチで作ることよりもやり取りする中でこちらの支持をちゃんと聞いてくれるかの方が大事だし
あとGPT-3.5は3550億パラメーターな
プログラムもスクラッチで作ることよりもやり取りする中でこちらの支持をちゃんと聞いてくれるかの方が大事だし
あとGPT-3.5は3550億パラメーターな
31名無しのひみつ
2023/06/30(金) 09:14:35.84ID:PM5wSJ+O32名無しのひみつ
2023/06/30(金) 09:34:33.15ID:XBYMr7DA >>28
それはない
人工知能のりんなのころからマイクロソフトが作ってる
オープンソースというよりwindowsと同じgptと所有者がマイクロソフトでそれを所有者がかけないわけ無い
というかもうマイクロソフトは今後11にgpt搭載するって発表してるよ
それはない
人工知能のりんなのころからマイクロソフトが作ってる
オープンソースというよりwindowsと同じgptと所有者がマイクロソフトでそれを所有者がかけないわけ無い
というかもうマイクロソフトは今後11にgpt搭載するって発表してるよ
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【薬】ED治療市販薬「シアリス」、7月末に発売 処方箋なし国内初、エスエス製薬 1回1錠、勃起を促す効果が最大36時間持続 [ぐれ★]
- 【野球】橋上巨人が強い!強すぎる!!! ついにセ首位浮上 6月はいまだ無敗 交流戦3年ぶりの勝ち越し決定 [ニーニーφ★]
- 「自分の声に似てる」「編集されて細切れ」「確信は持てない」高市総理、ネガキャン疑惑の音声を弁明…「事実と違う発言」撤回し答弁訂正 [ぐれ★]
- LUUP、都内で初の死亡事故発生……ひろゆき氏「時間の問題と言われてたけど 案の定…」 [少考さん★]
- 【6人死亡新名神事故】「運転中の携帯電話使用の厳罰化を」 遺族が家族の写真を公開 [ぐれ★]
- 【訃報】河野洋平・元衆議院議長が今月8日に死去 89歳 自民党総裁や外務大臣など歴任 93年には「河野談話」発表 [首都圏の虎★]
- 東京ポイント11000円、東京アプリにマイナンバー連携した人数が510万人突破 [245325974]
- 🏡📈👊😅👊📈🏡
- 【高市疑惑】高市、週刊誌報道を認める!なぜ、一度は否定したのかについても苦しい釈明。頑張って、サナエ [219241683]
- 広報アカウント「高市さんはダルっ!なんて言ってない「ちょっと大丈夫かな」と言っただけ」 [834922174]
- 日本企業、高市のせいでタングステンの在庫が6月をもって枯渇したと発表。7月以降の製品供給が未定になる [709039863]
- 【画像】最近の中学生の乳房、大人顔負け [769931615]