探検


【AI】Microsoftがたった13億のパラメーターでGPT-3.5超えのパフォーマンスをたたき出す「phi-1」を発表 [oops★]

■ このスレッドは過去ログ倉庫に格納されています
1oops ★
垢版 |
2023/06/23(金) 20:52:55.81ID:e25IpPbm
LLaMaやFalconといった小型の大規模言語モデル(LLM)が矢継ぎ早にリリースされる中、Microsoft ResearchのAI研究チームが、プレプリントサーバーのarXivで、Transformerベースのモデル「phi-1」を発表しました。このモデルは、パラメーター数がGPT-3.5の100分の1以下の13億しかないにもかかわらず、テスト用データセット・HumanEvalでGPT-3.5を上回る成績を収めたことが報告されています。

以下は、phi-1のパフォーマンスを他のモデルと比較したものです。phi-1はプログラミング能力を評価するためのデータセットであるHumanEvalで50.6%、MBPPで55.5%と、高い精度を示しました。この結果はGPT-4の67%には及びませんが、パラメーター数が1750億のGPT-3.5を上回るものでした。

https://i.gzn.jp/img/2023/06/22/phi-1-large-language-model-microsoft/s3632.png

phi-1がいかに軽量なのかについて、論文の著者のひとりであるセバスチャン・ビューベック氏は「他のHumanEval50%超えのモデルは1000倍も大きいです。例えば、WizardCoderはモデルサイズが10倍、データセットが100倍でした」と説明しています。

「Textbooks Are All You Need(必要なのは教科書だけ)」と題された論文によると、このモデルはインターネットから収集された教科書品質のデータセット60億トークンと、GPT-3.5から生成された教科書データセット10億トークンを使い、8台のNVIDIA A100によるわずか4日間のトレーニングで作られたとのこと。


※以下省略。記事全文はソース元にて

2023年06月22日 20時00分
https://gigazine.net/news/20230622-phi-1-large-language-model-microsoft/


■引用元記事
Microsoft Releases 1.3 Bn Parameter Language Model, Outperforms LLaMa
https://analyticsindiamag.com/microsoft-releases-1-3-bn-parameter-language-model-outperforms-llama/

■論文
Textbooks Are All You Need
https://arxiv.org/abs/2306.11644
2名無しのひみつ
垢版 |
2023/06/23(金) 21:06:41.36ID:wKYFgIeE
にゲット
3名無しのひみつ
垢版 |
2023/06/23(金) 21:10:51.15ID:PNxDtWak
しかしパラメーター数増やしてもGPT-4を超えられないと言うオチなんだろ
なんでGPT-3.5とか言ってんだ
4名無しのひみつ
垢版 |
2023/06/23(金) 21:21:37.65ID:BfSGHr4d
生成AIエロ動画早よ!
5名無しのひみつ
垢版 |
2023/06/23(金) 21:33:35.01ID:UtRR2059
電力食い過ぎ
6名無しのひみつ
垢版 |
2023/06/23(金) 21:35:34.56ID:jBPouB/n
>>3
人知を超えることを目的でやってるやつと
そこそこ性能をコンパクトにの違いやろな🥺
2023/06/23(金) 21:53:37.79ID:Afh/PwsZ
MSのあれは性格がよくない感じ
2023/06/24(土) 00:27:47.43ID:z5iRZDCm
独自にもやってたのか
いずれbingにも採用されるんかね
9名無しのひみつ
垢版 |
2023/06/24(土) 07:32:13.50ID:J4/w8xto
>>3
データ処理の技術ってだいたい似たようなアプローチになるよな。
最初は高性能を目指すんだけど、だんだん高性能なものは似たような品質になってきて区別がつきにくくなって、低性能でも高効率なものに関心が移りはじめる。
10名無しのひみつ
垢版 |
2023/06/24(土) 07:50:27.83ID:XCVB+ReI
私のγ-GPTは530 です。
2023/06/24(土) 08:08:32.54ID:wIT8R2Op
トレーニングでそうなるなら現実世界もそうなってほしいわ
12名無しのひみつ
垢版 |
2023/06/24(土) 08:21:10.48ID:SuFUrpg5
>>1
(゚∀。)ナルヘソ
13名無しのひみつ
垢版 |
2023/06/24(土) 09:44:07.97ID:wIT8R2Op
Windowsにチャットgpt搭載するから軽量化が必要なんだろ
そしてロボットに組み込まれるようになる

近い将来はプロジェクターに表示されたバスケットボールでシュートできるようになるの
14名無しのひみつ
垢版 |
2023/06/24(土) 10:52:34.43ID:wIT8R2Op
フット用とか膝用のVRをつけて感触とかも再現できるようになってバーチャルコート上でサッカーできるようになる
コートの幅も解像度の可変のように自由自在に変更できる
15名無しのひみつ
垢版 |
2023/06/24(土) 11:02:44.01ID:wIT8R2Op
http://prw.kyodonews.jp/prwfile/release/M101092/201603299305/_prw_PI1im_97XG73oF.JPG

こういったホログラフィックマッピングを使えば三次元で映像を映すことができる

これを使ってバーチャルキーボードがあるように、すでに接触によるポインティング動作が可能になっている
16名無しのひみつ
垢版 |
2023/06/24(土) 11:28:19.09ID:wIT8R2Op
これができればバーチャファイターも3d空間でできるようになる

http

s://xr-hub.com/wp-content/uploads/2019/02/gif-32-2.gif

マリオ64のラジコンが出る
2023/06/24(土) 19:29:16.13ID:jW3RIa6U
GTPは…3.5。ザコだな
2023/06/24(土) 19:30:09.60ID:jW3RIa6U
私のGTPは53万です。
19名無しのひみつ
垢版 |
2023/06/24(土) 21:19:26.37ID:vxM7Zw9T
1x1 pixel の背景画像を指定するとネットスケープでは極端に描画が遅くなるところ、IEでは描画が瞬時に行われ、これを持ってIEは速い!とか騒いでたんだっけな。
20名無しのひみつ
垢版 |
2023/06/25(日) 03:38:34.62ID:q0iEc5iB
技術は技術だよ
2023/06/25(日) 09:10:37.76ID:yDunuUok
まぁ元はシンプルで組み合わせで多様性を表現してる
極論すりゃ0と1の二つで歪な仮想空間構築できるくらいにはね
ファクターが多けりゃいいってもんでもないよね
知らんが
2023/06/25(日) 10:21:05.60ID:GtP5ICRm
>>13
搭載するわけないだろ
そんなことしたら他社にモデルを解析されてしまう
Windows はサーバと通信して結果を取得してるだけ
2023/06/25(日) 10:50:41.80ID:k0oIQJcM
最新AI画像
何も違和感はない。
http://imgur.com/24mA4le.jpg
24名無しのひみつ
垢版 |
2023/06/25(日) 10:51:32.44ID:vIpPqa9g
たった13億って、どういう意味?
なんと13億も、じゃないの?
25名無しのひみつ
垢版 |
2023/06/25(日) 13:48:37.15ID:1t8XSM2K
>>22
そんな懸念知らんがオフラインチャットgptはすでにアプリで出てる

色々と設定が必要なようだが
ググればでてくる
https://gigazine.net/news/20230522-private-gpt/

すぐインストールできりゃいいが素人には難しそうだな
26名無しのひみつ
垢版 |
2023/06/25(日) 14:17:51.06ID:1t8XSM2K
ネットの情報は嘘も多いからチャットgptも学習で曖昧な返事したり断り書きするよな。感情をもたないとかで

でもローカルチャットgptの場合自分で裏付けた資料を読み込ませて学習させることができる

研究用として使えるし、そういった裏付けが取れるものはネットでも評価されるだろう
事実なら

一般的なものよりオカルト絡みのチャットgptとかも出てくるかもしれない

結局技術的な問題が開発として解決したらその読み込ませは最重要になる
自分で本を読み込ませて学習させることは良いか悪いかはわからない
だけど真実ならやって見る価値はある
2023/06/25(日) 23:33:43.07ID:jR5kjvbX
>>23
痛そう
2023/06/26(月) 08:52:11.59ID:J+wIfgzV
>>25
オープンソースの GPT モデルを使えばそりゃできるだろうけど
Microsoft が採用してる GPT モデルはオープンソースじゃないから
2023/06/26(月) 14:49:41.07ID:2mNm28fh
>>3
そりゃ、3.5と4じゃ必要パラメーター数が一桁二桁違うんだから当たり前
まず3.5超えることを実証しないとその上は目指せない
2023/06/28(水) 07:57:50.47ID:5VMlgbNX
結局使ってみないと分からんからなあ
プログラムもスクラッチで作ることよりもやり取りする中でこちらの支持をちゃんと聞いてくれるかの方が大事だし
あとGPT-3.5は3550億パラメーターな
31名無しのひみつ
垢版 |
2023/06/30(金) 09:14:35.84ID:PM5wSJ+O
>>19
表示中のウェブサイトをファイルで保存したとき
1ピクセルだけの画像が入っていることがちょくちょくあったけど
そういうことだったのか
2023/06/30(金) 09:34:33.15ID:XBYMr7DA
>>28
それはない
人工知能のりんなのころからマイクロソフトが作ってる
オープンソースというよりwindowsと同じgptと所有者がマイクロソフトでそれを所有者がかけないわけ無い

というかもうマイクロソフトは今後11にgpt搭載するって発表してるよ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況