>>7
違うぞ
強化学習を強力に採用したのはDeepSeek

強化学習を顕著に取り入れた最初の大規模言語モデルは、2024 年 4 月に公開された DeepSeek-math-7b-RL
このモデルは数学的なタスクでのパフォーマンスが評価され、言語モデルで強化学習を使用する先例