AIが科学者にとってどれだけ役立つかを測定できるベンチマークテスト「LifeSciBench」をOpenAIが公開
2026年06月18日 11時17分
https://gigazine.net/news/20260618-openai-lifescibench/
OpenAIがAIベンチマークテスト「LifeSciBench」を2026年6月17日に発表しました。LifeSciBenchは「AIが生命科学研究者にとってどれだけ有用か」を測定できるベンチマークテストで、従来の科学系テストと比べて実際の運用に沿った評価が可能とされています。
AIの科学関連タスクの性能を測定するベンチマークテストは複数存在しますが、従来のテストには「狭い領域の知識を対象としている」「明確な正解が用意された一問一答形式になっている」といった問題があり、現実世界での実際の能力をうまく反映できていませんでした。
そこで、OpenAIは科学者が日常的に処理しているタスクを「科学的根拠の取り扱い」「分析」「設計と最適化」「科学的考察」「検証と運用」「科学的知見の臨床意思決定への結びつけ」「科学的コミュニケーション」の7種に分類し、バイオテクノロジーや創薬に携わる173人の科学者と協力して課題を作成しました。各課題は「科学者が知識豊富な共同研究者に依頼する」という形式で構成されており、AIは関連する資料の内容を確認しつつ自由記述形式で回答を生成する必要があります。
LifeSciBenchではAIに合計750件のタスクを与えます。AIには図表や化学構造ファイルなどを含む1062件の添付資料が与えられ、タスクの53%は少なくとも1つの資料を参照するように設計されています。
【ナゾロジー】ナルシストやサイコパス傾向が高い人の脳に“共通する特徴”を発見 [すらいむ★]
93名無しのひみつ
2026/06/18(木) 12:06:07.14ID:3jgye0Wsレスを投稿する
ニュース
- 【米紙報道】高市首相「コングレッショナルフェロー(官職)」経歴詐称疑惑… ★2 [BFU★]
- 【北区小学校火災】女性教師「電気ストーブ近くで洗濯物を乾かしていた」 失火とみて捜査 燃えた残骸に“繊維片”付着 ★7 [Ailuropoda melanoleuca★]
- 【W杯】森保一監督が「首位突破」を厳命!スウェーデン戦は大量得点の圧勝狙う 2位じゃダメなのですか?ダメなのです!! [征夷大将軍★]
- 【W杯】元ブラジル代表ロナウド氏「日本には簡単に勝てる」決勝T1回戦で対戦可能性…避けたいのは「オランダ」 ★3 [首都圏の虎★]
- 【ブロマンス詐欺】「好き♡」 70代男性にメッセージ 現金2000万円をだまし取った疑い 64歳の男を逮捕 [nita★]
- 【クールジャパン】ゲームやアニメなどコンテンツ産業の海外展開支援、政府が司令塔の法人設立へ…日本の「勝ち筋」に官民の叡智結集 [樽悶★]
- 〓たかせん〓 5
- おりせん☆3
- はません ★2
- ハム専 ★7
- 男子バレーボール総合実況スレ61
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★163【メキシコ/カナダ/アメリカ】
- 高市早苗さんが元米国議会立法調査官なんて立派なものではなくコロラドでインターンしてただけではないかという疑惑、徐々にバレ始める [617981698]
- 【同時視聴】キングスマン:ゴールデン・サークル★2
- 【同時視聴】キングスマン:ゴールデン・サークル
- 現役JDのお茶会スレ( ¨̮ )︎︎𖠚ᐝ16
- 3大、すぐ無くなる物「ティッシュ」「リモコン」「残高」あと1つは? [993451824]
- 金バエ(享年48)「毎日ビール9リットル飲んでいたら肝硬変になりました」 [832215575]