OpenAIが「LifeSciBench」を発表:実際の科学研究の現場におけるAIシステムの能力を評価
Svmuuニュース:OpenAIは、実際の科学研究の場面におけるAIシステムの能力を測定することを目的とした、新たな評価ベンチマーク「LifeSciBench」を公開した。LifeSciBenchは、専門家が作成した750の課題に基づき、7種類の研究ワークフローと7つの生物学分野を網羅している。タスクは、博士号を取得し、バイオテクノロジーまたは製薬業界での経験を持つ173名の研究者から提供されたもので、このベンチマークは、単一の事実確認問題ではなく、証拠の統合、実験設計、データ分析、科学的推論、研究コミュニケーションなどの能力を含む、複雑な研究能力の評価に重点を置いている。79%を超える課題には多段階の推論が含まれており、1問あたり平均約4段階の推論ステップを要し、1,062件の実研究に関連するデータ添付ファイル(論文、図表、配列データ、構造ファイルなど)が含まれている。
免責事項:本内容は著者個人の見解であり、投資助言ではありません。違反内容を発見した場合クリックして通報
24H人気ランキング
-
バイナンス LRCX、KLACなど7つのU建て永久先物が上場予定
-
Gateの株式専用エリアにて、ADSK(オートデスク)、BKNG(ブッキング・ドット・コム)など8銘柄の永久先物取引が開始されました
-
ALTHEAトークン(ALTH)とその分散型ネットワークについて詳しく知る
-
モルガン・スタンレーは、イーサリアムおよびSolanaのETF申請書類を更新し、0.14%の手数料を徴収する方針を示した
-
原油を10倍のレバレッジで買い、133万ドルの含み損。あるアドレスが3777万ドル相当のCLロングポジションを保有
-
アジアのレバレッジ型AI投資が過去最高を記録:韓国のSKハイニックスが2倍のロングETFを運用、運用資産総額は130億ドルに達した
-
OKX DEX xStocks トレードコンテスト開催中、賞金総額は300,000 USDC
-
ある「スマートマネー」が32万ドルを購入 ワールドカップのグループリーグでアルゼンチンがオーストリアに勝利
-
市場ニュース:米国のヴァンス副大統領は、イランとの初の会談を終えた後、まもなくスイスで演説を行う予定だ
-
中国本土のドージコイン取引プラットフォームの現状:規制政策と世界の主流の選択肢
おすすめ記事





