OpenAI發佈LifeSciBench:衡量AI系統在真實科研場景中的能力
Svmuu訊 OpenAI 發佈全新評測基準 LifeSciBench,旨在衡量 AI 系統在真實科研場景中的能力。據悉,LifeSciBench 基於 750 道專家編寫任務,覆蓋 7 類科研工作流與 7 個生物學領域,任務來源於 173 名具有博士背景並具備生物科技或製藥行業經驗的科研人員,該基準強調複雜科研能力評估,包括證據整合、實驗設計、數據分析、科學推理與科研溝通等能力,而非單一事實性問題。超過 79%的任務包含多步驟推理,平均每道題需約 4 個推理步驟,並包含 1,062 個真實科研相關數據附件(如論文、圖表、序列數據及結構文件等)。
免責聲明:本內容僅代表作者個人觀點,不構成任何投資理財建議。如有發現違規內容點擊舉報
24小時熱榜
-
伊朗外交部:伊美達成協議文件
-
幣安將上線LRCX、KLAC等7個U本位永續合約
-
Gate合約股票專區上線ADSK(歐特克)、BKNG(繽客控股)等8個永續合約交易
-
深入瞭解ALTHEA代幣(ALTH)及其去中心化網絡
-
Morgan Stanley更新以太坊和Solana ETF文件,擬收取0.14%費用
-
OKX DEX xStocks交易賽進行中,總獎池300,000 USDC
-
10倍做多原油後浮虧133萬美元,某地址持有價值3777萬美元CL多單
-
伊朗媒體稱伊美談判達成5項要點
-
亞洲槓桿AI押注創紀錄:韓國SK海力士2倍做多ETF資產管理規模達130億美元
-
某聰明錢購入32萬美元世界盃小組賽阿根廷戰勝奧地利
推薦閱讀




