OpenAI發佈LifeSciBench：衡量AI系統在真實科研場景中的能力

2026/06/19 23:30

投訴舉報

Svmuu訊 OpenAI 發佈全新評測基準 LifeSciBench，旨在衡量 AI 系統在真實科研場景中的能力。據悉，LifeSciBench 基於 750 道專家編寫任務，覆蓋 7 類科研工作流與 7 個生物學領域，任務來源於 173 名具有博士背景並具備生物科技或製藥行業經驗的科研人員，該基準強調複雜科研能力評估，包括證據整合、實驗設計、數據分析、科學推理與科研溝通等能力，而非單一事實性問題。超過 79%的任務包含多步驟推理，平均每道題需約 4 個推理步驟，並包含 1,062 個真實科研相關數據附件（如論文、圖表、序列數據及結構文件等）。

免責聲明：本內容僅代表作者個人觀點，不構成任何投資理財建議。如有發現違規內容點擊舉報

#AI评测 #生命科学 #OpenAI #人工智能

上一篇：亞馬遜撤檔Sam Altman“負面”傳記電影，投資OpenAI後AI敍事引發敏感調整 | 分析：標普500的半導體板塊市值佔比升至18.8%創新高：下一篇

24小時熱榜

熱門話題

#SCRT #比特現金 #艾達幣 #狗狗幣 #波場 #USD Coin #幣安幣 #泰達幣 #RON #SNT #ELF #ICX #MASK #PEOPLE #USDP(PAX) #Wrapped Bitcoin

svmuu(水木財經)專注於區塊鏈產業動態、加密貨幣前沿資訊，同時涵蓋港股、美股及外匯市場的即時行情與深度分析。在這裡，您不僅能取得專業的7×24小時新聞速遞、精準的行情數據，還能體驗實用的投資工具，幫助您掌握數位資產與傳統金融市場的雙重機會。無論您是區塊鏈愛好者，還是港股、美股及外匯投資者，都將為您提供高效、快速的資訊服務，賦能您的投資決策。

更快的區塊鏈好幫手！

OpenAI發佈LifeSciBench：衡量AI系統在真實科研場景中的能力

24小時熱榜

伊朗外交部：伊美達成協議文件

幣安將上線LRCX、KLAC等7個U本位永續合約

Gate合約股票專區上線ADSK（歐特克）、BKNG（繽客控股）等8個永續合約交易

深入瞭解ALTHEA代幣（ALTH）及其去中心化網絡

Morgan Stanley更新以太坊和Solana ETF文件，擬收取0.14%費用

OKX DEX xStocks交易賽進行中，總獎池300,000 USDC

10倍做多原油後浮虧133萬美元，某地址持有價值3777萬美元CL多單

伊朗媒體稱伊美談判達成5項要點

亞洲槓桿AI押注創紀錄：韓國SK海力士2倍做多ETF資產管理規模達130億美元

某聰明錢購入32萬美元世界盃小組賽阿根廷戰勝奧地利

推薦閱讀

熱門話題