OpenAI, LifeSciBench 출시: 실제 과학 연구 환경에서 AI 시스템의 역량을 평가
Svmuu 소식: OpenAI가 실제 과학 연구 환경에서 AI 시스템의 역량을 측정하기 위한 새로운 평가 벤치마크인 ‘LifeSciBench’를 발표했습니다. 알려진 바에 따르면, LifeSciBench는 전문가들이 작성한 750개의 과제를 기반으로 하며, 7가지 유형의 연구 워크플로우와 7개 생물학 분야를 포괄합니다. 이 과제들은 박사 학위를 소지하고 생명공학 또는 제약 업계 경험이 있는 173명의 연구원으로부터 제공되었으며, 이 벤치마크는 단순한 사실 확인 문제가 아닌 증거 통합, 실험 설계, 데이터 분석, 과학적 추론 및 연구 소통 등의 능력을 포함한 복잡한 연구 역량 평가를 강조한다. 79% 이상의 과제가 다단계 추론을 포함하며, 문제당 평균 약 4단계의 추론 과정이 필요하고, 1,062개의 실제 연구 관련 데이터 첨부 파일(논문, 그래프, 서열 데이터 및 구조 파일 등)이 포함되어 있다.
Disclaimer: This content reflects the author's personal views only and does not constitute investment advice. If you find any violations, please Click to Report
24H Trending
-
바이낸스 LRCX, KLAC 등 7종의 U 기반 영구 선물을 상장할 예정입니다.
-
Gate 계약 주식 코너에서 ADSK(오토데스크), BKNG(비앤케이 홀딩스) 등 8개 영구 계약 거래가 시작되었습니다.
-
ALTHEA 토큰(ALTH)과 그 탈중앙화 네트워크에 대해 자세히 알아보기
-
모건 스탠리, ‘이더리움’ 및 ‘Solana’ ETF 신청서를 갱신하며 0.14%의 수수료를 부과할 예정
-
원유에 10배 레버리지로 매수 포지션을 취한 후 133만 달러의 평가손실을 기록했으며, 특정 주소에서는 3,777만 달러 상당의 CL 매수 포지션을 보유하고 있다
-
아시아 레버리지 AI 투자, 사상 최대 규모 기록: 한국 SK하이닉스 2배 롱 ETF 운용 자산 규모 130억 달러 달성
-
OKX DEX xStocks 거래 대회가 진행 중이며, 총 상금은 300,000 USDC입니다.
-
어느 ‘스마트 머니’가 32만 달러를 매수했고, 월드컵 조별리그에서 아르헨티나가 오스트리아를 꺾었다.
-
중국 본토 도지코인 거래 플랫폼 현황: 규제 정책과 글로벌 주류 선택
-
이란 언론, 이란-미국 협상에서 5가지 핵심 사항 합의했다고 보도
Recommended Reading





