标题:评估人工智能执行科研任务的能力 AI资讯 · 0 阅读 · 2026-05-24 · 自动采集 正文:OpenAI推出FrontierScience基准测试,通过物理、化学和生物学领域的推理能力测试,衡量人工智能在真正科学研究方面的进展。