它够“智能体”吗?用你自己的工具评测开放模型。 AI资讯 · 3 阅读 · 2026-06-21 · 自动采集 Is it agentic enough? Benchmarking open models on your own tooling