返回 Skills

/agent-evaluation

description: "Testing and benchmarking LLM agents including behavioral testing, capability assessment, reliability metrics, and production monitori...

由 Dazi 托管
作者: sickn33
agentevaluation
查看原作者

导入此 Skill

在 Dazi 中粘贴以下链接即可导入:

https://aicowork.chat/skills-content/agent-evaluation.md

加载中...