🧠

HuggingFace Model Evaluation

Agent Skill

AI模型评估Skill，系统化的评估作业和报告生成

💰 开源📱 macOS, Windows, Linux👁 137 次浏览🔗 1 次点击📅 2026/3/31 收录

📊 CoolAI 编辑评分

4.0

满分 5.0

🔥 热度 3420

"HuggingFace Model Evaluation赋予AI Agent专业的垂直领域能力"

能力覆盖

4.0

输出质量

4.0

易上手

3.9

可定制性

3.8

HuggingFace 官方模型评估 Skill。提供编排评估作业、生成评估报告和映射指标的完整流程。支持多种评估框架（lm-eval-harness、lighteval），内置常见 Benchmark 的评估模板。帮助 AI Agent 对大语言模型进行系统化的性能评估。

npx skills add huggingface/skills

兼容客户端：Claude Code、Codex CLI、Cursor、WorkBuddy

阿里推出的桌面级通用智能体助手，可自动规划并交付办公任务结果

网页爬取MCP服务器，让AI助手能够抓取和解析网页内容

140+科学研究Skill合集，药物发现/基因组学/文献综述