Anthropic Skill Creator 重磅更新:AI 技能自动评估与循环优化来了!
| AI工具

Anthropic Skill Creator 重磅更新:AI 技能自动评估与循环优化来了!

很多人都在说 Anthropic 官方的 Skill Creator 变强了,但没人告诉你怎么更新它。

其实很简单,只需要告诉 Claude Code 一句话:

Install the update github.com/anthropics/skill-creator

这次更新带来了什么?

这次更新新增了三个关键文件:

  • run_eval.py - 自动评估脚本
  • run_loop.py - 循环优化脚本
  • aggregate_benchmark.py - 基准测试聚合

这正是大家期待已久的自动技能评估循环更新优化功能。

为什么这次更新这么重要?

1. AI 技能可以自我评分了

有开发者分享说,用了一个月后最大的变化是:run_eval 让技能可以给自己打分。

他运营的内容 Agent 现在会在每次发布后自动评估效果,直接淘汰和重写表现差的技能。人工干预大幅减少。

2. 自动优化循环

不用再手动调优技能了。系统会自动:

  • 评估技能表现
  • 识别问题点
  • 循环优化改进
  • 持续迭代升级

一位开发者说:“让它自己优化,比我自己优化更有信心。“

3. 老技能也能焕发新生

已经有人用新版本优化旧技能,效果非常好。这意味着你之前开发的技能都可以通过这次更新获得性能提升。

社区反馈

推特上的反馈非常热烈:

  • “auto-eval loop 是大家等待的部分,这太重要了”
  • “正好赶上,我的日常技能也不稳定,让它自己优化比我优化更靠谱”
  • “优化老技能,效果很好”

当然也有人吐槽:“这玩意儿吃 token 太猛了,被坑了。“看来自动优化的代价是 API 调用成本会上升。

如何更新?

方法一:直接告诉 Claude Code

Install the update github.com/anthropics/skill-creator

方法二:通过 /plugin 命令

在 Claude Code 中可以通过 /plugin 安装和更新这个官方技能。

写在最后

Anthropic 这次更新让 AI 技能开发进入了”自进化”时代。技能不再是一次性开发完就结束,而是可以持续自我评估、自我优化。

这对于需要长期运营 AI Agent 的团队来说,是个巨大的生产力提升。

不过要注意控制成本,毕竟自动评估和循环优化会消耗不少 token。

你用过 Skill Creator 吗?更新后体验如何?欢迎留言分享。


参考来源:

  • Twitter @vista8 原推文
  • 社区开发者反馈