ag(中国)手机网 Python逆天改命! 开源Hermes初次打败OpenAI Codex


新智元报谈

[新智元导读]一个纯Python写的开源方式,竟把OpenAI用Rust写的王牌给秒了!最终战绩6比5,Hermes径直献艺工程暴力好意思学,解释型说话终于逆天改命。
一个纯Python写的开源方式,竟击溃了OpenAI王牌!
今天,全网皆被HermesAgent的硬核实力狠狠刷屏了:
在针对果然寰宇CLI任务的11项基准测试中,它以6:5的战绩,径直把Codex按在地上摩擦。

在这场备受瞩经营对决中,HermesAgent展现出了惊东谈主的底层优化才气。
通过一连串的硬核操作,奏凯把系统的启动时间,从701ms裁汰至258ms。

更让东谈主悠扬的是,Hermes十足由Python编写,而Codex是用Rust写的。
这一仗,Python打赢了Rust!
这在编程界,属是「逆天改命」了。


三大狠招,砍掉63%启动时间
就在此次优化之前,Hermes照旧5-6过期的阿谁。
此次逆转不是靠换模子、不是靠堆算力,而是靠三个纯工程优化,单刀直入。

那么,它是具体怎么作念到的?
第一刀:Bitwarden磁盘缓存
原来Hermes每次启动皆会调用BitwardenSecretsManager的API去拉取笔据,一次便是380毫秒。
问题在于,之前的缓存是「纯进度内」,蚁集践诺两次hermeschat-q,第二次照旧要从新拉。
处治决策是,加了一个L2磁盘缓存。
缓存文献权限锁死0600,存放在/cache/bws_cache.json,默许TTL300秒。
另外,拜访token本人毫不落盘,默许300秒TTL,过期才从新拉取。
一刀砍掉380ms。

第二刀:模子目次蔓延加载
hermes_cli.models._PROVIDER_MODELS,一个包含通盘AI供应商模子信息的巨型字典。
之前在模块加载时就殷切导入,吃掉约55ms。
践诺上只好model_flow有关的处理函数才需要它。
团队用PEP562的模块级getattr终澄清懒加载,只在果然拜访模子目次时才付出这笔支出。。
这一步,又省了55毫秒。
第三刀:树立文献去重
main.py顶部正本读了两次config.yaml。
一次yaml.safe_load用于密钥脱敏桥接,2026美加墨世界杯中国官方网页版一次齐备的load_config(含深度并吞)只为稽察一个布尔值。
并吞成一次原始加载,省下17ms。
这三刀加起来,启动时间从701ms暴降至258ms,降幅63%。
不得不说,这才是果然的工程暴力好意思学,纯靠profiling找到瓶颈,一刀一刀切掉冗余。

战绩6:5,Hermes翻盘技巧
最终成果,是不会说谎的。
在优化前,Hermes对Codex的总战绩是5胜6负:单轮任务被Codex压制,多轮任务略有上风但不够澄清。
优化后,时事透澈回转。
单轮任务(8项):Hermes的中位框架支出,降到了与Codex抓平致使略低的水平。
正本被Codex碾压的启动症结,被十足抹平。
多轮任务(3项):Hermes在5轮对话的总支出上也曾擢升,优化后上风进一步拉大。

临了的总分,6:5,Hermes终澄清反超。
这意味着,ag(中国)手机网一个用Python写的开源方式,在框架支出——
一个最查验底层功力的维度,打败了用Rust写的、背后站着万亿市值公司的闭源产物。

Python,打赢了Rust
果然反直观的部分在于,Python凭什么赢下Rust?
遥远以来,Python在性能圈险些是「原罪」般的存在:解释型说话、GIL锁、动态类型支出……
当OpenAI接纳用Rust构建CodexCLI时,通盘东谈主皆以为理所虽然——
Rust生来,便是为性能而生的。

但Hermes的此次逆袭阐扬了一个关节事实:
在Agent这个赛谈上,框架层面的架构决策,比说话层面的原始速率更迫切。
确立者netrunner的褒贬一针见血,「Python在多轮任务上打赢Rust,践诺上是架构决策的奏凯,而不是说话速率的奏凯」。
「Codex可能在高下文处理上,过度工程化了」。

还有东谈主问谈,「为何不把Hermes也迁徙到Rust?那不是更快」?
Hermes联创兼首席科学家Teknium直言,「那样就无法剪辑代码,以及及时改造和迭代」
也便是说,Python的上风不在于快,而在于活。

关于一个需要抓续进化、从每次交互中学习的Agent来说,确立者友好性和迭代速率,便是最大的性能上风。
GitHub冲爆16.7万星
硬刚万亿巨头
HermesAgent的爆发速率,本人便是一组让东谈主瞠经营数据。
从2026年2月25日上线于今,只是三个月,GitHub星标也曾窒碍16万。
滚球app中国手机版入口日活Token耗尽量达到353B,是同类方式OpenClaw的近两倍。
不错说,它是2026年增长最快的开源Agent框架,莫得之一。

GitHub地址:https://github.com/nousresearch/hermes-agent
Hermes的中枢杀手锏,是一套闭环学习架构:
每次完成复杂任务后,Agent会自动将处治决策提取为可复用的Skill(手段)。
下次碰到相同任务,径直调用已有手段,跳过从新推理。
NousResearch里面基准测试流露,积贮20个以上自创手段的Hermes实例,完成同类任务的速率比全新实例快40%。

更狠的是,v0.12版块引入的自治Curator——
一个后台自动开动的Agent,会依期评分、修剪、并吞你的手段库。
换句话说,Hermes不仅能学,还能我方整理学到的东西。
说话不是天花板,架构才是
Python打赢Rust这件事,看起来是一个编程说话之间的「逆袭爽剧」。
但它果然揭示的东西,要潜入得多。
在AIAgent的寰宇里,底层说话的性能互异正在变得越来越不迫切。
Hermes此次优化砍掉的443毫秒,也曾是框架层能挤出的极限了。而一次LLM调用的蔓延,动辄几百毫秒致使数秒。
这意味着,在通往ASI的路上,果然的竞争从来不是「用什么说话写」,而是「怎么让Agent越用越聪慧」。
而Hermes此次用Python干翻Rust,正好解说了——
在Agent进化的赛谈上,怒放、可剪辑、可迭代的架构,比「跑得快」更接近ASI的践诺。
Rust是一把好刀ag(中国)手机网,但ASI需要的不是一把更快的刀。
