开云体育

开云体育官方网站 撕开Claude Code真相: 让它好用的98.4%, 是工程不是AI

发布日期:2026-05-01 22:33    点击次数:88

开云体育官方网站 撕开Claude Code真相: 让它好用的98.4%, 是工程不是AI

新智元报谈

[新智元导读]当正常东谈主还在钻研「最强请示词咒语」时,硅谷顶级实验室依然把AI基建跑成了出产线。

你还在ChatGPT的聊天框里反复调prompt?

最近,一位X用户发了条推文,开首便是一个惊呼:头部大厂悄悄在用的ClaudeCode形貌模板外泄!

这依然不是写请示词了。这是AI工程基础门径。

整套叮咛围绕一个文献「CLAUDE.md」伸开,而它的中枢原则惟有三条:

每次Claude犯错→你加一条王法;每次你同样我方→你加一个职责流;每次出bug→你加一皆护栏。

这样作念,是要把形貌教授千里淀成它每次启动都会读取的永恒荆棘文和自动化管制。

通盘架构,像是一家AI公司的岗亭编制:CLAUDE.md是入职手册,skills/是职责SOP,hooks/是合规部,docs/是公司法例,tools/是后勤组,src/才是信得过出活的业务部门。

你不再是在和AI聊天了,而是在构建一个了解你代码仓库的AI。

最浪漫的部分是,你只需要设立一次,Claude就会自动审查代码,并按指示重构、强制实践架构王法、撰写发布确认、从妙技中运行职责流、记着往日无理等。

何况它会越用越贤慧。

大多数东谈主,都是盛开ChatGPT,写请示词,复制粘贴,反复;而在这套叮咛下,你只需要盛开末端,跑一个skill代码已录用。

这等于是在我方的代码库里养了一队AI共事。

这条推文背后,传递的是这个时间正在悄悄翻篇的一个小信号,大多数东谈主可能还没反映过来。

一张不算泄露的「泄露截图」

撕开一个真相

@ai_rohitt晒出来的这张截图,是Anthropic官方文档里公开推选的ClaudeCode措施范式。

CLAUDE.md是ClaudeCode在每次会话运转时自动读取的形貌记挂文献。

.claude/skills/和.claude/hooks/是官方支撑的推广机制。

这些都是社区依然商榷了几个月的公开作念法,并不是什么东谈主偷出来的「里面模板」。

但它之是以能让一些资深开导者主动转发,确认它赢得了一些天天用Claude的开导者们的认可。

其中终点一部分东谈主,可能这两天才强项到本来它还能这样用。

而硅谷顶级团队,依然把这件事跑成了出产线。

第一个例子,是OpenAIFrontier团队。

OpenAI官方流露的Frontier团队实验中,一个从空repo起步的里面beta,在约5个月内由Codex生成了约100万行代码和约1500个PR;团队从3东谈主推广到7东谈主,东谈主工不径直写代码。

带队的RyanLopopolo在后续访谈中进一步提到,这套职责流依然接近「0东谈主工代码、0东谈主工review」的极限口头。

他觉得与其浅近token,不如运用模子极高的并发智商和极低的老本来代替东谈主类有限且不菲的同步提防力。

第二个例子,是Stripe里面的自动化代码代理系统Minions。

Stripe里面的Minions每周生成并鞭策跳动1300个PR合并,这些代码从新到尾由AI生成,但仍经过东谈主工review。

这里还有一双数据:1.6%vs98.4%,它来自MohamedbinZayedAI大学VILA-Lab发表的一篇论文。

经营者系统性扒了ClaudeCodev2.1.88版块51.2万行TypeScript源码,给出的论断是:惟有1.6%是AI决议逻辑,剩下的98.4%是服气性的工程基础门径。

具体说便是权限网关、荆棘文措置、器用路由、无理规复这四类。

这组数字不是说模子只孝顺1.6%的智商,而是确认ClaudeCode看成居品,盛大复杂度不在模子自己,而在权限、荆棘文、器用路由、规复机制等服气性工程基础门径上。

@ai_rohitt那张图里的CLAUDE.md/skills/hooks结构,便是正常开导者也能搭一套的「初学版基建」,它和OpenAI、Stripe那套出产级架构是统一种范式,仅仅限制小得多。

CLAUDE.md败露的神秘

往日3年,通盘东谈主都在问「GPT什么工夫能更贤慧」「Claude什么工夫出新版块」。

但信得过在出产环境跑通AI编程的团队,他们更和顺的可能根柢不是这个,而是怎么让AI记着我方前次踩过的坑,奈何让AI在动手前先看一眼项宗旨架构管制,开云体育官网奈何让AI犯错的工夫我方被器用挡住。

CLAUDE.md恰是这一切的承载体。

Anthropic官方对它的界说惟有一句:

一个markdown文献,放在形貌根目次,ClaudeCode在每次会话运转时自动读取。

https://code.claude.com/docs/en/memory

听上去很简便,围绕它伸开的那几层结构,才是它信得过强横的部分。

CLAUDE.md是形貌大脑。

架构决议、定名商定、测试条目、那些反复踩过的坑,都堆在这里。它是AI每次启动时第一眼看到的「职工手册」。

.claude/skills/是可复用职责流。

ClaudeCode的创建者BorisCherny在社区里反复强调一句话:「淌若你每天作念某件事跳动一次,把它变成skill或command。」

一个skill便是一段可实践的方法论。Codereview、生成commitmessage、写发布确认,这些都不该是每天手敲请示词的活,应该是skill调一下就出限度。

.claude/hooks/是自动护栏。

这是最枢纽的部分。它不依赖AI我方判断,由服气性代码在AI犯错之前就挡住它。这便是为什么敢让AI「无东谈主监督」地跑,因为出错的领域由hooks卡死了。

docs/decisions/是架构决议记载。

让AI不仅知谈代码「是什么」,还知谈代码「为什么是这样」。

这一项最容易被忽略,但亦然AI合营最大的杠杆点。

tools/和src/是实践层。

这套架构真恰巧得提防的地方,不在于某个开导者搞出了一个漂亮目次,而是越来越多悲怆团队正在管制到统一个所在:把模子放进一套由荆棘文、器用、权限、评估和反馈轮回构成的harness里。

GitHub上依然能看到不少雷同形貌:

rohitg00的awesome-claude-code-toolkit、diet103的claude-code-infrastructure-showcase、affaan-m的everything-claude-code,都在围绕agents、skills、hooks、rules、MCPconfigs等组件搭建ClaudeCode的工程化职责环境。

这确认,信得过训练的AI编程职责流,不是只靠一个更强的模子,也不是只靠一条更长的prompt,而是把模子镶嵌一套可复用、可管制、可规复、可审计的工程系统里。

至于具体目次结构,各家收场并子虚足疏导。

OpenAI实验室的极限实验

2026年2月11日,OpenAI官方博客发了一篇著述:《Harnessengineering:leveragingCodexinanagent-firstworld》。

https://openai.com/index/harness-engineering/

Anthropic围绕这个意见从新调治了ClaudeCode的架构念念路;MartinFowler的网站把它凝练就一个公式:「Agent=Model+Harness。」

Harness这个词来自马术。它指的是马的整套挽具,缰绳、马嚼子、马鞍、笼头。

一匹马不错跑得很快很有劲,但它我方不知谈往哪儿走:整套挽具决定了它的所在。

类比到AI编程:模子自己智商很强,但它不知谈在你的代码库里该往哪儿走。Harness便是你为它造的所在盘+刹车+导航。

OpenAIFrontier团队阿谁「100万行0东谈主工」的实验,施行便是把Harness作念到极致。

他们的枢纽工程实践包括以下几条。

层级架构强管制。

从Types到Config到Repo到Service到Runtime到UI,依赖相干单向流动,由linter在CI层强制实践。Agent写出违抗层级相干的代码?径直构建失败。

linter无理信息自己是建造指示,这亦然最反直观的细节。

正常项宗旨lint无理是「violationdetected」,给东谈主看的;OpenAIFrontier的lint无理是「uselogger.info({event:'name',...data})insteadofconsole.log」,给Agent看的、不错径直读懂并建造的指示。

文档看成单一事实来源。通盘架构图、executionplans、缠绵轨范都在仓库里面的docs/目次。Agent不需要任何外部常识库,一切就在repo里。

这套东西遵循有多强横?

模子莫得换,但LangChain调治了harness,包括系统请示、器用、中间件和推理模式,最终把TerminalBench2.0分数从52.8提到66.5。

你今天就能作念的事

是为AI造一个形貌大脑

问题回到正常开导者这里:淌若范式依然搬动,看成一个正常工程师,今天就能作念点什么。

第一件事,在你最紧迫的形貌根目次建一个CLAUDE.md。

不需要完好,也不需要很长。写下你团队的架构王法、定名商定、测试条目、那些反复踩过的坑,10分钟能写完一个能用的版块。

下次AI犯错的工夫,先不要手动修,而是问我方一句:CLAUDE.md里缺了什么?

第二件事,把每天同样作念的事改形成skill。

这里要提防BorisCherny的金句:「淌若你每天作念某件事跳动一次,把它变成skill或command。」

Codereview、生成commitmessage、写发布确认、修一类同样的bug,这些都该是skill,不该是每天手敲请示词。

第三件事,在容易踩坑的地方加一个hook。

Hook是98.4%里最有杠杆的那部分。它不依赖AI变贤慧,它依赖服气性代码作念强制检讨。这是把东谈主类工程师的判断力翻译成机器可读管制的历程。

这件事的中枢不在写代码,而在写王法。

Karpathy本年1月在推特上的那句被庸俗转发的话:「我依然从80%手动写代码变成了80%交给Agent写。」

将来五年,工程师的智商弧线正在从「我能写几许行代码」转向「我能为AI缠绵多严格的职责环境」。

写代码的活儿正在被Agent禁受。

但缠绵阿谁让Agent能写出好代码的全国开云体育官方网站,如故东谈主的职责。何况比以前更难、更紧迫、也更有道理。

快乐飞艇APP官方网站