开云「中国」Kaiyun·官方网站-登录入口-欧洲杯体育还参与了总共这个词开导险阻游历程-开云「中国」Kaiyun·官方网站-登录入口

欧洲杯体育还参与了总共这个词开导险阻游历程-开云「中国」Kaiyun·官方网站-登录入口

发布日期:2026-06-16 09:11  点击次数:154

欧洲杯体育还参与了总共这个词开导险阻游历程-开云「中国」Kaiyun·官方网站-登录入口

编译 | 傅宇琪、褚杏娟

筹划 | Tina

近日,初创公司 Every 总司理 Kieran Klaassen 在 x 上示意我方用 Claude Code 编程时平均每天花 250 好意思元,也就是说一个月破耗 6000 好意思元(约合 4.3 万东谈主民币)。他还晒出了珍爱的破耗列表:

帖子发出后,网友们纷繁对 Klaassen 的破耗示意不睬解:“你是买了 30 个 Max 套餐账户吗?如故说你用的是 API 付费方式?我不懂。”“如果你花了这样多钱,还不如平直雇个开导者呢!”

天然,也有开导者认为 Klaassen 的作念法很有启发性,毕竟“6000 好意思元不算什么,只是高档工程师一周的薪资。”但月旦的声息如故占了大多数。

随后,他在 x 上诠释称,“花了 6000 好意思金,多个 Agent 并走运行,一天提交了 10 个 PR,还完成重构并部署上线了。”他还示意:

张开剩余95%

我知谈这让你不爽。又一个“望望我 AI 支出”的爆款帖子,都是炒作,都是杂音。

但你翻冷眼时,错过了重要点:这些智能体透彻改变了咱们的构建方式,不单是更快——而是都备不同。就像从总共乐器的演奏者酿成了交响乐团的领导。音乐变得更丰富,而你与创作的关连也都备改变了。

咱们唯独两个工程师。服务数千用户。昔时需要数月的功能,当今几天就能上线。不是因为咱们写代码更快了,而是因为我学过音乐,学会了“领导” 😅。只是这次,领导的是智能体。

没错,账单看起来的确像是在博眼球。但效能呢?那些是实实在在的。当怀疑的东谈主还在争论这是否可络续时,咱们照旧在托福效能了。当他们在怀恨炒作时,咱们正在莳植高出咱们自身才智的系统。

软件开导酿成了一场不同想维方式头脑之间的妥洽艺术。

你可以不绝无视这些账单截图,把一切都四肢炒作。但你每不雅望一天,默契它的东谈主和无法默契它的东谈主之间的差距就会更大一些。

在驳斥区,他也说明了并非实践花掉了 6000 好意思元,而是产生了与其价值相配的资本。他也认为每个月花 6000 好意思元有点贵,但每月支付 2000 好意思元是可以接纳的。

Klaassen 推文中提到的效能也很显赫:他和 Nityesh Agarwal 如实在一周内托福了六项新功能、五个 Bug 树立和三次基础设施更新。两东谈主实践上在短短三个月内,通过 AI 器用完成了 AI 邮箱料理器用 Cora 的开导,并在发布后连忙劝诱了逾越 10,000 用户注册。

近期,Klaassen 和 Agarwa 两东谈主在 Dan Shipper 的播客节目上珍爱演示了其是如何使用 Anthropic 的 Agentic 编程器用 Claude Code 责任并借此提高工程效能的。InfoQ 对这次访谈进行了翻译,并在不改变快活上进行了增删,但愿能给全球带来一些启发。其中,部分中枢不雅点如下:

使用 AI 编程,不应仅限于写代码本人,还运用于调研和责任历程的构建,简直触及开导过程中的每一个重要。

该团队示意照旧很久莫得使用 Cursor 或者其他 Agent 类编程器用了,因为 Claude Code 的体验远胜一筹,简直将复杂度镌汰了十倍。

Cora 团队当今的方式是尽量让 AI 完成实践责任,而东谈主类开导者专注于料理这些 AI 器用。

一个点子能带来好多后续产出,这就是所谓的“复利效应”。团队有六七个任务是同期进行的,因为每当有了新想法,就坐窝来源实施。

务必牢记在“价值最低”的阶段对 AI 的输出进行严格审核,确保尽早发现并修正问题。

使用 AI 编程,不应仅限于写代码本人,还运用于调研和责任历程的构建,简直触及开导过程中的每一个重要。

该团队示意照旧很久莫得使用 Cursor 或者其他 Agent 类编程器用了,因为 Claude Code 的体验远胜一筹,简直将复杂度镌汰了十倍。

Cora 团队当今的方式是尽量让 AI 完成实践责任,而东谈主类开导者专注于料理这些 AI 器用。

一个点子能带来好多后续产出,这就是所谓的“复利效应”。团队有六七个任务是同期进行的,因为每当有了新想法,就坐窝来源实施。

务必牢记在“价值最低”的阶段对 AI 的输出进行严格审核,确保尽早发现并修正问题。

废弃 Cursor,采选 Claude Code

把持东谈主:天然 Cora 团队唯独两个东谈主,但总共这个词开导节律和产出却像是一个 15 东谈主的团队。Kieran,你前几天说的一句话让我印象很深切:你们正在探索所谓“复利式工程(compounding engineering)”的可能性——每完成一个任务,都会让后续任务变得更容易。我以为你们的教训值得被更多东谈主了解,因为咱们领有了新的器用,就需要建立新的原则和责任流。

Kieran:开导 Cora 是一件尽头意旨的事情,更意旨的是能在 Enjoy 这样的环境中责任,这里不仅有先进的器用,还有丰富的想想资源和全新的责任方式。这让咱们重新想考“如何构建居品”本人。咱们正在一边作念居品,一边尝试新设施,这种探索本人就很劝诱东谈主。

咱们通常会碰到多样新模子、新盘考器用,别东谈主问咱们若何看,咱们就在边用边学的过程中不休尝试。最近几周,Nityesh 和我都彰着感受到一种转念正在发生:一场由新模子、想维方式、MCP 等推动的系统性变革。

把持东谈主:具体改变了什么?你们现时徐徐成型的责任历程大致是什么样的?

Kieran:对我来说,最重要的转念是我意志到“AI 编程”不单是代码本人的生成。它应该贯串总共这个词历程,从前期的盘考到遐想责任历程,再到具体实施,每一步都能借助 AI。如今的 Agent 照旧富足宽广,能胜任简直总共重要,因此咱们需要透彻重新想考总共这个词开导方式。

以前咱们用 Cursor 或 Windsurf 之类的器用,属于更传统的“代码补全”阶段。而当今,咱们来源平直给 Agent 叮咛任务就能完成。尽管最终的产出仍然需要东谈主工妥洽与指引,但咱们要学会更深入地拥抱这一方式。

Claude Code 就是一个尽头优秀的编码 Agent,能很好地默契和实施复杂指示,尤其在与新模子谄媚之后,才智显赫提高。霎时之间,我意志到:咱们照旧进入了阿谁“Agent 期间”。这不再是实验室里的见地,而是确凿能用来构建真实居品的时候。咱们就是在用它作念运用,何况它确切在责任。

把持东谈主:你们若何使用 Claude Code?

Kieran:Claude Code 是 Anthropic 推出的一款编码 Agent,底层使用的是 Claude 模子,它以敕令行界面(CLI)的姿首运行在土产货结尾中。关于不太懂时候的东谈主来说,敕令行可能看起来有些吓东谈主,但我照旧见效劝服一些非时候布景的一又友尝试使用 Claude Code,他们也以为很好用。

把持东谈主:翻开的结尾是那种黑底白字的经典界面,看起来像 DOS 系统。Kieran 只输入了 “Claude”,屏幕上就出现了 “Welcome to Claude Code” 的接待信息,并有一个输入框可以键入敕令。

Kieran:Claude Code 和普通的 Claude 模子不同,它领有对土产货目次和诡计机的探听权限,能浏览文献、运行土产货敕令、截取网页截图,甚而进行网页搜索,内置的器用远比普通 Claude 丰富。这点很重要,因为作念工程开导不单是是写代码。你需要知谈 GitHub 上的需乞降任务景色,了解 CI/CD 历程是否平常,测试是否通过等等。而领有这些功能的编码 Agent,才确凿具备完成一个齐全责任历程的才智。

我可以让它自动实施我鄙俚要作念的事。这恰是“复利式工程”产生作用的地点——Agent 不仅写代码,还参与了总共这个词开导险阻游历程。大多数工程师的时期并不主要花在编写代码上,而是花在搞暴露“下一步要作念什么”,如何默契用户反馈并作出反应。这些事情,Claude Code 当今都可以帮上忙。

把持东谈主:何况这些内容的组织方式很暴露,既能让工程师读懂,也便捷非时候团队使用。

Kieran:咱们当今简直全力在鼓动“让 AI 作念事、咱们来料理 AI”的模式。比如,有东谈主来问我某个功能当今的景色或下周发布什么内容,我可以平直让 Claude 查 pipeline,看行将推出的内容。

全球应该照旧能感受到 Claude Code 的逻辑了:一朝你把总共信息系统接入它,使用起来就尽头顺畅。对我来说,Claude Code 是现时最生动的器用,不仅能解决编程问题,还能参与总共这个词工程历程。好多编码 Agent 只聚焦在写代码上,但我但愿它能成为总共这个词工程责任的扶植系统。

Anthropic 的团队在遐想这款器用时,显著琢磨到了这小数。它莫得被升天在某个特定用例上,而是保持了高度的通用性,同期又能精确解决问题。它能默契险阻文、分析我方何处作念错了并进行修正。这些才智谄媚起来,才确凿让它具备了当今可以干涉实践使用的水平。

把持东谈主:传统的“写代码”和当今的“Agent 妥洽编程”之间,最骨子的分辩是什么?

Nityesh:相较于咱们谨慎的 Cursor 和 Windsurf 等器用,Agentic Coding 其实提供了雷同的才智,但 Claude Code 更进一步,把整件事简化了一个数目级。

Kieran:天然敕令行界濒临有些东谈主来说可能看起来很复杂,但其实它比像 Windsurf、Cursor 那样的图形界面更绵薄。Claude Code 的界面唯唯一个文本输入框,莫得快捷键、莫得界面按钮,唯独纯文本交互。因为底层 Claude 模子才智更强了,它可以络续责任、调用更多器用,是以反而变得更宽广。天然它和 Cursor 背后都是 Claude,但 Claude Code 简洁的界面带来了更大的生动性。

我今天早上就用它查了一下数据方针。那时我在想:“为什么这份用户反馈表单都备莫得任何回报?”

Nityesh:给全球补充点布景:咱们每周会发一份问卷,问用户如果弗成再用 Cora 会有多失望,用来判断居品的价值。咱们也每周开会看这些方针,但 Kieran 发现这周根本没东谈主填写这份表单。

Kieran:对,我嗅觉征服是何处出问题了,也许表单根本没发出去。我就问 Claude Code:“14 天前是不是出了什么问题?帮我查一下。”

Claude Code 的反应是列出一组待就业项,比如检查 controller 的最近代码改造、搜索代码库等。它自动查到了在阿谁时期点,咱们删掉了负责把用户加入表单的那段代码。Claude 还告诉我:“你只需要加回这段代码就行了。”我就说:“那你帮我加且归,并创建一个 Pull Request。”它就坐窝实施了。我还补了一句:“趁机也生成个剧本,把之前漏掉的用户补追念。”它也作念到了。

总共这个词过程衰竭精炼,我简直莫得费什么元气心灵。这就像我在 GitHub 上记一个任务备忘一样绵薄,只不外这次它平直帮我作念罢了。

用 Claude Code 研发的细节

把持东谈主:如果莫得 AI,这样的排查和树立任务可能要花 30 分钟到几小时不等。何况重要不是时期瑕瑜,而是你必须停驻手头的事,专心处理它。而当今,你可以把它四肢“发个肯求”,然后再发一个、再发一个,有多个任务可以并行进行。具体说说你当今的责任历程是什么样的?比如你到底在干嘛?你我方还会写代码吗?

Kieran:偶然可以先讲一下咱们最早拿到 Claude Code 的时候作念了什么,那时咱们都尽头欢乐。

Nityesh:对,那是在 Claude 发布直播的前一天。咱们那时以为,从翌日起编程方式就会被透彻改变,咱们将得到一个才智更强的模子,就像领有一个“编程神灯精灵”。

于是咱们决定,最有分娩力的作念法不是不绝日常责任,而是开一个两小时的会议,融合列出总共但愿新模子能帮咱们解决的问题。咱们如实作念到了,列了约莫 20 个 issue,包括 bug 树立、功能开导等,还为 Claude Code 的到来提前准备好了系统。

Kieran:那时挺故趣味的,Nityesh 还用 ChatGPT 生成了一个 prompt,概略内容是:“翌日咱们就有 AGI(通用东谈主工智能)了,帮咱们列出咱们需要它完成的一切。”然后咱们把这个 prompt 输入到 Anthropic 的 prompt 优化器中,再拿这个优化后的 prompt 去生成具体任务。

把持东谈主:你们那时在 GitHub 顶用的是那种雷同 Trello 的看板系统吗?每个 issue 都是一个卡片,非论是新功能如故 Bug,每个卡片都有珍爱文档,包括问题姿首、解决有打算、时候条款,甚而还有驱散设施和预估所需时期。

Kieran:对,比如这张卡片里写的功能是“生成 AI 合成数据”,它的文档里从问题界说、解决想路、时候条款,到实施设施都写得很暴露。

咱们用 Claude Code 配合一个自界说的 prompt(在 Claude Code 中叫 command)来生成这些任务文档。哪怕是用 ChatGPT 来生成也挺辛劳的,因为你得读好多代码,还得想考、整合,这其实是个挺重的脑力活。是以咱们作念了一个 command,主义是把这个历程自动化。

把持东谈主:你说的 command 是 Claude Code 里的敕令,如故 Cursor 里的?

Kieran:我是用 Cursor 裁剪代码,但运行的如故 Claude Code。我还有个敕令,就是语音转翰墨(voice to text)平直启动。我和 Nityesh 通常一都首脑风暴:“如果咱们作念这个会若何样?听起来可以!”然后我就平直语音输入,它就来源跑。比如我刚刚说:“我想在 Cora 加一个无穷滚动功能,当我读完一个简报(brief)后,它应该自动加载下一个,直到总共未读的简报都读完为止。”

把持东谈主:我想让全球了解一件事:Kieran 简直从不敲键盘。他基本上全程通过语音输入来操作,比如刚才他是平直用语音在结尾中输入,通过 Claude Code 进行交互。我牢记他用的是一个现时还未珍爱发布的里面孵化面目——叫 Monologue,他是该器用的第四大用户。天然这个器用还在覆盖阶段,但咱们在这里算是提前预览了一下。

从我不雅察来看,它的责任方式是这样的:Kieran 说出任务内容后,这个系统会将语音转录成文本,并插入到任务说明中,然后自动实施一系列操作。

Kieran:对,Monologue 会把我说的内容填入“功能姿首”区域,接确凿施一整套设施。首先,它会在代码库中查找有关驱散,相配于先了解现存内容;然后它会上网搜索最好实践,包括开源面目中的常见模式;终末它会生成一个打算并让我审核。我很心爱这个“东谈主类审核重要”,天然偶尔它会搞错,但大多数时候都能射中重点。证据后,它就会创建 GitHub issue,并自动分派到正确的责任流中。

把持东谈主:原来你们是在 GitHub 的看板里,把想要驱散的功能平直用语音讲出来,然后 Claude Code 会自动完成总共调研,生成齐全文档,终末转成 GitHub issue。

Kieran:对,这是个很重要的重要。它和 Cursor 编码方式很不同。在 Cursor 里你可能会跳过这一步,因为它主若是用来写代码的。天然你也可以在那里面写 Markdown,但它不是专为任务料理遐想的。比拟之下,Claude Code 的遐想更迫临 issue 追踪系统——这本来就是开导者谨慎的器用,咱们可以平直把文档交给开导者去驱散。

把持东谈主:当咱们第一次看到 Claude Opus 4 的时候,咱们都畏惧了,因为它能一直运行,无需东谈主工侵略,最终还能给出很好的驱散。天然咱们以前也见过一些 Agent 模式,但 Claude 的这种自动化和完成度都备不一样。它像是在踏实、高质地地一项项完成清单上的任务,这是其他 Agent 轮回很难作念到的。

Nityesh:我和 Kieran 之间还在玩一个小游戏,看谁能让 Claude Code 一语气运行更久,Kieran 当今是率先者。

Kieran:我这次运行了 25 分钟。

Nityesh:我现时只跑了 8 分钟。

把持东谈主:Kieran,你是若何作念到让它跑这样久的?

Kieran:我给了一个衰竭长的打算,内容很复杂,还包括大量测试任务。我让它运行总共测试并树立全部失败项,这样总共这个词过程就会络续很久。

把持东谈主:你阿谁能自动生成调研文档的 prompt 是若何写出来的?你是靠嗅觉拼的,如故也用了 Claude 的 prompt 改写器?

Kieran:这就触及咱们所说的“复利式工程”了。最早是 Nityesh 给我发了一个 prompt,他写得很戏剧化:“AGI 照旧驱散了,咱们可以来源写软件了。”我那时以为这个 prompt 还行,但我也问了一句:“你知谈 Anthropic 的 prompt 改写器吗?”这个器用尽头好用。你只须粘贴一个 prompt,然后点击“生成”,它会帮你优化改写。看起来绵薄,但效果很可以。你甚而不需要花好多时期考证它好不好用——有时候试一试,不好就删掉,资本很低。

那天咱们要写 30 个调研任务,是以必须先有一个好用的 prompt。于是我就把刚刚阿谁 prompt 粘进去,生成一个版块,然后把它四肢基础 prompt 用。之后,咱们只需调动参数,就能反复复用。

把持东谈主:骨子上,你们作念的第一步是花时期写了一个 prompt,这个 prompt 的作用是自动生成其他 prompt。而那些调研文档,其实骨子上亦然给 Claude Code 的任务指示。

也就是说,你们不再需要每次都手动写“先调研、再拆解需求、再权谋实施细节”等等,而是只须讲出一个绵薄的功能需求,Claude 就能自动张开总共细节,写出一整份齐全打算。以前每次都要手动说暴露的那些内容,当今都可以自动生成了。

何况更意旨的是——它当今就在咱们聊天的时候运行着,这都备改变了写代码的方式。咱们前几周在通话时测试过这个系统,我那时甚而在通话中就上线了一个功能,这种边言语边构立功能的“酬酢式编程”在以前是不可设想的。

Kieran:刚才咱们在聊天的时候,其实 Claude 照旧完成了调研,并自动生成了一个 issue。何况咱们那会儿同期跑了六七个任务,因为咱们那时的景色就是“有新想法就坐窝实施”。咱们一边翻看用户反馈、读邮件,把能找到的信息都整理出来,一边不休头脑风暴。

这种景色确切很意旨——你只须一有想法就能坐窝启动一个 Agent,然后等俄顷再融合审阅它们的驱散。这亦然我尽头同意的小数:在语音通话中妥洽是一种很棒的体验,因为这种碰撞中通常会有“魔法时刻”。

天然,现时仍然需要东谈主类来作念复审。咱们发现必须检查输出是否合理、是否遗漏了什么,这就需要教训、判断力和直观。比如我之前树立了一个邮件无法发送的 bug,Nityesh 也用 Claude Code 作念了雷同的事,但它给出的解决有打算却错了。我在 prompt 里衰竭强调了“查察历史记载”,这领导 Claude 朝正确标的想考。而 Nityesh 莫得加那句话,它就说“看起来一切平常”。

是以,如实需要东谈主类的判断。这不是靠“神奇 prompt”暂劳永逸的问题,而是你是否知谈如何正确地使用它,把它的所长阐明出来。

“我每天以为我方什么都不会”

把持东谈主:Nityesh,我很好奇你若何看待这一切。毕竟 Kieran 是一个尽头资深的开导者,而你在编程上的教训可能还比较早期。你是若何顺应这种全新的妥洽方式的?

Nityesh:对我来说,这总共这个词过程尽头悠扬。我确凿战役编程是从 ChatGPT 出现后才来源的,那时候我以为 AI 出现正值是契机,于是决定自学编程,构建我一直想作念的 SaaS 运用。其后转到 Cursor,接着又用上 Windsurf。我一直以为我方照旧站在最前沿了,我周围的一又友都莫得这样用 AI 的。但直到我加入了 Every,来源和 Kieran 一都责任,才发现他都备是另一个线索。他在会议中从不敲代码,基本上都是对着电脑言语。而 Claude Code 发布后,Kieran 推动我去用它,当今它照旧成为咱们主要的编程方式了。

昔时三周里,我和 Kieran 简直都没再碰 Windsurf 或 Cursor,哪怕用了也只是因为咱们没装 VS Code。骨子上,如果只是为了看代码内容,用哪个裁剪器都无所谓了,因为总共中枢 AI 交互都发生在 Claude Code 里。何况确切很神奇,总共这个词编程的方式每三个月就会发生一次剧变,让你不休意志到“没东谈主确切站在最前边”。

把持东谈主:我确切有点爱护你们这些在 ChatGPT 期间来源学编程的东谈主,我是二十年前靠看书学的……

Kieran:《PHP for Dummies》。

把持东谈主:对对,还有什么《24 小时学会 Basic》那种……你刚才说以为我方照旧处在 AI 编程的前沿,驱散加入 Every 跟 Kieran 一比就发现都备不是,这让我料到《星球大战前传》里有一幕。他们在水下被怪物遑急,看起来要没命了,驱散霎时有个更大的怪物出来把阿谁怪物吃掉。主角说了一句:“总有更大的鱼。”Kieran 就是阿谁更大的鱼。

Kieran:其实我我方也有相同的嗅觉。你刚才说我很猛烈,但我每天也以为我方什么都不会,还在拚命追逐。有太多东西要作念,太多想法要驱散。这就是当下 AI 编程的真实景色:总有更多的东西,但中枢如故要教训。你必须每天都教训使用 AI,络续推动我方,不然就会错过好多令东谈主欢乐的东西。

把持东谈主:像你们这种“简直不写代码、而是在更高轮廓线索操作”的方式,会带来新问题吗?你们是如何打发这些问题的?又发展出了哪些新的工程实践,以保证总共这个词过程的高效与踏实?

Nityesh:对我来说,一个最首要的领会来自一册老书——《高产出料理》,是 Intel 的 CEO 在五十年前写的。它在第一章提到一个不雅点:总共问题都应该在“价值最低的阶段”被解决。

今天,AI 尤其是 Claude Code 照旧能帮咱们完成好多任务,这让“前期阶段”的质地变得格外重要。比如,咱们会用 AI 生成一份尽头珍爱的 GitHub issue 文档,那很容易让东谈主想平直调用 Claude Code 去驱散它。但如果 issue 本人的标的就偏了,Claude 就会在特殊的旅途上不绝鼓动,驱散只会花费时期。

是以,咱们当今的作念法是:必须在东谈主类 review 阶段就尽早发现这些潜在偏差、提前修正,而不是比及 Claude 实施罢了再回头返工。

把持东谈主:这让我料到杠杆旨趣:你越蚁合杠杆末端,力量越大,但标的偏差带来的后果也越严重。哪怕一厘米的偏差,终末驱散也可能收支几千公里。就像辐射火箭时对准月球,来源角度偏小数,终末就都备偏离轨谈。我我方其实很容易跳过打算阶段——对着一堆文档融合元气心灵很困难。你们是若何处理这个问题的?

Kieran:针织说,大多数时候读这些文档如实挺没趣的。但咱们会想办法让它“更意旨小数”。比如我会条款 Claude 给出更简洁的内容,但这样它又容易遗漏重要点。是以我更偏好让它聚焦在用户故事或问题清单上,比如:“一个优秀的居品司同意提倡哪些问题?有哪些不同解法?”这种模式会更容易阅读,也更容易激发想考。

总的来说,传统的 PRD(居品需求文档)太无趣了。但咱们可以加入更多例子或反问,把它“变形”为一个信息更丰富、也更易于东谈主默契的材料。这也恰是咱们东谈主类审查阶段要作念的事:查找潜在问题、补充罅漏——因为这一步能为后头从简大量时期。

把持东谈主:这让我料到咱们业务中另一个面目。咱们在 Spiral 正在开导一个“写稿 Agent”,有点像 Claude Code,但专为写稿任务遐想。咱们也碰到雷同问题:写稿 Agent 如果只是“生成一堆内容”,那东谈主类如故得花大量时期去筛选和修改。是以咱们当今尝试让 Agent 主动“进入访谈模式”,先了解用户是谁、想要什么,再输出内容,这样更准确,也省事。听你们这样说,我嗅觉 Coding 这边其实也存在雷同问题。也许 Claude Code 异日可以多问一些有启发性的问题,帮用户厘清想路,而不是只吐出一大堆文本。

Kieran:是的,这如实是咱们应该自动化并络续优化的事情。Claude Code 的宽广之处在于它可以探听你的总共这个词代码库,默契你的作风,这尽头有用。

除了在一来源就尽量作念好问题界说,我认为传统的测试方式和邮件见告也尽头重要。不然你若何知谈我方改的东西确切能用呢?天然你可以翻开戒指台手动点击测试,但都备没必要。咱们可以让 AI 写一个测试,比如最基本的 smoke test(冒烟测试),望望功能大致是否平常运行,这样 Claude 也可以字据测试驱散自主树立问题。

咱们还在尝试一项新责任历程。咱们会用 Claude Code 驱散 Figma 遐想,然后截取出动端页面截图,与遐想图进行对比,考证规复度。天然咱们还没在分娩环境大量使用,但尽头期待它的效果。这种方式骨子上就是把底本东谈主工实施的考证历程“编进系统里”。不单是是代码测试,对 prompt 也可以作念 eval(评估),就像给代码写测试一样,给 prompt 写评估剧本。

上周我就让 Claude Code 运行一个邮件发送历程的 eval,让它跑 10 次,失败了 4 次,它告诉我失败原因是调用了特殊的器用。我查察了一下指示词,不够具体,于是我让它不绝尝试,不休优化指示词,直到能每次都通过测试。我半途还下楼喝了杯咖啡,追念一看,照旧科罚了。

是以说,即就是最传统的测试历程,对 AI 编程相同首要——测试能告诉你指示词是否可靠,就像传统单位测试告诉你代码是否责任一样。乍一看枯燥,但其实尽头有用。

给各编码类 Agent 打若干分?

把持东谈主:我想花五分钟时期,让 Kieran 来给万般智能编码 Agent 作念一个从 S 级到 F 级的打分。我来报 Agent 的名字,你来给出评级。先从 Cursor 来源,拿最优成立的 Cursor 来看。

Kieran:就算是传统的、在最好的设定下的 Cursor,也不是最好的 Agent。我心爱某些 Agent 的原因就是它们明确告诉你,“这就是咱们最好的版块”。而 Cursor 有点让东谈主困惑。是以我会把它评为 A 级,它如实很可以,衰竭是在使用 Claude 的情况下。

把持东谈主:Windsurf?

Kieran:C 级。因为他们还不撑持 Claude 4,这让我很难默契。三周前我还会给它 A 级,但当今不行了。

把持东谈主:Devin?

Kieran:B 级。集成度不高,搭建过程也略略用功一些,代码质地也莫得 Cursor 或 Claude Code 那么全面。我省略情它是不是用 Claude 4,但用起来莫得其他器用顺畅。

把持东谈主:Charlie?

Kieran:Charlie 主要用于代码审查,咱们当今基本只在这个场景下用它。作为代码 Reviewer,我会给它 A,但作为 Agent 我只可给 B。

把持东谈主:Friday?

Kieran:我会把 Friday 排在 Cursor 之上,介于 S 和 A 之间。天然它当今还没用 Claude 4,而是用的 3.7,但依然发达尽头优秀。Friday 的历程尽头有主见,能高效地把事情作念完。你给它一个 issue,它就能自动生成打算、恭候你证据、然后实施、提交 PR。我见过它见效一次性规复 Figma 遐想,也完成过一些 Claude Code 作念不到的任务。让我确切有种“看见异日”的嗅觉,何况它背后的团队范围很小。

把持东谈主:Codeex?

Kieran:B 级。

把持东谈主:Copilot 呢?

Kieran:我没若何用过。三年前用过一次,半年前又试了一次,但不到一分钟就关了。如果一定要打分,我只可给 D。它那时还不具备 Agent 才智。天然,我得承认还没用过它的新版块,是以也许并不都备自制。

把持东谈主:Claude Code?

Kieran:天然是 S 级。

把持东谈主:Factory?

Kieran:Factory 在某些方面其实比其他器用都好。但它不是我的作风,更顺应那些偏企业级的开导者,尤其是对代码质地条款极高的用户,比如作念多仓库开导的。它用起来有些繁琐,因为是 Web 和土产货夹杂部署。我会给它 B,略低于 Codeex 和 Devin。

把持东谈主:AMP 呢?

Kieran:S 级,仅次于 Claude Code。它尽头擅长完成任务,使用体验也很好。你能感受到 AMP 背后的团队是确凿爱重 Agent 器用的开导者,他们我方也在用。

我更倾向于把智能 Agent 看作招聘开导者解决特定问题的过程。比如 Friday 尽头擅所长理界面责任,碰到这类任务我会用 Friday;需要作念调研时,我会采选 Claude;如果是代码审查,我则用 Charlie。Agent 之间是可以协同责任的,不消局限于只用一个。

把持东谈主:Charlie 集成在 GitHub 上,你可以平直“@Charlie”,它就会对 Pull Request 进行代码审查。

Kieran:对,咱们用 GitHub、Pull Request 和老例的开导历程,这样东谈主类开导者也能介入。咱们能“聘请”专长于特定任务的 Agent 来审查代码,而闭环代码器用则实施具体责任。这套体系是经过咱们几十年教训不休优化的,尽头宽广。也正因如斯,Copilot 也许能顺应这套历程,因为它本来就集成在 GitHub 里。

把持东谈主:你们最近似乎引入了一位确凿的人人,并通过 Agent 化的方式妥洽,既达到了预期,也减弱了对方的背负。

Kieran:是的。天然那时还莫得确凿的“问题”要解决,但咱们但愿更暴露地掌捏重要任务的托福进程。鉴于我我方对这方面并不十分擅长,咱们就邀请了人人参与。作念法是这样的:咱们开了一个两小时的电话会议,我把总共这个词对话录了音;会后,我把灌音内容输入到 Claude Code,并条款它字据对话生成两个资源 issue。约莫十分钟后,Claude Code 给出了初稿,我再请人人审核。他对驱散尽头骇怪——他平时对 AI 生成的有打算经常持怀疑立场,毕竟有些任务 AI 现时还没那么擅长。但这次他不仅招供了文档,还提倡了尽头有价值的雠校建议。于是咱们又围绕这些建议快速迭代。第二天,人人完成了东谈主工复审,我再用 Claude Code 驱散了对应的代码,并一都作念了 Code Review。总共这个词历程本来可能要两周时期,当今几小时就科罚了。

把持东谈主:还有什么想说的吗?

Nityesh:但务必牢记在“价值最低”的阶段对 AI 的输出进行严格审核,确保尽早发现并修正问题。

参考相连:

https://www.youtube.com/watch?v=Lh_X32t9_po欧洲杯体育

发布于:北京市

相关资讯
热点资讯
  • 友情链接:

Powered by 开云「中国」Kaiyun·官方网站-登录入口 @2013-2022 RSS地图 HTML地图