首龙
- lol外围投注 英美日这波操作, 背后藏着啥小心思?
- 英雄联盟比赛投注 章泽天翻车,陈鲁豫受捧,我们需要什么样的人物访谈
- 英雄联盟投注app 豆粕行情反弹,需求疲软,入口蔓延影响有限
- 英雄联盟投注 机器人赛道获重磅政策利好,行业大佬齐发声助力产业新风口来临
- lol投注app 《父母爱情》膏粱年少王海洋,为啥能考上大学?其实与前妻石冰冰相干
- 英雄联盟投注 刘嘉玲合股滑雪!王菲携李嫣出现,冯德伦也在,九东说念主共饮庆祝
- lol外围投注 看陈建斌盯着陆毅家妮儿的目光,钦慕得快流涎水了,他和蒋勤勤偶遇陆毅一家,满脸齐是酸溜溜的心情,却穿得像附
- lol外围投注 毛主席参加陈毅元帅追悼会现场,期间一个细微举动让张茜泪如雨下:那怎么敢当啊
- 英雄联盟投注 (字据创作要求,严格投诚计谋解读切入点,禁受对比分析结构,以严肃法式的讲话格调呈现)
- 英雄联盟投注app 甜度超标!朱易晒亲密合照道贺苏翊鸣夺冠,依偎肩头太好磕,苏翊鸣直白恢复爱你宝贝
- 发布日期:2026-02-17 12:31 点击次数:168


在使用编码代理时,一个重要的挑战是让他们既测试他们构建的内容,又向你动作主宰演示该软件。这超出了自动化测试——咱们需要展示他们程度并匡助咱们准确了解代理坐褥的软件大约作念什么的工件。
我刚刚发布了针对这个问题的两个新用具:Showboat 和 Rodney。
1、解说代码确乎有用
我最近写过,软件工程师的责任不是写代码,而是*录用有用的代码*。其中很大一部分是向我方和他东谈主解说咱们隆重的代码的行径适应预期。
当咱们秉承编码代理动作软件建造过程的中枢部分时,这变得愈加伏击——也愈加具有挑战性。
咱们用代理产生的代码越多,减少咱们需要破耗的手动 QA 时候数目的用具就越有价值。
对于 StrongDM 软件工场模式 最预料预料的事情之一是,尽管他们的策略是"代码不得由东谈主类审查",但他们怎样确保他们的软件经过充分测试并提供价值。他们处理有贪图的一部分触及通过运行"场景"来测试其软件的不菲的 QA 代理群。这很迷东谈主,但我不想在不错幸免的情况下在 QA 机器东谈主上破耗数千好意思元!
我需要用具让代理大约明晰地向我展示他们的责任,同期尽量减少他们对我方所作念的事情进行骗取的契机。
2、Showboat:代理构建文档来演示他们的责任
Showboat 是我构建的匡助代理向我展示其责任的用具。
它是一个 CLI 用具(一个 Go 二进制文献,可选地包装在 Python 中以使其更易于装配),它匡助代理构建一个 Markdown 文档,准确演示他们新建造的代码不错作念什么。
它不是为东谈主类运行而想象的,但无论怎样这是你会运行它的花式:
showboat init demo.md '怎样使用 curl 和 jq'
showboat note demo.md "以下是怎样全部使用 curl 和 jq 的顺序。"
showboat exec demo.md bash 'curl -s https://api.github.com/repos/simonw/rodney | jq .description'
showboat note demo.md '以及 curl 标记,用于演示 image 敕令:'
showboat image demo.md 'curl -o curl-logo.png https://curl.se/logo/curl-logo.png && echo curl-logo.png'
如果你在 VS Code 中掀开它并预览 Markdown,死字是这么的:

一个 Gist 中的 demo.md 文献
因此,一系列 showboat init、showboat note、showboat exec 和 showboat image 敕令一次构建一个 Markdown 文档部分,其中 exec 敕令的输出自动添加到文档中,径直跟在运行的敕令背面。
image 敕令有点出奇——它在敕令输出中查找图像的文献旅途,并将该图像复制到现时文献夹并在文献中援用它。
基本上即是所有这个词东西!还有一个 pop 敕令,如果出现问题则删除最近添加的部分,一个 verify 敕令再走运行文档并搜检莫得任何变化(我对这个想象并不透彻慑服),以及一个 extract 敕令,用于逆向工程用于创建文档的 CLI 敕令。
它特地轻佻——只消 172 行 Go 代码。
我使用我的 go-to-wheel 用具对其进行了打包,这意味着你不错像这么以至不装配它就运行它:
uvx showboat --help
阿谁 --help 敕令真是很伏击:它旨在为使用用具的编码代理提供他们需要知谈的一切。这里是齐全的匡助文本。
这意味着你不错掀开 Claude Code 并告诉它:
运行 "uvx showboat --help" 然后使用 showboat 创建一个 demo.md 文档,态状你刚刚构建的功能
即是这么!--help 文本有点像一个妙技。你的代理不错阅读匡助文本并使用 Showboat 的每个功能来创建一个文档,演示你需要演示的任何内容。
这里有一个预料预料的时刻:如果你让 Claude Code 构建 Showboat 文档,你不错在 VS Code 中掀开它,并在代理运行演示时及时不雅看预览窗格更新。这有点像让你的共事在屏幕分享会议中向你先容他们最新的责任。
终末,一些例子。以下是我让 Claude 使用 Showboat 创建的文档,以匡助演示我在其他技俩中正在处理的功能:
shot-scraper:全面演示 运行我的 shot-scraper 浏览器自动化用具的齐全功能套件,lol投注主如果为了锻真金不怕火 showboat image 敕令。
sqlite-history-json CLI 演示 演示我为新的 sqlite-history-json Python 库添加的 CLI 功能。
{jz:field.toptypename/}row-state-sql CLI 演示 展示我向并吞技俩添加的新 row-state-sql 敕令。
使用 Notes 进行改动分组 演示另一个功能,即并吞事务中的改动组不错附加一个备注。
krunsh:将 Shell 敕令传递到临时 libkrun 袖珍假造机 是一个出奇复杂的例子,我设法让 Claude Code for web 在 Claude gVisor 沙箱内的 QEMU 模拟 Linux 环境中运行 libkrun 袖珍假造机。
我当今不绝使用 Showboat,足以劝服我它的实用性。
我也看到代理舞弊!由于演示文献是 Markdown,代理无意会径直剪辑该文献而不是使用 Showboat,这可能导致敕令输出不反应骨子发生的情况。这里是对于这个问题的问题。
2、Rodney:结合Showboat的CLI 浏览器自动化
我参与的好多技俩皆触及 Web 界面。代理不绝为这些界面构建全新的页面,我但愿在演示中看到这些内容。
Showboat 的图像功能旨在允许代理动作其演示的一部分拿获屏幕截图,领先使用我的 shot-scraper 用具 或 Playwright。
Showboat 体式受益于 CLI 实用轨范。我寻找从 CLI 管制多轮浏览器会话的细致选项,但莫得找到,是以我决定尝试构建一些新东西。
Claude Opus 4.6 指向了我 Rod 用于与 Chrome DevTools 条约交互的 Go 库。它很棒——它为使用自动化 Chrome 基本上不错作念的所有事情提供了全面的包装,全部在一个编译为几 MB 的自包含库中。
Rod 阑珊的只是一个 CLI。
我构建了第一个版块动作一个异步文书原型,这劝服我值得将其发展成为我方的技俩。
我将其定名为 Rodney,是对它所基于的 Rod 库的请安,以及对只消傻瓜和马的援用——以及因为包称呼在 PyPI 上可用。
你不错使用 uvx rodney 运行 Rodney 或像这么装配它:
uv tool install rodney
(或者从发布页面获得 Go 二进制文献。)
这是一个轻佻的示例会话:
rodney start # 在后台览动 Chrome
rodney open https://datasette.io/
rodney js 'Array.from(document.links).map(el => el.href).slice(0, 5)'
rodney click 'a[href="/for"]'
rodney js location.href
rodney js document.title
rodney screenshot datasette-for-page.png
rodney stop
在结尾中看起来是这么的:

与 Showboat 相通,这个用具也不是为东谈主类使用而想象的!场所是让编码代理大约运行 rodney --help 并看到他们需要知谈的一切以启动使用该用具。你不错在 GitHub 存储库中看到该匡助输出。
以下是我使用 Showboat 创建的 Rodney 的三个演示:
Rodney 的原始功能集,包括页面屏幕截图和施行 JavaScript。
Rodney 的新无隔断测试功能,在建造这些功能时间构建,以展示它们不错作念什么。
使用这些功能对页面进行基本的无隔断审核。我对 Claude Opus 4.6 怎样响应教唆"使用 showboat 和 rodney 对 https://latest.datasette.io/fixtures 进行无隔断审核"印象潜入——转录在这里。
3、测试驱动建造有匡助,但咱们仍然需要手动测试
在成为测试优先、最大测试阴事率软件建造派别的毕生怀疑论者之后(我可爱包含测试的建造)我最近启动接受测试优先过程,动作迫使代理只编写处理现时问题所需代码的一种花式。
我的好多 Python 编码代搭理话皆以疏浚花式启动:
使用 "uv run pytest" 运行现存测试。使用红色/绿色 TDD 构建。
告诉代理怎样运行测试既标明该技俩存在测试且伏击,亦然一个观点。代理在编写我方的测试之前会阅读现存测试,因此领有具有细致模式的干净测试套件使他们更有可能编写我方的细致测试。
前沿模子皆融会"红/绿 TDD"意味着他们应该先编写测试,运行它并不雅察它失败,然后编写代码使其通过——这是一个浅薄的快捷花式。
我发现这大大晋升了代码质料和代理用最少的教唆指引产生正确事物的可能性。
但任何从事过测试责任的东谈主皆知谈,只是因为自动化测试通过并不虞味着软件信得过有用!这即是 Showboat 和 Rodney 背后的动机——直到我用我方的眼睛看到它运行,我从不信任任何功能。
在构建 Showboat 之前,我不绝向代搭理话添加"手动"测试设施,举例:
测试通事后,启动建耕种业器并使用 curl 锻真金不怕火新功能
4、我在手机上构建了这两个用具
Showboat 和 Rodney 皆启动动作通过 Claude iPhone 附近创建的 Claude Code for web 技俩。它们的大大批握续功能责任皆以疏浚花式发生。
我对当今在手机上完成了若干编码责任仍然有点诧异,但我猜想,我今天发布到 GitHub 的大部分代码皆是由通过该 iPhone 附近驱动的编码代理为我编写的。
我领先想象这两个用具用于像 Claude Code for web 这么的异步编码代理环境。到面前为止,死字真是很好。
- 英雄联盟投注 东说念主在深圳,36岁,极限考公2026-02-25
- 英雄联盟投注 古尔曼:苹果3月2 - 4日发布“至少五款家具”2026-02-24
- 英雄联盟投注 九游游戏文娱装甲中枢6恋爱梗走红2026-02-23
- lol外围投注 我国扣问露馅,这类严重凄迷病或无需终生养息2026-02-22
- lol投注 哈尔滨冰雪大宇宙创单日招待旅客量历史之最2026-02-21
- 英雄联盟投注app 甜度超标!朱易晒亲密合照道贺苏翊鸣夺冠,依偎肩头太好磕,苏翊鸣直白恢复爱你宝贝2026-02-20
