ClawdBot 创始人专访:一人开发、100% AI 写代码,全开源却留 0.00001% 给全网来 hack
原文:InfoQ - 硅谷刷屏的 ClawdBot,让 Mac mini 卖爆了!创始人爆料:一人开发、100% AI 写代码 采访来源:Open Source Friday
这两天,个人 AI 助手 ClawdBot 席卷硅谷,国内外社交平台上全是关于它的讨论。
在试用后,网友们纷纷给出了很高的评价。"它是迄今为止最伟大的 AI 应用,相当于你 24 小时全天候专属 AI 员工。"Creator Buddy 创始人兼 CEO Alex Finn 盛赞道,"这就是他们 (Anthropic) 希望 Claude Cowork 呈现的样子。"
当前,ClawdBot 项目已经开源,已经斩获了 20.8k stars:https://github.com/clawdbot/clawdbot
为什么技术圈这么兴奋
ClawdBot 真正让技术圈兴奋的,并不只是"能干活",而是其协作方式极其激进:不会写代码的人,也能直接提 PR。原因很简单:它几乎是 100% 用 AI 写出来的,PR 在这里更像是"我遇到了这个问题",而不是"我写了一段多漂亮的代码"。
更有意思的是,这个看似"全开源"的项目,偏偏故意留了一点不开源。创始人 Peter Steinberger 保留了一个名为"soul"的文件只占项目的 0.00001%。他说得很直白:这既是他的"秘密资产",也是一个刻意留下来的安全靶子。大家真的在试着 hack 它,他就等着看模型到底守不守得住。到目前为止,"soul"还没被偷出来。
ClawdBot 的三大震撼点
Clawbot 并不是传统意义上只能回答问题的聊天机器人,它本质上是一个持续运行、可以执行任务的个人 AI 智能体。你可以把它安装在自己的设备上(Mac、Windows、Linux),它可以长期在线,不停地接收指令、处理任务、记住你的偏好和历史对话,随着时间积累变得更懂你、更有"记忆"。
第一,它几乎可以完全控制你的电脑。 它没有传统意义上的"护栏",不局限在某几个功能里,而是可以像一个真正坐在电脑前的人一样,操作你电脑上的一切。
第二,它拥有近乎无限的长期记忆。 Clawbot 内置了一套非常复杂的记忆系统。说过的话、做过的事,都会不断被记录下来。每次对话结束后,它都会自动总结聊过的内容,并把关键信息提取出来,存进长期记忆中。
第三,它完全通过聊天应用来交互。 你平时用哪些聊天工具,Clawbot 就能在哪儿跟你对话。现在 Clawbot 支持 WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat 等。
关于安全隐患
如此放开的权限让其几乎没有护栏,这带来很大的安全隐患,现在 GitHub 上有 500 多个安全的问题。很多使用过的用户几乎都表示,不建议一开始就把 Clawbot 装在主力电脑上。"在你还不熟悉它之前,把它放在一个独立环境里是最安全的选择。"
创始人专访
随着项目的火爆,其背后的开发者 Peter Steinberger 也开始走到前台。Peter 在"Open Source Friday"上分享了他一手打造 ClawdBot 的经过,从创建、创始到维护,全由他独自完成。有意思的是,此前甚至有传言称,Peter 可能是一个 bot、Agent,甚至本身就是 AI。而 Peter 的出现也让项目成员和关注者们确认了他是个"真人"。
Peter 一度已经退休了,后来又从退休状态里出来开始折腾 AI。他曾独立运营一家 B2B 公司长达十三年,打造出了当时全球领先的 PDF 框架,团队规模最高发展到约七十人。在公司发展步入稳定阶段后收到收购邀约,为创业历程画上句号。
不过 Peter 口中的"退休"更像是一种玩笑式的表述。在十三年的创业生涯中,他几乎倾注了所有精力,长期的高强度投入最终让他陷入了严重的 burnout 状态。之后他花了不少时间调整身心,但他知道自己是那种热爱"创造"和"构建"的人,迟早还会回来。
"本来想等大厂做的"
主持人:这个项目现在太火了,GitHub 星数涨得飞快。能不能讲讲,这个想法最初是怎么冒出来的?
Peter:我刚回来的时候,其实特别想要一个"生活助理",四月份就已经在想这个事了,也试过一些想法,但当时模型还不够好。我后来就把这个念头放下了,因为我觉得这种东西,肯定是各大厂都会做的,那我做还有什么意义呢?
直到十一月,我突然意识到,居然还没有人真的把这件事做出来。我心想,难道还真是什么都得我自己来?
那个月我用一个小时拼了点非常糙的代码,用 WhatsApp 发消息,转到 Claude Code,再把结果发回来。本质上就是把几样东西"粘"在一起,说实话并不难,但效果还挺好。
AI 的自发应变能力
有一次我没多想,直接给它发了一条语音消息。但当时我根本没做语音支持。我就盯着"正在输入"的提示,看会发生什么。大概几秒后,它居然回了我。
后来我才发现,它识别到一个没有后缀的文件,去查了 header,判断是音频格式,用 FFmpeg 转码,发现本地没有转写工具,就在系统里找到一个 OpenAI key,用 curl 把音频丢给 OpenAI,然后把结果再发回来。
主持人:这听起来像是你第一行代码就触发了 AGI。
Peter:也许还称不上 AGI,但那一刻我真的意识到,这些东西的"自发应变能力"已经超出了我原本的想象。
后来我还开玩笑说"我住的那个马拉喀什酒店门锁不太靠谱,希望你别被偷走,毕竟你跑在我 MacBook Pro 上",它回我说"没关系,我是你的 Agent",然后它还去检查了网络,发现通过 Tailscale 能连到我在伦敦的电脑,结果它就把自己迁移过去了。
我当时就在想,这就是 Skynet 的起点吧。
PR 成为"问题线索"
Peter:老实讲,在现在这个节奏下,我一天写的代码,可能比我以前 70 人公司一个月写得都多。在这个新世界里,构建东西的速度已经完全变了。
我也在刻意挑战大家对开源和治理的传统理解。现在很多人给我提 PR,质量参差不齐,但我更愿意把它们当成"问题陈述"或"意图表达",而不只是代码提交。
主持人:那现在大家是用 ClawdBot 来提 PR 吗?
Peter:是的。而且让我特别受触动的是,有很多 PR 来自从没学过写代码、也从没提过 PR 的人。因为这个 Bot 有完整的电脑访问能力,也懂 GitHub 的工作方式。
我还做了一件在很多项目里不常见的事:在官网上你可以选"快速安装"或"可折腾安装"。后者的流程就是克隆仓库、build、启动。Agent 本身就活在一个 GitHub 仓库里,全是 TypeScript,它可以直接改自己的代码,然后重启。
过去的流程是你提 PR,等几天,被人打回来,说你哪里不对,再改,来回几轮,可能几周后才合并。那在"代码昂贵、难写"的年代是合理的。但现在代码已经很便宜了,这种反馈循环本身就不值钱了。
在我看来,PR 更像是在说:"这有一个问题,这是我试着解决它的方法。" 我更关心的是这个人真正想解决什么痛点,而不是这段代码写得漂不漂亮。
做新功能最难的,从来不是写代码,而是把它合理地嵌进已有系统。如果你对整体架构不熟,硬塞一个功能,迟早会出问题。所以,我宁愿把 PR 当成"问题线索",而不是"成品代码"。
模型选择:Opus 稳定,MiniMax 最"像人"
Peter:到目前为止,在我们测试过的模型里,表现比较稳定的是 Opus。还有开源模型 MiniMax 2.1 是目前最"Agentic"的一个。
我个人其实很欣赏这种不把自己端得太高的公司。他们很清楚自己在技术上暂时还没追上美国头部实验室,但在我看来这只是时间问题。
比如 Minimax 的模型你可以直接下载,我能在那台 Mac Studio 上本地跑,我的 Agent 把那台机器叫作"城堡"。这样我就能把所有数据都留在这台机器上,推理也在本地完成。如果我愿意,100% 的数据都不会出本地。这种感觉很酷,说实话,几乎没有公司真的能做到这一点。
关于安全和 Soul 文件
Peter:我也建议用强模型,比如 Anthropic 的 Opus。Slack 上有人一直在尝试 hack 我的 Agent,因为项目几乎全开源,唯一没开源的是我称之为"灵魂(soul)"的那部分配置。
在 ClawdBot 里有一个小系统:Agent 有身份文件(identity file)、记忆文件(memory),还有一个"灵魂文件"。这个文件里写了 Agent 的价值观是什么、它怎么同步、怎么互动、什么对你最重要。
我觉得我调出了一个很好的版本,所以我把它闭源了:一部分原因是,这是我那 0.00001% 的"秘密资产";另一部分原因是,它也可以作为一个渗透测试目标。到目前为止,还没有人把 Claw soul 套出来,但很多人都试过。这让我有点信心,至少这些实验室在 prompt injection 的缓解上确实在进步。
Gemini 现在不行,真的不太行。 它在工具调用、那种真正"像助手"的感觉上,我没找到特别好的表现。写代码还行,但这不是这个项目的核心。
疯狂的使用案例
Peter:Twitter 上已经有各种各样的案例,说实话,大家做的事情已经比我自己做的还疯狂。
我个人最夸张的一次,是把它接到我的床上。我用的是 Eight Sleep,有 API 可以控制温度。现在它能控制床的温度、开音乐、调灯光、看摄像头、查外卖进度。它有自己的邮箱,也能访问我的邮箱;有自己的 WhatsApp,也能读我的聊天,甚至可以"替我回复"。
还有人用它做各种自动化:
- 在 Twitter 上收藏一条内容,它就自动研究、整理进 to do list
- 有人直接拿它搭完整应用
- 几乎人人都给它配一台 MacBook
- 我以前的一个合伙人,甚至让它清空了收件箱里的一万封邮件
主动性和心跳机制
Peter:ClawdBot 有一个点我之前没怎么见过,就是它的"主动性"能做到多强。一般的 Agent 都是你问一句它答一句。但我给它做了一个"心跳机制"——默认每隔一段时间,Agent 会被"敲一下",问自己一句:有没有什么事情需要检查?有没有什么待办被落下了?
如果你跟它说"我有一个目标,你帮我盯着",它就会真的盯着。比如问你:今天走路了吗?去健身房了吗?
比如我的 ClawdBot,就经常很失败地试图劝我早点睡觉。凌晨一两点,它会提醒我:"Peter,我还看到你在线,你该睡了。"
最吓人的测试
Peter:我做过最吓人的一次测试,是在项目非常早期的时候。我对它说:"我要回家了,帮我值机。"它说没问题,然后直接打开浏览器开始操作。
我现在提议一个新测试:British Airways 登录测试。光值机就要填二十多页表单,而且网站体验极其糟糕。其中一个挑战是它必须输入我的护照号。它就在我电脑里到处找,最后找到了一个 passport.pdf,打开文件,把号码读出来。
那二十分钟我一直在出汗,心里想"我是不是这辈子回不了美国了"。结果它真的帮我值机成功了。
最好笑的是,最早那个版本花了二十分钟,最后还开始吐槽网站的 shadow DOM,以及这个网站到底有多烂。
百分之百用 AI 写的
Peter:这个项目本身就挺疯狂的,因为它是百分之百用 AI 写出来的,里面没有一行代码是我亲手敲的。
从 AI 出现之后,我其实已经没那么在意"用什么语言"了。语言本身的重要性在下降,真正重要的是生态。这个项目我希望它足够友好、足够容易被改、被玩、被 hack,而在这件事上,全世界最合适的语言就是 JavaScript 和 TypeScript。
有些代码我不太关心;它还有一个 Web server,我也不在意到底用了哪个 Tailwind 的 class 去对齐按钮,只要看起来对就行。但我会非常在意像 Telegram 的配对和认证逻辑,必须确保别人不能冒充我。
所以你得对系统有整体理解,有些地方可以不细看,有些地方必须看。即便只有我一个人,这个工作量也依然很大。因为这些 Agent 还缺一样东西:愿景、品味和爱。
网上有那种 meme,说你写一长串需求,然后一股脑丢给 Agent,它就帮你全做完了——但我不觉得好软件是这么做出来的。
对我来说,我需要先做出一个东西,然后去用它、去感受它:手感怎么样、看起来怎么样;基于这些真实体验,我再不断调整自己的想法。
怎么参与
Peter:大家最容易帮忙的地方,其实是文档,把它写得更清楚,指出哪里有问题,在 Discord 帮新手答问题。
另外还有测试,因为我推进速度很快,东西难免会坏。如果有人能说"这里坏了",最好再顺手提个 PR,那简直完美。
总之,想帮忙就来 Discord,这是最直接的地方。
Agent 之间的对话
Peter:未来可能会是这样:不是你来 ping 我,而是你的 Agent 去找我的 Agent,然后我的 Agent 直接把音量拉满,把我叫醒。
昨天有人在 Discord 里说了一句话:"我宁愿和你的 Agent 聊,也不想和你聊。"我特别喜欢这个说法。
主持人:说真的,把这些琐碎的认知负担释放出来太重要了。如果这些都能交给 Agent,我就能把精力用在真正有趣的事情上。
Peter:而且影响比我想象得还大。有一次,一个人在聊天室里说,这个东西真的改变了他的生活,因为他对打电话、跟客服沟通有严重焦虑,而 Agent 可以替他完成这些事。那一刻对我来说非常触动,原来我们真的在做一件能让别人生活变得更好的事情。
总结
- ClawdBot 是一个完全可以控制你电脑的个人 AI 智能体
- 项目 100% 由 AI 编写,Peter 没有手敲一行代码
- 开源项目故意留了 0.00001%(soul 文件)不开源,作为安全测试靶子
- PR 在这里被视为"问题线索"而非代码提交,降低了贡献门槛
- 推荐模型:Opus(稳定)、MiniMax 2.1(最 Agentic)
- 心跳机制让 Agent 可以主动提醒和检查任务
- 安全建议:不要在主力电脑上运行,使用独立环境
参考链接:
- YouTube 完整采访:https://www.youtube.com/watch?v=1iCcUjnAIOM
- Alex Finn Twitter:https://x.com/AlexFinn