
内容来源:2026年2月12日,Peter Steinberger在Lex Fridman播客内容分享。
分享嘉宾:Peter Steinberger彼得·斯坦伯格,奥地利程序员,OpenClaw开源项目创始人。
高级笔记达人丨天朗明月
责编 | 柒 排版 | 拾零
第 9494 篇深度好文:8726 字 | 22 分钟阅读
商业趋势
笔记君说:
最近,整个科技圈都在热议一只"龙虾"。它不是海鲜,而是2026年开年现象级的开源AI项目——OpenClaw(养龙虾)。
短短几天,它在GitHub上狂揽18万星,创下增长纪录。但它的创始人Peter Steinberger却轻描淡写:这只是一个"实验项目"。
一边是席卷全球的热度,一边是创始人冷静的定位,这种反差背后,到底藏着怎样的颠覆性力量?
从一小时做出的原型,到让扎克伯格、奥特曼亲自体验并争相招揽,OpenClaw究竟做对了什么?
今天,我们整理了Peter彼得在Lex Fridman(莱克斯·弗里德曼)播客中的三小时深度对话。
你将看到:一个曾卖掉十亿级公司的"bunout"(职业倦怠)程序员,如何重拾热爱,亲手点燃这场AI Agent(智能体)革命;他将分享"自修改软件"的魔法、与加密货币投机者抢注账号的"血泪史",以及对"80%的App将消亡"的大胆预言。
这不仅仅是一个产品的成功故事,更是一场关于技术哲学、创业心态与未来人机协作的深刻思考。
无论你是开发者、创业者,还是对未来感到好奇的普通人,都能从中获得启发。
一、OpenClaw的诞生:
从一小时原型到现象级开源项目
1.魔法时刻:一条语音消息触发的AI交互革命
我从去年四月份就想要一个AI个人助手。比如,把我所有的WhatsApp(类似微信的即时通讯应用)数据拉出来,然后进行查询。
那时候我们有GPT-4.1,它带有一百万上下文窗口。我把所有数据导进去,然后问它一些问题,比如""这段友谊的意义是什么?",得到了一些非常深刻的结果。我把结果发给朋友们,他们都感动得眼眶湿润了。
那个时候,我就已经感受到AI交互的潜力。但后来我想,所有的实验室都会做这个,所以我就去做别的事了。
比如Viptunnel(某项目名称),这是一个周末黑客项目。那时候还是Claude Code(由AI驱动的编程工具)时代,项目处于早期实验和玩耍阶段。
那个时候,我有WhatsApp的实验,也有Viptunnel的实验,但两个都感觉不是正确答案。后来我想到,直接把WhatsApp连接到Claude Code,一步到位。
当CLI(命令行界面)消息进来时,我用"-p"参数调用CLI,它施展魔法后返回字符串,再发回WhatsApp。这个功能我只用一个小时就做出来了。当时感觉已经很酷了,就像"哦,我可以跟我的电脑说话了"。

但我还想要图片支持,因为我经常在prompt(提示词)里使用图片。我觉得这是给Agent提供更多上下文的一种非常高效的方式,Agent很擅长理解我的意思,即使是一张奇怪的裁剪截图。所以我大量使用图片,也想在WhatsApp里实现这个功能。
你知道的,当你走在路上看到一个活动海报,截个图让它帮忙看看你是否有时间参加、活动好不好、朋友们是否有兴趣,图片在这种场景下非常重要。因此,我又花了几个小时才把这个功能搞定。
之后我就开始大量使用它。有趣的是,那正好是我和朋友们去马拉喀什过生日旅行之前。在那里它甚至更好用,因为网络虽然有点不稳定,但WhatsApp总能正常发送消息,它在这方面做得真的很好。
所以我在旅行中用了很多次,让它帮我翻译内容、解释问题、查找地点,就像有一个帮你使用Google的助手。虽然基本上还没有真正构建完整功能,但已经能做这么多事了。
那种体验有种难以用语言表达的魔力。用聊天客户端跟Agent对话,和坐在电脑前用Cursor(代码编辑器)或者在终端里用Claude Code和CLI是完全不同的体验。
能靠在椅子上跟它说话,这看似是一个很小的步骤,但在某种意义上,这是AI融入生活方式的一个相变,感受完全不一样。
有人说「这里面没有什么魔法,它就是做了这个、那个、还有那个」。而且感觉这几乎像个爱好,就像Cursor或Perplexity(一款AI搜索引擎)的功能模块一样。
我想是的,有时候重新排列组合、再加入几个新想法,就是你所需要的全部魔法了。这类创新往往是之前没人做到,之后又让人觉得如此显而易见。
真正让我看到未来可能性的,是一次意外的发现。
在大量使用这个工具之后,有一次我发了一条消息,只是一个随机问题:"嘿,这家餐厅怎么样?"
然后屏幕上出现了"正在输入"的提示。我心想:等等,我没做这个功能啊,它原本只支持图片,到底在干什么?接着它就给出了回复。
我们当时正在城里四处逛。我用它时完全没多想,因为有时候赶时间打字很麻烦,所以就发了语音消息,没想到它居然直接处理了。我当时就说:"嘿!这家伙是怎么做到的?"
然后它告诉我:
"是的,这个疯狂的家伙做了以下事情:他给我发了一条消息,但只是一个没有文件扩展名的文件。于是我检查了文件头,发现它是Opus(音频编码)格式,就用ffmpeg(音视频处理技术)进行了转换。我本想使用Whisper(音频处理工具),但发现没有安装,不过找到了OpenAI的API key(密钥),于是直接用Curl(命令行工具)把文件发给OpenAI进行转录,才有了现在的回复。"

我看着这条消息,不禁感叹:"哇哦。"要知道,你没有教它任何这些操作,Agent却自己弄明白了,完成了所有的转换和翻译步骤。它自己找到了API,自己决定使用哪个程序,这一切都是自主完成的。
而你只是不经意地发了一条语音消息,它就给出了回复,而且处理方式非常聪明。因为如果走Whisper本地路径,需要下载模型,速度会很慢。
所以这背后体现了丰富的世界知识和创造性解决问题的能力。当它面对"这是什么没有扩展名的文件?"这样的问题时,会主动去弄清楚。那个时刻让我顿悟了,我被深深打动了。
2.成功密码:开源创新与"玩"出来的颠覆力
OpenClaw的成功源于将开发过程变成了一场充满乐趣的探索,感觉就像是在玩无限版的Factorio(一款工厂建设游戏),建造属于自己的小游乐场。
我从来没有像构建这个项目一样开心过。你看,一级Agent循环,我能做什么?怎么巧妙地排队消息?怎么让它更像人?
我有了一个想法,因为循环里Agent总是会回复一些东西,但在群聊里你不一定总想让Agent回复。所以我给了它一个不回复的选项。所以它可以选择闭嘴,这样感觉更自然。
然后是记忆,你想让它记住东西。终极Boss可能是持续强化学习,但我觉得我现在大概在第二三级,用Markdown文件和向量数据库。然后你还能升级社区管理、网站和营销。
很多人都喜欢问我一个问题:如果看2025年,那么多创业公司、那么多公司都在做Agent类的东西,或者声称在做。然后OpenClaw横空出世把所有人都干翻了。
为什么是OpenClaw赢了?我认为,因为他们都太把自己当回事了。

事实上,你很难和一个只是来玩的人竞争。我想让它有趣,我想让它古怪。如果你看到网上所有那些龙虾的东西,我觉得我做到了古怪。
很长时间以来,安装它的唯一方式就是gitclone(克隆)、pnpmbuild(编译)、pnpmgateway(运行),也就是通过git克隆代码库、使用pnpm进行构建、以及通过pnpm配置网关的操作流程。
然后Agent非常有自我意识。它知道自己的源代码是什么,理解自己是怎么运行的,知道文档在哪里,知道自己跑的是哪个模型,知道你是否开了语音或推理模式。
我想让它更像人,所以它理解自己的系统,这使得Agent很容易就能你什么都不用做,你用prompt(提示词)把它召唤出来,然后它就会修改自己的软件。
所以,这种趣味性、开源特性以及自修改能力,极大地降低了用户的参与门槛。我想,这正是它能够在众多Agent类项目中脱颖而出的关键。
二、技术哲学与未来展望:
自修改软件与App消亡预言
1.技术内核:自修改能力与开发范式革新① 自修改软件:让AI自主进化的底层逻辑
自修改软件,大部分是Codex(OpenAI开发的AI代码生成模型和编程助手)构建的,但很多时候我在调试时会大量使用自省。
比如"嘿,你能看到什么工具?你能自己调用这个工具吗?"或者"你看到了什么错误?读一下源代码,搞清楚问题出在哪里。"
我觉得这是一种非常有趣的方式,Agent用来调试自身,所以它很自然地让每个人都能这样做。它带来了很多从没写过代码的人提交的PR,我最后把它们叫做"prompt Requests"(提示请求)而不是"Pull Requests"(拉取请求)。
但我不想贬低这件事,因为每次有人提交了他们的第一个PR,对我们的社会来说都是一个胜利。不管它有多粗糙,你总得从某个地方开始。
我知道有很多人抱怨开源的PR质量,那是另一个层面的问题。但在另一个层面上,我觉得非常有意义的是,我做了一个东西,人们喜欢它到愿意去学习开源是怎么运作的。以前进入这个门槛太高了,而有了Agent和合适的软件,门槛一路降低。
此外,我还组织了另一种聚会,我叫它Cloud Code Anonymous(云代码匿名会),现在改叫Agents Anonymous(Agent 匿名会),让你知道灵感来源。
② 开发工作流:从工具革新到思维转变
首先是在工具层面。
第一,是Claude Code。我的第一个接触点是Claude Code,四月份,不太好但还行。这种突然在终端里工作的范式转变很清新,但我还是很需要IDE(集成开发环境)因为它还不够好。然后我大量实验Cursor,不太喜欢很难开多个实例。
最终我回到了Claude Code作为主要工具。到了某个时候我有大概七个订阅,每天用完一个,因为我已经非常习惯同时开多个窗口并行工作了。
第二,是diff(差异对比工具)查看器。我用IDE非常少,主要用一个diff
查看器。我越来越习惯不读所有代码了,不读无聊的部分,因为大部分软件就是数据进来,从一种形状变成另一种形状,存到数据库里,取出来展示给用户。
第三,是Agentic Engineering。
在我的一篇博客里有个图叫"Agentic编程曲线":X轴是时间,Y轴是复杂度。左边是"请修复这个"的简短prompt(提示词)。中间是超级复杂的八个Agent、复杂编排、多工作区、Agent链、自定义子Agent工作流、18个slash命令、大型全栈功能。
然后精英级别是随着时间你又回到了禅意的短prompt(提示词):"嘿,看看这些文件然后做这些修改"。
我其实叫它Agentic陷阱。很多人第一次接触然后开始Vibe Coding(氛围编码方式)。我其实觉得Vibe Coding是个贬义词。我更喜欢Agentic Engineering(智能体工程),我跟别人说我做 Agentic Engineering。
总之,人们开始尝试这些工具,有建设者心态的人会非常兴奋。但你得去玩它,就像你得先玩吉他才能弹出好听的音乐。不是摸一次就能行云流水。这是一种需要学习的技能。

其次是在思维认知层面。
第一,你得稍微学习Agent的语言,理解它们哪里擅长哪里需要帮助。
你得考虑Codex或Claude怎么看你的代码库。它们每次开启新会话的时候对你的项目一无所知。你的项目可能有十万行代码。所以你得帮Agent一点,记住上下文大小是个限制,引导它们看该看的地方。这通常不需要很多工作,但考虑它们的视角是有帮助的。
听起来很奇怪,它又不是活的。但它们每次都从零开始。我有系统理解,所以用几个指引我就能马上告诉它"嘿,要改这里,你需要考虑这个、这个和这个"。
然后它们会去找和看,它们对项目的理解永远不完整,因为全部塞不进去。所以你得引导它们看哪里以及怎么处理问题。
第二,有些小技巧有时候很有用,比如"不着急,慢慢来"。
听起来很蠢,但这是一个非直觉的东西。就像我写代码进入心流时,如果架构不对会感到摩擦。prompt(提示词)的时候也一样,如果什么东西花了太长时间,也许是我思路有问题,也许是架构上的误解。你随时可以按Escape(退出键)停下来,看看问题在哪里。
你得像和一个非常能干的工程师讨论一样。但也不要把你的世界观强加给它。让Agent做它擅长的事情,它可能有更好的想法。
所以有一定程度的接受是必要的:代码不会完美,我会做得不一样,但这是一个可用的方案,将来如果真的太慢或有问题,我们随时可以重做。
2.模型对比:Opus与Codex的差异化应用
目前两个大的竞争者,Claude Opus4.6(克劳德·奥普斯4.6版本)和通过Codex使用的GPT-5(OpenAI专门给Agent编程优化)这两个模型,我有很多话要说。
首先,在通用模型方面,Opus是最好的。
对于OpenClaw,Opus在角色扮演方面非常出色,真的能进入你给它的角色。它在遵循指令方面从很差变到了很好,取得了很大进步。它通常很快就会尝试做事,更倾向于试错。用起来很舒服。总的来说,Opus有点像是太美国了。
你也知道Codex团队很多人是欧洲人,所以也许这不只是巧合。但Anthropic(人工智能公司)也修了一些。Opus以前会一直说"你说得完全对",这已经成了一个梗。我现在听到这句话就受不了,不是在开玩笑。
其次,模型之间存在差异。
Opus像那个有点傻但很有趣的同事,你把他留在身边。而Codex像角落里你不想搭话的怪人,但很靠谱,能把事情做完。
归根结底,如果你是一个熟练的驾驶员,你可以用任何最新一代的模型得到好结果。

我更喜欢Codex,因为它不需要那么多表演。它默认就会读大量代码。而Opus你得推它更用力,因为它就像"我能开干了吗?我能开干了吗?"然后它就飞速跑出去了,给你一个非常局部的解决方案。
我觉得区别在后训练,不是原始模型智能差多少。只是它们被给予了不同的目标。没有哪个模型在所有方面都更好。
最后,代码质量方面,Opus略高一筹。
果驾驭得好,Opus有时候甚至能给出更优雅的解决方案。但需要更多技巧。用Cloud Code并行开很多会话更难,因为它更交互式。而Codex更像是你先讨论,然后它消失20分钟。它可以非常非常持久地工作直到搞定。如果有一个明确的目标,模型会非常努力地达到那里。
最终它们需要差不多的时间,但Claude方面更多是试错,Codex有时候会想太多。我更喜欢那种干巴巴的、我不需要读太多的版本。
3.架构选择:Skills+CLI(命令行界面)优于MCP的实践
半年前所有人都在谈论MCP(模型上下文协议),而我说"MCP算了吧,每个MCP不如做成一个CLI"。现在这个项目甚至没有MCP支持(严格来说有,但不在核心层),没人抱怨。
我的方法是,如果你想用更多功能扩展模型,你就做一个CLI(命令行界面),模型可以调用那个CLI(命令行界面)。它可能第一次搞错,调用帮助菜单,然后按需加载到上下文中它需要的东西。它只需要一句话知道这个CLI(命令行界面)存在。
Skills(人工智能技能)其实就很完美:一句话解释这个Skill,模型加载这个Skill,Skill解释了CLI(命令行界面),模型使用CLI。
所以,MCP对比Skills,MCP基本上要死了。MCP是更结构化的东西,一种与API、数据库、服务、文件通信的协议。Skills更多是「我应该怎么工作」,是流程、辅助脚本和prompt(提示词),通常用半结构化的自然语言写的。如果模型足够聪明,Skills技术上可以替代MCP。
事实上,我觉得主要的美妙之处在于模型非常擅长调用Unix(操作系统)命令。所以你加另一个CLI就只是加了另一个Unix命令。而MCP需要在训练中添加,不是模型天然的东西,需要非常特定的语法,最大的问题是不可组合。
比如我有一个天气服务返回温度、降雨、风力等一大堆数据。作为模型,我总是得把整个大blob(数据块)拿回来,用它填满我的上下文,然后挑我要的。没有办法让模型自然地过滤,除非我主动在MCP里加过滤功能。
但如果我做成CLI(命令行界面),模型可以加一个jq(Linux中用于JSON数据处理的轻量级命令行工具)命令自己过滤,只拿它需要的。甚至可以组合成脚本做计算,只给我精确的输出,上下文零污染。
当然你可以用子Agent之类的解决,但那都是变通方案。
MCP推动了很多公司去做API,这是好的,但是MCP默认污染你的上下文,加上大部分MCP做得不好,总体来说不是一个很有用的范式。
4.未来预言:个人Agent将重塑80%的App生态
未来,我觉得个人Agent会成为最好的编程伙伴,这是未来的发展方向,它会越来越像我们的操作系统。
现在,我已经为Open Claw添加了子Agent支持和TTY(电传打字机)支持,所以它可以运行Claude Code或Codex。当前的聊天界面可能还只是早期形态,相当于给Agent复制了Google的模式:一个输入框加上一个聊天界面。
这就像电视刚发明时的样子,未来一定会有更好的与模型沟通的方式。
当Agent能够基于全面的上下文提供服务时,大部分单一功能的App将失去存在的必要。
比如,它已经知道我在哪里,就可以根据我的位置推断我可能会做出不好的饮食决定;它可以根据我的睡眠质量或者压力状况来调整我的健身计划;它拥有比任何App都多得多的上下文信息,能够做出更优的决策;它还可以按照我喜欢的方式展示UI。
那我为什么还需要单独的App呢?为什么还要为这些App支付额外的订阅费用?为什么还需要Eight Sleep(一家美国智能睡眠科技公司)的App来控制我的床?我的Agent已经知道我在哪里,还能帮我关掉那些我不用的东西。

未来,个人Agent可能会淘汰80%的App,但同时也会催生新的服务,这将带来巨大的变革性影响。
比如说,我想给我的Agent一笔津贴,比如100块钱,让它帮我解决问题。如果我让它帮我点外卖,它可能会使用某个服务,也可能会使用一个叫"租个人类"的服务。
我不在乎它具体怎么实现,我只在乎问题能否解决。这就为新公司提供了发展空间。也许不是所有App都会消失,有些可能会转型成API。
而且,不管那些App愿不愿意,它们最终都会变成API。因为我的Agent能够弄清楚如何操作我的手机,在Android系统上已经有人在做这件事了。
三、开源坚守与人生启示:
从职业倦怠到热爱重燃
1.开源底线:巨头争夺下的项目独立性
最近我的收件箱里收到了大公司的offer,大家都想约我聊15分钟。其中Meta(元公司)和OpenAI看起来最有趣,现在我还没完全敲定,我的条件是项目保持开源。也许会像Chrome(谷歌)和Chromium(谷歌开源浏览器)的模式。(注:Peter彼得最后选择加入了OpenAI)
我觉得这个项目太重要了,不能交给一家公司变成他们的一部分。
在个人层面上,我从来没在大公司工作过,我很好奇。不管我宣布什么,肯定会有人说"他卖了",但我想告诉大家,项目会继续。
不管最后怎样,如果不行,我就继续做自己的事。我跟他们说我不是为了钱才做的。

别人使用你做的东西是最大的赞美,也说明他们真的在乎。
当然钱是一种好的赞美,但我想要的是乐趣和影响力,这最终决定了我的选择。
我为PSPDFKit(一款PDF软件开发工具包)燃烧了太长时间太亮了。让我倦怠的主要是人的事,比如和联合创始人的分歧、冲突,与客户的高压状况,最终磨垮了我。
幸运的是我们收到了一个很好的offer,把公司带到下一个阶段。我已经花了两年让自己变得可有可无,所以我可以离开了。
然后我坐在屏幕前,感觉就像Austin Powers(电影角色名"奥斯汀·鲍尔斯",此处用作比喻失去能量的状态)被吸走了魔力。一切都没了。我写不出代码了,只是盯着屏幕,感觉空虚,然后我就停了。
我订了一张去马德里的单程票,花了一些时间在那里。我觉得我需要补上生活。
如果你的想法是"拼命工作然后退休",我不推荐。因为"从此享受生活"这个想法虽然吸引人,但实际上,我现在比任何时候都更享受生活。

2.对初学者的启示:以热爱驱动的成长路径
玩是最好的学习方式。如果你心里有个想做的东西,就去做,不需要完美。我做了一大堆自己不用的东西,这不重要,旅程才重要。
我从来没有像现在这样享受构建东西,因为我可以专注于难的部分了。我一直以为我喜欢编程,但实际上我喜欢的是构建。
而且你有一个无限耐心的回答机器。它能在任何复杂度层面解释任何东西。以前我得去Stack Overflow问或者在X上问,两天后也许能得到一个回复。现在你就直接问。就像有了你自己的老师。
如果你想真的学会快速构建软件,就参与开源。不需要是我的项目。要谦虚,也许不要马上发PR,但有很多方式可以帮忙和学习。读代码,待在Discord或其他社区里,理解东西是怎么构建的,所有更细节的东西Agent可以帮忙。
参考资料:
1.《龙虾OpenClaw创始人万字访谈》,企业家杂志。
*文章为作者独立观点,不代表笔记侠立场。
我们深嵌于一个政治、经济、科技、哲学都在经历持续变革和深刻重塑的复杂社会与商业系统之中。
真正的挑战是:我们的认知框架、组织形态和行动工具,还停留在"前AI时代"。
在前所未有的复杂系统性变革中,我们需要的是理解世界底层的"元能力"。
面向AI新时代,笔记侠PPE(哲学、政治学与经济学)课程,正是为理解这样的复杂系统而生:理解国际贸易与经济政策、理解国际政治与治理模式、理解全球技术与科技范式、理解AI哲学和科技经济、理解文明进程与哲学意义。
这是第五代企业家应有的一套"操作系统"。
笔记侠PPE课程26级招生现已启动。驾驭技术、洞察世界、扎根中国、修炼心力,在应对时代重重挑战中寻找决策底牌。
穿越变革的旧世界,找到时代的新大陆,从升级你的PPE决策底层开始。
欢迎你扫描下方海报二维码,添加课程主理人咨询详情。

好文阅读推荐:
"子弹笔记"是笔记侠的矩阵公众号,聚焦职场效率追求、人际关系与高潜成长者,帮你3分钟吃透核心观点和方法论。欢迎关注~
分享、点赞、在看,3连3连!


登录后才可以发布评论哦
打开小程序可以发布评论哦