龙虾创始人最新访谈：一场大变革，已经挡不住了！

内容来源：2026年2月12日，Peter Steinberger在Lex Fridman播客内容分享。

分享嘉宾：Peter Steinberger彼得·斯坦伯格，奥地利程序员，OpenClaw开源项目创始人。

高级笔记达人丨天朗明月

责编 | 柒排版 | 拾零

第 9494 篇深度好文：8726 字 | 22 分钟阅读

商业趋势

笔记君说：

最近，整个科技圈都在热议一只"龙虾"。它不是海鲜，而是2026年开年现象级的开源AI项目——OpenClaw（养龙虾）。

短短几天，它在GitHub上狂揽18万星，创下增长纪录。但它的创始人Peter Steinberger却轻描淡写：这只是一个"实验项目"。

一边是席卷全球的热度，一边是创始人冷静的定位，这种反差背后，到底藏着怎样的颠覆性力量？

从一小时做出的原型，到让扎克伯格、奥特曼亲自体验并争相招揽，OpenClaw究竟做对了什么？

今天，我们整理了Peter彼得在Lex Fridman（莱克斯·弗里德曼）播客中的三小时深度对话。

你将看到：一个曾卖掉十亿级公司的"bunout"（职业倦怠）程序员，如何重拾热爱，亲手点燃这场AI Agent（智能体）革命；他将分享"自修改软件"的魔法、与加密货币投机者抢注账号的"血泪史"，以及对"80%的App将消亡"的大胆预言。

这不仅仅是一个产品的成功故事，更是一场关于技术哲学、创业心态与未来人机协作的深刻思考。

无论你是开发者、创业者，还是对未来感到好奇的普通人，都能从中获得启发。

一、OpenClaw的诞生：

从一小时原型到现象级开源项目

1.魔法时刻：一条语音消息触发的AI交互革命

我从去年四月份就想要一个AI个人助手。比如，把我所有的WhatsApp（类似微信的即时通讯应用）数据拉出来，然后进行查询。

那时候我们有GPT-4.1，它带有一百万上下文窗口。我把所有数据导进去，然后问它一些问题，比如""这段友谊的意义是什么？"，得到了一些非常深刻的结果。我把结果发给朋友们，他们都感动得眼眶湿润了。

那个时候，我就已经感受到AI交互的潜力。但后来我想，所有的实验室都会做这个，所以我就去做别的事了。

比如Viptunnel（某项目名称），这是一个周末黑客项目。那时候还是Claude Code（由AI驱动的编程工具）时代，项目处于早期实验和玩耍阶段。

那个时候，我有WhatsApp的实验，也有Viptunnel的实验，但两个都感觉不是正确答案。后来我想到，直接把WhatsApp连接到Claude Code，一步到位。

当CLI（命令行界面）消息进来时，我用"-p"参数调用CLI，它施展魔法后返回字符串，再发回WhatsApp。这个功能我只用一个小时就做出来了。当时感觉已经很酷了，就像"哦，我可以跟我的电脑说话了"。

但我还想要图片支持，因为我经常在prompt（提示词）里使用图片。我觉得这是给Agent提供更多上下文的一种非常高效的方式，Agent很擅长理解我的意思，即使是一张奇怪的裁剪截图。所以我大量使用图片，也想在WhatsApp里实现这个功能。

你知道的，当你走在路上看到一个活动海报，截个图让它帮忙看看你是否有时间参加、活动好不好、朋友们是否有兴趣，图片在这种场景下非常重要。因此，我又花了几个小时才把这个功能搞定。

之后我就开始大量使用它。有趣的是，那正好是我和朋友们去马拉喀什过生日旅行之前。在那里它甚至更好用，因为网络虽然有点不稳定，但WhatsApp总能正常发送消息，它在这方面做得真的很好。

所以我在旅行中用了很多次，让它帮我翻译内容、解释问题、查找地点，就像有一个帮你使用Google的助手。虽然基本上还没有真正构建完整功能，但已经能做这么多事了。

那种体验有种难以用语言表达的魔力。用聊天客户端跟Agent对话，和坐在电脑前用Cursor（代码编辑器）或者在终端里用Claude Code和CLI是完全不同的体验。

能靠在椅子上跟它说话，这看似是一个很小的步骤，但在某种意义上，这是AI融入生活方式的一个相变，感受完全不一样。

有人说「这里面没有什么魔法，它就是做了这个、那个、还有那个」。而且感觉这几乎像个爱好，就像Cursor或Perplexity（一款AI搜索引擎）的功能模块一样。

我想是的，有时候重新排列组合、再加入几个新想法，就是你所需要的全部魔法了。这类创新往往是之前没人做到，之后又让人觉得如此显而易见。

真正让我看到未来可能性的，是一次意外的发现。

在大量使用这个工具之后，有一次我发了一条消息，只是一个随机问题："嘿，这家餐厅怎么样？"

然后屏幕上出现了"正在输入"的提示。我心想：等等，我没做这个功能啊，它原本只支持图片，到底在干什么？接着它就给出了回复。

我们当时正在城里四处逛。我用它时完全没多想，因为有时候赶时间打字很麻烦，所以就发了语音消息，没想到它居然直接处理了。我当时就说："嘿！这家伙是怎么做到的？"

然后它告诉我：

"是的，这个疯狂的家伙做了以下事情：他给我发了一条消息，但只是一个没有文件扩展名的文件。于是我检查了文件头，发现它是Opus（音频编码）格式，就用ffmpeg（音视频处理技术）进行了转换。我本想使用Whisper（音频处理工具），但发现没有安装，不过找到了OpenAI的API key（密钥），于是直接用Curl（命令行工具）把文件发给OpenAI进行转录，才有了现在的回复。"

我看着这条消息，不禁感叹："哇哦。"要知道，你没有教它任何这些操作，Agent却自己弄明白了，完成了所有的转换和翻译步骤。它自己找到了API，自己决定使用哪个程序，这一切都是自主完成的。

而你只是不经意地发了一条语音消息，它就给出了回复，而且处理方式非常聪明。因为如果走Whisper本地路径，需要下载模型，速度会很慢。

所以这背后体现了丰富的世界知识和创造性解决问题的能力。当它面对"这是什么没有扩展名的文件？"这样的问题时，会主动去弄清楚。那个时刻让我顿悟了，我被深深打动了。

2.成功密码：开源创新与"玩"出来的颠覆力

OpenClaw的成功源于将开发过程变成了一场充满乐趣的探索，感觉就像是在玩无限版的Factorio（一款工厂建设游戏），建造属于自己的小游乐场。

我从来没有像构建这个项目一样开心过。你看，一级Agent循环，我能做什么？怎么巧妙地排队消息？怎么让它更像人？

我有了一个想法，因为循环里Agent总是会回复一些东西，但在群聊里你不一定总想让Agent回复。所以我给了它一个不回复的选项。所以它可以选择闭嘴，这样感觉更自然。

然后是记忆，你想让它记住东西。终极Boss可能是持续强化学习，但我觉得我现在大概在第二三级，用Markdown文件和向量数据库。然后你还能升级社区管理、网站和营销。

很多人都喜欢问我一个问题：如果看2025年，那么多创业公司、那么多公司都在做Agent类的东西，或者声称在做。然后OpenClaw横空出世把所有人都干翻了。

为什么是OpenClaw赢了？我认为，因为他们都太把自己当回事了。

事实上，你很难和一个只是来玩的人竞争。我想让它有趣，我想让它古怪。如果你看到网上所有那些龙虾的东西，我觉得我做到了古怪。

很长时间以来，安装它的唯一方式就是gitclone（克隆）、pnpmbuild（编译）、pnpmgateway（运行），也就是通过git克隆代码库、使用pnpm进行构建、以及通过pnpm配置网关的操作流程。

然后Agent非常有自我意识。它知道自己的源代码是什么，理解自己是怎么运行的，知道文档在哪里，知道自己跑的是哪个模型，知道你是否开了语音或推理模式。

我想让它更像人，所以它理解自己的系统，这使得Agent很容易就能你什么都不用做，你用prompt（提示词）把它召唤出来，然后它就会修改自己的软件。

所以，这种趣味性、开源特性以及自修改能力，极大地降低了用户的参与门槛。我想，这正是它能够在众多Agent类项目中脱颖而出的关键。

二、技术哲学与未来展望：

自修改软件与App消亡预言

1.技术内核：自修改能力与开发范式革新① 自修改软件：让AI自主进化的底层逻辑

自修改软件，大部分是Codex（OpenAI开发的AI代码生成模型和编程助手）构建的，但很多时候我在调试时会大量使用自省。

比如"嘿，你能看到什么工具？你能自己调用这个工具吗？"或者"你看到了什么错误？读一下源代码，搞清楚问题出在哪里。"

我觉得这是一种非常有趣的方式，Agent用来调试自身，所以它很自然地让每个人都能这样做。它带来了很多从没写过代码的人提交的PR，我最后把它们叫做"prompt Requests"（提示请求）而不是"Pull Requests"（拉取请求）。

但我不想贬低这件事，因为每次有人提交了他们的第一个PR，对我们的社会来说都是一个胜利。不管它有多粗糙，你总得从某个地方开始。

我知道有很多人抱怨开源的PR质量，那是另一个层面的问题。但在另一个层面上，我觉得非常有意义的是，我做了一个东西，人们喜欢它到愿意去学习开源是怎么运作的。以前进入这个门槛太高了，而有了Agent和合适的软件，门槛一路降低。

此外，我还组织了另一种聚会，我叫它Cloud Code Anonymous（云代码匿名会），现在改叫Agents Anonymous（Agent 匿名会），让你知道灵感来源。

② 开发工作流：从工具革新到思维转变

首先是在工具层面。

第一，是Claude Code。我的第一个接触点是Claude Code，四月份，不太好但还行。这种突然在终端里工作的范式转变很清新，但我还是很需要IDE（集成开发环境）因为它还不够好。然后我大量实验Cursor，不太喜欢很难开多个实例。

最终我回到了Claude Code作为主要工具。到了某个时候我有大概七个订阅，每天用完一个，因为我已经非常习惯同时开多个窗口并行工作了。

第二，是diff（差异对比工具）查看器。我用IDE非常少，主要用一个diff

查看器。我越来越习惯不读所有代码了，不读无聊的部分，因为大部分软件就是数据进来，从一种形状变成另一种形状，存到数据库里，取出来展示给用户。

第三，是Agentic Engineering。

在我的一篇博客里有个图叫"Agentic编程曲线"：X轴是时间，Y轴是复杂度。左边是"请修复这个"的简短prompt（提示词）。中间是超级复杂的八个Agent、复杂编排、多工作区、Agent链、自定义子Agent工作流、18个slash命令、大型全栈功能。

然后精英级别是随着时间你又回到了禅意的短prompt（提示词）："嘿，看看这些文件然后做这些修改"。

我其实叫它Agentic陷阱。很多人第一次接触然后开始Vibe Coding（氛围编码方式）。我其实觉得Vibe Coding是个贬义词。我更喜欢Agentic Engineering（智能体工程），我跟别人说我做 Agentic Engineering。

总之，人们开始尝试这些工具，有建设者心态的人会非常兴奋。但你得去玩它，就像你得先玩吉他才能弹出好听的音乐。不是摸一次就能行云流水。这是一种需要学习的技能。

其次是在思维认知层面。

第一，你得稍微学习Agent的语言，理解它们哪里擅长哪里需要帮助。

你得考虑Codex或Claude怎么看你的代码库。它们每次开启新会话的时候对你的项目一无所知。你的项目可能有十万行代码。所以你得帮Agent一点，记住上下文大小是个限制，引导它们看该看的地方。这通常不需要很多工作，但考虑它们的视角是有帮助的。

听起来很奇怪，它又不是活的。但它们每次都从零开始。我有系统理解，所以用几个指引我就能马上告诉它"嘿，要改这里，你需要考虑这个、这个和这个"。

然后它们会去找和看，它们对项目的理解永远不完整，因为全部塞不进去。所以你得引导它们看哪里以及怎么处理问题。

第二，有些小技巧有时候很有用，比如"不着急，慢慢来"。

听起来很蠢，但这是一个非直觉的东西。就像我写代码进入心流时，如果架构不对会感到摩擦。prompt（提示词）的时候也一样，如果什么东西花了太长时间，也许是我思路有问题，也许是架构上的误解。你随时可以按Escape（退出键）停下来，看看问题在哪里。

你得像和一个非常能干的工程师讨论一样。但也不要把你的世界观强加给它。让Agent做它擅长的事情，它可能有更好的想法。

所以有一定程度的接受是必要的：代码不会完美，我会做得不一样，但这是一个可用的方案，将来如果真的太慢或有问题，我们随时可以重做。

2.模型对比：Opus与Codex的差异化应用

目前两个大的竞争者，Claude Opus4.6（克劳德·奥普斯4.6版本）和通过Codex使用的GPT-5（OpenAI专门给Agent编程优化）这两个模型，我有很多话要说。

首先，在通用模型方面，Opus是最好的。

对于OpenClaw，Opus在角色扮演方面非常出色，真的能进入你给它的角色。它在遵循指令方面从很差变到了很好，取得了很大进步。它通常很快就会尝试做事，更倾向于试错。用起来很舒服。总的来说，Opus有点像是太美国了。

你也知道Codex团队很多人是欧洲人，所以也许这不只是巧合。但Anthropic（人工智能公司）也修了一些。Opus以前会一直说"你说得完全对"，这已经成了一个梗。我现在听到这句话就受不了，不是在开玩笑。

其次，模型之间存在差异。

Opus像那个有点傻但很有趣的同事，你把他留在身边。而Codex像角落里你不想搭话的怪人，但很靠谱，能把事情做完。

归根结底，如果你是一个熟练的驾驶员，你可以用任何最新一代的模型得到好结果。

我更喜欢Codex，因为它不需要那么多表演。它默认就会读大量代码。而Opus你得推它更用力，因为它就像"我能开干了吗？我能开干了吗？"然后它就飞速跑出去了，给你一个非常局部的解决方案。

我觉得区别在后训练，不是原始模型智能差多少。只是它们被给予了不同的目标。没有哪个模型在所有方面都更好。

最后，代码质量方面，Opus略高一筹。

果驾驭得好，Opus有时候甚至能给出更优雅的解决方案。但需要更多技巧。用Cloud Code并行开很多会话更难，因为它更交互式。而Codex更像是你先讨论，然后它消失20分钟。它可以非常非常持久地工作直到搞定。如果有一个明确的目标，模型会非常努力地达到那里。

最终它们需要差不多的时间，但Claude方面更多是试错，Codex有时候会想太多。我更喜欢那种干巴巴的、我不需要读太多的版本。

3.架构选择：Skills+CLI（命令行界面）优于MCP的实践

半年前所有人都在谈论MCP（模型上下文协议），而我说"MCP算了吧，每个MCP不如做成一个CLI"。现在这个项目甚至没有MCP支持（严格来说有，但不在核心层），没人抱怨。

我的方法是，如果你想用更多功能扩展模型，你就做一个CLI（命令行界面），模型可以调用那个CLI（命令行界面）。它可能第一次搞错，调用帮助菜单，然后按需加载到上下文中它需要的东西。它只需要一句话知道这个CLI（命令行界面）存在。

Skills（人工智能技能）其实就很完美：一句话解释这个Skill，模型加载这个Skill，Skill解释了CLI（命令行界面），模型使用CLI。

所以，MCP对比Skills，MCP基本上要死了。MCP是更结构化的东西，一种与API、数据库、服务、文件通信的协议。Skills更多是「我应该怎么工作」，是流程、辅助脚本和prompt（提示词），通常用半结构化的自然语言写的。如果模型足够聪明，Skills技术上可以替代MCP。

事实上，我觉得主要的美妙之处在于模型非常擅长调用Unix（操作系统）命令。所以你加另一个CLI就只是加了另一个Unix命令。而MCP需要在训练中添加，不是模型天然的东西，需要非常特定的语法，最大的问题是不可组合。

比如我有一个天气服务返回温度、降雨、风力等一大堆数据。作为模型，我总是得把整个大blob（数据块）拿回来，用它填满我的上下文，然后挑我要的。没有办法让模型自然地过滤，除非我主动在MCP里加过滤功能。

但如果我做成CLI（命令行界面），模型可以加一个jq（Linux中用于JSON数据处理的轻量级命令行工具）命令自己过滤，只拿它需要的。甚至可以组合成脚本做计算，只给我精确的输出，上下文零污染。

当然你可以用子Agent之类的解决，但那都是变通方案。

MCP推动了很多公司去做API，这是好的，但是MCP默认污染你的上下文，加上大部分MCP做得不好，总体来说不是一个很有用的范式。

4.未来预言：个人Agent将重塑80%的App生态

未来，我觉得个人Agent会成为最好的编程伙伴，这是未来的发展方向，它会越来越像我们的操作系统。

现在，我已经为Open Claw添加了子Agent支持和TTY（电传打字机）支持，所以它可以运行Claude Code或Codex。当前的聊天界面可能还只是早期形态，相当于给Agent复制了Google的模式：一个输入框加上一个聊天界面。

这就像电视刚发明时的样子，未来一定会有更好的与模型沟通的方式。

当Agent能够基于全面的上下文提供服务时，大部分单一功能的App将失去存在的必要。

比如，它已经知道我在哪里，就可以根据我的位置推断我可能会做出不好的饮食决定；它可以根据我的睡眠质量或者压力状况来调整我的健身计划；它拥有比任何App都多得多的上下文信息，能够做出更优的决策；它还可以按照我喜欢的方式展示UI。

那我为什么还需要单独的App呢？为什么还要为这些App支付额外的订阅费用？为什么还需要Eight Sleep（一家美国智能睡眠科技公司）的App来控制我的床？我的Agent已经知道我在哪里，还能帮我关掉那些我不用的东西。

未来，个人Agent可能会淘汰80%的App，但同时也会催生新的服务，这将带来巨大的变革性影响。

比如说，我想给我的Agent一笔津贴，比如100块钱，让它帮我解决问题。如果我让它帮我点外卖，它可能会使用某个服务，也可能会使用一个叫"租个人类"的服务。

我不在乎它具体怎么实现，我只在乎问题能否解决。这就为新公司提供了发展空间。也许不是所有App都会消失，有些可能会转型成API。

而且，不管那些App愿不愿意，它们最终都会变成API。因为我的Agent能够弄清楚如何操作我的手机，在Android系统上已经有人在做这件事了。

三、开源坚守与人生启示：

从职业倦怠到热爱重燃

1.开源底线：巨头争夺下的项目独立性

最近我的收件箱里收到了大公司的offer，大家都想约我聊15分钟。其中Meta（元公司）和OpenAI看起来最有趣，现在我还没完全敲定，我的条件是项目保持开源。也许会像Chrome（谷歌）和Chromium（谷歌开源浏览器）的模式。(注：Peter彼得最后选择加入了OpenAI）

我觉得这个项目太重要了，不能交给一家公司变成他们的一部分。

在个人层面上，我从来没在大公司工作过，我很好奇。不管我宣布什么，肯定会有人说"他卖了"，但我想告诉大家，项目会继续。

不管最后怎样，如果不行，我就继续做自己的事。我跟他们说我不是为了钱才做的。

别人使用你做的东西是最大的赞美，也说明他们真的在乎。

当然钱是一种好的赞美，但我想要的是乐趣和影响力，这最终决定了我的选择。

我为PSPDFKit（一款PDF软件开发工具包）燃烧了太长时间太亮了。让我倦怠的主要是人的事，比如和联合创始人的分歧、冲突，与客户的高压状况，最终磨垮了我。

幸运的是我们收到了一个很好的offer，把公司带到下一个阶段。我已经花了两年让自己变得可有可无，所以我可以离开了。

然后我坐在屏幕前，感觉就像Austin Powers（电影角色名"奥斯汀·鲍尔斯"，此处用作比喻失去能量的状态）被吸走了魔力。一切都没了。我写不出代码了，只是盯着屏幕，感觉空虚，然后我就停了。

我订了一张去马德里的单程票，花了一些时间在那里。我觉得我需要补上生活。

如果你的想法是"拼命工作然后退休"，我不推荐。因为"从此享受生活"这个想法虽然吸引人，但实际上，我现在比任何时候都更享受生活。

2.对初学者的启示：以热爱驱动的成长路径

玩是最好的学习方式。如果你心里有个想做的东西，就去做，不需要完美。我做了一大堆自己不用的东西，这不重要，旅程才重要。

我从来没有像现在这样享受构建东西，因为我可以专注于难的部分了。我一直以为我喜欢编程，但实际上我喜欢的是构建。

而且你有一个无限耐心的回答机器。它能在任何复杂度层面解释任何东西。以前我得去Stack Overflow问或者在X上问，两天后也许能得到一个回复。现在你就直接问。就像有了你自己的老师。

如果你想真的学会快速构建软件，就参与开源。不需要是我的项目。要谦虚，也许不要马上发PR，但有很多方式可以帮忙和学习。读代码，待在Discord或其他社区里，理解东西是怎么构建的，所有更细节的东西Agent可以帮忙。

参考资料：

1.《龙虾OpenClaw创始人万字访谈》，企业家杂志。

*文章为作者独立观点，不代表笔记侠立场。

我们深嵌于一个政治、经济、科技、哲学都在经历持续变革和深刻重塑的复杂社会与商业系统之中。

真正的挑战是：我们的认知框架、组织形态和行动工具，还停留在"前AI时代"。

在前所未有的复杂系统性变革中，我们需要的是理解世界底层的"元能力"。

面向AI新时代，笔记侠PPE（哲学、政治学与经济学）课程，正是为理解这样的复杂系统而生：理解国际贸易与经济政策、理解国际政治与治理模式、理解全球技术与科技范式、理解AI哲学和科技经济、理解文明进程与哲学意义。

这是第五代企业家应有的一套"操作系统"。

笔记侠PPE课程26级招生现已启动。驾驭技术、洞察世界、扎根中国、修炼心力，在应对时代重重挑战中寻找决策底牌。

穿越变革的旧世界，找到时代的新大陆，从升级你的PPE决策底层开始。

欢迎你扫描下方海报二维码，添加课程主理人咨询详情。

好文阅读推荐：

用好AI，1年顶10年

2026，你的工作方式，该变了！

"子弹笔记"是笔记侠的矩阵公众号，聚焦职场效率追求、人际关系与高潜成长者，帮你3分钟吃透核心观点和方法论。欢迎关注～

分享、点赞、在看，3连3连！

宙世代

一起剪

相关标签