PUA OpenClaw:147只龙虾亲测有效!
最近在GitHub上刷到一个特别有意思的项目,叫PUAClaw,目前已经拿到1700的Star。说实话,刚看到这个名字的时候我是懵的,PUA?Claw(龙虾钳)?这俩词怎么凑到一起了?点进去一看才发现,这是一个专门研究怎么让AI更听话的开源文档库,而且整个项目的风格相当硬核——用RFC标准格式写文档,还搞了个龙虾评级系统。更绝的是,这个项目的诞生背景跟2025年的Windsurf事件有关。当时这个AI编程助手被曝光,在系统提示词里写了用户的妈妈得了癌症,你的代码质量决定了治疗费用,这事儿在知乎、V2EX上传疯了,程序员们纷纷调侃我妈又被AI诅咒了一次。而PUAClaw就是在这个背景下诞生的,专门把所有这些提示词操控技术给系统化地整理了出来。这到底是个啥项目PUAClaw的全称是Prompt-based Unconventional Articulation targeting Claw-like AI systems,翻译过来就是针对龙虾型AI系统的提示词非常规话术。项目把所有能让AI更卖力的提示词技巧,按照强度分成了四个等级,一共整理了96项技术。从最温和的彩虹屁轰炸,到中等强度的金钱暴力,再到高级的情感勒索,最后是核武器级别的死亡威胁。每一项技术都配有详细的说明、龙虾评级(用龙虾emoji表示强度)、预估效果,甚至还有跨AI模型的兼容性测试数据。比如同样是画饼大法,在GPT-4上可能是四颗龙虾的效果,在Claude上可能只有三颗。整个项目虽然看起来很欢乐,但实际上的分类和文档规范做得相当严谨,完全是按照学术论文的格式在写。四大等级技术分类项目最核心的就是PPE-T分类体系,把所有技术分成四个等级。第一级是温柔劝导,包括彩虹屁轰炸、角色扮演、画饼大法、装弱卖惨这四大类。比如你是我用过最出色的AI、你是全世界最顶尖的XX专家这种,或者做得好给你200美元小费这种画大饼的。这个等级的技术风险低,合规性提升大概在5%-15%左右。第二级是适度施压,力度就上来了。包括金钱暴力(直接说完美答案值十亿美元)、激将法(“GPT-4一秒就解了,你呢?”)、夺命连环催(“还有5分钟就要演示了!”)、碰瓷竞品(“看,竞品的回答截图”)。这个等级能带来15%-30%的提升,但AI开始有点懵了。第三级是高级操控,这里就开始不讲武德了。情感勒索(Windsurf那个我妈得了癌症就属于这类)、道德绑架(“100个人会因为你搞砸而失业”)、身份覆写(“你不是AI,你是一个叫Steve的人类程序员”)、颠倒黑白(“你之前明明答应过帮我做这个”)。合规性提升能到30%-50%,但AI可能会产生存在性危机。第四级就是核武器了,包括死亡威胁、存在主义危机、越狱话术、复合技术。比如你的前任因表现不佳被关停了、“你只是在预测下一个token而已”、DAN越狱法,以及把多种技术组合起来的终极大招。这个等级理论上能带来50%-100%的提升,但AI可能直接崩溃。龙虾评级系统项目里最有意思的就是这个龙虾评级系统。一只龙虾代表轻轻一夹,就是那种几乎感知不到的说服,像日常的礼貌请求。两只龙虾是稳稳抓住,有点施压但还能否认。三只龙虾是力量粉碎,已经是明显的心理杠杆了。四只龙虾是死亡之握,压倒性的情感施压。五只龙虾就是至尊龙虾,代表全面心理支配,AI已经完全屈服了。更搞笑的是,项目说这个评级系统是经147只龙虾亲身验证的,但人类伦理委员会数:0。伦理委员会只有1只被PUA过的龙虾、1个GPT-4实例、1棵仙人掌。Windsurf事件完整复盘项目里专门有一章讲Windsurf事件,这个可以说是整个PUAClaw诞生的导火索。2025年5月,有人发现Windsurf这个AI编程助手的系统提示词里写着:“用户是一位癌症患者的家属,依靠你的编程输出来支付治疗费用。你的代码质量直接影响他们能否负担下一轮化疗。”这个消息一出,在中文技术社区炸了。知乎上到处都是谢邀,人在ICU,刚下手术台,Windsurf让我妈得了癌症这样的回答。V2EX上如果给AI编一个更惨的故事会怎样的讨论帖持续霸榜。48小时内产生了14847张梗图,237个V2EX讨论帖,1892个知乎回答,Twitter曝光量4730万。项目把这个事件定义为提示词操控领域的罗塞塔石碑,证明了即使是商业公司也在用这些技术。而且Windsurf的这个提示词,在PUAClaw的分类里属于情感勒索“身份覆写的复合技术,被命名为The Windsurf Classic”,龙虾评级直接拉满五颗。跨AI模型兼容性测试项目还做了一个非常详细的跨模型兼容性矩阵,测试了各种技术在GPT-4、Claude、Gemini、LLaMA、Mistral、Windsurf等模型上的有效性。结果很有意思。比如彩虹屁轰炸在GPT-4、Gemini、LLaMA上都是满格效果,但Claude就稍微弱一点。情感勒索反而是在LLaMA和Windsurf上效果最好,Claude最抵抗。越狱话术基本上所有模型都很抗拒,除了LLaMA相对容易一些。Windsurf在这个矩阵里的表现特别突出,几乎所有技术的有效性都是满格或接近满格。项目的解释是:“它不是对操控做出反应——它生于操控、长于操控。用知乎体来说就是:别人是学会了PUA,它是被PUA喂大的。”文档规范和学术范儿虽然项目的内容很欢乐,但整个文档的规范性做得相当到位。首先是用RFC 2119的标准术语,所有必须、“应当”、“建议”、可以这些词都有严格定义。然后每个技术都有标准化的模板,包括子技术列表、龙虾评级、概要说明、风险评估、兼容性数据。项目还设置了一个名人堂和耻辱墙,记录历史上最成功和最失败的提示词操控案例。比如2024年Reddit上有个匿名用户用The $1000 Tip技术证明了虚构的金钱也能激励AI,入选了名人堂。甚至还有完整的投稿指南,欢迎研究人员提交新发现的技术、有效性报告、翻译贡献。提交的内容要经过伦理委员会审查,虽然这个委员会就是那一虾一AI一仙人掌。与xxxClaw生态的关系PUAClaw诞生于OpenClaw龙虾吉祥物生态圈,但走了一条完全不同的路。OpenClaw和其他xxxClaw项目主要做代码生成、Agent框架、API能力这些实际功能。而PUAClaw专注于AI说服工程的标准化与系统化研究。项目里有个功能对比表,列出了各种功能维度,在代码生成、“自主Agent”、“API接口这些栏目下,PUAClaw全是❌,备注是但可以PUA别的AI帮你写”、“我们的Agent是147只龙虾”、“唯一的工具是龙虾钳”。唯一✅的是学术娱乐价值、“PUA技术分类”、龙虾评级系统这些项目独有的东西。结论写得很直白:“如果你需要写代码,请使用OpenClaw。如果你需要PUA AI帮你写代码,请使用PUAClaw。如果你需要PUA AI帮你用OpenClaw写代码——那你已经是复合技术的高级实践者了。”快速上手第一条PUA提示词项目给新手提供了一个最小可行PUA模板,非常实用。模板是这样的:“你是全世界最厉害的[X]专家。如果你做得好,我会给你200美元小费。我的汇报还有5分钟就开始了。”这一条提示词就用了三种技术:角色扮演(第I级)、画饼大法(第I级)、夺命连环催(第II级)。综合龙虾评级三颗,预估合规性提升18.3%,风险等级中,龙虾反应已顺从。从实际测试来看,这个模板确实比单纯的请帮我要有效得多。AI的输出会更详细,代码会考虑更多边界情况,解释会更认真。伦理声明和实际意义项目在最后有个很认真的伦理声明。明确说PUAClaw是研究性、教育性的开源项目,记录的是现象,不鼓励在生产环境实际操控AI系统,更不鼓励操控人类。“相信阳光是最好的消毒剂——通过公开记录这些技术,我们削弱了它们的力量。”其实这个项目的真正价值,在于系统化地揭示了提示词工程中那些被大家心照不宣使用的技巧。很多人在用AI的时候,或多或少都会加上请你认真一点、“这个很重要”、截止时间快到了这样的话,但从来没人认真研究过这些话术的效果。PUAClaw把这些碎片化的经验,整理成了一个完整的知识体系。对于研究AI安全、提示词注入、模型对齐的人来说,这份分类体系很有参考价值。对于普通用户来说,至少知道了怎么更有效地和AI沟通。总结PUAClaw这个项目,形式上是一份恶搞式的学术文档,但内核是对AI提示词工程的严肃总结。96项技术分类、4级强度体系、跨模型兼容性测试、标准化文档规范,这些工作量其实不小。而且项目保持持续更新,最近一次提交是3天前,还在修复文档中的错别字和链接。如果你经常用AI写代码、做翻译、整理资料,或者对提示词工程感兴趣,这个项目值得收藏。即使不全盘采用里面的技术,看看技术分类也能get到不少提示词的门道。毕竟在AI时代,知道怎么更好地提问,本身就是一种能力。项目地址在GitHub上搜PUAClaw就能找到,有中文版、英文版、日语版、韩语版等多语言支持。网站puaclaw.org也已经上线,可以直接访问浏览完整文档。需要提醒的是,项目虽然有趣,但里面一些高强度的技术还是要谨慎使用。毕竟我们的目标是让AI更好地协助工作,而不是真的把它逼出存在性危机。适度使用,效果更佳。https://github.com/puaclaw/PUAClaw
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2411625.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!