5 分钟
AI实战笔记1:AI编程不是噱头,是你该掌握的新生产力工具
其实之前一直写一篇关于vibe coding的文章,但是之前已经新产品一直在迭代没问题就没太多时间来写。这篇文章主要是把最近一段时间的vibe coding的经验总结一下。
在开始前我讲一下我对vibe coding的看法,网上其实我看到很多做技术的都非常排斥vibe coding,觉得AI写的代码非常混乱,一堆乱七八糟的问题,根本无法运行。我不反对这种说法,就目前来说,AI确实无法像人类一样去思考,毕竟存在上下文的限制,所以很可能写出来的东西会变成维护越来越混乱。
最经典的说法就是,以前是人工拉屎,不断堆积屎山,现在是直接粪车拉过来堆积。我并不反对这种说法,工具的本质是提效,但是如果之前就是创造垃圾,那么提高效率后就当然会创造更多的垃圾。还有另外一种就是,不懂代码1小时创造XX APP,然后赚到XX钱,接着卖教程。我刷小红书经常能刷到某补光灯的例子,里面的电子书卖了不少钱。
同样的东西给到不同的人就有不同的定价,无论好还是坏,我对AI的看法是:“不要做时代的洗衣工”。洗衣机出现之后再坚持手洗衣服意义不大,基本上上能解决80-90%的问题。当然你要觉得洗不干净要坚持手洗,也没问题,无非就是一个ROI的选择问题。
vibe coding
目前很火的一个说法是“气氛编程”,大概就是你不需要懂代码,你通过自然语言随心所欲的对话然后就能创造出你的产品。但是这里其实是一个相对的伪命题,因为AI目前对意图和语境的理解程度受限于上下文。比如你在一家企业上班,可能需要跟不同的部门对接,很多业务的知识你是要入职都慢慢熟悉才会懂得,这点上注定了AI无法取代人,AI永远需要操作员,这也是为什么很多公司喜欢建立一些闲聊区,这样员工之间可以闲聊的过程中产生一些优化也好,新的创意也好。
当然AI也并不是那么没用,比如你丢给一个实习生一堆文档,很大概率这些文档他只能记得1%,但是AI会完全阅读完,这就是区别。
这里我先说一个结论,就是不懂技术的话无法做可持续性的产品。除非你不会再对产品迭代,比如做一些一次性的产品且功能不会有迭代,这种就很适合你不需要懂太多。我在推特上看到很多非技术人员开始使用一些AI Coding的工具,无一例外最后做得好的都开始学习技术,比如最基本的学习如何使用git。
模型篇
首先我先说一个结论,就是暂时不需要考虑Gemini、Chatgpt、Claude外的任何一个大模型,我知道现在很多大模型也很厉害,但是真没必要浪费时间去学习怎么让他变得更好。就像你买安卓和iphone一样,我看到很多人说安卓电池啊,AI功能等等,我本身也做过很多年安卓开发,如果安卓要变得好用,比如装一些功能限制乱授权,应用多开,广告拦截啥的。但是他需要你花费大量精力,比如学习刷机、root等很多专业知识,对于大部分人,我的建议是用最少的精力解决80%的需求。
Chatgpt(主要用来讨论想法和构思)
比如说4o能快速回复响应,o3带思考功能,4.5适合做研究什么的。但是对于大部分人来说,要理解他们的区别太困难了。所以直接用简易的方式,就是先跟4o聊,解决不了就换o3,还不行就上4.5。
因为gpt有了一些记忆功能,所以你跟他聊的话结果会更加适合你当前正在做的事情,而不是像抽卡一样。这样就导致他非常适合来聊构思,我常规的做法是我想做个什么产品,或者给我的产品加一个什么功能都会跟他聊,直到确定了大致的思路和框架。
Gemini(设计与分析)
我们这里主要说Pro,得益于他的超长上下文,所以你把跟GPT聊的结果复制过来,让他做细化和详细的方案设计,然后你跟他沟通知道完善方案和任务拆分。有时候一些很难排查的bug,或者设计缺陷或者其他可以使用Gemini去分析,然后制定修复方案
Claude(实行)
编码能力基本上是垄断的,编码的话不用考虑其他任何模型。如果希望出来的结果更加符合你的设想,你可以给到更具体的任务让他进行实行,比如1做什么,2做什么之类的。
工具篇
网上有很多教程和工具,这里我就主要提一下我现在常用的。
cursor
因为之前用lenny送了1年的使用,就一直在使用。cursor主要是用来做commit和分析,现在让他写代码已经比较少了。目前用的比较多的是使用它的Gemini-Pro-2.5来做技术方案和任务拆分,因为长上下文,所以很容易对整个项目进行读取和分析,然后利用好提示词输出我们想要的方案和任务,再丢给Claude进行开发。
Claude Code
cursor目前用的比较少的原因是因为Claude Code,Claude Code相信大家都看到网上吹的天花乱坠,但是你也能看到网上说关于降智的吐槽,Claude Code经典回复就是“你说得对”。其实最重要的原因是你不用考虑token,因为他现在在烧钱抢用户。比如说我就订阅了100刀的套餐,但是这个月我已经花了将近1000刀的token,之前还有看到还有花200刀用了2万刀token的新闻,导致他开始做很多限制,反正越早用效果越好。
其次,不要用任何中转服务,比如说一些网站会有一些共享号,中转的问题在于不稳定。服务商用200u去薅2万u的token,对于ai大模型的厂商来说,风控到就封号。这样就导致服务商号池里的号不一定能及时供应上,你就一直报错。尽量想办法用官方的,不行的话再考虑第三方。
经验篇
其实前面已经说了一些,这里讲一下实际过程中使用的一些技巧。
如何让UI更加美观
去dribbble这种设计网站下载一些你想要的风格图片,然后把图片丢给Claude,告诉他根据风格转换成json文件。后续迭代的过程中就引入这个json文件,他就会按照你想要的风格计划,但是也不完全每次都那么精准,所以你发现后可以再引用已经实现的页面,让他参考json和已实现页面进行优化
AI陷入死循环
有时候AI会在一个问题上反复的来回改,有点像钻牛角尖。这个时候你看你上下文长度,如果不够的话,你跟他说:“把我们前面的对话总结一下,我需要让另外一个AI来接手你的工作”,接着开启新聊天,把总结的信息和你调整的其他信息一起作为新的上下文给入。
如果上下文有更多的长度,那么你就可以说:”目前这个方案修改有问题,你换个思路思考,给我另外一个方案“
长任务实现出来无法运行
这种情况一般是随着他编写的时长和不断总结信息失真导致的,这种情况应该我们要帮他拆任务,可以参考我前面说的,用Gemini去拆解任务,然后实现的时候一个个告诉他,实现完后让他询问你是否执行下一个任务。
提示词增强
通常我们用自然语言输入后,并不能产出我们满意的结果。这个时候可以把你的语言丢给另外一个AI(比如chatgpt),然后跟他说我们希望让另外一个AI进行实现,你帮我优化提一下我的提示词,让他实现更加精准,然后gpt给你优化后再丢给Claude,你会发现效果很不错
仔细思考和计划
有时候我们并不能经常都是先A再B再C,就像传统我们工作一样,开会出prd,技术方案,拆分任务,实行,测试上线等等。所以这里给一个最简化的说法,你在让Claude Code执行的时候说:“仔细思考xxx,并制定计划和详细的测试覆盖”,这样AI的实现会主动触发Thinking模式和Plan模式,然后也会写测试用例覆盖
编写提示词
有些功能我们完全可以用固定的提示词来达成效果,比如说我写代码的风格、技术方案的讨论、任务的拆分,我们可以把需求给到gpt,让他帮我写提示词,然后复制提示词到输入框后,接着自己再输入自然语言,这样出来就能达到我们想要的效果了
其他
现在网上很多都是每出一个产品和模型,就吹上天替代xx,实际上他们可能并没有使用过,只是拿来做了一个非常简单的评测,对于我们来说,我们希望是一款实际上使用可以顺手的产品。所以打算开多一个合集,用来写一些日常AI相关的一些产品使用经验和介绍。