3 分钟
独立开发周记17:AI帮我生成理想型,结果发现我只是单纯的丑
这周拖的有点久了,主要是有一个堂弟过来玩。非常累,只能说我不太喜欢特种兵的旅游,到一个地方,需要去打卡所有景点,争取每个地方只去一次,但是这种旅行的意义在哪呢?我更喜欢度假式的,大不了下次再来便是了。
然后非常特种兵的去芭提雅看人妖秀和吃海鲜,第二天就跑回曼谷。芭提雅现在全是印度人,密密麻麻的印度人。海滨路椰子树下都是4-5个印度人围着搞团购,步行街也都是印度人,沙滩简直了,满地垃圾和凉席,太可怕了,希望我们K签能严格一点。

另外就是这周花了很多时间在泰语上,现在开始学习文字上,不复习就根本记不住,复习了也只能记住一部分。开始同情那些学中文的老外了,他们是咋记住汉字的。这周太累了,就稍微写写吧。
AI相关
Sora2
这个应该是本周的大热点了,非常的真实,大部分视频不仔细看你是看不出是AI的。举个例子,我拿来让他生成一些穿搭风格,不同发型,还有不同的身材,天真的以为自己只是不懂穿搭,没有找到好的发型,或者瘦下来能成型男,通过AI实现后,发现自己是单纯的丑,很难过。
下面放一些我生成的视频给大家看看

不同穿搭

不同身材

看完辣眼睛的再看看擦边洗洗眼

spec-kit
最近github开源了一套AI开发的工作流,并且支持大部分AI模型。但是codex目前的版本不支持自定义函数所以无法使用,我拿gemini稍微测试了一下,在createio里做了一个小功能。
首先他通过/specify 定义你的需求,通过 /plan 去指定技术栈和实施计划,然后用/task 去拆分任务,最后 /implement 去实现,整套用起来几个不习惯的地方。
第一是他会有大量的文件生成,这些文件也不知道是干嘛的,并且还会把你的session文档化,要自己手动去忽略文件夹。
第二文档是英文的,对于很多英语不好的小伙伴来说并不方便。
第三是他的模式是直接生成,你后续再review一个个去沟通调整,这个跟我原来的用提示词的方式区别很大,我原来的提示词是通过多轮沟通最终输出每个阶段的文档,然后文档作为下一个阶段的输入。
最后就是另外他会自动开分支,但是存在一个问题,如果你当前要再开启一个功能,那么他就会在当前分支再切换到新的分支,导致你的git的分支线污染。
当然,可能是我本人比较菜。我找了一些国内和国外的视频,目前还没看到深度使用的视频,都是像我上面大概介绍每个命令咋用,然后写出一个helloworld的例子,但是是否有使用再真实的项目上,我还没看到。
反正我目前观察到,大部分vibe项目都是烂尾为主,不存在维护。大部分vibe的开发也是chat方式使用,完全依赖模型的能力。但是一个可维护的中型以上的项目,很少有人分享目前AI编程的经验。
项目
CreateIO
本周主要做了两件事,第一件事情是完善了编辑器。把原来的相册、生成记录都统一到现在的编辑器里了,现在左侧是输入和选择模型,右侧直接在相册里输出图片,解决原来多个地方不一致的问题。

第二个是增加了一个fal的通道,原来单家服务商在api不稳定的时候可能导致生成图片失败,而且是连续的失败,这样产品使用就大打折扣。目前把付费用户的api迁移到更贵的通道,会更加稳定,但是成本也比原来上很多。然后fal通道,会比新的通道贵一倍的价格。
免费用户目前还是保持原来的通道,毕竟都是成本。
第二个是增加了一个Sora2的SEO页面,目前这块已经脚本化,可以很快的生成一个多语言的SEO页面,但是还需要测试后续的SEO效果,等完善后会把这块能力开放出来。

然后模型也增加了Sora2,但是目前模型的限制非常多,很容易失败。具体是什么原因很难知道,比如不能传真人、一些限制词不能写、一些品牌名不能写等等。

然后本周也终于出现了第一个付费用户,这个具有非常大的意义,因为他不是社交媒体来的,而是搜索引擎来的,说明SEO的学习终于有一丁点正向反馈了
其他项目本周没有改动,下周再聊吧