(再次插入广告)我用AI制作的网页:户晨风数字纪念馆
赛博户子(户晨风机器人) 是一个苹果级别的项目,让你的ESP32设备变户晨风本人,OpenClaw负责从物理层操纵Macmini来对“固件”或“服务”做出调试或修改。你只需动动嘴,一个声音几乎完美还原,能讲“苹果安卓论”的AI户子就诞生了~~

有一些朋友可能很好奇,它到底是怎么做的,有什么坑有什么难点,在这里简单写一下……其实,你只需要购买相应的硬件,再不断向AI提供所需的教程链接,完全让AI来学习如何制作就可以了,整个流程你只需要用自然语言来发号施令、指明方向。
(以下内容包括语音转文本口述和AI撰写的内容)
硬件购买:
首先,它是基于小智机器人来进行修改的,这已经是网上一个非常成熟的硬件/服务了。在淘宝上最低几十元都能买到一个这样的对话机器人,网上也有很多关于它的视频,非常厉害且有趣。
https://x.com/kimmonismus/status/1976661112482640028
它默认接入小智的服务器:https://xiaozhi.me/ 基本上都调用的是国产大模型和豆包的语音服务。

但是,只是接入小智的官方服务实现不了我们想要的——就是发出户晨风的声音,保持户晨风的人设,甚至使用海外大模型(因为可能会谈到一些敏感话题)的需求。
所以制作户晨风机器人的第一步,就是要买一个可以自己方便固件的ESP32设备。而且必须同时带屏幕、话筒喇叭效果优质等。这一步开始你就可以把你的需求描述给AI,让AI来帮你挑选硬件。AI一般会推荐一些不错的选择。

我买的一款就是AI首先推荐的,价格并不低,要接近三百人民币。但好在它又不是一次性的设备,如果你以后对户子机器人没兴趣了,你也可以把它刷回原版的或者再修改其他的功能。
https://x.com/tutulifestyle/status/2001160050409361658
对这个设备的改动其实分固件和服务。固件部分复杂得多,我们可以理解成路由器刷机,这其中涉及很多核心代码操作,如果没有代码能力其实是很难,必须全部依托AI来完成。至于到底用哪家的模型来做这样的工作,我觉得各有各的习惯,各有各的选择吧,也争不出个所以然。
模型的选择:
我自己是用的Claude,我不认为它一定是最强的,但我觉得它在对话上很能懂我的意图,所以在沟通成本方面倒是节省了很多。 当然,你可以用Claude来做主控AI,然后把代码部分的工作交给更便宜国产大模型。
一开始把所有觉得能用的资源都喂给AI。它会判断哪一些是可用的资源。但它最初就把这个知名的项目排除掉了,觉得项目的文本量太大了,如果要进行向量模型训练的话,可能要数周的时间。所以我也就没有把这个知名的项目给加进去。