人工智能火爆了天,但可惜的是。服务要么人家不让用,要么被墙了,要么被阉割。新时代的打工人,非常纠结。
当你忙着各种内测,忙着各种捣鼓账号的时候,开源届的 AI,也已经相当的繁荣昌盛了。
其实,一台 PC 机,就可以搭建各种服务,不联网,把机器人领回家。唯一让人感觉无奈的是,要想玩的爽,还是需要一块牛 X 一点的显卡。
刚刚经历了挖矿的洗礼,又要接受 AI 的鞭挞。显卡(尤其是N卡),真是的生不逢时。
(注:本文图片,都是 AI 绘制的)
机器人绘画
stable-diffusion-webui
要说机器人绘画,最流行的当然是Stable Diffusion。我们一般使用 webui 作为前端界面。
https://github.com/AUTOMATIC1111/stable-diffusion-webui
webui的安装非常简单,只需要 clone 下上面仓库的内容,按照文档安装即可。
支持:
- Windows ,运行 webui-user.bat
- Linux & Mac,运行 webui.sh
依赖的文件将自动被下载。
Stable Diffusion 的基本功能如下:
- 根据提示词(咒语),生成图片,可任意组合。
- 根据提供的图像和提示词,生成相似的图像。
- 图像局部微调,新元素加入。
- 支持任务训练,拥有自己的虚拟老婆不是梦。
- 支持非常多的扩展。
- 海量模型。
其他的推荐
其实,对于计算机绘画来说,一个 stable-diffusion-webui 就够了。想要用的好,还需要更多资源加持。
一、海量模型,免费下载。
https://civitai.com/ 不需要注册,即可从 C 站下载各种风格的大模型。比如,绘制汉服小姐姐,只需要下载一个 checkpoint 模型即可。
https://huggingface.co/ 当然,机器学习届的github,也可以获取更多的模型。
常用的模型有:Chilloutmix、Counterfeit、YesMix、RealDosMix等。
二、生成的提示词
想要获得更好的图像,提示词是最关键的。
https://stablediffusionweb.com/prompts 在sd的官网,可以看到大量的类似的提示词。你可以找到自己喜欢的进行微调。
https://tag.redsex.cc/ 对英文不好的人说,绘制人物模型的一些关键词。当然有R18的限制性词汇,解锁之后可以无线生成 S 图,不需要访问什么网站暴露身份了。
https://civitai.com/ 同样是 C 站,大多数人在分享图片的时候,把提示词也分享了,你也可从这里找找看。
三、绘图工作流
webui的界面,刷新后内容就不见了。如果你想要保存自己的工作流,可以尝试 https://github.com/comfyanonymous/ComfyUI。
加入你用过blender等软件,使用 ComfyUI 的体验将是非常丝滑的。
四、NovelAI
另外,不得不提的是 NovelAI。其实它也是基于 SD 进行开发的,不过生成的二次元图片比较精美,所以已经成为了独立的软件。
不过,webui的内容更全,模型更多,很多二次元模型效果也非常棒。
AI聊天
ChatGPT 引爆了人工智能领域。但其实,绘图领域的 SD 发展更早,而且走的是开源路线。
现在,也有更多的 GTP 开源模型被放出来了。我们完全可以在本地搭建一套。
就比如上次分享的 llama.cpp。
对于一个说中文来的人来说,这个它明显不够啊。于是就有了下面这两个。
ChatGLM-6B
ChatGLM-6B是清华大学知识工程和数据挖掘小组发布的一个开源的对话机器人。这个模型虽然不大,但也是与ChatGPT类似,做了针对对话的调优,使用体验很好。
https://github.com/THUDM/ChatGLM-6B
结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。当然,如果你是 Macbook m1 pro的话,这个也是能够快速跑起来的。
Chinese-LLaMA-Alpaca
上次分享的llama不是只支持英文吗?这里,有一个支持中文的。这一起都是基于 Meta 的 LLama模型演变出来的。可以说 Meta 公司在人工智能开源领域也付出了很多。
https://github.com/ymcui/Chinese-LLaMA-Alpaca
显然,中文模型相对于英文模型,也很小。但回答常识性的问题,已经耍你家里那什么小度小爱小E,千八百条街了。
作者简介:小姐姐味道 (xjjdog),一个不允许程序员走弯路的公众号。聚焦基础架构和Linux。十年架构,日百亿流量,与你探讨高并发世界,给你不一样的味道。