【感想】做AI也四五个月了

个人页：https://www.pixiv.net/users/2109018

专区开了，平时也没地方说这个，在这里把自己的想法写一下吧。

大概11月开始在P站发图，到现在也就3w粉丝吧，第一两个月涨得很快，当时还挺激动的（也有过不少幻想）

一开始的动力是给自己翻译的欧美音声自制配图

也不是说这个目标现在没能实现，只是大家对AI的接受度还是喜忧参半，所以做出来也不适合使用，最后音声的翻译也放下了（有点觉得按现在的发展，音声汉化也会AI化，就不太想继续忙这块了，重心就全部放在了AI作画上面）

大概1月份到现在是AI技术发展最令我震惊的一段时间，一开始AI作画刚火的时候当然也是很惊人，但是自己参与进去的想法更多些。到了前两个月，技术的进步速度真是令人惊掉下巴，尤其是写实方向。

而我的作画方式恰恰是完全和这个没有关系的，可能我在这个圈子里都是极少数的，没有本地部署，不调任何参数，纯粹靠NovelAI网页端的订阅功能+tag词的组合来作图。

而且为了大量测试，基本上都是用的基础尺寸（订阅25刀一个月以后基础尺寸是0费用的），每次边调tag边生成个300-400张，留100-200张，最后筛个20-30张出来发一发。

整个对tag的探索过程是很有意思的，由于自己是文字工作者，所以体验很像是在写诗歌什么的（我也不加{}之类的权重引导，所以连编程都不像，反正量大，能随机摇出来合适的结果就行，不需要张张都好）。

慢慢地学会了和AI对话的方法，比如要求胸部不要用cleavage，breast等，而是要用mammary，要身材好不需要特别描述细腰什么的，加个hip bones就能有效果，还有各种非常玄学的词汇用法，以及解剖名词（解剖名词表述身体不分不容易带出不必要的关联元素）

尤其是对负面词，就更加神奇，不追求肉感一般都要禁止pregnant，白皮禁tan，随机表情禁emotionless，一般tag里加了blush会丰富表情细节和神情，但是风格会剧烈二次元化，这时候在负面词里面再禁止blush效果就会很好。还有很多这种七进七出的例子，什么摇赛博朋克图一定得禁cyberpunk，摇机甲图得禁奥特曼和变形金刚等等……

但是这些都是我个人在自己领域里面的经验，和现在AI的发展趋势其实是很遥远的，现在大家都在搞的是模型、算法、机器配置等等的竞赛。我也想过要不要自己弄一台好点的机器，然后学一下各种东西的搭建来实现更好的细节和效果。

但我想来想去还是放弃了，因为追求这个方面是没有止境的，对我来说，AI就是提供了一个把我的想法变成图像的手段，非常精细的画风一直都有，不只是AI领域。回想过去自己多年来看的涩图，其实普通的简单的画风也总是很涩的，更不要说很多厚涂、素描、卡通、漫画风格的作品（我自己现在也在努力研究这些风格），为什么做了AI以后就变成只是追求真人化了呢？

当然这些也都比较像是自己的借口，因为自己不想学、不想做就不去搞更好的效果什么的。想起自己当时还和自己的做设计的老婆因为对AI的喜欢而吵了一架，其实有点讽刺。

我是真的觉得自己现在的创作形式好吗？还是我只是舍不得每天可以走在路上用手机刷图的轻松生活？也许都有，但有一点是肯定的，就是调词对画面的影响的研究其实还远远不够。从最近chatgpt的经验来看就很明显，人和人的对话与人和AI的对话是很不一样的。

你当然可以通过给AI设定更好的算法和人格的方式来实现更符合人与人交流的AI体验（包括绘画），但是令我更感兴趣的是AI的可能性，AI要做的是拟真拟人还是创造你完全没有想象过自己需要的新画面、新声音和新故事？

我会选择后者。

顶端

Sora_k

B1F 2023-03-17 16:30

（https://www.pixiv.net/users/2000609）

全看 | | 小中大

楼主总结的很好啊，我也坚持创作了一个月。因为没有美术背景，创作也到瓶颈期了。c站现在pose和各类lora也越来越丰富，之前要凹半天的一个造型现在controlnet一下就出来了。这领域确实更新的很快，估计之后的趋势会是和chatgpt融合，通过大型语言模块用人类语言生成图片而不是tags。之后估计这领域的门槛估计只剩硬件了。共勉吧

顶端

南+ South Plus AI交流 (beta)

[-- 查看移动版 --]

漫区特设

蜜柑计划

综合交流

人民囧府

【感想】做AI也四五个月了