29a087f6733aceea.png

Reconia

GF  2023-03-09 10:08
(AI头像,P站:https://www.pixiv.net/users/2109018)

【感想】做AI也四五个月了

个人页:https://www.pixiv.net/users/2109018

专区开了,平时也没地方说这个,在这里把自己的想法写一下吧。

大概11月开始在P站发图,到现在也就3w粉丝吧,第一两个月涨得很快,当时还挺激动的(也有过不少幻想)

一开始的动力是给自己翻译的欧美音声自制配图

也不是说这个目标现在没能实现,只是大家对AI的接受度还是喜忧参半,所以做出来也不适合使用,最后音声的翻译也放下了(有点觉得按现在的发展,音声汉化也会AI化,就不太想继续忙这块了,重心就全部放在了AI作画上面)

大概1月份到现在是AI技术发展最令我震惊的一段时间,一开始AI作画刚火的时候当然也是很惊人,但是自己参与进去的想法更多些。到了前两个月,技术的进步速度真是令人惊掉下巴,尤其是写实方向。

而我的作画方式恰恰是完全和这个没有关系的,可能我在这个圈子里都是极少数的,没有本地部署,不调任何参数,纯粹靠NovelAI网页端的订阅功能+tag词的组合来作图。

而且为了大量测试,基本上都是用的基础尺寸(订阅25刀一个月以后基础尺寸是0费用的),每次边调tag边生成个300-400张,留100-200张,最后筛个20-30张出来发一发。

整个对tag的探索过程是很有意思的,由于自己是文字工作者,所以体验很像是在写诗歌什么的(我也不加{}之类的权重引导,所以连编程都不像,反正量大,能随机摇出来合适的结果就行,不需要张张都好)。

慢慢地学会了和AI对话的方法,比如要求胸部不要用cleavage,breast等,而是要用mammary,要身材好不需要特别描述细腰什么的,加个hip bones就能有效果,还有各种非常玄学的词汇用法,以及解剖名词(解剖名词表述身体不分不容易带出不必要的关联元素)

尤其是对负面词,就更加神奇,不追求肉感一般都要禁止pregnant,白皮禁tan,随机表情禁emotionless,一般tag里加了blush会丰富表情细节和神情,但是风格会剧烈二次元化,这时候在负面词里面再禁止blush效果就会很好。还有很多这种七进七出的例子,什么摇赛博朋克图一定得禁cyberpunk,摇机甲图得禁奥特曼和变形金刚等等……

但是这些都是我个人在自己领域里面的经验,和现在AI的发展趋势其实是很遥远的,现在大家都在搞的是模型、算法、机器配置等等的竞赛。我也想过要不要自己弄一台好点的机器,然后学一下各种东西的搭建来实现更好的细节和效果。

但我想来想去还是放弃了,因为追求这个方面是没有止境的,对我来说,AI就是提供了一个把我的想法变成图像的手段,非常精细的画风一直都有,不只是AI领域。回想过去自己多年来看的涩图,其实普通的简单的画风也总是很涩的,更不要说很多厚涂、素描、卡通、漫画风格的作品(我自己现在也在努力研究这些风格),为什么做了AI以后就变成只是追求真人化了呢?

当然这些也都比较像是自己的借口,因为自己不想学、不想做就不去搞更好的效果什么的。想起自己当时还和自己的做设计的老婆因为对AI的喜欢而吵了一架,其实有点讽刺。

我是真的觉得自己现在的创作形式好吗?还是我只是舍不得每天可以走在路上用手机刷图的轻松生活?也许都有,但有一点是肯定的,就是调词对画面的影响的研究其实还远远不够。从最近chatgpt的经验来看就很明显,人和人的对话与人和AI的对话是很不一样的。

你当然可以通过给AI设定更好的算法和人格的方式来实现更符合人与人交流的AI体验(包括绘画),但是令我更感兴趣的是AI的可能性,AI要做的是拟真拟人还是创造你完全没有想象过自己需要的新画面、新声音和新故事?

我会选择后者。

1546849.jpg

Sora_k

B1F  2023-03-17 16:30
(https://www.pixiv.net/users/2000609)
楼主总结的很好啊,我也坚持创作了一个月。因为没有美术背景,创作也到瓶颈期了。c站现在pose和各类lora也越来越丰富,之前要凹半天的一个造型现在controlnet一下就出来了。这领域确实更新的很快,估计之后的趋势会是和chatgpt融合,通过大型语言模块用人类语言生成图片而不是tags。之后估计这领域的门槛估计只剩硬件了。共勉吧