狗狗币专家观点无界 AI 内容生态...

无界 AI 内容生态中心负责人赵杰诚:AI 绘画像是在解应用题

-

2024 年 1 月 5 日,“智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会”在杭州未来科技城召开。大会由杭州未来科技城管委会、余杭区科技局和余杭区企业(人才)综合服务中心联合指导,时戳科技主办,AI 新智界提供媒体特别支持。

无界 AI 内容生态中心负责人赵杰诚在《实用型 AIGC 的多维度解决方案》主题演讲中分享了无界 AI 是如何像解应用题一样解决 AI 图片生成的问题。他表示,只有把用户提出的“飘在天上”的需求以细致、稳定并且精确的方式落地,才能让 AIGC 在实操层面成为一个非常好用的工具。

以下是 AI 新智界整理的演讲内容,为方便阅读已进行部分删减:

我是无界 AI 内容生态中心的负责人赵杰诚,今天跟大家分享一些 AI 的实用解决方案。在我之前,包括红蜻蜓的老总、各位领导都说了非常多的实用案例,大家觉得特别好。但是我们企业该怎么办?这些东西好像离我很远。无界 AI 有一个内容生态中心,它就是来解决这些问题的。刚才说我们如何用 AI 来做鞋的打板、如何来做汉服,这是一个飘在天上的问题。如何让它成为普通人能使用的,一两句话就能让 AI 做好设计,然后进行深度的使用,这是我们无界做的。

无界 AI 内容生态中心在这一年多的时间里面不断解决了各行各业的实际问题,在这里,我都会向大家说明一下。

首先,当我们去年了解到 AI 之后,我们发现 AI 在很多行业都能做非常深入的研究。在第一个项目中,我们做的是偏学术的,在去年 11 月份 AI 初步被大家认可,可以画很多很精美的图案的时候,在中国传媒大学的一个研究老师找到了我们,说我们想要还原一位叫做“薛稷”的唐代老师的画鹤的图片。但是他一直以来都在屏风上绘画,没有流传下来。我们都知道宋徽宗的鹤很好看,但是大家不知道唐代薛稷才是画鹤的祖宗。然后,我们通过了 AI 技术,在各种方面去寻找一些相关的素材,最终我们也通过去西安的一个古墓里面拓一些鹤的图片,解决了鹤绘画羽毛以及口器的难点,最终绘画成了,得到了大家的认可。

后面,我们发现 AI 对内容生产非常有利,因为有很多国内的内容生产行业,比如说漫画、动画是非常有产能限制,国内的动画人才相对国外来讲起步比较晚。对于现在铺天盖地的内容需求,很多平台都说我们该怎么办,我们没有办法投入更多费用进行采购了,所以他们找到了 AI。

我们在今年 2 月份开始,跟国内各大平都有深入的接触,去做各种 AI 的绘画尝试。包括我们这边看到的纯 AI 制作的科幻漫画,这是它的人设。还有刚刚跟《长相思》做的漫改剧项目,是我们非常成熟的项目,已在优酷平台上播放。这些是我们在内容方面的尝试。

还有我们在 4 月份做了第一个以画漫画为需求的国漫模型。我们的绘画风格,得到了非常多的小哥哥、小姐姐们的喜欢,他们觉得这个风格是目前市场上别的平台无法满足的一种需求,非常契合中国人的审美。

6 月份,我们开始深入跟万事利研究一个新的项目。今天,万事利的刘总会深入演讲,我就不详细讲了,我们做出非常特色的杭州风格的相关模型。

刚才也提到了我们都在往汉服方向寻找解,因为汉服也是我们杭州非常重要的一个特色。我们首次研发了一款汉服模型,在今年 9 月份的时候已经对外公布发布,并且也解决了很多行业的需求。包括我们可以用汉服来制作跟现代服装结合的汉服样式,我们也可以通过汉服去直接把《梦华录》里面明星穿的衣服进行一键学习,让它成为一键同款,但也不会有侵权。像这样的功能,对于我们汉服模型来讲都非常容易,用户可以轻易上手。

在今年 10 月份,我们也做了相关的影视照相方面的研究。这是我们跟刚刚热播的电视剧《神隐》合作的,将《神隐》里面的角色直接替换成我们的用户,既拓展了作品的宣传,又可以让作品在播放阶段有更好的变现模式,是一种非常好的 AI 增效方面的尝试。

这些尝试,只是我们日常工作的十分之一甚至更少的一部分。我们每周都会遇到各方面的相关需求,包括如何用 AI 设计眼镜,如何用 AI 设计大理石的纹样。就像刚才我们说的汉服有面临打板的问题,大理石纹样对像素要求是高精度的,需要在一个非常细小的横截面上进行 AI 绘画。这样的工作,对于我们来讲每天遇到的都是全新的挑战,就像是在写应用题。所以在现场,我给大家手把手演示一遍我们怎么去满足我们的用户需求。

请听题!我们来玩一个用户可以把自己的照片画成一个油画,或者是画成一个非常好看的插画的需求,我们来看一下他们提出的需求。

首先,小韩说我要做一款 AI 的拍照,以后能直接变成水彩画的工具。要求是一定要像本人,又不能有 PS 感觉或者绘画的感觉。其次,算力不能太高,如果计算非常复杂,是很难实现的,所以我可能只有 2 台显卡,只有 8 G,我该怎样配置,这个工作该怎么做?将这个问题提到了我们部门。它同时也问如果我要做这样的事情,我要多久?你说你要给我做一个模型,可能要两三个月,我等不了,因为我下个月就要用,所以我们天天碰到这样的问题,这就是我们的提问。

接下来,看我如何解答。小韩给到了我们照片,我要把照片变成一个很好看的油画,我们来解这个问题。

大家都知道解应用题都有第一步、第二步、第三步。

第一步,审题。我们应该要如何去控制刚才说的人怎么像他?第一步是我要去想如何控制图形。在无界 AI 里面,已选的图形控制有 Google 捕捉、边缘检测、涂鸦上色等。普通人最初阶段要想该选择怎样的工具?

首先,我们在图形选择层面,有非常多的图形选择器,包括谷骨骼捕捉、边缘检测和线稿提取等。识别完成之后,就得到了一个比较好的模型。

第二步,风格控制。该怎么画好这张图?也就是说我们要有绘画感,像油画、像插画。我们就要选一个风格,如何像油画、像插画。

大家都觉得这五个图都挺好看的,左边第一个是卡通风,中间是国风水墨,后面又有非常多的真人像,最终像一个简笔画。这些都是通过识别的方式“画”出来的风格,这些风格该怎么选?卖个关子,这里所有的都不合格。为什么?好看,但是不像,跟我的用户需求不同。我不能交一个用户直接拍手说好看的东西,我要交付的是一个企业觉得实用,用起来是满足需求的东西。所以,这五个都不满足。

所以,我们挑选了几个相像的,因为这三个就属于刚才说的风格既符合小韩国这样位女生觉得需要像,但又有艺术上的风格,左边偏油画,中间偏真实写照,右边偏插画,最终我选择其中一个。

风格已经差不离了,接下来就要做第三步的细节稳定。

对 AI 来讲,它识别了脸部线条,进行非常好的风格选取以后,我要考虑的是要跟你多像,这个参数是由我们来调的。调好各种参数以后,我们最终就会出现有笔触较轻、笔触较厚、笔触较圆滑的三种。

现在已经更像了,到底要轻、重还是平滑呢?这个问题,我已经无法解答了,因为我自己的判断已经结束了,需要交给客户来判断。最终,客户选择了自己满意的图片。

像这个工作,它不是飘在天上,在我们无界都是可以轻松完成的。所以现在在座的用户,都可以用无界去尝试解决这样的 AI 需求。

其实到现在为止,工作已经结束了,但我对自己还有个要求,我想要做得更好,因为我觉得这不够,因为我觉得可能对用户来讲画一个跟你很像的没有什么太好的吸引,这个很简单。我提出了一个新的点,我说我从原图做好了客户的 AI 精修绘画,我还想做一个创意延展,我想把她画成妲己的样子,来吸引更多的用户,我尝试了一下。这个其实已经满足了,我们在整个 AI 的应用题中已经得到了满足,客户给了我 10 分,我解完了。

我刚才说我想做一个延展,如果增加一下刚才的风格,我想画妲己,我想当公主,我想画恶魔,行不行?我们来做一个更深入的尝试。

我进行了稍微深度的延展,大家可以看到我分别把刚才的那位女生分别画成了狐妖、公主、魔女,而且都是像她的,并且她自己非常满意。所以经过 AI 的深度调整以后,我们还能做更多的尝试。一整个工作下来,我们就完成了。

刚才为大家完整地演示了我 2 个小时的工作,这就是一个客户的需求。我们希望在无界的每一个需求,不是飘在天上的,而是一个非常稳定的输出。用户所见即所得,我输入我想要的文字,就能够生成非常稳定的结果。只有这样,才能让 AIGC 最后在实操层面成为一个非常好用的工具,达到细致、稳定并且精确,这也是我们无界 AI 和无界的内容生态中心一直在想帮用户解决的问题,我们也会一直研究下去。

LEAVE A REPLY

Please enter your comment!
Please enter your name here

热门新闻

狗狗币市值短暂超过西南航空公司

据u.today消息,狗狗币(DOGE)的市值在本周飙升了300%之后,短暂地超过了全球最大的低成本航空公司西南航空的市...

彭博社:预测比特币今年将上涨至40万美元

比特币的涨幅与2013年的约55倍和2017年的约15倍相似。

知名投行摩根士丹利为何选择新增比特币敞口?

12只摩根士丹利的投资基金将在比特币金融产品中配置资金以获得风险敞口

一文读懂元宇宙、NFT 和 GameFi 的关系

GameFi 改变了现实传统游戏中多方各自为阵的割裂模式
spot_img