快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线

来源: 南方周末
2024-06-02 14:59:56

  近日,快手自研大模型产品“可图”(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。目前,用户可以通过“可图大模型”官方网站和微信小程序,免费使用各项AI图像功能。

  从具体功能上看,一方面,可图提供AI形象定制功能,即图生图功能,通过人像保持技术,可轻松保留人像的自然特征,并一键生成各种风格的人像作品,满足不同社交及营销场景的个性化形象需求。例如,用户只需上传一张面部轮廓清晰的照片,并选择偏好的风格,调节保留面部特征的程度,便可创作出既有个性又富含艺术感的头像。

  目前,可图已上线10余种AI形象定制风格玩法。在六一儿童节来临之际,可图还特别推出了QQ秀风格的“红钻贵族”和“我的小时候”两种玩法,支持用户上传图片生成复古像素风格化图片和童年写真,打造个人二次元IP形象,回味美好的童年时光。

  此外,可图还提供粘土世界、炫彩琉璃、梦幻莫奈、甜蜜情人节、春日卡通、水彩浪漫等风格化玩法,以及韩式写真、魔法学院、帅气赛车、浪漫海岛等写 实风玩法,打造专属的个性化写真。

  另一方面,快手可图大模型也提供AI创作功能,即文生图,支持用户自由输入文本,生成风格多样、画质精美、创意十足的绘画作品。同时用户也可以上传参考图,可图将根据参考图像的风格、主题和细节等内容,生成既符合创意描述又与参考图相关的图像作品。

  例如,根据“油画,被鲜花簇拥的猫咪,布偶,浮雕质地,多层次维度,栩栩如生,粉色氛围感”等文字描述,可图生成了质感十足、细节生动的猫咪油画。不仅动物画极具创意,在人物画方面,可图同样功能强大,基于“男孩,天真可爱,水汪汪的大眼睛,背面,转头微笑,高清,亚麻色卷发,小斗篷”等描述生成的超写实作品,细节刻画精美,人物形神兼备。

  不仅是油画,国画、动漫等多样风格的绘画作品,可图均可一一呈现。在可图输入文本“荷塘,水墨画,留白,意境,齐白石风格,细腻的笔触,宣纸的纹理”,一幅荷塘图即刻生成。根据“戴草帽的男人,肩上站着一只鹦鹉,极简,波西米亚风格”等描述,可图同样生成了高质量的精美AI图片。

  值得注意的是,“可图”大大降低了AI图像生成的使用门槛,提供了更好的使用体验:与同类产品需多张照片和较长时间来完成AI生成不同不同,可图只需一张图片和几秒钟时间,便可生成一套效果优秀的AI图像。

  在强大的功能背后,快手大模型团队的技术能力为产品提供了有力支撑。例如,在中文特色理解方面,可图基于快手自研的知识图谱构建了上亿级别的中文特色图文数据,结合中文大语言模型的文本表征能力,能够精准描绘和表达各类中文场景。

  据悉“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

  同时,在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配,同时引入了经过优质专家标注的图文数据集,以对齐人类审美偏好,提升模型性能表现。

  据媒体报道,去年9月,“可图”大模型平台已在快手开启内测,快手在App评论区推出的“AI玩评”和“AI小快”等多种创新互动玩法,集合了文生图、图生图、扩图等功能,也是基于可图大模型能力。

  近日,在2024年一季度财报电话会上,快手CEO程一笑介绍,今年一季度,快手稳步推进自研大模型各项性能的迭代提升,并且加快大模型在各业务场景的应用。随着大模型产品可图的正式发布,快手也将持续为用户带来更丰富有趣的AI互动新体验。

  同时,2月9日下午在电商平台搜索“ChatGPT”时,也已搜索不到任何内容。(完)

  祝女士同时运营该中介的自媒体平台,“没想到大年初一至初五,还有不少客户在平台上咨询房源信息,其中4组客户年后转换成门店的带看客户。”她说。

  在中山大学人机互联实验室主任、哲学系教授翟振明看来,设计者将ChatGPT定位为聊天软件,是比较明智的,这样它可以不保证产出内容的正确性。“作为聊天软件,ChatGPT表现相当不错,只是还不能实时更新,还是基于过去一个时间节点以前的海量数据。ChatGPT的出现会代替许多人创造性不强的书面工作,这样给未来的工作带来更高的创意要求。”

  “这会儿人已经是最少的了,前几天乌乌泱泱都是人,那个楼前站都站不下。”招募中心附近,一位老大爷推三轮车贩卖着饮品和包装食品。由于人流量大,周边居民都做起了相关生意,还有人搬来电脑和打印机,可以现场拍照和打印。

  影像的另一长处是将小说中的奇思妙想转换为视觉上的饕餮盛宴。比如剧版《三体》一五一十还原了小说中“三体游戏”的种种场面,虽然CG动画的效果相较于特效大片仍有距离,但诸如秦始皇的3000万士兵“人列计算机”等场面的还原,也确实是震撼恢弘、摄人心魄。除此之外,影像的蒙太奇魅力,让它在衔接叶文洁的“文革”经历与时下老年叶文洁心如死灰的状态时,形成强烈的关联对比,有助于观众理解叶文洁当下的心境与抉择。

  电视剧《三体》刚开播时,可谓万众瞩目。一方面自然是因为小说《三体》在国内科幻界、乃至世界科幻界的崇高地位,小说曾获得2015年科幻文学界的最高奖雨果奖,并以一己之力将中国的科幻小说提高到世界一流水准;另一方面,电视剧《三体》是首部真人化的《三体》影视改编。剧版《三体》播出前,打头阵的动画版《三体》正好在播出中,可惜口碑惨淡。如此一来,观众既期待剧版,也不免担忧它重蹈动画版覆辙。

张哲琇

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有