百度知识图谱部总监佘俏俏:AIGC正在颠覆现有的内容生产方式
人工智能技术的发展,给内容生产创作带了影响和变革。
7月28日,2023 ChinaJoy AIGC大会在上海举办,本次大会的主题为“AI新范式,内容生产新世代”。会上,《数字交互引擎的应用与价值研究》报告发布,来自国内外AIGC行业的专家、学者及从业者分享了对于AIGC技术给内容产业带来的变革思考,探讨了行业发展新趋势。
【资料图】
随着ChatGPT火爆全球,人工智能技术随之掀起一阵高潮,国内外多家科研机构、企业、高校等相继发布了多个大模型产品,将AIGC技术推向了新高度。AIGC技术改变了内容的创作方式,提升了内容生产的能力。例如,游戏是内容与科技结合的成果,人工智能技术能有效提升游戏研发效率、创新能力,给玩家带来全新的游戏体验。
会上,百度知识图谱部总监佘俏俏进行了题为《AIGC技术助力视觉创作新业态》的主题演讲,分享了百度AIGC技术与应用上的进展和思考。
(图片来源:活动方供图)
“AIGC正在颠覆现有的内容生产方式,以十分之一的成本,以百倍千倍的速度生成AI原创的内容,它不仅会提升内容生产的效率,也会创造出独特的价值和独立视角的内容,从而带来内容生产、内容消费模式的突破。”佘俏俏表示。
佘俏俏以百度目前在该领域推出的产品和应用技术为例,从图片生成、视频生成两方面分享了她的观察和看法。
文心一格是百度于2022年8月发布的一款依托于百度飞桨、文心大模型技术的AI绘画产品,能够为专业创作者提供创作灵感,也能为文字创作者提供高质量配图,为大众提供了一个零门槛创作绘画平台。
据佘俏俏介绍,文心一格的背后是百度自研的一套基于知识与大模型的文生图系统,这套文生图系统是基于昆仑芯、飞桨、文心大模型、百度知识图谱构建的,全栈技术自研,自主可控。智能Prompt工程能很好地理解用户的需求,构建出适合于AI绘画的输出表示。基于输出,跨模态大模型会生成能够满足用户需求同时兼具美感和实用性的图像。平台还具备图像编辑能功能,让用户能够对图像进行调整。在流程中,各个模块都充分利用用户反馈持续进行优化迭代。
在视频内容创作方面,佘俏俏表示,视频素材质量和丰富程度决定了最终效果,而获取高质量视频素材主要有跨模态匹配、跨模态生成两种方法。
“但无论是哪种方法,最核心的技术难题是如何实现文本、图片、视频片段等不同模态之间的语义级对齐。”佘俏俏称,团队在业界首次提出了基于统一建模的视文一体跨模态大模型,解决了这一业界难题。具体而言,百度创新整合了包括语言、视觉、语音、跨模态等一系列技术能力,参考了人在视频创作过程中的策、采、编,实现了文案理解与生成、素材分析与处理、素材扩充与编排等步骤,自动生成视频,在这套系统基础上实现了辅助的视频创作系统。
AIGC技术又给视觉内容创作的带来了哪些新变化?
据佘俏俏观察,AIGC技术提升了内容创作的效率,显著降低了不同形式视觉内容创作的整体成本和制作时间。同时,AIGC技术能够助力用户将想象付诸于实现,为用户提供更多创意。此外,AIGC技术能够降低创作门槛,让更多人加入到视觉内容创作中来。
佘俏俏认为,未来,大模型与知识技术将推动AIGC的效果进一步提升。在算法层面,大模型将进一步统一更多模态、任务、场景;在算力层面,将硬件利用率进一步提高,并且形成更高性能的能力;在数据层面,将从之前更多强调规模转向更强调质量,以及与模型打造更好的迭代闭环;在知识层面,更强调精准、更多形态,在AI推理和决策中发挥更重要的作用。
“这些技术的持续提升,将使AIGC技术具有更强的语言交互界面,更好的自主可控性、可解释性,生成更高维度的时空内容。”佘俏俏表示,将AI与人类的创造力结合在一起,可以开拓视觉内容的广阔未来。
关键词: