CIKM是人工智能领域的顶级国际会议,会议的目的是确定未来知识和信息系统发展面临的挑战性问题,并通过征集和审查高质量的应用和理论研究成果来塑造未来的研究方向,在学术和工业界都有巨大的影响力。此次入选意味着阿里云人工智能平台 PAI自研的扩散模型算法和框架达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。
扩散模型在图像生成领域的成功我们有目共睹。从 Latent Diffusion 到 Stable Diffusion,从惊艳的 Midjourney 到百花齐放的 Diffusion 开源社区,扩散模型目前已然成为 AIGC 行业的最热门研究方向之一。
图 1:扩散模型的精美生成效果
然而,扩散模型生成精美图像的代价是高昂的计算资源需求。与基于生成对抗网络的方法不同,扩散模型的生成过程是迭代式的,因此需要多次调用模型,逐步消除图像中的噪声。现有的一些加速算法通过设计“调度机”,构造完整生成过程的近似过程,减少迭代步数,提高生成速度。
图 2:调度机算法构造的短步数近似过程
根据论文中的分析,调度机构造的近似过程本质上是线性子空间的扩张过程,论文中也给出了其中的几何解释,DDIM 算法在二维线性子空间中寻找近似解,而论文中提出的 OLSS 算法旨在更高维的线性子空间中求解。
图 3:OLSS 算法的直观几何解释
此外,OLSS 还使用一个路径规划算法进一步提升精度,在同等步数下,实现了更高的图像质量。
图 4:OLSS 算法与其他方法生成的图像对比
目前,阿里云人工智能平台 PAI已经上线了多种扩散模型的应用,例如快速部署AIGC Stable Diffusion SDWebUI绘画的AI-Web应用及快速推理等。用户可以登录阿里云官网领取免费试用资源,快速体验。
论文信息
论文标题:Optimal Linear Subspace Search: Learning to Construct Fast and High-Quality Schedulers for Diffusion Models
论文作者:段忠杰、汪诚愚、陈岑、黄俊、钱卫宁
论文pdf链接:https://arxiv.org/abs/2305.14677