分享好友 资讯首页 频道列表

【EMNLP2024】阿里云人工智能平台PAI多篇论文入选EMNLP2024

2024-11-07 08:58101150

近期,阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台 PAI 在自然语言处理和多模态算法能力方面研究获得了学术界认可。

论文简述

面向长文本的文视频表征学习与检索模型 VideoCLIP-XL

CLIP 模型在视觉-语言预训练领域已经取得了重要进展。然而,原始 CLIP 模型的一个显著局限性是处理长文本描述的能力受限。原始 CLIP 模型的训练过程中对简短的摘要性文本的强调迫使文本/视觉编码器主要关注文本/视觉输入中的主要特征,常常忽视一些较小但潜在关键的细节。为了解决这些限制,该工作提出了一个名为 VideoCLIP-XL 的视频 CLIP 模型,旨在提升对视频的长文本描述的理解能力。其首先构建了一个大规模的视频-长描述配对数据集 VILD,并在预训练阶段提出了一种文本相似度引导的主成分匹配方法(TPCM)来优化高维特征空间的学习。

此外,该工作提出能够理解长描述的视频 CLIP 模型应当体现两个特征:给定一个视频及其相关描述,CLIP 类模型应该对(1)具有更丰富和更精确细节的描述以及(2)在相同细节水平下更准确即幻觉更少的描述赋予更高的分数。为此,其提出两个新的预训练任务:细节描述排序(DDR)和幻觉描述排序(HDR)。此外,该工作也建立了一个新的视频长描述排序基准测评集(LVDR),来更全面地评估视频 CLIP 模型的性能。

基于多任务课程规划的大语言模型蒸馏算法

大语言模型在回答开放领域通用任务的指令上取得了很大地进步。指令微调是微调预训练模型,使其从文本补全模型成为强大的对话模型的关键。尽管已有研究探索了使用强大的黑盒教师模型(如GPT-4, Qwen-max)来自动蒸馏和标注指令的方法,但这些研究往往忽视了微调训练集中任务的多样性分布,以及训练集中指令难度的差异,这可能导致学生 LLMs 知识能力的不平衡和解决复杂任务的能力的不足。为了解决这些挑战,这篇文章介绍了一个名为 TAPIR 的知识蒸馏框架,它通过多任务课程规划来蒸馏黑盒大语言模型的指令回答能力,在蒸馏和多轮迭代过程中,使用教师 LLM 做为裁判找出对于学生 LLM 来说难以回答的指令,进行难度重采样。并调整多任务配比进行训练集中的任务多样性分布的重采样,并根据相应多任务特点自动优化教师模型的回答风格。

该工作创新性地用显式的任务标签配比代替隐式的句向量多样性。在任务重采样的过程中,大大增加数学推理代码类任务的数据比例。首次提出了模型拟合难度 (MFD) 指标,来表示数据难度大小,并在多轮迭代优化的过程中提升困难数据占比。提升模型从弱到强的泛化速度。在 Alpacaeval 排行榜上,我们微调后的 LLaMA2-7B 底座获得了7.8的相对分数,超过了参数量、数据量都远大于我们的知名开源模型模型(LLaMA2-Chat-13B,Vicuna 13B)。我们持续优化了 Qwen 系列模型的指令回答能力,优化 Qwen1.5系列模型在 Alpacaeval 榜单上提升3-8个百分点。

产品化服务

上述科研成果也在人工智能平台PAI的各个模块进行了深度的集成和整合,持续为PAI客户提供AI模型训练和推理相关服务。其中,VideoCLIP-XL作为文视频质量评估模块,与EasyAnimate视频生成解决方案无缝融合,支持用户轻松实现文视频语义一致性计算和数据过滤,从而训练AIGC视频生成大模型。在智码实验室,我们也上架了“VideoCLIP-XL:面向超长文本的文视频跨模态特征抽取”的notebook。

用于数据增强和改写的蒸馏模型也已经上架PAI平台,为用户提供简单易用的大模型蒸馏解决方案。基于Qwen2的开源模型,PAI也在开源了DistilQwen2蒸馏小模型系列,进一步提升了模型的指令跟随能力,在HuggingFace和ModelScope开源社区开放下载。

此外,PAI-QuickStart集成了超过50个热门大语言模型,及其多种训练和推理方式,使客户更加简单地微调和部署大语言模型。在未来,我们也将在PAI平台上持续提供业界领先的算法和模型能力给广大客户。

资源链接

-视频多模态

 EasyAnimate开源项目:https://github.com/aigc-apps/EasyAnimate

  VideoCLIP-XL:https://huggingface.co/alibaba-pai/VideoCLIP-XL

  VideoCLIP-XL-v2:https://huggingface.co/alibaba-pai/VideoCLIP-XL-v2

  LVDR数据集:https://huggingface.co/alibaba-pai/LVDR

  VILD数据集:https://huggingface.co/alibaba-pai/VILD

  VideoCLIP-XL:面向超长文本的文视频跨模态特征抽取:https://gallery.pai-ml.com/#/preview/deepLearning/cv/videoclipxl

大模型蒸馏

● 大语言模型数据增强与模型蒸馏解决方案:https://help.aliyun.com/zh/pai/use-cases/llm-data-enhancement-and-model-distillation-solution

  DistilQwen2蒸馏小模型系列

alibaba-pai/DistilQwen2-7B-Instruct

  https://huggingface.co/alibaba-pai/DistilQwen2-7B-Instruct

  https://modelscope.cn/models/PAI/DistilQwen2-7B-Instruct

alibaba-pai/DistilQwen2-1.5B-Instruct

  https://huggingface.co/alibaba-pai/DistilQwen2-1.5B-Instruct

  https://modelscope.cn/models/PAI/DistilQwen2-1.5B-Instruct

论文汇总

论文名字:VideoCLIP-XL: Advancing Long Description Understanding for Video CLIP Models

论文作者:汪嘉鹏、汪诚愚、黄坤哲、黄俊、金连

论文pdf链接:https://arxiv.org/abs/2410.00741

论文名字:Distilling Instruction-following Abilities of Large Language Models with Task-aware Curriculum Planning

论文作者:岳元浩、汪诚愚、黄俊、王鹏

论文pdf链接:https://arxiv.org/abs/2405.13448

 

阿里云人工智能平台 PAI 长期招聘研究实习生。团队专注于深度学习算法研究与应用,重点聚焦大语言模型和多模态 AIGC 大模型的应用算法研究和应用。

简历投递和咨询:chengyu.wcy@alibaba-inc.com。

 

举报 0
收藏 0
打赏 0
“论道”十五五企业发展:卡奥斯分享AI+工业互联网转型新路
 关键词:#中国纸业发展大会# #AI+工业互联网# #十五五# #数智化转型# #数字孪生# #工业大模型# #智能制造#

0评论2025-10-245218

产业里程碑 | 星闪数字车钥匙蓝皮书在京成功发布
10月17日,以“汇智聚能·网联无限”为主题的2025世界智能网联汽车大会正在北京紧锣密鼓地进行中。期间,由国际星闪联盟主办的“《星闪短距通信技术的汽车数字钥匙蓝皮书》发布会”成功召开。

0评论2025-10-215684

华成工控受邀出席宝安新质生产力成果发布,携具身智能核心成果亮相
华成工控携具身智能控制系统精彩亮相,展现宝安智造创新产品的硬核实力。

0评论2025-10-205265

校企协同,以赛促学|华成工控携手中原工学院举办 “华成杯” 程序设计竞赛
近日,为迎接中原工学院建校70周年,营造浓厚的学术氛围,激发学生对计算机与编程的热爱,培育科技创新人才,深圳市华成工业控制股份有限公司(以下简称 “华成工控”)携手中原工学院计算机学院,联合举办 “华成杯” 程序设计竞赛。本次竞赛共吸引全校近百位在校本科生踊跃报名,为广大学子提供了一个展示自我、交流学习的优质平台。

0评论2025-10-205191

新联合众AI赋能智能办公解决方案亮相香港环球资源电子展
Linxee新联在展会中重磅推出多款AI赋能的智能办公创新产品,展现了公司在电子配件领域的前沿技术实力,成为展会焦点。

0评论2025-10-155843

BOE(京东方)联合vivo打造旗舰vivo X300系列 多项核心技术定义屏幕新标杆
10月13日,vivo X300系列新品发布会以“巨出片・出巨片”为主题盛大启幕,全系搭载由BOE(京东方)高端柔性显示技术品牌f-OLED赋能的全新Q10 plus护眼屏、集成BOE LTPO自适应刷新、硬件1nit低亮显示等行业领先黑科技。

0评论2025-10-155601

深圳电机产业链交流会议程正式公布
为聚焦技术前沿、促进行业共同发展,由Big-Bit商务网主办、《半导体器件应用》杂志承办的“中国电机智造与创新应用暨电机产业链交流会(秋季)”将于10月24日在深圳盛大开幕。

0评论2025-10-155560

从自供到破局,格力工业机器人十年蝶变之路!
从一台数控机床起步,到如今拥有上百种智能装备产品的产业布局,格力智能装备产品覆盖数控机床、工业机器人、智慧物流仓储、工业自动化等高端装备领域,更在新能源汽车、3C电子、储能等关键行业实现批量交付。

0评论2025-10-115851

赋能智慧物流,构建未来仓库——胜轶德智能科技开启智能仓储新篇章
胜轶德智能科技(苏州)有限公司,这家深耕智能制造与场内物流系统的高新技术企业,正以自主创新的笔墨,书写着属于本土企业的发展新篇。

0评论2025-10-116066

迈向“零事故”未来:湾测以安全传感为使命,重塑中国制造安全基线
在国产工业安全传感器领域,湾测无疑是近年崛起的标杆企业。这家 2021 年成立的本土品牌,仅用四年便实现出货量突破百万支、斩获 “国产综合实力第一” 的殊荣,更在标准制定、全球化布局中展现出强劲势能。

0评论2025-09-306726