分享好友 资讯首页 频道列表

通义千问2(Qwen2)大语言模型在PAI-QuickStart的微调、评测与部署实践

2024-06-14 19:2951370
 Qwen2(通义千问2)是阿里云最近推出的开源大型语言模型系列,相比2月推出的Qwen1.5,Qwen2实现了整体性能的代际飞跃,大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。其中,Qwen2系列包含5个尺寸的预训练和指令微调模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中,Qwen2-57B-A14B为混合专家模型(MoE)。Qwen2所有尺寸模型都使用了GQA(分组查询注意力)机制,以便让用户体验到GQA带来的推理加速和显存占用降低的优势。

阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen2模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松实现Qwen2系列模型的微调、评测和快速部署。

PAI-QuickStart 介绍

快速开始(PAI-QuickStart)是阿里云人工智能平台PAI的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了包括大语言模型,文本生成图片、语音识别等各个领域。通过 PAI 对于这些模型的适配,用户可以通过零代码和 SDK 的方式实现从训练到部署再到推理的全过程,大大简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

运行环境要求

•  本示例目前支持在阿里云北京、上海、深圳、杭州、乌兰察布等多地域,使用PAI-QuickStart产品运行。

•  资源配置要求:

 Qwen2-0.5B/1.5B/7B量级模型:最低使用V100/P100/T4(16GB显存)及以上卡型运行训练任务;

  Qwen1.5-72B量级模型:最低使用A100(80GB显存)及以上卡型运行训练任务。

通过PAI-QuickStart使用模型

开发者可以在 PAI 控制台的“快速开始”入口,找到Qwen2系列模型,以Qwen2-7B-Instruct为例,模型卡片如下图所示:

 


模型部署和调用

PAI 提供的Qwen2-7B-Instruct预置了模型的部署配置信息,用户仅需提供推理服务的名称以及部署配置使用的资源信息即可将模型部署到PAI-EAS推理服务平台。当前模型需要使用公共资源组进行部署。

 

 

部署的推理服务支持使用ChatLLM WebUI进行实时交互,示例如下:

 

 

推理服务支持以OpenAI API兼容的方式调用,具体可见以下的Python SDK的示例。

模型微调训练

PAI 为Qwen2-7B-Instruct模型配置了微调算法,支持用户以开箱即用得方式对Qwen2-7B-Instruct进行微调。训练算法支持使用 Json 格式输入,每条数据由问题、答案组成,分用“instruction”、“output”字段表示,例如:

 

77.jpg

 

当完成数据的准备,用户可以将数据上传到对象存储 OSS Bucket 中。算法需要使用V100/P00/T4(16GB显存)的GPU资源,请确保选择使用的资源配额内有充足的计算资源。

 

 

训练算法支持的超参信息如下,用户可以根据使用的数据,计算资源等调整超参,或是使用算法默认配置的超参。

 

 

点击“训练”按钮,PAI-QuickStart 开始进行训练,用户可以查看训练任务状态和训练日志。

 

 

如果需要将模型部署至PAI-EAS,可以在同一页面的模型部署卡面选择资源组,并且点击“部署”按钮实现一键部署。模型调用方式和上文直接部署模型的调用方式相同。

如果需要评测微调后模型的性能,可以从任务页面右上角评测按钮进入评测页。详情见下一节:模型评测。

模型评测

PAI 为Qwen2-7B-Instruct模型配置了评测算法,支持用户以开箱即用得方式对Qwen2-7B-Instruc以及微调后模型进行评测。通过评测能帮助用户和其他模型做性能对比,更能指导用户进行精准地模型选择和优化。

模型评测入口:

从“快速开始”页面完成Qwen2-7B-Instruct开源模型的评测

 

 

从训练任务详情页完成微调后模型的评测

 

 

模型评测支持自定义数据集评测和公开数据集评测:

 

 

•  自定义数据集评测

对于自定义数据集评测,我们使用NLP领域标准的文本匹配方式,计算模型输出结果和真实结果的匹配度,值越大,模型越好。使用该评测方式,基于自己场景的独特数据,可以评测所选模型是否适合自己的场景。

评测需要提供JSONL格式的评测集文件,每条数据使用question标识问题列,answer标识答案列,例如:

 

 

符合格式要求的评测集,可自行上传至OSS,并创建自定义数据集,详情参见上传OSS文件和创建及管理数据集。之后选择评测结果输出路径,并根据系统推荐选择相应计算资源,最后提交评测任务。等待任务完成,在任务页面查看评测结果(模型在ROUGE和BLEU系列指标上的得分):

 

 

•  公开数据集评测

在公开数据集评测中,我们通过对开源的评测数据集按领域分类,对大模型进行综合能力评估,例如数学能力、知识能力、推理能力等,值越大,模型越好。目前PAI维护了MMLU、TriviaQA、HellaSwag、GSM8K、C-eval、TruthfulQA,其他公开数据集陆续接入中。无需准备数据,直接选择PAI提供的公开数据集、评测结果输出路径、计算资源即可提交评测任务。等待任务完成,在任务页面查看评测结果(模型在各个公开数据集的得分情况,其中每个公开数据集的评测范围详见数据集官方介绍):

 


通过Python SDK使用

PAI 提供了Python SDK,支持开发者方便得使用Python在PAI完成模型的开发到上线的。通过PAI Python SDK,开发者可以轻松调用PAI-快速开始提供的模型,完成相应模型的微调训练和部署。

部署推理服务的示例代码如下:

 

 

微调训练的示例代码如下:

 

 

通过快速开始的模型卡片详情页,用户可以通过“在DSW打开”入口,获取一个完整的Notebooks示例,了解如何通过PAI Python SDK使用的细节。

结论

Qwen2(通义千问2)的推出标志着阿里云在开源大语言模型领域的最新进展。这个系列推出了不同规模的开源模型,可广泛用于多样化的下游应用场景。开发者可以借助PAI-QuickStart轻松地对Qwen2模型进行定制和部署。此外,PAI QuickStart还汇集了一系列先进的模型,覆盖多个专业领域,欢迎广大开发者们体验和应用这些丰富的资源。

相关资源链接:

•  Qwen2介绍:

https://qwenlm.github.io/zh/blog/qwen2/

•  PAI 快速开始:

https://help.aliyun.com/zh/pai/user-guide/quick-start-overview

•  PAI Python SDK Github:

https://github.com/aliyun/pai-python-sdk

举报 0
收藏 0
打赏 0
评论 0
高端家电唯一入选!卡萨帝连续4年入选最具价值品牌榜单
6月19日,2024年《中国500最具价值品牌》正式发布,作为高端家电的唯一代表,卡萨帝此番以超过800亿的品牌价值登上榜单。

0评论2024-06-205065

重新定义大容量冰箱!卡萨帝发布700⁺L墅式冰箱
买冰箱,只要容量够大、保鲜过关就行?现在的用户可不这么想了。从今年618的市场反馈来看,用户不仅关注冰箱的整体容量,还会考量冰箱内部分区是否精细、外观设计能否融入家居空间等一系列问题。

0评论2024-06-205041

阿里云PAI大模型评测最佳实践
本文为PAI大模型评测最佳实践,旨在指引AI开发人员使用PAI平台进行大模型评测。借助本最佳实践,您可以轻松构建出既能反映模型真实性能,又能满足行业特定需求的评测过程,助力您在人工智能赛道上取得更好的成绩。

0评论2024-06-195075

基于EasyAnimate模型的视频生成最佳实践
EasyAnimate是阿里云PAI平台自主研发的DiT的视频生成框架,它提供了完整的高清长视频生成解决方案,包括视频数据预处理、VAE训练、DiT训练、模型推理和模型评测等。本文为您介绍如何在PAI平台集成EasyAnimate并一键完成模型推理、微调及部署的实践流程。

0评论2024-06-195087

技术加持、产品立身“商查利器”爱企查持续助力诚信社会建设
作为百度旗下专业权威的企业信息查询平台,爱企查依托百度先进的大数据和AI查询技术,全面整合企业监管、经营行为、市场反馈、关系网络等信息,辅助用户高效做出专业决策,持续助力诚信社会建设。

0评论2024-06-195154

曙光存储即将发布重磅新品,6月25日见
数据要素已经成为“战略资源”,数据存储成为全社会关注重点。6月25日,以“先进存力 凝聚数据要素”为主题的曙光存储新品暨品牌发布会,将以线上直播方式举办,面向市场大存力需求再出大招!

0评论2024-06-195072

央视走进海尔:回收旧家电,再造新材料
6月17日,央视财经《经济信息联播》报道海尔智家再循环互联工厂打通家电换新堵点,从回收、拆解、再生到再利用等多个环节,展现废旧家电如何变废为宝。基于全球首家再循环互联工厂,海尔智家构建起行业首个家电“回收-拆解-再生-再利用”循环闭环体系,在规范回收废旧家电的同时,通过工厂已布局的清洗-分选-造粒线体等流程,产出循环新材料,纯度高达99.9%,物性近乎零衰减,性能堪比新料,可广泛应用于各个领域,实现循环利用。

0评论2024-06-195211

高端占比猛增!卡萨帝华南用户定制方案初见成效
近期天气显示, 华南地区 多地持续暴雨已达7天 ,对居民日常生活影响也越来越大。在广州、海南各地的梅雨季“攻击下”,居民不得不忍受屋外蒸笼、屋内潮湿的状态。不少人这样更新朋友圈:“衣服是半干的、墙壁是渗水的,每天都觉得自己是个‘潮人’。”

0评论2024-06-195142

行业唯一!海尔智慧楼宇写入低碳智慧建筑白皮书
当前,智慧化已成为实现建筑低碳化的关键技术支撑。与此同时,国内在该领域的标准和规范尚不完善,需更为明晰的指导框架和行动蓝图,以引领行业加速发展。

0评论2024-06-195081

数据“跑”代替人工跑 海尔生物医疗助赛傲生物细胞质控管理智慧升级
“4楼实验室,温湿度数据异常,请及时处置……”“样本已通过跨楼层传递窗进行传递,注意查收!”在上海赛傲生物技术有限公司(以下简称“赛傲生物”),海尔生物医疗智慧细胞管理全景方案的落地应用,不仅实现了各洁净区“人机料法环”全场景、全要素的互联互通,各项信息数据的即时记录和“一屏统管”;也打通了不同楼层、不同洁净细胞间上下游信息传递,让公司集团化管理,分公司高效协同运作成为现实,大大提高了细胞药物研发的规范化、标准化管理水平。

0评论2024-06-195202