分享好友 资讯首页 频道列表

智能无处不在:安谋科技“周易”NPU开启端侧AI新时代

2024-11-12 09:0662760

在科技之光的照耀下,大模型从云端的殿堂飘然而至终端的舞台。这一历史性的跨越,不仅赋予了数据处理以迅捷之翼,更将智能体验推向了前所未有的高度。终端上的大模型以灵动的姿态,即时捕捉并回应着每一个细微的需求,将AI的触角延伸至世界的每一个角落。

安谋科技新闻稿配图-1

近日,在EEVIA主办的第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上,安谋科技产品总监鲍敏祺发表了精彩的主题演讲《端侧AI应用芯机遇,NPU加速终端算力升级》。他深入剖析了端侧AI发展的广阔前景,并详细介绍了安谋科技自研NPU的最新进展。

 端侧AI正在崛起

安谋科技新闻稿配图-2

 AIGC大模型带来的算力提升是端侧AI迎来的最大机遇。鲍敏祺表示,从近期头部大厂的发布中都可以看出,端侧AI的应用已经得到了业界的一致认可。

安谋科技新闻稿配图-3

 当前,国际和国内实际部署的主流端侧大模型体量主要集中在100亿参数以下。这一限制主要是由于端侧设备的内存带宽范围通常在50-100GB/s之间。为了满足用户对应用实时性的需求,10-30亿参数的大模型最适合部署在现有的带宽条件下。这些模型能够在保持高效性能的同时,提供快速响应和高质量的服务。

 头部终端厂商如OPPO、vivo、小米、荣耀和华为等,都在积极推动端侧AI的发展。他们不仅自研了适合端侧部署的大模型,还将其与具体业务场景紧密结合。芯片厂商也达成了共识,认为AI NPU(神经网络处理单元)将是未来消费类电子产品发展的重点。NPU通过专门优化的硬件架构,能够大幅提升端侧设备的AI计算能力,同时降低功耗。

尽管端侧AI的发展势头强劲,但鲍敏祺强调,这并不意味着要彻底放弃云端AI。相反,他认为两者应该实现互补,才能产生最大的收益。端侧AI的优势在于其时效性和数据本地化带来的安全性。由于数据处理发生在设备本地,用户的隐私得到更好的保护,同时也能实现实时响应。而云端AI则具备更强的推理能力和大规模数据处理能力,可以进行更复杂的任务。因此,结合端侧和云端的优势,将为用户提供更加全面和高效的AI体验。

从人机交互界面的发展历史来看,从最初的物理按键到触摸屏和语音交互,再到当前的Agent智能体,每一次变革都极大地提升了用户体验。未来的趋势将是多模态场景,即结合图像、音频、视频等多种输入方式,使设备能够更全面地理解用户的需求。通过观察和学习,未来的AI系统将能够更好地预测和满足用户的期望,从而实现真正的智能化。

以三重升级应对三重挑战

端侧AI的快速发展给硬件设备带来了三重挑战:成本、功耗和生态系统。

成本的挑战主要来自于设备的存储容量、带宽和芯片计算资源。功耗则源自对数据的大量搬运,而且大模型无法像CNN一样实现高度复用,也会大幅提升功耗。最后,开发工具的不断优化和支持也是挑战所在。

安谋科技新闻稿配图-4

针对这些挑战,安谋科技自研的“周易”NPU围绕微架构、能效和并行处理等方面进行了升级。

●微架构:鉴于CNN与Transformer的差异性,“周易”NPU在保留CNN能力的基础上,又针对Transformer进行了优化,克服了实际计算中的瓶颈。

●效率:进行混合精度的量化,比如int4和fp16,在算法和工具链层面上实现低精度量化。同时,对数据进行无损压缩和改变稀疏度,从而增加有效带宽。另外,采用In-NPU interconnection技术,实现了对总线带宽的扩展。

●并行处理:采用数据并行或模型并行,使用负载均衡和Tiling,减少了数据的搬运。

鲍敏祺还详细介绍了下一代的周易“NPU”架构,不仅包含了能够适应多任务场景的Task Schedule Manager,而且整个架构具备可扩展能力,并增加DRAM以实现高带宽的匹配,还增加了OCM(Optional on Chip SRAM),以支持有特殊要求的算法。

安谋科技新闻稿配图-5

鲍敏祺在演讲中特别强调了“周易”NPU对异构计算的支持,并指出无论是从能效还是整个SoC(系统级芯片)的面积角度来看,异构计算都是端侧AI芯片的最佳选择。他解释道,面对不同的应用场景,异构计算能够实现算力的灵活裁剪,并将不必要的功耗降到最低。

跨领域的应用专家

周易“NPU”已经在多个关键领域展示了其强大的性能和灵活性,特别是在汽车应用、AI加速卡以及AIoT场景中。

安谋科技新闻稿配图-6

在汽车应用中,不同的场景会对应不同的算力需求。如果是车载信息娱乐系统,对算力的要求不会太高,但是在ADAS应用中,很多情况下要执行多任务,对算力的要求就会大幅提升。而“周易”NPU的算力范围是20~320TOPS,可以根据需求裁剪出所需的算力。鲍敏祺表示,搭载了“周易”NPU的芯擎科技“龍鷹一号”已累计出货超过40万片,并成功定点应用于吉利旗下的领克、银河系列以及一汽红旗等20余款主力车型中。

安谋科技新闻稿配图-7

在AI加速卡的应用中,周易“NPU”能够与智能汽车、PC、机器人等不同类型的主机处理器(Host AP)进行高效交互,处理音频、图像、视频等多种数据形式。这种多模态模型的支持能力使得周易“NPU”能够在复杂的数据环境中保持高性能和灵活性。在AIoT场景中,设备通常受到面积和功耗的严格限制。尽管如此,周易“NPU”仍能提供高效的算力支持,同时保证高度的安全性。这使得它成为多个应用场景的理想选择。

鲍敏祺最后表示,下一代周易“NPU”将会继承并显著增强前代产品的强算力、易部署以及可编程等特点和优势,并围绕精度、带宽、调度管理、算子支持等多个方面进行持续优化。同时,NPU不仅要考虑适配现在的存储介质,还要考虑到对未来各种存储介质的适配,使得NPU能够更好地满足当前及未来市场需求。

举报 0
收藏 0
打赏 0
阿里云受邀加入Elastic AI Ecosystem联盟,助力企业加速RAG应用开发
近日,AI搜索公司Elastic宣布推出其全新的AI Ecosystem联盟,阿里云作为中国唯一受邀加入的厂商,携手Elastic共同为全球用户提供强大的AI搜索开发平台,推动AI搜索技术的广泛应用。

0评论2024-11-225528

智能建造领军企业获国际智能建造可持续发展合作伙伴荣誉
2024年11月18日,一场聚焦智能建造未来发展的高端论坛国际智能建造高端论坛在北京成功召开。此次论坛汇聚了众多国内外智能建造领

0评论2024-11-225552

高校AI通识课全面铺开,老师率先“升级”迎接挑战”
11月16-17日,西安交通大学和百度共同举办了AI通识教育主题高级研修班。60多名来自全国各地的老师花了一个周末,和百度的工程师一起探讨AI通识课“教什么”“怎么教”。

0评论2024-11-215913

第十九届中博会圆满落幕!五大关键词解读盛会成果
11月18日,为世界中小企业搭建“展示、交易、交流、合作”平台的第十九届中国国际中小企业博览会落下帷幕,五大关键词解读盛会成果。

0评论2024-11-215710

未来之“光”:艾迈斯欧司朗引领汽车照明革新
作为光源领域的领导者,艾迈斯欧司朗以光子为媒介,架起智能化汽车与终端用户(包括驾驶员、乘客及道路使用者)之间的交互桥梁。

0评论2024-11-185969

发展新质生产力,龙华区亮相第26届高交会展示硬核科技
2024年11月14日至16日,第二十六届中国国际高新技术成果交易会(以下简称“高交会”)在深圳国际会展中心举行,龙华区共28家创新型企业组团亮相。

0评论2024-11-156193

深圳NEPCON电子展圆满落幕,镭晨科技新品备受瞩目
2024年 11 月 6 日- 8 日,2024 NEPCON ASIA亚洲电子展在深圳国际会展中心如期举行,镭晨科技携多款新品及最新技术隆重亮相。

0评论2024-11-126098

Apache Spark & Paimon Meetup · 北京站,助力 LakeHouse 架构生产落地
2024年11月15日 13:30-17:30(周五),北京市朝阳区阿里中心-望京A座-05F,阿里云 EMR 技术团队联合 Apache Paimon 社区,联合举办“ Apache Spark & Paimon, 助力 LakeHouse 架构生产落地”线下 meetup。

0评论2024-11-126204

电装:推进碳中和,人才培养不计成本
10月21日,电装在电装(广州南沙)有限公司举办碳中和节能体感教育培训活动。

0评论2024-11-126251

从富士通到RAMXEED,以全新一代FeRAM迎接边缘智能高可靠性无延迟数据存储需求
近日,富士通半导体科技(上海)有限责任公司总经理冯逸新在由E维智库举办的第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上分享公司开展FeRAM的业务。

0评论2024-11-126193