分享好友 资讯首页 频道列表

两大AI模型性能提升 登上国际榜单

2025-01-16 11:2489500

科技日报讯(记者李禾)近日,由盛大AI团队研发的模型Watt-tool-70B和Newsbang/homer-72B,登上国际知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt团队研发的旗舰模型,目前位列BFCL Leaderboard总榜单第一。

微信截图_20250116112700

据悉,榜单BFCL Leaderboard是由加州大学伯克利分校开发的评估LLM工具调用能力基准测试平台。作为目前大语言模型(LLM)最热门的研究方向之一,工具调用(Function-Calling)是为了让LLM理解,并能准确使用API(应用程序编程接口),来执行更复杂而具体的任务。在近期公布的最新一轮评估结果中,Watt的“多轮对话执行能力”相较于排名第二的GPT-4o 领先11分,比排名第十的Gemini-1.5-Pro 领先近40分。

“这个模型将加速大模型落地‘融合’过程。”Watt有关负责人说,还有助于从底层数据标注到人机交互的体系化建设,让大模型初步实现从“光说不练”到“能文能武”。

此外,由盛大集团NewsBang团队开发的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜单第一。Open LLM Leaderboard V2是由Hugging Face维护的开源语言模型评测平台升级版本,采用更全面和严格评估标准,对各类开源大语言模型进行多维度测试和排名。Newsbang/homer-72B重视提升模型在推理和思考方面的能力,通过搭配数据筛选机制等,在多个核心评测维度,该模型性能有了大幅提升。

微信截图_20250116112743

据公开报道,2023年初,盛大集团宣布All in AI战略,去年10月,联合多家高校发表了AI与长期记忆方面的论文,其自研的OMNE大模型多智能体框架登上GAIA 基准测试排行榜榜首;其旗下的天桥脑科学研究院(TCCI)与国际学术杂志《Science》合作推出全球AI驱动科学大奖,举办和支持包括“AI+精神健康”在内的各种高水平国际会议和夏校项目,助力培养跨学科青年AI人才等。

举报 0
收藏 0
打赏 0
涨!广东调整最低工资标准,华成工控助力人机协作迎来新时代!(智能化学会副会长单位)
近日,广东调整最低工资标准上调,“机器换人”的话题也再度升温。机器换人的本质是人机协同,从制造到“智造”,智能化学会理事单位华成工控控制系统助力人协同迎来新时代!

0评论2025-02-216258

AI时代,手机订“智”——联通云手机创新产品发布
2025年2月10日,中国联通在哈尔滨隆重举办了“联通万兆,畅享魅力亚冬”5G-A行动计划发布会。在此次盛会上,联通云手机作为5G-A技术的重点应用,正式向公众亮相。

0评论2025-02-177297

【代办入台证】诚邀赴台参观「2025 年台北国际电脑展」
由台湾贸易中心主办的「2025 年台北国际电脑展(COMPUTEX 2025)」将于2025年5月20- 23日在台北南港展览1、2 馆盛大举行。受主办单位委托,深圳市智能化学会邀请国内相关人士前往参观,并办理入台证。

0评论2025-02-147133

台湾贸易中心广州代表处首席代表邱玉珠女士一行访问深圳市智能化学会
正月十五元宵节,家家户户庆团圆。2025年2月12日正值中国传统的元宵佳节,深圳市智能化学会执行会长石锡铭先生热情接待了台湾贸易中心广州代表处首席代表邱玉珠女士一行。

0评论2025-02-127746

DeepSeek爆火引发"算力焦虑"!优刻得专有云助您抢占大模型风口!
DeepSeek现象级爆火,为助力用户快速打造一个基于DeepSeek模型能力的AI智算云,优刻得专有云提供GPU算力纳管和调度、DeepSeek模型部署、AI智算云平台运营等一站式AI算力和模型接入服务.

0评论2025-02-109633

亚冬冰雪狂欢:AI加持联通看家,守护生活每一刻
2月7日,哈尔滨以其独特的北国冰雪风光,迎来“2025年第九届亚洲冬季运动会”的盛大启幕。中国联通以中国联通以官方通信及云服务合作伙伴的身份荣耀登场。

0评论2025-02-108914