分享好友 资讯首页 频道列表

实时数仓Hologres V2.2发布,Serverless Computing降本20%

2024-06-14 19:2751180
 Highlight

· 新发布Serverless Computing,提升大任务稳定性,同时可降低20%计算成本

· 引擎性能优化,TPC-H 1TB测试相对V1.X 提升100%

· 实时湖仓加速架构升级,支持Paimon,直读ORC、Parquet数据性能提升5倍以上

· 新增实例监控指标,可观测性全面提升,新增SQL指纹、Query洞察、SQL 与表索引诊断

· 流量分析场景新增路径函数,支持跨可用区容灾、OpenAPI能力升级

升级说明:Hologres支持热升级,可以在实例后台进行自助升级与升级准备。升级流程请查看>>>

一、新发布Serverless Computing,提供大作业隔离与弹性处理

功能说明:

通过共享Serverless资源执行DML任务,保证大任务隔离与高可用,降低成本并提升性能。同时支持设置单条SQL使用Serverless的资源上限,支持设置使用Serverless资源的SQL优先级。详细请查看>>>

应用场景:

· 隔离与稳定性。计算资源开销大的任务,不会有争抢资源,OOM等问题。

· 成本降低。无需为大任务单独购买预付费资源,实际应用可降低20%计算成本。

 

 

当前发布地域和可用区:华东1(杭州)的可用区J、华南1(深圳)的可用区F、华东2(上海)的可用区E、华北2(北京)的可用区I。

二、多种引擎能力优化,TPC-H 性能测试结果提升 100%

Hologres V2.2 提升了查询优化器和查询引擎的能力,1.1 版本使用 96CU 在 TPC-H 1T 的总查询耗时为 223.08 秒,在V2.2版本中,测试结果为111.53 秒,性能提升达到100%。详细结果请查看>>>

 

 

引擎性能优化包含:

向量执行引擎HQE能力提升

· Runtime Filter能力增强,在Join场景上,支持多种过滤类型,无需手动设置,引擎自适应,在减少数据扫描量的同时也能减少join的计算量和数据的网络传输量,有效提升Join的查询效率约30%。

· 优化HQE的RPC连边机制,每个Worker内数据先合并再进行Worker间分发,显著降低网络开销,在带有Shuffle的场景上,查询性能提升8%。

查询优化器性能提升,SQL在Plan阶段的处理速度提升40%

· 优化内存分配机制和Join算法,提升多Join场景的查询性能。

· 优化DATE_PART函数行为,提升对带有时间属性的字段(如年份)的查询效率。

· 优化DATE和TIMESTAMP类型字段的比较行为,提升时间字段的查询效率。

· 优化复杂函数中带有Filter的运算行为,通过调整多个Filter的顺序,减少数据计算量,提升查询效率。

三、实时湖仓架构升级,性能提升5倍,外表元数据自动加载提升分析体验

HologresV2.2版本针对实时湖仓架构进行重构,显著提升了数据湖的查询性能,并通过外表元数据自动加载(Auto Load) 提升实时湖仓的用户使用体验。

实时湖仓架构升级包含:

· 实现HQE引擎直读OSS上的ORC、Parquet数据,相较于原引擎有5倍以上的性能提升

· 针对ORC、Parquet格式的外部表支持谓词下推过滤,减少数据扫描量,提升查询效率

· 支持使用内置高速磁盘和内存实现多级缓存

外表元数据自动加载(Auto Load)能力增强:

支持一键绑定外部数据源,实现DB或者schema级别的映射,简化和降低外表创建成本,包含:

· 支持MaxCompute三层模型Project,可以将MaxCompute三层Project中的一个或多个指定schema 数据按需或者全量映射到Hologres

· 支持MaxCompute外部表的Schema Evolution(如增加列、删除列、修改列名及列顺序)

· 支持通过DLF元数据自动加载,来加速查询存储于OSS的数据

详情请查看>>>

 

 

四、实例诊断能力提升,新增SQL指纹、Query洞察、SQL 与表索引诊断等

新增SQL指纹,快速定位Bad Query

SQL指纹是Hologres提供的一种自动Query聚类分析能力。V2.2版本在存放慢Query查询日志的系统表中,新增digest列以展示SQL指纹。对于SELECT/INSERT/DELETE/UPDATE类型的Query,系统会计算一个MD5哈希值作为该Query的SQL指纹,帮助业务快速识别占用资源的Query以及异常Query等。详情请查看>>>

新增Query洞察可视化,全方位获取查询诊断信息

在holoweb-诊断与优化中,通过Query ID就能快速获取当前Query的执行信息,例如Query进程的资源消耗、Query所涉及的表的元数据,以及Query对应的执行计划(plan)。同时可以通过Query洞察快速判断当前Query是否产生了DDL冲突,以及表锁情况,辅助业务进一步排查问题和处理问题。详细结果请查看>>>

 

 

新增SQL诊断和表索引诊断,快速完成实例治理

在holoweb-诊断与优化中,SQL诊断通过对不同维度的Query趋势、明细分析,可以辅助您了解实例的使用情况并做相应的优化,以达到更好的效果。详情请查看>>>

 

 

在holoweb-诊断与优化中,表索引诊断对当前实例的Table Group、表、索引等进行诊断,帮助业务进行实例治理,从而辅助提升实例的稳定性和性能。例如:

·  一个Table Group的内表总数不建议超过1W张,优化后将提升DDL性能。

·  对于分区子表超过1W张的分区表,建议使用冷热分层 ,以节约存储成本。

详情请查看>>>


 

实例监控信息新增15+Metrics,可观测性得到增强

在实例列表-监控信息中,新增15+metric指标,提供不同执行引擎的QPS、RPS、Latencty等以及可观测Binlog、Serverless等功能的运行情况,以方便及时了解任务的负载。同时也提供Locks、Analyze等健康度指标,可以帮助业务快速观测实例运行健康状态,及时处理异常。

 

 

五、新增路径分析函数,更加丰富流量分析场景函数能力

在流量分析场景,需要计算访问每个流程/步骤的路径分布和情况,以及每个步骤的流入流出情况,原有SQL计算方式较为复杂,并且影响计算性能。Hologres通过一个路径分析函数即可实现路径分析,简化用户路径分析流程,与之前推出的漏斗函数、留存函数、明细圈人函数、Roaring Bitmap函数、BSI函数等结合,实现完整、丰富的流量数据分析方案。详情请查看>>>


 

六、支持跨可用区容灾,提升生产业务稳定性

跨可用区(AZ)容灾,即在同Region不同可用区部署同构的Hologres容灾实例,如果生产实例所处的地理位置发生自然灾害,或者实例内部出现了故障导致生产实例无法正常对外提供读写服务,那么容灾实例可以切换为生产实例,从而保障业务连续性。详情请查看>>>

例如:杭州Region某个可用区(例如可用区H)中的Hologres实例无法正常运行时,可通过已配置的容灾关系,将同Region其他可用区(例如可用区J)的Hologres实例切换为生产实例,保障业务正常运行。

七、OpenAPI能力升级,提升实例运维管理能力

新增计算组列表与详情、数据湖加速功能、更新实例资源组等OpenAPI,在severless、数据湖分析等场景下,提升实例运维以及管理能力。详情请查看>>>

15000CU时计算包原价5313元,限时新购仅需59元>>>

前往实时数仓Hologres官网查看详情>>>

实时数仓Hologres V2.1版本发布,新增计算组实例构建高可用实时数仓>>>

 

 

举报 0
收藏 0
打赏 0
评论 0
高端家电唯一入选!卡萨帝连续4年入选最具价值品牌榜单
6月19日,2024年《中国500最具价值品牌》正式发布,作为高端家电的唯一代表,卡萨帝此番以超过800亿的品牌价值登上榜单。

0评论2024-06-205065

重新定义大容量冰箱!卡萨帝发布700⁺L墅式冰箱
买冰箱,只要容量够大、保鲜过关就行?现在的用户可不这么想了。从今年618的市场反馈来看,用户不仅关注冰箱的整体容量,还会考量冰箱内部分区是否精细、外观设计能否融入家居空间等一系列问题。

0评论2024-06-205041

阿里云PAI大模型评测最佳实践
本文为PAI大模型评测最佳实践,旨在指引AI开发人员使用PAI平台进行大模型评测。借助本最佳实践,您可以轻松构建出既能反映模型真实性能,又能满足行业特定需求的评测过程,助力您在人工智能赛道上取得更好的成绩。

0评论2024-06-195075

基于EasyAnimate模型的视频生成最佳实践
EasyAnimate是阿里云PAI平台自主研发的DiT的视频生成框架,它提供了完整的高清长视频生成解决方案,包括视频数据预处理、VAE训练、DiT训练、模型推理和模型评测等。本文为您介绍如何在PAI平台集成EasyAnimate并一键完成模型推理、微调及部署的实践流程。

0评论2024-06-195087

技术加持、产品立身“商查利器”爱企查持续助力诚信社会建设
作为百度旗下专业权威的企业信息查询平台,爱企查依托百度先进的大数据和AI查询技术,全面整合企业监管、经营行为、市场反馈、关系网络等信息,辅助用户高效做出专业决策,持续助力诚信社会建设。

0评论2024-06-195154

曙光存储即将发布重磅新品,6月25日见
数据要素已经成为“战略资源”,数据存储成为全社会关注重点。6月25日,以“先进存力 凝聚数据要素”为主题的曙光存储新品暨品牌发布会,将以线上直播方式举办,面向市场大存力需求再出大招!

0评论2024-06-195072

央视走进海尔:回收旧家电,再造新材料
6月17日,央视财经《经济信息联播》报道海尔智家再循环互联工厂打通家电换新堵点,从回收、拆解、再生到再利用等多个环节,展现废旧家电如何变废为宝。基于全球首家再循环互联工厂,海尔智家构建起行业首个家电“回收-拆解-再生-再利用”循环闭环体系,在规范回收废旧家电的同时,通过工厂已布局的清洗-分选-造粒线体等流程,产出循环新材料,纯度高达99.9%,物性近乎零衰减,性能堪比新料,可广泛应用于各个领域,实现循环利用。

0评论2024-06-195211

高端占比猛增!卡萨帝华南用户定制方案初见成效
近期天气显示, 华南地区 多地持续暴雨已达7天 ,对居民日常生活影响也越来越大。在广州、海南各地的梅雨季“攻击下”,居民不得不忍受屋外蒸笼、屋内潮湿的状态。不少人这样更新朋友圈:“衣服是半干的、墙壁是渗水的,每天都觉得自己是个‘潮人’。”

0评论2024-06-195142

行业唯一!海尔智慧楼宇写入低碳智慧建筑白皮书
当前,智慧化已成为实现建筑低碳化的关键技术支撑。与此同时,国内在该领域的标准和规范尚不完善,需更为明晰的指导框架和行动蓝图,以引领行业加速发展。

0评论2024-06-195081

数据“跑”代替人工跑 海尔生物医疗助赛傲生物细胞质控管理智慧升级
“4楼实验室,温湿度数据异常,请及时处置……”“样本已通过跨楼层传递窗进行传递,注意查收!”在上海赛傲生物技术有限公司(以下简称“赛傲生物”),海尔生物医疗智慧细胞管理全景方案的落地应用,不仅实现了各洁净区“人机料法环”全场景、全要素的互联互通,各项信息数据的即时记录和“一屏统管”;也打通了不同楼层、不同洁净细胞间上下游信息传递,让公司集团化管理,分公司高效协同运作成为现实,大大提高了细胞药物研发的规范化、标准化管理水平。

0评论2024-06-195202