自建开源大数据平台会随着企业数据的增长遇到:性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop对比优势、自建迁移上云的实践案例来介绍 EMR 是如何解决这些问题的。
(资料图)
如果您需要定制迁移方案,可以点击 立即申请,我们收到申请后将会与您取得联系。
弹性 MapReduce (EMR) 是基云原生技术和泛 Hadoop 生态开源技术的安全、低成本、高可靠的开源大数据平台,组件完全源于开源社区,您可以将现有 IDC 或云上自建的大数据集群无缝平滑迁移至腾讯云EMR上。
腾讯云 EMR 产品集成了社区中常见的热门组件,包括但不限于 Hadoop、Hive、Hbase、Spark、Presto、Impala、Flink、Sqoop、Hue、Iceberg、Starrocks 等,可以满足您对大数据在线业务、离线/在线数据仓库、云原生数据湖构建、实时流式计算等全方位场景的需求。
腾讯云弹性 EMR 核心产品能力如下图所示:
● EMR集成了30+开源大数据组件,提供Hadoop2/3的多版本组件集供用户选择,您可以根据场景按需选择使用的组件,一键分钟级拉起云上大数据平台。
● 云原生大数据平台支持存储计算分离架构,解决传统自建平台扩容滞后、资源利用率低的挑战。存算分离架构下可实现基于COS数据分层存储,计算资源弹性按需使用,提升资源利用率,降低闲置成本。
● 在您使用过程中,可以通过EMR控制台界面可视化管理集群,包括服务启停、配置管理、脚本下发等;并提供涵盖集群、节点、服务累计1000+丰富监控指标,支持多渠道配置告警;EMR也提供了Yarn作业查询、Impala查询分析、HDFS文件存储分析等高阶洞察功能,帮助您显著提升大数据集群及业务运维效率。
相比使用开源Hadoop发行版本自建大数据平台,腾讯云EMR有以下主要优势:
1) 集群轻松构建、运维管理功能丰富易用,便于使用及维护
i. 基于开源Hadoop发行商软件构建大数据平台周期长,技术复杂度高,配套开发、运维、监控等工具不完善,且无法得到有效技术支持,需投入较大人力成本进行支撑及维护。
ii.腾讯云EMR可一键快速构建集群,发行版经过充分兼容性测试验证;控制台提供丰富运维、监控工具开箱即用,大幅降低使用及运维成本;除此之外腾讯提供的专业技术支持,也可以帮助客户快速定位并解决问题。
2) 计算资源按需弹性使用,数据可分层存储,资源利用率高
i. 自建大数据平台在服务器资源上一般需提前预估,并且针对业务峰值做一定的的预留,导致资源利用率低,面临计算需求的潮汐变化应对也非常不灵活。
ii. 腾讯云EMR支持灵活的弹性伸缩,资源按需使用,分钟级即可完成扩缩,并且可以根据业务变化的负载或者时间周期进行计算资源自动伸缩。初次之外,您的大数据服务也可以部署在容器服务上;存储方面也支持存算分离架构,可以对数据分层存储,为客户大幅降低存算资源成本。
3) 开源组件持续加固优化,稳定性及性能更有
i. 自建大数据平台一般采用开源社区版本组件,兼容性问题、组件缺陷需自行处理。性能也需自行优化,如需使用社区新版本组件或前沿技术栈搭建及测试成本高。
ii. 腾讯云EMR结合内部大规模实践经验,核心组件如 Hadoop、Hbase 等引入了天穹Oteam 版本,兼容开源并提供有效的稳定性加固。除此之外,新兴技术栈提供丰富优势特性,如 Iceberg 支持 Z-Order 优化可提升场景化性能10倍以上。在云产品敏捷迭代下,用户也可以便捷的基于社区最新稳定版组件构建集群,轻松使用 StarRocks、Iceberg 等新兴实时湖仓技术。
4)全栈安全防护策略,云上环境及数据更安全
i. 自建大数据平台从底层到服务层安全能力需自行构建,复杂度高,覆盖不完整,配套审计能力不完善,存在较多隐患及风险。
ii. 腾讯云 EMR 提供从硬件、网络、操作系统、大数据服务全栈易用的安全防护能力。提供 CVM 主机安全防护,异常告警;支持云硬盘加密,对象存储 COS 加密;网络层面支持 VPC 网络隔离管理,网络安全组设置;集群支持基于 Kerberos+LDAP 安全架构,身份认证确保集群访问安全,并提供基于 Ranger 的多种策略的数据权限管理。
5)无缝对接云生态服务,快速构建完整配套能力
i. 自建大数据平台如数据开发工具等配套能力需自行构建,成本高、周期长。
ii. 腾讯云 EMR 可轻松与 Wedata 数据开发平台、BI 商业智能分析产品无缝对接,帮助客户低门槛、快速构建数据集成、数据开发、数据可视化等服务。除此之外,EMR还支持云监控、云审计等周边服务,助力客户快速构建云上企业智能生态。
三、 自建迁移上云最佳实践案例
【客户背景】
该客户是中国国内在线教育引领者,一直致力于用科技手段助力教育普惠,运用人工智能、大数据等前沿技术,为学生、老师、家长提供更高效的学习、教育解决方案,智能硬件产品等。
【核心痛点】
客户在使用腾讯云EMR服务前,主要采取CDH自建方式维护自身开源大数据集群。但随着业务爆发式增长,数据量暴涨,为了应对不同业务场景时效性需求,该客户曾尝试采用众多技术方案并且不断扩容离线集群的规模,还是无法完全满足业务需求,基于CDH自建hive体系的核心报表无法按时产出,严重影响数据分析工作及企业经营决策。
【解决方案】
针对客户海量数据离线数仓时效性以及上云后安全性等核心诉求,腾讯云弹性 MapReduce 提出两种解决方案:
湖仓一体方案:推动数据湖iceberg技术落地,于腾讯云EMR的Iceberg独有能力,帮助客户将基于hive的PB级报表体系迁移至iceberg数据湖,通过Z-Order优化后报表计算性能显著提升,改善核心报表效率,同时综合降低成本;
权限统一方案:主导存算分离权限统一方案,基于产品统一权限管控能力,增加扩展能力,该方案中将对象存储(cos)作为权限管控的一种资源,统一权限管理,解决权限管控不统一问题;
【迁移效果】
场景化查询效率提升10倍:通过腾讯云弹性 MapReduce 的Iceberg特性优化、缓存加速、存算分离智能分层等应用,提高场景化查询了近10倍性能。另外通过腾讯云EMR提供的Iceberg外部Matastore功能,降低了客户元数据改造成本,几乎零改造实现Iceberg元数据接入。
固定算力降低5000核:通过EMR计算节点弹性扩缩、容器资源在离线调度等云原生能力,避免闲置资源浪费、降低综合成本。
【客户背景】
中国领军的企业云端商业及营销解决方案提供商,同时也是中国领军的精准营销服务提供商。为更好服务客户自身BI、搜索、营销、推荐等业务场景,需要一套稳定、高性能的大数据解决方案。
【核心痛点】
由于客户业务发展迅猛、数据量剧增,原来基于黑石物理机+CDH自建的大数据平台逐步出现了黑石节点扩容周期长、CDH组件版本老、不丰富、无法覆盖数据湖等新增业务场景的弊端。同时由于CDH集群组件较多、平均bug修复周期较长,客户不得不投入较多人力进行运维。 综合而言为支持业务的快速发展,客户大数据团队不得不在自建集群的扩容、新业务场景支持、平台稳定性与运维等方面投入大量成本与人力。
【解决方案】
腾讯云EMR提供了一键构建集群能力,满足业务高峰时段分钟级别弹性扩缩容,对集群计算和存储组件的深度集成,满足客户多租户认真和表级别、字段级别颗粒度授权能力。
自动扩缩容能力能够基于时间和负载两种策略弹性伸缩计算节点,满足客户在离线和即席分析场景在不同时间段的资源需求。登录鉴权、索引在文档字段级别的权限管理能力,为集群安全访问提供了稳固的保障。集成对象存储COS功能让备份变得简单。多可用区能力为集群提供了在城市电力或网络异常情况下的容灾保障。
【迁移效果】
通过引入腾讯云EMR,客户集群的交付效率提升10倍。
集群分钟级弹性能力帮助客户轻松应对活动期间流量剧增的压力。
腾讯云EMR安全体系让业务的安全性、高可用性获得了更有利的保障。
四、 迁移方案与购买优惠
在决策上云之后,会将数据和分析任务迁移到腾讯云EMR,我们为您提供IDC自建迁移EMR方案实践与定制迁移 EMR 方案。
● 迁移方案实践:
IDC自建迁移EMR方案.pdf
● 定制迁移方案:
申请定制迁移 EMR 方案
目前购买 EMR 可享受 3年55折优惠。点击 立即购买进行选购。
如需了解更多优惠折扣活动,请填写 申请定制迁移 EMR 方案,我们将及时与您联系。
欢迎对 弹性 MapReduce 感兴趣的朋友加入腾讯云大数据EMR沟通交流群。
下一篇:最后一页
自建开源大数据平台会随着企业数据的增长遇到:性能慢、扩容周期长、平台稳定性差、运维难、投入成本高...
1、红色经典诗歌可以写中国的成就以及赞美。2、《七律·长征》红军不怕远征难,万水千山只等闲。3、五岭...
1、金叹2、演员李敏镐3、男,18岁,射手座,帝国集团继承者。王子般的气度与涵养,看似拥有很多,却从未...
3月21日,太原天然气维检修停气通知,西山,太原,南街,摄乐,白家庄
1、如果被疯狗咬了,就必需要打狂犬疫苗。2、如果被普通野狗咬了,然后野狗不知去向,保险起见最好打。3...
雍正王朝电视剧距今已有二十四年之久,身为一部难得一见的经典之作,不只是剧情精彩绝伦,背后更是寓意...
山西省今年将建200个乡镇快递综合服务站
国际上以产品生命周期碳足迹(简称“碳足迹”)评价结果为手段的贸易壁垒一旦形成,我国光伏、动力电池...
1、放入DVD光盘,打开我的电脑,右键点DVD光驱盘符选中打开。2、打开VIDEO文件夹,找到DVD文件(一般是最大的)
1、手机充电慢有多方面的原因,有电池、数据线、充电器等方面的原因。2、原装充电器输出电流是2A(意思是...
1、朱雷1 〔清〕字雪筠,自号梅花仙叟,浙江平湖人。2、善花卉、师嘉兴张熊,用白阳(陈淳)法写牡丹松...
1、〖解释〗师:借鉴。2、记取从前的经验教训,作为以后工作的借鉴。3、〖出处〗《战国策·赵策一》:“...
乱套了!李梦被曝当小三,和领队发生关系,裸聊照片被原配晒出,小三,出轨,李梦(女演员)
8月6日晚,罗志祥通过微博发文祝福潘玮柏生日快乐,祝福不是看点,看点是罗志祥的配图,图片中潘玮柏身...
1、做两个相同文字图层(最好是艺术字),配不同颜色,重叠放在一起,设置动画。2、点击后的颜色放下一...
1、病情分析:奶苔是哺乳期婴儿面部出现的油性或干性皮疹。2、严重的时候会爆裂、糜烂、渗出、结痂,因...
甘咨询:子公司中标8419万元勘察设计项目:甘咨询(000779)公告,全资子公司甘肃省水利水电勘测设计研...
1、 s所谓“入盆”,临床上称为“辐合”,即宝宝头部在腹部最尖的位置进入我们孕妈妈的骨盆入口平面...
1、胡子鲶科(ClariidaeBonaparte,1846),硬骨鱼纲鲶形目的一个科。2、与鲶科外形相似,但背鳍
1、从暗夜精灵的主城达纳苏斯到人类主城暴风城,最常规的路线是坐船。2、先从主城飞行点附近,找一个大...
1、kWh读作千瓦小时,(k是千,W是瓦,h是小时),一个“kWh”就是俗称的“一度电”。2、它的来历是这样的...
项目名称中国午餐肉罐头市场竞争对手、流通渠道及消费者调查项目背景需求客户公司计划在2010年提升销售...
每经AI快讯,有投资者在投资者互动平台提问:公司工厂有实现智能化4 0吗?莱茵生物(002166 SZ)3月16日...
本次活动旨在进一步贯彻绿色大运、智慧大运的办赛理念,积极推动经济社会发展绿色化、低碳化转型。
大家好,小榜来为大家解答以上的问题。宇星科技被剥离,宇星科技发展(深圳)有限公司深圳待遇怎么样这个很...
X 关闭
X 关闭