logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

EMR Serverless Spark:结合实时计算 Flink 基于 Paimon 实现流批一体

简介EMR Serverless Spark 版是开源大数据平台 E-MapReduce 基于 Spark 提供的一款全托管、一站式的数据计算平台。它为用户提供任务开发、调试、发布、调度和运维等全方位的产品化服务,显著简化了大数据计算的工作流程,使用户能更专注于数据分析和价值提炼。实时计算 Flink 版是阿里云提供的全托管 Serverless Flink 云服务,具备实时应用的作业开发、数据调

#serverless#spark#flink +2
数据湖实操讲解【JindoFS 缓存加速】第十二讲:Spark 访问 OSS 透明缓存加速

数据湖技术圈本期导读 :【JindoFS 缓存加速】第十二讲主题:Spark 访问 OSS 透明缓存加速讲师:辰山,阿里巴巴计算平台事业部 EMR 技术专家内容框架:JindoFS 缓存...

#zookeeper#大数据#分布式 +2
免费公测|阿里云EMR Serverless StarRocks 公测正式开启!

让算力更普惠,让 AI 更普及!未来十年,阿里云将全面拥抱智能化时代。随着 Serverless 化逐渐成为全新的软件研发范式,阿里云正坚定推进核心产品全面 Serverless 化。其中,开源大数据产品 阿里云E-MapReduce 率先推出 EMR Serverless StarRocks 服务。StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP 架构、可实时更新的列式存储引擎

#阿里云#serverless#大数据 +2
阿里云EMR 2.0:重新定义新一代开源大数据平台

摘要:本文整理自阿里云高级产品专家何源(荆杭)在 阿里云EMR2.0线上发布会 的分享。本篇内容主要分为三个部分:1. 开源大数据的痛点及EMR产品历程2. EMR2.0 新特征3. 总结1►开源大数据的痛点及EMR产品历程1. 开源大数据的痛点 如何提升性能,降低资源成本全面的性能优化需要大量的研发投入且门槛较高;大数据资源使用量大,广大用户都在不断探索降本方案。如何降低运维成本...

#大数据#阿里云#开源 +1
Spark 大数据处理最佳实践

开源大数据社区 & 阿里云 EMR 系列直播 十一期主题:Spark 大数据处理最佳实践讲师:简锋,阿里云 EMR 数据开发平台 负责人内容框架:大数据概览如何摆脱技术小白Spar...

#spark#大数据#flink +2
【实践案例】Databricks 数据洞察 Delta Lake 在基智科技的应用实践

作者高爽,基智科技数据中心负责人尚子钧,数据研发工程师1基智科技北京基智科技有限公司是一家提供智能营销服务的科技公司。公司愿景是基于 AI 和大数据分析为 B2B 企业提供全流程的智能营销...

#大数据#人工智能#hadoop +2
如何通过 EMR 构建弹性低成本离线海量日志大数据分析

点击上方蓝字关注我们,获取最新技术资讯内容概述本实践结合阿里云 EMR 以及日志服务 LOG 、对象存储 OSS 、抢占式 ECS 实例、弹性伸缩等产品,以电商网站日志埋点采集存储投递并利...

#运维#大数据#hadoop +2
EMR 打造高效云原生数据分析引擎

本场视频链接:https://developer.aliyun.com/live/1545?spm=a2c6h.12873639.0.0.244d6dceFT4wxM&groupCode=apachespark本场ppt材料:https://www.slidestalk.com/AliSpark/2019___0926_110365链接可点击文末阅读原文直达基于开源体系打造云上数据分析平台

【ClickHouse 技术系列】- 在 ClickHouse 物化视图中使用 Join

译者何源(荆杭),阿里云计算平台事业部高级产品专家前言本文翻译自 Altinity 针对 ClickHouse 的系列技术文章。面向联机分析处理(OLAP)的开源分析引擎 ClickHou...

#大数据#数据库#python +2
Gluten + Celeborn: 让 Native Spark 拥抱 Cloud Native

作者:张凯@阿里云、陳韋廷@Intel、周渊@Intel一、简介Apache Celeborn(Incubating) 是阿里云捐赠给 Apache 的通用 Remote Shuffle Service,旨在提升大数据计算引擎的性能/稳定性/弹性,目前已广泛应用于生产场景。Gluten 是 Intel 开源的引擎加速项目,旨在通过把 Spark Java Engine 替换为 Native Eng

#spark#云原生#大数据 +1
到底了