2025 Data+AI:智能数据架构与应用最佳实践合集.pdf
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
### 智能数据架构与应用实践 #### 腾讯欧拉平台数据血缘架构及应用 腾讯欧拉平台是基于DataOps理念的全方位数据平台,整合了资产工厂、治理引擎、数据发现三个子产品。其中,数据血缘作为核心子模块,为数据治理、数据开发提供支持。 ##### 背景和目标 数据血缘的建设主要基于两个原因:现状满足不了血缘数据需求,和希望通过血缘实现更多功能。腾讯欧拉数据平台为了实现从数据生产到数据应用的全链路覆盖,着手构建了更为广泛和深入的数据血缘架构。 ##### 项目架构 腾讯欧拉数据平台的架构包含三个核心组成部分: 1. 资产工厂:负责数仓建设及模型开发; 2. 治理引擎:全链路成本的数据治理; 3. 数据发现:元数据管理。 数据血缘模块直接服务于这三个部分,实现从数据生产到应用的全程数据管理。 ##### 模块化建设 数据血缘的建设分为两个方面: 1. 广度:实现数据生产、数据加工到数据应用的全链路覆盖。涉及腾讯灯塔、大同等生产环节,欧拉平台加工环节,以及DataTalk报表、TAB的ABtest等应用环节,形成完整的全链路资源。 2. 深度:包括任务血缘、表血缘、字段血缘,重点是字段级别的血缘粒度。正在研发的数值血缘则进一步细化。 任务血缘打通了腾讯内部的多种数据产品,表血缘则构建了包含各种表级别抽象的血缘图谱。字段血缘在表血缘基础上将粒度进一步拓展至字段级别。 ##### 应用场景 腾讯欧拉平台数据血缘架构广泛应用于多产品、跨平台的完整任务血缘关系图谱构建,为数据治理、全链路数据观测提供支持,以及通过血缘成本洞察和数仓开发实现数据管理的进一步优化。 #### 字节跳动数据集成引擎BitSail开源架构演进和实践 字节跳动的BitSail是一个高效且易于使用的数据集成引擎,支持多数据源、任务调度、容错等功能,并通过开源项目对外分享其架构演进和实践经验。 #### 从Bert到LLM:360广告推荐业务中语言模型的应用探索 360公司在广告推荐业务中探讨从Bert到LLM等语言模型的应用,通过深度学习技术提升广告推荐的准确性和效率。 #### 多模态在京东内容算法上的应用 京东利用多模态技术在内容算法上进行应用,通过结合图片、文本等多源数据提升内容推荐的智能化水平。 #### 实时语音交互的游戏队友——网易伏羲AI Agent创新应用 网易伏羲AI Agent通过实时语音交互技术,为游戏玩家提供智能的游戏队友角色,提升游戏互动体验。 #### 阿里云DataWorks湖仓融合数据治理与大模型应用探索 阿里云DataWorks平台将湖仓融合的数据治理与大模型应用结合起来,为大规模数据处理和智能分析提供了解决方案。 #### 蚂蚁集团EB级大数据治理架构与实践 蚂蚁集团处理EB级大数据的治理架构和实践经验,展现其在大数据时代背景下处理海量数据的技术挑战与成果。 #### B站大数据集群管理平台BMR的实践与创新 B站通过大数据集群管理平台BMR实现对大数据集群的高效管理与创新应用,满足视频平台日益增长的数据处理需求。 ------





























剩余148页未读,继续阅读


- 粉丝: 1670
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 广州数控TD数控车床操作编程说明书模板.doc
- 智慧交通系统解决方案.docx
- 互联网创业项目策划书.docx
- 嵌入式培训实习报告总结表.doc
- 网络食品违法行为法律责任汇总表.docx
- 数学教案-课题二:乘法结合律和简便算法1.docx
- 通用版2021年预防网络诈骗班会课件.pptx
- 人工智能技术在城市公路隧道中的应用.doc
- 建设工程项目管理与监理工作的关系.docx
- 西气东输管道工程建设项目管理技术规程.doc
- 数据仓库与数据挖掘实验指导书样本.doc
- 计算机网络体系结构考试试题(最终).doc
- 数据库原理课程设计编写规范模板.doc
- 集团档案信息化建设可行性研究方案.doc
- 项目管理-概念阶段-SOW[最终版].pdf
- 人工智能发展.pptx


