亚马逊数据区域（AmazonDataZone）与数据安全管理

### 亚马逊数据区域（Amazon DataZone）与数据安全管理在当今数字化时代，数据的有效管理和安全共享至关重要。亚马逊提供了一系列工具和服务来帮助企业实现这一目标，其中亚马逊数据区域（Amazon DataZone）在数据发现、共享和治理方面发挥着重要作用，同时亚马逊红移（Amazon Redshift）也提供了强大的安全和访问控制功能。 #### 亚马逊数据区域（Amazon DataZone） ##### 数据门户数据门户是控制台之外的个性化主页，为用户提供自助服务功能，用户可以在目录中搜索数据。它是用户访问亚马逊数据区域的主要方式，是一个基于浏览器的 Web 应用程序，支持用户进行数据编目、发现、治理、共享和分析。借助该门户，用户可以利用身份提供商的现有凭证，在使用数据和分析工具时实现跨职能协作，还能访问数据资产的个性化视图，而无需登录 AWS 管理控制台或了解底层的 AWS 分析服务。 ##### 入门指南采用数据网格架构不仅需要技术支持，还需要思维方式的转变。企业需要组织团队并实施相应流程，向生产者 - 消费者模型转型。域（Domain）为团队提供了一种机制，有助于在业务数据目录中生产和编目数据时贯彻组织纪律。任何数据生产者都可以将数据资产发布到特定域的目录中，该域负责管理数据并控制消费者的访问权限。一个域可以与多个项目关联，以满足不同的业务用例，人们可以在这些项目中协作和访问数据。以下是设置亚马逊数据区域的基本步骤： 1. **创建域和数据门户**：这是使用亚马逊数据区域的第一步。域是亚马逊数据区域对象的集合，包括数据资产、项目、关联的 AWS 账户和数据源等。在域中，用户和团队可以创建所有相关的亚马逊数据区域实体，包括元数据资产。用户可以将数据资产发布到特定域的目录中，并控制关联的 AWS 账户和资源对该域的访问权限。 2. **创建生产者项目**：作为生产者创建和发布数据产品，需要创建一个项目来组织数据产品和相关资产。创建项目时，需要指定项目配置文件和数据源连接详细信息。项目配置文件决定了项目的功能，以及项目是作为生产者、消费者还是两者兼具；连接详细信息则针对数据源。因此，在创建项目之前，需要先创建项目配置文件和 AWS Glue 连接。对于数据仓库生产者，还需要输入额外信息，如 Amazon Redshift 集群名称和 AWS Glue 连接详细信息。创建项目时，使用数据门户 URL 导航到亚马逊数据区域数据门户，使用单点登录（SSO）或 AWS 凭证登录，然后在“我的项目”菜单中点击“+”号创建新项目。 3. **生成用于发布的数据**：在将数据资产发布到数据目录之前，需要创建要与消费者共享的数据对象和数据。从之前创建的生产者项目中，点击“分析工具”下的“查询数据 - Amazon Redshift”，登录到 Amazon Redshift 集群，创建数据表并设置数据。这将带你进入 Amazon Redshift 查询编辑器 V2，使用“联合用户”选项登录数据仓库，在这里可以创建数据库对象和数据。如果已经有表，可以在发布数据产品时选择包含这些表。 4. **将数据产品发布到目录**：当生产者准备好数据产品后，可以将其发布到业务数据目录，供消费者搜索和订阅。发布时，选择生产者项目并选择“发布数据”。发布通过带有发布协议的作业完成，可以从要发布数据产品的项目中选择“发布”选项卡，然后选择“发布协议”来创建发布协议。发布过程通过作业触发，用户还可以监控作业状态。 5. **创建消费者项目**：消费者要订阅底层数据产品，需要创建一个具有消费者配置文件的消费者项目。在创建消费者配置文件时，需要添加数据仓库消费者功能。当用户使用门户在目录中识别出数据集后，需要在请求访问该数据集之前选择消费者项目。亚马逊数据区域将根据访问控制集验证请求，并仅授权能够访问项目和数据资产的个人、组和角色。 6. **发现和消费数据**：将数据资产发布到域后，订阅者可以使用亚马逊数据区域门户发现并请求订阅该数据资产。消费者首先通过搜索和浏览目录来查找所需的资产，选择消费者项目并在搜索框中输入关键词，亚马逊数据区域将搜索所有已发布的目录，并返回匹配关键词的数据产品列表。消费者可以选择所需的数据集，并在业务术语表中了解更多信息。确认选择的数据集后，可以请求访问并开始分析。 7. **生产者批准访问请求**：生产者可以通过生产者项目批准消费者的访问请求。生产者可以导航到生产者项目，选择“发布”选项卡下的“订阅请求”选项卡，查看所有待批准的订阅请求，并批准请求并指定批准原因。这些信息将被记录下来，以便日后跟踪谁批准了访问以及批准请求的详细信息。 8. **消费者分析已发布的数据资产**：一旦请求获得批准，订阅者可以使用消费者项目查看批准状态，并根据数据源类型和数据存储位置，使用 Amazon Athena 或 Amazon Redshift 查询编辑器查看数据。在开始为数据网格设置亚马逊数据区域

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

亚马逊数据区域（AmazonDataZone）与数据安全管理

相关推荐

专栏目录

亚马逊数据区域（AmazonDataZone）与数据安全管理

相关推荐

数据湖+安全与合格性技术教程

混合多云安全，始于数据互联与集成的安全管理平台.pdf

使用kettle完成数据集管理.pptx

Amazon S3：S3数据安全与加密.docx

推荐系统亚马逊数据集-amazon-men数据集

推荐系统亚马逊数据集-amazon-boys and girls数据集

Amazon S3：S3跨区域复制与数据同步技术教程.docx

Amazon Product Dataset 2020 亚马逊产品数据集-数据集

amazon_scrapy：使用scrapy获取亚马逊数据。 我们可以在数据科学中使用scrapy。 在此过程中，我们可以存储数据，并且可以分析数据以执行某些操作

Amazon股票数据集，亚马逊亚马孙股票数据（1997-2025）

分别实现：1.对模糊车牌图像进行清晰处理；2.对高斯模糊图像进行高斯平滑滤波处理；3.对椒盐噪声图像进行中值滤波处理；4

专栏目录

最新推荐

Rust模块系统与JSON解析：提升代码组织与性能

Rust应用中的日志记录与调试

Rust编程：模块与路径的使用指南

Rust项目构建与部署全解析

iOS开发中的面部识别与机器学习应用

AWS无服务器服务深度解析与实操指南

Rust开发实战：从命令行到Web应用

React应用性能优化与测试指南

并发编程中的锁与条件变量优化

Rust数据处理：HashMaps、迭代器与高阶函数的高效运用

amazon_scrapy：使用scrapy获取亚马逊数据。我们可以在数据科学中使用scrapy。在此过程中，我们可以存储数据，并且可以分析数据以执行某些操作