タグ

amazon-s3とdata-lakeに関するnabinnoのブックマーク (2)

  • 推奨されるデータレイヤー - AWS 規範ガイダンス

    翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。 推奨されるデータレイヤー 個人を特定できる情報 (PII) を含まないデータなど、機密性のないデータを使用する場合は、 のデータレイクで少なくとも 3 つの異なるデータレイヤーを使用することをお勧めします AWS クラウド。 ただし、データの複雑さとユースケースによっては、追加のレイヤーが必要になる場合があります。たとえば、PII データなどの機密データを使用する場合は、ランディングゾーンとして追加の Amazon Simple Storage Service (Amazon S3) バケットを使用することをお勧めします。次に、raw データレイヤーに移動する前にデータをマスクします。詳細については、このガイドの「機密データの処理」セクションを参照してください。 各

  • データレイヤー内の Amazon S3 バケットに名前を付ける - AWS 規範ガイダンス

    翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。 データレイヤー内の Amazon S3 バケットに名前を付ける 以下のセクションでは、データレイクレイヤー内の Amazon Simple Storage Service (Amazon S3) バケットの命名構造について説明します。ただし、組織の要件に応じて Amazon S3 バケットとパス名をカスタマイズできます。アーカイブ、バージョニング、アクセス、暗号化の要件はレイヤーごとに異なる可能性があるため、レイヤーごとに個別のバケットを作成することをお勧めします。 次の図は、推奨データレイクレイヤー内の Amazon S3 バケットの推奨命名構造を示しています。命名構造は、複数のビジネスユニット、ファイル形式、パーティションを分離します。 データパーティションは、

  • 1