BigQuery 簡介

BigQuery 是內建 AI 的全代管資料平台,內建機器學習、搜尋、地理空間分析和商業智慧等功能,有助於管理及分析資料。您可以使用 SQL 和 Python 等語言,透過 BigQuery 的無伺服器架構,解答貴機構最棘手的問題,而且完全不需要管理基礎架構。

BigQuery 提供一致的方式處理結構化和非結構化資料,並支援 Apache Iceberg、Delta 和 Hudi 等開放式資料表格式。BigQuery 串流支援持續資料擷取和分析,而 BigQuery 可擴充的分散式分析引擎可讓您在幾秒內查詢 TB 資料,在幾分鐘內查詢 PB 資料。

BigQuery 提供內建的治理功能,可讓您探索及整理資料,以及管理中繼資料和資料品質。您可以透過語意搜尋和資料沿革等功能,找出並驗證用於分析的相關資料。您可以透過存取控管機制,在貴機構內分享資料和 AI 資產。這些功能採用 Dataplex Universal Catalog,這是一項統合式智慧型治理解決方案,可管理 Google Cloud中的資料和 AI 資產。

BigQuery 的架構包含兩個部分:用於擷取、儲存及最佳化資料的儲存層,以及提供分析功能的運算層。這些運算和儲存層可獨立運作,且效率極高,這要歸功於 Google 的 petabit 等級網路,可讓這些層之間進行必要的通訊。

傳統資料庫通常必須在讀取/寫入作業和分析作業之間共用資源。這可能會導致資源衝突,並在寫入或讀取儲存空間中的資料時,導致查詢速度變慢。當資料庫管理工作 (例如指派或撤銷權限) 需要資源時,共用資源集區可能會進一步受限。BigQuery 將運算層和儲存層分開,讓每個層都能動態分配資源,且不會影響其他層的效能或可用性。

BigQuery 架構會使用 petabit 網路將資源分開。

這項分離原則可讓 BigQuery 加快創新,因為儲存空間和運算資源的改善措施可獨立部署,不會造成停機或對系統效能造成負面影響。您也必須提供全代管的無伺服器資料倉儲,由 BigQuery 工程團隊負責更新和維護。這樣一來,您就不需要佈建或手動調整資源,可以專注於提供價值,而非處理傳統資料庫管理工作。

BigQuery 介面包括 Google Cloud 主控台介面和 BigQuery 指令列工具。開發人員和資料科學家可以使用用戶端程式庫,搭配熟悉的程式語言 (包括 Python、Java、JavaScript 和 Go) 以及 BigQuery 的 REST API 和 RPC API,轉換及管理資料。ODBC 和 JDBC 驅動程式可與現有應用程式互動,包括第三方工具和公用程式。

無論您是資料分析師、資料工程師、資料倉儲管理員或資料科學家,BigQuery 都能協助您載入、處理及分析資料,以利做出重要業務決策。

開始使用 BigQuery

您可以在幾分鐘內開始探索 BigQuery。善用 BigQuery 的免費方案或免費沙箱,開始載入及查詢資料。

  1. BigQuery 沙箱:在 BigQuery 沙箱中開始使用,無須付費且不必擔心風險。
  2. Google Cloud 控制台快速入門:瞭解 BigQuery 控制台的強大功能。
  3. 公開資料集:探索公開資料集計畫提供的大量實際資料,體驗 BigQuery 的效能。

探索 BigQuery

BigQuery 的無伺服器基礎架構可讓您專注於資料,而非資源管理。BigQuery 結合了雲端式資料倉儲和強大的分析工具。

BigQuery 儲存空間

BigQuery 會使用資料欄式儲存格式儲存資料,這種格式可針對分析查詢進行最佳化。BigQuery 會以資料表、資料列和資料欄的形式呈現資料,並提供資料庫交易語義 (ACID) 的完整支援。BigQuery 儲存空間會自動複製到多個位置,提供高可用性。

詳情請參閱「BigQuery 儲存空間簡介」。

BigQuery 分析

描述性和規範性分析的用途包括商業智慧、專案分析、地理空間分析和機器學習。您可以查詢儲存在 BigQuery 中的資料,或使用外部資料表或聯合查詢 (包括儲存在 Google 雲端硬碟中的 Cloud Storage、Bigtable、Spanner 或 Google 試算表),對資料所在位置執行查詢。

詳情請參閱「BigQuery 數據分析總覽」。

BigQuery 管理

BigQuery 可集中管理資料和運算資源,而身分與存取權管理 (IAM) 則可協助您透過在整個 Google Cloud中使用的存取模式,保護這些資源。Google Cloud 安全性最佳做法提供穩固且靈活的做法,可納入傳統的邊界安全防護,或更複雜且精細的縱深防禦做法

  • 資料安全性和管理簡介可協助您瞭解資料管理,以及保護 BigQuery 資源可能需要的控管機制。
  • 「工作」是指 BigQuery 代表您執行的動作,包括載入、匯出、查詢或複製資料。
  • 保留項目可讓您在「以量計價」和「以運算資源為基礎」的定價模式之間切換。

詳情請參閱「BigQuery 管理簡介」。

BigQuery 資源

探索 BigQuery 資源:

API、工具和參考資料

適用於 BigQuery 開發人員和分析師的參考資料:

Gemini 版 BigQuery 功能

Gemini in BigQuery 是 Gemini for Google Cloud 產品組合的一部分,提供 AI 輔助功能,協助您處理資料。

Gemini in BigQuery 提供 AI 輔助功能,可協助您執行下列作業:

如要瞭解如何在 BigQuery 中設定 Gemini,請參閱「在 BigQuery 中設定 Gemini」。

BigQuery 角色和資源

BigQuery 可滿足下列角色和職責的資料專家需求。

資料分析師

如需執行下列操作,請參閱工作指南:

如要在 Google Cloud 控制台中直接瞭解 BigQuery 的資料分析功能,請按一下「開始導覽」

觀看導覽

資料管理員

如需執行下列操作,請參閱工作指南:

詳情請參閱「BigQuery 管理簡介」。

如要在 Google Cloud 控制台中直接參閱 BigQuery 資料管理功能的導覽,請按一下「參閱導覽」

觀看導覽

資料科學家

如要使用 BigQuery ML 的機器學習功能執行下列作業,請參考以下指引:

資料開發人員

如需執行下列操作,請參閱工作指南:

BigQuery 影片教學課程

以下一系列教學影片可協助您開始使用 BigQuery:

標題

說明

如何開始使用 BigQuery (17:18) 概略說明 BigQuery 的用途和使用方式。主題包括:ETL 管道、價格和最佳化、BigQuery ML 和 BI Engine,最後在 Google Cloud 控制台中示範 BigQuery。
什麼是 BigQuery?(4:39) 概略說明 BigQuery 的設計方式,以及如何擷取及儲存大量資料,以便分析師和開發人員使用
使用 BigQuery 沙箱 (3:05) 如何設定 BigQuery 沙箱,讓您不必使用信用卡就能執行查詢
提問、執行查詢 (5:11) 如何在 BigQuery UI 中編寫及執行 SQL 查詢,以及選擇中獎球衣號碼
將資料載入 BigQuery (5:31) 如何即時擷取及分析資料,或一次性批次分析資料 - 以及貓咪與狗狗
以視覺化方式呈現查詢結果 (5:38) 資料視覺化功能如何協助您更輕鬆地瞭解及內化複雜的資料集
使用 IAM 管理存取權 (5:23) 如何透過 IAM 權限和存取權控管功能,允許其他使用者在 BigQuery 中查詢您的資料集
儲存及共用查詢 (6:17) 如何輕鬆在 BigQuery 中儲存及分享查詢
使用授權檢視畫面保護機密資料 (7:12) 如何設定自訂存取權控制項,輕鬆與其他使用者共用資料集
使用 BigQuery 查詢外部資料 (5:49) 如何在 BigQuery 中設定外部資料來源,以及查詢 Cloud Storage、Cloud SQL、Google 雲端硬碟等來源的資料
什麼是使用者定義函式?(4:59) 如何建立使用者定義的函式 (UDF),以便在 BigQuery 中分析資料集

後續步驟