BigQuery の機能や用途などの基礎的な知識について調べてみたのでここにメモします。
BigQuery
BigQuery は、Google がクラウド上で提供している「データウェアハウス(DWH)」の名称です。
BigQuery を活用すると、ビッグデータを超高速で解析することも可能とのことです。Google の社内では、もともと「Dremel (ドレメル) 」というツールによってビッグデータの解析が行われていましたが、この Dremel の機能を一般のユーザーでも利用できるようにしたものが BigQuery です。
特徴・メリット
データ処理が高速
特徴は、データの処理速度が非常に速い点です。TB・PB(ペタバイト)単位の膨大なデータに対するクエリ(ソフトウェアに対する処理要求)も、数秒~数分で処理が完了します。
各種ツールとの連携
様々なデータソースや外部ツールと連携して、大量のデータを格納・整理できます。またGoogleアナリティクスやGoogleスプレッドシートなどGoogleが提供する各種プロダクトとの親和性が高く、データの分析や整理を強力にサポートしてくれます。
利用コスト
基本的にサービスを利用した分だけ料金が発生する従量課金制です。
BigQuery を無料で使えるプランは[BigQueryサンドボックス]というプランです。BigQuery サンドボックスであれば、ストレージの容量やクエリの処理量に関わらず、料金が発生することはありません。
また、クレジットカードの登録も不要です。
技術的なハードルが低い
BigQuery は完全サーバーレスのクラウドサービスなので、全ての機能を Web ブラウザの UI で利用できます。
GA4 との連携が可能
アクセス解析サービスのGA4(Google Analytics 4)と連携ができ、GA4単体ではできない詳細なデータ分析が可能です。
利用方法
BigQueryを初めて利用する場合、まずは公式サイト(BigQuery エンタープライズ向けデータ ウェアハウス | Google Cloud)にアクセスします。
「BigQueryの無料トライアル」
「BigQueryの無料トライアル」を選択し、画面の案内に従ってアカウント情報やお支払情報などの必要事項を入力します。入力が完了すると、Google Cloud Platform(GCP)に登録され、BigQueryが使えるようになります。
データ分析
データを分析する際は、まず「プロジェクト」を作成する必要があります。画面上部の「新しいプロジェクト」を選択し、任意の名前でプロジェクトを作成します。
次に、プロジェクト内に「データセット」を作成します。対象のプロジェクト名の右側にある「アクションを表示」のアイコンから「データセットを作成」を選択します。
次に、データセット内にデータを読み込むための「テーブル」を作成します。データセット名の横にある「アクションを表示」のアイコンから「テーブルを作成」を選択します。
テーブルの作成画面で、テーブルの作成元やアップロードするデータ、テーブル名などを設定し、「テーブルを作成」を選択します。
データセットが作成されます。