ブロックリファレンス

BLOCKS Reference

BigQuery

複数テーブルから GCS へエクスポート

概要

このブロックは、BigQuery の複数のテーブルを Google Cloud Storage(GCS)上のファイル群へ並列に出力(エクスポート)します。

複数テーブルから GCS へエクスポートブロックの概念図
(図をクリックすると拡大表示されます。)

エクスポートするファイルのデータ形式は、以下いずれかのフォーマットが選択できます。

フォーマット 説明
CSV CSV 形式のデータです。
NEWLINE_DELIMITED_JSON 改行区切りの JSON 形式データです。JSON Lines と同形式です。

プロパティ

プロパティ名 説明
ブロック名

編集パネルに配置した当該ブロックの表示名が変更できます。

ブロックリストパネル中のブロック名は変更されません。

GCP サービスアカウント このブロックで使用する GCP サービスアカウントを選択します。
出力ファイル群の GCS URL

ファイルの出力先となる GCS 上の URL("gs://バケット名/フォルダー名" のような URL)を指定します。

ファイルは、出力対象のテーブル ID + 出力先ファイルの拡張子 というファイル名で出力されます。

例えば、出力対象のテーブル ID が sample1 および sample2 で、出力先ファイルの拡張子が csv だった場合は、sample1.csv および sample2.csv というファイル名で出力されます。

変数展開の指定が可能][% 形式の文字列書式の指定が可能]
出力先ファイルの拡張子

出力先ファイルの拡張子を指定します。省略した場合は、「ファイル形式」プロパティによって拡張子が自動設定されます。

変数展開の指定が可能][% 形式の文字列書式の指定が可能]
出力元のデータセット

出力元のデータセット ID を指定します。

変数展開の指定が可能][% 形式の文字列書式の指定が可能]
出力元のテーブル

出力対象テーブル群を特定するためのテーブル ID のプリフィックスを指定します。データセット内のすべてのテーブルを出力対象とする場合は、空欄にします。

例えば、データセット内に sample1sample2 および foo というテーブルが存在し、sample と指定した場合は、sample1sample2 のテーブルが出力対象です。

変数展開の指定が可能][% 形式の文字列書式の指定が可能]
ブロックメモ このブロックに関するメモが記載できます。このブロックの処理に影響しません。
ファイル形式

出力するファイルのフォーマットを選択します。選択できるフォーマットは次のいずれかです。

  • CSV
  • NEWLINE_DELIMITED_JSON
CSV の区切り文字

「ファイル形式」が CSV の場合の区切り文字を選択もしくは指定します。選択できる区切り文字は以下のいずれかです。

  • カンマ
  • タブ
  • パイプ
  • その他

「その他」を選択した場合は、「その他」の横の入力フィールドに、区切り文字を指定してください。

ヘッダー行を出力する 「ファイル形式」が CSV の場合、ヘッダ行を出力するかしないかを指定します。
ファイル圧縮

出力するファイルを圧縮するかどうかを選択します。

  • 圧縮しない
  • GZIP

このプロパティを使って圧縮したファイルは、そのまま「GCS から単一テーブルへロード」や「GCS から複数テーブルへロード」を使って BigQuery のテーブルにロードできます。

出力ファイルに BOM を追加

チェックボックスにチェックを付けると出力ファイルに BOM を追加します。

この情報は役に立ちましたか?