ブロックリファレンス

Block Reference

BigQuery

複数テーブルからGCSへエクスポート

BigQuery の複数のテーブルを GCS 上のファイル群へ並列にエクスポート(出力)するブロックです。

プロパティ名 説明
ブロック名 ブロックの名前を指定します。ブロックに表示されます。
GCPサービスアカウント このブロックで使用する GCP サービスアカウントを選択します。
出力ファイル群のGCS URL

ファイルの出力先となる GCS 上の URL("gs://バケット名/フォルダー名" のような URL)を指定します。

ファイルは、出力対象のテーブル ID + 出力先ファイルの拡張子 というファイル名で出力されます。

例えば、出力対象のテーブル ID が sample1 および sample2 で、出力先ファイルの拡張子が csv だった場合は、sample1.csv および sample2.csv というファイル名で出力されます。

[% 形式の文字列書式指定可能] [変数展開指定可能]

出力先ファイルの拡張子

出力先ファイルの拡張子を指定します。省略した場合は、「ファイル形式」プロパティによって拡張子が自動設定されます。

[% 形式の文字列書式指定可能] [変数展開指定可能]

出力元のデータセット

出力元のデータセット ID を指定します。

[% 形式の文字列書式指定可能] [変数展開指定可能]

出力元のテーブル

出力対象テーブル群を特定するためのテーブル ID のプリフィックスを指定します。データセット内のすべてのテーブルを出力対象とする場合は、空欄にします。

例えば、データセット内に sample1sample2 および foo というテーブルが存在し、sample と指定した場合は、sample1sample2 のテーブルが出力対象です。

[% 形式の文字列書式指定可能] [変数展開指定可能]

ブロックメモ ブロックに対するコメントを指定します。
エラー時の繰り返し回数 BigQuery のエラーやタイムアウト時の繰り返し回数を指定します。
最小タイムアウト時間 BigQuery からの応答を待つ時間(タイムアウト)を秒単位で指定します。繰り返し回数ごとに2倍に増えます。繰り返し回数ごとに増える時間の最大値は、「最大タイムアウト時間」プロパティで指定します。
最大タイムアウト時間 「最小タイムアウト時間」から繰り返し回数ごとに増やすタイムアウトの最大時間を秒単位で指定します。
ファイル形式

出力するファイルのフォーマットを選択します。選択できるフォーマットは次のいずれかです。

  • CSV
  • NEWLINE_DELIMITED_JSON
CSVの区切り文字

「ファイル形式」が CSV の場合の区切り文字を選択もしくは指定します。選択できる区切り文字は以下のいずれかです。

  • カンマ
  • タブ
  • パイプ
  • その他

「その他」を選択した場合は、「その他」の横にある入力フィールドに、区切り文字を指定してください。

ヘッダー行を出力する 「ファイル形式」が CSV の場合、ヘッダ行を出力するかしないかを指定します。
ファイル圧縮

出力するファイルを圧縮するかどうかを選択します。

  • 圧縮しない
  • GZIP