ブロックリファレンス

BLOCKS Reference

BigQuery

単一テーブルから GCS へエクスポート

概要

BigQuery のテーブルを GCS 上のファイルへ出力(エクスポート)するブロックです。

単一テーブルから GCS へエクスポートブロックの概念図

エクスポートするファイルのデータ形式は、以下いずれかのフォーマットが選択できます。

フォーマット 説明
CSV CSV 形式のデータです。
NEWLINE_DELIMITED_JSON 改行区切りの JSON 形式データです。JSON Lines と同形式です。

プロパティ

プロパティ名 説明
ブロック名

編集パネルに配置した当該ブロックの表示名が変更できます。

ブロックリストパネル中のブロック名は変更されません。

GCP サービスアカウント このブロックで使用する GCP サービスアカウントを選択します。
出力先ファイルの GCS URL

出力先 GCS 上のファイル URL("gs://バケット名/ファイル名" のような URL)を指定します。

URL にはワイルドカードを 1 つまで含められらます。これは出力サイズが大きいときには必須です。詳しくは、Google のドキュメント「1 つまたは複数のファイルへのデータのエクスポート 」>「単一のワイルドカード URI」の項を参照してください。「複数のワイルドカード URI」はサポートしていません。

制限事項や留意事項など詳しくは、Google のドキュメント「テーブルデータのエクスポート 」を参照してください。

変数展開の指定が可能][% 形式の文字列書式の指定が可能]
出力元のデータセット

出力元のデータセット ID を指定します。

変数展開の指定が可能][% 形式の文字列書式の指定が可能]
出力元のテーブル

出力元のテーブル ID を指定します。

変数展開の指定が可能][% 形式の文字列書式の指定が可能]
ブロックメモ このブロックに関するメモが記載できます。このブロックの処理に影響しません。
エラー時の繰り返し回数 BigQuery のエラーやタイムアウト時の繰り返し回数を指定します。
最小タイムアウト時間 BigQuery からの応答を待つ時間(タイムアウト)を秒単位で指定します。繰り返し回数ごとに 2 倍に増えます。繰り返し回数ごとに増える時間の最大値は、「最大タイムアウト時間」プロパティで指定します。
最大タイムアウト時間 「最小タイムアウト時間」から繰り返し回数ごとに増やすタイムアウトの最大時間を秒単位で指定します。
ファイル形式

出力するファイルのフォーマットを選択します。選択できるフォーマットは次のいずれかです。

  • CSV
  • NEWLINE_DELIMITED_JSON
CSV の区切り文字

「ファイル形式」が CSV の場合の区切り文字を選択もしくは指定します。選択できる区切り文字は以下のいずれかです。

  • カンマ
  • タブ
  • パイプ
  • その他

「その他」を選択した場合は、「その他」の横の入力フィールドに、区切り文字を指定してください。

ヘッダー行を出力する 「ファイル形式」が CSV の場合、ヘッダ行を出力するかしないかを指定します。
ファイル圧縮

出力するファイルを圧縮するかどうかを選択します。

  • 圧縮しない
  • GZIP

このプロパティを使って圧縮したファイルは、そのまま「GCS から単一テーブルへロード」や「GCS から複数テーブルへロード」を使って BigQuery のテーブルにロードできます。

出力ファイルに BOM を追加

チェックボックスにチェックを付けると出力ファイルに BOM を追加します。

この情報は役に立ちましたか?