BigQuery
複数テーブルから GCS へエクスポート
概要
このブロックは、BigQuery open_in_new の複数のテーブルを Google Cloud Storage(GCS)open_in_new上のファイル群へ並列に出力(エクスポート)します。

エクスポートするファイルのデータ形式は、以下いずれかのフォーマットが選択できます。
フォーマット | 説明 |
---|---|
CSV | CSV open_in_new 形式のデータです。 |
NEWLINE_DELIMITED_JSON | 改行区切りの JSON 形式データです。JSON Lines open_in_new と同形式です。 |
プロパティ
プロパティ名 | 説明 |
---|---|
ブロック名 |
編集パネルに配置した当該ブロックの表示名が変更できます。 ブロックリストパネル中のブロック名は変更されません。 |
GCP サービスアカウント | このブロックで使用する GCP サービスアカウントを選択します。 |
出力ファイル群の GCS URL |
ファイルの出力先となる GCS 上の URL("gs://バケット名/フォルダー名" のような URL)を指定します。 ファイルは、出力対象のテーブル ID + 出力先ファイルの拡張子 というファイル名で出力されます。 例えば、出力対象のテーブル ID が sample1 および sample2 で、出力先ファイルの拡張子が csv だった場合は、sample1.csv および sample2.csv というファイル名で出力されます。 [変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
出力先ファイルの拡張子 |
出力先ファイルの拡張子を指定します。省略した場合は、「ファイル形式」プロパティによって拡張子が自動設定されます。 [変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
出力元のデータセット |
出力元のデータセット ID を指定します。 [変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
出力元のテーブル |
出力対象テーブル群を特定するためのテーブル ID のプリフィックスを指定します。データセット内のすべてのテーブルを出力対象とする場合は、空欄にします。 例えば、データセット内に sample1、sample2 および foo というテーブルが存在し、sample と指定した場合は、sample1 と sample2 のテーブルが出力対象です。 [変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
ブロックメモ | このブロックに関するメモが記載できます。このブロックの処理に影響しません。 |
ファイル形式 |
出力するファイルのフォーマットを選択します。選択できるフォーマットは次のいずれかです。
|
CSV の区切り文字 |
「ファイル形式」が CSV の場合の区切り文字を選択もしくは指定します。選択できる区切り文字は以下のいずれかです。
「その他」を選択した場合は、「その他」の横の入力フィールドに、区切り文字を指定してください。 |
ヘッダー行を出力する | 「ファイル形式」が CSV の場合、ヘッダ行を出力するかしないかを指定します。 |
ファイル圧縮 |
出力するファイルを圧縮するかどうかを選択します。
このプロパティを使って圧縮したファイルは、そのまま「GCS から単一テーブルへロード」や「GCS から複数テーブルへロード」を使って BigQuery のテーブルにロードできます。 |
出力ファイルに BOM を追加 |
チェックボックスにチェックを付けると出力ファイルに BOM open_in_new を追加します。 |