文書(限定公開)
言語を判定
notifications このカテゴリーのブロックは限定公開です。利用にあたってはライセンス購入申請が必要です。このカテゴリーのブロックを使用したい場合は、MAGELLAN BLOCKS のお問い合わせ機能からライセンス購入申請をお願いします。
概要
このブロックは、BigQuery テーブルに格納された文書の言語を判定します。判定結果は、結果出力用の BigQuery テーブルの language 列に出力します。
対応する言語は、日本語と英語のみです。判定結果の値は、それぞれ Japanese・English と出力されます。

- 「結果出力先 BigQuery テーブル」は、「言語の判定対象 BigQuery テーブル」の内容に language 列を加えて出力します。
- 「言語の判定対象 BigQuery テーブル」に language 列は不要です。language 列があると言語の判定に失敗します。
warning セルフサービスプラン(無料トライアル含む)の場合は、このブロックを使用する前に、Dataflow API を有効にしてください。詳しくは、「基本操作ガイド > ヒント > Google API を有効にする」を参照してください。
プロパティ
プロパティ名 | 説明 |
---|---|
ブロック名 | ブロックの名前を指定します。ブロックに表示されます。 |
GCP サービスアカウント | このブロックで使用する GCP サービスアカウントを選択します。 |
言語の判定対象 BigQuery データセット |
[言語の判定対象 BigQuery テーブル]プロパティで指定する BigQuery テーブルが属する BigQuery データセットの ID を指定します。 warning「言語の判定対象 BigQuery データセット」・「結果出力先 BigQuery データセット」・「一時フォルダー GCS URL」のロケーションは合わせる必要があります。BigQuery のデータセットが US マルチリージョンの場合は、この限りではありません。 [変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
言語の判定対象 BigQuery テーブル |
言語を判定したい文書が格納されている BigQuery テーブルの ID を指定します。 [変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
結果出力先 BigQuery データセット |
[結果出力先 BigQuery テーブル]プロパティで指定する BigQuery テーブルが属する BigQuery データセットの ID を指定します。 warning「言語の判定対象 BigQuery データセット」・「結果出力先 BigQuery データセット」・「一時フォルダー GCS URL」のロケーションは合わせる必要があります。BigQuery のデータセットが US マルチリージョンの場合は、この限りではありません。 [変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
結果出力先 BigQuery テーブル |
言語の判定結果を出力する BigQuery テーブルの ID を指定します。 言語の判定結果は、この BigQuery テーブルの language 列に出力します。空でないテーブルが存在する場合は、空にして上書きします。 [変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
一時フォルダー GCS URL |
このブロックの内部処理で一時的に使用する GCS 上のフォルダーを指定します。 内部処理中に、このフォルダーに一時的なファイルが作成されますが、処理終了後は削除されます。 warning「言語の判定対象 BigQuery データセット」・「結果出力先 BigQuery データセット」・「一時フォルダー GCS URL」のロケーションは合わせる必要があります。BigQuery のデータセットが US マルチリージョンの場合は、この限りではありません。 [変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
文書の列名 |
[言語の判定対象 BigQuery テーブル]プロパティで指定した BigQuery テーブルにおいて、文書が格納されている列の名前を指定します。 |
ブロックメモ | ブロックに対するコメントを指定します。 |