ブロックリファレンス

BLOCKS Reference

文書(限定公開)

言語を判定

概要

このブロックは、BigQuery テーブルに格納された文書の言語を判定します。判定結果は、結果出力用の BigQuery テーブルの language 列に出力します。

対応する言語は、日本語と英語のみです。判定結果の値は、それぞれ JapaneseEnglish と出力されます。

言語を判定ブロックの概要図
  • 「結果出力先 BigQuery テーブル」は、「言語の判定対象 BigQuery テーブル」の内容に language 列を加えて出力します。
  • 「言語の判定対象 BigQuery テーブル」に language 列は不要です。language 列があると言語の判定に失敗します。

セルフサービスプラン(無料トライアル含む)の場合は、このブロックを使用する前に、Dataflow API を有効にしてください。詳しくは、「基本操作ガイド > ヒント > Google API を有効にする」を参照してください。

文書カテゴリーのブロックはすべて限定公開です。文書カテゴリー各ブロックの利用を希望される場合は、「お問い合わせ」ページより問い合わせ願います。

プロパティ

プロパティ名 説明
ブロック名 ブロックの名前を指定します。ブロックに表示されます。
GCP サービスアカウント このブロックで使用する GCP サービスアカウントを選択します。
言語の判定対象 BigQuery データセット

言語の判定対象 BigQuery テーブル]プロパティで指定する BigQuery テーブルが属する BigQuery データセットの ID を指定します。

「言語の判定対象 BigQuery データセット」・「結果出力先 BigQuery データセット」・「一時フォルダー GCS URL」のロケーションは合わせる必要があります。BigQuery のデータセットが US マルチリージョンの場合は、この限りではありません。

言語の判定対象 BigQuery テーブル

言語を判定したい文書が格納されている BigQuery テーブルの ID を指定します。

結果出力先 BigQuery データセット

結果出力先 BigQuery テーブル]プロパティで指定する BigQuery テーブルが属する BigQuery データセットの ID を指定します。

「言語の判定対象 BigQuery データセット」・「結果出力先 BigQuery データセット」・「一時フォルダー GCS URL」のロケーションは合わせる必要があります。BigQuery のデータセットが US マルチリージョンの場合は、この限りではありません。

結果出力先 BigQuery テーブル

言語の判定結果を出力する BigQuery テーブルの ID を指定します。

言語の判定結果は、この BigQuery テーブルの language 列に出力します。空でないテーブルが存在する場合は、空にして上書きします。

一時フォルダー GCS URL

このブロックの内部処理で一時的に使用する GCS 上のフォルダーを指定します。

内部処理中に、このフォルダーに一時的なファイルが作成されますが、処理終了後は削除されます。

「言語の判定対象 BigQuery データセット」・「結果出力先 BigQuery データセット」・「一時フォルダー GCS URL」のロケーションは合わせる必要があります。BigQuery のデータセットが US マルチリージョンの場合は、この限りではありません。

文書の列名

言語の判定対象 BigQuery テーブル]プロパティで指定した BigQuery テーブルにおいて、文書が格納されている列の名前を指定します。

ブロックメモ ブロックに対するコメントを指定します。

この情報は役に立ちましたか?