ブロックリファレンス

BLOCKS Reference

文書(限定公開)

言語を判定

概要

このブロックは、BigQuery テーブルに格納された文書の言語を判定します。判定結果は、結果出力用の BigQuery テーブルの language 列に出力します。

対応する言語は、日本語と英語のみです。判定結果の値は、それぞれ JapaneseEnglish と出力されます。

言語を判定ブロックの概要図
  • 「結果出力先 BigQuery テーブル」は、「言語の判定対象 BigQuery テーブル」の内容に language 列を加えて出力します。
  • 「言語の判定対象 BigQuery テーブル」に language 列は不要です。language 列があると言語の判定に失敗します。

セルフサービスプラン(無料トライアル含む)の場合は、このブロックを使用する前に、Dataflow API を有効にしてください。詳しくは、「基本操作ガイド > ヒント > Google API を有効にする」を参照してください。

文書カテゴリーのブロックはすべて限定公開です。文書カテゴリー各ブロックの利用を希望される場合は、「お問い合わせ」ページより問い合わせ願います。

プロパティ

プロパティ名 説明
ブロック名 ブロックの名前を指定します。ブロックに表示されます。
GCP サービスアカウント このブロックで使用する GCP サービスアカウントを選択します。
言語の判定対象 BigQuery データセット

言語の判定対象 BigQuery テーブル]プロパティで指定する BigQuery テーブルが属する BigQuery データセットの ID を指定します。

言語の判定対象 BigQuery テーブル

言語を判定したい文書が格納されている BigQuery テーブルの ID を指定します。

結果出力先 BigQuery データセット

結果出力先 BigQuery テーブル]プロパティで指定する BigQuery テーブルが属する BigQuery データセットの ID を指定します。

結果出力先 BigQuery テーブル

言語の判定結果を出力する BigQuery テーブルの ID を指定します。

言語の判定結果は、この BigQuery テーブルの language 列に出力します。

一時フォルダー GCS URL

このブロックの処理で一時的に使用する GCS 上のフォルダーを GCS URL で指定します。

文書の列名

言語の判定対象 BigQuery テーブル]プロパティで指定した BigQuery テーブルにおいて、文書が格納されている列の名前を指定します。

ブロックメモ ブロックに対するコメントを指定します。