ブロックリファレンス

BLOCKS Reference

文書(限定公開)

言語を判定

このカテゴリーのブロックは限定公開です。利用にあたってはライセンス購入申請が必要です。このカテゴリーのブロックを使用したい場合は、MAGELLAN BLOCKSのお問い合わせ機能からライセンス購入申請をお願いします。

概要

このブロックは、BigQueryテーブルに格納された文書の言語を判定します。判定結果は、結果出力用のBigQueryテーブルのlanguage列に出力します。

対応する言語は、日本語と英語のみです。判定結果の値は、それぞれJapaneseEnglishと出力されます。

言語を判定ブロックの概要図
  • 「結果出力先BigQueryテーブル」は、「言語の判定対象BigQueryテーブル」の内容にlanguage列を加えて出力します。
  • 「言語の判定対象BigQueryテーブル」にlanguage列は不要です。language列があると言語の判定に失敗します。

warningセルフサービスプランの場合は、このブロックを使用する前に、Dataflow APIを有効にしてください。詳しくは、「基本操作ガイド>ヒント> Google APIを有効にする」を参照してください。

プロパティ

プロパティ名 説明
ブロック名 ブロックの名前を指定します。ブロックに表示されます。
GCPサービスアカウント このブロックで使用するGCPサービスアカウントを選択します。
言語の判定対象BigQueryデータセット

言語の判定対象BigQueryテーブル]プロパティで指定するBigQueryテーブルが属するBigQueryデータセットのIDを指定します。

「言語の判定対象BigQueryデータセット」・「結果出力先BigQueryデータセット」・「一時フォルダーGCS URL」のロケーションは合わせる必要があります。BigQueryのデータセットがUSマルチリージョンの場合は、この限りではありません。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
言語の判定対象BigQueryテーブル

言語を判定したい文書が格納されているBigQueryテーブルのIDを指定します。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
結果出力先BigQueryデータセット

結果出力先BigQueryテーブル]プロパティで指定するBigQueryテーブルが属するBigQueryデータセットのIDを指定します。

「言語の判定対象BigQueryデータセット」・「結果出力先BigQueryデータセット」・「一時フォルダーGCS URL」のロケーションは合わせる必要があります。BigQueryのデータセットがUSマルチリージョンの場合は、この限りではありません。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
結果出力先BigQueryテーブル

言語の判定結果を出力するBigQueryテーブルのIDを指定します。

言語の判定結果は、このBigQueryテーブルのlanguage列に出力します。空でないテーブルが存在する場合は、空にして上書きします。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
一時フォルダーGCS URL

このブロックの内部処理で一時的に使用するGCS上のフォルダーを指定します。

内部処理中に、このフォルダーに一時的なファイルが作成されますが、処理終了後は削除されます。

「言語の判定対象BigQueryデータセット」・「結果出力先BigQueryデータセット」・「一時フォルダーGCS URL」のロケーションは合わせる必要があります。BigQueryのデータセットがUSマルチリージョンの場合は、この限りではありません。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
文書の列名

言語の判定対象BigQueryテーブル]プロパティで指定したBigQueryテーブルにおいて、文書が格納されている列の名前を指定します。

ブロックメモ ブロックに対するコメントを指定します。

この情報は役に立ちましたか?