Watson
自然言語分類器の作成とトレーニング【ベータ版】
notifications このブロックはベータ版です。機能改善や不具合などの情報提供は、MAGELLAN BLOCKS のお問い合わせ機能からお願いします。
概要
このブロックは、IBM Watson Natural Language Classifier API open_in_new の Create classifier を BLOCKS から利用できるようにしたものです。
このブロックを実行すると、自然言語分類器(分類器)の作成とトレーニングが行えます。下図は、このブロックの位置づけを表したものです。

-
自然言語分類器の作成とトレーニングブロック
分類器は、テキスト形式のトレーニングデータから学習(トレーニング)を行います。
-
テキストの分類ブロック
トレーニング済みの分類器は、トレーニングされていないテキストデータから、そのテキストの意図を解釈し分類します。分類は、トレーニング時に定められた分類の中から最も適切なもが選択されます。
トレーニングデータの形式は、以下の 3 種類の中から選べます。
- Natural Language Classifier 独自のテキスト形式(CSV)open_in_new
- Google スプレッドシート(BLOCKS 独自機能)
- 配列形式(BLOCKS 独自機能)
以下、各トレーニングデータの形式と、そのデータを BLOCKS(フローデザイナー)でどう扱うかの簡単な解説です。
Natural Language Classifier 独自のテキスト形式(CSV)
info_outline Natural Language Classifier 独自のテキスト形式については、IBM Cloud 資料 open_in_new を参照願います。
ここでは、Natural Language Classifier 独自のデータをフローデザイナーでどう扱うかを解説します。
BLOCKS では、[GCS から変数へロード]ブロックを使うと、Google Cloud Storage(GCS)上のファイルを読み取ってくれます。あとは、このブロックと、[自然言語分類器の作成とトレーニング]ブロックを組み合わせるだけです。
まず、データを GCS へアップロードします。ここでは、weather_data_train.csv というファイルを my-blocks-bucket という GCS 上にバケットにアップロードしたとします(GCS URL: gs://my-blocks-bucket/weather_data_train.csv)。
info_outline BLOCKS の機能 GCS Explorer を使うと簡単にローカル PC のファイルを GCS へアップロードできます。
フローを以下のように作成すると、分類器の作成とトレーニングができます。

warning[GCS から変数へロード]ブロックと[自然言語分類器の作成とトレーニング]ブロックのファイル形式は、いずれも none にしなければなりません。
Google スプレッドシート(BLOCKS 独自機能)
配列形式(BLOCKS 独自機能)
オブジェクトの各メンバーの値が配列値のデータもトレーニングデータとして扱えます(BLOCKS 独自機能)。
以下は、[オブジェクト生成]ブロックでトレーニングデータを設定した例です。データの内容は、前述の Google スプレッドシートと同じものです。

(画像をクリックすると拡大表示されます。)
- 1 つの Object 型を用意(この例の場合、Key 名
data
) - その子要素として Array 型のメンバーを用意
- Array 型の Key が分類値(この例の場合、「
気温
」と「天候
」) - Array 型の子要素が分類するテキスト(型は String)
[オブジェクト生成]ブロックの準備ができたら、フローを以下のように作成すると、分類器の作成とトレーニングができます。

warning[自然言語分類器の作成とトレーニング]ブロックのファイル形式は、None としてください。
warning このブロックの利用にあたっては、お客さまの IBM Cloud open_in_new 環境上で、 Natural Language Classifier サービス open_in_new が利用可能となっている必要があります。また、Natural Language Classifier の資格情報も必要です。