Data Editor によるモデルの作成と予測

Creating query models and making predictions in the Data Editor

概要

Data Editor では、Data Editor 上のデータを使った機械学習のモデル作成と予測が行えます。

現在、Data Editor では、以下のモデルをサポートしています。

モデル 説明
数値回帰

数値の予測に使用します。天候や曜日などから来場者数や販売数を予測したり、交通機関の利用者数を予測したりといったことなどに使用します。

分類

与えられたデータの分類に使用します。クレジットカードや ATM の利用特性から正当利用か不正利用に分類したり、キャンペーンなどの実施により会員登録するかしないかに分類したりといったことなどに使用します。

クラスタリング

データをいくつかの似ているデータの集まり(クラスタリング)に分類します。マーケットの分析やコンピュータビジョンなどのデータ分析において使用します。

数値分類(Deep Learning) Deep Learning による数値分類モデルの作成を行います。与えられたデータの分類に使用します。クレジットカードや ATM の利用特性から正当利用か不正利用に分類したり、キャンペーンなどの実施により会員登録するかしないかに分類したりといったことなどに使用します。
数値回帰(Deep Learning) Deep Learning による数値回帰モデルの作成を行います。数値の予測に使用します。天候や曜日などから来場者数や販売数を予測したり、交通機関の利用者数を予測したりといったことなどに使用します。

Data Editor でモデルを利用する場合の利点は、以下のとおりです。

  • Data Editor 上でデータを構築するだけで、難しい専門知識は不要です。簡単に機械学習が利用できます。
  • 学習データの準備→モデルの作成→評価のサイクルがすべて Data Editor 上で自己完結するため、モデル開発のスピードが向上します。

なお現時点では、数値分類(Deep Learning)・数値回帰(Deep Learning)の Data Editor 内での予測には対応していません。

数値回帰の例

ここでは、「モデルジェネレーターの使い方(数値回帰タイプ)」の電力需要予測データを使った数値回帰の使用例を紹介します。

データの準備

まず、機械学習のモデル作成時に必要となる学習(トレーニング)データを準備します。

ここでは、「モデルジェネレーターの使い方(数値回帰タイプ)」のデータを使用します。

まだ、「モデルジェネレーターの使い方(数値回帰)」を試していない方は、「数値回帰を始める前に」の章を実施して、データを準備してください。

モデルの作成

トレーニングデータの準備ができたら、モデルを作成します。

トレーニングデータを選択する様子
  1. 電力の需要予測の基礎データ_train]をクリック
モデル作成から線形回帰を選択する様子
  1. テーブル]タブをクリック
  2. テーブルの操作]をクリック
  3. モデル作成]をクリック
  4. 線形回帰]をクリック
モデルを作成する様子
  1. 名前を電力の需要予測モデルに変更
  2. 作成]ボタンをクリック

しばらくすると、モデルの作成が完了します。

モデルの確認

モデルの作成が完了したら、作成したモデルの内容を確認して評価します。

ホーム画面へ戻る様子
  1. <]をクリック
モデル一覧へ切り替える様子
  1. モデル]タブをクリック
モデル詳細画面へ切り替える様子
  1. 電力の需要予測モデル]をクリック
モデルのスキーマ情報を確認する様子

モデルの詳細画面では、まずモデルのスキーマ情報(列名と型)が確認できます。

トレーニング情報を確認する様子

トレーニング情報]タブ(❶)をクリックすると、トレーニング(学習)の情報が確認できます。

  • トレーニング繰り返し回数:トレーニングの繰返し回数です。
  • トレーニングデータの損失:トレーニングデータの繰り返し後に計算された損失指標(平均二乗誤差)です。
  • 評価データの損失:評価の損失指標です。
  • 完了時刻:各トレーニングの時間
  • 学習率:各トレーニングの学習率
トレーニングデータの特徴情報を確認する様子

トレーニングデータの特徴情報]タブ(❶)をクリックすると、トレーニングデータの特徴情報が確認できます。

  • 列名:トレーニングデータの列名です。
  • 最小値:トレーニングデータの最小値です。数値以外の場合は、NULL になります。
  • 最大値:トレーニングデータの最大値です。数値以外の場合は、NULL になります。
  • 平均値:トレーニングデータの平均値です。数値以外の場合は、NULL になります。
  • 標準偏差:トレーニングデータの標準偏差です。数値以外の場合は、NULL になります。
  • カテゴリの数:カテゴリの数です。カテゴリ以外の列の場合、NULL になります。
  • NULL の数:NULL の数です。
データの重み情報を確認する様子

データの重み情報]タブ(❶)をクリックすると、トレーニングデータ各列ごとの重み情報が確認できます。

モデルを評価した結果が悪ければ、トレーニングデータの因子(列)を見直して、モデルを作り直し再度評価を行います。このサイクルを良い結果が得られるまで繰り返します。

予測

モデルの内容を確認し問題がなければ、そのモデルを使って予測を行います。

モデル一覧へ戻る様子
  1. <](❶)をクリック
データ一覧画面へ切り替える様子
  1. データ]タブ(❶)をクリック
予測用データをクリックする様子
  1. 電力の需要予測の基礎データ_test](❶)をクリック
予測画面に切り替える様子
  1. 予測]タブ(❶)をクリック
デルを選択し予測を実行する様子
  1. 電力の需要予測モデル](❶)をクリック
  2. 予測]ボタン(❷)をクリック
予測結果を確認する様子

予測が完了すると、結果(❶)が表示されます。

ダウンロード]ボタン(❷)をクリックすると、予測結果の表を CSV 形式のデータでダウンロードできます。

  • 予測結果の画面が複数ページにまたがる場合は、一度表示したページ数分のデータをダウンロード

    予測結果が 3 ページ分あり、2 ページまで画面上で確認し[ダウンロード]ボタンをクリックした場合、2 ページ分のデータがダウンロードされます。

このように Data Editor 上にデータさえあれば、機械学習に関する難しい専門知識なしで、簡単かつ迅速に機械学習が利用できます。

分類の例

ここでは、「モデルジェネレーターの使い方(数値分類タイプ)」のあやめの分類データを使った分類の使用例を紹介します。

データの準備

まず、機械学習のモデル作成時に必要となる学習(トレーニング)データを準備します。

ここでは、「モデルジェネレーターの使い方(数値分類タイプ)」のデータを使用します。

まだ、「モデルジェネレーターの使い方(数値分類)」を試していない方は、「数値分類を始める前に」の章を実施して、データを準備してください。

モデルの作成

トレーニングデータの準備ができたら、モデルを作成します。

トレーニング用データの編集画面へ切り替える様子
  1. あやめの基礎データ_train](❶)をクリック
テーブル操作メニューのモデル作成から分類を選択する様子
  1. テーブル]タブをクリック
  2. テーブルの操作]をクリック
  3. モデル作成]をクリック
  4. 分類]をクリック
モデルを作成する様子
  1. 名前をあやめの分類モデルに変更
  2. 作成]ボタンをクリック

しばらくすると、モデルの作成が完了します。

モデルの確認

モデルの作成が完了したら、作成したモデルの内容を確認して評価します。

ホーム画面へ戻る様子
  1. <]をクリック
モデル一覧画面へ切り替える様子
  1. モデル]タブをクリック
モデル詳細画面へ切り替える様子
  1. あやめの分類モデル]をクリック
モデルのスキーマ情報を確認する様子

モデルの詳細画面では、まずモデルのスキーマ情報(列名と型)が確認できます。

トレーニング情報を確認する様子

トレーニング情報]タブ(❶)をクリックすると、トレーニング(学習)の情報が確認できます。

  • トレーニング繰り返し回数:トレーニングの繰返し回数です。
  • トレーニングデータの損失:トレーニングデータの繰り返し後に計算された損失指標(平均二乗誤差)です。
  • 評価データの損失:評価の損失指標です。
  • 完了時刻:各トレーニングの時間
  • 学習率:各トレーニングの学習率
トレーニングデータの特徴情報を確認する様子

トレーニングデータの特徴情報]タブ(❶)をクリックすると、トレーニングデータの特徴情報が確認できます。

  • 列名:トレーニングデータの列名です。
  • 最小値:トレーニングデータの最小値です。数値以外の場合は、NULL になります。
  • 最大値:トレーニングデータの最大値です。数値以外の場合は、NULL になります。
  • 平均値:トレーニングデータの平均値です。数値以外の場合は、NULL になります。
  • 標準偏差:トレーニングデータの標準偏差です。数値以外の場合は、NULL になります。
  • カテゴリの数:カテゴリの数です。カテゴリ以外の列の場合、NULL になります。
  • NULL の数:NULL の数です。
データの重み情報を確認する様子

データの重み情報]タブ(❶)をクリックすると、トレーニングデータの重み情報が確認できます。

モデルを評価した結果が悪ければ、トレーニングデータの因子(列)を見直して、モデルを作り直し再度評価を行います。このサイクルを良い結果が得られるまで繰り返します。

予測

モデルの内容を確認し問題がなければ、そのモデルを使って予測を行います。

ホーム画面へ戻る様子
  1. <]をクリック
データ一覧画面へ切り替える様子
  1. データ]タブをクリック
予測用データのデータ編集画面へ切り替える様子
  1. あやめの基礎データ_test]をクリック
予測画面へ切り替える様子
  1. 予測]タブをクリック
予測を実行する様子
  1. あやめの分類モデル]をクリック
  2. 予測]ボタンをクリック
予測結果を確認する様子

予測が完了すると、結果(❶)が表示されます。

ダウンロード]ボタン(❷)をクリックすると、予測結果の表を CSV 形式のデータでダウンロードできます。

  • 予測結果の画面が複数ページにまたがる場合は、一度表示したページ数分のデータをダウンロード

    予測結果が 3 ページ分あり、2 ページまで画面上で確認し[ダウンロード]ボタンをクリックした場合、2 ページ分のデータがダウンロードされます。

  • 各ラベルの結果(predicted_label_probs)欄は出力から除外

このように Data Editor 上にデータさえあれば、機械学習に関する難しい専門知識なしで、簡単かつ迅速に機械学習が利用できます。

クラスタリングの例

ここでは、「モデルジェネレーターの使い方(数値分類タイプ)」のあやめの分類データを使ったクラスタリングの使用例を紹介します。

データの準備

まず、機械学習のモデル作成時に必要となるデータを準備します。

ここでは、「モデルジェネレーターの使い方(数値分類タイプ)」のデータを使用します。

まだ、「モデルジェネレーターの使い方(数値分類)」を試していない方は、「数値分類を始める前に」の章を実施して、データを準備してください。

モデルの作成

トレーニングデータの準備ができたら、モデルを作成します。

トレーニング用データのデータ編集画面へ切り替える様子
  1. あやめの基礎データ_train]をクリック
テーブルの操作メニューのモデル作成からクラスタリングをクリックする様子
  1. テーブル]タブをクリック
  2. テーブルの操作]をクリック
  3. モデル作成]をクリック
  4. クラスタリング]をクリック
モデルを作成する様子
  1. 名前をあやめの分析モデルに変更
  2. クラスタ数を 3 に変更
  3. class 列を[使わない]に変更
  4. 作成]ボタンをクリック

しばらくすると、モデルの作成が完了します。

クラスタリングは教師なし学習となるため、トレーニングデータ設定で与えるデータには、答えである class 列は含めません。

モデルの確認

モデルの作成が完了したら、作成したモデルの内容を確認して評価します。

ホーム画面へ戻る様子
  1. <]をクリック
モデル一覧画面に切り替える様子
  1. モデル]タブをクリック
モデル詳細画面へ切り替える様子
  1. あやめの分析モデル]をクリック
モデルのスキーマ情報を確認する様子

モデルの詳細画面では、まずモデルのスキーマ情報(列名と型)が確認できます。

トレーニング情報を確認する様子

トレーニング情報]タブ(❶)をクリックすると、トレーニング(学習)の情報が確認できます。

  • トレーニング繰り返し回数:トレーニングの繰返し回数です。
  • トレーニングデータの損失:トレーニングデータの繰り返し後に計算された損失指標(平均二乗誤差)です。
  • クラスタの重心 ID:クラスタの重心ごとの ID です。
  • クラスタの半径:クラスタの半径です。
  • クラスタのサイズ:クラスタのサイズです。
  • 完了時刻(秒):各トレーニングの時間です。
トレーニングデータの特徴情報を確認する様子

トレーニングデータの特徴情報]タブ(❶)をクリックすると、トレーニングデータの特徴情報が確認できます。

  • 列名:トレーニングデータの列名です。
  • 最小値:トレーニングデータの最小値です。数値以外の場合は、NULL になります。
  • 最大値:トレーニングデータの最大値です。数値以外の場合は、NULL になります。
  • 平均値:トレーニングデータの平均値です。数値以外の場合は、NULL になります。
  • 標準偏差:トレーニングデータの標準偏差です。数値以外の場合は、NULL になります。
  • カテゴリの数:カテゴリの数です。カテゴリ以外の列の場合、NULL になります。
  • NULL の数:NULL の数です。
クラスタの重心情報を確認する様子

クラスタの重心情報]タブ(❶)をクリックすると、トレーニングデータのクラスタの重心情報が確認できます。

  • centroid_id:クラスタの重心ごとにつけられた ID です。
  • feature:列の名前です。
  • numerical_value:feature が数値の場合は、feature が表す列の重心値です。feature が数値以外の場合は、NULL です。
  • categorical_value.category:文字列型の列の場合、重心となる文字列です。数値型の列の場合は空欄です。
  • categorical_value.value:categorical_value.category の重心としての確からしさです。値は 0 から 1 の範囲です。

予測

モデルの内容を確認し問題がなければ、そのモデルを使って予測を行います。

ホーム画面へ戻る様子
  1. <]をクリック
データ一覧画面へ切り替える様子
  1. テーブル]タブをクリック
予測用データのデータ編集画面へ切り替える様子
  1. あやめの基礎データ_test]をクリック
予測画面へ切り替える様子
  1. 予測]タブをクリック
予測を実行する様子
  1. あやめの分析モデル]をクリック
  2. 予測]ボタンをクリック
予測結果を確認する様子

予測が完了すると、結果が表示されます。

ダウンロード]ボタン(❶)をクリックすると、予測結果の表を CSV 形式のデータでダウンロードできます。

  • 予測結果の画面が複数ページにまたがる場合は、一度表示したページ数分のデータをダウンロード

    予測結果が 3 ページ分あり、2 ページまで画面上で確認し[ダウンロード]ボタンをクリックした場合、2 ページ分のデータがダウンロードされます。

  • NEAREST_CENTROIDS_DISTANCE 欄は出力から除外

このように Data Editor 上にデータさえあれば、機械学習に関する難しい専門知識なしで、簡単かつ迅速に機械学習が利用できます。

数値分類(Deep Learning)の例

ここでは、「モデルジェネレーターの使い方(数値分類タイプ)」のあやめの分類データを使った数値分類の使用例を紹介します。

データの準備

まず、機械学習のモデル作成時に必要となるデータを準備します。

ここでは、「モデルジェネレーターの使い方(数値分類タイプ)」のデータを使用します。

まだ、「モデルジェネレーターの使い方(数値分類)」を試していない方は、「数値分類を始める前に」の章を実施して、データを準備してください。

モデルの作成

トレーニングデータの準備ができたら、モデルを作成します。

トレーニング用データのデータ編集画面へ切り替える様子
  1. あやめの基礎データ_train]をクリック
テーブルの操作メニューのモデル作成から数値分類(Deep Learning)をクリックする様子
  1. テーブル]タブをクリック
  2. テーブルの操作]をクリック
  3. モデル作成]をクリック
  4. 数値分類](Deep Learning のマーク付き)をクリック
モデルを作成する様子
  1. モデルに付ける名前を指定
  2. Google Cloud Storage(ストレージ)のバケットを指定(初回のみ)
  3. フォルダー作成]ボタンをクリック(初回のみ)
  4. 1 回の試行の制限時間を設定(モデルの作成では試行を繰り返し学習を行う)
  5. 最大の試行回数を設定
  6. 作成]ボタンをクリック

試行の途中で学習結果が悪化する(学習の過剰状態になる)と、[経過制限時間]を待たずに試行を止めます。また、おおよその時間は、目安です。実際には、付加的・間接的な処理による時間もあるため、もう少し時間がかかる可能性もあります。

続いて、モデルの作成状況を確認します。

トレーニング開始メッセージ画面
  1. 閉じる]ボタンをクリック
ホーム画面へ戻る様子
  1. <]をクリック
モデル一覧でモデルの作成状況を確認する様子
  1. モデル]タブをクリック
  2. プログレスバーでモデル作成の進捗を確認
  3. アイコンクリックで進捗状況を更新
  4. 名前のクリックでそのモデルの詳細を確認

以下は、モデル詳細の例です。

モデルの詳細情報を確認する様子
  1. <]をクリック(モデル一覧に戻る)
モデル一覧画面でメニューを確認する様子

アイコン(❶)をクリックするとメニューが表示され、以下の操作が可能です。

  • 名前の変更
  • モデルの削除

モデルの作成が完了すると、フローデザイナーを使っての予測が可能です。なお、現時点では、Data Editor 内ので予測はできません。

予測については、「モデルジェネレーターの使い方(数値分類)」の「フローデザイナーを作成しよう」の章から「予測結果を確認しよう」の章までを参照願います。

数値回帰(Deep Learning)の例

ここでは、「モデルジェネレーターの使い方(数値回帰タイプ)」の電力需要予測データを使った数値回帰(Deep Learning)の使用例を紹介します。

データの準備

まず、機械学習のモデル作成時に必要となる学習(トレーニング)データを準備します。

ここでは、「モデルジェネレーターの使い方(数値回帰タイプ)」のデータを使用します。

まだ、「モデルジェネレーターの使い方(数値回帰)」を試していない方は、「数値回帰を始める前に」の章を実施して、データを準備してください。

モデルの作成

トレーニングデータの準備ができたら、モデルを作成します。

トレーニング用データのデータ編集画面へ切り替える様子
  1. 電力の需要予測の基礎データ_train]をクリック
テーブルの操作メニューのモデル作成から数値分類(Deep Learning)をクリックする様子
  1. テーブル]タブをクリック
  2. テーブルの操作]をクリック
  3. モデル作成]をクリック
  4. 数値回帰](Deep Learning のマーク付き)をクリック
モデルを作成する様子
  1. モデルに付ける名前を指定
  2. Google Cloud Storage(ストレージ)のバケットを指定(初回のみ)
  3. フォルダー作成]ボタンをクリック(初回のみ)
  4. 1 回の試行の制限時間を設定(モデルの作成では試行を繰り返し学習を行う)
  5. 最大の試行回数を設定
  6. 作成]ボタンをクリック

試行の途中で学習結果が悪化する(学習の過剰状態になる)と、[経過制限時間]を待たずに試行を止めます。また、おおよその時間は、目安です。実際には、付加的・間接的な処理による時間もあるため、もう少し時間がかかる可能性もあります。

続いて、モデルの作成状況を確認します。

トレーニング開始メッセージ画面
  1. 閉じる]ボタンをクリック
ホーム画面へ戻る様子
  1. <]をクリック
モデル一覧でモデルの作成状況を確認する様子
  1. モデル]タブをクリック
  2. プログレスバーでモデル作成の進捗を確認
  3. アイコンクリックで進捗状況を更新
  4. 名前のクリックでそのモデルの詳細を確認

以下は、モデル詳細の例です。

モデルの詳細情報を確認する様子
  1. <]をクリック(モデル一覧に戻る)
モデル一覧画面でメニューを確認する様子

アイコン(❶)をクリックするとメニューが表示され、以下の操作が可能です。

  • 名前の変更
  • モデルの削除

モデルの作成が完了すると、フローデザイナーを使っての予測が可能です。なお、現時点では、Data Editor 内ので予測はできません。

予測については、「モデルジェネレーターの使い方(数値回帰)」の「フローデザイナーを作成しよう」の章から「予測結果を確認しよう」の章までを参照願います。