ブログ

Blog

絞り込んで表示する

2018.12.25 - 

MAGELLAN BLOCKSのData Editorが線形回帰・ロジスティック回帰に対応!

グルーヴノーツ コンサルタントの吉村です。
MAGELLAN BLOCKSのData Editorでクエリーを書かずに線形回帰・ロジスティック回帰を利用することができます。

(本当は11月2日にこのブログを書いて一瞬見た人がいるかもしれないけど、アルファ版だったから一回引っ込めてました。)

※Data Editorで表示されるモデルの重みは、モデルジェネレーターで作成されたモデルの重要度と同じではありません。 比較される際は参考値としてご利用ください。

それでは早速使っていきましょう。データはいつもの電力需要予測です。


1.モデル作成

モデルを作成するにはData Editorに登録されているテーブルから、モデル作成元となるデータが入ったテーブルを選びます。 該当のテーブルのメニューから クエリモデル作成 をクリックします。

モデルを作成するための画面が表示されます。 まずはモデルの種類を選択します。Data Editorで作れるモデルには二種類あります。

  1. 線形回帰
  2. ロジスティック回帰

線形回帰は数値データを元に数値の量を予測するものです。 モデルジェネレーターで言う数値回帰と同じ使い方になります。 今回は線形回帰を利用します。
ロジスティック回帰は数値データを元に分類判断をするものです。 モデルジェネレーターで言う数値分類と同じ使い方になります。

モデルタイプの選択と予測因子の型と予測対象となる項目について設定を行います。 設定が完了したら 作成 をクリックすると線形回帰のモデルが作成されます。



2.モデル情報の確認

モデルが作成されるとテーブル一覧の他にモデル一覧のタブが表示されます このモデル一覧から作成したモデルを選びクリックします。

  1. モデルのスキーマ
  2. 予測因子の項目名および型などの定義
  3. トレーニング情報
  4. モデル作成時に内部的に行われたトレーニングに関する情報
  5. トレーニングデータの特徴情報
  6. 学習データについて予測因子ごとの最大・最小・平均値などの統計情報
  7. データの重み情報
  8. 各予測因子についての重みや切片の情報








3.予測

予測はまずテーブル一覧から予測に使うテーブルを選択します。

テーブルの画面が表示されたところで予測のタブをクリックし、 利用するモデルを選択して 予測 をクリックするとそれだけで予測することができます。

するとそれだけで予測対象のデータに含まれる key ごとに予測結果 predicted_label が表示されます。 この結果から保存をクリックするとDataEditorの新たなテーブルとして利用することができます。

新たなテーブルとして保存ができると言うことは、実績であるlabelと予測結果のpredicted_labelを線グラフにして比較することなんかも簡単に実現できます。

この様に新しくData Editorに追加されたモデル作成の機能は簡単にモデル作成・予測を行うことができます。 重回帰分析と言うとExcelなんかでは16項目までの制限があったりデータ量によって時間がかかったりしますが、 Data Editorであればそう言ったこともなく利用できるのでぜひご活用いただければと思います。