ブログ

Blog

絞り込んで表示する

2018.10.01 - 

細かい新機能シリーズ No.3 予測因子をデータから自動セット

グルーヴノーツ コンサルタントの吉村です。
今日は、細かい新機能紹介のNo.3です。

MAGELLAN BLOCKSのモデルジェネレーターで数値回帰タイプ・数値分類タイプを利用するのに、ちょっと手数が多くなってしまうのがトレーニングデータ設定の予測因子を設定するところです。

需要予測で予測因子、トレーニングデータを設定。月情報・曜日情報・休日情報・天気情報 etc...

この設定が、MAGELLAN BLOCKSの「DataEditor」と直接連携して、設定できるようになりました。(以前は、JSONテキストをコピー&ペーストで間接的に連携していました。)

DataEditorで、データ処理をもっと簡単に。

MAGELLAN BLOCKSのData Editorは、データをわかりやすく視覚的に確認しながら、欠損値の補完や異常値の排除などのデータの加工・編集が、すばやく簡単に実現できるサービスです。


テーブルから自動セット

設定方法は、まずはトレーニングデータ設定の画面までいつもどおり遷移してきます。

すると、トレーニングデータ設定の表の左上に DataEditorから設定 というボタンが増えているのがわかります。
こちらをクリックして見ましょう。

DataEditorから設定ボタンをクリック

ここで、DataEditorのデータ一覧が表示されます。
データ一覧から、予測因子として指定したい項目が分かるデータを選択します。

※ここで選択するデータは学習用に分割する前のデータでも大丈夫です。keyという項目が入っていても大丈夫なように実装してもらいました。

予測因子に使いたいデータテーブルを選択
テーブルからの自動セット。キーワードリストを補完したい列を選択

さて、利用するデータを選びクリックをすると、文字列列挙型でキーワードリストとして取得したい項目の選択肢が表示されます。

画面上の必要な項目にチェックを入れてOKをクリックすると、トレーニングデータ設定の画面に選択したデータが予測因子として表示されます。この時点で前述したとおり、 key とさらに 末尾の項目は含まない状態でリストアップされます。

また、ここでは予測因子としてのデータ型を微調整します。今回であればいつもの電力需要のデータなので、先頭3つの予測因子に月・曜日・フラグ型を設定します。

天気情報のキーワードリストは、晴,雲,雨,雪など。予測因子のデータ型を微調整して、予測因子の設定が完了

このDataEditorとの連携機能が実装されたことで、モデルジェネレーターを作成するのがよりスムーズにできるようになりました。このようにMAGELLAN BLOCKSは、大きな機能リリース以外にも日々便利になっていっています。

ぜひ新しい機能をお試しいただければと思います。


※本ブログの内容や紹介するサービス・機能は、掲載時点の情報です。