グルーヴノーツ コンサルタントの吉村です。
今日は、細かい新機能紹介のNo.3です。
MAGELLAN BLOCKSのモデルジェネレーターで数値回帰タイプ・数値分類タイプを利用するのに、ちょっと手数が多くなってしまうのがトレーニングデータ設定の予測因子を設定するところです。
![需要予測で予測因子、トレーニングデータを設定。月情報・曜日情報・休日情報・天気情報 etc...](https://www.magellanic-clouds.com/blocks/wp-content/uploads/2018/10/small_new_func_03_01-700x513.jpg)
この設定が、MAGELLAN BLOCKSの「DataEditor」と直接連携して、設定できるようになりました。(以前は、JSONテキストをコピー&ペーストで間接的に連携していました。)
DataEditorで、データ処理をもっと簡単に。
MAGELLAN BLOCKSのData Editorは、データをわかりやすく視覚的に確認しながら、欠損値の補完や異常値の排除などのデータの加工・編集が、すばやく簡単に実現できるサービスです。
テーブルから自動セット
設定方法は、まずはトレーニングデータ設定の画面までいつもどおり遷移してきます。
すると、トレーニングデータ設定の表の左上に DataEditorから設定 というボタンが増えているのがわかります。
こちらをクリックして見ましょう。
![DataEditorから設定ボタンをクリック](https://www.magellanic-clouds.com/blocks/wp-content/uploads/2018/10/small_new_func_03_02-700x321.jpg)
ここで、DataEditorのデータ一覧が表示されます。
データ一覧から、予測因子として指定したい項目が分かるデータを選択します。
※ここで選択するデータは学習用に分割する前のデータでも大丈夫です。keyという項目が入っていても大丈夫なように実装してもらいました。
![予測因子に使いたいデータテーブルを選択](https://www.magellanic-clouds.com/blocks/wp-content/uploads/2018/10/small_new_func_03_03-700x471.jpg)
![テーブルからの自動セット。キーワードリストを補完したい列を選択](https://www.magellanic-clouds.com/blocks/wp-content/uploads/2018/10/small_new_func_03_05-700x482.jpg)
さて、利用するデータを選びクリックをすると、文字列列挙型でキーワードリストとして取得したい項目の選択肢が表示されます。
画面上の必要な項目にチェックを入れてOKをクリックすると、トレーニングデータ設定の画面に選択したデータが予測因子として表示されます。この時点で前述したとおり、 key とさらに 末尾の項目は含まない状態でリストアップされます。
また、ここでは予測因子としてのデータ型を微調整します。今回であればいつもの電力需要のデータなので、先頭3つの予測因子に月・曜日・フラグ型を設定します。
![天気情報のキーワードリストは、晴,雲,雨,雪など。予測因子のデータ型を微調整して、予測因子の設定が完了](https://www.magellanic-clouds.com/blocks/wp-content/uploads/2018/10/small_new_func_03_06-700x511.jpg)
このDataEditorとの連携機能が実装されたことで、モデルジェネレーターを作成するのがよりスムーズにできるようになりました。このようにMAGELLAN BLOCKSは、大きな機能リリース以外にも日々便利になっていっています。
ぜひ新しい機能をお試しいただければと思います。
※本ブログの内容や紹介するサービス・機能は、掲載時点の情報です。