ブロックリファレンス

BLOCKS Reference

機械学習

因子の重要度計算【アルファ版】

このブロックはアルファ版です。利用にあたっては利用申請が必要です。提供している機能は完全でない場合があり、下位互換性のない変更を加える可能性もあります。このため、テスト環境での使用に適しています。利用申請/機能改善の要望/不具合の報告などは、MAGELLAN BLOCKS のお問い合わせ機能からお願いします。

概要

このブロックは、機械学習モデルと BigQuery に格納されたラベル付きデータから予測に大きな影響を及ぼす因子の重要度を計算します。計算結果は、BigQuery テーブルに格納します。

permutation importance ブロックの概念図

ラベル付きデータとは、因子と結果となる値(ラベル)がセットになったデータのことで、トレーニングデータと同じ形式のデータです(トレーニングデータを使用しても良い)。

プロパティ
プロパティ 説明
ブロック名

編集パネルに配置した当該ブロックの表示名が変更できます。

ブロックリストパネル中のブロック名は変更されません。

モデル

推論/予測に使用するタグもしくはモデルを選択します。

現時点で対応するモデルは、以下のとおりです。

  • モデルジェネレーターの数値系(分類・回帰)タイプで作成したモデル
  • DataEditor で作成した AutoML(回帰)および XGBoost(回帰)のモデル

将来的には、「推論/予測」ブロックで扱えるすべてのモデルに対応する予定です。

ラベルのカラム名

ラベル付きデータを持つテーブルにおけるラベルを表すカラム名を指定します。

例えばラベル付きデータを持つテーブルが以下のような内容で、ラベルを表すカラムが class カラムの場合は、class と指定します。

sepal_length sepal_width petal_length petal_width class
5.7 2.6 3.5 1 Iris-versicolor
6.3 2.7 4.9 1.8 Iris-virginica
6.3 3.3 6 2.5 Iris-virginica
... ... ... ... ...
ラベル付きデータの入力元 BigQuery データセット

ラベル付きデータを持つテーブルのデータセットを指定します。

ラベル付きデータの入力元 BigQuery テーブル

ラベル付きデータを持つテーブルを指定します。

因子の重要度データの出力先 BigQuery データセット

因子の重要度データを格納するデータセットを指定します。

因子の重要度データの出力先 BigQuery テーブル

因子の重要度データを格納するテーブルを指定します。

既に同一スキーマのテーブルが存在する場合は、因子の重要度データのレコードが追加されます(異なるスキーマの同名テーブルが存在する場合はエラー)。

このテーブルは、「ラベル付きデータの BigQuery テーブル」の因子と同じカラム名で作成され、それぞれのカラム(因子)ごとにその因子の重要度が格納されます。

例えば、「ラベル付きデータの BigQuery テーブル」が以下のようなデータとします(class カラムがラベル)。

sepal_length sepal_width petal_length petal_width class
5.7 2.6 3.5 1 Iris-versicolor
6.3 2.7 4.9 1.8 Iris-virginica
6.3 3.3 6 2.5 Iris-virginica
... ... ... ... ...

このとき、「因子の重要度データの BigQuery テーブル」は、以下のようになります。

sepal_length sepal_width petal_length petal_width
4.011069011155556 6.45976690288146 2.7153396163069727 1.8859003994673236
ブロックメモ このブロックに関するメモが記載できます。このブロックの処理に影響しません。

この情報は役に立ちましたか?