ブロックリファレンス

BLOCKS Reference

機械学習

ロジスティック回帰(数値分類)モデルの作成

概要

このブロックは、BigQuery MLを使い、BigQuery上のトレーニングデータで ロジスティック回帰(分類)のモデルを作成します。作成したモデルは、BigQueryとDataEditorに登録されます。

このブロックを利用することで、ロジスティック回帰(分類)のモデルを利用した以下のようなユースケースに対応できます。

  • 蓄積されていくデータを用いた再学習
  • モデル作成の試行錯誤
留意事項
  • ロジスティック回帰(分類)は、教師あり学習にあたるため、トレーニングデータに推論/予測の対象となるカラムが必要です。
  • このブロックは、モデル作成の完了を待たずに終了します。
    トレーニングの状態や結果は、DataEditorのモデル一覧で確認できます。
  • Slack通知設定」プロパティを利用すると、モデル作成の完了をSlackで確認できます。
    Slack通知設定」プロパティで指定する内容は、あらかじめプロジェクト設定の通知設定で作成しておきます。

プロパティ

プロパティ名 説明
ブロック名

編集パネルに配置した当該ブロックの表示名が変更できます。

ブロックリストパネル中のブロック名は変更されません。

GCPサービスアカウント

GCPサービスアカウントのリストから適切なGCPサービスアカウントを選択します。

入力BigQueryデータセット

トレーニングデータを格納したBigQueryテーブルが属するBigQueryデータセットを指定します。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
入力BigQueryテーブル

トレーニングデータを格納したBigQueryテーブルを指定します。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
モデル名

DataEditorで参照する際のモデルの名前を指定します。

DataEditorに登録済の名前を指定するとモデルは更新されます。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
トレーニング完了時に付加するタグ名

トレーニングが完了した際に、タグも同時に付けたい場合に指定します。

タグは、別途「推論/予測に使用するタグの設定」ブロックを使って、後付けできます。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
推論/予測の対象に使用するカラム名

トレーニングデータの推論/予測の対象に使用するカラム名を指定します。

ブロックメモ このブロックに関するメモが記載できます。このブロックの処理に影響しません。
トレーニング完了時からのモデル保持日数(0は制限なし)

トレーニング完了時点からモデルを保持する日数を指定します。指定した日数を経過するとモデルは自動で削除されます。0日を指定すると、自動削除されません。

初期値は、0日です。

各クラスの頻度に反比例して各クラスの重みを使用してクラスラベルのバランスを取るかどうか

各クラスの頻度に反比例して各クラスの重みを使用してクラスラベルのバランスを取るか取らないかを指定します。

  • :バランスを取る
  • :バランスを取らない
各クラスラベルに使用する重み

クラスラベルごとに重みを設定します。

適用されるL1正則化の量

L1正則化の適用量を指定します。

適用されるL2正則化の量

L2正則化の適用量を指定します。

トレーニングの反復またはステップの最大数

トレーニングの反復回数またはステップ回数の最大値を指定します。

トレーニング中に学習率を指定するための戦略

トレーニング時の学習率を求める方法を指定します。

  • 直線探索:直線探索のアルゴリズムで学習率を計算します。このアルゴリズムで使用する初期学習率は、「初期学習率」プロパティで指定した値を用います。
  • 一定:学習率を「最急降下法の学習率」プロパティで指定した値で設定します。
初期学習率

トレーニング中に学習率を指定するための戦略」プロパティの「直線探索」で使用する初期学習率を指定します。

トレーニング中に学習率を指定するための戦略」プロパティで、「直線探索」を指定したときのみ設定できます。

最急降下法の学習率

トレーニング中に学習率を指定するための戦略」プロパティの「一定」で使用する学習率を指定します。

トレーニング中に学習率を指定するための戦略」プロパティで、「一定」を指定したときのみ設定できます。

早期停止(相対損失の改善が値よりも小さい最初の反復の後にトレーニングを停止するかどうか)

最初の反復の後で、「トレーニングを継続するために必要な最小相対損失の改善」で指定された値よりも小さいときに、トレーニングを停止するか停止しないかを指定します。

  • :停止する
  • :停止しない
トレーニングを継続するために必要な最小相対損失の改善

早期停止」を指定した場合、トレーニングを継続するために必要な相対的な損失の最小改善量を指定します。

たとえば、0.01の値を指定すると、トレーニングを継続するためには、各反復で損失を1%減少させる必要があります。

p値と標準誤差を計算する

p値と標準誤差を計算するか計算しないかを指定します。

  • :計算する
  • :計算しない
カテゴリー変数(数値でないデータ)の数値化手法

カテゴリー変数(数値でないデータ)の数値化手法を指定します。

Slack通知設定(省略可)

モデル作成完了時に、Slackへその旨のテキストメッセージを送信したい場合に、プロジェクト設定の通知設定で設定したSlack通知の名称を指定します。

Slack通知のイメージ:

モデルの作成が完了したにも関わらずSlackに通知が来ない場合は、何らかの原因(指定したチャンネルがないなど)でSlackの通知に失敗している可能性があります。その場合は、プロジェクト設定の通知設定を確認してください。Slackの通知に失敗している場合は、失敗に関するメッセージが確認できます。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
Slack通知チャンネル設定(省略可)

通知先のSlackチャンネルを指定します。

チャンネルを指定した場合は、プロジェクト設定の通知設定のチャンネルは無視されます。

省略した場合は、通知設定で指定されたチャンネルへ通知されます。

Slack通知ユーザー名設定(省略可)

通知する際のユーザー名を指定します。

ユーザー名を指定した場合は、プロジェクト設定の通知設定のユーザー名は無視されます。

省略した場合は、プロジェクト設定の通知設定で指定されたユーザー名が使われます。

Slack通知アイコン絵文字設定(省略可)

通知する際の絵文字を指定します。

絵文字を指定した場合は、プロジェクト設定の通知設定の絵文字は無視されます。

省略した場合は、プロジェクト設定の通知設定で指定された絵文字が使われます。

この情報は役に立ちましたか?