ブロックリファレンス

BLOCKS Reference

最終更新日：2023年12月21日

機械学習

AutoML（分類）モデルの作成

概要

このブロックは、GoogleのAutoMLテーブルを使い、BigQuery上のトレーニングデータで分類モデルを作成します。作成したモデルは、BigQueryとDataEditorに登録されます。

（図をクリックすると拡大表示されます。）

トレーニングデータは、以下の要件を満たす必要があります。

100 GB以下
推論／予測する値（カラム）が含まれている
列数は2から1,000列の範囲内
行数は1,000から200,000,000行の範囲内
1,000行では予測精度の高いモデルをトレーニングするには不十分な場合があります。分類モデルでは、カラム数の少なくとも10倍の行数を準備する必要があります。

このブロックを利用することで、以下のようなユースケースに対応できます。

蓄積されていくデータを用いた再学習
モデル作成の試行錯誤

プロパティ

プロパティ名説明

ブロック名

編集パネルに配置した当該ブロックの表示名が変更できます。

ブロックリストパネル中のブロック名は変更されません。

GCPサービスアカウント

このブロックで使用するBigQueryテーブルにアクセス可能なGCPサービスアカウントを指定します。

入力BigQueryデータセット

トレーニングデータを格納したBigQueryテーブルが属するBigQueryデータセットを指定します。

［変数展開の指定が可能］［%形式の文字列書式の指定が可能］

入力BigQueryテーブル

トレーニングデータを格納したBigQueryテーブルを指定します。

［変数展開の指定が可能］［%形式の文字列書式の指定が可能］

モデル名

DataEditorで参照する際の名前を指定します。

［変数展開の指定が可能］［%形式の文字列書式の指定が可能］

トレーニング完了時に付加するタグ名

トレーニングが完了した際に、タグも同時に付けたい場合に指定します。

タグは、別途「推論／予測に使用するタグの設定」ブロックを使って、後付けできます。

［変数展開の指定が可能］［%形式の文字列書式の指定が可能］

推論／予測の対象に使用するカラム名

トレーニングデータの推論／予測の対象に使用するカラム名を指定します。

ブロックメモこのブロックに関するメモが記載できます。このブロックの処理に影響しません。

トレーニング完了時からのモデル保持日数（0は制限なし）

トレーニング完了時点からモデルを保持する日数を指定します。指定した日数を経過するとモデルは自動で削除されます。0日を指定すると、自動削除されません。

初期値は、0日です。

データ分割に使用するカラム名（タイムスタンプまたは文字列のカラム）

AutoMLテーブルでは、教師付きトレーニングデータをトレーニング用・検証用・テスト用に分割して利用します。

デフォルトでは、データ行の80%をトレーニング用、10%を検証用、10%をテスト用としてランダムに選択します。

分割比率やデータのどの行をトレーニング用・検証用・テスト用に適用するかをコントロールしたい場合は、特定のカラムを追加して行います。

タイムスタンプ型のカラムを使用する場合：
最も時間の古い80%の行がトレーニング用に、その後の10%が検証用に、最も時間の新しい10%がテスト用に使用されます。
文字列型のカラムを使用する場合：
次のいずれかの値を含めることで、それぞれの行がどの分割データに適用するかを決めます。
- TRAIN：トレーニング用
- VALIDATE：検証用
- TEST：テスト用
- UNASSIGNED：AutoMLテーブルによって自動的にトレーニング用か検証用に振り分け
値は、以下の組み合わせのいずれかにする必要があります（空文字列は不可）。
- TRAIN・VALIDATE・TEST
- TEST・UNASSIGNED

このデータ分割の詳細については、Googleのドキュメントの「データ分割の用途」を参照願います。

トレーニングの最大時間（時間）

モデルの最大トレーニング時間数を時間単位で指定します。

推奨されるトレーニング時間は、教師付きトレーニングデータのサイズに応じて変わります。以下に、行数別の推奨トレーニング時間を示します。

行数	推奨トレーニング時間の最大時間
100,000未満	1から3時間
100,000から1,000,000	1から6時間
1,000,000から10,000,000	1から12時間
10,000,001以上	3から24時間

モデルの作成は、トレーニング以外の処理も含まれます。このため、モデル作成全体にかかる合計時間は、トレーニング時間より長くなります。

トレーニングの最大時間を満たす前にモデルの改善がみられなくなると、トレーニングは停止されます。

Slack通知設定（省略可）

モデル作成完了時に、Slackへその旨のテキストメッセージを送信したい場合に、プロジェクト設定の通知設定で設定したSlack通知の名称を指定します。

Slack通知のイメージ：

モデルの作成が完了したにも関わらずSlackに通知が来ない場合は、何らかの原因（指定したチャンネルがないなど）でSlackの通知に失敗している可能性があります。その場合は、プロジェクト設定の通知設定を確認してください。Slackの通知に失敗している場合は、失敗に関するメッセージが確認できます。

［変数展開の指定が可能］［%形式の文字列書式の指定が可能］

Slack通知チャンネル設定（省略可）

通知先のSlackチャンネルを指定します。

チャンネルを指定した場合は、プロジェクト設定の通知設定のチャンネルは無視されます。

省略した場合は、通知設定で指定されたチャンネルへ通知されます。

Slack通知ユーザー名設定（省略可）

通知する際のユーザー名を指定します。

ユーザー名を指定した場合は、プロジェクト設定の通知設定のユーザー名は無視されます。

省略した場合は、プロジェクト設定の通知設定で指定されたユーザー名が使われます。

Slack通知アイコン絵文字設定（省略可）

通知する際の絵文字を指定します。

絵文字を指定した場合は、プロジェクト設定の通知設定の絵文字は無視されます。

省略した場合は、プロジェクト設定の通知設定で指定された絵文字が使われます。

ブロックリファレンス

機械学習

AutoML（分類）モデルの作成

概要

プロパティ

この情報は役に立ちましたか？