出力仕様
動画分析
概要
このドキュメントでは、[動画分析]ブロックの画像の解析結果について解説します。
動画分析の結果
動画分析に成功すると、分析結果が[結果を格納する変数]プロパティで指定された変数に出力されます。
以下は、分析結果を JSON で表現した例です。"..." や {...} の部分は、中身を省略していることを意味しています。
{
"@type": "...",
"annotationResults": [{
"inputUri": "...",
"segmentLabelAnnotations": [{...}],
"shotLabelAnnotations": [{...}],
"frameLabelAnnotations": [{...}],
"explicitAnnotation": {...}
}]
}
| 名前 | 型 | 説明 |
|---|---|---|
| "@type" | 文字列 |
動画分析の結果であることを示す文字列です。 |
| "annotationResults" | 配列 |
配列の各要素はオブジェクト({...})で構成されています。 各オブジェクトには、 1 つのビデオ情報がまとめられています。 |
| "inputUri" | 文字列 |
GCS 上の動画ファイルの位置です。 |
| "segmentLabelAnnotations" | 配列 |
ビデオ全体もしくはセグメント単位で検出したラベル情報がまとめられています。 配列の各要素はオブジェクト({...})で構成されています。 |
| "shotLabelAnnotations" | 配列 |
ショットレベルで検出したラベル情報がまとめられています。 配列の各要素はオブジェクト({...})で構成されています。 |
| "frameLabelAnnotations" | 配列 |
フレームレベルで検出したラベル情報がまとめられています。 配列の各要素はオブジェクト({...})で構成されています。 |
| "explicitAnnotation" | オブジェクト |
ラベル情報
検出したラベルの情報です。
{
"entity": {...},
"categoryEntities": [{...}],
"segments": [{...}],
"frames": [{...}]
}
| 名前 | 型 | 説明 |
|---|---|---|
| "entity" | オブジェクト | |
| "categoryEntities" | 配列 |
検出したエンティティ(ラベル)の一般的なカテゴリー情報です。検出したラベルが "Terrier" の場合は、おそらくは "dog" というカテゴリー情報を持ちます。1 つのラベルに対して、複数のカテゴリーが存在する可能性もあります。"Terrier" の場合で言うと、"pet" というカテゴリー情報を持つ可能性もあります。 配列の各要素はオブジェクト({...})で構成されています。 各オブジェクトには、検出したカテゴリー情報がまとめられています(情報の形式は "entity" と共通)。 |
| "segments" | 配列 |
ラベルが検出されたすべてのビデオセグメントの情報です。 配列の各要素はオブジェクト({...})で構成されています。 |
| "frames" | 配列 |
ラベルが検出されたすべてのビデオフレームの情報です。 配列の各要素はオブジェクト({...})で構成されています。 |
エンティティ情報
検出したエンティティ情報(カテゴリー情報含む)です。
{
"entityId": "...",
"description": "...",
"languageCode": "..."
}
| 名前 | 型 | 説明 |
|---|---|---|
| "entityId" | 文字列 |
エンティティ ID です。多くの ID は、Knowledge Graph Search API open_in_new で利用可能です。 |
| "description" | 文字列 |
テキストによるエンティティの説明です。例:"desk" や "furniture" など。 |
| "languageCode" | 文字列 |
"description" の言語コード(IETF の BCP-47 で定義されているフォーマット)です。 |
ラベルセグメント情報
ビデオセグメントレベルのラベル検出情報です。
{
"segment": {...},
"confidence": 0.123456
}
| 名前 | 型 | 説明 |
|---|---|---|
| "segment" | オブジェクト | |
| "confidence" | 数値 |
ラベルの確からしさを数値で表します。数値の範囲は、0 から 1 の間です(1 に近いほど確からしさの確度が高い)。 |
ビデオセグメント情報
ビデオセグメント情報です。
{
"startTimeOffset": "12.345678s",
"endTimeOffset": "34.567890s"
}
| 名前 | 型 | 説明 |
|---|---|---|
| "startTimeOffset" | 文字列 |
セグメント開始位置を表します。値は、ビデオ先頭からのオフセット時間を文字列で表現します。単位は秒で、文字列の最後は秒を示す s で終わります。 |
| "endTimeOffset" | 文字列 |
セグメント終了位置を表します。値は、ビデオ先頭からのオフセット時間を文字列で表現します。単位は秒で、文字列の最後は秒を示す s で終わります。 |
ラベルフレーム情報
ビデオフレームレベルのラベル検出情報です。
{
"timeOffset": "12.345678s",
"confidence": 0.123456
}
| 名前 | 型 | 説明 |
|---|---|---|
| "timeOffset" | 文字列 |
ビデオ先頭からのオフセット時間を文字列で表現します。単位は秒で、文字列の最後は秒を示す s で終わります。 |
| "confidence" | 数値 |
ラベルの確からしさを数値で表します。数値の範囲は、0 から 1 の間です(1 に近いほど確からしさの確度が高い)。 |
アダルトコンテンツ情報
アダルトコンテンツの情報です。フレーム内でアダルトコンテンツの可能性のあるものが検出されなかった場合は、そのフレームに対する情報はありません。
{
"frames": [{...}]
}
| 名前 | 型 | 説明 |
|---|---|---|
| "frames" | 配列 |
検出したアダルトコンテンツとしての可能性のあるすべてのビデオフレームの情報です。 配列の各要素はオブジェクト({...})で構成されています。 |
アダルトコンテンツフレーム情報
アダルトコンテンツのビデオフレームごとの情報です。
{
"timeOffset": "12.345678s",
"pornographyLikelihood": "..."
}
| 名前 | 型 | 説明 |
|---|---|---|
| "timeOffset" | 文字列 |
ビデオ先頭からのオフセット時間を文字列で表現します。単位は秒で、文字列の最後は秒を示す s で終わります。 |
| "pornographyLikelihood" | 文字列 |
見込み度合い
| 度合い | 説明 |
|---|---|
| "LIKELIHOOD_UNSPECIFIED" |
不明 |
| "VERY_UNLIKELY" |
可能性がとても低い |
| "UNLIKELY" |
可能性が低い |
| "POSSIBLE" |
可能性がある |
| "LIKELY" |
可能性が高い |
| "VERY_LIKELY" |
可能性がとても高い |