モデル制作ガイド

このドキュメントは、Roboflowのブログ、YouTubeチャンネル、およびその他のチームの情報を集約して、すべてのRoboflowユーザーの成功を促進することを目的としています。

Written by Mohamed Traore

Last published at: May 4th, 2022

主要な指標


mAP、適合率、再現率のスコアは、 Roboflow Trainでトレーニングされたすべてのモデル、およびRoboflowModelZooのノートブックを通じて提供されます。

地図

精度

  • 予測時のモデルの精度の尺度。真の陽性は、推測されたすべての陽性で除算されます。

想起

  • 予測システムのパフォーマンスの尺度。リコールは、予測システムが十分に推測しているかどうかを評価するために使用されます。真陽性は、考えられるすべての真陽性で除算されます。

予測

  • グラウンドトゥルースを複製するためのモデルによる試み。予測には通常、各クラスの信頼値が含まれています。
  • Roboflowでのインポートとエクスポートに使用できるフォーマット

データセットの品質管理のための主要なツール

データセット 健康診断
データセットヘルスチェック、ガイド付きウォークスルー

「ガベージイン、ガベージアウト」
この古い機械学習の格言は、重要な機械学習のポイントを伝えています。入力データが高品質でない限り、モデルの精度は、たとえ最高のコンピュータービジョンアーキテクチャであっても、問題になります。前処理と拡張がコアにあることを理解することで、データサイエンティストは入力データを最大限に活用できます。
前処理

前処理ステップは、サイズ変更やグレースケールへの変換など、すべての画像に対して行われる画像の変更です。前処理ステップは、トレーニング、検証、およびテストセットに適用されます。

増強

画像拡張ステップは、明るさや回転をランダムに変更するなど、パフォーマンスを向上させるためにデータセットサイズを増やすためだけに設計された画像変更です。画像拡張手順は、トレーニング画像にのみ適用されます。

バウンディングボックスレベルの拡張

レベル拡張は、ソース画像のバウンディングボックスのコンテンツを変更するだけで新しいトレーニングデータを生成します。そうすることで、開発者は、問題の状態により適したトレーニングデータの作成をより細かく制御できます。

オブジェクト検出のための学習データ拡張戦略-GoogleResearchTeam (2019)

ワンクリックモデルトレーニング(ロボフロートレイン)

はじめに(ビデオ)

サードパーティのトレーニング統合(Pro)
AWS、Azure Custom Vision、Google Cloud Vision AutoML
  • AWSとAzureCustomVisionでは、サードパーティのキーをプロジェクトのワークスペースに入力する必要があります。これらのアクセスポイントは、Roboflowとの統合を有効にするために、ターゲットのAWSまたはAzureアカウントに設定する必要があります。

ゼロショットオブジェクトトラッキング

モデル制作のヒント

適切な問題ステートメントの選択(Roboflowブログ)

特徴:具体的、達成可能、測定可能
範囲外の問題の解決(Roboflowブログ)|ビデオ
  • 私たちのモデルは「野生で…」何を経験しますか?
データセットの組み立てプロセスを通じて、レーザーフォーカスは、モデルの範囲外と自然に見なされる多くのエッジケースを見逃す可能性があります。範囲外のインスタンスは私たちにとって直感的ですが、私たちのモデルには、表示されている範囲を超えて何かを知る方法がありません。

空中データセットの拡張(Roboflowのブログ)

小さい(Roboflowのブログ)|ビデオ
 

アクティブラーニングのヒント(Roboflowのブログ)|ビデオ

転移学習の入門書(Roboflowのブログ)
事前にトレーニングされた重みを使用して、モデルの学習をブートストラップします。別のデータセットで学習した知識を「転送」してから、それを「微調整」して新しいドメインについて学習します。
データセットのマージ(Roboflowのドキュメント)