バウンディングボックス(Bounding Box)は、コンピュータビジョンや画像処理の分野で使用される矩形の枠で、画像内の特定の物体を囲むために利用されます。バウンディングボックスは、物体の位置や大きさを特定し、解析や認識を行う際の基礎的な情報を提供します。画像、シェイプ、テキストを取り囲む四角形の境界で、ドラッグして移動、変形、回転、倍率の変更をすることができます。
バウンディングボックスは通常、画像座標系における左上の頂点の座標(x_min, y_min)と右下の頂点の座標(x_max, y_max)によって定義されます。この情報を用いて、対象物の領域を切り出したり、物体検出アルゴリズムの学習データとして使用したりします。
例えば、顔認識システムでは、顔の領域をバウンディングボックスで囲むことで、その範囲内で詳細な特徴抽出や識別を行います。また、自動運転車のシステムでは、道路上の歩行者や他の車両をバウンディングボックスで囲むことで、衝突回避や経路計画に役立てています。
バウンディングボックスはシンプルで計算コストが低いため、リアルタイムアプリケーションにも適しています。ただし、物体の正確な形状を反映しないため、複雑な形状の物体にはマスク(セグメンテーション)技術と組み合わせて使用することもあります。