日本語タイトル#
魚眼目標検出のエッジケース合成:データ中心の視点
英文タイトル#
Edge-case Synthesis for Fisheye Object Detection: A Data-centric Perspective
日本語要約#
魚眼カメラは著しい歪みを引き起こし、従来のデータセットで訓練された目標検出モデルに独自の課題をもたらします。本研究では、モデルの盲点を特定するという重要な問題に焦点を当てることで、検出性能を体系的に向上させるデータ中心のプロセスを提案します。詳細なエラー分析を通じて、混同されるクラスペア、周辺の歪み、十分に表現されていない文脈などの重要なエッジケースを特定しました。次に、エッジケース合成を通じてこれらの問題に直接対処します。画像生成モデルを微調整し、慎重に設計されたプロンプトで導いて、現実世界の失敗パターンを再現する画像を生成します。これらの合成画像は高品質の検出器を使用して擬似ラベル付けされ、訓練に統合されます。我々のアプローチは一貫した性能向上をもたらし、魚眼目標検出のような専門分野において、データを深く理解し、その弱点を選択的に修正することが大きな影響を与えることを強調しています。
英文要約#
Fisheye cameras introduce significant distortion and pose unique challenges to object detection models trained on conventional datasets. In this work, we propose a data-centric pipeline that systematically improves detection performance by focusing on the key question of identifying the blind spots of the model. Through detailed error analysis, we identify critical edge-cases such as confusing class pairs, peripheral distortions, and underrepresented contexts. Then we directly address them through edge-case synthesis. We fine-tuned an image generative model and guided it with carefully crafted prompts to produce images that replicate real-world failure modes. These synthetic images are pseudo-labeled using a high-quality detector and integrated into training. Our approach results in consistent performance gains, highlighting how deeply understanding data and selectively fixing its weaknesses can be impactful in specialized domains like fisheye object detection.
PDF 取得#
抖音でスキャンしてさらに素晴らしいコンテンツを見る