HyperDiff：超図に基づく拡散モデルを用いた3D人体姿勢推定

2508.14431v1

日本語タイトル#

HyperDiff：ハイパーグラフガイドの拡散モデルによる 3D 人体姿勢推定

英文タイトル#

HyperDiff: Hypergraph Guided Diffusion Model for 3D Human Pose Estimation

日本語要約#

単眼 3D 人体姿勢推定（HPE）は、2D から 3D への変換プロセスにおいて、深度のあいまいさや遮蔽といった課題にしばしば直面します。さらに、従来の手法は骨格構造情報を利用する際にマルチスケールの骨格特徴を見落とす可能性があり、これが姿勢推定の精度に悪影響を及ぼすことがあります。これらの課題に対処するために、本論文では新しい 3D 姿勢推定手法である HyperDiff を紹介します。この手法は、拡散モデルと HyperGCN を統合しています。拡散モデルはデータの不確実性を効果的に捉え、深度のあいまいさや遮蔽を緩和します。一方、去噪器として機能する HyperGCN は、マルチグラニュラリティ構造を採用し、関節間の高次相関を正確にモデル化します。これにより、特に複雑な姿勢においてモデルの去噪能力が向上します。実験結果は、HyperDiff が Human3.6M および MPI-INF-3DHP データセットで最先端の性能を達成し、性能と効率のバランスを取るために異なる計算リソースに柔軟に適応できることを示しています。

英文要約#

Monocular 3D human pose estimation (HPE) often encounters challenges such as depth ambiguity and occlusion during the 2D-to-3D lifting process. Additionally, traditional methods may overlook multi-scale skeleton features when utilizing skeleton structure information, which can negatively impact the accuracy of pose estimation. To address these challenges, this paper introduces a novel 3D pose estimation method, HyperDiff, which integrates diffusion models with HyperGCN. The diffusion model effectively captures data uncertainty, alleviating depth ambiguity and occlusion. Meanwhile, HyperGCN, serving as a denoiser, employs multi-granularity structures to accurately model high-order correlations between joints. This improves the model's denoising capability especially for complex poses. Experimental results demonstrate that HyperDiff achieves state-of-the-art performance on the Human3.6M and MPI-INF-3DHP datasets and can flexibly adapt to varying computational resources to balance performance and efficiency.

文章ページ#

HyperDiff：ハイパーグラフガイドの拡散モデルによる 3D 人体姿勢推定

PDF 入手#

日本語 PDF を見る - 2508.14431v1

スマート達人の抖音 QR コード

抖音でさらに素晴らしいコンテンツを見るには QR コードをスキャンしてください