日本語のタイトル#
説明可能な知識蒸留による効率的な医療画像分類
英文タイトル#
Explainable Knowledge Distillation for Efficient Medical Image Classification
日本語の要約#
本研究は、胸部 X 線(CXR)画像を用いた COVID-19 および肺癌分類のための知識蒸留フレームワークを包括的に探求します。私たちは、VGG19 や軽量ビジョントランスフォーマー(Visformer-S および AutoFormer-V2-T)を含む高容量の教師モデルを使用して、OFA-595 スーパーネットから派生したコンパクトでハードウェア対応の学生モデルのトレーニングを指導します。私たちのアプローチは、真のラベルと教師モデルのソフトターゲットを組み合わせたハイブリッド監視を利用して、精度と計算効率のバランスを取ります。私たちは、COVID-QU-Ex および LCS25000 という 2 つのベンチマークデータセットでモデルを検証し、COVID-19、健康、非 COVID 肺炎、肺癌、結腸癌などの複数のクラスをカバーします。モデルの空間的焦点を解釈するために、Score-CAM に基づく視覚化を採用し、教師ネットワークと学生ネットワークの推論プロセスに洞察を提供します。結果は、蒸留された学生モデルがパラメータと推論時間を大幅に削減しながら高い分類性能を維持することを示しており、リソース制約のある臨床環境における最適な選択肢となります。私たちの研究は、モデルの効率性と説明可能性を組み合わせることが、実用的で信頼できる医療 AI ソリューションにとって重要であることを強調しています。
英文要約#
This study comprehensively explores knowledge distillation frameworks for COVID-19 and lung cancer classification using chest X-ray (CXR) images. We employ high-capacity teacher models, including VGG19 and lightweight Vision Transformers (Visformer-S and AutoFormer-V2-T), to guide the training of a compact, hardware-aware student model derived from the OFA-595 supernet. Our approach leverages hybrid supervision, combining ground-truth labels with teacher models' soft targets to balance accuracy and computational efficiency. We validate our models on two benchmark datasets: COVID-QU-Ex and LCS25000, covering multiple classes, including COVID-19, healthy, non-COVID pneumonia, lung, and colon cancer. To interpret the spatial focus of the models, we employ Score-CAM-based visualizations, which provide insight into the reasoning process of both teacher and student networks. The results demonstrate that the distilled student model maintains high classification performance with significantly reduced parameters and inference time, making it an optimal choice in resource-constrained clinical environments. Our work underscores the importance of combining model efficiency with explainability for practical, trustworthy medical AI solutions.
文章ページ#
PDF 取得#
抖音でスキャンしてさらに素晴らしいコンテンツを確認