日本語タイトル#
ECHO:周波数に基づく可変長信号の階層的エンコーディング
英文タイトル#
ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signal
日本語摘要#
事前学習された基盤モデルは、視覚と言語の分野で素晴らしい成功を収めていますが、音響、振動、その他の産業センサーデータを含む一般的な機械信号モデリングの可能性はまだ十分に探求されていません。 既存のサブバンドベースのエンコーダを使用したアプローチは競争力のある結果を達成していますが、固定された入力長さと明示的な周波数位置エンコーディングの欠如に制限されています。本研究では、先進的なバンド分割アーキテクチャと相対周波数位置埋め込みを統合した新しい基盤モデルを提案します。これにより、任意のサンプリング構成での精密なスペクトルローカリゼーションが可能になります。このモデルは、パディングやセグメンテーションなしで任意の長さの入力をサポートし、時間的およびスペクトルの忠実度を保持した簡潔な埋め込みを生成します。私たちは、すべての DCASE タスク 2 チャレンジ(2020-2025)や広く使用されている産業信号コーパスを含む複数のデータセットを統一した、機械信号エンコーディングのための新たに導入された大規模ベンチマークである SIREN(https://github.com/yucongzh/SIREN)で私たちの方法を評価しました。実験結果は、異常検出と故障識別において、私たちの方法が常に最先端の性能を示し、提案されたモデルの有効性と一般化能力を確認しました。私たちは ECHO を https://github.com/yucongzh/ECHO でオープンソース化しました。
英文摘要#
Pre-trained foundation models have demonstrated remarkable success in vision and language, yet their potential for general machine signal modeling-covering acoustic, vibration, and other industrial sensor data-remains under-explored. Existing approach using sub-band-based encoders has achieved competitive results but are limited by fixed input lengths, and the absence of explicit frequency positional encoding. In this work, we propose a novel foundation model that integrates an advanced band-split architecture with relative frequency positional embeddings, enabling precise spectral localization across arbitrary sampling configurations. The model supports inputs of arbitrary length without padding or segmentation, producing a concise embedding that retains both temporal and spectral fidelity. We evaluate our method on SIREN (https://github.com/yucongzh/SIREN), a newly introduced large-scale benchmark for machine signal encoding that unifies multiple datasets, including all DCASE task 2 challenges (2020-2025) and widely-used industrial signal corpora. Experimental results demonstrate consistent state-of-the-art performance in anomaly detection and fault identification, confirming the effectiveness and generalization capability of the proposed model. We open-sourced ECHO on https://github.com/yucongzh/ECHO.
文章ページ#
PDF 入手#
抖音扫码查看更多精彩内容