エコーキャンセラ向けのNormalized LMSアルゴリズムの改良

　エコーキャンセラ向けのNormalized LMSアルゴリズムの改良

| ← back |

| home |

下記の改良NLMSアルゴリズムの特許のライセンスが可能です．　詳細は当社まで直接お問い合わせ下さい．→ TEL (042)357-0621
排他的・独占的な実施条件でのライセンス、または特許の売却も可能です

Normalized LMS (NLMS) アルゴリズムの改良

エコーキャンセラにNormalized LMS（NLMS）アルゴリズムを適用すると，ダブルトーク状態においてLMSアルゴリズムよりも収束特性が劣ることが知られています．　しかし，わずかな改良によりNLMSアルゴリズムはダブルトーク状態でも良好なエコー消去量を維持することが出来ます．　この改良NLMSアルゴリズムを用いると，ダブルトーク検出処理無しでも良好なエコー抑圧特性が得られます．　
ダブルトーク検出処理（DTD, Double Talk Detecotr）をおこなう場合でも、簡単なDTD付加で特性を向上させることが出来ます．（良く知られている Geigel algorithm より極めて少ない演算量で済みます）

PDF資料 nlms_txt.pdf （492KB）
PDF資料 nlms_txt_data.pdf （下記のwavファイルを埋込済，3301KB）
- 添付ファイル1：エコーキャンセラ無し nlms_data1(off).wav （782KB）
- 添付ファイル2：LMSアルゴリズムを用いたエコーキャンセラの出力 nlms_data2(lms).wav （782KB）
- 添付ファイル3：改良NLMSアルゴリズムを用いたエコーキャンセラの出力 nlms_data3(improved_nlms).wav （782KB）

上記のシミュレーション結果のwavファイルの先頭約18秒分のスペクトログラム
- エコーキャンセラ無し　nlms_data1(off).wav (782KB)
  - エコーキャンセラが無いなので、男声と女声（エコー成分）が完全に混じり合っています
- LMSアルゴリズム nlms_data2(lms).wav (782KB)
  - 除去しきれなかったエコー成分（女声）がゴモゴモした異音のように聞こえます
  - ステップサイズ・パラメータμを小さくするとエコーが小さくなりますが、代わりに収束が大幅に遅くなります
- 改良NLMSアルゴリズム nlms_data3(improved_nlms).wav (782KB)
  - LMSより初期の収束は遅くなっていますが、エコー減衰量は良好です
  - ステップサイズ・パラメータμの値を変えると、特性のバランス（収束速度 vs. エコー減衰量）が変化します

詳細なシミュレーション

上記のシミュレーションはほとんど常にダブルトーク状態という現実にはあり得ない厳しい条件でおこなっているので、もう少しダブルトークを緩和したより現実に近い条件でシミュレーションをおこないました．　詳細は下記のPDFファイルをご覧下さい．
緩和した条件なので、比較対象はダブルトーク検出処理付きの従来技術のNLMSアルゴリズムとしています．　ダブルトーク状態と判定された区間では適応フィルタ係数の更新を停止しています．　ダブルトーク検出（DTD）には良く知られているGeigelのアルゴリズムと同社独自の手法の２種類を用いました．
改良NLMSもDTD有り／無しの両方のシミュレーション結果を示しています．
サンプリング周波数は8kHz、適応フィルタ長は128tapです．
信号レベルの設定は、便宜的に男声と女声のレベルを等しくしてシミュレーションをおこないました．

改良NLMS（Improved NLMS）の詳細なシミュレーションの結果（PDFファイル）

improved_nlms_sim.pdf (4352KB)
improved_nlms_sim_wav.pdf (33098KB, wavファイル埋込)

シミュレーション結果のwavファイル（エコー・キャンセラの出力信号）

シミュレーション例（１）

(A) 従来のNLMS（Geigelのダブルトーク検出アルゴリズムを使用） 1a_conventional_nlms.wav (3126KB)
(B) 従来のNLMS（当社独自のダブルトーク検出アルゴリズムを使用） 1b_conventional_nlms.wav (3126KB)
(C) 改良NLMS（ダブルトーク検出無し） 1c_improved_nlms.wav (3126KB)
(D) 改良NLMS（ダブルトーク検出有り） 1d_improved_nlms.wav (3126KB)
エコーキャンセラ無しの場合の出力信号 1_without_canceller.wav (3126KB)

シミュレーション例（２）

(A) 従来のNLMS（Geigelのダブルトーク検出アルゴリズムを使用） 2a_conventional_nlms.wav (3126KB)
(B) 従来のNLMS（当社独自のダブルトーク検出アルゴリズムを使用） 2b_conventional_nlms.wav (3126KB)
(C) 改良NLMS（ダブルトーク検出無し） 2c_improved_nlms.wav (3126KB)
(D) 改良NLMS（ダブルトーク検出有り） 2d_improved_nlms.wav (3126KB)
エコーキャンセラ無しの場合の出力信号 2_without_canceller.wav (3126KB)

音響系H(ω)のインパルス・レスポンスのデータ

シミュレーション例（１） 1_h_coef.txt (2KB)
シミュレーション例（２） 2_h_coef.txt (2KB)

シミュレーション結果の一部（適応フィルタ係数のミスアライメント量のグラフ）を以下に示します．
DTD は Double Talk Detector、ダブルトーク検出器のことです．　DTDでダブルトークと判定された区間では適応フィルタ係数の更新を停止しています．
適応フィルタ係数のミスアライメントは、必ずしもエコーの減衰量とは一致しません．　エコー消去量は出力信号のwavファイルから判断してください．

LMS （DTD無し、μ=0.003） LMS （DTD無し、μ=0.01）

NLMS （DTD無し、μ=0.0005） NLMS （DTD無し、μ=0.00005）

NLMS （Geigel のDTD 、μ=0.00005） NLMS （当社独自のDTD、μ=0.00005)

改良NLMS （DTD無し、μ=0.00003）改良NLMS （DTD有り、μ=0.00003）

よくある質問とその答

Q1．従来の Normalized LMS (NLMS) アルゴリズムと何が違うのか？
A1．
- エコーキャンセラへの応用において生じる、いわゆるダブルトーク状態の存在を前提とした改良を従来の Normalized LMS (NLMS) アルゴリズムに加えたものです．
- 従来のNLMSアルゴリズムと比較して、わずかな演算量の増加でリーズナブルな特性改善の効果が得られます．
- 後付けのダブルトーク対応処理を不要とすることが可能となります．（ただし使用条件による）　ダブルトーク検出処理を付加する場合でも演算量の増加はごくわずかです．

Q2．ダブルトーク状態のエコーキャンセラの動作特性改善を目的としたLMS/NLMSベースの適応アルゴリズムは他にも多数あるが、それらとは何が違うのか？
A2．
- 技術的なトーレドオフが明らかになっていることが最大の特徴です．　音声処理としての評価が甘い怪しげな「魔法のアルゴリズム」ではありません．
- 利点としてダブルトーク状態での収束特性が向上しますが、その代償として適応初期の収束速度が遅くなるとともに、（現実にはあり得ない）ダブルトークがまったく無い理想的状態でのエコー消去量が低下します．
- 処理の前提条件となっているのは、異なる話者の音声のパワーは無相関に変動しているという自明の事実です．　現実の音声では成り立ちがたい仮定・前提条件に依存した複雑精緻な処理ではありません．　単純なアルゴリズムですが、安定して動作します．

Q3．原理的なデメリット（適応初期の収束速度低下等）があるということは、性能が悪いということではないのか？
A3．
- LMS/NLMSを部分的に改良しただけで、外乱・ノイズがあるのに（ダブルトーク状態なのに）一切のデメリット無しに収束特性が向上する「魔法のアルゴリズム」など原理的に有り得ません．　
- きちんと理論的なメリットとデメリットが明らかになっているということは、過去の技術には無かった当社の改良NLMSアルゴリズムの好ましい特徴です．
- 現実的な使用条件においては従来のLMS/NLMSアルゴリズムよりも良好な特性が得られるため、改良NLMSのデメリットはありません．

Q4．NLMSの改良版であるにもかかわらず、PDF資料の中ではLMSアルゴリズムを比較対象としているのは何故か？　NLMSアルゴリズムと比較するべきではないのか？
A4．
- ダブルトーク状態においては従来のNLMSアルゴリズムの収束特性はLMSよりも劣ることが知られています．　したがってダブルトーク状態の収束特性を比較する対象として、LMSアルゴリズムを用いていました．
- ダブルトークの発生条件を緩和したシミュレーション例では、ダブルトーク検出処理付きのNLMSを比較対象としています．

Q5．他のLMS/NLMSアルゴリズムを用いたエコー・キャンセラと比較して、PDF資料に示されている改良NLMSの収束が非常に遅いのではないか？
A5．
- エコー・キャンセラ製品のカタログや学術論文等では意図的に甘い条件で評価・シミュレーションをおこなっていることが多いようです．　比較は同一の条件でおこなわなければ意味がありません．　当社のPDF資料の中の同一条件でシミュレーションをおこなっているLMS/NLMSアルゴリズムの収束特性と（当社の）改良NLMSアルゴリズムの収束特性を比較してください．
- エコー・キャンセラ製品のカタログにしばしば見られる、「エコー消去時間ＸＸ ms」・「エコー除去量 XX dB」というスペック表記は測定条件が明らかでない限り無意味です．　従来技術を用いた既存製品のカタログ・スペックは気休め程度に考えてください．

Q6．改良NLMSアルゴリズムはどのようなアプリケーションに適用出来るのか？
A6．
- 現在、LMS/NLMSベースのアルゴリズムが用いられているアプリケーションの性能改善に向いています．　比較的ローエンドのアプリケーション向けです．
- ハンズフリー・インターホンや個人向けのTV電話システム等への応用が考えられます．
- 一般的な電話は現在ある手法、エコーキャンセラ製品で間に合っているので、新たな技術を導入する必要性は低いかもしれません．　現状の製品で性能が不十分なのであれば、改良NLMSの採用を検討してみる価値はあります．
- 残響の多い部屋に複数の参加者が集まって使用する法人向けTV会議システム等は（システム全体の単価が高く）コストの制約が緩いため、大きな演算量を必要とするより複雑・高性能なアルゴリズムを用いた方が良い場合もあるでしょう．

Q7．上記の答だけではよく分からない．　技術的な内容をもう少し具体的に教えて欲しい．
A7．
- すでにLMS/NLMSアルゴリズムをベースとしたエコーキャンセラを使用されていて、その性能に不満がなければ改良NLMSを用いる必要性はありません．
- ダブルトーク状態でのエコー抑圧性能低下の問題、およびそれに対処するための後付けのダブルトーク検出・回線利得制御等の処理に関してお困りでしたら、改良NLMSの採用を検討する価値があると思われます．　改良NLMSを用いれば、後付けのダブルトーク対応処理無しで良好な収束特性を得られます．　ダブルトーク検出処理を必要とする場合でも、ごくわずかな演算量の増加で済みます．
- 一般に市販のエコーキャンセラIP（ソフトウェア・ライブラリ）にはダブルトーク対応処理は含まれていません．　ダブルトーク状態での収束性能低下を補うためのダブルトーク検出・回線利得制御等の処理はユーザー側が付け加えることになっています．　あるいはベンダーがカスタム対応でダブルトーク対応処理付加に関して有償のサポートをすることが可能であっても、一切の性能保証はしないのが普通です．
- 改良NLMSはもともとダブルトーク状態の存在を想定したアルゴリズムですので、適応信号処理（適応フィルタ）の利点を損なう後付けのダブルトーク対応処理は不要です．　ごく少数のパラメータの設定（ステップサイズ・パラメータμと積分定数の２つだけ）で、使用状況に応じた最適な動作特性の設定が可能です．
- ダブルトークがまったく生じないのであれば、改良NLMSを用いるメリットはありません．

Q8．製品化の予定はどうなっているのか？　特定のプロセッサへの実装は可能か？
A8．
- 現在、ソフトウェアIPとして製品化の準備中です．　ご要望に応じて任意のプロセッサへの実装を承ります．
- FPGAへの実装、LSIのハードウェアIP化も可能です．

|↑top |

| home |


NLMS （DTD無し、μ=0.0005）	NLMS （DTD無し、μ=0.00005）


NLMS （Geigel のDTD 、μ=0.00005）	NLMS （当社独自のDTD、μ=0.00005)


改良NLMS （DTD無し、μ=0.00003）	改良NLMS （DTD有り、μ=0.00003）