15
結結 GMM 結 K-means 結結結結結結結 結結結 結結結 結結結結結結結結結結結結結 結結結結結結結結結結結結結結 TAAI2008 Presenter Chia-Cheng Chen

結合 GMM 與 K-means 之語者分群 方法

  • Upload
    affrica

  • View
    85

  • Download
    2

Embed Size (px)

DESCRIPTION

結合 GMM 與 K-means 之語者分群 方法. 古鴻炎 游政人 國立台灣科技大學資訊工程系 第十三屆人工智慧與應用研討會 TAAI2008. Presenter Chia-Cheng Chen. 大綱. 介紹 方法 實驗 結果 結論. 介紹. 提出一種結合 GMM 和 K-means 分群之 語者 分群方法 。 先為各個語者建立一個 GMM 模型,然後採取基於散異度 (divergence) 的距離函數來量測兩 GMM 模型之間的距離,接著使用我們修正的 K-means 分群演算法來進行語者的分群。. 方法. 方法 (Cont.). - PowerPoint PPT Presentation

Citation preview

Page 1: 結合 GMM 與 K-means 之語者分群 方法

結合 GMM 與 K-means 之語者分群方法

古鴻炎 游政人國立台灣科技大學資訊工程系

第十三屆人工智慧與應用研討會 TAAI2008

Presenter Chia-Cheng Chen

Page 2: 結合 GMM 與 K-means 之語者分群 方法

介紹

方法

實驗結果

結論

大綱

Page 3: 結合 GMM 與 K-means 之語者分群 方法

提出一種結合 GMM 和 K-means 分群之語者分群方法。

先為各個語者建立一個 GMM 模型,然後採取基於散異度 (divergence) 的距離函數來量測兩 GMM 模型之間的距離,接著使用我們修正的 K-means 分群演算法來進行語者的分群。

介紹

Page 4: 結合 GMM 與 K-means 之語者分群 方法

方法

Page 5: 結合 GMM 與 K-means 之語者分群 方法

GMM 模型建造

距離量測與模型距離

修正之 K-means 分群法

方法 (Cont.)

Page 6: 結合 GMM 與 K-means 之語者分群 方法

GMM 模型建造

方法 (Cont.)

M

iii xbwxp

1

)()|(

SkkXpS

1

)|(maxargˆ

Page 7: 結合 GMM 與 K-means 之語者分群 方法

距離量測與模型距離◦Mahalanobis 距離

◦Bhattacharyya 距離

方法 (Cont.)

Page 8: 結合 GMM 與 K-means 之語者分群 方法

基於 Pseudo Divergence 的模型距離

方法 (Cont.)

Page 9: 結合 GMM 與 K-means 之語者分群 方法

K-means 演算法1. 先從 N 個向量中隨機挑選出 K 個當作初始的中心向量

2. 訓練向量 Xn ,計算它離每個中心向量 Ck 的距離

3. grp(Xn)=arg min distance(Xn, Ck)

4. 計算各群的新中心向量

5. 設前一次疊代的失真距離為 R’ ,而本次疊代後的失真距離為 。 R / R’ , > Thr(0.98)

方法 (Cont.)

Page 10: 結合 GMM 與 K-means 之語者分群 方法

計算各群的成員對於該群當中其它成員的幾何平均距離

方法 (Cont.)

Page 11: 結合 GMM 與 K-means 之語者分群 方法

實驗結果 TCC-300 語料庫中的 303 位語者 (151 位男性 , 152

位女性 )

額外 30 位語者 ( 男女性各 15 人 )◦前進、後退左轉、右轉、開始、停止、準備、機器人、向

後轉、煞車。

Page 12: 結合 GMM 與 K-means 之語者分群 方法

實驗結果 (Cont.)

Page 13: 結合 GMM 與 K-means 之語者分群 方法

評估方法

實驗結果 (Cont.)

K:群落數N:總資料點數nk:群落 k中資料點數Zk:所有資料點的中心點

Page 14: 結合 GMM 與 K-means 之語者分群 方法

實驗結果 (Cont.)

Page 15: 結合 GMM 與 K-means 之語者分群 方法

本文研究語者分群的目的是,希望使用少量語者的錄音語料,便能夠建立強健的 HMM 模型,來作為語音命令辨識之用。

303 個語者作 40 群的分群,然後只把 40 群中心語者的語料拿去訓練 HMM 辨識模型,就可使語音命令的辨識率達到飽和,亦即辨識率和 303 個語者都拿去訓練 HMM 的辨識率相當。

CH 分群評估值和辨識率之間的相關性,並未發現兩者之間有相關性存在。

結論