ON THE APPLICATION OF MIXTURE AR HIDDEN MARKOV-MODELS TO TEXT INDEPENDENT SPEAKER RECOGNITION

被引：55

作者：

TISHBY, NZ

机构：

[1] AT&T Bell Laboratories, Murray Hill

来源：

IEEE TRANSACTIONS ON SIGNAL PROCESSING | 1991年 / 39卷 / 03期

关键词：

D O I：

10.1109/78.80876

中图分类号：

TM [电工技术]; TN [电子技术、通信技术];

学科分类号：

0808 ; 0809 ;

摘要：

Linear predictive hidden Markov models have proved to be an efficient way for statistically modeling speech signals. The possible application of such models to statistical characterization of the speaker himself is described and evaluated. The results show that even with a short sequence of only four isolated digits, a speaker can be verified with an average equal-error rate of less than 3%. These results are slightly better than the results obtained using speaker dependent vector quantizers, with comparable numbers of spectral vectors. The small improvement over the vector quantization approach indicates the weakness of the Markovian transition probabilities for characterizing speaker dependent transitional information.

引用

页码：563 / 570

页数：8

共 16 条

[1] A MAXIMIZATION TECHNIQUE OCCURRING IN STATISTICAL ANALYSIS OF PROBABILISTIC FUNCTIONS OF MARKOV CHAINS [J].

BAUM, LE ;

PETRIE, T ;

SOULES, G ;

WEISS, N .

ANNALS OF MATHEMATICAL STATISTICS, 1970, 41 (01) :164-&

[2] MAXIMUM LIKELIHOOD FROM INCOMPLETE DATA VIA EM ALGORITHM [J].

DEMPSTER, AP ;

LAIRD, NM ;

RUBIN, DB .

JOURNAL OF THE ROYAL STATISTICAL SOCIETY SERIES B-METHODOLOGICAL, 1977, 39 (01) :1-38

[3]

EPHRAIM Y, 1987, ICASSP 87 IEEE INT C, P25

[4] VITERBI ALGORITHM [J].

FORNEY, GD .

PROCEEDINGS OF THE IEEE, 1973, 61 (03) :268-278

[5]

Gray R. M., 1984, IEEE ASSP Magazine, V1, P4, DOI 10.1109/MASSP.1984.1162229

[6]

Hartigan JohnA., 1975, CLUSTERING ALGORITHM

[7] MIXTURE AUTOREGRESSIVE HIDDEN MARKOV-MODELS FOR SPEECH SIGNALS [J].

JUANG, BH ;

RABINER, LR .

IEEE TRANSACTIONS ON ACOUSTICS SPEECH AND SIGNAL PROCESSING, 1985, 33 (06) :1404-1413

[8] ON THE HIDDEN MARKOV MODEL AND DYNAMIC TIME WARPING FOR SPEECH RECOGNITION - A UNIFIED VIEW [J].

JUANG, BH .

AT&T BELL LABORATORIES TECHNICAL JOURNAL, 1984, 63 (07) :1213-1243

[9] CONTINUOUSLY VARIABLE DURATION HIDDEN MARKOV MODELS FOR AUTOMATIC SPEECH RECOGNITION. [J].

Levinson, S.E. .

Computer Speech and Language, 1986, 1 (01) :29-45

[10]

PORITZ AB, 1982, MAY P IEEE INT C AC, P1291

← 1 2 →