Abstract:Discriminative training approaches such as minimum phone error (MPE), feature minimum phone error (fMPE) and boosted maximum mutual information (BMMI) have brought remarkable improvement to the speech community in recent years, however, much work still remains to be done. This paper investigates the performances of three lattice-based discriminative training methods in detail, and does a comparison of different I-smoothing methods to obtain more robust models in the Chinese-monolingual situation. The complementary properties of the different discriminative training methods are explored to perform a system combination by recognizer output voting error reduction (ROVER). Although discriminative training is normally used in monolingual systems, this paper systematically investigates its use for bilingual speech recognition, including MPE, fMPE, and BMMI. A new method is proposed to generate significantly better lattices for training the bilingual model, and complementary discriminative training models are also explored to get the best ROVER performance in the bilingual situation. Experimental results show that all forms of discriminative training can reduce the word error rate in both monolingual and bilingual systems, and that combining complementary discriminative training methods can improve the performance significantly.

An Improved Linear Discriminant Analysis for Mandarin Digit Speech Recognition

LDA Applied to Mandarin Speech Recognition System

Discriminative Hmm Stream Model For Mandarin Digit String Speech Recognition

Transformation techniques for mandarin digit string recognition

Use Tone Detection to Improve Performance of Mandarin Digit Speech Recognition

High Performance Digit Mandarin Speech Recognition

Use Formant Trajectory to Improve the Performance of Mandarin Digit Speech Recognition

Improvement Comparison of Different Lattice-based Discriminative Training Methods in Chinese-monolingual and Chinese-English-bilingual Speech Recognition

Mandarin Continuous Digit Speech Recognition System

Effective Acoustic Modeling for Pronunciation Quality Scoring of Strongly Accented Mandarin Speech

Research work on the influence of training method in mandarin connected digit speech recognition

A Rejection Model Based on Multi-Layer Perceptrons for Mandarin Digit Recognition

DLD: An Optimized Chinese Speech Recognition Model Based on Deep Learning

New Neural Network Architecture with Application in Mandarin Digit Speech Recognition

Speech Emotion Recognition Based on Linear Discriminant Analysis and Support Vector Machine Decision Tree

Similar Pattern Discriminant Analysis for Improving Chinese Character Recognition Accuracy

The Optimal Selecting for HMM State-number in Mandarin Continuous Speech

Mandarin-English bilingual phone modeling and combining MPE based Discriminative training for cross-language speech recognition

Investigation of Deep Neural Network Acoustic Modelling Approaches for Low Resource Accented Mandarin Speech Recognition

Noisy speech recognition performance of discriminative HMMs

Phone modeling and combining discriminative training for Mandarin-English bilingual speech recognition