ВходРегистрация
Например: Перечень ВАК
О консорциуме Подписка Контакты
(812) 409 53 64 Некоммерческое партнерство
Санкт-Петербургский
университетский
консорциум

Статьи

Университетский научный журнал № 7, 2014

Использование артикуляторных данных для задач автоматического распознавания звуков русской речи

Д. А. Кочаров
Цена: 50 руб.
В статье представлены результаты экспериментов по автоматической интерпретации звуков русской речи с использованием артикуляторных данных в качестве дифференциальных признаков. В системе используется трехслойная рекуррентная нейронная сеть в качестве классификатора. Проведенные эксперименты в этой области показал высокую эффективность использования артикуляторных данных для параметризации звуков речи при решении задачи
автоматической идентификации. Общая эффективность такой системы достигает 69%, причем около трети звуков различаются между собой с почти 100% точностью.
Ключевые слова: лектромагнитная артикулография, автоматическое распознавание
речи, обработка речевого сигнала, экспериментальная фонетика, лингвистика.
СПИСОК ЛИТЕРАТУРЫ
1. Кочаров Д. А., Глотова О. Н. Обзор технологии электромагнитной артикулографии для исследования и моделирования процессов порождения речи // Научное мнение. СПб., 2012. № 12. С. 47–53.
2. Кочаров Д. А., Глотова О. Н. Корпус артикуляторных данных русской речи //
Труды международной конференции «Корпусная лингвистика — 2013». СПб.:
С.-Петербургский гос. университет, 2013. С. 328–335.
3. Graves A., Mohamed A. and Hinton G. E. Speech Recognition with Deep Recurrent
Neural Networks // In IEEE International Conference on Acoustic Speech and
Signal Processing (ICASSP 2013) Vancouver, 2013.
4. Kaburagi T., Wakamiya K., Honda M. Three-dimensional electromagnetic articulography: A measurement principle. The Journal of the Acoustical Society of America. Vol. 118 (2005). Р. 428–443. 2005.
5. King S., Frankel J., Livescu K., McDermott E., Richmond K. and Wester M. Speech
production knowledge in automatic speech recognition. Journal of the Acoustical Society of America, 121(2): 723–742, February 2007.
6. Mohamed A., Dahl G. E. and Hinton G. E. Deep belief networks for phone recognition
// Proc. NIPS Workshop Deep Learning Speech Recognition Relative Applications,
2009.
7. Moon T., Stirling W. Mathematical Methods and Algorithms for Signal Processing,
Prentice Hall, 1999.
8. Richmond K., Ling Z., Yamagishi J., and Uria B. On the evaluation of inversion
mapping performance in the acoustic domain // Proc. Interspeech, pp. 1012–1016,
Lyon, 2013.
9. Robinson A. J. An Application of Recurrent Nets to Phone Probability Estimation
// IEEE Transactions on Neural Networks. Vol. 5, no. 2/ P. 298–305, 1994.
Цена: 50 рублей
Заказать
• Этические принципы научных публикаций