doi: 10.17586/2226-1494-2017-17-4-749-752


УДК 004.934.5

МЕТОД АВТОМАТИЧЕСКОЙ РАССТАНОВКИ ПАУЗ ДЛЯ КАЗАХСКОГО ЯЗЫКА

Калиев А.К.


Читать статью полностью 
Язык статьи - русский

Ссылка для цитирования: Калиев А. Метод автоматической расстановки пауз для казахского языка // Научно-технический вестник информационных технологий, механики и оптики. 2017. Т. 17. № 4. С. 749–752. doi: 10.17586/2226-1494-2017-17-4-749-752

Аннотация

Предложен новый метод паузации для систем синтеза интонационной речи, основанный на анализе дистрибутивной семантики в больших текстовых корпусах. Для предсказывания паузы использовался классификатор на основе метода опорных векторов и два речевых корпуса на казахском языке. Предсказание мест паузации проводилось на уровне биграмм, где входными параметрами биграммы служили векторные представления обоих ее лексем и их битовое представление в кластерной модели Брауна. Проведенные исследования показали, что предложенный метод паузации для систем автоматического синтеза казахской речи в повествовательном стиле обеспечивает расстановку пауз с высокой точностью. Экспериментально подтверждена важность использования однородных данных для решения такого рода задач. Предложенный подход может быть использован при создании систем автоматического синтеза речи для множества языков.


Ключевые слова: синтез речи, паузы, кластеризация, текстовый корпус, просодика

Благодарности. Исследование выполнено в рамках научно-исследовательской работы «Разработка и исследование методов и алгоритмов распознавания эмоционального и психофизического состояния человека по многомодальным данным» и поддержано Грантом Правительства Российской Федерации № 616029.

Список литературы
1. Brown P.F., Desouza P.V., Mercer R.L. et. al. Class-based n-gram models of natural language // Computational Linguistics. 1992. V. 18. P. 467–479.
2. Stratos K., Kim D., Collins M., Hsu D. A spectral algorithm for learning classbased n-gram models of natural language // Proc. 30th Conf. on Uncertainty in Artificial Intelligence. Quebec, Canada, 2014. P. 762–771.
3. Miller S., Guinness J., Zamanian A. Name tagging with word clusters and discriminative training // Proc. Human Language Technologies and North American Association for Computational Linguistics. 2004. V. 4. P. 337–342.
4. Koo T., Carreras X., Collins M. Simple semi-supervised dependency parsing // Proc. 46th Annual Meeting of the Association for Computational Linguistics, ACL-08: HLT. Columbus,USA,2008. P. 595–603.
5. Lancia F. Word Co-occurrence and Theory of Meaning. 2005. URL:
www.soc.ucsb.edu/faculty/mohr/classes/soc4/summer_08/pages/Resources/Readings/TheoryofMeaning.pdf
(дата обращения: 25.04.2017).
6. Cortes C., Vapnik V. Support vector networks // Machine Learning. 1995. V. 20. N 3. P. 273–297. doi: 10.1023/A:1022627411411
7. Rijsbergen C.J.V. Information Retrieval. 2nd ed. London: Butterworths, 1979. 152 p.
8. Chistikov P.G., Khomitsevich O.G. Improving prosodic break detection in a Russian TTS system // Lecture Notes in Computer Science. 2013. V. 8113.P. 181–188. doi: 10.1007/978-3-319-01931-4_24


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2024 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика