Navigation


Myanmar synthesized speeches of End-to-End Speech Synthesis with GAN based Neural Vocoder


Synthesized speeches of Text-to-Speech systems which are published results from research of NLP Lab., UCSY are presented in the following table.

This is published in "Aye Mya Hlaing, Win Pa Pa, "Generative Adversarial Network based Neural Vocoder for Myanmar End-to-End Speech Synthesis", The 7th International Conference on Natural Language and Speech Processing (ICNLSP 2024) , October 19-20, 2024, Trento, Italy"

The following utterances are the synthesized speeches of these transcriptions.

Ground Truth Mel-spectrogram Inversion

ID Gound Truth Parallel WaveGAN HiFi-GAN
1 စာအိတ်တစ်အိတ်နဲ့ စာရေးစက္ကူတစ်ချို့ ယူလာပေးနိုင်မလား။
2 မွန်းတည့်ချိန်တောင် ရောက်နေပြီ။
3 အပတ်တိုင်း အင်္ဂါနေ့၊ သောကြာနေ့၊ စနေနေ့၊ သုံးစင်းရှိပါတယ်။

Generalizing to Unseen Speakers

ID Gound Truth Parallel WaveGAN HiFi-GAN
1 နည်းနည်းပိုဈေးဆစ်ရင် လျှော့ရင်လည်း လျှော့ပေးမှာပေါ့။
2 ဘွဲ့ယူပြီးတာနဲ့ ချက်ခြင်းဘဲ မဟာဘွဲ့အထိ ဆက်တက်ပါမယ်။
3 မိုးလေဝသကြေညာချက်အရ မနက်ဖြန် မိုးရွာမယ်။
4 ပိုက်ဆံအိတ်ထဲမှာ အကြွေးဝယ်ခွင့်ကတ်တွေနဲ့ ငွေသားဒေါ်လာ နှစ်ရာရှိတယ်။

Myanmar End-to-End Speech Synthesis

ID Gound Truth Tacotron2 + Parallel WaveGAN Tacotron2 + HiFi-GAN
1 ကျွန်တော် ရှာနေတာနဲ့ အံကိုက်ပဲ။
2 စိတ်ချ၊ ဘာလို့မဖြစ်နိုင်ရမှာလဲ။
3 ဒါတွေက မက်မန်းသီးလို အသီးဆားစိမ် ဖြစ်ပါတယ်။

Updated on 20.4.2025