Myanmar synthesized speeches of End-to-End Speech Synthesis with GAN based Neural Vocoder
Synthesized speeches of Text-to-Speech systems which are published results from research of NLP Lab., UCSY are presented in the following table.
This is published in "Aye Mya Hlaing, Win Pa Pa, "Generative Adversarial Network based Neural Vocoder for Myanmar End-to-End Speech Synthesis", The 7th International Conference on Natural Language and Speech Processing (ICNLSP 2024) , October 19-20, 2024, Trento, Italy"
The following utterances are the synthesized speeches of these transcriptions.
Ground Truth Mel-spectrogram Inversion
ID | Gound Truth | Parallel WaveGAN | HiFi-GAN |
---|---|---|---|
1 | စာအိတ်တစ်အိတ်နဲ့ စာရေးစက္ကူတစ်ချို့ ယူလာပေးနိုင်မလား။ | ||
2 | မွန်းတည့်ချိန်တောင် ရောက်နေပြီ။ | ||
3 | အပတ်တိုင်း အင်္ဂါနေ့၊ သောကြာနေ့၊ စနေနေ့၊ သုံးစင်းရှိပါတယ်။ | ||
Generalizing to Unseen Speakers
ID | Gound Truth | Parallel WaveGAN | HiFi-GAN |
---|---|---|---|
1 | နည်းနည်းပိုဈေးဆစ်ရင် လျှော့ရင်လည်း လျှော့ပေးမှာပေါ့။ | ||
2 | ဘွဲ့ယူပြီးတာနဲ့ ချက်ခြင်းဘဲ မဟာဘွဲ့အထိ ဆက်တက်ပါမယ်။ | ||
3 | မိုးလေဝသကြေညာချက်အရ မနက်ဖြန် မိုးရွာမယ်။ | ||
4 | ပိုက်ဆံအိတ်ထဲမှာ အကြွေးဝယ်ခွင့်ကတ်တွေနဲ့ ငွေသားဒေါ်လာ နှစ်ရာရှိတယ်။ | ||
Myanmar End-to-End Speech Synthesis
ID | Gound Truth | Tacotron2 + Parallel WaveGAN | Tacotron2 + HiFi-GAN |
---|---|---|---|
1 | ကျွန်တော် ရှာနေတာနဲ့ အံကိုက်ပဲ။ | ||
2 | စိတ်ချ၊ ဘာလို့မဖြစ်နိုင်ရမှာလဲ။ | ||
3 | ဒါတွေက မက်မန်းသီးလို အသီးဆားစိမ် ဖြစ်ပါတယ်။ | ||
Updated on 20.4.2025