Pembuatan Perangkat Basis Data untuk Sintesis Ucapan (Natural Speech Synthesis) Berbahasa Indonesia Berbasis Hidden Markov Model (HMM)

Elok Anggrayni; Sekartedjo Sekartedjo; Dhany Arifianto

Jurnal Teknik ITS (Sep 2013)

Pembuatan Perangkat Basis Data untuk Sintesis Ucapan (Natural Speech Synthesis) Berbahasa Indonesia Berbasis Hidden Markov Model (HMM)

Elok Anggrayni,
Sekartedjo Sekartedjo,
Dhany Arifianto

Affiliations

Elok Anggrayni: Institut Teknologi Sepuluh Nopember Surabaya
Sekartedjo Sekartedjo: Institut Teknologi Sepuluh Nopember Surabaya
Dhany Arifianto: Institut Teknologi Sepuluh Nopember Surabaya

Journal volume & issue: Vol. 2, no. 2

Abstract

Read online

Salah satu teknik sintesis ucapan adalah sistem statistik parametrik sintesis ucapan menggunakan Hidden Markov Model (HMM). Speech synthesis dalam bahasa Indonesia dengan menggunakan HTS masih belum pernah dikembangkan (under-resourced). Penelitian ini diawali dengan pembuatan basis data suara bahasa Indonesia melalui proses perekaman, kemudian diikuti dengan proses segmentasi simbol fonetik, dan pemberian label. Dalam penelitian ini diperoleh basis data dalam bahasa Indonesia sejumlah 1529 kalimat yang sesuai dengan kaidah keseimbangan fonetik (phonetically balanced), yaitu telah memenuhi 33 jenis fonem. Selain itu, diperoleh juga segmentasi dan labeling dataset sebanyak 100 kalimat hasil rekaman suara laki-laki dan 100 kalimat hasil rekaman suara wanita. Penyiapan perangkat lunak untuk menjalankan sistem sintesis ucapan berbahasa Inggris berbasis HMM telah dilakukan dengan mengaplikasikan HTS yang menggunakan. Berdasarkan hasil uji kualitas suara menggunakan uji subyektif, melibatkan 20 responden, diperoleh naturalness dengan nilai Mean Opinion Score (MOS) 3,4 untuk pengujian hasil training speaker dependent (SD) training demo dan 3,2 untuk pengujian hasil speaker adaptation/adaptive (SAD) training demo. Dengan demikian, synthetic speech yang dihasilkan dapat dikategorikan baik dan perangkat lunak yang dipakai dapat digunakan untuk melakukan perancangan sistem sintesis ucapan berbahasa Indonesia.

Published in Jurnal Teknik ITS

ISSN: 2301-9271 (Print); 2337-3539 (Online)
Publisher: Lembaga Penelitian dan Pengabdian kepada Masyarakat (LP2M)
Country of publisher: Indonesia
LCC subjects: Technology: Engineering (General). Civil engineering (General)
Website: http://ejurnal.its.ac.id/index.php/teknik

About the journal

Abstract

Keywords