Dzulkahfi, Dzulkahfi (2022) Perbandingan Hasil Penerjemahan Neural Machine Translation (NMT) Dengan Mariannmt Terhadap Sumber Korpus Wikimedia Dan QED&TED. Skripsi thesis, Universitas Tanjungpura.
Text (Cover)
Cover_D1042151048.pdf - Published Version Download (46kB) |
|
Text (Yuridis)
Yuridis_D1042151048.pdf - Published Version Download (138kB) |
|
Text (Surat Pernyataan)
SP_D1042151048.pdf - Published Version Download (85kB) |
|
Text (Abstrak)
Abstrak_D1042151048.pdf - Published Version Download (91kB) |
|
Text (Kata Pengantar)
Kapeng_D1042151048.pdf - Published Version Download (85kB) |
|
Text (Daftar Isi)
Dafis_D1042151048.pdf - Published Version Download (177kB) |
|
Text (Daftar Lain)
Daflain_D1042151048.pdf - Published Version Download (158kB) |
|
Text (Bab I)
Bab1_D1042151048.pdf - Published Version Download (97kB) |
|
Text (Bab II)
Bab2_D1042151048.pdf - Published Version Download (2MB) |
|
Text (Bab III)
Bab3_D1042151048.pdf - Accepted Version Restricted to Repository staff only Download (326kB) |
|
Text (Bab IV)
Bab4_D1042151048.pdf - Accepted Version Restricted to Repository staff only Download (667kB) |
|
Text (Bab V)
Bab5_D1042151048.pdf - Accepted Version Restricted to Repository staff only Download (91kB) |
|
Text (Daftar Pustaka)
Dapus_D1042151048.pdf - Published Version Download (175kB) |
Abstract
Pembelajaran bahasa dengan mesin sekarang ini sudah mencapai pada tahap dimana jumlah data memegang kunci penting pada hasilnya. Berbagai pengembangan dilakukan sehingga masalah terkait kualitas data dapat diatasi, terutama banyak terjadi di era mesin penerjemah saraf tiruan (MPST). Salah satu ide besar untuk mengembangkan pembelajaran lebih lanjut untuk hal ini adalah dengan membangun sistem secara low-resource, dimana akan memfokuskan media pembelajar untuk bekerja dan mampu membentuk pengetahuan dengan sumber data dengan kondisi tersebut. Arsitektur MPST sudah umum digunakan sebagai bagian arsitektur sistem machine translation sejak populer di WMT16, dan mempunyai kelebihan dapat melakukan berbagai tugas terkait penerjemahan bahasa secara tepat dan mudah. Tersebutlah toolkit MarianNMT, Sebuah toolkit mesin penerjemah saraf tiruan yang dikembangkan oleh tim Microsoft Translator dengan harapan menciptakan toolkit yang resource-friendly dan dapat mencapai kecepatan training dan penerrjemahan yang tinggi serta support untuk impementasi pada sistem lokal yang mengandalkan sumber daya hardware dalam device dengan GPU atau CPU. Dalam kasus penerjemahan Bahasa Inggris ke Indonesia dan menggunakan model “Nematus-Style Shallow RNN” pada MarianNMT, dalam 28 jam mampu untuk menyelesaikan training untuk kedua kasus training dengan korpus yang memiliki baris < 500K kalimat. Pada training digunakan validasi dengan repository FLORES-101, dan membawa dua kasus training dengan korpus berbeda dari Wikimedia untuk memperoleh nilai BLEU (5.2 - 4.7), SpBLEU (8.1 - 7.2) dan QED&TED dengan nilai BLEU (4.0 - 4.3) SpBLEU (6.8 - 6.9) untuk terjemahan dari korpus dev dan devtest berturut-turut. Menyimpulkan bahwa korpus Wikimedia memiliki kecocokan dengan evaluasi pelatihannya, namun belum cocok untuk melakukan penerjemahan pada bentuk kata yang tak pernah terlihat. Sedangkan pada korpus QED&TED hal tersebut tercapai walau dengan perbandingan skor yang lebih kecil.
Item Type: | Thesis (Skripsi) | ||||||
---|---|---|---|---|---|---|---|
Creators: |
|
||||||
Subjects: | 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data | ||||||
Divisions: | Fakultas Teknik > Teknik Informatika S1 | ||||||
Depositing User: | Sri Yulihartini | ||||||
Date Deposited: | 11 Jul 2024 07:59 | ||||||
Last Modified: | 11 Jul 2024 07:59 | ||||||
URI: | http://36.95.239.66/id/eprint/1237 |
Actions (login required)
View Item |