Perbandingan Hasil Penerjemahan Neural Machine Translation (NMT) Dengan Mariannmt Terhadap Sumber Korpus Wikimedia Dan QED&TED

Dzulkahfi, Dzulkahfi (2022) Perbandingan Hasil Penerjemahan Neural Machine Translation (NMT) Dengan Mariannmt Terhadap Sumber Korpus Wikimedia Dan QED&TED. Skripsi thesis, Universitas Tanjungpura.

[img] Text (Cover)
Cover_D1042151048.pdf - Published Version

Download (46kB)
[img] Text (Yuridis)
Yuridis_D1042151048.pdf - Published Version

Download (138kB)
[img] Text (Surat Pernyataan)
SP_D1042151048.pdf - Published Version

Download (85kB)
[img] Text (Abstrak)
Abstrak_D1042151048.pdf - Published Version

Download (91kB)
[img] Text (Kata Pengantar)
Kapeng_D1042151048.pdf - Published Version

Download (85kB)
[img] Text (Daftar Isi)
Dafis_D1042151048.pdf - Published Version

Download (177kB)
[img] Text (Daftar Lain)
Daflain_D1042151048.pdf - Published Version

Download (158kB)
[img] Text (Bab I)
Bab1_D1042151048.pdf - Published Version

Download (97kB)
[img] Text (Bab II)
Bab2_D1042151048.pdf - Published Version

Download (2MB)
[img] Text (Bab III)
Bab3_D1042151048.pdf - Accepted Version
Restricted to Repository staff only

Download (326kB)
[img] Text (Bab IV)
Bab4_D1042151048.pdf - Accepted Version
Restricted to Repository staff only

Download (667kB)
[img] Text (Bab V)
Bab5_D1042151048.pdf - Accepted Version
Restricted to Repository staff only

Download (91kB)
[img] Text (Daftar Pustaka)
Dapus_D1042151048.pdf - Published Version

Download (175kB)

Abstract

Pembelajaran bahasa dengan mesin sekarang ini sudah mencapai pada tahap dimana jumlah data memegang kunci penting pada hasilnya. Berbagai pengembangan dilakukan sehingga masalah terkait kualitas data dapat diatasi, terutama banyak terjadi di era mesin penerjemah saraf tiruan (MPST). Salah satu ide besar untuk mengembangkan pembelajaran lebih lanjut untuk hal ini adalah dengan membangun sistem secara low-resource, dimana akan memfokuskan media pembelajar untuk bekerja dan mampu membentuk pengetahuan dengan sumber data dengan kondisi tersebut. Arsitektur MPST sudah umum digunakan sebagai bagian arsitektur sistem machine translation sejak populer di WMT16, dan mempunyai kelebihan dapat melakukan berbagai tugas terkait penerjemahan bahasa secara tepat dan mudah. Tersebutlah toolkit MarianNMT, Sebuah toolkit mesin penerjemah saraf tiruan yang dikembangkan oleh tim Microsoft Translator dengan harapan menciptakan toolkit yang resource-friendly dan dapat mencapai kecepatan training dan penerrjemahan yang tinggi serta support untuk impementasi pada sistem lokal yang mengandalkan sumber daya hardware dalam device dengan GPU atau CPU. Dalam kasus penerjemahan Bahasa Inggris ke Indonesia dan menggunakan model “Nematus-Style Shallow RNN” pada MarianNMT, dalam 28 jam mampu untuk menyelesaikan training untuk kedua kasus training dengan korpus yang memiliki baris < 500K kalimat. Pada training digunakan validasi dengan repository FLORES-101, dan membawa dua kasus training dengan korpus berbeda dari Wikimedia untuk memperoleh nilai BLEU (5.2 - 4.7), SpBLEU (8.1 - 7.2) dan QED&TED dengan nilai BLEU (4.0 - 4.3) SpBLEU (6.8 - 6.9) untuk terjemahan dari korpus dev dan devtest berturut-turut. Menyimpulkan bahwa korpus Wikimedia memiliki kecocokan dengan evaluasi pelatihannya, namun belum cocok untuk melakukan penerjemahan pada bentuk kata yang tak pernah terlihat. Sedangkan pada korpus QED&TED hal tersebut tercapai walau dengan perbandingan skor yang lebih kecil.

Item Type: Thesis (Skripsi)
Creators:
CreatorsNomor Induk Mahasiswa (NIM)Email
Dzulkahfi, DzulkahfiNIMD1042151048UNSPECIFIED
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Teknik > Teknik Informatika S1
Depositing User: Sri Yulihartini
Date Deposited: 11 Jul 2024 07:59
Last Modified: 11 Jul 2024 07:59
URI: http://36.95.239.66/id/eprint/1237

Actions (login required)

View Item View Item