Analisis Perbandingan Kemiripan Teks Bahasa Daerah di Indonesia Menggunakan Algoritma Naive Bayes dan K-Nearest Neighbor

Alfarizi, Alfarizi (2025) Analisis Perbandingan Kemiripan Teks Bahasa Daerah di Indonesia Menggunakan Algoritma Naive Bayes dan K-Nearest Neighbor. Skripsi thesis, Universitas Tanjungpura.

[img] Text (Cover-Bab1)
Cover-Bab1_D1041191018.pdf - Published Version

Download (779kB)
[img] Text (D1041191018_ALFARIZI)
D1041191018_ALFARIZI.pdf - Accepted Version
Restricted to Repository staff only

Download (2MB)

Abstract

Sebagai sebuah negara kepulauan, Indonesia memiliki berbagai macam bahasa, Indonesia memiliki 718 bahasa daerah. Namun, banyak bahasa daerah yang menghadapi risiko penurunan pengguna hingga ternacam punah. Perkembangan teknologi membuka peluang untuk melakukan analisis pola dan karakteristik unik bahasa daerah melalui analisis n gram yang menggunakan algoritma naive bayes dan k-nearest neighbor. Oleh karena itu, dilakukanlah penelitian ini dengan tujuan menganalisis kemiripan bahasa daerah, terutama bahasa Jawa Tengah, Sunda, dan Melayu Pontianak sebagai salah satu upaya membantu pelestarian bahasa daerah di Indonesia. Hasil analisis kemiripan antar bahasa dihitung berdasarkan kesalahan pada confusion matrix dan kinerja dari algoritma akan dinilai menggunakan metrik akurasi dan F1-score. Algoritma naive bayes dengan fitur gabungan unigram dan bigrams menunjukkan kinerja yang paling baik dengan nilai akurasi dan F1-score sebesar 0.921. Hasil penelitian menunjukkan nilai kemiripan tertinggi pada bahasa ‘Jawa – Melayu’ meskipun hanya sebesar 3.82% dan terendah pada bahasa ‘Melayu – Sunda’ sebesar 1.66%. Nilai kemiripan tersebut didasarkan pada karakter yang dominan muncul di suatu bahasa seperti ‘e’ pada bahasa Melayu serta ‘a’ dan ‘u’ pada bahasa Sunda. Penelitian ini membuktikan bahwa hanya sedikit kemiripan yang ada di antara bahasa Jawa, Sunda, dan Melayu

Item Type: Thesis (Skripsi)
Creators:
CreatorsNomor Induk Mahasiswa (NIM)Email
Alfarizi, AlfariziNIMD1041191018UNSPECIFIED
Subjects: 000 - Komputer, Informasi dan Referensi Umum > 000 Ilmu komputer, ilmu pengetahuan dan sistem-sistem > 005 Pemrograman komputer, program dan data
Divisions: Fakultas Teknik > Teknik Informatika S1
Depositing User: Robiatul Adawiyah
Date Deposited: 23 Dec 2025 03:04
Last Modified: 23 Dec 2025 03:04
URI: http://36.95.239.66/id/eprint/4545

Actions (login required)

View Item View Item