Nurhaliza, Sy. Farini (2025) Penerapan Support Vector Machine Dengan Synthetic Minority Oversampling Technique (Smote) Dalam Pengklasifikasian Penyakit Diabetes. Skripsi thesis, Universitas Tanjungpura.
|
Text (Cover-Bab I)
Cover-Bab1_H1091211037.pdf - Published Version Download (457kB) |
|
|
Text (H1091211037_SY. ARINI NURHALIZA)
H1091211037_SY. ARINI NURHALIZA.pdf - Accepted Version Restricted to Repository staff only Download (1MB) |
Abstract
Algoritma Support Vector Machine (SVM) merupakan salah satu algoritma pada data mining yang sering digunakan dalam proses klasifikasi karena kemampuannya menangani data dengan dimensi tinggi. Namun, performa klasifikasi SVM dapat dipengaruhi oleh ketidakseimbangan kelas, di mana data kelas mayoritas cenderung mendominasi hasil prediksi dan mengabaikan kelas minoritas. Oleh karena itu, penelitian ini bertujuan untuk menerapkan metode Support Vector Machine (SVM) dalam pengklasifikasian penyakit diabetes dengan membandingkan performa model sebelum dan sesudah diterapkannya Synthetic Minority Over-sampling Technique (SMOTE). Data yang digunakan merupakan data PIMA Indian Diabetes dari Kaggle yang memiliki ketidakseimbangan kelas. Untuk menangani ketidakseimbangan tersebut, SMOTE digunakan dengan parameter jumlah tetangga terdekat (k) sebanyak 3 dengan label kelas positif adalah pasien terdiagnosa diabetes. Evaluasi dilakukan terhadap tiga jenis kernel SVM, yaitu Linear, RBF, dan Polynomial, pada data latih dan data uji. Hasil pada data latih menunjukkan bahwa model SVM dengan SMOTE memberikan peningkatan signifikan pada nilai recall dan F1-score dibandingkan model tanpa SMOTE. Recall mengukur kemampuan model dalam mendeteksi seluruh kasus positif (penderita diabetes), sementara F1-score merupakan rata-rata harmonik dari precision dan recall, yang mencerminkan keseimbangan antara kemampuan model mendeteksi dan ketepatan prediksi kasus positif. pada data latih, kernel RBF yang mencapai akurasi 0,9828, recall 0,9863, dan F1-score 0,9822. Sebaliknya, model tanpa SMOTE dengan kernel RBF menunjukkan performa yang sangat tinggi pada data latih namun rendah pada data uji, dengan F1-score hanya sebesar 0,1600, yang mengindikasikan kemungkinan terjadinya overfitting. Pada data uji, penerapan SMOTE juga menunjukkan perbaikan recall yang signifikan terutama pada kernel Linear dan Polynomial. Model SVM dengan SMOTE dan kernel Linear mencapai recall sebesar 0,7368 dan F1-score sebesar 0,6829, meningkat dibandingkan model tanpa SMOTE dengan recall 0,4737 dan F1-score 0,5806. Hal ini mengindikasikan bahwa pola klasifikasi pada data memiliki kecenderungan linier, sehingga transformasi non-linear yang ditawarkan oleh kernel RBF maupun polynomial tidak memberikan keuntungan signifikan.
| Item Type: | Thesis (Skripsi) | ||||||
|---|---|---|---|---|---|---|---|
| Creators: |
|
||||||
| Subjects: | 500 – Ilmu Pengetahuan > 510 Matematika > 511 Prinsip-prinsip umum matematika | ||||||
| Divisions: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Statistik S1 | ||||||
| Depositing User: | Rudiarti Rudiarti | ||||||
| Date Deposited: | 16 Dec 2025 03:05 | ||||||
| Last Modified: | 16 Dec 2025 03:05 | ||||||
| URI: | http://36.95.239.66/id/eprint/4398 |
Actions (login required)
![]() |
View Item |
