Optimasi Model Prediksi Kelulusan Mahasiswa Berbasis Principal Component Analysis dan Modified K-Nearest Neighbor
Abstract
Angka drop-out mahasiswa di perguruan tinggi masih menjadi permasalahan serius karena berdampak pada pemborosan sumber daya dan perkembangan institusi. Identifikasi dini terhadap mahasiswa berisiko drop-out sangat penting, namun metode manual dan algoritma K-Nearest Neighbor (KNN) konvensional masih memiliki keterbatasan, seperti sensitivitas terhadap outlier dan data berdimensi tinggi. Penelitian ini mengusulkan integrasi Principal Component Analysis (PCA) dan Modified K-Nearest Neighbor (MKNN) untuk meningkatkan akurasi klasifikasi kelulusan mahasiswa. PCA digunakan untuk mereduksi 14 variabel menjadi 2 variabel utama, sedangkan MKNN memodifikasi KNN dengan teknik weight voting berbasis jarak serta validasi data latih guna mengurangi perngaruh outlier. Model diujikan dengan skema pembagian data 60:40 (latih:uji) dan parameter optimal k=9. Hasil penelitian menunjukkan bahwa kombinasi PCA dan MKNN mampu mencapai akurasi 99,31%, meningkat 0,93% dibanding KNN standar, serta menghasilkan presisi, recall, dan F1-Score sebesar 99,3%. Temuan ini menegaskan bahwa integrasi reduksi dimensi dan weight voting efektif dalam meningkatkan kinerja klasifikasi, sehingga model ini berpotensi menjadi alat prediksi drop-out yang andal di lingkungan pendidikan tinggi.