ANALISA TERJADINYA OVERFITTING DAN UNDERFITTING PADA ALGORITMA NAIVE BAYES DAN DECISION TREE DENGAN TEKNIK CROSS VALIDATION

Wildan Attariq Firmansyach,Umi Hayati,Yudhistira Arie Wijaya
DOI: https://doi.org/10.36040/jati.v7i1.6329
2023-02-26
JATI (Jurnal Mahasiswa Teknik Informatika)
Abstract:Perkembangan digital dapat meringankan aktivitas manusia dalam menggunakan, serta mengelola informasi. Suatu informasi berdasarkan kumpulan data dengan dilakukannya proses data mining. Banyak masalah yang terjadi pada data mining dikarenakan hasil yang diperoleh dipengaruhi oleh adanya ketidak seimbangan data sehingga terjadinya overfitting dan underfitting biasanya disebabkan oleh data yang berlebihan atau data yang kurang sehingga model yang dihasilkan tidak dapat menangkap pola dari data yang digunakan. Tujuan dari penelitian ini mendapatkan hasil akurasi terbaik melalui perbandingan yang diperoleh supaya tidak terjadinya overfitting dan underfitting dalam hasil akurasi, untuk mengimplementasikan hasil akurasi darimachine learning meningkatkan kepastian dan menunjukan hasil keputusan, menggunakan data sampel Status Kelulusan Siswa SMA Jurusan IPA Jalur SNMPTN Di Indonesia yang dihimpun dari periode tahun 2022, data berjumlah 4.030 data dan 10 atribut. Metode yang digunakan untuk mendapatkan hasil evaluasi terbaik menggunakan algoritma Naïve Bayes dan Decision Tree dengan teknik Cross Validation. Hasil dari penelitian ini yaitu algoritma Naive Bayes mendapatkan skor akurasi sebesar 63%, serta algoritma Decision Tree mendapatkan skor akurasi sebesar 96%, dengan hasil skor akurasi yang diperoleh algoritma terbaik yaitu Decision Tree dengan menggunakan teknikValidasi silang.
What problem does this paper attempt to address?