Data Balancing untuk Mengatasi Imbalance Dataset pada Prediksi Produksi Padi

Main Article Content

Khafid Akbar
Mardhiya Hayaty

Abstract

Padi adalah salah satu hasil tanaman pangan di Indonesia yang merupakan salah satu makanan pokok. Tingginya permintaan untuk produksi beras telah mengakibatkan sejumlah daerah di Indonesia membuat lumbung padi dengan setidaknya delapan daerah, yang salah satunya di Jawa Timur. Kebutuhan untuk memproses data terkait pasokan makanan, terutama beras, merupakan salah satu faktor penting untuk mengantisipasi tingkat permintaan di masa depan. Langkah yang dilakukan dalam penelitian ini untuk mencapai hasil yang diharapkan adalah dengan melakukan proses penambangan data yaitu mengumpulkan data, preprocessing data, mengimplementasikan algoritma pada data yang ada, dan mengevaluasi hasil. Dalam penelitian ini, peneliti menggunakan dua algoritma klasifikasi untuk menguji keakuratan data balancing, yaitu Naive Bayes dan CART. Proses balancing yang dilakukan oleh peneliti menggunakan metode balancing data dengan algoritma SMOTE. Dengan langkah-langkah yang peneliti lakukan di atas menghasilkan akurasi algoritma Naive Bayes dengan data sebelum menyeimbangkan 43,8% dengan nilai AUC 0,373 dan setelah menyeimbangkan data menghasilkan akurasi 39,06% dengan nilai AUC 0,475. Untuk algoritma CART, nilai akurasi sebelum menyeimbangkan data adalah 47,67% dengan nilai AUC 0,391, kemudian akurasi yang dihasilkan setelah saldo data untuk algoritma CART mencapai 55,73% dengan nilai AUC 0,492. dengan demikian menunjukkan pengaruh keseimbangan dan ketidakseimbangan data terhadap kinerja algoritma klasifikasi Naive Bayes dan CART.


 


 

Article Details

How to Cite
Akbar, K., & Hayaty, M. . (2020). Data Balancing untuk Mengatasi Imbalance Dataset pada Prediksi Produksi Padi. Jurnal Ilmiah Intech : Information Technology Journal of UMUS, 2(02). https://doi.org/10.46772/intech.v2i02.283
Section
Articles
Author Biographies

Khafid Akbar, Program Studi Informatika , Fakultas Ilmu Komputer, Universitas AMIKOM Yogyakarta

 

 

Mardhiya Hayaty, Program Studi Informatika , Fakultas Ilmu Komputer, Universitas AMIKOM Yogyakarta

 

 

References

BPS, Hasil Survey Pertanian Antar Sensus (SUTAS) 2018 Seri-A2, Seri-A2. Jakarta: BPS-Statistics, 2019.

Suyanto, Data Mining Untuk Klasifikasi dan Klasterisasi Data. Bandung: Informatika Bandung, 2017.

F. H. Utami, “Penentuan Tingkat Kesuburan Tanah di Balai Penyuluhan Pertanian Perikanan dan Kehutanan,” Riau J. Comput. Sci., vol. 1, no. 1, pp. 27–39, 2015, [Online]. Available: http://e-journal.upp.ac.id/index.php/RJOCS/article/view/485.

I. N. Hidayati and S. Suryanto, “Pengaruh Perubahan Iklim Terhadap Produksi Pertanian Dan Strategi Adaptasi Pada Lahan Rawan Kekeringan,” J. Ekon. Stud. Pembangunan., vol. 16, no. 1, pp. 42–52, 2015, doi: 10.18196/jesp.16.1.1217.

B. Landia, “Peramalan Jumlah Mahasiswa Baru Dengan Exponential Smoothing dan Moving Average,” J. Ilm. Intech Informatioan Technol. J. UMUS, vol. 2, no. 1, pp. 71–78, 2020, doi: 10.46772/intech.v2i01.188.

Ronida and Kosim, “Implementasi Prototype Dalam Pembuatan Website Sebagai Media Promosi Di MA Darul Masholeh Cirebon,” J. Ilm. Intech Informatioan Technol. J. UMUS, vol. 1, no. 2, pp. 33–42, 2019, doi: 10.46772/intech.v1i02.68.

R. A. Putra, “Penerapan Naïve Bayes Classifier dengan Gaussian Function Untuk Menentukan Kelompok UKT,” J. Inform. Glob., vol. 9, no. 2, pp. 112–117, 2018, doi: 10.36982/jig.v9i2.583.

E. Zhang, B. Li, P. Li, and Y. Chen, “A deep learning based printing defect classification method with imbalanced samples,” Symmetry (Basel)., vol. 11, no. 12, pp. 1–14, 2019, doi: 10.3390/SYM11121440.

S. H. Sumartini and S. W. Purnami, “Penggunaan Metode Classification and Regression Trees (CART) untuk Klasifikasi Rekurensi Pasien Kanker Serviks di RSUD Dr. Soetomo Surabaya,” J. Sains dan Seni ITS, vol. 4, no. 2, pp. 211–216, 2015, doi: 10.12962/j23373520.v4i2.10673

Hariati, M. Wati, and B. Cahyono, “Penerapan Algoritma C4.5 Decision Tree pada Penentuan Penerima Program Bantuan Pemerintah Daerah Kabupaten Kutai Kartanegara,” Jurti, vol. 2, no. 1, pp. 27–36, 2018, doi: 10.30872/jurti.v2i2.1861.

A. Walyuno, moch abdul Mukid, and T. Wuryandari, “Perbandingan Analisis Klasifikasi Nasabah Kredit Menggunakan Regresi Logistik Biner Dan Cart (Classification and Regression Trees),” J. Gaussian, vol. 4, no. 2, pp. 215–225, 2015, doi: 10.15797/concom.2019..23.009.

W. Y. Loh, “Classification and regression trees,” Wiley Interdiscip. Rev. Data Min. Knowl. Discov., vol. 1, no. 1, pp. 14–23, 2011, doi: 10.1002/widm.8.

F. E. Pratiwi, F. E. Pratiwi, and I. Zain, “Klasifikasi Pengangguran Terbuka Menggunakan CART (Classification and Regression Tree) di Provinsi Sulawesi Utara,” J. Sains dan Seni ITS, vol. 3, no. 1, pp. D54–D59, 2014, doi: 10.12962/j23373520.v3i1.6129

L. Breiman, “Technical note: Some properties of splitting criteria,” Mach. Learn., vol. 24, no. 1, pp. 41–47, 1996, doi: 10.1007/bf00117831.

R. A. Barro, I. D. Sulvianti, and F. M. Afendi, “Penerapan Synthetic Minority Oversampling Technique (Smote) Terhadap Data Tidak Seimbang Pada Pembuatan Model Komposisi Jamu,” Xplore J. Stat., vol. 1, no. 1, pp. 1–6, 2013, doi: 10.29244/xplore.v1i1.12424.

N. Rout, D. Mishra, and M. K. Mallick, “Handling imbalanced data: A survey,” Adv. Intell. Syst. Comput., vol. 628, pp. 431–443, 2018, doi: 10.1007/978-981-10-5272-9_39.

Harliana and W. Widayani, “Analisis Dempster Shafer Pada Sistem Pakar Pendeteksi ISPA,” FAHMA, vol. 17, no. 2, pp. 60–69, 2019, [Online]. Available: https://stmikelrahma.e-journal.id/FAHMA/article/view/34/22.