OPTIMASI ALGORITMA RANDOM FOREST UNTUK MENINGKATKAN AKURASI PREDIKSI INDEKS MASSA TUBUH (BMI)

  • Eva Juliani Universitas Singaperbangsa Karawang
  • Apriade Voutama Universitas Singaperbangsa Karawang
Keywords: Body Mass Index, Random Forest, Machine Learning

Abstract

Accurate Body Mass Index (BMI) prediction is essential for detecting obesity risks and related diseases. This study optimizes the Random Forest algorithm to enhance BMI prediction accuracy through hyperparameter tuning and feature selection. The dataset used is Obesity: Raw and Synthetic Data, which includes demographic and lifestyle variables. After undergoing subsetting, label encoding, and data imbalance handling using SMOTE, the model was trained using Random Forest and evaluated with accuracy, precision, recall, and F1-score metrics. The results indicate that the optimized model achieved 90% accuracy, with precision and recall of 0.89. Additionally, the feature importance analysis identified weight, height, and dietary habits as the most influential factors in BMI prediction. These findings confirm that optimizing the algorithm enhances model reliability in BMI classification and can be applied in data-driven health monitoring systems. This research is expected to contribute to the development of digital health applications and more accurate early obesity detection systems. 

References

Alifah, R. N., Najib, M. K., Nurdiati, S., Sari, A. P., Herlambang, K., Putri, T., Ginting, B., & Sya’adah, S. N. (n.d.). Indonesian Journal of Mathematics and Natural Sciences Perbandingan Metode Tree Based Classification untuk Masalah Klasifikasi Data Body Mass Index. In Indones. J. Math. Nat. Sci (Vol. 47, Issue 1). https://journal.unnes.ac.id/journals/JM/index

Anggara, B., Fauziah, F., & Ningsih, S. (2023). Metode Fast dan Subset Query untuk Optimalisasi Pengolahan Data Medis pada Posbindu Berbasis Web. Infomatek, 25(1), 33–40. https://doi.org/10.23969/infomatek.v25i1.7270

Candra, E. N., Cholissodin, I., & Wihandika, R. C. (2022). Klasifikasi Status Gizi Balita menggunakan Metode Optimasi Random Forest dengan Algoritme Genetika (Studi Kasus: Puskesmas Cakru) (Vol. 6, Issue 5). http://j-ptiik.ub.ac.id

Fabian Azmi, A., Voutama, A., Karawang Jl HSRonggo Waluyo, S., & Timur, T. (2024). PREDIKSI CHURN NASABAH BANK MENGGUNAKAN KLASIFIKASI RANDOM FOREST DAN DECISION TREE DENGAN EVALUASI CONFUSION MATRIX. 13(1).

Fauzi, A., Heri, A., & #2, Y. (n.d.). JEPIN (Jurnal Edukasi dan Penelitian Informatika) Optimasi Algoritma Klasifikasi Naive Bayes, Decision Tree, K-Nearest Neighbor, dan Random Forest menggunakan Algoritma Particle Swarm Optimization pada Diabetes Dataset.

Gde Agung Brahmana Suryanegara, Adiwijaya, & Mahendra Dwifebri Purbolaksono. (2021). Peningkatan Hasil Klasifikasi pada Algoritma Random Forest untuk Deteksi Pasien Penderita Diabetes Menggunakan Metode Normalisasi. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 5(1), 114–122. https://doi.org/10.29207/resti.v5i1.2880

Herdian, C., Kamila, A., & Agung Musa Budidarma, I. G. (2024). Studi Kasus Feature EngineeringJeong, J. H., Lee, I. G., Kim, S. K., Kam, T. E., Lee, S. W., & Lee, E. (2024). DeepHealthNet: Adolescent Obesity Prediction System Based on a Deep Learning Framework. IEEE Journal of Biomedical and Health Informatics, 28(4), 2282–2293. https://doi.org/10.1109/JBHI.2024.3356580

Liu, H., Wu, Y. C., Chau, P. H., Chung, T. W. H., & Fong, D. Y. T. (2024). Prediction of adolescent weight status by machine learning: a population-based study. BMC Public Health, 24(1), 1–13. https://doi.org/10.1186/s12889-024-18830-1

Yousaf, N., Hussein, S., & Sultani, W. (2021). Estimation of BMI from facial images using semantic segmentation based region-aware pooling. Computers in Biology and Medicine, 133. https://doi.org/10.1016/j.compbiomed.2021.104392

Untuk Data Teks: Perbandingan Label Encoding dan One-Hot Encoding Pada Metode Linear Regresi. Technologia : Jurnal Ilmiah, 15(1), 93. https://doi.org/10.31602/tji.v15i1.13457

Rosidah, N., & Prathivi, R. (2025). OPTIMASI METODE RANDOM FOREST UNTUK KLASIFIKASI RISIKO OBESITAS BERDASARKAN POLA MAKAN. Jurnal Informatika Teknologi Dan Sains, 7(1), 56–62.

Siboro, O., Pricilia Banjarnahor, Y., Gultom, A., Antonius Siagian, N., & Silitonga, P. D. (2024). Penanganan Data Ketidakseimbangan dalam Pendekatan SMOTE Guna Meningkatkan akurasi Algoritma K-NN 1) (Vol. 1, Issue Mei).

Sulehu, M., Wisda, W., Wanita, F., & Markani, M. (2025). Optimasi Prediksi Kelulusan Mahasiswa Menggunakan Random Forest untuk Meningkatkan Tingkat Retensi. Jurnal Minfo Polgan, 13(2), 2364–2374. https://doi.org/10.33395/jmp.v13i2.14472

Utami, N., Ahmad Baihaqi, K., Elvira Awal, E., & Wahiddin, D. (2024). Analisis Kinerja Algoritma Decision Tree Dan Random Forest Dalam Klasifikasi Penyakit Kardiovaskular. Technology and Science (BITS), 6(2). https://doi.org/10.47065/bits.v6i2.5722

Yogi Aptana, N., Nur Ikhsan, A., Maulana Baihaqi, W., & Raras Ajeng Widiawati, C. (2025). Perbandingan Random Forest dan K-Nearest Neighbors untuk Klasifikasi Body Mass Index Menggunakan SMOTE-ENN untuk Mengatasi Ketidakseimbangan Data pada Analisis Kesehatan. 16(01). https://doi.org/10.35970/infotekmesin.v16i1.2553

Zahra Wulandari, M., Fuad Hamdi, A., Zahra Nurhalisa, F., Fawwaz, D., Hutabarat, P., Septiani, G. C., Nurazizah, D. A., & Puspadewi, S. (2023). Penggunaan Perhitungan Indeks Massa Tubuh sebagai Penanda Status Gizi pada Mahasiswa Prodi Kesehatan Masyarakat Rombel 2D. In Jurnal Analis (Vol. 2, Issue 2). http://jurnalilmiah.org/journal/index.php/Analis

Published
2025-06-25
How to Cite
Juliani, E., & Voutama, A. (2025). OPTIMASI ALGORITMA RANDOM FOREST UNTUK MENINGKATKAN AKURASI PREDIKSI INDEKS MASSA TUBUH (BMI). Jurnal Sistem Informasi (JUSIN), 6(1), 11-20. https://doi.org/10.32546/jusin.v6i1.3021