Analisis Performa Random Forest dalam Mengklasifikasikan Engagement Rate Konten Video Blora TV

Authors

  • Eko Diding Wahyudi Sekolah Tinggi Teknologi Ronggolawe
  • Adhika Pramita Widyassari Sekolah Tinggi Teknologi Ronggolawe

DOI:

https://doi.org/10.47134/jacis.v6i2.186

Keywords:

Random Forest, klasifikasi engagement rate, konten video YouTube, Prediksi Viralitas, Blora TV

Abstract

Penelitian ini bertujuan untuk menganalisis performa algoritma Random Forest dalam mengklasifikasikan engagement rate konten video YouTube Blora TV serta mengidentifikasi faktor-faktor paling berpengaruh terhadap popularitas video. Data dikumpulkan dari kanal YouTube Blora TV sebanyak 125 video dengan delapan atribut utama meliputi durasi, waktu tonton, subscriber, estimasi pendapatan, dan rasio klik-tayang (CTR). Target klasifikasi dibagi menjadi tiga kategori popularitas berdasarkan waktu tonton, yaitu Low (Tidak Populer), Medium (Cukup Populer), dan High (Sangat Populer). Pra-pengolahan data mencakup pembersihan data, normalisasi fitur, dan pembagian data latih (60%) dan data uji (40%) menggunakan stratified split. Model Random Forest dikonfigurasi dengan 100 pohon dan kedalaman maksimal 10. Hasil evaluasi menunjukkan akurasi testing sebesar 98,00%, F1-score tertimbang 97,90%, serta rata-rata validasi silang 5-lipat sebesar 98,40% dengan standar deviasi 1,96%. Analisis feature importance mengungkap bahwa waktu tonton (46,37%) merupakan faktor paling dominan, diikuti oleh subscriber (20,89%) dan CTR (18,84%). Model hanya melakukan satu kesalahan klasifikasi dari 50 data uji, yaitu video kelas High terprediksi sebagai Medium. Kendala utama terletak pada rendahnya recall kelas High (75%) akibat ketidakseimbangan kelas (hanya 7,2% video populer). Secara keseluruhan, Random Forest terbukti efektif, stabil, dan interpretabel dalam mengklasifikasikan engagement rate konten video Blora TV, serta layak dijadikan alat pendukung keputusan strategis berbasis data

References

[1] K. L. Tan, C. P. Lee, and K. M. Lim, “A Survey of Sentiment Analysis: Approaches, Datasets, and Future Research,” Appl. Sci., vol. 13, no. 7, 2023, doi: 10.3390/app13074550.

[2] Q. A. Xu, V. Chang, and C. Jayne, “A systematic review of social media-based sentiment analysis: Emerging trends and challenges,” Decis. Anal. J., vol. 3, no. May, p. 100073, 2022, doi: 10.1016/j.dajour.2022.100073.

[3] M. Rodríguez-Ibánez, A. Casánez-Ventura, F. Castejón-Mateos, and P. M. Cuenca-Jiménez, “A review on sentiment analysis from social media platforms,” Expert Syst. Appl., vol. 223, no. August 2022, 2023, doi: 10.1016/j.eswa.2023.119862.

[4] M. A. M. Setiawan, K. Kusrini, and A. D. Hartono, “Menggunakan Metode Machine Learning Untuk Memprediksi Nilai Mahasiswa Dengan Model Prediksi Multiclass,” J. Inform. J. Pengemb. IT, vol. 10, no. 1, pp. 190–204, 2025, doi: 10.30591/jpit.v10i1.8334.

[5] R. Alfian, M. Shobari, H. Santoso, E. D. Ulya, and R. T. Harpin, "Strategi Konten Edutainment Instagram Terhadap Ketertarikan Pembelian Anggota DWDG IPB," Jurnal Riset Komunikasi dan Media, vol. 5, no. 2, pp. 4177–4191, 2026.

[6] S. H. Fikriyah, P. B. Sulistyo, and I. Tomohardjo, “Strategi Peningkatan Engagement Melalui Produksi Konten dan Preferensi Audiens,” J. Din. Ilmu Komun., vol. 11, no. 2, pp. 215–229, 2025, doi: 10.32509/dinamika.v11i2.5465.

[7] N. I. T. Ati, F. A. Fadilah, and T. W. Nurdiani, "Studi Kasus Customer Engagement dan Content Planning dalam Manajemen Pemasaran PT Akademi Smart Indonesia," Jurnal Indonesian Management, vol. 5, no. 3, pp. 1–15, 2025.

[8] F. Widianto, “Analisis Sentimen Komentar Youtube tentang Konflik Iran-Israel Menggunakan Orange Data Mining,” Sains Data J. Stud. Mat. dan Teknol., vol. 3, no. 2, pp. 81–88, 2025, doi: 10.52620/sainsdata.v3i2.278.

[9] M. A. Al Montaser et al., “Sentiment analysis of social media data: Business insights and consumer behavior trends in the USA,” Edelweiss Appl. Sci. Technol., vol. 9, no. 1, pp. 545–565, 2025, doi: 10.55214/25768484.v9i1.4164.

[10] M. Fauzan and R. Ahmad, "Program Kampus Merdeka Berbasis Web Sentiment Analysis of Youtube Comments About Program Using Naïve Bayes Multinomial Algorithm," in Seminar Nasional Mahasiswa Fakultas Teknologi Informasi (SENAFTI), Jakarta, Indonesia, Sep. 2023, pp. 864–871. [Online]. Available: https://senafti.budiluhur.ac.id/index.php/senafti/article/view/929

[11] M. Hussein Umar, R. Daud Antony Pangaribuan, R. Primadana, I. Budiawan, and R. Pakpahan, "Penerapan Algoritma Random Forest Untuk Prediksi Tingkat Stres Dari Aktivitas Media Sosial," Jurnal Media Informatika (JUMIN), vol. 6, no. 6, pp. 3113–3122, 2025.

[12] F. S. S. Nagalay et al., "Penerapan Algoritma Random Forest dengan Pendekatan Hybrid Feature Engineering untuk Klasifikasi Spam Judi Online," Jurnal Ilmiah Teknologi Informasi, vol. 8, no. 1, pp. 45–55, 2024.

[13] A. M. Wahid, T. Turino, K. A. Nugroho, T. S. Maharani, D. Darmono, and F. S. Utomo, "Optimasi Logistic Regression dan Random Forest untuk Deteksi Berita Hoax Berbasis TF-IDF," Jurnal Pendidikan dan Teknologi Indonesia, vol. 4, no. 8, pp. 381–392, 2024. [Online]. Available: https://jpti.journals.id/index.php/jpti/article/view/602

[14] S. Wei, K. Shores, and Y. Xu, “A Comparison of Machine Learning-Based Approaches in Estimating Surface PM2.5 Concentrations Focusing on Artificial Neural Networks and High Pollution Events,” Atmosphere (Basel)., vol. 16, no. 1, 2025, doi: 10.3390/atmos16010048.

[15] E. Ismanto, A. G. Dalimunthe, M. Iqbal, and F. Addinunnisa, “Analisis Komparatif Model Machine Learning dan Deep Learning pada Peramalan Harga Saham Time Series,” vol. 2, no. 1, pp. 131–139, 2026.

[16] H. Eldo, A. Ayuliana, D. Suryadi, G. Chrisnawati, and L. Judijanto, “Penggunaan Algoritma Support Vector Machine (SVM) Untuk Deteksi Penipuan pada Transaksi Online,” J. Minfo Polgan, vol. 13, no. 2, pp. 1627–1632, 2024, doi: 10.33395/jmp.v13i2.14186.

[17] R. A. Silvana, N. Anggiani, A. Labib, and R. L. Pratiwi, "Perbandingan Kinerja Algoritma Decision Tree dan Random Forest dalam Memprediksi Kepuasan Penumpang Maskapai," Jurnal Ilmiah Teknologi dan Informasi, vol. 5, no. 1, pp. 55–65, Sep. 2025.

[18] F. Cappelli, G. Castronuovo, S. Grimaldi, and V. Telesca, “Random Forest and Feature Importance Measures for Discriminating the Most Influential Environmental Factors in Predicting Cardiovascular and Respiratory Diseases,” Int. J. Environ. Res. Public Health, vol. 21, no. 7, 2024, doi: 10.3390/ijerph21070867.

[19] H. A. Salman, A. Kalakech, and A. Steiti, “Random Forest Algorithm Overview,” Babylonian J. Mach. Learn., vol. 2024, pp. 69–79, 2024, doi: 10.58496/BJML/2024/007.

[20] O. O. Bifarin, “Interpretable machine learning with treebased shapley additive explanations: Application to metabolomics datasets for binary classification,” PLoS One, vol. 18, no. 5 May, 2023, doi: 10.1371/journal.pone.0284315.

Downloads

Published

2026-06-01

How to Cite

Wahyudi, E. D., & Widyassari , A. P. (2026). Analisis Performa Random Forest dalam Mengklasifikasikan Engagement Rate Konten Video Blora TV. Journal Automation Computer Information System, 6(2), 275–290. https://doi.org/10.47134/jacis.v6i2.186

Similar Articles

<< < 1 2 3 > >> 

You may also start an advanced similarity search for this article.