Perbandingan Performa Algoritma Support Vector Machine (SVM) dan Logistic Regression untuk Analisis Sentimen Pengguna Aplikasi Retail di Android

Main Article Content

Akhmad Ghiffary Budianto
Rusilawati Rusilawati
Arief Trisno Eko Suryo
Gunawan Rudi Cahyono
Andry Fajar Zulkarnain
Martunus Martunus

Abstract

Platform Google Play Store menyediakan fitur pemberian masukan dan penilaian dari pelanggan terhadap aplikasi yang tersedia. Aplikasi retail di android dapat menjadikan hal tersebut sebagai salah satu metrik utama untuk memantau kinerja. Analisis sentimen merupakan salah satu bagian dari NLP dan text mining yang digunakan untuk melihat sentimen dari opini dalam ulasan pengguna di aplikasi tersebut. Penelitian ini bertujuan untuk membandingkan performa algoritma SVM dan logistic regression dalam klasifikasi sentimen ulasan pengguna aplikasi tersebut. Dari 4250 data ulasan pengguna, 3400 data digunakan sebagai data training dan 850 data digunakan sebagai data testing. Hasilnya didapatkan klasifikasi dengan SVM dan logistic regression sama-sama memiliki tingkat akurasi 0,87, namun namun Logistic Regression menunjukkan performa yang lebih baik dalam mengidentifikasi sentimen positif dengan nilai F1 score 0.89 dibandingkan SVM (0.78). Logistic Regression juga memiliki misklasifikasi yang lebih sedikit (110) dan nilai True Positive (TP) dan True Negative (TN) yang lebih tinggi dibandingkan SVM. Secara keseluruhan, Logistic Regression menunjukkan performa yang lebih baik dalam mengklasifikasikan sentimen ulasan pengguna aplikasi retail dibandingkan SVM.

Article Details

Section
Articles

References

S. Hassan, C. Tantithamthavorn, C.-P. Bezemer, and A. E. Hassan, “Studying the dialogue between users and developers of free apps in the google play store,” Empir. Softw. Eng., vol. 23, pp. 1275–1312, 2018.

S. Venkatakrishnan, A. Kaushik, and J. K. Verma, “Sentiment analysis on google play store data using deep learning,” Appl. Mach. Learn., pp. 15–30, 2020.

A. Prabhat and V. Khullar, “Sentiment classification on big data using Naïve Bayes and logistic regression,” in 2017 International Conference on Computer Communication and Informatics (ICCCI), IEEE, 2017, pp. 1–5.

R. Feldman, “Techniques and applications for sentiment analysis,” Commun. ACM, vol. 56, no. 4, pp. 82–89, 2013.

W. T. H. Putri and R. Hendrowati, “Penggalian Teks Dengan Model Bag of Words Terhadap Data Twitter,” J. Muara Sains, Teknol. Kedokteran, dan Ilmu Kesehat., vol. 2, no. 1, pp. 129–138, 2018.

S. Rana and A. Singh, “Comparative analysis of sentiment orientation using SVM and Naive Bayes techniques,” in 2016 2nd International Conference on Next Generation Computing Technologies (NGCT), IEEE, 2016, pp. 106–111.

M. Ahmad, S. Aftab, M. S. Bashir, and N. Hameed, “Sentiment analysis using SVM: A systematic literature review,” Int. J. Adv. Comput. Sci. Appl., vol. 9, no. 2, 2018.

N. A. R. Putri, “Analisis Sentimen Terhadap Kemajuan Kecerdasan Buatan di Indonesia Menggunakan BERT dan RoBERTa,” J. Sains dan Inform., vol. 9, no. 2, pp. 136–145, 2023.

M. Fikri and R. Sarno, “A comparative study of sentiment analysis using SVM and SentiWordNet,” Indones. J. Electr. Eng. Comput. Sci., vol. 13, no. 3, pp. 902–909, 2019.

A. Lamurias and F. M. Couto, “Text Mining for Bioinformatics Using Biomedical Literature.” 2019.

K. S. Srujan, S. S. Nikhil, H. Raghav Rao, K. Karthik, B. S. Harish, and H. M. Keerthi Kumar, “Classification of amazon book reviews based on sentiment analysis,” in Information Systems Design and Intelligent Applications, Springer, 2018, pp. 401–411.

W. A. Qader, M. M. Ameen, and B. I. Ahmed, “An overview of bag of words; importance, implementation, applications, and challenges,” in 2019 international engineering conference (IEC), IEEE, 2019, pp. 200–204.

H. D. Abubakar, M. Umar, and M. A. Bakale, “Sentiment classification: Review of text vectorization methods: Bag of words, Tf-Idf, Word2vec and Doc2vec,” SLU J. Sci. Technol., vol. 4, no. 1 & 2, pp. 27–33, 2022.

R. L. Atimi and E. E. Pratama, “Implementasi Model Klasifikasi Sentimen Pada Review Produk Lazada Indonesia,” J. Sains Dan Inform., vol. 8, no. 1, pp. 88–96, 2022.

B. Santosa and A. Umam, Data Mining dan Big Data Analytics: Teori dan Implementasi Menggunakan Python & Apache Spark. Penebar Media Pustaka.

K. Bhargava and R. Katarya, “An improved lexicon using logistic regression for sentiment analysis,” in 2017 International Conference on Computing and Communication Technologies for Smart Nation (IC3TSN), IEEE, 2017, pp. 332–337.

M. Wankhade, A. C. S. Rao, S. Dara, and B. Kaushik, “A sentiment analysis of food review using logistic regression,” Int J Sci Res Comput Sci Eng InformTechnol, pp. 2–17, 2017.

S. Mokhtari, K. K. Yen, and J. Liu, “Effectiveness of artificial intelligence in stock market prediction based on machine learning,” arXiv Prepr. arXiv2107.01031, 2021.

A. M. Rajeswari, M. Mahalakshmi, R. Nithyashree, and G. Nalini, “Sentiment analysis for predicting customer reviews using a hybrid approach,” in 2020 Advanced Computing and Communication Technologies for High Performance Applications (ACCTHPA), IEEE, 2020, pp. 200–205.