Akıllı telefonların hızla yaygınlaşması, hassas kullanıcı bilgilerinin güvenliğini tehdit eden kötü amaçlı yazılımlara karşı savunmasızlıklarını artırmıştır. Bu çalışma, gelişmiş makine öğrenimi ve derin öğrenme tekniklerini kullanarak Android kötü amaçlı yazılımlarını tespit etme zorluğunu ele almaktadır. CIC_MALDroid2020 veri kümesini 11.598 örnekle kullanarak hem ikili hem de çok sınıflı sınıflandırma görevlerinde birden fazla modelin performansını değerlendiriyoruz. Makine öğrenimi modelleri için özellik seçimini ve hiperparametreleri optimize etmek için bir Genetik Algoritma (GA) kullanılmıştır. Analizimiz çeşitli modeller içermektedir: Makine öğrenimi için XGBoost, Random Forest ve Bagging Classifier ve derin öğrenme için CNN, LSTM, GRU ve ANN. Ayrıca SMOTETomek algoritmasını kullanarak veri kümesini dengelemenin etkisini de araştırdık. Deneylerimiz, Rastgele Orman yöntemini kullanarak ikili sınıflandırmada %99,15'lik en yüksek doğruluğa ulaştı. Bu çalışma, kötü amaçlı yazılım tespiti için bu tekniklerin etkinliğini göstermekte ve yüksek performans elde etmede veri kümesi dengeleme ve hiperparametre optimizasyonunun önemini vurgulamaktadır.
The widespread adoption of smartphones has made them increasingly vulnerable to malware, posing significant risks to the security of sensitive user information. This work investigates the detection of Android malware using advanced machine learning and deep learning techniques. We use the CIC_MALDroid2020 dataset, containing 11,598 samples, to evaluate the performance of various models on binary and multi-class classification tasks. A Genetic Algorithm (GA) is applied to optimize both feature selection and hyperparameters for the machine learning models. The machine learning algorithms evaluated in this work include XGBoost, Random Forest, and Bagging Classifier, while the deep learning models include CNN, LSTM, GRU, and ANN. Additionally, we studied the effects of handling class imbalance in the dataset using the SMOTETomek algorithm. The experimental results show that the Random Forest model achieves the highest accuracy of 99.15% in binary classification. Overall, this study confirms the effectiveness of machine learning and deep learning techniques in Android malware detection and highlights the critical role of dataset balancing and hyperparameter optimization in achieving high detection performance.