2024 32nd Signal Processing and Communications Applications Conference (SIU), Mersin, Turkey, 15 - 18 May 2024, pp.1-4
Nowadays, machine learning models are frequently employed in high-dimensional datasets. At this stage, it is known that feature selection methods make significant contributions to the performance of machine learning models. In this study, a unique feature selection method based on Bayesian optimization was developed to contribute to the feature selection literature, and the method was tested using nine classification methods on two datasets. According to the experimental results, it was concluded that the proposed method provides a substantial decrease in the number of features without causing significant drops in performance scores. The aim is to contribute to the literature by sharing the source codes of the proposed method on open-source platforms. The fact that the Bayesian optimization-based method developed in the study has not been developed before is considered the novelty of the study. Additionally, sharing the method in a reusable manner on open-source platforms is anticipated to increase the prevalence of the method
Günümüzde makine öğrenmesi modelleri yüksek boyutlu veri setlerinde sıklıkla kullanılmaktadır. Bu aşamada öznitelik seçim yöntemlerinin makine öğrenmesi modellerinin performanslarına ciddi katkılar sunduğu bilinmektedir. Bu çalışmada öznitelik seçim literatürüne katkı sağlamak için Bayesian optimizasyon tabanlı özgün bir öznitelik seçim yöntemi geliştirilmiş ve yöntem iki veri seti üzerinde dokuz sınıflandırma yöntemi kullanılarak test edilmiştir. Deney sonuçlarına göre önerilen yöntemin performans skorlarında kayda değer düşüşler sağlamadan, öznitelik sayılarında ciddi düşüşler sağladığı kanaatine varılmıştır. Önerilen yöntemin kaynak kodları açık kaynak kodlu platformlarda paylaşılarak, literatüre katkı sağlamak amaçlanmıştır. Çalışmada geliştirilen Bayesian optimizasyon tabanlı yöntemin daha önce geliştirilmemiş olması, çalışmanın özgün yanı olarak değerlendirilmektedir. Bunun yanı sıra yeniden kullanılabilir şekilde yöntemin açık kaynak kodlu platformlarda paylaşılmasının yöntemin yaygınlığını artıracağı ön görülmektedir