4. Uluslararası Mühendislikte Yapay Zeka ve Uygulamalı Matematik Konferansı (UMYMK 2022), Baku, Azerbaijan, 20 - 22 May 2022, pp.171
Nesnelerin İnterneti (IoT) tabanlı endüstriyel uygulamalardan toplanan veriler her
geçen gün giderek artmaktadır. Bununla birlikte, IoT cihazlarındaki arıza ve iletişim kopukluğu sebebi ile toplanan veriler gürültülü, belirsiz ve eksik olabilmektedir. Bu problemler,
veri üretimi, kalitesi, işlenmesi ve analizleri için kritik bir konu haline gelmiştir. Kayıp veri
tahmini problemini ele almak için son dönemde makine öğrenmesi yöntemleri yaygın olarak
kullanılmaktadır. Bu çalışma kapsamında kullanılan veri setleri, Sivas Numune Hastanesi
tıbbi atıkları evsel atığa dönüştüren su nötralizatör sisteminden gerçek zamanlı toplanarak
oluşturulmuştur. Hastanelerde bulunan tıbbi sıvı atıklar kan ürünleri, diyaliz sıvı atıkları ve
sıvı patoloji numuneleri gibi atıklardan oluşmaktadır. Bu atıklar kanalizasyona aktarılmadan
önce nötralizasyon cihazları ile pH değişikliği yoluyla kimyasal nötralizasyon işlemine maruz
bırakılmaktadır. Bu anlamda, tıbbi atık nötralizasyon sistemindeki pH değerlerinin gözlemlenmesi çevrenin korunması adına oldukça önemlidir. Bu kapsamda, farklı miktarlarda eksiltilerek
oluşturulan iki veri seti ile kayıp pH verilerinin tahmini için Lineer Regresyon (LR), Destek
Vektör Makineleri (DVM), K-En Yakın Komşuluk (KNN), Rastgele Orman (RO), Karar Ağacı
(KA) ve Adaboost olmak üzere toplam altı farklı makine öğrenmesi algoritması kullanılmıştır.
Makine öğrenmesi algoritmalarının değerlendirilmesinde ortalama mutlak hata (mean absolute error, MAE), ortalama karesel hata (mean squared error, MSE) ve kök ortalama kare
hata (Root Mean Square Error, RMSE) performans metrikleri kullanılmıştır. Gerçekleştirilen
çalışma sonucunda iki farklı veri seti içinde DVM algoritmasının daha başarılı olduğu gözlemlenmiştir. Birinci veri seti için en iyi sonuçlar 0.0827 MAE, 0.0135 MSE ve 0.1160 RMSE
değerleri ile elde edilirken ikinci veri seti için en iyi sonuçlar 0.0843 MAE, 0.0142 MSE ve 0.
0.1193 RMSE değerleri ile elde edilmiştir. Yapılan değerlendirme sonucu, makine öğrenmesi
algoritmalarının kayıp pH verilerinin tahmininde oldukça başarılı olduğunu göstermektedir.