Missing IoT Data Prediction with Machine Learning Techniques


Creative Commons License

Azizoğlu F. , Ünsal E.

4. Uluslararası Mühendislikte Yapay Zeka ve Uygulamalı Matematik Konferansı (UMYMK 2022), Baku, Azerbaijan, 20 - 22 May 2022, pp.171

  • Publication Type: Conference Paper / Summary Text
  • City: Baku
  • Country: Azerbaijan
  • Page Numbers: pp.171

Abstract

Nesnelerin İnterneti (IoT) tabanlı endüstriyel uygulamalardan toplanan veriler her geçen gün giderek artmaktadır. Bununla birlikte, IoT cihazlarındaki arıza ve iletişim kopukluğu sebebi ile toplanan veriler gürültülü, belirsiz ve eksik olabilmektedir. Bu problemler, veri üretimi, kalitesi, işlenmesi ve analizleri için kritik bir konu haline gelmiştir. Kayıp veri tahmini problemini ele almak için son dönemde makine öğrenmesi yöntemleri yaygın olarak kullanılmaktadır. Bu çalışma kapsamında kullanılan veri setleri, Sivas Numune Hastanesi tıbbi atıkları evsel atığa dönüştüren su nötralizatör sisteminden gerçek zamanlı toplanarak oluşturulmuştur. Hastanelerde bulunan tıbbi sıvı atıklar kan ürünleri, diyaliz sıvı atıkları ve sıvı patoloji numuneleri gibi atıklardan oluşmaktadır. Bu atıklar kanalizasyona aktarılmadan önce nötralizasyon cihazları ile pH değişikliği yoluyla kimyasal nötralizasyon işlemine maruz bırakılmaktadır. Bu anlamda, tıbbi atık nötralizasyon sistemindeki pH değerlerinin gözlemlenmesi çevrenin korunması adına oldukça önemlidir. Bu kapsamda, farklı miktarlarda eksiltilerek oluşturulan iki veri seti ile kayıp pH verilerinin tahmini için Lineer Regresyon (LR), Destek Vektör Makineleri (DVM), K-En Yakın Komşuluk (KNN), Rastgele Orman (RO), Karar Ağacı (KA) ve Adaboost olmak üzere toplam altı farklı makine öğrenmesi algoritması kullanılmıştır. Makine öğrenmesi algoritmalarının değerlendirilmesinde ortalama mutlak hata (mean absolute error, MAE), ortalama karesel hata (mean squared error, MSE) ve kök ortalama kare hata (Root Mean Square Error, RMSE) performans metrikleri kullanılmıştır. Gerçekleştirilen çalışma sonucunda iki farklı veri seti içinde DVM algoritmasının daha başarılı olduğu gözlemlenmiştir. Birinci veri seti için en iyi sonuçlar 0.0827 MAE, 0.0135 MSE ve 0.1160 RMSE değerleri ile elde edilirken ikinci veri seti için en iyi sonuçlar 0.0843 MAE, 0.0142 MSE ve 0. 0.1193 RMSE değerleri ile elde edilmiştir. Yapılan değerlendirme sonucu, makine öğrenmesi algoritmalarının kayıp pH verilerinin tahmininde oldukça başarılı olduğunu göstermektedir.