Bulut Bilişimde Genomik Verilerin Gizliliği

Karabey Aksakallı I., Yelkuvan A. F., Akal F.

Uluslararası Bilgi Güvenliği Mühendisliği Dergisi, cilt.6, sa.2, ss.72-88, 2020 (Hakemli Dergi)


Genomik araştırmalardan elde edilen, tıbbi veritabanları ve biyobankalar gibi elektronik ortamda saklanan veriler, araştırmacılar tarafından sorgulanmakta ve işlenmektedir. Son yıllarda genomik verilere ortak bir erişim alanı sunmak, erişimi kolaylaştırmak ve depolama birimlerini etkin bir biçimde kullanmak için bulut bilişimden yararlanılmaktadır. Genomik verilerin bulut üzerinde işlenmesi için dış kaynaklardan temin edilmesi bazı gizlilik ve güvenlik tehditlerini de beraberinde getirmektedir. Bulut bilişim sistemlerinin kullanımı bireylerin mahremiyetini tehlikeye atmadan etkin bir şekilde sağlanmalıdır. Dışa aktarılan veriler, iletim sırasında taşıma katmanı güvenliği sayesinde kolaylıkla korunurken, verilerin işlenmesi sırasında bir takım problemler meydana gelmektedir. Verinin bulutta açık bir şekilde depolanması veri sızıntısına yol açabilmektedir. Özel Bilgi Erişim (Private Information Retrieval-PIR) şemaları kullanılarak verinin şifreli bir şekilde saklanması da sorgulama sırasında sistemin yavaşlamasına sebep olmakta ve böylece PIR şemaları, gerçek dünya kullanımında etkinliğini yitirmektedir. Bu çalışmada genomik verilerin bulut ortamlarında saklanması ve sorgulanması sırasında karşılaşılacak gizlilik ve güvenlik problemleri ve bu problemlere yönelik literatürde bulunan çözümler derlenmiştir. Genomik verilere yapılan saldırılar ve bu saldırılara yönelik çözüm önerileri de bu çalışma kapsamında bir araya getirilmiştir. Aynı zamanda önerilen çözümlere rağmen hala devam eden bazı açık sorunlar da okuyucuya aktarılmıştır.

Data obtained from genomic research is stored in electronic form, on medical databases and bio-data-storage, where they are made available for queries and processing by many researchers. Recently, cloud computing is becoming a popular choice given its ability to offer and facilitate shared access to genomic data, and to make effective use of storage capabilities. Outsourcing the processing of genomic data over the cloud, especially that of patients’ sensitive data, entails certain confidentiality and security concerns. Various computing services must be used without endangering the individual's privacy. Although the exported data is easily protected by the transport layer security during transmission, a number of problems can still arise during the processing of the data. Storing unencrypted data in the cloud can lead to data leakage, while theoretically storing the data in encrypted form using the Private Information Retrieval (PIR) schemes causes the system to slow down during queries, limiting realworld effectiveness of PIR schemes. The present study aims to provide a more comprehensible compilation of the confidentiality of genomic data, by categorizing the solutions proposed in the literature, for confidentiality and security problems concerning the storage and query of genomic data in cloud environments. Unlike other studies, the attacks on genomic data and the proposal for this aggressive solution have been put together in this study. Furthermore, readers are informed about some open issues despite the proposed solutions.