A hybrid classification example in describing chronic kidney disease
Yükleniyor...
Dosyalar
Tarih
2018
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Institute of Electrical and Electronics Engineers Inc.
Erişim Hakkı
info:eu-repo/semantics/closedAccess
Özet
In today's world, technological developments have an huge impact on medicine (health sector) as well as every branch of science. Importance of data analysis made by technology in medicine is increasing day by day. Thanks to the technology, the health care workers' decisions are more accurate and successful treatments can be applied on the patient. In this study, chronic renal disease was analyzed relying on the patient's laboratory results and patient's background. The data set used in the study is the chronic kidney disease data set taken in the UCI machine learning data warehouse. In the chronic kidney dataset, the Bayesian classification algorithm, which is obtained from the laboratory results of 400 patients, was compared with the classification algorithm of K-nn neighbors (k-nn) classification and Support Vector Machines classification algorithms. Data preprocessing steps such as completion of the missing data and normalization of the data on this data set have been performed. In addition, before moving on to the classification algorithms for the estimation work, the feature selection was applied to select which of the attributes are more important and which will affect the performance of the classification result. Feature selection process is carried out by using Relief and Gain Ratio algorithms for attribute selection. It has been proved that the raw data of the chronic renal disease gives the best performance in the classification algorithm with k nearest neighbor algorithm after the feature selection with Relief algorithm. As a performance evaluation criterion of the models, from the contrast matrix; accuracy, precision, sensitivity and F-measure values were used. 10 sets of cross validation method was used for the data set as test and training set. © 2018 IEEE.
Özetçe—Günümüzde teknoloji gelişimi, her alanı olduğu gibi sağlık bilimlerini de etkilemiştir. Sağlık bilimlerinde teknoloji yardımıyla yapılan veri analizlerinin önemi gün geçtikçe artmaktadır. Teknoloji sayesinde sağlık çalışanlarının verdikleri kararların doğruluğu artmakta ve hastalar üzerine doğru tedaviler uygulanabilmektedir. Çalışma kapsamında hastalardan alınan laboratuvar sonuçları ve hasta bilgilerine göre kronik böbrek hastalığı durumu tahmin edilmiştir. Çalışmada kullanılan veri seti UCI makine öğrenmesi veri deposundan alınan kronik böbrek hastalığı (KBH) veri setidir. Kronik böbrek veri setinde bulunan 400 hastanın laboratuvar sonuçlarından elde edilen 24 özniteliğe sahip veriler Bayes sınflandırma algoritması, K-en yakın komşu (k-nn) sınıflandırma algoritması ve Destek Vektör Makineları sınıflandırma algoritmalarıyla sınıflandırılarak elde edilen sonuçlar karşılaştırılmıştır. Bu veri seti üzerinde eksik olan verilerin tamamlanması ve verilerin normalize edilmesi gibi veri ön işleme adımları gerçekleştirilmiştir. Ayrıca tahmin çalışması için sınıflandırma algoritmalarına geçmeden önce özniteliklerden hangilerinin sınıflandırma sonucunda performansı etkileyecek olanlarının seçilmesi için Relief ve Gain Ratio (Kazanım oranı) algoritmaları kullanılarak öznitelik seçme işlemi yapılmıştır. Çalışma sonunda elde edilen sonuçlara göre, kronik böbrek hastalığı ham verisinin, Relief algoritması ile öznitelik seçme işleminden sonra k en yakın komşu algoritması ile yapılan sınıflandırma algoritmasında en iyi performansı verdiği görülmüştür. Modellerin performans değerlendirme ölçütü olarak karşıtlık matrisinden; doğruluk, kesinlik, duyarlılık, ROC ve F-measure değerleri kullanılmıştır. Veri setinin test ve eğitim kümesi olarak ayrımlarında 10 kat çapraz geçerleme yöntemi kullanılmıştır.
Özetçe—Günümüzde teknoloji gelişimi, her alanı olduğu gibi sağlık bilimlerini de etkilemiştir. Sağlık bilimlerinde teknoloji yardımıyla yapılan veri analizlerinin önemi gün geçtikçe artmaktadır. Teknoloji sayesinde sağlık çalışanlarının verdikleri kararların doğruluğu artmakta ve hastalar üzerine doğru tedaviler uygulanabilmektedir. Çalışma kapsamında hastalardan alınan laboratuvar sonuçları ve hasta bilgilerine göre kronik böbrek hastalığı durumu tahmin edilmiştir. Çalışmada kullanılan veri seti UCI makine öğrenmesi veri deposundan alınan kronik böbrek hastalığı (KBH) veri setidir. Kronik böbrek veri setinde bulunan 400 hastanın laboratuvar sonuçlarından elde edilen 24 özniteliğe sahip veriler Bayes sınflandırma algoritması, K-en yakın komşu (k-nn) sınıflandırma algoritması ve Destek Vektör Makineları sınıflandırma algoritmalarıyla sınıflandırılarak elde edilen sonuçlar karşılaştırılmıştır. Bu veri seti üzerinde eksik olan verilerin tamamlanması ve verilerin normalize edilmesi gibi veri ön işleme adımları gerçekleştirilmiştir. Ayrıca tahmin çalışması için sınıflandırma algoritmalarına geçmeden önce özniteliklerden hangilerinin sınıflandırma sonucunda performansı etkileyecek olanlarının seçilmesi için Relief ve Gain Ratio (Kazanım oranı) algoritmaları kullanılarak öznitelik seçme işlemi yapılmıştır. Çalışma sonunda elde edilen sonuçlara göre, kronik böbrek hastalığı ham verisinin, Relief algoritması ile öznitelik seçme işleminden sonra k en yakın komşu algoritması ile yapılan sınıflandırma algoritmasında en iyi performansı verdiği görülmüştür. Modellerin performans değerlendirme ölçütü olarak karşıtlık matrisinden; doğruluk, kesinlik, duyarlılık, ROC ve F-measure değerleri kullanılmıştır. Veri setinin test ve eğitim kümesi olarak ayrımlarında 10 kat çapraz geçerleme yöntemi kullanılmıştır.
Açıklama
4th Electric Electronics, Computer Science, Biomedical Engineerings' Meeting, EBBT 2018 -- 18 April 2018 through 19 April 2018 -- -- 137380
Anahtar Kelimeler
Chronic Kidney Disease, Data Mining, Feature Selection, Veri Madenciliği, Kronik Böbrek Hastalığı, Öznitelik Seçme
Kaynak
2018 Electric Electronics, Computer Science, Biomedical Engineerings' Meeting, EBBT 2018
WoS Q Değeri
Scopus Q Değeri
N/A