|
Yazar
|
:
Eyüp AKÇETİN
& Hüseyin TURGUT
|
|
Türü |
:
|
Baskı Yılı |
:
2015
|
Sayı |
:
5
|
Sayfa |
:
181-199
|
DOI Number: |
:
|
Cite : |
Eyüp AKÇETİN & Hüseyin TURGUT, (2015). EKSİK VERİLİ İŞLETME VERİ TABANLARINDA VERİ ANALİZİ VE VERİ MADENCİLİĞİ UYGULAMASI. Route Education and Social Science Journal , 5, p. 181-199. Doi: 10.17121/ressjournal.327.
|
8717 4660
|
Özet
Günümüz bilgi ekonomilerinde, verilerin analiz edilerek bilgiye dönüştürülmesi işletmeler için çok önemlidir. Bu çalışmada, Vefa Gıda Pazarlama firmasına ait veriler kullanılmıştır. Bu veriler 1 Eylül 2012 ve 17 Şubat 2015 tarihleri arasındaki alış ve satışlardan oluşmaktadır. Çalışma sürecinde 8 başarılı veri madenciliği algoritması test edilmiştir. Bu işlem ile 78 000’den fazla veri elde edilmiştir. 63958 satır veri ile işlem yapılmıştır. Verilerin %80’i eğitim ve %20’si test verisi olarak kullanılmıştır. Bu çalışmanın amacı işletme veri tabanlarında eksik veya yetersiz yapıdaki verilerin analizine en uygun veri madenciliği yönteminin bulunmasıdır. Yapılan çalışmada eksik verili veri tabanları için en uygun modelin logitboost sınıflandırma algoritması olduğu tespit edilmiştir.
Anahtar Kelimeler
Yönetim bilişim sistemi, eksik veri, veri tabanı, veri madenciliği, bilgi keşfi.
Abstract
Converting to information by analyzing the data is very important for businesses in today's knowledge economy. In this study, data of the Vefa Gıda Pazarlama Company are used. This data consists of buying and selling between September 1, 2012 and February 17, 2015 dates. 8 successful data mining algorithms were tested during the study period. The aim of this study which of the data mining method is most suitable for date analyzing when the structure of the data is missing or insufficient in business database. More than 78 000 data was obtained. The transaction is made by 63958 lines of data. 80% of the data are used as training data and 20% was used as the test data. In this study, the most appropriate model logitboost classification algorithm was determined for data base with missing data.
Keywords
Management information systems, incomplete data, database, data mining, knowledge discovery.