067-Front-Back-5x8-Paperback-Book-COVERVAULT
Issue 
Vol 3- Issue 2

DECEMBER 2019


ِWria Mohammed Salih Mohammed1, Payman Othman Rahim2

Department of Computer Science, College of Science, University of Sulaimani, Sulaimani, Iraq1,2

[email protected]2

Received : 17-9-2019                                    Revised: 7-10-2019

Accepted :  23-11-2019                                 Published :31-12-2019


Abstract:

Basket market analysis is one of the most widely used groups of data mining and have been extensively utilized for analyzing data to extract interesting information from huge amount of data. Also, Studies over the past two decades have provided important information on semantic web as it is part of (World Wide Web Consortium) W3C. Both data mining and semantic web have several key features to mine semi-structured dataset and having an accurate result. The methodological approach taken in this study is combining both Éclat algorithm and RDF (Resource Description Framework) dataset based on the process of converting RDF into dataset and mining it. Firstly, RDF data is checked for validation, and then it needs to convert into traditional dataset. This process requests SPARQL as a query language. Thus, it needs to imply Éclat (Equivalence class Transformation) algorithm on traditional dataset. This experiment illustrates that semantic web and data mining have significant results in mining semi-structured dataset. This paper hands out how mixing RDF and Éclat algorithm is influent. For this technique different data source can be used, however, for this paper particularly products in a supermarket are going to use as a main dataset.

Keywords:RDF, Data Mining, Linked Data, Éclat, SPARQL.

الملخص:

يعتبر تحليل سلة التسوق واحدا من اكثر التقنيات استخداما في تعريف البيانات وقد كان و مايزال الاكثر استعمالا في تحليل البيانات لاستخلاص معلومات هامة من كم هائل من البيانات. ولقد زودتنا الدراسات خلال السنوات الماضية بمعلومات هامة عن شبكة السيمانتك كونها جزءا من جمعية الشبكات العالمية. و تمتلك كلا من تعريف البيانات و شبكة السيمانتك خصائص عديدة لتعريف ملف البيانات الانشائية الجزئية و الحصول على نتائج دقيقة و صحيحة. النهج المتبع في هذه الدراسة عبارة عن دمج نظام (ئيكلات) للحلول الحسابية ونظام اطار وصف الموارد (آر دي اف) لتحليل ملف البيانات بناءا على عملية تحويل (الآر دي اف) الى ملف بيانات و تعريفها. اولا, يتم فحص بيانات (الآر دي اف) لغرض تأكيد فاعليتها, ثم يجب تحويلها الى ملف البيانات التقليدية. هذه العملية تتطلب لغة سباركل كلغة الاستعلام. وهكذا تحتاج لتطبيق نظام (ئيكلات) للحلول الحسابية على الملفات التقليدية. توضح هذه التجربة بان لكل من شبكة السيمانتك و تعريف البيانات نتائج مهمة في تعريف ملف البيانات الانشائية الجزئية. يبين هذا البحث بان دمج (الآر دي اف) و(ئيكلات)  للحلول الحسابية يتم بشكل مؤثر. ويمكن استخدام موارد معلوماتية لهذه التقنية, وفي هذه الدراسة تم استخدام منتجات احدى الاسواق (السوبرماركت) كملف بيانات.

پوختە:

شیکردنەوەی سەبەتەى بازارِکردن یەکيکە لە تەکنیکە هەرە باوەکانی بەکارهينان لە ناساندنی داتاکان وئێستاش زۆرترین بەکارهێنانی تۆمار کردووە لە شیکردنەوەی داتاکان بۆ بەدەستهێنانی زانیاری گرنگ لە بڕێکی زۆر داتا. توێژینەوکانی ساڵانی پێشوو زانیاری زۆر گرنگمان دەخەنە بەر دەست سەبارەت بە (تۆڕی سیمانتیک) کە بەشێکە لە کۆمەڵەی تۆڕە جیهانیەکان. ناساندنی داتاکان و (تۆڕی سیمانتیک) چەند خەسڵەتێکیان هەیە بۆ ناساندنی فایلی داتا نیمچە دروستکارییەکان و دەستکەوتنی ئەنجامی ڕاست ودروست. ڕێبازی پەیڕەوکراو لەم توێژینەوەیەدا بریتیە لە تیکەڵ کردنی سیستمی (ئیکلات) بۆ چارەسەرە ماتماتیکیەکان و سیستمی چوارچێوەی وەسفی سەرچاوەکان کە ناسراوە بە (ئار دی ئێف) بۆ شیکردنەوەی فایلی داتاکان لەسەر بنەمای گۆڕینی (ئار دی ئێف) بۆ فایلی داتاو ناساندنی. سەرەتا شیکاری بۆ داتاکانی (ئار دی ئێف) ئەنجام دەدرێت بۆ دڵنیابون لە کاریگەری داتاکان و دواتر گۆڕینی بۆفایلی داتای تەقلیدی. ئەم کردارە پێویستی بە زمانی (سپارکڵە). بەم شێوەیە پێویستی بە جێبەجێ کردنی سیستمی (ئیکلات) بۆ چارەسەرە ماتماتیکیەکان بۆسەرفایلە تەقلیدییەکان. ئەم ئەزموونە ئەوەمان بۆ دەردەخات کەوا هەر یەک لە (تۆڕی سیمانتیک) و ناساندنی داتاکان ئەنجامی گرنگیان هەیە لە ناساندنی فایلی داتا نیمچە دروستکارییەکان. ئەم توێژینەوەیە دەریدەخات کەوا تێکەڵکردنی سیستمی (ئیکلات) بۆ چارەسەرە ماتماتیکیەکان و سیستمی چوارچێوەی وەسفی سەرچاوەکان کە ناسراوە بە (ئار دی ئێف) بە شێوەیەکی کاریگەر ئەنجام دەدرێت. لەم توێژینەوەیەدا بەرهەمی یەکێک لە سوپەرمارکێتەکان بەکارهاتووە وەک فایلی داتاکان.

Reference:

  1. AbedjanEmail, Z., & Naumann, F. (2013). Improving RDF Data Through Association Rule Mining. Datenbank Spektrum , 13 (2).
  2. Aggarwal, C. C., & Han, J. (2014). Frequent Pattern Mining.
  3. Baratia, M., Baia, Q., & Liub, Q. (2017). Mining semantic association rules from RDF data . 133, 183-196 .
  4. Borgelt, C. (2012). Frequent item set mining . WIREs Data Mining And Knowledge discovery , 2 (6), 437–456.
  5. DECKER, S., MELNIK, S., HARMELEN, F. V., FENSEL, D., KLEIN, A. M., BROEKSTRA, J., et al. (2000). The Semantic Web: The Roles of XML and RDF. IEEE Internet and Computing , 4 (5), 63-74.
  6. DuCharme, B. (2013). Learning SPARQL: Querying and Updating with SPARQL 1.1 (Second edition ed.). O’Reilly Media.
  7. Gayo, o. E., Prud’hommeaux, E., Boneva, I., & Kontokostas, D. (2018). Validating RDF Data (Vol. 7). Morgan & Claypool.
  8. Han, J., Pei, J., & Kamber, M. (2012). Data Mining: Concepts and Techniques . Waltham, MA: Elsevier Inc.
  9. Hidber, C. (1999). Online Association Rule Mining . Proceeding SIGMOD ’99 Proceedings of the 1999 ACM SIGMOD international conference on Management of data , 28 (2), 145-156 .
  10. kaur, M., & Grag, U. (2014). ECLAT Algorithm for Frequent Item sets Generation. International Journal of Computer Systems , 1 (2).
  11. Koh, Y. S., & Rountree, N. (2010). Rare Association Rule Mining and Knowledge Discovery: Technologies for Infrequent and Critical Event Detection .
  12. Maimon, O., & Rokach, L. (2005). Data Mining and Knowledge Discovery Handbook .
  13. Mohammed, W. M., & Saraee, M. M. (2016). Mining Semantic Web Data Using K-means Clustering Algorithm. British Journal of Mathematics & Computer Science , 13 (1), 1-14.
  14. Mohammed, W., & Saraee, M. M. (2016). Sematic Web Mining Using Fuzzy C-means Algorithm. 16 (4), 1-16.
  15. ReynaudEmail, J., Toussaint, Y., & Napoli, A. (2019). Using Redescriptions and Formal Concept Analysis for Mining Definitions in Linked Data. International Conference on Formal Concept Analysis , 11511, 241-256.
  16. Shimada, K., Hirasawa, K., & Hu, J. (2006). Association Rule Mining with Chi-Squared Test Using Alternate Genetic Network Programming . Advances in Data Mining. Applications in Medicine, Web Mining, Marketing, Image and Signal Mining , 202-216.
  17. Venkata, N. p., Kappara, P., & Ichise, R. (2011). LiDDM: A Data Mining System for Linked Data . Workshop on Linked Data on the Web , 813.