TẠP CHÍ KHOA HỌC YERSIN

YERSIN JOURNAL OF SCIENCE

ISSN: 2525 - 2372

Cooc-cfi: thuật toán hiệu quả khai thác tập phổ biến đóng trên dữ liệu giao dịch

  • File: Tải bài viết
  • Title: Cooc-cfi: An efficient mining algorithm for closed frequent itemsets in transaction databases
  • Ngày nhận bài: 01/06/2017
  • Ngày xét duyệt: 01/07/2017
  • Ngày xuất bản: 01/08/2017
  • Tác giả: Phan Thành Huấn
  • Trang: 10 - 17

Tóm tắt

Khai thác luật kết hợp là một trong những kỹ thuật quan trọng và được nghiên cứu nhiều trong khai thác dữ liệu. Khai thác tập phổ biến đóng là một trong những vấn đề cơ bản trong khai thác luật kết hợp. Hầu hết các thuật toán sinh không gian tìm kiếm dựa trên tập mục thỏa ngưỡng phổ biến tối thiểu và không dùng lại cho lần khai thác tiếp theo. Để khắc phục vấn đề này, chúng tôi đề xuất một cách tiếp cận mới để tìm tập phổ biến đóng trên dữ liệu giao dịch dùng cấu trúc dữ liệu lưu trữ dạng bit và tập chỉ mục chứa tập mục đồng xuất hiện để chiếu tính nhanh tập phổ biến đóng. Sau cùng, chúng tôi trình bày kết quả thực nghiệm, cho thấy thuật toán đề xuất tốt hơn so với các thuật toán hiện hành.

Abstract

Association rule mining  is one of the most important and well-researched techniques of Data Mining. Mining closed frequent itemsets is one of the most fundamental problems in association rule mining. Most of algorithms in literature used to find frequent itemsets on search space items, which have a support greater than minsup and not reuse for mining next time. To overcome this problem, we propose a new approach to fast dectect closed frequent itemsets using data structure on bit and array co-occurrence itemset of kernel item for fast mining closed frequent itemsets. Finally, the result showed the proposed algorithm which was better than the existing algorithms.

Từ khóa

Luật kết hợp, tập phổ biến đóng, tập mục đồng xuất hiện

Tài liệu tham khảo

  1. Agrawal, R., & Imilienski, T., & Swami, A. (1993). Mining association rules between sets of large databases. Proceedings of the ACM SIGMOD International Conference on Management of Data, Washington, DC, 207-216.
  2. Agrawal, R., & Srikant, R. (1994). Fast algorithms for mining association rules. Proceedings of International Conference on Very Large Data Base, Santiago, Chile, 478-499.
  3. Dong, J., & Han, M. (2007). BitTableFI: An efficient mining frequent itemsets algorithm. Knowledge-Based Systems 20(4), 329–335.
  4. Song, W., & Yang, B. (2008). Index-BitTableFI: An improved algorithm for mining frequent itemsets. Knowledge-Based Systems 21, 507-513.
  5. Vo, B., & Hong, T. P., & Le, B. (2012). DBV-miner: A dynamic bit-vector approach for fast mining frequent closed itemsets. Expert Systems with Applications, 39(8),7196–7206.
  6. Zaki, M. J., & Hsiao, C. (2002). CHARM: An efficient algorithm for closed association rule mining. In 2nd SIAM International Conference on Data Mining, 457–473.
  7. Wang, J., & Han, J., & Pei, J. (2003). CLOSET+: searching for the best strategies for mining frequent closed itemsets. Proceedings of the 9th ACM SIGKDD International Conference on Knowledge Discovery  and Data Mining, Washington, DC, USA, 236–245.

Đăng ký/Đăng Nhập
Tìm kiếm