KHAI THÁC DÃY SỰ KIỆN PHỔ BIẾN SỬ DỤNG CÂY Seq-Tree

Authors

  • Khoa CNTT
  • Nguyễn Thị Thu Hiền
  • Lê Hữu Hà
  • Văn Thế Thành

Abstract

Tóm tắt: Tìm kiếm tập phổ biến là một bài toán quan trọng trong khai phá dữ liệu. Hơnnữa, trích xuất tập phổ biến có yếu tố thời gian từ cơ sở dữ liệu sẽ tốn kém nhiều chi phí đốisánh. Để giải quyết vấn đề này, bài báo tiếp cận xây dựng cấu trúc dữ liệu cây Seq-Tree lưutrữ các dãy sự kiện phổ biến. Sau đó, bài báo đưa ra thuật toán Seq-Alg nhằm truy xuất dãysự kiện phổ biến từ cây Seq-Tree. Để minh họa tính hiệu quả của phương pháp đề xuất, bàibáo đánh giá kết quả thực nghiệm so với phương pháp TSET

Từ khóa: Tập phổ biến, Dãy tuần tự, Dãy sự kiện max-Miner.

References

R. Agrawal and R. Srikant. Fast algorithms for mining association rules. In Proc. of the 20th Int'l Conf. on

Very Large Data Bases, pp. 487-499, 1994.

R. Agarwal, C. Aggarwal and V.V.V. Prasad. A tree projection algorithm for generation of frequent itemsets.

Journal of Parallel and Distributed Computing, pp. 350-371, 2001.

M. Zaki, S. Parthasarathy, M. Ogihara, and W. Li. New Algorithms for Fast Discovery of Association Rules.

Proc. 3rd Int. Conf. on Knowledge Discovery and Data Mining (KDD’97), 283–296. AAAI Press, Menlo

Park, CA, USA 1997.

F. Guil, R. Marín. A tree structure for event-based sequence mining, Knowledge-Based Systems, Vol 35,

pp.186-200, 2012.

R. Agarwal, R. Srikant. Mining Sequential Patterns, Proc. 1995 Int’l Conf. Data Eng. (ICDE ’95), pp.3-14,

Mar. 1995.

L. Feng, J.X. Yu, H. Lu, J. Han. A template model for multidimensional intertransactional association rules,

The VLDB Journal 11, pp.153–175, 2002.

S. Ramaswamy, S. Mahajan, and A. Silberschatz. On the Discovery of Interesting Patterns in Association

Rules, Proc.1998 Int’l Conf. Very Large Data Bases (VLDB ’98), pp. 368-379, Aug.1998.

R. Rymon. Search through systematic set enumeration, in: Proc. of Third Int.Conf. on Principles of

Knowledge Representation and Reasoning, 1992.

Published

2015-09-04