TRUY VẤN DỮ LIỆU DỰA TRÊN CÂY CHỮ KÝ CỦA KHỐI VĂN BẢN

Authors

  • Văn Thế Thành Trường Đại học Công nghiệp thực phẩm Tp. HCM
  • Trần Minh Bảo Trường Đại học Công nghiệp thực phẩm TP. HCM

Abstract

Bài báo xây dựng mô hình cấu trúc dữ liệu lưu trữ tập tin chữ ký của văn bản dưới dạng các khối văn bản, mỗi khối văn bản được mã hóa và xây dựng dưới dạng một cấu trúc cây chữ ký, từ đó xây dựng ứng dụng mô phỏng việc truy vấn dữ liệu trên cây chữ ký khối văn bản, đồng thời thực hiện việc đánh dấu dữ liệu đã được truy vấn lên văn bản gốc. Bài báo thực hiện việc mô phỏng thực nghiệm phương pháp truy vấn trên các văn bản có hơn 20.000 từ, qua đó bài báo đưa ra việc đánh giá chi phí của phương pháp thông qua thực nghiệm dựa trên mô hình cấu trúc dữ liệu đã đưa ra.

References

. Elizabeth Shanthi, R. Nadarajan, Applying SD-Tree for Object-Oriented Query Processing, Informatica 33, (2009), 177-187, .

. Yangjun Chen, Building Signature Trees into OODBs, Journal Of Information Science and Engineering 20, (2004), 275-304, .

. Dik Lun Lee, Young Man Kim, Gaurav Patel, Efficient Signature File Methods for Text Retrieval, IEEE Transaction on Knowledge and Data Engineering, Vol. 7, No. 3, (1995), 423-435.

. Walter W.Chang, Hans J. Schek, A signature Access Method for the Starburst Database System, Proceedings of the Fifteenth International Conference on Very Large Database, Amsterdam, (1989), 145-153.

. Wang-chien Lee and Dik L. Lee, Signature File Methods for Indexing Object-Oriented Database systems, Proceedings of the 2nd International Computer Science Conference, Hong Kong, (1992), 616-622.

. Yangjun Chen and Yibin Chen, On the Signature Tree Construction and Analysis, IEEE Transactions On Knowledge and Data Engineering, Vol. 18, No. 9, 2006.

. Seyit Kocberber, Fazli Can, Partial evaluation of queries for bit-sliced signature files, ELSEVIER, Information Processing Letters, 60, (1996), 305-311.

. Kjetil Norvag, Signature caching in parallel object database systems, ELSEVIER, Information and Software Technology, 44, (2002), 331-334.

. Edi Winarko, John F. Roddick, A Signature-Based Indexing Method for Efficient Content-Based Retrieval of Relative Temporal Patterns, IEEE Transactions On Knowledge and Data Engineering, Vol. 20, No. 6, (2008), 825-835.

Published

2013-03-26