MỞ RỘNG TỪ ĐIỂN VIETSENTIWORDNET CHO MIỀN DỮ LIỆU THUỘC LĨNH VỰC DU LỊCH SỬ DỤNG PHƯƠNG PHÁP DỰA TRÊN TỪ VỰNG

Abstract

Khai phá quan điểm giúp xác định hướng quan điểm (tích cực, tiêu cực) của người dùng về một chủ đề, sản phẩm hay dịch vụ. Có một số cách tiếp cận khác nhau về khai phá quan điểm, trong đó phương pháp khai phá quan điểm dựa trên từ vựng là khá phổ biến. Độ chính xác của phương pháp khai phá quan điểm dựa trên từ vựng phụ thuộc rất nhiều vào từ điển được sử dụng, trong đó chứa các từ quan điểm về các lĩnh vực cụ thể. Một bộ dữ liệu có thể thực hiện phân lớp tốt trong lĩnh vực này, nhưng lại kém hiệu quả đối với một số lĩnh vực khác. VietSentiWordNet là từ điển quan điểm tiếng Việt được sử dụng khá phổ biến hiện nay, nhưng thiếu nhiều từ quan điểm cho miền dữ liệu thuộc lĩnh vực du lịch. Bài báo này do đó tập trung vào việc mở rộng từ điển VietSentiWordNet với việc làm giàu các từ quan điểm thuộc lĩnh vực du lịch, trong đó một mô hình mở rộng từ điển VietSentiWordNet dựa vào phương pháp dựa trên từ vựng được đề xuất và một tiến trình tiền xử lý dữ liệu với nhiều chức năng được tích hợp cũng được bổ sung nhằm nâng cao hiệu quả phân lớp quan điểm. Kết quả thực nghiệm cho thấy rằng việc từ điển VietSentiWordNet được mở rộng đã phân lớp quan điểm chính xác hơn đối với các câu quan điểm trong lĩnh vực du lịch.
https://doi.org/10.26459/hueunijtt.v129i2A.5949
PDF (Vietnamese)
Creative Commons License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Copyright (c) 2020 Array