Trích xuất thuật ngữ

Trích xuất thuật ngữ (tiếng Anh: terminology extraction) là một tác vụ con của trích xuất thông tin (information extraction). Mục đích của trích xuất thuật ngữ là tự động trích xuất các thuật ngữ tương đương từ một ngữ liệu đã cho.[1]

Trong kỷ nguyên mạng ngữ nghĩa, ngày càng nhiều cộng đồng và các doanh nghiệp có kết nối mạng bắt đầu truy cập và tương tác với nhau thông qua Internet. Việc mô hình hóa các cộng đồng này và nhu cầu thông tin tương ứng là quan trọng đối với một số ứng dụng web, như các web crawler theo chủ đề,[2] dịch vụ web,[3] hệ thống gợi ý,[4]... Sự phát triển của trích xuất thuật ngữ cũng rất cần thiết đối với ngành công nghiệp ngôn ngữ.

Xem thêm sửa

Tham khảo sửa

  1. ^ Alrehamy, Hassan H; Walker, Coral (2018). “SemCluster: Unsupervised Automatic Keyphrase Extraction Using Affinity Propagation”. Advances in Computational Intelligence Systems. Advances in Intelligent Systems and Computing. 650. tr. 222–235. doi:10.1007/978-3-319-66939-7_19. ISBN 978-3-319-66938-0.
  2. ^ Menczer F., Pant G. and Srinivasan P. Topic-Driven Crawlers: machine learning issues.
  3. ^ Fan J. and Kambhampati S. A Snapshot of Public Web Services, in ACM SIGMOD Record archive Volume 34, Issue 1 (March 2005).
  4. ^ Yan Zheng Wei, Luc Moreau, Nicholas R. Jennings. A market-based approach to recommender systems, in ACM Transactions on Information Systems (TOIS), 23(3), 2005.