Natural Language Toolkit (tạm dịch là Bộ công cụ Ngôn ngữ Tự nhiên, hay viết tắt là NLTK) là một bộ thư viện và chương trình dành cho xử lý ngôn ngữ tự nhiên (NLP) thống kê và biểu tượng tiếng Anh, được xây dựng bằng ngôn ngữ Python. Steven Bird and Edward Loper là hai tác giả phát triển NLTK tại Khoa Khoa học Thông tin và Máy tính, đại học Pennsylvania.[4] NLTK bao gồm các minh họa đồ họa và dữ liệu mẫu, đi kèm một cuốn sách chứa các giải thích về khái niệm cơ bản đằng sau các tác vụ xử lý ngôn ngữ được hỗ trợ bởi bộ công cụ,[5] và một cuốn sách hướng dẫn.[6]

Natural Language Toolkit
Thiết kế bởiSteven Bird, Edward Loper, Ewan Klein
Phát triển bởiNhóm NLTK
Phát hành lần đầu2001; 23 năm trước (2001)[1]
Phiên bản ổn định
3.5 / 13 tháng 4 năm 2020; 3 năm trước (2020-04-13)[2]
Kho mã nguồn
Viết bằngPython (ngôn ngữ lập trình)
Thể loạiXử lý ngôn ngữ tự nhiên
Giấy phépGiấy phép Apache[3]
Websitewww.nltk.org
Cây phân tích cú pháp được tạo ra bằng NLTK

Thư viện nổi bật sửa

Xem thêm sửa

Tham khảo sửa

  1. ^ “Project site on SourceForge”. ngày 9 tháng 7 năm 2001.
  2. ^ “NLTK ChangeLog”. nltk.org. Truy cập ngày 13 tháng 4 năm 2020.
  3. ^ “NLTK License”. NLTK Project. Truy cập ngày 14 tháng 2 năm 2015.
  4. ^ “Preface”. www.nltk.org. Truy cập ngày 15 tháng 6 năm 2016.
  5. ^ Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). “Multidisciplinary instruction with the Natural Language Toolkit” (PDF). Proceedings of the Third Workshop on Issues in Teaching Computational Linguistics, ACL. Bản gốc (PDF) lưu trữ ngày 2 tháng 9 năm 2011. Chú thích journal cần |journal= (trợ giúp)
  6. ^ Perkins, Jacob (2010). Python Text Processing with NLTK 2.0 Cookbook. Packt Publishing. ISBN 978-1849513609.

Liên kết ngoài sửa