Thành viên:Alphama/Lập trình Wikipedia

Trang này mô tả và hướng dẫn các kỹ thuật để lập trình và xây dựng bot, ứng dụng tích hợp với Wikipedia. Nội dung kiến thức giúp thế hệ sau kế thừa và phát triển dự án này.

Đừng mong đợi mọi thứ ở đây hoàn hảo, hãy tự hoàn thiện những lỗ hổng để các bánh răng này hoạt động trơn tru.

Vì sao tôi viết cái này?

Tôi tham gia từ năm 2012, đến nay khoảng 9 năm nhiều tháng, lúc trước quá ít nhiều người ở đây biết về lập trình với Wikipedia và trình độ công nghệ lúc đó so với enwiki còn quá thấp. Một mình mò mẫm như con thuyền nhỏ giữa đại dương, đến nay tích được 1 số vốn nhỏ.

Bây giờ, tôi đã bắt đầu thấy nhiều bạn nhỏ nắm bắt công nghệ, vì vậy tôi tin tưởng phần kiến thức này đã đến lúc nên truyền thụ cho các bạn "gấu trúc" tương lai.

Những thành viên đã đến đây

Ngôn ngữ bạn bắt buộc phải học

Xếp theo thứ tự ưu tiên:

Cấu trúc & định dạng dữ liệu

  • JSON
  • XML

Kiến thức nền

Bài 1. Tổng quan về Wikipedia

Bài này mặc định bạn đã tham gia Wikipedia ít nhất 1 tháng và biết 1 số điều về Wikipedia. Một số tham khảo:

Bài 2. Wikipedia API

Xem nội dung Thành viên:Alphama/Lập trình Wikipedia/2.

Bài 3. Biểu thức chính quy

Xem nội dung: Thành viên:Alphama/Lập trình Wikipedia/3.

Python

Bài 4. Lập trình Python

Tự học ở đây Python Programming ở Wikibook. Nếu bạn không thể tự học, hãy đăng ký 1 khóa học offline hoặc online.

Bạn phải bỏ thời gian ít nhất 2 tuần để có thể học sơ qua nội dung lập trình Python, và có thể mất vài năm để trở thành "bậc thầy" lão luyện ngôn ngữ này. Thời gian học và làm càng lâu, bạn sẽ có trình độ càng cao. Nhìn chung, Python là 1 ngôn ngữ dễ hiểu và ngắn gọn.

Bài 5. Một số kỹ thuật xử lý chuỗi với Python

Tạm xem ở Python Strings. Nội dung này là chưa đầy đủ, bạn có thể trau dồi kỹ năng thêm khi thực hiện các thao tác lập trình và tìm kiếm câu hỏi ở Internet.

Bài 6. Kết hợp Python + Wikipedia API

Xem nội dung: Thành viên:Alphama/Lập trình Wikipedia/6.

Bài 7. Pywiki bot

Xem nội dung: Thành viên:Alphama/Lập trình Wikipedia/7.

C#

Bài 8. Kết hợp C# + Wikipedia API

Bài 9. Wikipedia:AutoWikiBrowser

Tham khảo ở en:Wikipedia:AutoWikiBrowser.

Nâng cao (chỉ với Python + Pywiki bot)

Bài 10. Đại số cơ bản

Đọc và tham khảo hết cuốn sách này MATHEMATICS FOR MACHINE LEARNING, tham khảo trước các khái niệm:

  • Matrices
  • Solving Problems of Linear Equations
  • Vector Spaces
  • Norm
  • Lengths & Distances
  • ...

Bài 11. Deep Learning (DL) và các mạng thần kinh

Bài 12. Các khái niệm cơ bản liên quan đến DL

Bài 13. Phân loại/gom cụm văn bản

Bài 14. Sinh ngôn ngữ tự nhiên

Bài 15. Dịch máy

Bài 16. Phân tích hình thái/Phân tích quan điểm