Thành viên:Mxn/Tủ sách/Giả thiết

Encyclopædia Britannica chiếm hai ngăn sách.
  • Theo bảng này, Wikipedia tiếng Việt có 48 triệu từ trong 93.000 bài viết (con số được cập nhật vào ngày 1 tháng 7 năm 2009), tức là mỗi bài có 516 từ. (Con số này đã được cập nhật cách đây 146 tháng, nên chưa chắc đã còn chính xác tuyệt đối).
  • Nguồn này cũng cho rằng 48 triệu từ tốn 378 MB (bằng 396.361.728 B), tức là 8,3 B/từ. Wikipedia sử dụng bảng mã UTF-8: mỗi chữ không dấu là 1 B, mỗi một dấu ta cộng thêm 1 B nữa. Từ các số liệu trên, chúng ta đưa ra giả định rằng để "viết" một từ tiêu biểu trong tiếng Việt, thì mỗi từ chỉ cần có trung bình 5 ký tự. (8,3 trừ đi số byte giả định để viết dấu hay viết các đoạn code chèn ảnh, tạo bảng và trình bày trong wiki, đồng thời ngược lại cũng được cộng với số tên riêng viết bằng tiếng nước ngoài). Chúng ta thêm một ký tự vào mỗi từ để tính cho khoảng trắng và các dấu chấm, phẩy v.v nên theo tính toán cuối cùng, mỗi từ có 6 ký tự.
  • Hiện có 1.269.523 bài, tức 655.237.677,41935 từ, tức 3.931.426.064,5161 ký tự.
  • Mỗi cuốn Encyclopædia Britannica cao 25 cm, có vào khoảng 1.000 trang, tức 500 tờ giấy. Nếu được in giống những bách khoa toàn thư khác, mỗi cuốn dày 5 cm. Mỗi trang 2 cột và 80 dòng văn bản, mỗi dòng 50 ký tự. Thành thử một cuốn chứa 8.000.000 ký tự, tức 1.333.333 từ, tức 2.583 bài.
  • Vậy Wikipedia tiếng Việt hiện bằng cỡ 491,4 cuốn Britannica.
  • Hãy kiểm tra sự đúng mực của số này: Encyclopædia Britannica có 44 triệu từ trong 32 cuốn, tức mỗi cuốn có 1.375.000 từ. Vậy Wikipedia tiếng Việt tương đương với 476 cuốn.

Lưu ý:

  • Encyclopædia Britannica bao gồm một cuốn chỉ mục và 12 cuốn Micropæadia (các bài tóm lược, tương ứng với các bài sơ khai tại đây).