HTML

Ngôn ngữ đánh dấu tiêu chuẩn cho các tài liệu được thiết kế để hiển thị trong trình duyệt WEB

HTML (viết tắt của từ Hypertext Markup Language, hay là "Ngôn ngữ Đánh dấu Siêu văn bản") là một ngôn ngữ đánh dấu được thiết kế ra để tạo nên các trang web trên World Wide Web. Nó có thể được trợ giúp bởi các công nghệ như CSS và các ngôn ngữ kịch bản giống như JavaScript.

HTML
(HyperText Markup Language)
HTML5 logo resized.svg
Logo chính thức của HTML5, phiên bản mới nhất của HTML[1]
Phần mở rộng tên file
  • .html
  • .htm
Kiểu phương tiệntext/html
Mã định danh loại thống nhất (UTI)public.html
Phát triển bởiWHATWG
Phát hành lần đầu1993; 28 năm trước (1993)
Bản mới nhấtLiving Standard / 2021
Kiểu định dạngĐịnh dạng tài liệu
Dùng để chứaPhần tử HTML
Được chứa bởiTrình duyệt Web
Được mở rộng từSGML
Được mở rộng thànhXHTML
Định dạng mở?
Websitehtml.spec.whatwg.org

Các trình duyệt web nhận tài liệu HTML từ một web server hoặc một kho lưu trữ cục bộ và render tài liệu đó thành các trang web đa phương tiện. HTML mô tả cấu trúc của một trang web về mặt ngữ nghĩa và các dấu hiệu ban đầu được bao gồm cho sự xuất hiện của tài liệu.

Các phần tử HTML là các khối xây dựng của các trang HTML. Với cấu trúc HTML, hình ảnh và các đối tượng khác như biểu mẫu tương tác có thể được nhúng vào trang được hiển thị. HTML cung cấp một phương tiện để tạo tài liệu có cấu trúc bằng cách biểu thị ngữ nghĩa cấu trúc cho văn bản như headings, paragraphs, lists, links, quotes và các mục khác. Các phần tử HTML được phân định bằng các tags, được viết bằng dấu ngoặc nhọn. Các tags như <img /><input /> giới thiệu trực tiếp nội dung vào trang. Các tags khác như <p> bao quanh và cung cấp thông tin về văn bản tài liệu và có thể bao gồm các thẻ khác làm phần tử phụ. Các trình duyệt không hiển thị các thẻ HTML, nhưng sử dụng chúng để diễn giải nội dung của trang.

HTML có thể nhúng các chương trình được viết bằng scripting như JavaScript, điều này ảnh hưởng đến hành vi và nội dung của các trang web. Việc bao gồm CSS xác định giao diện và bố cục của nội dung. World Wide Web Consortium (W3C), trước đây là đơn vị bảo trì HTML và là người duy trì hiện tại của các tiêu chuẩn CSS, đã khuyến khích việc sử dụng CSS trên HTML trình bày rõ ràng kể từ năm 1997.[2]

Lịch sửSửa đổi

Phát triểnSửa đổi

 
Tim Berners-Lee tháng 4/2009

Năm 1980, nhà vật lý Tim Berners-Lee, một nhà thầu tại CERN, đã đề xuất và tạo mẫu ENQUIRE, một hệ thống cho các nhà nghiên cứu CERN sử dụng và chia sẻ tài liệu. Năm 1989, Berners-Lee đã viết một bản ghi nhớ đề xuất một hệ thống siêu văn bản dựa trên Internet.[3] Berners-Lee ác định rõ HTML và viết phần mềm trình duyệt và máy chủ vào cuối năm 1990. Năm đó, Berners-Lee và kỹ sư hệ thống dữ liệu CERN Robert Cailliau đã hợp tác để cùng yêu cầu tài trợ, nhưng dự án không được CERN chính thức thông qua. Trong ghi chú cá nhân của mình[4] từ năm 1990, ông đã liệt kê[5] "một số trong nhiều lĩnh vực mà siêu văn bản được sử dụng" và đặt một cuốn bách khoa toàn thư lên hàng đầu

Mô tả HTML công khai đầu tiên là một tài liệu có tên "HTML Tags", ần đầu tiên được đề cập trên Internet bởi Tim Berners-Lee vào cuối năm 1991.[6][7] Nó mô tả 18 phần tử bao gồm thiết kế ban đầu, tương đối đơn giản của HTML. Ngoại trừ thẻ siêu liên kết, chúng bị ảnh hưởng mạnh bởi SGMLguid, một định dạng tài liệu dựa trên Standard Generalized Markup Language (SGML) tại CERN. Mười một trong số các phần tử này vẫn tồn tại trong HTML 4.[8]

HTML là một ngôn ngữ đánh dấu mà các trình duyệt web sử dụng để giải thích và soạn văn bản, hình ảnh và các tài liệu khác thành các trang web trực quan hoặc nghe được. Các đặc điểm mặc định cho mọi mục của đánh dấu HTML được xác định trong trình duyệt và các đặc điểm này có thể được thay đổi hoặc nâng cao bằng cách sử dụng thêm CSS của nhà thiết kế trang web. Nhiều thành phần văn bản được tìm thấy trong báo cáo kỹ thuật 1988 ISO TR 9537 Techniques for using SGML, lần lượt đề cập đến các tính năng của các ngôn ngữ định dạng văn bản ban đầu, chẳng hạn như được sử dụng bởi lệnh RUNOFF được phát triển vào đầu những năm 1960 cho hệ điều hành CTSS (Compatible Time-Sharing System): các lệnh định dạng này bắt nguồn từ các lệnh được sử dụng bởi các bộ sắp chữ để định dạng tài liệu theo cách thủ công. Tuy nhiên, khái niệm SGML về đánh dấu tổng quát dựa trên các phần tử (các phạm vi được chú thích lồng nhau với các thuộc tính) chứ không chỉ đơn thuần là các hiệu ứng in, với sự phân tách của cấu trúc và đánh dấu, HTML đã được chuyển dần theo hướng này với CSS.

Berners-Lee xem xét HTML là một ứng dụng của SGML. Nó chính thức được định nghĩa như vậy bởi Internet Engineering Task Force (IETF) với việc xuất bản vào giữa năm 1993 về đề xuất đầu tiên cho một đặc tả HTML, Bản thảo trên Internet "Hypertext Markup Language (HTML)" của Berners-Lee và Dan Connolly, bao gồm định nghĩa kiểu SGML Document type definition để xác định ngữ pháp.[9][10] Bản dự thảo hết hạn sau sáu tháng, nhưng đáng chú ý vì nó đã thừa nhận thẻ tùy chỉnh của trình duyệt NCSA Mosaic để nhúng hình ảnh trong dòng, phản ánh triết lý của IETF về việc dựa trên các tiêu chuẩn trên các nguyên mẫu thành công. Tương tự, Bản thảo Internet cạnh tranh của Dave Raggett, "HTML+ (Hypertext Markup Format)", ừ cuối năm 1993, đề xuất tiêu chuẩn hóa các tính năng đã được triển khai như bảng và biểu mẫu điền vào.[11]

Sau khi các bản thảo HTML và HTML+ hết hạn vào đầu năm 1994, IETF đã tạo một HTML Working Group, nhóm này vào năm 1995 đã hoàn thành "HTML 2.0", đặc tả HTML đầu tiên dự định sẽ được coi là tiêu chuẩn dựa trên việc triển khai trong tương lai.[12]

Sự phát triển hơn nữa dưới sự bảo trợ của IETF đã bị đình trệ bởi các lợi ích cạnh tranh. Kể từ năm 1996, các đặc tả ký thuật HTML đã được duy trì, với đầu vào từ các nhà cung cấp phần mềm thương mại, bởi World Wide Web Consortium (W3C).[13] Tuy nhiên, vào năm 2000, HTML cũng đã trở thành tiêu chuẩn quốc tế (ISO/IEC 15445:2000). HTML 4.01 được xuất bản vào cuối năm 1999, với các bản tiếp theo được xuất bản đến năm 2001. Năm 2004, sự phát triển bắt đầu trên HTML5 trong Web Hypertext Application Technology Working Group (WHATWG), nhóm này đã trở thành một nhóm có thể phân phối chung với W3C vào năm 2008, và được hoàn thiện và chuẩn hóa trên Ngày 28 tháng 10 năm 2014.[14]

Đánh dấuSửa đổi

Có bốn loại phần tử đánh dấu trong HTML:

  • Đánh dấu Có cấu trúc miêu tả mục đích của phần văn bản
  • Đánh dấu trình bày miêu tả phần hiện hình trực quan của phần văn bản bất kể chức năng của nó là gì (ví dụ, <b>boldface</b> sẽ hiển thị đoạn văn bản boldface) (Chú ý là cách dùng đánh dấu trình bày này bây giờ không còn được khuyên dùng mà nó được thay thế bằng cách dùng CSS),
  • Đánh dấu liên kết ngoài chứa phần liên kết từ trang này đến trang kia (ví dụ, <a href="http://www.wikipedia.org/">Wikipedia</a> sẽ hiển thị từ Wikipedia như là một liên kết ngoài đến một URL) cụ thể, và
  • Các phần tử thành phần điều khiển giúp tạo ra các đối tượng (ví dụ, các nút và các danh sách).

Tách phần trình bày và nội dungSửa đổi

Nỗ lực tách phần nội dung ra khỏi phần hình thức trình bày của trang HTML đã đưa đến sự xuất hiện của các chuẩn mới như XHTML. Các chuẩn này nhấn mạnh vào việc sử dụng thẻ đánh dấu vào việc xác định cấu trúc tài liệu như phần đề mục, đoạn văn, khối văn bản trích dẫn và các bảng, chứ không khuyên dùng các thẻ đánh dấu mang tính chất trình bày trực quan, như <font>, <b> (in đậm), và <i> (in nghiêng). Những mã mang tính chất trình bày đó đã được loại bỏ khỏi HTML 4.01 Strict và các đặc tả XHTML nhằm tạo điều kiện cho CSS. CSS cung cấp một giải pháp giúp tách cấu trúc HTML ra khỏi phần trình bày của nội dung của nó. Xem phần tách nội dung và trình bày.

Cấu trúc trang HTMLSửa đổi

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <meta http-equiv="X-UA-Compatible" content="ie=edge">
    <title></title><script data-ad-client="ca-pub-2883196244040435" async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>
</head>
<body>
</body>
</html>

XEM THÊMSửa đổi

Tham khảoSửa đổi

  1. ^ “W3C Html”.
  2. ^ “HTML 4.0 Specification — W3C Recommendation — Conformance: requirements and recommendations”. w3. World Wide Web Consortium. 18 tháng 12 năm 1997. Lưu trữ bản gốc ngày 5 tháng 7 năm 2015. Truy cập ngày 6 tháng 7 năm 2015.
  3. ^ Tim Berners-Lee, "Information Management: A Proposal." CERN (March 1989, May 1990). W3.org
  4. ^ Tim Berners-Lee, "Design Issues"
  5. ^ Tim Berners-Lee, "Design Issues"
  6. ^ Lỗi chú thích: Thẻ <ref> sai; không có nội dung trong thẻ ref có tên tagshtml
  7. ^ Berners-Lee, Tim (29 tháng 10 năm 1991). “First mention of HTML Tags on the www-talk mailing list”. w3. World Wide Web Consortium. Lưu trữ bản gốc ngày 24 tháng 5 năm 2007. Truy cập ngày 8 tháng 4 năm 2007.
  8. ^ “Index of elements in HTML 4”. w3. World Wide Web Consortium. 24 tháng 12 năm 1999. Lưu trữ bản gốc ngày 5 tháng 5 năm 2007. Truy cập ngày 8 tháng 4 năm 2007.
  9. ^ Berners-Lee, Tim (9 tháng 12 năm 1991). “Re: SGML/HTML docs, X Browser (archived www-talk mailing list post)”. w3. Lưu trữ bản gốc ngày 22 tháng 12 năm 2007. Truy cập ngày 16 tháng 6 năm 2007. SGML is very general. HTML is a specific application of the SGML basic syntax applied to hypertext documents with simple structure.
  10. ^ Berners-Lee, Tim; Connolly, Daniel (tháng 6 năm 1993). “Hypertext Markup Language (HTML): A Representation of Textual Information and MetaInformation for Retrieval and Interchange”. w3. Lưu trữ bản gốc ngày 3 tháng 1 năm 2017. Truy cập ngày 4 tháng 1 năm 2017.
  11. ^ Raggett, Dave. “A Review of the HTML+ Document Format”. w3. Lưu trữ bản gốc ngày 29 tháng 2 năm 2000. Truy cập ngày 22 tháng 5 năm 2020. The hypertext markup language HTML was developed as a simple non-proprietary delivery format for global hypertext. HTML+ is a set of modular extensions to HTML and has been developed in response to a growing understanding of the needs of information providers. These extensions include text flow around floating figures, fill-out forms, tables and mathematical equations.
  12. ^ Berners-Lee, Tim; Connelly, Daniel (tháng 11 năm 1995). “Hypertext Markup Language – 2.0”. ietf.org. Internet Engineering Task Force. RFC 1866. Lưu trữ bản gốc ngày 11 tháng 8 năm 2010. Truy cập ngày 1 tháng 12 năm 2010. This document thus defines an HTML 2.0 (to distinguish it from the previous informal specifications). Future (generally upwardly compatible) versions of HTML with new features will be released with higher version numbers.
  13. ^ Raggett, Dave (1998). Raggett on HTML 4. Bản gốc lưu trữ ngày 9 tháng 8 năm 2007. Truy cập ngày 9 tháng 7 năm 2007.
  14. ^ “HTML5 – Hypertext Markup Language – 5.0”. Internet Engineering Task Force. 28 tháng 10 năm 2014. Lưu trữ bản gốc ngày 28 tháng 10 năm 2014. Truy cập ngày 25 tháng 11 năm 2014. This document recommends HTML 5.0 after completion.

Liên kết ngoàiSửa đổi