Khác biệt giữa bản sửa đổi của “World Wide Web”

Nội dung được xóa Nội dung được thêm vào
n replaced: ( → ( (9), ) → ) (15), . → . (51), , → , (56), : → : (2), . <ref → .<ref (23), → (123) using AWB
Dòng 38:
==Chức năng==
{{main|HTTP|HTML}}
[[Tập tin:Internet_Key_Layers.png|nhỏ| World Wide Web hoạt động như một [[Giao thức truyền thông|giao thức]] [[Tầng ứng dụng|lớp ứng dụng]] được chạy "trên đỉnh" (theo nghĩa bóng) Internet, giúp làm cho nó hoạt động nhiều hơn. Sự ra đời của trình duyệt web khảm đã giúp web trở nên tiện dụng hơn rất nhiều, bao gồm hiển thị hình ảnh và hình ảnh chuyển [[GIF|động]] ( [[GIF]] ). ]]
Các thuật ngữ ''Internet'' và ''World Wide Web'' thường được sử dụng mà không có nhiều sự khác biệt. Tuy nhiên, hai thuật ngữ không có nghĩa giống nhau. Internet là một hệ thống toàn cầu của [[Mạng máy tính|các mạng máy tính được]] kết nối với nhau. Ngược lại, World Wide Web là một tập hợp toàn cầu các tài liệu và các tài nguyên khác, được liên kết bởi các siêu liên kết và [[URI]] . Tài nguyên web được truy cập bằng [[Hypertext Transfer Protocol|HTTP]] hoặc [[HTTPS]] , là các giao thức Internet cấp ứng dụng sử dụng các giao thức truyền tải của Internet. <ref>{{Chú thích web|url=https://www.w3.org/Help/#webinternet|title=What is the difference between the Web and the Internet?|publisher=World Wide Web Consortium|archive-url=https://web.archive.org/web/20160422072749/http://www.w3.org/Help/#webinternet|archive-date=22 April 2016|dead-url=no|access-date=18 April 2016}}</ref>
 
Việc xem một [[Trang web|trang web]] trên World Wide Web thường bắt đầu bằng cách nhập [[URL]] của trang vào trình duyệt web hoặc bằng cách theo một siêu liên kết đến trang hoặc tài nguyên đó. Trình duyệt web sau đó khởi tạo một loạt các thông báo truyền thông nền để tìm nạp và hiển thị trang được yêu cầu. Vào những năm 1990, sử dụng trình duyệt để xem các trang web, và chuyển từ trang này sang trang khác thông qua các siêu liên kết, được biết đến như là 'duyệt web,' 'lướt web' (sau khi lướt kênh ) hoặc 'điều hướng Web'. Những nghiên cứu ban đầu về hành vi mới này đã điều tra các mẫu người dùng trong việc sử dụng trình duyệt web. Một nghiên cứu, ví dụ, đã tìm thấy năm mẫu người dùng: lướt web khám phá, lướt web cửa sổ, lướt phát triển, điều hướng giới hạn và điều hướng mục tiêu. <ref>{{Chú thích tạp chí|last=Muylle|first=Steve|last2=Rudy Moenaert|last3=Marc Despont|year=1999|title=A grounded theory of World Wide Web search behaviour|url=http://www.ingentaconnect.com/content/routledg/rjmc/1999/00000005/00000003/art00004|dead-url=no|journal=Journal of Marketing Communications|volume=5|issue=3|page=143|doi=10.1080/135272699345644|archive-url=https://web.archive.org/web/20141020140153/http://www.ingentaconnect.com/content/routledg/rjmc/1999/00000005/00000003/art00004|archive-date=20 October 2014}}</ref>
 
Ví dụ sau đây cho thấy chức năng của trình duyệt web khi truy cập một trang tại URL <code><nowiki>http://www.example.org/home.html</nowiki></code> . Trình duyệt phân giải tên máy chủ của URL ( <code>www.example.org</code> ) thành [[Địa chỉ IP|địa chỉ Giao thức Internet]] bằng [[Hệ thống phân giải tên miền|Hệ thống tên miền]] (DNS) được phân phối toàn cầu. ''Tra'' cứu này trả về một địa chỉ IP như ''203.0.113.4'' hoặc ''2001: db8: 2e :: 7334'' . Trình duyệt sau đó yêu cầu tài nguyên bằng cách gửi yêu cầu [[Hypertext Transfer Protocol|HTTP]] qua Internet đến máy tính tại địa chỉ đó. Nó yêu cầu dịch vụ từ một số cổng TCP cụ thể nổi tiếng với dịch vụ HTTP, để máy chủ nhận có thể phân biệt yêu cầu HTTP với các giao thức mạng khác mà nó có thể đang phục vụ. Giao thức HTTP thường sử dụng số cổng 80 và đối với giao thức HTTPS, thông thường nó là số cổng 443 . Nội dung của yêu cầu HTTP có thể đơn giản như hai dòng văn bản:
<source lang="http">
GET /home.html HTTP/1.1
Host: www.example.org
</source>
Máy tính nhận yêu cầu HTTP chuyển nó đến phần mềm máy chủ web lắng nghe yêu cầu trên cổng 80. Nếu máy chủ web có thể thực hiện yêu cầu, nó sẽ gửi phản hồi HTTP trở lại trình duyệt cho thấy thành công:
<source lang="http">
HTTP/1.1 200 OK
Content-Type: text/html; charset=UTF-8
</source>
tiếp theo là nội dung của trang được yêu cầu. Ngôn ngữ đánh dấu siêu văn bản ( [[HTML]] ) cho một trang web cơ bản có thể trông như thế này:
<source lang="html">
<html>
Dòng 64:
</html>
</source>
Trình duyệt web phân tích cú pháp HTML và diễn giải đánh dấu (<source lang="html" inline><title></source>, <source lang="HTML" inline><p></source> cho đoạn văn, v.v.) bao quanh các từ để định dạng văn bản trên màn hình. Nhiều trang web sử dụng HTML để tham chiếu các URL của các tài nguyên khác như hình ảnh, phương tiện được nhúng khác, tập lệnh ảnh hưởng đến hành vi của trang và Biểu [[CSS|định kiểu xếp chồng]] ảnh hưởng đến bố cục trang. Trình duyệt thực hiện các yêu cầu HTTP bổ sung cho máy chủ web cho các loại [[Kiểu phương tiện|phương tiện Internet khác]] . Khi nhận được nội dung của họ từ máy chủ web, trình duyệt sẽ dần dần hiển thị trang lên màn hình theo quy định của HTML và các tài nguyên bổ sung này.
 
=== HTML ===
{{main|HTML}}
Ngôn ngữ đánh dấu siêu văn bản (HTML) là [[Ngôn ngữ đánh dấu|ngôn ngữ đánh dấu]] tiêu chuẩn để tạo [[Trang web|các trang web]] và [[Ứng dụng web|ứng dụng web]] . Với [[CSS|Cascading Style Sheets]] (CSS) và [[JavaScript]] , nó tạo thành một bộ ba công nghệ [[Viên đá đầu tiên|nền tảng]] cho World Wide Web. <ref>{{Chú thích sách|title=JavaScript – The definitive guide|last=Flanagan|first=David|edition=6|page=1|quote=JavaScript is part of the triad of technologies that all Web developers must learn: HTML to specify the content of web pages, CSS to specify the presentation of web pages, and JavaScript to specify the behaviour of web pages.}}</ref>
 
[[Trình duyệt web]] nhận tài liệu HTML từ [[Máy chủ web|máy chủ web]] hoặc từ bộ nhớ cục bộ và hiển thị tài liệu vào các trang web đa phương tiện. HTML mô tả cấu trúc của một trang web [[Mạng ngữ nghĩa|về mặt ngữ nghĩa]] và ban đầu bao gồm các tín hiệu cho sự xuất hiện của tài liệu.
 
[[Phần tử HTML|Các phần tử HTML]] là các khối xây dựng của các trang HTML. Với cấu trúc HTML, [[Phần tử HTML|hình ảnh]] và các đối tượng khác như [[Phần tử HTML|biểu mẫu tương tác]] có thể được nhúng vào trang được hiển thị. HTML cung cấp một phương tiện để tạo các tài liệu có cấu trúc bằng cách biểu thị [[Ngữ nghĩa học|ngữ nghĩa]] cấu trúc cho văn bản như tiêu đề, đoạn văn, danh sách, [[Siêu liên kết|liên kết]] , trích dẫn và các mục khác. Các phần tử HTML được mô tả bằng ''các thẻ'' , được viết bằng [[Dấu ngoặc|dấu ngoặc nhọn]] . Các thẻ như {{code|lang=html|code=<img />}} và {{code|<input />|lang=html}} trực tiếp giới thiệu nội dung vào trang. Các thẻ khác, chẳng hạn như {{code|lang=html|code=<p>}} bao quanh và cung cấp thông tin về văn bản tài liệu và có thể bao gồm các thẻ khác làm thành phần phụ. Các trình duyệt không hiển thị các thẻ HTML, nhưng sử dụng chúng để diễn giải nội dung của trang.
 
HTML có thể nhúng các chương trình được viết bằng [[Ngôn ngữ kịch bản|ngôn ngữ script]] như [[JavaScript]] , ảnh hưởng đến hành vi và nội dung của các trang web. Bao gồm CSS xác định giao diện và bố cục nội dung. [[W3C|World Wide Web Consortium]] (W3C), người duy trì cả hai tiêu chuẩn HTML và CSS, đã khuyến khích sử dụng CSS trên HTML trình bày rõ ràng {{Tính đến|1997}} <ref name="deprecated">{{Chú thích web|url=https://www.w3.org/TR/REC-html40-971218/conform.html#deprecated|title=HTML 4.0 Specification — W3C Recommendation — Conformance: requirements and recommendations|date=December 18, 1997|publisher=World Wide Web Consortium|access-date=July 6, 2015}}</ref>
 
=== Liên kết ===
Hầu hết các trang web chứa siêu liên kết đến các trang liên quan khác và có lẽ các tệp có thể tải xuống, tài liệu nguồn, định nghĩa và các tài nguyên web khác. Trong HTML cơ bản, một siêu liên kết trông như thế này:
<source lang="html" inline><a href="http://www.example.org/home.html">www.Example.org Homepage</a></source>
[[Tập tin:WorldWideWebAroundWikipedia.png|nhỏ| Biểu diễn đồ họa của một phần nhỏ của WWW, thể hiện [[Siêu liên kết|các siêu liên kết]] ]]
Một tập hợp các tài nguyên hữu ích, có liên quan, được kết nối với nhau thông qua các liên kết siêu văn bản được mệnh danh là một ''mạng lưới'' thông tin. Xuất bản trên Internet tạo ra thứ mà Tim Berners-Lee gọi là ''WorldWideWeb'' (trong CamelCase ban đầu, sau đó đã bị loại bỏ) vào tháng 11 năm 1990. <ref name="W90">{{Chú thích web|url=http://w3.org/Proposal.html|title=WorldWideWeb: Proposal for a HyperText Project|author=Berners-Lee|first=Tim|authorlink=Tim Berners-Lee|author2=Cailliau|first2=Robert|authorlink2=Robert Cailliau|date=12 November 1990|archive-url=https://web.archive.org/web/20150502080527/http://www.w3.org/Proposal.html|archive-date=2 May 2015|dead-url=no|access-date=12 May 2015}}</ref>
 
Cấu trúc siêu liên kết của WWW được mô tả bởi webgraph : các nút của biểu đồ web tương ứng với các trang web (hoặc URL) các cạnh được định hướng giữa chúng với các siêu liên kết. Theo thời gian, nhiều tài nguyên web được chỉ ra bởi các siêu liên kết biến mất, di dời hoặc được thay thế bằng các nội dung khác nhau. Điều này làm cho các siêu liên kết trở nên lỗi thời, một hiện tượng được gọi trong một số vòng tròn là thối liên kết và các siêu liên kết bị ảnh hưởng bởi nó thường được gọi là liên kết chết . Bản chất bất ổn của Web đã thúc đẩy nhiều nỗ lực lưu trữ các trang web. [[Internet Archive]] , hoạt động từ năm 1996, được biết đến nhiều nhất với những nỗ lực như vậy.
 
=== Tiền tố WWW ===
Nhiều tên máy chủ được sử dụng cho World Wide Web bắt đầu bằng ''www'' vì thông lệ đặt tên máy chủ [[Internet]] lâu dài theo các dịch vụ mà chúng cung cấp. Tên máy chủ của [[Máy chủ web|máy chủ web]] thường là ''www'' , giống như cách mà nó có thể là ''ftp'' cho [[FTP|máy chủ FTP]] và ''tin tức'' hoặc ''nntp'' cho máy chủ tin tức [[Usenet]] . Các tên máy chủ này xuất hiện dưới dạng Hệ thống tên miền (DNS) hoặc [[Tên miền phụ|tên miền phụ]] , như trong ''www.example.com'' . Việc sử dụng ''www'' không được yêu cầu bởi bất kỳ tiêu chuẩn kỹ thuật hoặc chính sách nào và nhiều trang web không sử dụng nó; máy chủ web đầu tiên là ''nxoc01.cern.ch'' . <ref>{{Chú thích web|url=http://w3.org/People/Berners-Lee/FAQ.html|title=Frequently asked questions by the Press|author=Berners-Lee|first=Tim|publisher=W3C|archive-url=https://web.archive.org/web/20090802051415/http://www.w3.org/People/Berners-Lee/FAQ.html|archive-date=2 August 2009|dead-url=no|access-date=27 July 2009}}</ref> Theo Paolo Palazzi, <ref>Palazzi, P (2011) [http://soft-shake.ch/2011/en/conference/sessions.html?key=earlydays 'The Early Days of the WWW at CERN'] {{Webarchive}}</ref> người từng làm việc tại CERN cùng với Tim Berners-Lee, việc sử dụng phổ biến ''www'' làm tên miền phụ là tình cờ; trang dự án World Wide Web dự định được xuất bản tại www.cern.ch trong khi info.cern.ch được dự định là trang chủ của Cern, tuy nhiên các bản ghi DNS không bao giờ được chuyển đổi và việc thực hành trả trước ''www'' vào trang web của tổ chức tên miền sau đó đã được sao chép. Nhiều trang web được thiết lập vẫn sử dụng tiền tố hoặc họ sử dụng các tên miền phụ khác như ''www2'' , ''an toàn'' hoặc ''en'' cho các mục đích đặc biệt. Nhiều máy chủ web như vậy được thiết lập sao cho cả tên miền chính (ví dụ: example.com) và tên miền phụ ''www'' (ví dụ: www.example.com) đề cập đến cùng một trang web; những người khác yêu cầu một hình thức này hoặc hình thức khác, hoặc họ có thể ánh xạ đến các trang web khác nhau. Việc sử dụng tên miền phụ rất hữu ích để tải cân bằng lưu lượng truy cập web đến bằng cách tạo bản ghi CNAME trỏ đến một cụm máy chủ web. Vì hiện tại, chỉ có một tên miền phụ có thể được sử dụng trong CNAME, kết quả tương tự không thể đạt được bằng cách sử dụng gốc tên miền trần. <ref>{{Chú thích web|url=https://medium.freecodecamp.org/why-cant-a-domain-s-root-be-a-cname-8cbab38e5f5c|title=Why a domain’s root can’t be a CNAME — and other tidbits about the DNS|author=Dominic Fraser|date=May 13, 2018|website=FreeCodeCamp}}</ref>
 
Khi người dùng gửi một tên miền chưa hoàn chỉnh cho trình duyệt web trong trường nhập thanh địa chỉ của nó, một số trình duyệt web sẽ tự động thử thêm tiền tố "www" vào đầu của nó và có thể là ".com", ".org" và ".net "Ở cuối, tùy thuộc vào những gì có thể thiếu. Ví dụ: nhập ' microsoft ' có thể được chuyển đổi thành ''<nowiki>http://www.microsoft.com/</nowiki>'' và 'openoffice' thành ''<nowiki>http://www.openoffice.org</nowiki>'' . Tính năng này bắt đầu xuất hiện trong các phiên bản đầu tiên của [[Mozilla Firefox|Firefox]] , khi nó vẫn có tiêu đề hoạt động 'Firebird' vào đầu năm 2003, từ một thực tiễn trước đó trong các trình duyệt như Lynx . <ref>{{Chú thích web|url=http://forums.mozillazine.org/viewtopic.php?f=9&t=10980|title=automatically adding www.___.com|date=16 May 2003|publisher=mozillaZine|archive-url=https://web.archive.org/web/20090627225046/http://forums.mozillazine.org/viewtopic.php?f=9&t=10980|archive-date=27 June 2009|dead-url=no|access-date=27 May 2009}}</ref> <sup class="noprint Inline-Template" style="white-space:nowrap;">&#x5D;</sup> Có thông tin rằng Microsoft đã được cấp bằng sáng chế của Hoa Kỳ cho ý tưởng tương tự vào năm 2008, nhưng chỉ dành cho thiết bị di động. <ref>{{Chú thích web|url=http://techdirt.com/articles/20080626/0203581527.shtml|title=Microsoft Patents Adding 'www.' And '.com' To Text|author=Masnick|first=Mike|date=7 July 2008|publisher=Techdirt|archive-url=https://web.archive.org/web/20090627212151/http://www.techdirt.com/articles/20080626/0203581527.shtml|archive-date=27 June 2009|dead-url=no|access-date=27 May 2009}}</ref>
<sup class="noprint Inline-Template" data-ve-ignore="true" style="white-space:nowrap;">&#x5B; ''[[Wikipedia:Nguồn đáng tin cậy|<span title="The material near this tag may rely on an unreliable source. (November 2016)">nguồn không đáng tin cậy?</span>]]''</sup>
Trong tiếng Anh, <nowiki><i id="mwAUQ">www</i></nowiki> thường được đọc là ''double-u double-u double-u'' . <ref>{{Chú thích web|url=http://www.oxforddictionaries.com/us/definition/american_english/WWW?q=www|title=Audible pronunciation of 'WWW'|publisher=Oxford University Press|archive-url=https://web.archive.org/web/20140525195152/http://www.oxforddictionaries.com/us/definition/american_english/WWW?q=www|archive-date=25 May 2014|dead-url=no|access-date=25 May 2014}}</ref> Một số người dùng phát âm nó ''dub-dub-dub'' , đặc biệt là ở New Zealand. Stephen Fry, trong loạt podcast "Podgrams" của mình, phát âm nó là ''wuh wuh wuh'' . <ref>{{Chú thích web|url=http://www.podcasts.com/stephen_frys_podgrams_audio_visual/episode/series_2_episode_1_stephenfry.com_2.0|title=Stephen Fry's pronunciation of 'WWW'|publisher=Podcasts.com|archive-url=https://web.archive.org/web/20170404220105/http://www.podcasts.com/stephen_frys_podgrams_audio_visual/episode/series_2_episode_1_stephenfry.com_2.0|archive-date=4 April 2017|dead-url=no}}</ref> Nhà văn người Anh [[Douglas Adams]] đã từng châm biếm trong ''[[The Independent|tờ Độc lập]] vào Chủ nhật'' (1999): "World Wide Web là điều duy nhất tôi biết về hình thức rút gọn của nó mất nhiều thời gian hơn ba lần để nói ngắn hơn" <ref name="Sim">{{Chú thích web|url=https://www.newscientist.com/blog/technology/2008/07/help-us-find-better-way-to-pronounce.html|title=Help us find a better way to pronounce www|author=Simonite|first=Tom|date=July 22, 2008|website=newscientist.com|publisher=New Scientist, ''Technology''|archive-url=https://web.archive.org/web/20160313095715/https://www.newscientist.com/blog/technology/2008/07/help-us-find-better-way-to-pronounce.html|archive-date=13 March 2016|dead-url=no|access-date=7 February 2016}}</ref> Trong tiếng Quan Thoại, ''World Wide Web'' thường được dịch qua khớp phono-ngữ nghĩa để ''Wan wǎng Wei'' ( {{Lang|zh|[[wikt:万维网|万维网]]}} ), thỏa mãn ''www'' và nghĩa đen là "mạng vô số chiều", <ref>{{Chú thích web|url=http://us.mdbg.net/chindict/chindict.php?page=translate&trst=0&trqs=World+Wide+Web&trlang=&wddmtm=0|title=MDBG Chinese-English dictionary&nbsp;– Translate|archive-url=https://web.archive.org/web/20081112091834/http://us.mdbg.net/chindict/chindict.php?page=translate|archive-date=12 November 2008|dead-url=no|access-date=27 July 2009}}</ref> một bản dịch phản ánh khái niệm thiết kế và phổ biến của World Wide Web. Không gian web của Tim Berners-Lee tuyên bố rằng ''World Wide Web'' được chính thức đánh vần là ba từ riêng biệt, mỗi từ viết hoa, không có dấu gạch ngang. <ref>{{Chú thích web|url=http://w3.org/People/Berners-Lee/FAQ.html|title=Frequently asked questions by the Press&nbsp;– Tim BL|publisher=W3.org|archive-url=https://web.archive.org/web/20090802051415/http://www.w3.org/People/Berners-Lee/FAQ.html|archive-date=2 August 2009|dead-url=no|access-date=27 July 2009}}</ref> Việc sử dụng tiền tố www đã giảm dần, đặc biệt là khi [[Ứng dụng web|các ứng dụng web]] [[Web 2.0]] tìm cách tạo thương hiệu cho tên miền của chúng và làm cho chúng dễ phát âm. <ref name="cas">{{Chú thích web|url=http://www.thefreelibrary.com/It's+not+your+grandfather's+Internet.-a0239804575|title=It's not your grandfather's Internet.|author=Castelluccio|first=Michael|date=2010|website=thefreelibrary.com|publisher=Institute of Management Accountants|access-date=7 February 2016}}</ref> Khi Web di động ngày càng phổ biến, các dịch vụ như [[Gmail]] .com, [[Outlook.com]] , [[Myspace]] .com, [[Facebook]] .com và [[Twitter]] .com thường được đề cập nhất mà không cần thêm "www." (hoặc, thực sự, ".com") cho tên miền.
 
=== Sơ đồ mô tả ===
Các chỉ định lược đồ ''<code><nowiki>http://</nowiki></code>'' và ''<code><nowiki>https://</nowiki></code>'' khi bắt đầu [[URI]] web tương ứng với [[Hypertext Transfer Protocol|Giao thức truyền siêu văn bản]] hoặc [[HTTPS|Bảo mật HTTP]] . Họ chỉ định giao thức truyền thông để sử dụng cho yêu cầu và phản hồi. Giao thức HTTP là nền tảng cho hoạt động của World Wide Web và lớp mã hóa được thêm vào trong HTTPS là điều cần thiết khi trình duyệt gửi hoặc truy xuất dữ liệu bí mật, như mật khẩu hoặc thông tin ngân hàng. Các trình duyệt web thường tự động thêm <nowiki>http: //</nowiki> vào các URI do người dùng nhập, nếu bị bỏ qua.
 
=== Trang web ===
[[Tập tin:Commons.png|nhỏ| Ảnh chụp màn hình của một trang web trên Wikimedia Commons ]]
Một ''trang web'' (cũng được viết dưới dạng ''trang web'' ) là một tài liệu phù hợp với World Wide Web và [[Trình duyệt web|các trình duyệt web]] . Trình duyệt web hiển thị một trang web trên [[Màn hình máy tính|màn hình]] hoặc thiết bị di động .
 
Thuật ngữ ''trang web'' thường đề cập đến những gì có thể nhìn thấy, nhưng cũng có thể đề cập đến nội dung của chính [[Tập tin|tệp máy tính]] , thường là tệp văn bản chứa [[Siêu văn bản|siêu văn bản]] được viết bằng [[HTML]] hoặc [[Ngôn ngữ đánh dấu|ngôn ngữ đánh dấu]] so sánh. Các trang web điển hình cung cấp [[Siêu văn bản|siêu văn bản]] để duyệt đến các trang web khác thông qua [[Siêu liên kết|các siêu liên kết]] , thường được gọi là ''các liên kết'' . Các trình duyệt web sẽ thường xuyên phải truy cập nhiều yếu tố tài nguyên web , chẳng hạn như đọc biểu định [[CSS|kiểu]] , tập lệnh và hình ảnh, trong khi trình bày từng trang web.
 
Trên mạng, trình duyệt web có thể truy xuất trang web từ [[Máy chủ web|máy chủ web]] từ xa. Máy chủ web có thể hạn chế quyền truy cập vào một mạng riêng như mạng nội bộ của công ty. Trình duyệt web sử dụng [[Hypertext Transfer Protocol|Giao thức truyền siêu văn bản]] (HTTP) để thực hiện các yêu cầu như vậy đến [[Máy chủ web|máy chủ web]] .
 
Một trang web <nowiki><i id="mwAYc">tĩnh</i></nowiki> được phân phối chính xác như được lưu trữ, như nội dung web trong [[Hệ thống file|hệ thống tệp]] của máy chủ web. Ngược lại, một trang web <nowiki><i id="mwAYs">động</i></nowiki> được tạo bởi một [[Ứng dụng web|ứng dụng web]] , thường được điều khiển bởi phần mềm phía máy chủ . Các trang web động giúp trình duyệt ( máy khách ) cải thiện trang web thông qua đầu vào của người dùng đến máy chủ.
 
==== Trang web tĩnh ====
''Trang web tĩnh'' (đôi khi được gọi là ''trang phẳng / trang cố định'' ) là [[Trang web|trang web]] được phân phối cho người dùng chính xác như được lưu trữ, trái ngược với các trang web động được tạo bởi [[Ứng dụng web|ứng dụng web]] .
 
Do đó, một trang web tĩnh hiển thị cùng một thông tin cho tất cả người dùng, từ mọi bối cảnh, tùy thuộc vào khả năng hiện đại của [[Máy chủ web|máy chủ web]] để đàm phán loại [[Kiểu phương tiện|nội dung]] hoặc ngôn ngữ của tài liệu có sẵn các phiên bản đó và máy chủ được cấu hình để làm như vậy.
 
==== Các trang web động ====
[[Tập tin:Scheme_dynamic_page_en.svg|phải|nhỏ|500x500px| Trang web động: ví dụ về scripting tại máy chủ ( [[PHP]] và [[MySQL]] ). ]]
''Trang web động phía máy chủ'' là [[Trang web|trang web]] có cấu trúc được điều khiển bởi [[Máy chủ ứng dụng|máy chủ ứng dụng]] xử lý các tập lệnh phía máy chủ. Trong kịch bản phía máy chủ, [[Tham số (lập trình máy tính)|các tham số]] xác định cách tiến hành lắp ráp mỗi trang web mới, bao gồm cả việc thiết lập xử lý phía máy khách nhiều hơn.
 
Một ''trang web động phía máy khách'' xử lý trang web bằng cách sử dụng tập lệnh HTML chạy trong trình duyệt khi tải. JavaScript và các ngôn ngữ kịch bản lệnh khác xác định cách HTML trong trang nhận được được phân tích cú pháp vào [[DOM|Mô hình đối tượng tài liệu]] hoặc DOM, đại diện cho trang web được tải. Các kỹ thuật phía máy khách tương tự sau đó có thể tự động cập nhật hoặc thay đổi DOM theo cùng một cách.
 
Sau đó, một trang web động được tải lại bởi người dùng hoặc bởi một [[Chương trình máy tính|chương trình máy tính]] để thay đổi một số nội dung biến. Thông tin cập nhật có thể đến từ máy chủ hoặc từ các thay đổi được thực hiện cho DOM của trang đó. Điều này có thể hoặc không thể cắt bớt lịch sử duyệt web hoặc tạo một phiên bản đã lưu để quay lại, nhưng một ''bản cập nhật trang web động'' bằng công nghệ [[Ajax (lập trình)|Ajax]] sẽ không tạo ra một trang để quay lại, cũng không cắt bớt lịch sử duyệt web về phía trước của trang được hiển thị. Sử dụng các công nghệ Ajax, người dùng cuối sẽ có ''một trang động'' được quản lý dưới dạng một trang trong [[Trình duyệt web|trình duyệt web]] trong khi nội dung web thực tế được hiển thị trên trang đó có thể khác nhau. Động cơ Ajax ngồi chỉ trên trình duyệt yêu cầu các bộ phận của DOM của nó, ''DOM,'' cho khách hàng của mình, từ một máy chủ ứng dụng.
 
[[HTML động|DHTML]] là thuật ngữ chung cho các công nghệ và phương pháp được sử dụng để tạo các trang web không phải là trang web tĩnh , mặc dù nó đã không được sử dụng phổ biến kể từ khi phổ biến [[Ajax (lập trình)|AJAX]] , một thuật ngữ mà hiện nay nó hiếm khi được sử dụng. Kịch bản phía máy khách, kịch bản phía máy chủ hoặc kết hợp những thứ này tạo nên trải nghiệm web động trong trình duyệt.
 
[[JavaScript]] là [[Ngôn ngữ kịch bản|ngôn ngữ kịch bản]] được phát triển lần đầu tiên vào năm 1995 bởi [[Brendan Eich]] , sau đó là [[Netscape]] , để sử dụng trong các trang web. <ref name="Hamilton">{{Chú thích web|url=http://computerworld.com.au/article/255293/-z_programming_languages_javascript|title=The A-Z of Programming Languages: JavaScript|author=Hamilton, Naomi|date=31 July 2008|website=Computerworld|publisher=IDG|archive-url=https://web.archive.org/web/20090524025720/http://www.computerworld.com.au/article/255293/-z_programming_languages_javascript|archive-date=24 May 2009|dead-url=no|access-date=12 May 2009}}</ref> Phiên bản tiêu chuẩn là [[ECMAScript]] . <ref name="Hamilton" /> Để làm cho các trang web tương tác nhiều hơn, một số ứng dụng web cũng sử dụng các kỹ thuật JavaScript như [[Ajax (lập trình)|Ajax]] (JavaScript không đồng bộ và [[XML]] ). Tập lệnh phía máy khách được phân phối cùng với trang có thể thực hiện các yêu cầu HTTP bổ sung cho máy chủ, để đáp ứng với các hành động của người dùng như di chuyển chuột hoặc nhấp chuột hoặc dựa trên thời gian đã trôi qua. Phản hồi của máy chủ được sử dụng để sửa đổi trang hiện tại thay vì tạo một trang mới với mỗi phản hồi, do đó máy chủ chỉ cần cung cấp thông tin gia tăng, giới hạn. Nhiều yêu cầu Ajax có thể được xử lý cùng một lúc và người dùng có thể tương tác với trang trong khi dữ liệu được truy xuất. Các trang web cũng có thể thường xuyên thăm dò máy chủ để kiểm tra xem thông tin mới có sẵn hay không. <ref>{{Chú thích web|url=http://buntin.org/2008/sep/23/jquery-polling-plugin/|title=jQuery Polling plugin|author=Buntin|first=Seth|date=23 September 2008|archive-url=https://web.archive.org/web/20090813184848/http://buntin.org/2008/sep/23/jquery-polling-plugin/|archive-date=13 August 2009|dead-url=yes|access-date=2009-08-22}}</ref>
 
=== Trang mạng ===
[[Tập tin:United_States_Antarctic_Program_website_from_2018_02_22.png|phải|nhỏ|482x482px| Trang web usap.gov ]]
''Trang web'' <ref>{{Chú thích web|url=http://www.thefreedictionary.com/Website|title=website|author=|first=|date=|website=[[TheFreeDictionary.com]]|publisher=|archive-url=|archive-date=|dead-url=|access-date=2011-07-02}}</ref> là tập hợp các tài nguyên web liên quan bao gồm [[Trang web|các trang web]] , nội dung [[Đa phương tiện|đa phương tiện]] , thường được xác định bằng một [[Tên miền|tên miền]] chung và được xuất bản trên ít nhất một [[Máy chủ web|máy chủ web]] . Ví dụ đáng chú ý là [[wikipedia]].org, [[google]].com và [[amazon.com]] .
 
Một trang web có thể được truy cập thông qua [[Internet Protocol|mạng Giao thức Internet]] (IP) công cộng, chẳng hạn như [[Internet]] hoặc [[Local area network|mạng cục bộ]] riêng (LAN), bằng cách tham chiếu một trình [[URL|định vị tài nguyên thống nhất]] (URL) xác định trang web.
 
Trang web có thể có nhiều chức năng và có thể được sử dụng trong nhiều thời trang khác nhau; một trang web có thể là một trang web cá nhân , một trang web công ty cho một công ty, một trang web của chính phủ, một trang web của tổ chức, v.v. Các trang web thường dành riêng cho một chủ đề hoặc mục đích cụ thể, từ giải trí và [[Dịch vụ mạng xã hội|mạng xã hội]] đến cung cấp tin tức và giáo dục. Tất cả các trang web có thể truy cập công khai cùng nhau tạo thành World Wide Web, trong khi các trang web riêng, chẳng hạn như trang web của công ty dành cho nhân viên, thường là một phần của [[Intranet|mạng nội bộ]] .
 
Các trang web, là các khối xây dựng của trang web, là các [[Văn kiện|tài liệu]] , thường được soạn thảo [[Plain text|bằng văn bản thuần túy]] xen kẽ với các hướng dẫn định dạng của Ngôn ngữ đánh dấu siêu văn bản ( [[HTML]] , [[XHTML]] ). Họ có thể kết hợp các yếu tố từ các trang web khác với [[Phần tử HTML|các neo đánh dấu]] phù hợp. Các trang web được truy cập và vận chuyển với [[Hypertext Transfer Protocol|Giao thức truyền siêu văn bản]] (HTTP), có thể tùy chọn sử dụng mã hóa ( [[HTTPS|HTTP Secure]] , HTTPS) để cung cấp bảo mật và quyền riêng tư cho người dùng. Ứng dụng của người dùng, thường là [[Trình duyệt web|trình duyệt web]] , hiển thị nội dung trang theo hướng dẫn đánh dấu HTML của nó lên [[Màn hình máy tính|thiết bị đầu cuối hiển thị]] .
 
[[Siêu liên kết]] giữa các trang web chuyển đến người đọc cấu trúc trang web và hướng dẫn điều hướng của trang web, thường bắt đầu bằng một trang chủ chứa một thư mục của nội dung trang web . Một số trang web yêu cầu đăng ký người dùng hoặc đăng ký để truy cập nội dung. Ví dụ về các trang web đăng ký bao gồm nhiều trang web kinh doanh, trang web tin tức, trang web [[Tập san học thuật|tạp chí học thuật]] , trang web trò chơi, trang web chia sẻ tệp, [[Diễn đàn trực tuyến|bảng tin]] , [[Thư điện tử|email]] dựa trên web, trang web [[Dịch vụ mạng xã hội|mạng xã hội]] , trang web cung cấp dữ liệu [[Thị trường chứng khoán|thị trường chứng khoán theo]] thời gian thực, cũng như các trang web cung cấp dịch vụ khác nhau. Người dùng cuối có thể truy cập các trang web trên một loạt thiết bị, bao gồm [[Máy tính để bàn|máy tính để bàn]] và [[Máy tính xách tay|máy tính xách tay]] , [[Máy tính bảng|máy tính bảng]] , [[Điện thoại thông minh|điện thoại thông minh]] và TV thông minh .
 
=== Trình duyệt web ===
''Trình duyệt web'' (thường được gọi là ''trình duyệt'' ) là [[User Agent|tác nhân người dùng]] [[Phần mềm ứng dụng|phần mềm]] để truy cập thông tin trên World Wide Web. Để kết nối với [[Máy chủ web|máy chủ]] của trang web và hiển thị các trang của nó, người dùng cần phải có chương trình trình duyệt web. Đây là chương trình mà người dùng chạy để tải xuống, định dạng và hiển thị một trang web trên máy tính của người dùng. <ref>{{Chú thích web|url=http://www.differencebetween.net/technology/internet/difference-between-search-engine-and-browser/|title=Difference Between Search Engine and Browser}}</ref>
 
Ngoài việc cho phép người dùng tìm, hiển thị và di chuyển giữa các trang web, trình duyệt web thường sẽ có các tính năng như giữ dấu trang, ghi lịch sử, quản lý cookie (xem bên dưới) và trang chủ và có thể có phương tiện để ghi lại mật khẩu để đăng nhập vào trang web .
 
Các trình duyệt phổ biến nhất là [[Google Chrome|Chrome]] , [[Mozilla Firefox|Firefox]] , [[Safari]] , [[Internet Explorer]] và [[Microsoft Edge|Edge]] .
 
=== Máy chủ web ===
[[Tập tin:Inside_and_Rear_of_Webserver.jpg|phải|nhỏ| Mặt trong và mặt trước của máy chủ web Dell PowerEdge , một máy tính được thiết kế để gắn giá đỡ ]]
Máy ''chủ Web'' là [[Máy chủ|phần mềm máy chủ]] hoặc phần cứng dành riêng để chạy phần mềm nói trên, có thể đáp ứng các yêu cầu máy khách World Wide Web. Nói chung, một máy chủ web có thể chứa một hoặc nhiều trang web. Một máy chủ web xử lý các yêu cầu mạng đến qua [[Hypertext Transfer Protocol|HTTP]] và một số giao thức liên quan khác. <ref name="new">{{Chú thích web|url=http://www.webdevelopersnotes.com/basics/what_is_web_server.php|title=What is web server?'|author=|first=|date=2010-11-23|website=webdevelopersnotes|archive-url=|archive-date=|dead-url=|access-date=2019-02-01}}</ref>
 
Chức năng chính của máy chủ web là lưu trữ, xử lý và phân phối [[Trang web|các trang web]] cho khách hàng . <ref>{{Chú thích sách|title=Web performance tuning|last=Patrick|first=Killelea|date=2002|publisher=O'Reilly|isbn=978-0596001728|edition=2nd|location=Beijing|pages=264|oclc=49502686}}</ref> Giao tiếp giữa máy khách và máy chủ diễn ra bằng [[Hypertext Transfer Protocol|Giao thức truyền siêu văn bản (HTTP)]] . Các trang được phân phối thường xuyên nhất là các [[HTML|tài liệu HTML]] , có thể bao gồm [[Hình ảnh|hình ảnh]] , biểu định kiểu và [[JavaScript|tập lệnh]] ngoài nội dung văn bản.
[[Tập tin:Wikimedia_Foundation_Servers-8055_35.jpg|nhỏ|275x275px| Nhiều máy chủ web có thể được sử dụng cho một trang web lưu lượng truy cập cao; Tại đây, các máy chủ [[Dell]] được cài đặt cùng nhau đang được sử dụng cho [[Wikimedia Foundation]] . ]]
Tác [[User Agent|nhân người dùng]] , thường là [[Trình duyệt web|trình duyệt web]] hoặc trình thu thập dữ liệu web , bắt đầu giao tiếp bằng cách [[Hypertext Transfer Protocol|yêu cầu]] một tài nguyên cụ thể bằng HTTP và máy chủ phản hồi với nội dung của tài nguyên đó hoặc thông báo lỗi nếu không thể thực hiện được. Tài nguyên thường là một tệp thực trên [[Bộ nhớ|bộ lưu trữ thứ cấp]] của máy chủ, nhưng điều này không nhất thiết phải như vậy và phụ thuộc vào cách máy chủ web được triển khai .
 
Mặc dù chức năng chính là phục vụ nội dung, nhưng việc triển khai HTTP đầy đủ cũng bao gồm các cách nhận nội dung từ khách hàng. Tính năng này được sử dụng để gửi biểu mẫu web , bao gồm việc tải lên tập tin.
 
Nhiều máy chủ web chung cũng hỗ trợ tập lệnh phía máy chủ bằng [[Active Server Pages]] (ASP), [[PHP]] (Bộ xử lý siêu văn bản) hoặc các [[Ngôn ngữ kịch bản|ngôn ngữ tập lệnh khác]] . Điều này có nghĩa là hành vi của máy chủ web có thể được viết thành kịch bản trong các tệp riêng biệt, trong khi phần mềm máy chủ thực tế vẫn không thay đổi. Thông thường, chức năng này được sử dụng để tạo các tài liệu HTML một cách linh hoạt ("đang hoạt động") thay vì trả lại các tài liệu tĩnh . Cái trước chủ yếu được sử dụng để lấy hoặc sửa đổi thông tin từ [[Cơ sở dữ liệu|cơ sở dữ liệu]] . Cái sau thường nhanh hơn nhiều và dễ dàng [[Web caching|lưu vào bộ nhớ cache hơn]] nhưng không thể cung cấp nội dung động .
 
Máy chủ web cũng có thể thường xuyên được tìm thấy [[Hệ thống nhúng|được nhúng]] trong các thiết bị như [[Máy in|máy in]] , [[Router|bộ định tuyến]] , [[webcam]] và chỉ phục vụ một [[Local area network|mạng cục bộ]] . Sau đó, máy chủ web có thể được sử dụng như một phần của hệ thống để theo dõi hoặc quản trị thiết bị được đề cập. Điều này thường có nghĩa là không có phần mềm bổ sung nào phải được cài đặt trên máy khách vì chỉ cần một trình duyệt web (hiện đã có trong hầu hết các [[Hệ điều hành|hệ điều hành]] ).
 
=== Cookie web ===
''Cookie HTTP'' (còn được gọi là ''cookie web'' , ''Internet cookie'' , ''cookie'' ''trình duyệt'' hoặc đơn giản là ''cookie'' ) là một phần nhỏ dữ liệu được gửi từ một trang web và được [[Trình duyệt web|trình duyệt web]] của người dùng lưu trữ trên máy tính của người dùng trong khi người dùng đang duyệt. Cookies được thiết kế để trở thành một cơ chế đáng tin cậy để các trang web ghi nhớ thông tin [[Trạng thái (khoa học máy tính)|trạng thái]] (như các mục được thêm vào giỏ hàng trong cửa hàng trực tuyến) hoặc để ghi lại hoạt động duyệt của người dùng (bao gồm nhấp vào nút cụ thể, [[Điều khiển truy cập|đăng nhập]] hoặc ghi lại trang nào đã được truy cập trong quá khứ). Chúng cũng có thể được sử dụng để ghi nhớ các mẩu thông tin tùy ý mà người dùng trước đây đã nhập vào các trường mẫu như tên, địa chỉ, mật khẩu và số thẻ tín dụng.
 
Các loại cookie khác thực hiện các chức năng thiết yếu trong web hiện đại. Có lẽ quan trọng nhất, ''cookie xác thực'' là phương pháp phổ biến nhất được sử dụng bởi các máy chủ web để biết liệu người dùng có đăng nhập hay không và họ đăng nhập vào tài khoản nào. Nếu không có cơ chế như vậy, trang web sẽ không biết nên gửi một trang có chứa thông tin nhạy cảm hay yêu cầu người dùng tự xác thực bằng cách đăng nhập. Tính bảo mật của cookie xác thực thường phụ thuộc vào bảo mật của trang web phát hành và [[So sánh các trình duyệt web|trình duyệt web]] của người dùng và vào việc dữ liệu cookie có được mã hóa hay không. Các lỗ hổng bảo mật có thể cho phép [[Hacker (an ninh máy tính)|hacker]] đọc dữ liệu của cookie, được sử dụng để có quyền truy cập vào dữ liệu người dùng hoặc được sử dụng để có quyền truy cập (với thông tin xác thực của người dùng) vào trang web có cookie (xem kịch bản chéo và chéo trang trang web yêu cầu giả mạo). <ref>{{Chú thích web|url=http://news.cnet.com/8301-10789_3-9918582-57.html|title=Gmail cookie stolen via Google Spreadsheets|author=Vamosi|first=Robert|date=2008-04-14|website=News.cnet.com|access-date=19 October 2017}}</ref>
 
Cookie theo dõi, và đặc biệt là [[World Wide Web|cookie theo dõi của bên thứ ba]] , thường được sử dụng làm cách để lập hồ sơ dài hạn về lịch sử duyệt web của cá nhân {{En dash}} mối lo ngại về quyền riêng tư khiến Châu Âu <ref>{{Chú thích web|url=http://webcookies.org/faq/#Directive|title=What about the "EU Cookie Directive"?|year=2013|publisher=WebCookies.org|access-date=19 October 2017}}</ref> và các nhà lập pháp Hoa Kỳ phải hành động vào năm 2011. <ref name="eulaw">{{Chú thích báo|url=https://www.bbc.co.uk/news/technology-12668552|title=New net rules set to make cookies crumble|date=2011-03-08|work=BBC}}</ref> <ref>{{Chú thích web|url=http://adage.com/article/digital/sen-rockefeller-ready-a-real-track-bill/227426/|title=Sen. Rockefeller: Get Ready for a Real Do-Not-Track Bill for Online Advertising|date=2011-05-06|website=Adage.com}}</ref> Luật pháp châu Âu yêu cầu tất cả các trang web nhắm mục tiêu đến [[Liên minh châu Âu|các]] quốc gia thành viên [[Liên minh châu Âu|Liên minh châu Âu phải có]] được "sự đồng ý" từ người dùng trước khi lưu trữ cookie không cần thiết trên thiết bị của họ.
 
Nhà nghiên cứu của Google Project Zero, Jann Horn mô tả cách các cookie có thể được đọc bởi [[Tấn công xen giữa|các trung gian]] , như [[Wi-Fi|các]] nhà cung cấp điểm truy cập [[Wi-Fi]] . Ông khuyến nghị sử dụng trình duyệt ở chế độ ẩn danh trong những trường hợp như vậy. <ref> [https://thejh.net/written-stuff/want-to-use-my-wifi? Bạn muốn sử dụng wifi của tôi?] , Jann Horn, truy cập 2018-01-05. </ref>
 
=== Máy tìm kiếm ===
[[Tập tin:Mayflower_Wikimedia_Commons_image_search_engine_screenshot.png|nhỏ| Kết quả tìm kiếm cụm từ "nguyệt thực" trong công cụ tìm kiếm hình ảnh dựa trên web ]]
Công ''cụ tìm kiếm web'' hoặc ''công cụ tìm kiếm Internet'' là một [[Hệ thống phần mềm|hệ thống phần mềm]] được thiết kế để thực hiện ''tìm kiếm trên web'' ( ''tìm kiếm Internet'' ), có nghĩa là tìm kiếm World Wide Web theo cách có hệ thống để biết thông tin cụ thể được chỉ định trong truy vấn tìm kiếm trên web . Các kết quả tìm kiếm thường được trình bày trong một dòng kết quả, thường được gọi là các trang kết quả của công cụ tìm kiếm (SERPs). Thông tin có thể là một hỗn hợp của [[Trang web|các trang web]] , hình ảnh, video, infographics, bài viết, tài liệu nghiên cứu và các loại tệp khác. Một số công cụ tìm kiếm cũng [[Khai phá dữ liệu|khai thác dữ liệu]] có sẵn trong [[Cơ sở dữ liệu|cơ sở dữ liệu]] hoặc thư mục mở . Không giống như các thư mục web , được duy trì bởi các biên tập viên của con người, các công cụ tìm kiếm cũng duy trì thông tin theo [[Hệ thống thời gian thực|thời gian thực]] bằng cách chạy một [[Thuật toán|thuật toán]] trên trình thu thập dữ liệu web . Nội dung Internet không có khả năng được tìm kiếm bởi một công cụ tìm kiếm web thường được mô tả là [[Web chìm|web sâu]] .
 
=== Deep web ===
Web sâu, <ref name="nhamilton">{{Chú thích tạp chí|last=Hamilton|first=Nigel|title=The Mechanics of a Deep Net Metasearch Engine|citeseerx=10.1.1.90.5847}}</ref> ''web vô hình'' , <ref name="jal">{{Chú thích tạp chí|last=Devine|first=Jane|last2=Egger-Sider|first2=Francine|date=July 2004|title=Beyond google: the invisible web in the academic library|journal=The Journal of Academic Librarianship|volume=30|issue=4|pages=265–269|doi=10.1016/j.acalib.2004.04.010}}</ref> hoặc ''web ẩn'' <ref name="cthw">{{Chú thích tạp chí|last=Raghavan|first=Sriram|last2=Garcia-Molina|first2=Hector|date=September 11–14, 2001|title=Crawling the Hidden Web|url=http://ilpubs.stanford.edu:8090/725/|journal=27th International Conference on Very Large Data Bases}}</ref> là một phần của World Wide Web có nội dung không được lập chỉ mục bởi [[Máy truy tìm dữ liệu|các công cụ tìm kiếm web]] tiêu chuẩn. Thuật ngữ ngược lại với web sâu là [[Mạng nổi|web bề mặt]] , có thể truy cập được đối với bất kỳ ai sử dụng Internet. <ref>{{Chú thích web|url=https://www.computerhope.com/jargon/s/surface-web.htm|title=Surface Web|publisher=Computer Hope|access-date=June 20, 2018}}</ref> [[Khoa học máy tính|Nhà khoa học máy tính]] Michael K. Bergman được cho là đã đặt ra thuật ngữ ''deep web'' vào năm 2001 như một thuật ngữ lập chỉ mục tìm kiếm. <ref name="wright2009"> <cite class="citation news">Wright, Alex (2009-2-22). [https://www.nytimes.com/2009/02/23/technology/internet/23search.html?th&emc=th "Khám phá một 'Deep Web' mà Google không thể nắm bắt được"] . ''Thời báo New York'' <span class="reference-accessdate">. Truy cập <span class="nowrap">2009-02-23</span></span> .</cite> <templatestyles src="Module:Citation/CS1/styles.css"></templatestyles></ref>
 
Nội dung của web sâu được ẩn đằng sau [[Hypertext Transfer Protocol|các]] biểu mẫu [[Hypertext Transfer Protocol|HTTP]] , <ref> Madhavan, J., Ko, D., Kot, Ł., Ganapathy, V., Rasmussen, A., & Halevy, A. (2008). Thu thập dữ liệu web sâu của Google. Thủ tục tố tụng của VLDB, 1 (2), 1241 Tiết52. </ref> <ref>{{Chú thích web|url=https://www.questia.com/article/1G1-370513892/how-do-you-want-me-to-do-it-does-it-have-to-look|title=How Do You Want Me to Do It? Does It Have to Look like an Accident? – an Assassin Selling a Hit on the Net; Revealed Inside the Deep Web|author=Shedden|first=Sam|date=June 8, 2014|via=[[Questia]]|access-date=May 5, 2017|subscription=yes}}</ref> và bao gồm nhiều cách sử dụng rất phổ biến như [[Email trên nền web|thư trên web]] , [[Internet Banking|ngân hàng trực tuyến]] và các dịch vụ mà người dùng phải trả tiền và được bảo vệ bởi một tường trả tiền, [[Video theo yêu cầu|video theo yêu cầu]] , một số tạp chí và báo trực tuyến, trong số những người khác.
 
Nội dung của web sâu có thể được định vị và truy cập bằng một [[Địa chỉ IP|địa chỉ]] [[URL]] hoặc [[Địa chỉ IP|IP]] trực tiếp và có thể yêu cầu mật khẩu hoặc quyền truy cập bảo mật khác qua trang web công cộng.