Khác biệt giữa bản sửa đổi của “Máy truy tìm dữ liệu”
Nội dung được xóa Nội dung được thêm vào
n →Liên kết ngoài: clean up, replaced: {{Commonscat → {{thể loại Commons using AWB |
n sửa chính tả, replaced: thí dụ → Ví dụ (21) using AWB |
||
Dòng 45:
* Sự ra đời của các công ty tư vấn về nâng cao thứ hạng cho trang Web: các công ty này sẽ nhận làm các dịch vụ SEO cho thân chủ để đưa thứ hạng các trang đó lên trong danh sách hiển thị trước tiên của các máy truy tìm.
* Các trang Web giả dụng (''page cloaking''): Người thiết kế các trang này sẽ tìm cách cung cấp một nội dung có thể nhận sự phân hạng cao trong các máy truy tìm trong khi thực tế nếu một người dùng Internet truy cập đến địa chỉ này (qua trang trả về của máy truy tìm hay qua việc gõ thẳng địa chỉ vào [[máy truy cập]]) thì trang đó hiển thị một nội dung hoàn toàn khác với sự đánh giá của máy truy cập. Hành động này xuất phát từ ý muốn tăng cường khả năng tiếp thị của một số trang Web.
:''Kỹ thuật đánh lừa các máy truy tìm như trên không quá phức tạp. Một
* Tính tạm thời của SEO: Phương pháp phân hạng các trang Web của các máy truy tìm thường thay đổi theo tình hình phát triển của Internet và của sự thay đổi nội dung của các trang Web. Do đó, một trang Web cố định chỉ có thể được phân hạng cao trong một thời hạn cố định mà thôi. Để một trang Web tiếp tục được giữ thứ hạng cao thì nội dung của nó (hay ít nhất nội dung các thẻ <code>meta</code>) phải thay đổi hoặc là tự trang đó phải được tăng liên kết từ các địa chỉ Web khác tới và đây cũng là chỗ cho các nhà chuyên nghiệp về SEO phục vụ.
* Bảo trợ quảng cáo cho máy truy tìm: Bản thân các máy truy tìm cũng có thể là các cơ quan phục vụ quảng cáo do đó một trong những cách tốt để tăng hiệu quả tiếp thị là tham gia các dịch vụ quảng cáo ngay trên các máy truy tìm.
Dòng 74:
Để mở rộng các chức năng tìm kiếm, cũng như tạo thêm nhiều tiện dụng cho người dùng, các máy truy tìm cũng đã hỗ trợ thêm nhiều phép toán lên từ khóa. Dĩ nhiên mỗi máy có thể sẽ hỗ trợ những phép toán khác nhau. Ở đây chỉ nêu ra các phép toán được hỗ trợ bởi hầu hết các máy truy tìm.
* Dùng phép "'''+'''": Để tìm các trang có mặt tất cả các chữ của từ khóa mà không theo thứ tự nào hết thì viết nối các chữ này với nhau bằng dấu +.
* Dùng phép "'''-'''": Trong số các trang Web tìm được do quy định của từ khóa thì máy truy tìm sẽ loại bỏ các trang mà nội dung của chúng có chứa chữ (hay cụm từ) trong ngoặc kép đứng ngay sau dấu trừ.
* Dùng dấu ngoặc kép '''" "''': Khi muốn chỉ thị máy truy tìm nguyên văn của cụm từ, có thể dùng dấu ngoặc kép.
* Dùng các phép toán của [[đại số Bool]]: Hiện tại, nhiều máy truy tìm hỗ trợ thêm các phép toán như là OR, AND và NOT. Khi dùng thì tên của các phép toán này bắt buộc phải viết chữ in hoa. Phép toán Bool đòi hỏi điền vào đúng vị trí quy định một từ (hay một cụm từ trong ngoặc kép) giữ vai trò của [[toán tử]]. Ngoài ra, đa số máy truy tìm chỉ hoạt động tốt trong một số lượng giới hạn các phép toán Bool cho một bộ từ khoá. Lời khuyên chung là không nên dùng quá 6 phép toán Bool cho cùng một bộ từ khoá và không phải máy truy tìm nào cũng hỗ trợ đầy đủ các phép toán <code>AND, OR </code>hay<code> NOT</code>
** '''OR''': Có cú pháp là <code>(Toán tử 1) OR (Toán tử 2)</code>. Lệnh này cho phép tìm những trang Web nào có chứa ''một trong các toán tử'' của phép toán OR của bộ từ khoá.
** '''AND''': Có cú pháp <code>(Toán tử 1) AND (Toán tử 2)</code>. Phép toán AND nhằm yêu cầu máy truy tìm kiếm các trang có sự hiện diện của tất cả các toán tử.
** '''NOT''': Phép này hoàn toàn tương tự như cách dùng dấu -. Nghĩa là, sự truy tìm sẽ loại bỏ những trang mà nội dung có chứa toán tử đứng ngay sau phép toán NOT. Tuy nhiên trong nhiều máy truy tìm có hỗ trợ thì phép này cũng chỉ được dùng có một lần cho một bộ từ khoá. Thí dụ để tìm tài liệu hướng dẫn về [[ngôn ngữ lập trình]] C/C++ có thể thử dùng trên Altavista<br /><code>"C/C++ tutor" NOT book</code><br />Các trang có thể dùng NOT là ''AOL Search, Excite, Inktomi (HotBot, MSN), Northern Light và Gigablast.''
* Dùng phép '''NEAR''': Dùng để truy tìm những trang Web mà nội dung của chúng có các thành tố của từ khoá nằm gần nhau. Phép toán này rất có lợi để tìm ra những trang có một cụm từ, một khái niệm, một định nghĩa hay một lời phát biểu mà bạn không nhớ hết được. Ví dụ: Tìm lại nguyên văn câu thơ và tác giả bằng bộ từ khoá:<br /><code>"Ong non" NEAR "Dê cỏn"</code>
* Dùng dấu ngoặc đơn '''()''' để chẻ nhánh. Dùng ngoặc đơn cho phép tìm nhiều kết hợp phức tạp.
* Lưu ý:
*# Trong mọi trường hợp thì từ khoá sai chính tả sẽ không thể có hiệu quả.
Dòng 93:
Các từ khoá mặc định kết thúc bằng dấu hai chấm ''':''' và chữ (hay cụm từ trong ngoặc kép) của bộ từ khoá nào đứng ngay sau dấu này sẽ bị chi phối bởi điều kiện của từ khoá mặc định, còn các thành phần khác trong từ khoá sẽ không thay đổi ý nghĩa.
* Các từ khoá mặc định giới hạn máy truy tìm trả về các trang nằm trong một tên miền, hay một miền con. Tuỳ theo máy truy tìm mà các từ khoá mặc định được sử dụng.
*# ''Altavista'' hỗ trợ chức năng này bằng từ khoá <code>host:</code>.
*# ''Excite, Google (Netscape, Yahoo)'' hỗ trợ chức năng này bằng từ khoá <code>site:</code>, khi kết hợp với các lệnh khác có thể tìm theo cách chuyên biệt.
*# ''Inktomi (HotBot, iWon, LookSmart)'' hỗ trợ chức năng này bằng từ khoá <code> domain:</code>.
*# ''AllTheWeb'' hỗ trợ các từ khoá <code>domain, url, site:</code> cho chức năng này.
* Các từ khoá mặc định dùng để tìm trang có tựa đề chứa một từ (hay cụm từ) đặc biệt:
*# ''AltaVista, AllTheWeb, Inktomi (MSN và HotBot)'' dùng từ khoá <code>title:</code>.
*# ''Google và Teoma'' hỗ trợ các từ khoá <code>intitle:</code> và <code>allintitle:</code> ("allintitle:" sẽ ảnh hưởng đến tất cả các chữ đứng sau dấu ''':''').
* Các từ khoá dùng để tìm các địa chỉ Web nào có chứa từ (hay cụm từ) của bộ từ khoá:
*# ''Google'' hỗ trợ từ khoá <code>inurl:</code> và <code>allinurl:</code>.
*#* Muốn tìm địa chỉ các trang Web có một chữ đặc biệt thì dùng inurl.
*#* Nếu cần truy tìm một địa chỉ có nhiều hơn một chữ thì dùng allinurl.
*# ''Inktomi, AOL, GoTo, HotBot'' cung cấp từ khoá <code>originurl:</code> cho việc này.
*# ''Yahoo'' thì dùng từ khoá u:
*# ''Exite'' dùng url:
* Các từ khoá mặc định giúp tìm các trang có cài đặt các liên kết tới địa chỉ trang được ghi trong từ khoá:
*# ''Google, Yahoo'' sẽ cung cấp từ khoá <code>link:</code>. Tuy nhiên, Yahoo yêu cầu địa chỉ trong từ khoá phải có đủ tiếp đầu ngữ <code><nowiki>http://</nowiki></code> thì mới hoạt động hữu hiệu.
*# ''MSN'' hỗ trợ chức năng này bằng từ khoá <code>linkdomain:</code>
* Ngoài ra, để truy tìm các loại tệp có định dạng (''format'') đặc biệt thì có thể dùng từ khoá <code>filetype:(đuôi của tập tin)</code>:
*# Google: sẽ hỗ trợ truy tìm các kiểu tệp: PDF, Word (.doc), Excel (.xls), PowerPoint (.ppt) và Rich Text Format (.rtf) cũng như PostScript (.ps), Text (.txt), HTML (.htm hay.html), WordPerfect (.wpd) và các đuôi khác...
*# ''Yahoo'' cho phép tìm HTML (htm hay html), PDF, Excel (.xls), PowerPoint (.ppt), Word (.doc), RSS/XML (.xml) và tập tin văn bản dạng (.txt).
*# ''MSN'' chỉ hỗ trợ chuyên tìm các loại tệp: HTML, PDF, PowerPoint (.pps hay.ppt), các dạng của Word, hay Excel.
Dòng 119:
'''[[Kí tự thay thế]]''' (''wildcard character'') được hiểu là một [[kí tự]] có thể dùng để thay thế, hay đại diện cho một tập hợp con của tập các kí tự chưa được xác định hoàn toàn. Một cách đơn giản hơn, kí tự thay thế là kí tự được dùng để đại diện cho một kí tự, hay một chuỗi kí tự trong một từ khoá, mệnh đề, câu hay dãy các kí tự.
Nhiều máy truy tìm hỗ trợ cho việc sử dụng hai loại kí tự thay thế. Đó là dấu sao <code>*</code> và dấu chấm hỏi <code>?</code>
* Dấu sao <code>'''*'''</code>: dấu này sẽ thay thế cho một dãy bất kì các kí tự (chữ, số, hay dấu).
* Dấu chấm hỏi '''?''': dùng thay cho một kí tự duy nhất nào đó.
'''Dấu ngã <code>~</code>''': Đặc biệt trong Google có một cách để tìm không những các trang có chứa từ khoá mà còn tìm các trang có chứa chữ đồng nghĩa (''synonym'') Anh ngữ với từ khoá. Ví dụ, <code>~food facts</code> sẽ giúp truy tìm các dữ liệu có chữ "food facts" và các chữ tương đương như "nutrition facts",... Sự truy tìm theo hỗ trợ này đặc biệt hữu dụng trong trường hợp các tài liệu cần tìm quá hiếm hoi.
Dòng 139:
== Sử dụng các chức năng đặc biệt của máy truy tìm ==
Các máy truy tìm có thể cung cấp thêm một số phương tiện để giảm thiểu khó khăn của việc truy tìm. Sau đây là vài chức năng đặc biệt
* Tìm thêm dữ liệu theo liên hệ (''related search''): Sau khi tìm kiếm, máy truy tìm có thể giúp đào sâu sự truy tìm bằng cách cung cấp các bộ từ khoá chi tiết hơn dưới dạng các dòng liên kết (''link''). Các liên kết này thu nhỏ thị trường tìm kiếm (nếu số trang tìm theo từ khoá quá lớn). Thực ra, nếu cách chọn từ khoá đủ tập trung và khéo thì sẽ không phải mượn đến chức năng này.
* Nhóm gọn (''cluster''): trong lúc tìm kiếm nếu máy truy tìm cho rằng các trang tìm ra có thể ở chung một trang nguồn thì nó chỉ chọn ra một trang đại diện, còn các trang khác sẽ được xếp gọn vào và người dùng có thể khai triển rộng ra thành nhiều trang nếu muốn. Như vậy, sự tìm kiếm sẽ dễ hơn và ít bị nhiễu loạn thông tin của cùng một trang.<br />Những trang có chức năng này là: ''AltaVista (<code>Additional relevant pages from this site</code>), AllTheWeb (<code>more hits from</code>), Excite, Google (<code>More results from</code>), HotBot, MSN, Northern Light''.
* Trang tương tự và trang có chính tả gần giống: Trong một số trường hợp thì chức năng tìm các trang tương tự như các trang mà máy truy tìm cho rằng có thể hữu dụng. Để dùng chức năng này chỉ việc bấm vào liên kết tương ứng. Riêng trong Google thì còn có link gợi ý thêm hay sửa chính tả cho việc truy tìm bằng chữ "<code>Did you mean...</code>"<br />Các trang có chức năng tìm trang Web tương tự là: ''AltaVista (<code>similar pages, related pages</code>), AOL Search (<code>Show me more like this</code>), Google (<code>did you mean, similar pages</code>).
[[Tập tin:chucnangnangcao.jpg|nhỏ|400px|phải|Các chức năng đặc biệt của máy truy tìm Google]]
* Trang có từ nối dài (''stemming''): Đây là khả năng của một số máy truy tìm cho phép tìm những trang có những chữ mở rộng của chữ trong từ khoá.
* Chức năng tồn trữ (<code>''cached''<code>) của Google: Có nhiều trường hợp trang Web đã bị xoá không thể hiển thị được nữa nhưng thông tin của nó trong cơ sở dữ liệu của máy truy tìm vẫn còn mà người dùng có thể cần đến. Trong thời gian các tin tức này chưa bị xoá khỏi cơ sở dữ liệu thì vẫn có thể đọc được nó nhờ vào chức năng đặc biệt này của Google.
* Chuyển dịch (''translation''): Một số trang cho khả năng dịch lại trang tìm thấy sang thứ tiếng mà người dùng đang có. Thường thì chỉ có dịch được ra các thứ tiếng thông dụng như Anh, Pháp, Đức, hay Tây Ban Nha và sự chuyển dịch này cũng không chính xác hoàn toàn. Dù vậy, người dùng có thể nắm được một phần thông tin có thể dịch ra.<br /> Các trang có chức năng chuyển dịch là: ''AltaVista (<code>Translate</code>), Google(<code>Translate this page</code>)''.
Dòng 175:
=== Tài liệu tham khảo ===
* Truy tìm định nghĩa, khái niệm, tài liệu tham khảo hay dịch nghĩa:<br />Nếu chỉ muốn biết chính tả thì có thể dùng từ đó làm từ khoá và gõ vào Google rồi đọc chức năng hỗ trợ có dòng <code>"did you mean"</code>. Đây là chức năng có khả năng chỉnh chính tả.<br /> Nếu để tra ý nghĩa chữ, khái niệm, hay danh từ khoa học thì dùng từ khoá mặc định <code>"define:"</code> trên Google. (
* Truy tìm nghĩa qua các từ điển
** [http://www.yourdictionary.com yourdictionary.com]
|