Spamdexing (còn gọi là thư rác tìm kiếm, công cụ tìm kiếm thư rác hoặc spam web)[1] liên quan đến một số phương thức, chẳng hạn như lặp đi lặp lại các cụm từ không liên quan, để thao tác liên quan hoặc nổi bật của tài nguyên lập chỉ mục của một công cụ tìm kiếm, trong một cách thức không phù hợp với Mục đích của hệ thống lập chỉ mục.[2][3] Một số coi nó là một phần của tối ưu hóa công cụ tìm kiếm, mặc dù có rất nhiều công cụ tìm kiếm tối ưu hóa mà phương pháp nâng cao chất lượng và sự xuất hiện của các nội dung của những trang web và phục vụ nội dung hữu ích cho nhiều người người sử dụng.[4] Công cụ tìm kiếm sử dụng một loạt các thuật toán để xác định thứ hạng liên quan. Một số trong số này bao gồm xác định xem các thuật ngữ tìm kiếm xuất hiện trong META từ khóa từ khóa, những người khác cho dù các thuật ngữ tìm kiếm xuất hiện trong cơ thể văn bản hoặc URL của một trang web. Nhiều công cụ tìm kiếm kiểm tra các trường hợp của spamdexing và sẽ loại bỏ các trang nghi ngờ từ chỉ số của họ. Ngoài ra, những người làm việc cho một tổ chức động cơ tìm kiếm nhanh chóng có thể chặn các kết quả niêm yết toàn bộ từ các trang web có sử dụng spamdexing, có lẽ cảnh báo của các khiếu nại của người sử dụng sai trận. Sự gia tăng của spamdexing trong những năm 1990 đã làm cho công cụ tìm kiếm hàng đầu thời điểm đó kém hữu ích hơn.[5]

Kĩ thuật thường gặp có thể được phân thành hai loại: nội dung thư rác (hoặc hạn thư rác)[4] và liên kết thư rác.[3]

Lịch sử sửa

Từ những năm con người biết đến các công cụ tìm kiếm và sự phổ biến của nó - người ta đã biết thế nào là Spamdexing.

Nhồi nhét từ khóa sửa

Điều này liên quan đến việc tính toán vị trí của các từ khóa trong một trang để nâng cao tính cạnh tranh, đa dạng, và mật độ của trang. Điều này rất hữu ích để làm cho một trang xuất hiện để được có liên quan cho một trình thu thập web trong một cách mà làm cho nó nhiều khả năng được tìm thấy. Ví dụ: Một người buôn bán bất động sản làm ra một trang web và nhồi hàng ngàn từ khóa liên quan đến ca sĩ nhằm thu hút các fan hâm mộ ghé qua trang của ông. phiên bản cũ của chương trình lập chỉ mục đơn giản là tính cách thường xuyên một từ khoá xuất hiện, và được sử dụng mà để xác định mức độ phù hợp. Hầu hết các công cụ tìm kiếm hiện đại có khả năng phân tích một trang để nhồi từ khoá và xác định xem liệu tần số phù hợp với các trang web khác tạo đặc biệt để thu hút lưu lượng truy cập công cụ tìm kiếm. Ngoài ra, các trang web lớn được cắt ngắn, vì vậy mà các danh sách từ điển lớn có thể không được lập chỉ mục trên một trang web duy nhất.

Ẩn các từ khóa sửa

Điều này là không liên quan văn bản được chèn vào bằng cách ngụy trang từ khoá và cụm từ bằng cách làm cho chúng cùng một màu sắc như là nền, sử dụng cỡ chữ nhỏ, hoặc ẩn chúng trong HTML code như là "không có khung" phần, thuộc tính ALT, zero-width/height DIVs, và "no script". Tuy nhiên, văn bản ẩn không phải luôn luôn spamdexing: nó cũng có thể được sử dụng để tăng cường khả năng tiếp cận. Người sàng lọc các trang web cho một công ty động cơ tìm kiếm có thể tạm thời hoặc vĩnh viễn chặn toàn bộ trang web để có văn bản vô hình trên một số trang web.

Spam blog sửa

Spam blog, còn được gọi là autoblogs, là blog giả tạo ra chỉ để gửi. Chúng sẽ tự động đăng bài để tạo các backlink.

Tham khảo sửa

  1. ^ SearchEngineLand, Danny Sullivan's video explanation of Search Engine Spam, October 2008 Lưu trữ 2008-12-17 tại Wayback Machine . Retrieved 2008-11-13.
  2. ^ "Word Spy - spamdexing" (definition), March 2003, webpage:WordSpy-spamdexing Lưu trữ 2014-07-18 tại Wayback Machine.
  3. ^ a b Gyöngyi, Zoltán; Garcia-Molina, Hector (2005), “Web spam taxonomy” (PDF), Proceedings of the First International Workshop on Adversarial Information Retrieval on the Web (AIRWeb), 2005 in The 14th International World Wide Web Conference (WWW 2005) May 10, (Tue)-14 (Sat), 2005, Nippon Convention Center (Makuhari Messe), Chiba, Japan., New York, NY: ACM Press, ISBN 1-59593-046-9
  4. ^ a b Ntoulas, Alexandros; Manasse, Mark; Najork, Marc; Fetterly, Dennis (2006), “Detecting Spam Web Pages through Content Analysis”, The 15th International World Wide Web Conference (WWW 2006) May 23–26, 2006, Edinburgh, Scotland., New York, NY: ACM Press, ISBN 1-59593-323-9
  5. ^ Smarty, Ann (17 tháng 12 năm 2008). “What Is BlackHat SEO? 5 Definitions”. Search Engine Journal. Truy cập ngày 5 tháng 7 năm 2012.