Hiện nay có rất nhiều website phải đối mặt với vấn đề lập chỉ mục với Google. Sau khi đào sâu vào vấn đề này, tôi muốn viết một bài để chia sẻ kinh nghiệm của tôi để những người khác không cần phải dành nhiều thời gian đào cho câu trả lời cho vấn đề lập chỉ mục trên google.
Nếu website bạn không được lập chỉ mục tại Google tức là hầu như không có lượt truy cập nào mới đến từ Google tìm kiếm.
Thông thường thì website sẽ gặp một số lỗi sau:
Robots.txt – tập tin văn bản này mà nằm trong thư mục gốc của trang web sẽ hướng dẫn spider tìm kiếm thu thập dữ liệu. Ví dụ, tập tin robots.txt của website có dòng này trong đó; User-agent: * Disallow: /
.htaccess – Đây là một tập tin vô hình và cũng nằm trong WWW hoặc thư mục public_html. Bạn có thể chuyển đổi trong soạn thảo văn bản và FTP. Một htaccess được cấu hình xấu có thể làm những thứ khó chịu như vòng lặp vô hạn, và sẽ không bao giờ tải trang web của bạn.
Meta Tags – Hãy chắc chắn rằng các trang bạn muốn index sẽ không có các thẻ meta này trong mã nguồn: <META NAME = “robot” CONTENT = “noindex, nofollow”>
Sơ đồ trang web – lý do có thể do sitemap của website không được cập nhật. Luôn luôn kiểm tra, sau khi bạn đã giải quyết các vấn đề đã được chỉ ra cho website trong các công cụ quản trị trang web bảng điều khiển, là website đã chạy một sitemap mới và cập nhật tại webmaster tool.
Các thông số URL – Trong Webmaster Tools có một phần mà bạn có thể thiết lập các thông số URL mà nói với Google những gì liên kết năng động, bạn không muốn để có được lập chỉ mục. Tuy nhiên, điều này đi kèm với một cảnh báo từ Google: “Không chính xác cấu hình các thông số có thể dẫn đến các trang từ trang web của bạn được giảm từ chỉ số của chúng tôi, vì vậy chúng tôi không khuyên bạn sử dụng công cụ này trừ khi cần thiết.”
Bạn không có đủ Pagerank -Matt Cutts tiết lộ trong một cuộc phỏng vấn với Eric Enge rằng số lượng trang Google thu thập thông là tỷ lệ với pagerank của bạn.
Khả năng kết nối hoặc các vấn đề DNS – Có thể vì lý do gì đó spider của Google không thể tiếp cận máy chủ của website khi các spider cố gắng tìm kiếm và thu thập dữ liệu.
Vấn đề thừa kế – Bạn mới mua 1 tên miền mới, nhưng trước kia nó đã được sử dụng với người dùng khác. Tên miền đó có thể bị Google phạt hoặc nội dung xấu. Bạn viết nội dung tốt, submit những thứ trên trang, một vài liên kết tốt cho website, nhưng Google vẫn từ chối lập chỉ mục chúng, mặc dù nó được chấp nhận sitemap của họ. Lý do Google không index website của bạn có lẽ là do lượng backlink xấu đổ về website của bạn có từ khi nó còn thuộc sở hữu của chủ cũ. Nếu bị phạt như vậy, quản trị web phải nộp đơn yêu cầu xem xét lại với Google.