Các công cụ tìm kiếm index website như thế nào ?
Tìm hiểu về:
- Web index là gì?
- Thu thập thông tin
- Cache là gì và làm thế nào để kiểm tra bản cahe của một trang web ?
Một khi máy tìm kiếm đã dò quét trang web , chúng cần lưu
tất cả những nội dung này vào cơ sở dữ liệu của mình. Tất cả những thông tin
này được tổ chức lại và đặt trong tình trạng sẵn sàng cung cấp cho người dùng
khi họ tìm kiếm.
1.Cơ sở dữ liệu web (web index ) là gì?
- W eb index là cơ sở dữ liệu lưu trử các trang web.Các máy tìm kiếm sử dụng hàng nghìn máy chủ đặt khắp nơi trên thế giới để lưu trử nhiều tỉ trang web trong cơ sở dữ liệu của mình.Việc này đảm bảo người tìm kiếm nhận được kết quả gần như ngay lập tức sau khi họ nhấn nút enter
2. Lấy thông tin
- Khi một người dùng tìm kiếm với một từ khóa, các máy tìm kiếm sẽ vào cơ sở dữ liệu của mình và lấy ra các trang web cùng chủ đề chứa từ tìm kiếm hoặc chứa những từ liên quan. Từ đây rút ra được, để tăng độ liên quan của trang web đến từ khóa bạn muốn hướng tới, bạn cần biết chèn từ khóa một cách hợp lý ở những vị trí quan trọng .
- Làm thế nào máy tìm kiếm biết được nội dung trang web có liên quan đến từ khóa đang được tìm kiếm
a. Sử dụng từ khóa
- Máy tìm kiếm tìm xem trong nội dung của trang web có chứa từ khóa đang được tìm kiếm hay không ?
b. Tấn suất xuất hiện * tần số nghịch của từ trong văn bản
- Tần số xuất hiện là số lần xuất hiện của từ khóa trong văn bản. Tần số nghịch là tỷ lệ giữa mức độ phổ biến của một từ trên trang web đó với mức độ phổ trung bình trên mọi trang web.
3. Caching
- Để sử dụng hiệu quả nguồn tài nguyên của mình, các máy tìm kiếm sẽ tiến hành copy nội dung trang web của bạn về máy chủ của họ để dùng cho việc đánh giá thứ hạng. Những bản copy nội dung trang web này được gọi là bản cache. Ví nội dung trang web thường được cập nhật nên máy tìm kiếm thường phải quay trở lại để copy nội dung. Tần suất có thể là từ cài tiếng/1 lần đến vài ngày/1 lần hoặc thậm chí lâu hơn. Điều này có nghĩa nội dung của bản cache có thể khác biệt với nội dung hiện tại của trang web.
- Điều này sẽ lý giải thực tế vì sao: thứ hạng của website không thay đổi mặc dù bạn đã tiến hành tối ưu nó. Thực tế, máy tìm kiếm vẫn đánh giá website dựa trên bản cache cũ, chỉ đến khi nó download nội dung mới- hay tạo bản cache mời thì thứ hạng website của bạn mới thay đổi. Ví dụ, khi bạn bổ sung thêm nội dung để nhắm đến những từ khóa khác, bạn không thể ngay lập tức thấy sự cải thiện về thứ hạng cho đến khi máy tìm kiếm ghé thăm website của bạn lần tới, thấy được nội dung mới và lưu những nội dung này vào bản cache mới của trang web
4. Cách kiểm tra bản cache của trang web
- Nếu bạn dùng google chrome, bạn có thể dùng lệnh sau:
Cache:seoin24h.blogspot.com
- Bạn cũng có thể kiểm tra phiên bản chỉ chứa text hay chữ, phim bản google nhìn thấy.Việc này sẽ giúp bạn biết thực tế google có thể thấy những gì trên trang web của bạn