Tổng quát về các máy tìm kiếm- search engine
Máy tìm kiếm google |
Tìm hiểu về
- World Wide Web là gì ?
- Lịch sử và vai trò của công cụ tìm kiếm
- Sơ lược về dò quét, tạo chỉ mục và xây dựng thứ hạng
- Những tiến bộ gần đây của các công cụ tìm kiếm
1. World Wide Web là gì ?
Về cơ bản, thế giới web là tập hợp các trang web và các file
(thuộc rất nhiều định dạng khác nhau ) được liên kết với nhau bởi hệ thống phức
tạp của các liên kết hay links .
Các file trên thế giới web này có thể thuộc những định dạng
sau:
- Hình ảnh
- Videos
- File pdf
- Video Flash
- File Javascript
Với nhiều định dạng file khác nhau, nội dung trang web trở
nên hấp dẫn hơn, thay vì thuần túy là văn bản. Việc này gây khó khăn cho search engine, đặc biệt vào thời điểm nó mới ra đời. Một phần vì kỹ thuật dò quét chưa
thực sự phát triển.
Cho đến ngày nay, máy tìm kiếm vẫn gặp khó khăn với một vài
định dạng file. Là một người làm SEO, bạn cần biết những định dạng file nào
mà máy tìm kiếm gặp khó khăn để không đưa những nội dung quan trọng vào các
file này .
2. Lịch sử và vai trò của các máy tìm kiếm
- Thế giới web mới ra đời trong hơn 20 năm. Ngày đó, máy tìm kiếm vẫn chưa ra đời- các website được biết đến chỉ nhờ truyền miệng, hoặc nhờ một trang web danh bạ chứa địa chỉ của tất cả các trang web khác (web hub ). Khi thế giới internet vẫn còn nhỏ, việc này không vấn đề gì. Nhưng khi thế giới này mở rộng mạnh mẽ vào những năm tiếp theo, một giải pháp mới là điều bắt buộc
- Trong suốt 1993/1994, những máy tìm kiếm đầu tiên đã ra đời bao gồm Excite, AltaVista và Yahoo!. Số lượng các trang web và người dùng tăng lên mạnh mẽ đến mức mà những trang web hub trở nên quá tải và không còn hiệu quả.
- Năm 1996 , google ra đời. Đây là máy tìm kiếm đầu tiên nhận ra sứ mạnh và vai trò của liên kết và sử dụng chúng để đánh giá độ uy tín của trang web. Đây chính là bước độ phá giúp tăng chất lượng bảng kết quả tìm kiếm .
3. công việc chính của máy tìm kiếm: Dò quét , xây dựng cơ sở
dữ liệu và xếp hạng
Về cơ bản:
- Dò quét: lá quá trình máy tìm kiếm đi tìm những nội dung mới. Họ sử dụng những phần mếm có thể tự động ghé thăm các website và lần theo liên kết trên các trang web để tìm ra những nội dung khác
- Xây dựng cơ sở dữ liệu: Các máy tìm kiếm copy nội dung của các trang web mà chúng đã ghé thăm. Dữ liệu này được lưu trữ trên rất nhiều máy tính trong các trung tâm dữ liệu (data center) ở khắp nơi trên thế giới. Điều này giúp cho việc tìm kiếm trở nên nhanh chóng, dễ dàng hơn giúp bạn nhận được kết quả chỉ trong 1/2s hoặc ít hơn .
- Xếp hạng : Đây là công việc mà các SEO quan tâm nhất. Khi một người tìm kiếm online , các cỗ máy này cần một thuật toán để đánh giá trang web nhằm xác định trang web nào liên quan nhất và từ đó tính ra thứ hạng của trang web đó trên bảng kết quả
4. Những tiến bộ gần đây của công cụ tìm kiếm
- Bên cạnh đó , kết quả tìm kiếm không phân biệt theo khu vực. Bất kỳ ai trong một đất nước tìm kiếm một sản phẩm hay dịch vụ đều nhận được một bản kết quả như nhau
- Mạng xã hội: Các trang mạng xã hội như facebook và Twitter giúp máy tìm kiếm biết chính xác trang web nào đang được quan tâm. Search engine đã nhanh chóng cập nhật tín hiệu này vào thuật toán. Giúp bảng kết quả trở nên chính xác hơn, cập nhật hơn
- Cá nhân hóa kết quả tìm kiếm: máy tìm kiếm thu thập lịch sử lướt web của người dùng . Lịch sử đó bao gồm: Những cụm từ nào được họ tìm kiếm nhiều, những trang web nào họ hay ghé thăm và ở lại lâu. Từ đó, máy tìm kiếm có thể biết mức độ yêu thích của người dùng đối với các trang web. Kết quả là với cùng một cụm từ, bảng kết quả tìm kiếm của người này sẽ có khác biệt với bảng kết quả của người khác .
- Máy tìm kiếm đã tiến hóa rất nhiều trong những năm gần đây và từ đó thay đổi cách thức tìm kiếm của mọi người, đặc biệt là google. Cổ máy này đã trở nên thông minh hơn rất nhiều nhờ cơ chế tự học cũng như khả năng thu thập dữ liệu vượt trội giúp nó có thể cung cấp kết quả phù hợp nhất với mong muốn người dùng. Sự vượt trội này của Google thể hiện qua 2 tính năng dưới đây:
- Google Suggests : Ra đời từ 8/2008 . Khi bạn bắt đầu gõ , Google sẽ đề xuất từ khóa cho bạn, giúp bạn không mất nhiều thời gian mà vẫn biết được từ khóa nào phù hợp nhất cho mình
- Google Instant : Ra đời 9/2010, Google Instant thay đổi đáng kể cách tìm kiếm bằng cách ngay lập tức cung cấp kết quả dựa trên những ký tự mà người dùng gõ vào. Bạn sẽ thu được kết quả ngay khi gõ mà không cần nhấn enter.