20/1/14

Các yếu tố kỹ thuật trong seo phần 1

 Tìm hiểu về 
  • Vì sao phải nghiên cứu các yếu tố kỹ thuật trong SEO
  • Dò quét và lưu dữ liệu
  • Mã trạng thái HTTP là gì? Chúng được dùng khi nào ?
  • Đường dẫn URL – Cấu trúc và cách tối ưu
  • Trùng lặp nội dung và cách khắc phục
  • Tốc độ site- Tầm quan trọng và cách tối ưu
  • Sitemap và RSS Feeds – Tầm quan trọng và tại sao ?
  • Những lỗi thường gặp
  • Những tool cần biết
 Vì sao phải nghiên cứu các yếu tố kỹ thuật trong SEO
  • Một cách lý tưởng, các máy tìm kiếm có thể tìm ra và hiểu mọi loại nội dung ở bất kỳ đâu trên thế giới web và trả về những kết quả liên quan nhất đến cụm từ tìm kiếm của bạn . Tuy nhiên, xây dựng website là một quá trình phức tạp và không tránh khỏi những thiếu sót.Một vài lỗi thậm chí có thể khiến máy tìm kiếm không tìm ra được website của bạn, hoặc khiến nó không thể có thứ hạng tốt.
  • Để trở thành một người làm SEO giỏi, bạn cần phải biết cách hoạt động của máy tìm kiếm, cách nó tìm ra nội dung mới, cách nó hiểu và xếp hạng trang web của bạn. Điều này sẽ giúp bạn nâng cao chất lượng website hiện có và tránh mắc phải những lỗi mà mọi người thường hay mắc phải.
 Dò quét và lưu dữ liệu
  • Dò quét
  • Sơ đồ website XML
  • Lưu dữ liệu
  • Những rào cản đối với việc dò quét và lưu dữ liệu
JavaScript
Flash
Frames
Cookies
Emulating Googlebot
  • Những loại nội dung khác
  • Hình ảnh
  • File PDF
  • File Microsoft Office
  • Kiểm tra việc lưu dữ liệu
  • Điều khiển hoạt động của bọ tìm kiếm
  • Lựa chọn loại thư mục
  • Sử dụng file Robots.txt
  • Sử dụng Meta Robots  

1.Dò quét
  • Các máy tìm kiếm tìm thấy nội dung nhờ robots ( bọ tìm kiếm, tên tiếng anh là “bots”, “spiders”, “crawlers”) liên tục ghé thăm các website. Chúng đồng thời lần theo đường link trên các website đó để tìm ra các website mới. Những đường link này có thể là link nội bộ, hoặc link trỏ ra ngoài. Nhờ đó bọ tìm kiếm có thể khám phá tất cả các nội dung trên trang web đó, cũng như nội dung của các website khác.
  • Vì vậy, hệ thống link nội bộ của bạn cần phải được thiết kết tối ưu sao cho máy tìm kiếm có thể tìm ra mọi nội dung quan trọng trên website của bạn.Hành động đi theo những đường link để khám phá ra nội dung mới được gọi là “Dò quét”
2.Sơ đồ website XML
  • Máy tìm kiếm khám phá nội dung mới thông qua sơ đồ website XML là danh sách các địa chỉ URL của các trang web. Một website có một hoặc nhiều sitemap XML. Các máy tìm kiếm sẽ lấy ra sitemap này và sử dụng nó để khám phá ra nội dung mới.
  • Sơ đồ website XML giúp máy tìm kiếm dễ dàng khám phá website của bạn, nó không giúp tăng thứ hạng cho website,chỉ giúp bọ tìm kiếm tìm ra nội dung dễ dàng hơn mà thôi.
3.Lưu dữ liệu
  • Khi bọ tìm kiếm tìm ra một trang web, nó đọc đồng thời lưu các nội dung đó cùng với địa chỉ URL của trang web vào hệ thống máy chủ của mình. Quá trình lưu trữ dữ liệu này còn được gọi là indexing
  • Việc google index một trang, cũng giống như việc chúng ta mở một quyền sách hay một tạp chí, photocopy một bài báo nào đó, rồi đặt bản sao đó vào một file có cùng chủ đề với bài báo, nơi bạn có thể tìm lại nó bất cứ khi nào cần đến.
4.Các công nghệ gây khó khăn cho máy tìm kiếm
  • Công nghệ mới giúp tăng chất lượng website, giúp website thân thiện hơn, hấp dẫn hơn với người dùng.Tuy nhiên, chúng cũng gây ra những khó khăn nhất định với máy tìm kiếm cụ thể là các công nghệ dưới dây :
a. Javascript
  • Javascript là ngôn ngữ kịch bản của web. Tất cả các trang web hiện đại đều sử dụng JavaScript nhằm tăng thêm chứ năng cho trang web.
  • Máy tìm kiếm không thể đọc được file Javascript. Có nghĩa nếu nội dung nằm trong JavaScript, nó sẽ vô hình trước máy tìm kiếm. Google cũng không thể đọc được các liên kết nằm nếu chúng nằm trong Javascript. Điều này có nghĩa nếu bạn sử dụng Javascript cho thanh điều hướng chính, toàn bộ cấu trúc site sẽ trở nên vô hình trước máy tìm kiếm
  • Khả năng của google đã được cải thiện nhiều trong việc dò quét file JavaScript , nhưng vẫn chưa đạt đến mức hoàn hảo.Trong khi google đang cố gắng ngày đêm hoàn thiện mình để tăng khả năng đọc hiểu JavaScript, bạn không nên phụ thuộc vào điều này. Bạn cần đảm bảo những nội dung quan trọng nhất của mình đều nằm trong code HTML
b) Fash
  • Google đã có thể hiểu file Flash định dạng .swf tốt hơn trước đây, trong khi vẫn chưa đủ khả năng để đọc hiểu file Flash Video.Tuy google có thể đọc được nội dung Flash, nó vẫn gặp khó khăn trong việc rút ra ý chính của một file Flash từ những hình ảnh riêng lẻ. Đó là do Flash là phim
  • Nên tránh sử dụng Flash bất cứ khi nào có thể . Flash có thể làm cho website của bạn hấp dẫn hơn, sinh động hơn những bạn chỉ nên sử dụng hạn chế.
  • Với sự ra đời và phát triển mạnh mẽ của HTML 5 , bạn càng có ít lý do để sử dụng Flash , vì HTML 5 có đầy đủ chức năng của Flash
c) Frames
  • Nếu trang web của bạn có chứa thẻ <frame> hoặc <iframe> , các máy tìm kiếm cũng sẽ không thể  đọc được nội dung trong các thẻ này.
d) Cookies
  • Cookies là một file để lưu dữ về lịch sử sử dụng internet của người dùng. 
Ví dụ, một cookie có thể được một website sử dụng để ghi nhớ thông tin về bạn, do vậy website đó có thể biết bạn là một người truy cập hoàn toàn mới hay là một người đã từng truy cập trước kia.
  • Nhờ có cookies, giao diện website có thể thay đổi tự động theo người truy cập.
  • Thực tế là cookie có thể ảnh hưởng đến công việc dò quét website của bọ tìm kiếm. Website không thể tạo cookie cho bọ tìm kiếm giống như đã làm cho người dùng.
  • Vì lý do này, bạn không nên phụ thuộc vào cookies. Website của bạn nên được thiết kế để đảm bảo tất các nội dung tốt mà không cần đến cookies .Điều này sẽ cho phép máy tìm kiếm có thể dò quét và lưu trữ tất cả dữ liệu của bạn.
5.Xem website dưới con mắt bọ tìm kiếm
  • Nếu bạn muốn biết trang web của mình trong như thế nào dưới mắt máy tìm kiếm, bạn có thể thực hiện bằng 1 trong 2 cách dưới đây:
I.   Sử dụng google webmaster tools
  • Trước khi sử dụng công cụ này, bạn cần khai báo và chứng minh mình là chử của website này với google webmaster tools
  • 1. Trên trang chủ webmaster tools, đăng nhập vào tài khoản google của bạn, click vào website bạn muốn kiểm tra
  • 2. Trên dashboard (là thanh menu nằm bên trái màn hình ), click vào crawl (dò quét), chọn fetch as google trong menu sổ xuống
  • 3. Trong hộp thoại ở phía trên cùng, gõ vào đường dẫn đến trang web mà bạn muốn kiểm tra
  • 4. Trong danh sách sổ xuống, lựa chọn loại fetch mà bạn muốn. Để xem website trong thế nào dưới mắt của googlebot, chọn web
  • 5. Click fetch
  • Một khi googlebot đã hoàn thành việc fetch trang web của bạn, bạn sẽ nhận được một đường link”success” mà bạn có thể truy cập để xem website dưới con mắt của google
  • Bên cạnh đó, google còn cung cấp cho bạn mã trạng thái cũng như code HTML mà googlebot nhận được
II.Truy cập vào trang web : http://www.seo-browser.com/
  • Và gõ vào địa chỉ trang web bạn cần kiểm tra
6.Những loại nội dung khác
  • Ngoài file HTML, trên website bạn còn tìm thấy nhiều định dạng file khác. Dưới đây là những định dạng phổ biến nhất và cách tối ưu chúng
Hình ảnh
  • Các máy tìm kiếm có thể nhận ra hình ảnh nhưng không thể hiểu hay xem hình ảnh đó như con người. Để hiểu hình ảnh, nó sẽ dựa vào :
1. Thè mô tả ảnh và tên ảnh

2. Chú thích ảnh và nội dung xung quanh ảnh

3. Các liên kết trỏ đến ảnh 
File PDF
  • Máy tìm kiếm có thể dò quét và lưu trữ file PDF. Tuy nhiên, vì file PDF có chức năng khá nghèo nàn và không đẹp như một trang web nên có thể bạn không muốn người dùng tìm đến các file này. Bạn muốn sử dụng các phiên bản HTML thay thế cho các phiên bản PDF
  • Bạn có 2 giải pháp.
Giải pháp 1:
  • Bạn có thể ngăn chặn máy tìm kiếm, không cho nó truy nhập và từ đó ngăn chặn file pdf này xuất hiện trên bảng kết quả tìm kiếm. Việc này có thể thực hiện bằng cách đặt các file PDF vào trong một thư mục (như:/assets/) và không cho bọ tìm kiếm truy cập vào thư mục này thông qua file robots.txt
  • Nhược điểm  : Bạn không thể tận dụng được giá trị các link trỏ đến các file pdf này
Giải pháp 2 :
  •  Chèn tag canonical trỏ tới phiên bản HTML của file PDF này. Việc này đảm bảo file pdf này cũng không xuất hiện trong bảng kết quả tìm kiếm trong khi giá trị của các link trỏ đến file PDF này sẽ không bị mất đi mà sẽ được chuyển sang phiên bản HTML
Chú ý: Cách này chỉ áp dụng với google
Tài liệu Microsoft Office
  • Máy tìm kiếm có thể đọc và lưu trữ những file dạng này. Như bạn đã biết, những file này không cung cấp đầy đủ chức năng cho một trang web nên chắc chắn người dùng không thích chúng.Bạn có thể khắc phục bằng cách chặn nội dung file robots.txt hoặc chèn thẻ canonical trỏ đến phiên bản HTTP
7.Điều khiển hoạt động của bọ tìm kiếm
  • Khi bọ tìm kiếm tìm đến website của bạn, bạn có quyền điều khiển hoạt động của chúng.Trên website của bạn có những nội dung chưa đầy đủ hoặc nội dung riêng tư mà bạn không muốn người khác biết đến. Bạn có thể chặn không cho bọ tìm kiếm đến những nội dung này.
Có 2 công cụ có thể giúp bạn làm điều này :
  1. File Robots.txt cần được đặt trong thư mục gốc để phát huy tác dụng , dùng để chặn bọ tìm kiếm không cho chúng truy cập vào một hoặc nhiều trang web nào đó.
  2. Thẻ meta robots : Đặt trong phần head của 2 trang web và điều khiển cách bọ tìm kiếm tương tác với nội dung cụng như cách hiển thị trang web trên kết quả tìm kiếm

Ebook seo

 The Art of SEO
If your company is going to succeed in the web economy, optimizing your site for search engine visibility is essential. In this book, four of the most noted experts in the field of search engine optimization (SEO) provide you with proven guidelines and cutting-edge techniques for planning and executing a comprehensive SEO strategy. The authors clearly explain SEO fundamentals, while correcting many common misconceptions. How can you make it easier for people to find your website? And how can you convert casual visitors into active users? SEO Warrior shows you how it's done through a collection of tried and true techniques, hacks, and best practices. Learn the nuts and bolts of SEO theory, the importance of keyword strategy, and how to avoid and remedy search engine traps. This book serves as a tutorial, and as a reference guide for implementing effective SEO techniques. This in-depth Bible delivers the holy grail of online marketing: how to influence search engine results to drive online shoppers to specific Web sites; the process is called search engine optimization (SEO) and it is a hot topic. One-stop resource offers readers what they need to plan and implement a successful SEO program, including useful tips on finding the shortest routes to success, strategy suggestions, and sidebars with more information and additional resources. Features interviews with executives from top search companies, plus appendices on creating successful listings with Google, MSN, Yahoo!, and others.
Whether promoting yourself, your business, or your hobbies and interest, you want your website or blog to appear near the top when your customers search. Search engine optimization, or SEO, is increasingly essential to businesses. This full-color, step-by-step guide demonstrates key SEO concepts and practices in an easy-to-follow visual format. Learn how to set up your website and what to implement to help your business or product make a great showing in search results. Learn how to create a search engine-optimized Drupal website. Packed full of tips to help you develop an appropriate SEO strategy. Discover the right configurations and extensions for SEO purposes. Gain an understanding of how the search engines function. Configure your Drupal site to be search engine friendly. The top extensions to enhance your Drupal sites search engine optimization. What the most important factors to track with Google Analytics are. ebook seo vietmoz 2013