Những điều căn bản khi tối ưu website thân thiện với search engine
Các bộ máy tìm kiếm bị hạn chế bởi cách mà chúng quét và giải nghĩa nội dung của các website. Khi nhìn một trang web, các bộ máy tìm kiếm sẽ nhìn thấy khác so với khi chúng ta nhìn thấy trang web đó.
Vì vậy, trong chương này, chúng ta sẽ tập trung vào các yếu tố kĩ thuật khi xây dựng (hoặc chỉnh sửa) các website để khiến cho cả các bộ máy tìm kiếm lẫn người dùng đều thích thú. Nếu bạn muốn, hãy chia sẻ bài hướng dẫn này với các lập trình viên, các chuyên gia thiết kế web của bạn để tất cả có thể tạo nên một kiến trúc website đồng nhất.
Nội dung có khả năng lập chỉ mục
Để trở nên thân thiện với các bộ máy tìm kiếm, các nội dung quan trọng nhất nên có định dạng văn bản HTML.
Các hình ảnh, file dạng Flash, cấu trúc Java, và bất cứ các nội dung không thuộc dạng văn bản sẽ thường bị bỏ qua hoặc đánh giá thấp bởi các con bọ tìm kiếm mặc dù hiện tại các kĩ thuật quét của các con bọ đã tiên tiến hơn rất nhiều.
Cách đơn giản nhất để chắc chắn rằng các từ hay đoạn văn mà bạn muốn hiển thị cho người dùng cũng hiển thị tốt với các bộ máy tìm kiếm là hãy đặt chúng dưới dạng văn bản HTML trong trang đó.
Tuy nhiên, còn có các cách nâng cao khác phù hợp với nhu cầu định dạng khác hoặc các dạng hiển thị trực quan:
- Tạo Alt cho hình ảnh: Nên cung cấp thuộc tính “ALT” dưới dạng HTML cho các ảnh thuộc định dạng gif, jpg hay png để khiến các bộ máy tìm kiếm có thể đọc được diễn giải của bạn về hình ảnh đấy.
- Thêm vào các ô tìm kiếm các liên kết định hướng và có khả năng quét được.
- Thêm vào file Java hay Flash các văn bản ở trên trang.
- Cung cấp các bản ghi chép lại cho file video hay ghi âm ví dụ như “nội dung của các file đó được chuyển hóa sang text”.
Hãy thử nhìn trang của bạn như các bộ máy tìm kiếm
Rất nhiều các trang web gặp phải lỗi về các nội dung có khả năng lập chỉ mục, vì vậy kiểm tra trang web của bạn thật kĩ càng.
Bạn có thể xem các yếu tố nội dung đã được hiển thị và có khả năng được lập chỉ mục bởi các bộ máy tìm kiếm hay không bằng các công cụ như Google’s cache, SEO-browser.com, và MozBar. Giờ hãy thử xem một trang của bạn dưới cái nhìn của Google’s text cache trông như thế nào.
Liệu nó có trông giống như thế này không?


Hãy xem tiếp trông thật khác với chúng ta nhìn thấy đúng không?
Bằng cách sử dụng chức năng của Google cache, chúng ta có thể nhìn như một bộ máy tìm kiếm.
Trang chủ demo không có chứa toàn bộ nhiều thông tin như chúng ta nhìn thấy.
Điều này gây khó khăn cho các bộ máy tìm kiếm khi giải nghĩa độ liên quan của trang web.
Vậy các nội dung thú vị đó đã biến đi đâu?
Uhm … thông qua Google cache, chúng ta có thể thấy rằng trang web trên như một vùng đất trống.
Thậm chí không có một chút nội dung dạng văn bản nào nói cho chúng ta rằng trang đó có chứa chú khỉ Axe Battling.
Website trên được xây dựng hoàn toàn bằng dạng Flash, điều này có nghĩa là các bộ máy tìm kiếm không thể lập chỉ mục cho bất cứ nội dung văn bản hay các liên kết tới các trò chơi khác. Nếu không có bất cứ cấu trúc HTML nào, trang này sẽ rất khó để có được thứ hạng cao trên các bộ máy tìm kiếm.
Vì vậy, bạn không chỉ kiểm tra độ hay của nội dung của trang web mà còn cần phải kiểm tra lại bằng các công cụ SEO xem các nội dung đó có được hiển thị tốt với các bộ máy tìm kiếm hay không.
Hãy áp dụng điều này cho các hình ảnh hay các liên kết trong trang web của bạn.
Cấu trúc liên kết có thể quét được
Các bộ máy tìm kiếm không chỉ xem nội dung để liệt kê danh sách các trang trong các chỉ mục được lập dựa trên hệ thống từ khoá cực lớn mà chúng cũng cần đi thêm các liên kết để tìm ra các nội dung mới.
Một cấu trúc liên kết có khả năng quét không chỉ giúp các con bọ tìm ra đường đi trong website của bạn mà nó còn giúp chúng tìm ra toàn bộ các trang trong website.
Hàng trăm nghìn website đã gặp phải sai lầm nghiêm trọng trong việc tạo ra các cấu trúc định hướng mà các con bọ không thể truy cập, từ đó khiến các trang không có khả năng được liệt kê trong các chỉ mục của các bộ máy tìm kiếm.
Như mọi người thấy ví dụ trong hình ảnh trên, con bọ của Google đã tới được với trang A và nhìn thấy các liên kết tới trang B và E.
Tuy nhiên, mặc dù C và D có vẻ là các trang quan trọng nhưng các con bọ không thể tìm ra đường tới các trang này (kể cả khi chúng biết các trang này tồn tại).
Điều này là bởi vì không có các liên kết có khả năng quét tới trang C và D.
Bởi vì Google không thể thấy các trang này nên chúng có thể coi như không tồn tại! Kể cả khi bạn có nội dung tốt, nhắm mục tiêu vào các từ khóa chuẩn và có cách marketing thông minh tới mức nào đi nữa thì điều này cũng sẽ không tạo ra bất kỳ sự khác biệt nào nếu các con bọ không thể tiếp cận các trang này.
Cấu trúc của một liên kết
<a href=”https://hiseo.vn”>Trung tâm đào tạo SEO</a>
<a : bắt đầu của thẻ liên kết
href=”https://hiseo.vn”> : địa chỉ liên kết tham khảo
Trung tâm đào tạo SEO : văn bản neo
</a> : đóng thẻ liên kết
Thẻ liên kết (link tag) có thể chứa hình ảnh, văn bản hoặc các nội dung khác, tất cả các điều này cung cấp một vùng có thể nhấn vào trên trang của bạn.
Điều này giúp người dùng có thể tương tác và chuyển tới một trang khác. Các kiên kết có các yếu tố điều hướng của mạng Internet thường được gọi là các Siêu liên kết (hyperlinks).
Như minh hoạ ở trên, thẻ “<a” chỉ ra việc bắt đầu của một liên kết.
Địa chỉ liên kết tham khảo sẽ nói cho trình duyệt (và cả các bộ máy tìm kiếm) nơi mà liên kết này chỉ tới.
Trong ví dụ trên, liên kết https://hiseo.vn chính là liên kết được tham khảo.
Tiếp tới là phần hiển thị của liên kết mà người dùng có thể nhìn thấy, nó được gọi là Văn bản neo (Anchor text), được dùng để định nghĩa hoặc giới thiệt ngắn về trang được liên kết tới.
Như trong ví dụ trên, trang được liên kết tới nói về một trung tâm đào tạo SEO, vì thế chúng ta có thể đặt văn bản liên kết là “Trung tâm đào tạo SEO”. Thẻ “</a> dùng để đóng liên kết nhằm phân biệt các văn bản liên kết giữa các thẻ, ngoài ra nó còn ngăn cách liên kết với các yếu tố khác trong trang.
Đây chỉ là định dạng cơ bản của một liên kết và nó là dạng dễ hiểu nhất đối với các bộ máy tìm kiếm.
Các con bọ có thể biết rằng chúng nên thêm liên kết này vào hệ thống liên kết của website, sử dụng nó để tính toán các biến số truy vấn độc lập, và theo các liên kết này để lập chỉ mục các nội dung của trang được liên kết tới.
Các lỗi thường thấy khiến các trang không thể truy cập
Các biểu mẫu điền thông tin
Nếu bạn yêu cầu người dùng phải điền thông tin vào một biểu mẫu trực tuyến trước khi có quyền truy cập vào một nội dung nào đó, các bộ máy tìm kiếm sẽ không có bất kì cơ hội nào để thấy những trang được bảo mật này.
Các biểu mẫu có thể là ô đăng nhập hay là một bản khảo sát.
Dù trong bất cứ trường hợp nào thì các con bọ tìm kiếm cũng sẽ không thể điền và nộp biểu mẫu được, vì thế các nội dung hay các liên kết được truy cập qua các biểu mẫu đều sẽ trở nên vô hình với các bộ máy tìm kiếm.
Biểu mẫu tìm kiếm
Mặc dù điều này cũng tương tự như biểu mẫu điền thông tin đã nói ở trên, nhưng nó cũng là một lỗi phổ biến mà chúng ta cần phải nói tới.
Một vài quản trị viên website tin rằng nếu họ đặt một ô tìm kiếm trên website thì sau đó các bộ máy tìm kiếm vẫn có thể tìm ra tất cả các thứ mà người dùng đang tìm kiếm.
Thật không may, các con bọ không thể thực hiện tìm kiếm để tìm ra các nội dung, điều này làm cho hàng triệu trang không có khả năng truy cập và chịu cảnh vô hình cho tới khi có liên kết được quét trỏ tới chúng.
Các liên kết JavaScript không có khả năng phân tích
Nếu bạn sử dụng JavaScript cho các liên kết, bạn có thể thấy rằng các bộ máy tìm kiếm sẽ không quét được chút gì dù chỉ một ít liên kết được gắn ở trong.
Bạn nên thay JavaScript bằng các cấu trúc HTML tiêu chuẩn ở bất cứ trang nào bạn muốn con bọ quét.
Các liên kết trong Flash, Java và các thành phần mở rộng khác
Các liên kết được gắn trong trang Juggling Panda ở phần trước là một ví dụ hoàn hảo cho vấn đề này.
Mặc dù có hàng tá thứ hay ho được liệt kê hay được liên kết trên trang nhưng không có bất cứ con bọ nào có thể tiếp cận chúng thông qua cấu trúc liên kết của trang.
Chúng trở nên vô hình đối với các bộ máy tìm kiếm và đương nhiên cũng bị ẩn đối với các truy vấn tìm kiếm của người dùng.
Các liên kết trỏ tới các trang bị chặn bởi các thẻ Meta Robots hay robots.txt
Thẻ Meta Robots hay file robots.txt đều cho phép chủ của website hạn chế các con bọ truy cập tới một trang cụ thể.
Bạn cũng cần lưu ý rằng có khá nhiều nhân viên quản lý website đã vô tình sử dụng không đúng các công cụ này để ngăn chặn việc truy cập của các con bọ phá hoại nhưng cũng làm ngừng việc quét của các bộ máy tìm kiếm.
Các liên kết trên trang với hàng trăm hay hàng nghìn liên kết
Các bộ máy tìm kiếm sẽ chỉ quét được một lượng liên kết nhất định trên một trang.
Sự hạn chế này là cần thiết để tránh việc spam và bảo toàn xếp hạng. Các trang có hàng trăm liên kết sẽ đối mặt với nguy cơ không thể quét và lập chỉ mục cho toàn bộ các liên kết trên nó.
Thẻ Frames và iframes
Về mặt kĩ thuật, các liên kết của cả frames hay iframes đều có thể quét được, nhưng cả hai đều có các vấn đề cấu trúc khiến việc tổ chức và theo dõi của các bộ máy tìm kiếm gặp khó khăn.
Trừ khi bạn là một chuyên gia và thực sự hiểu về mặt kĩ thuật cách thức các bộ máy tìm kiếm lập chỉ mục và theo dõi các liên kết trong frames, nếu không cách tốt nhất là tránh xa frames hay iframes.
Nếu bạn có thể tránh được toàn bộ các lỗi trên, bạn sẽ có một cấu trúc liên kết HTML sạch sẽ, dễ quét.
Điều này sẽ giúp các con bọ dễ dàng truy cập vào các trang nội dung hơn rất nhiều.
Rel=”nofollow”
Rel=”nofollow” có thể được sử dụng với cấu trúc:
<a href=”https://www.facebook.com/” rel=”nofollow”>Facebook</a>
Các liên kết có thể chứa rất nhiều các yếu tố. Các bộ máy tìm kiếm sẽ bỏ qua gần hết chúng, ngoại trừ yếu tố rel=”nofollow”.
Trong ví dụ trên, việc thêm yếu tố rel=”nofollow” đối với thẻ liên kết sẽ nói cho các bộ máy tìm kiếm rằng quản trị viên website không muốn liên kết này được coi như là một sự tán thành đối với trang được trỏ tới.
Nofollow, hiểu theo nghĩa đen, là điều hướng bộ máy tìm kiếm không đi theo liên kết đấy (mặc dù một số vẫn đi theo).
Thẻ nofollow trở thành một công cụ giúp chấm dứt việc bình luận tự động, guest book, và việc spam liên kết trỏ về; nhưng thực tế nó được dùng như một cách nói với các bộ máy tìm kiếm hãy giảm bớt bất kỳ giá trị nào được chuyển qua liên kết này.
Các liên kết được gắn thẻ nofollow được giải nghĩa khác biệt một chút đối với từng bộ máy tìm kiếm, tuy nhiên điểm chung là chúng sẽ không truyền nhiều giá trị như các liên kết bình thường.
Google nói rằng trong hầu hết các trường hợp thì họ đều không đi theo các liên kết nofollow hoặc không truyền PageRank hay các giá trị của văn bản neo. Về cơ bản, việc sử dụng nofollow làm cho Google loại bỏ liên kết mục tiêu khỏi bản đồ tổng thể của website đó.
Liên kết nofollow không có trọng lượng và được coi như văn bản HTML (giống như liên kết không tồn tại). Mặc dù vậy, nhiều quản trị viên website vẫn tin rằng kể cả một liên kết nofollow từ các trang có độ tin tưởng cao (high authority), như Wikipedia, vẫn có thể được coi như là dấu hiệu của sự đáng tin cậy. Bing & Yahoo!
Bing, cũng như Yahoo, nói rằng họ không thêm các liên kết nofollow vào biểu đồ liên kết của website, dù các con bọ của họ vẫn có thể sử dụng các liên kết nofollow như một cách để tìm ra các trang mới. Vì thế, có khi họ vẫn đi theo các liên kết đấy nhưng không dùng chúng trong việc tính toán xếp hạng.
Liệu các liên kết nofollow là không tốt?
Mặc dù các liên kết này không truyền nhiều giá trị như các liên kết thông thường, nhưng chúng là một phần tự nhiên của việc đa dạng hoá các liên kết.
Một website có nhiều liên kết tới dạng nofollow cũng không phải là một điều xấu.
Trên thực tế, Moz Ranking Factors cũng chỉ ra rằng các trang có xếp hạng cao có tỉ lệ liên kết nofollow trỏ tới cao hơn các trang có xếp hạng thấp.
Cách sử dụng và nhắm mục tiêu theo từ khóa
Các từ khoá là yếu tố cốt lõi trong quá trình tìm kiếm.
Chúng là các bộ phận cấu tạo của ngôn ngữ và của việc tìm kiếm.
Trong thực tế, toàn bộ khoa học truy xuất dữ liệu (bao gồm cả các bộ máy tìm kiếm trên web như Google) đều hoạt động dựa trên các từ khoá.
Bởi vì các bộ máy này đã quét và lập chỉ mục nội dung của các trang trên mạng nên chúng có thể tiếp tục theo dõi các trang này dựa trên chỉ mục các từ khoá thay vì lưu trữ hơn 25 tỉ trang web trong một cơ sở dữ liệu.
Hàng triệu triệu các cơ sở dữ liệu nhỏ hơn, mỗi cái tập trung vào 1 cụm từ hay 1 đoạn từ khoá nhất định, cho phép các bộ máy tìm kiếm truy xuất dữ liệu cần thiết chưa đến 1 giây.
Vì thế, nếu bạn muốn trang của bạn có cơ hội xếp hạng cao với từ khoá về chó, bạn cần chắc chắn rằng từ khoá “chó” là một phần của nội dung có khả năng quét được của văn bản.
Tính quyết định của từ khóa
Từ khoá quyết định cách chúng ta truyền đạt ý định tìm kiếm và sự tương tác với các bộ máy tìm kiếm.
Khi chúng ta gõ các từ khoá, các bộ máy tìm kiếm sẽ đưa ra các trang phù hợp với các truy xuất dựa trên từ khóa mà chúng ta đã gõ. Trật tự của các từ (“pandas juggling” và “juggling pandas”), chính tả, chấm câu và cách viết hoa sẽ cung cấp các thông tin bổ sung mà các bộ máy tìm kiếm sẽ dùng để truy xuất ra đúng các trang và xếp hạng chúng.
Các bộ máy tìm kiếm đánh giá cách các từ khoá được sử dụng trên các trang nhằm giúp đưa ra sự liên quan của một văn bản cụ thể đối với một truy vấn tìm kiếm.
Một trong các cách tốt nhất để tối ưu xếp hạng của một trang là chắc chắn rằng các từ khoá bạn muốn xếp hạng được ưu tiên sử dụng trong tiêu đề, văn bản và lý lịch dữ liệu (metadata).
Nói chung, nếu bạn càng làm cụ thể và chi tiết các từ khoá của bạn thì bạn sẽ giảm bớt được sự cạnh tranh trong kết quả tìm kiếm và tăng khả năng đạt được xếp hạng cao hơn.
Như trong hình dưới, các bạn có thể so sánh sự liên quan giữa một từ khóa rộng là “Books” đối với một từ khoá tiêu đề cụ thể “Tale of Two Cities”.
Bạn cần phải biết rằng sẽ có rất nhiều kết quả tìm kiếm cho các từ khoá rộng nhưng chỉ có rất ít kết quả tìm kiếm cho các từ khoá cụ thể (đương nhiên điều này nghĩa là sự cạnh tranh rất thấp).
Lạm dụng từ khóa
Ngay từ lúc bắt đầu của việc tìm kiếm trực tuyến, nhiều người đã cố tình lạm dụng từ khoá nhằm đánh lừa và thao túng các bộ máy tìm kiếm. Hộ đã cố “nhồi” các từ khoá vào trong văn bản, URL, thẻ meta, và các liên kết.
Tuy nhiên thật không may, hành động này hầu hết gây ra ảnh hưởng xấu hơn là tốt đối với website của bạn.
Trong những ngày đầu, các bộ máy tìm kiếm thực sự dựa vào việc sử dụng từ khoá như là một dấu hiệu chính của sự liên quan mà không hề để ý xem cách các từ khoá được sử dụng thực sự như thế nào.
Ngày nay, mặc dù các bộ máy tìm kiếm vẫn không thể đọc và hiểu các văn bản như con người, nhưng việc sử dụng trí thông minh nhân tạo đã giúp chúng ngày càng đọc hiểu tốt hơn.
Cách làm tốt nhất là hãy dùng các từ khoá của bạn một cách tự nhiên và có chiến lược.
Nếu trang của bạn nhắm mục tiêu tới cụm từ khoá “Tháp Eiffel” thì bạn có thể thêm nội dung một cách tự nhiên về chính tháp Eiffel, như lịch sử của toà tháp hay kể cả việc giới thiệu một số khách sạn ở Paris.
Nói cách khác, nếu bạn chỉ đơn giản cố đưa từ khóa “Tháp Eiffel” lên những trang có nội dung không liên quan, như một trang về cách nuôi chó, thì sau đó công sức để tăng hạng cho từ “Tháp Eiffel” sẽ rất nhiều và lâu.
Điểm quan trọng trong việc sử dụng từ khóa là không phải tăng thứ hạng của tất cả các từ khoá mà là tăng thứ hạng cho những từ khoá mà trang của bạn cung cấp cho những người đang tìm kiếm tại thời điểm họ muốn.
Mật độ từ khóa
Mật độ từ khóa không phải là một phần trong thuật toán xếp hạng hiện đại, điều này cũng được đề cập bởi tiến sĩ Edel Garcia trong The Keyword Density of Non-Sense.
Nếu có 2 văn bản, D1 và D2, bao gồm 1000 từ (l=1000) và có một từ được lặp lại 20 lần (tf=20), sau đó việc phân tích mật độ từ khoá sẽ nói với bạn rằng cả hai văn bản đều có mật độ từ khoá KD (keyword density) = 20/1000 = 2% cho từ khoá đó.
Giá trị đó cũng giống hệt như khi tf=10 và l=500. Rõ ràng, việc phân tích mật độ từ khóa không xác định được tài liệu nào liên quan tới từ khóa hơn.
Việc phân tích mật độ từ khóa không nói cho chúng ta bất cứ điều gì về:
- Khoảng cách tương đối giữa các từ khoá trong một văn bản.
- Nơi mà từ khoá được đặt trong văn bản.
- Tần suất cùng xuất hiện của các từ khoá.
- Chủ đề chính, chủ đề phụ của văn bản.
Nói tóm lại, mật độ từ khóa không có ý nghĩa đối với nội dung, chất lượng, ngữ nghĩa và sự liên quan của văn bản.
Tối ưu trên trang (On-page optimization)
Việc sử dụng và nhắm mục tiêu từ khóa vẫn là một phần trong các thuật toán xếp hạng của các bộ máy tìm kiếm, và chúng ta có thể áp dụng một vài phương pháp kĩ thuật hiệu quả về việc sử dụng từ khóa để tạo nên những trang được tối ưu hóa tốt.
Tại HiSEO, có rất nhiều thử nghiệm được tiến hành và nhận được rất nhiều kết quả tìm kiếm và sự dịch chuyển của chúng dựa trên các chiến thuật sử dụng từ khóa.
Khi bạn làm trên trang của bạn, chúng tôi khuyên bạn nên làm theo quy trình:
Sử dụng cụm từ khóa
- Ít nhất 1 lần trong thẻ tiêu đề. Cố gắng giữ cụm từ khóa ở càng gần đầu của thẻ tiêu đề càng tốt.
- Một lần ở gần đầu của trang
- Ít nhất hai hoặc ba lần, bao gồm cả các biến thể, ở trong đoạn thân của trang. Tuy nhiên, có thể nhiều hơn nếu bạn có nhiều nội dung dạng văn bản. Bạn có thể tìm thấy giá trị bổ sung trong việc sử dụng từ khóa hoặc các biến thể nhiều hơn, tuy nhiên theo kinh nghiệm của chúng tôi thì việc nhồi thêm từ khoá hay cụm từ khoá cũng chỉ ảnh hưởng nhỏ hoặc không ảnh hưởng gì tới việc xếp hạng
- Ít nhất một lần trong thuộc tính Alt của ảnh ở trên trang. Điều này không chỉ tốt cho việc tìm kiếm trang web mà còn cho cả việc tìm kiếm hình ảnh, điều này thỉnh thoảng có thể đem lại các truy cập có giá trị.
- Một lần trong URL.
- Ít nhất một lần trong thẻ meta description. Nên nhớ rằng thẻ meta description không chỉ được sử dụng cho việc xếp hạng, hơn thế nữa còn thu hút thêm các lượt nhấp chuột bởi người tìm kiếm sẽ đọc các kết quả ở trang tìm kiếm. Vì thế thẻ meta description sẽ trở thành đoạn trích văn bản được sử dụng bởi các bộ máy tìm kiếm.
Và bạn không nên sử dụng từ khóa của trang này trong các văn bản NEO chỉ tới các trang khác trên website của bạn.
Thẻ tiêu đề
Yếu tố tiêu đề của một trang là một mô tả chính xác và súc tích về nội dung của trang đó.
Đó là một điều quan trọng đối với cả trải nghiệm của người dùng và việc tối ưu hóa tìm kiếm.
Bởi vì thẻ tiêu đề là một phần quan trọng trong việc tối ưu hóa kết quả tìm kiếm nên sau đây là các cách làm tốt nhất dành cho các từ có thứ hạng SEO thấp.
Những gợi ý dưới dây bao gồm cả những bước quan trọng để tối ưu thẻ tiêu đề cho cả các bộ máy tìm kiếm và tính thực dụng.
Chú ý về độ dài
Các bộ máy tìm kiếm chỉ hiển thị 65-75 kí tự cho thẻ tiêu đề ở trên trang kết quả tìm kiếm (tiếp đó, các bộ máy tìm kiếm sẽ chỉ hiển thị … để biết được khi nào một tiêu đề bị cắt bỏ).
Đây cũng là giới hạn chung của hầu hết các trang phương tiện truyền thông.
Vì vậy, tuân thủ chặt chẽ giới hạn này là một điều khôn ngoan.
Tuy nhiên, nếu bạn đang nhắm mục tiêu tới nhiều từ khóa (hoặc một cụm từ khóa siêu dài), và nếu có chúng trong thẻ tiêu đề là điều cần thiết để xếp hạng thì bạn cũng có thể làm tiêu đề dài hơn.
Đặt các từ khóa quan trọng lên đầu
Các từ khóa của bạn càng ở gần đầu của thẻ tiêu đề thì càng giúp ích cho chúng trong việc xếp hạng, và cũng tăng khả năng người dùng nhấp chuột vào ở trên trang kết quả tìm kiếm.
Thêm thương hiệu
HiSEO rất thích thêm tên thương hiệu vào cuối mỗi thẻ tiêu đề để tăng độ nhận diện thương hiệu và tăng tỉ lệ nhấp chuột đối với những người thích và quen thuộc với thương hiệu này.
Thỉnh thoảng, việc đặt thương hiệu ở đầu thẻ tiêu đề, như ở trang chủ, là một điều có ý nghĩa tốt.
Bởi vì các từ khóa ở đầu thẻ tiêu đề có trọng lượng lớn nên hãy thực sự chú ý vào thứ mà bạn đang mong muốn xếp hạng.
Cân nhắc khả năng đọc và ảnh hưởng tới cảm xúc
Thẻ tiêu đề phải có tính mô tả và dễ đọc.
Thẻ tiêu đề là cái mà người dùng tương tác đầu tiên với thương hiệu của bạn, vì vậy nó cần phải truyền đạt được sự ấn tượng tốt nhất có thể với người dùng.
Tạo ra một thẻ tiêu đề độc đáo sẽ giúp thu hút sự chú ý trên trang kết quả tìm kiếm và đưa tới nhiều lượt truy cập cho website của bạn.
Điều này nhấn mạnh rằng SEO không chỉ là việc tối ưu hóa và chiến lược hóa việc sử dụng từ khóa mà còn cần quan tâm tới cả trải nghiệm của người dùng.
Thẻ Meta
Lúc đầu, các thẻ meta được coi như là một đại diện cho các thông tin về nội dung của website.
Một vài thẻ meta cơ bản được liệt kê dưới đây cũng như cách dùng của chúng.
Thẻ Meta Robots
Thẻ Meta Robots được sử dụng để kiếm soát hoạt động của các con bọ tìm kiếm (cho tất cả các bộ máy tìm kiếm chính) ở mức độ trang.
Có một vài cách sử dụng thẻ Meta Robots để kiểm soát cách hành động các bộ máy tìm kiếm đối với một trang:
- index/noindex: dùng để nói với các bộ máy tìm kiếm trang nào nên được quét và được lập chỉ mục để truy xuất hay không. Nếu bạn sử dụng “noindex”, trang đó sẽ bị loại trừ khỏi việc lập chỉ mục. Thông thường, các bộ máy tìm kiếm đều mặc định là chúng có thể lập chỉ mục tất cả các trang, vi vậy việc sử dụng giá trị “index” là điều không cần thiết.
- follow/nofollow: nói với các bộ máy tìm kiếm những liên kết nào trên trang có thể đi theo hay không. Nếu bạn lựa chọn thêm “nofollow”, các bộ máy tìm kiếm sẽ bỏ qua các liên kết trên trang trong việc khám phá hay xếp hạng, hoặc cả hai mục đích trên. Ở chế độ mặc định, các trang đều có thuộc tính “follow” Ví dụ: <Meta name=”robots” content=”noindex, nofollow”>
- noarchive: được sử dụng để hạn chế các bộ máy tìm kiếm lưu lại các bản copy của cache của trang. Ở chế độ mặc định, các bộ máy tìm kiếm sẽ duy trì lưu trữ các bản copy của tất cả các trang mà chúng đã lập chỉ mục, và khả năng truy cập đối với người tìm kiếm thông qua các liên kết được lưu trữ trong trang kết quả tìm kiếm
- nosnippet: thông báo với các bộ máy tìm kiếm rằng chúng không nên sử dụng khối văn bản mô tả ở bên cạnh tiêu đề trang và URL để hiển thị trên trang kết quả tìm kiếm
- noodp/noydir: là các thẻ đặc biệt dùng để nói với các bộ máy tìm kiếm không lấy một đoạn mô tả về trang từ Open Dictory Project (DMOZ) hoặc Yahoo! Directory để hiển thị trên trang kết quả tìm kiếm.
Chỉ thị tiêu đề X-Robots-Tag HTTP cũng có chức năng tương tự.
Kĩ thuật này hoạt động đặc biệt tốt cho các nội dung không phải dạng file HTML, ví dụ như hình ảnh.
Thẻ Meta Description
Thẻ meta description tồn tại như là một đoạn định nghĩa ngắn về nội dung của trang. Các bộ máy tìm kiếm sẽ không sử dụng các từ khoá hay đoạn trong
thẻ này để xếp hạng, tuy nhiên thẻ meta description là nguồn cung cấp chính cho đoạn văn bản ngắn được hiển thị trên trang kết quả tìm kiếm.
Thẻ meta description thực hiện chức năng như một đoạn quảng cáo giúp hướng người dùng tới website của bạn.
Nó thực sự là một phần quan trọng của chiến lược marketing trên công cụ tìm kiếm.
Hãy tạo ra một đoạn giới thiệu thật cuốn hút, thuyết phục và sử dụng các từ khóa quan trọng (nên biết rằng Google sẽ bôi đậm các từ khoá được tìm kiếm trong đoạn giới thiệu này) sẽ làm tăng tỉ lệ nhấp chuột cho trang của bạn.
Thẻ meta description có thể dài tuỳ ý nhưng nhìn chung các bộ máy tìm kiếm đều cắt các đoạn dài hơn 160 kí tự.
Vì thế, chú ý giới hạn độ dài là một điều bạn cần phải chú ý.
Trong trường hợp không có thẻ meta description, các bộ máy tìm kiếm sẽ tự tạo đoạn giới thiệu từ các thành phần tử khác của trang.
Vì vậy, đối với các trang nhắm mục tiêu tới nhiều từ khóa và chủ đề, đây là một chiến thuật khá tốt.
Các thẻ meta không quá quan trọng
Meta keywords: thẻ meta keyword đã từng một lần có giá trị khá cao nhưng hiện giờ lại không quan trọng và có giá trị trong việc tối ưu hoá kết quả tìm kiếm. Nếu bạn muốn tìm hiểu thêm về việc tại sao thẻ meta keywords trở nên vô dụng thì có thể đọc bài viết Meta Keywords Tag 101 của SearchEngineLand.
Meta Refresh, Meta Revisit-after, Meta Content-type, và các loại khác: Mặc dù nhưng thẻ này có thể sử dụng để tối ưu hoá kết quả tìm kiếm, nhưng chúng không quá quan trọng.
Cấu trúc URL
URL – địa chỉ cho các văn bản trên website – đóng góp giá trị quan trọng trong tiềm thức tìm kiếm.
Chúng xuất hiện ở rất nhiều vị trí quan trọng.
Bởi vì các bộ máy tìm kiếm sẽ hiển thị các URL trên các kết quả tìm kiếm nên chúng sẽ ảnh hưởng tới khả năng hiển thị và tỉ lệ nhấp chuột.
Các URL cũng được sử dụng trong việc xếp hạng các văn bản, và những trang mà tên của chúng có chứa các truy vấn tìm kiếm sẽ nhận được những lợi ích từ việc sử dụng từ khoá mô tả hợp lý.
Các URL được hiển thị trên thanh địa chỉ của các trình duyệt web, và điều này thông thường có một chút ảnh hưởng tới các bộ máy tìm kiếm.
Cấu trúc và thiết kế URL nghèo nàn sẽ làm giảm trải nghiệm của người dùng.
URL này được sử dụng như một văn bản neo chỉ tới một trang được tham khảo khác trong bài viết blog.
Hướng dẫn về cấu trúc URL
Sử dụng sự đồng cảm
Hãy coi mình như một người sử dụng và xem xét URL của bạn.
Nếu bạn có thể dự đoán nội dung mà bán muốn tìm trên trang một cách dễ dàng thì URL của bạn đã có tính mô tả chính xác.
Bạn không cần phải ghi lại từng chi tiết trong URL nhưng cần phải nêu ra được ý tưởng chung.
Càng ngắn càng tốt
Mặc dù tính mô tả của URL là một điều quan trọng nhưng hãy giảm độ dài và dấu gạch chéo “/” sẽ giúp URL của bạn dễ copy và dán (vào email, bài viết…) và sẽ được hiển thị toàn bộ trên trang kết quả tìm kiếm.
Việc sử dụng từ khóa là điều quan trọng (nhưng nhồi nhét là điều nguy hiểm)
Nếu trang của bạn đang nhắm mục tiêu tới một từ khoá hay một cụm từ cụ thể, hãy chắc chắn rằng bạn đã thêm nó vào trong URL.
Tuy nhiên, đừng quá nhồi nhét bằng cách cho quá nhiều từ khóa với mục đích SEO vào; việc nhồi nhét sẽ làm giảm khả năng được sử dụng của URL và có thể dính phải các bộ lọc spam.
URL tĩnh
URL tốt nhất là cái mà con người có thể đọc được và không có quá nhiều tham số, con số hay kí hiệu.
Sử dụng kĩ thuật, chẳng hạn như mod_rewrite cho Apache và ISAPI cho Microsoft, bạn sẽ dễ dàng biến các URL động, như htpps://hiseo.vn/blog?id=123 thành dạng tĩnh có khả năng dễ đọc hơn như https://hiseo.vn/blog/google-fresh-factor.
Kể cả chỉ có 1 tham số động trong URL cũng có thể khiến kết quả xếp hạng thấp hơn.
Sử dụng dấu gạch ngang để phân tách các từ
Không phải tất cả các ứng dụng web đều giải thích chính xác các dấu phân cách, ví dụ như dấu gạch dưới (_), dấu cộng (+) hoặc dấu cách (%20); thay vào đó bạn nên sử dụng dấu gạch ngang (-) để phân tách các
Canonical gốc và các phiên bản trùng lặp từ trong một URL.
Trùng lặp nội dung là một trong những vấn đề gay phiền hà nhất mà bất cứ một website nào cũng có thể gặp phải. Trong nhưng năm qua, các bộ máy tìm kiếm đã đánh rớt thứ hạng của những trang có nội dung ít hoặc trung lặp.
Canonicalization xảy ra khi hai hay nhiều phiên bản trùng lặp của một trang xuất hiện dưới các URL khác nhau. Đây là điều rất phổ biến với các hệ thống quản trị nội dung hiện nay. Ví dụ, bạn có thể có một phiên bản thông thường của trang và một phiên bản được tối ưu để in.
Trùng lặp nội dung cũng có thể xuất hiện trên các website khác nhau. Đối với các bộ máy tìm kiếm, đây chính là một vấn đề nghiêm trọng: nó nên hiển thị phiên bản nào của nội dung? Trong SEO, vấn đề này thường được coi như trùng lặp nội dung.
Các bộ máy tìm kiếm thường khá nghiêm khác với các phiên bản trùng lặp của một trang.
Để cung cấp trải nghiệm người dùng tốt nhất, chúng rất hiếm khi hiển thị các trang hay các đoạn có nội dung trùng lặp mà thay vào đó chúng lựa chọn phiên bản có vẻ giống là bản gốc nhất. Điều này nghĩa là tất cả các nội dung trùng lặp sẽ bị xếp hạng thấp hơn so với thứ hạng chúng nên có.
Canonicalization là cách làm để tổ chức nội dung của bạn theo cách mà mỗi phần riêng có một và chỉ một URL.
Nếu bạn tạo ra nhiều phiên bản của một nội dung trên một website (hoặc nhiều website), bạn có thể có kết cục như hình ở bên cạnh: viên kim cương nào mới là viên thật?
Thay vào đó, nếu người sở hữu website lấy cả 3 trang này và sử dụng kĩ thuật 301 redirect, các bộ máy tìm kiếm sẽ coi như chỉ có một trang rất mạnh để hiển thị trong danh sách các trang.
Khi nhiều trang có tiềm năng để xếp hạng được gom thành một trang, chúng không những giảm bớt sự cạnh tranh lẫn nhau mà còn tạo nên các tín hiệu mạnh hơn về độ liên quan và độ phổ biến.
Điều này ảnh hưởng tích cực tới khả năng được xếp hạng tốt với các bộ máy tìm kiếm.
Sử dụng thẻ Canonical để giải cứu!
Một lựa chọn khác dành cho các bộ máy tìm kiếm là sử dụng thẻ Canonical.
Đây là một cách khác để giảm các trường hợp trùng lặp nội dung trên một website và hợp chúng thành 1 URL riêng biệt.
Cách này cũng có thể sử dụng trên nhiều website khác nhau, từ một URL trên một tên miền tới một URL khác trên một tên miền khác.
Sử dụng thẻ canonical đối với trang có chứa nội dung trùng lặp.
Mục đích của thẻ canonical là chỉ ra URL nào mà bạn muốn xếp hạng
Ví dụ: <link rel=”canonical” href=”https://hiseo.vn/blog” /> sẽ nói với các bộ máy tìm kiếm rằng trang này được coi như là một phiên bản copy của URL https://hiseo.vn/blog và tất cả các thông số liên kết và nội dung mà các bộ máy tìm kiếm áp dụng nên được trả về cho URL đó.
Theo quan điểm SEO, thuộc tính của thẻ Canonical cũng tương tự như 301 redirect.
Nói cách khác, bạn đang chỉ ra cho các bộ máy tìm kiếm rằng các trang này nên được coi như một (giống như 301 làm), nhưng thực tế bạn không chuyển người dùng tới một URL mới. Điều này là một điểm cộng trong việc giảm bớt sự đau đầu của các nhân viên lập trình của bạn.
Nếu bạn muốn xem thêm các loại trùng lặp nội dung khác, các bạn có thể tìm đọc bài viết của tiến sĩ Pete.
Rich Snippets
Bạn đã bao giờ thấy đánh giá 5 sao ở trên trang kết quả tìm kiếm chưa? Đó chính là các thông tin mà các bộ máy tìm kiếm thu thập về Rich Snippets được gắn trên trang.
Rich Snippets là một loại dữ liệu có cấu trúc chuẩn giúp cho quản trị website đánh dấu nội dung theo các cách cung cấp thông tin cho các bộ máy tìm kiếm.
Việc sử dụng rich snippets và dữ liệu có cấu trúc chuẩn không phải là yếu tố bắt buộc của việc thiết kế thân thiện với các bộ máy tìm kiếm, tuy nhiên việc sử dụng nó có thể đem lại khá nhiều điểm tốt trong một số trường hợp.
Các dữ liệu có cấu trúc có nghĩa là đánh dấu các nội dung của bạn, do đó các bộ máy tìm kiếm có thể định nghĩa dễ dàng hơn loại nội dung của trang là gì.
Schema.org cung cấp một vài ví dụ về dữ liệu có cấu trúc có thể đem lại lợi ích từ việc đánh dấu nội dung, bao gồm con người, sản phẩm, đánh giá, doanh nghiệp, công thức nấu ăn và sự kiện.
Các bộ máy tìm kiếm thường thêm dữ liệu có cấu trúc trong kết quả tìm kiếm, ví dụ như đánh giá của người dùng (số lượng sao) và hồ sơ của tác giả (hình ảnh).
Có một vài nguồn tốt để bạn có thể học thêm về Rich Snippets như Schema.org, Google Rich Snippet Tool
Bảo vệ danh dự website của bạn
Những kẻ phá hoại ăn cắp xếp hạng của bạn như thế nào?
Thật không may khi trang web của bạn bị nhắm tới bởi các trang web mà mô hình hoạt động và kéo lượng truy cập dựa trên việc ăn trộm nội dung từ các web khác và tái sử dụng chúng trên các tên miền khác.
Cách làm của việc lấy trộm nội dung và tái xuất bản được gọi là “Đạo văn” (scraping) và những kẻ đạo văn này lại có xếp hạng khá tốt, thậm chí thường có thứ hạng cao hơn các trang gốc.
Bất cứ khi nào bạn xuất bản nội dung dưới bất kì định dạng nào, chẳng hạn như RSS or XML, hãy chắc chắn rằng bạn đã ping các dịch vụ theo dõi chính (như Google, Technorati, Yahoo!…). Bạn có thể tìm thấy các hướng dẫn cho các dịch vụ ping của Google và Technorati ngay trên trang của họ hoặc sử dụng một dịch vụ như Pingomatic để tự đông hoá quy trình này.
Nếu phần mềm tự động xuất bạn của bạn được làm tùy chỉnh theo yêu cầu, bạn nên yêu cầu thêm vào chức năng tự động ping sau khi xuất bản.
Tiếp theo, bạn có thể trả đũa việc ăn cắp nội dung rồi.
Hầu hết các kẻ ăn cắp sẽ tái xuất bản nội dung mà không chỉnh sửa chút nào.
Vì thế, việc thêm các liên kết trỏ về trang của bạn hay một bài viết cụ thể mà bạn đã tạo sẽ giúp bạn chắc chắn rằng các bộ máy tìm kiếm thấy được hầu hết các liên kết trỏ về web của bạn (chứng tỏ nguồn của bạn là hàng gốc).
Để làm điều này, bạn cần sử dụng các cấu trúc tuyệt đối thay vì sử dụng các liên kết tương đối trong cấu trúc liên kết nội bộ của bạn.
Ví dụ, thay vì sử dụng cấu trúc <a href=”../”>Home</a> thì bạn cần phải sử dụng cấu trúc <a href=https://hiseo.vn>Home</a>
Với cách này, khi một kẻ trộm lấy và copy nội dung của bạn, liên kết sẽ vẫn trỏ về trang của bạn.
Vẫn còn rất nhiều cách khác để bảo vệ nội dung của bạn khỏi những kẻ ăn cắp, tuy nhiên không có cách nào là tuyệt đối cả.
Bạn nên biết rằng, trang của bạn càng phổ biến và được hiển thị nhiều thì khả năng bạn thấy nội dung của bạn bị lấy cắp và tái xuất bản càng lớn.
Trong nhiều trường hợp, bạn có thể bỏ qua vấn đề này.
Bài viết này thuộc quyền sở hữu của HiSEO – Chúng tôi không cho phép bạn sao chép dưới mọi hình thức