trang mô côi là gì và cách sửa trang mồ côi - dịch vụ viết bài chuẩn SEO - blog review sách hay

Hướng dẫn cách tìm và sửa lỗi các trang mồ côi

Một trang không có bất kỳ liên kết nào đến nó được gọi là trang mồ côi. Đây là cách tìm tất cả các trang mồ côi của bạn và tại sao việc sửa chúng lại quan trọng đối với SEO.

Việc tìm kiếm các trang web không có liên kết là rất khó, nhưng không phải là không thể.

Nếu có các trang trên trang web của bạn mà người dùng và công cụ tìm kiếm không thể truy cập thì đây là vấn đề bạn cần khắc phục.

Các loại trang này có tên: trang mồ côi.

Trong bài đăng này, bạn sẽ tìm hiểu các trang mồ côi là gì, tại sao việc sửa chúng lại quan trọng đối với SEO và cách tìm mọi trang mồ côi trên trang web của bạn.

Trang mồ côi là gì?

Một trang không có bất kỳ liên kết nào đến nó được gọi là trang mồ côi.

Các công cụ tìm kiếm, như Google, thường tìm các trang mới theo một trong hai cách:

-Trình thu thập thông tin theo liên kết từ một trang khác.
-Trình thu thập thông tin tìm thấy URL được liệt kê trong sơ đồ trang XML của bạn.
Vì vậy, nếu bạn muốn Google thu thập dữ liệu và lập chỉ mục trang của bạn, họ cần phải có thể tìm thấy nó.

Tại sao các trang mồ côi là một vấn đề SEO?

Các công cụ tìm kiếm không thể tìm thấy các trang mồ côi thông qua các liên kết, vì vậy các trang mồ côi thường không được lập chỉ mục và không bao giờ hiển thị trong kết quả tìm kiếm.

Ngay cả khi các trang mồ côi của bạn được liệt kê trong sơ đồ trang XML của bạn, chúng vẫn là một vấn đề đối với SEO.

Các trang mồ côi có tệ không?

Các trang mồ côi không tuyệt vời cho cả người dùng hoặc trình thu thập thông tin.

Người dùng không thể truy cập các trang đó thông qua cấu trúc tự nhiên của trang web của bạn, vì vậy nếu có thông tin quan trọng hoặc hữu ích trên các trang đó, điều đó thật lãng phí.

Điều này có thể tạo ra trải nghiệm người dùng khó chịu.

Không có liên kết nội bộ, không có thẩm quyền nào được chuyển đến các trang và các công cụ tìm kiếm không có ngữ cảnh hoặc cấu trúc để đánh giá trang.

Nếu không có bất kỳ cách nào để biết vị trí trang phù hợp với tổng thể trang web của bạn, thì việc xác định trang có liên quan đến những truy vấn nào sẽ trở nên khó khăn hơn.

Trang mồ côi với trang cuối

Như chúng tôi đã thiết lập, trang mồ côi là trang web không được liên kết với hoặc có thể truy cập từ bất kỳ trang nào khác trên cùng một trang web.

Mặt khác, trang kết thúc là một trang web không liên kết với bất kỳ trang web nội bộ nào khác hoặc bất kỳ trang web bên ngoài nào, do đó tạo ra một “đường cùng”.

Khi mọi người truy cập vào trang này, họ có thể quay lại hoặc bỏ trang web.

Khi trình thu thập thông tin của công cụ tìm kiếm truy cập vào trang, chúng không có nơi nào để đi và không có liên kết nào có thể được thông qua.

Ngày nay, với rất nhiều mẫu và chủ đề có sẵn, càng khó tạo ra một ngõ cụt – nhưng hầu như không thể.

Kết thúc có thể dễ dàng được khắc phục bằng cách thêm liên kết đến nội dung trên trang của bạn hoặc đảm bảo rằng điều hướng thanh bên hoặc chân trang được điền trên mọi trang.

Tất cả rõ ràng? Tốt.

Bây giờ chúng ta hãy tìm các trang mồ côi của bạn.

1.Xác định các trang có thể thu thập thông tin của bạn

Bạn sẽ cần danh sách tất cả các URL hiện có thể truy cập được bằng cách thu thập thông tin các liên kết trang web của bạn.

Bạn sẽ cần trình thu thập thông tin của riêng mình – một con nhện SEO, để làm điều này. ScreamingFrog là một lựa chọn tốt.

Dù bạn sử dụng trình thu thập thông tin nào, hãy đảm bảo rằng trình thu thập thông tin được đặt để chỉ thu thập thông tin các trang có thể lập chỉ mục bởi các công cụ tìm kiếm.

Do đó, ý tôi là nó không nên thu thập dữ liệu các trang:

-Noindexed
-Bị ẩn khỏi công cụ tìm kiếm bởi robots.txt.
Bắt đầu thu thập thông tin từ trang chủ của trang web.

Đảm bảo sử dụng URL chuẩn, bao gồm https hoặc http thích hợp và www hoặc không phải www.

Khi bạn đã thu thập thông tin trang web của mình, hãy xuất các URL sang một bảng tính như sau:

trang mồ côi là gì và cách sửa lỗi

2.Giải quyết 2 nguyên nhân phổ biến của Trang mồ côi

Có hai nguyên nhân phổ biến khiến trang mồ côi cần được khắc phục và xử lý ngay.

Cả hai nguyên nhân này về cơ bản là các bản sao trang sẽ tự động chuyển hướng nhất quán đến chỉ một URL.

Nếu không, có khả năng một số phiên bản của trang không được liên kết đến và do đó là trang mồ côi.

Trong trường hợp này, thực tế rằng chún là trang mồ côi không phải là vấn đề chính, thực tế là chúng là bản sao.

Những điều này có thể xuất hiện sau khi bạn đang tìm kiếm các trang mồ côi và cần được xử lý, vì vậy, bạn nên xử lý chúng trước.

Không có thẻ canonical https / http hoặc www / không phải www

Mọi trang công khai trên trang web của bạn tốt nhất nên sử dụng http hoặc https một cách nhất quán (tốt nhất là https) và www hoặc không phải www.

Để kiểm tra xem có đúng như vậy không, hãy thử nhập tất cả các biến thể này của trang chủ trang web vào trình duyệt của bạn:

https://www.example.com
http://www.example.com
https://example.com
http://example.com

Tất cả bốn biến thể sẽ tự động chuyển hướng đến cùng một URL.

Để nhất quán, trang đó phải là trang chuẩn cho chính nó.

Nếu một trong những biến thể này không chuyển hướng đúng cách, đó có thể là dấu hiệu của các vấn đề tương tự trên trang web rộng lớn hơn.

Kiểm tra các URL khác, sử dụng biến thể đó, để xem liệu đó có phải là vấn đề phổ biến hơn không.

Bạn nên kiểm tra một vài trang khác trên trang web của mình và kiểm tra tệp .htaccess của trang web để đảm bảo rằng các chuyển hướng cho những trang này được thiết lập đúng cách.

Đây là cách buộc https trong .htaccess. Nếu bạn làm điều này, hãy xác minh rằng mọi trang trên trang web của bạn đều có khả năng SSL, nếu không người dùng của bạn sẽ nhận được cảnh báo trình duyệt đáng sợ.

Đây là cách buộc www hoặc không phải www. Một lần nữa, hãy xác minh rằng điều này sẽ không tạo ra bất kỳ lỗi máy chủ nào.

Dấu gạch chéo

Một điều khác cần chú ý là việc sử dụng nhất quán các dấu gạch chéo.

Ví dụ: hai URL này có thể tạo ra cùng một nội dung, nhưng các URL không giống nhau:

  • https://example.com/page1/
  • https://example.com/page1

Kiểm tra một số trang trên trang web của bạn cả có và không có dấu gạch chéo ở cuối và đảm bảo rằng chúng tự động chuyển hướng đến cùng một URL và chúng làm như vậy một cách nhất quán.

Xác minh rằng điều này được thiết lập đúng cách trong .htaccess.

3. Nhận Danh sách URL từ Google Analytics

Trình thu thập thông tin, theo định nghĩa, sẽ gặp khó khăn khi tìm các trang mồ côi.

Vì vậy, sử dụng bất kỳ công cụ SEO nào để tìm một công cụ chắc chắn sẽ có vấn đề.

Một trong những nơi tốt nhất để bắt đầu tìm kiếm các trang mồ côi là dữ liệu Google Analytics của riêng bạn (hoặc bất kỳ gói phân tích nào khác mà bạn sử dụng).

Miễn là các trang được đề cập đã cài đặt Google Analytics, nếu trang đó đã từng được truy cập, thì sẽ có một bản ghi về nó ở đâu đó trong Google Analytics.

Để có được danh sách đầy đủ các URL, từ thanh bên trái, hãy chuyển đến Hành vi> Nội dung trang> Tất cả các trang.

trang mồ côi là gì và cách sửa lỗi

Vì các trang mồ côi của chúng tôi rất khó tìm, nên số lần chúng được truy cập có khả năng khá thấp.

Nhấp vào “Số lần xem trang” để mũi tên hướng lên trên, cho biết rằng danh sách các URL được sắp xếp theo thứ tự tăng dần từ ít nhất đến hầu hết các lần xem trang.

Điều này sẽ chuyển các trang có nhiều khả năng là trẻ mồ côi nhất lên đầu:

trang mồ côi là gì và cách sửa lỗi

Để đảm bảo danh sách của chúng tôi toàn diện nhất có thể, hãy chuyển đến phạm vi ngày ở trên cùng bên phải.

Đặt ngày bắt đầu trở lại thời điểm trước khi có Google Analytics và nhấp vào nút Áp dụng:

trang mồ côi là gì và cách sửa lỗi

Bây giờ chúng ta sẽ cần mở rộng danh sách URL của mình nhiều nhất có thể.

Ở dưới cùng bên phải, nhấp vào menu thả xuống Hiển thị hàng và chọn số lượng hàng cao nhất.

Trở ngại lớn nhất của chúng tôi là Analytics chỉ có thể liệt kê tối đa 5.000 URL cùng một lúc:

trang mồ côi là gì và cách sửa lỗi

Nếu bạn có nhiều hơn số này, bạn sẽ phải xuất 5.000 trang cùng một lúc cho đến khi bạn có tất cả dữ liệu khách truy cập Google Analytics của mình.

Tuy nhiên, chúng tôi đang sắp xếp số lần xem trang theo cách tăng dần, vì vậy, danh sách của chúng tôi hy vọng sẽ bao gồm tất cả và rất có thể sẽ bao gồm hầu hết các URL mồ côi đã có khách truy cập.

Có thể sẽ mất một chút thời gian để Analytics tìm nạp tất cả dữ liệu.

Hãy kiên nhẫn và đừng cố gắng gấp rút mọi thứ, nếu không bạn sẽ có nguy cơ làm hỏng trình duyệt của mình.

Sau khi các URL được tải, hãy lên trên cùng bên phải, chọn xuất và xuất Google Trang tính, tệp Excel hoặc bảng tính CSV để lấy URL của bạn.

Nếu kỹ thuật hơn một chút, bạn có thể sử dụng API Google Analytics để tăng tốc quá trình này; thử sử dụng số liệu số lần xem trang so với thứ nguyên Đường dẫn trang.

trang mồ côi là gì và cách sửa lỗi

Bây giờ sao chép các URL từ tệp phân tích đã xuất của bạn vào bảng tính trang mồ côi của bạn, như sau:

trang mồ côi là gì và cách sửa lỗi

Chúng ta sẽ cần đưa chúng vào định dạng URL để chúng hữu ích.

Để thực hiện việc này, hãy chèn một cột mới và dán URL trang chủ xuống, như sau:

trang mồ côi là gì và cách sửa lỗi

Và sử dụng công thức concat () để kết hợp chúng với nhau thành một URL trong cột tiếp theo:

trang mồ côi là gì và cách sửa lỗi

Sau đó, chỉ cần kéo công thức xuống để nhận danh sách URL đầy đủ:

trang mồ côi là gì và cách sửa lỗi

4. Xác định URL mồ côi của bạn

Để xác định các URL mồ côi, chúng tôi sẽ cần so sánh danh sách các URL có thể thu thập thông tin và danh sách các URL Analytics được tìm thấy trong bảng tính của mình.

Trong ví dụ giả định của chúng tôi, rõ ràng https://example.com/11 là một trang mồ côi, nhưng trên thực tế, hầu như bạn sẽ luôn có nhiều URL hơn để sàng lọc và chúng tôi sẽ cần tự động hóa quá trình xác định URL mồ côi của mình .

Để làm điều này, chúng tôi cần một công thức kiểm tra xem mỗi URL trong danh sách Analytics của chúng tôi có được tìm thấy trong danh sách URL có thể thu thập thông tin của chúng tôi hay không.

Dưới đây là một ví dụ về một công thức sẽ thực hiện điều này:

trang mồ côi là gì và cách sửa lỗi

Công thức “match” mà chúng tôi đã sử dụng trong ô E2 ở đây là:

= match (D2, $ A $ 2: $ A $ 11,0)

Công thức này kiểm tra xem URL trong ô D2 có nằm trong phạm vi $ A $ 2: $ A $ 11 hay không.

(Nếu bạn không quá quen thuộc với bảng tính, các ký hiệu đô la ở đó để đảm bảo rằng khi chúng tôi kéo công thức xuống cột, phạm vi sẽ không thay đổi.)

Giá trị “0” cho Google Trang tính biết rằng các cột không nhất thiết phải được sắp xếp. (Xem tài liệu Google Trang tính.)

Nếu có một kết quả phù hợp, công thức trả về vị trí của nó trong phạm vi, trong trường hợp này là vị trí đầu tiên trong phạm vi.

Tuy nhiên, điều chúng tôi quan tâm hơn là nếu không có kết quả phù hợp.

Như bạn có thể thấy, công thức trả về lỗi “# N / A” cho https://example.com/11, vì nó không được tìm thấy trong danh sách URL có thể thu thập thông tin của chúng tôi. Điều này có nghĩa nó là một trang mồ côi.

Sau đó, để có được danh sách các trang mồ côi của chúng ta, tất cả những gì chúng ta cần làm là sắp xếp cột Đối sánh để thu thập tất cả các kết quả “# N / A” vào một nơi.

trang mồ côi là gì và cách sửa lỗi

Sau đó, chúng tôi có thể sao chép danh sách các URL mồ côi và dán chúng vào một trang tính mới, nơi chúng tôi có thể giải quyết cách sửa chúng.

5.Các nơi khác để tìm URL mồ côi

Bạn có thể lặp lại quy trình này để xác định URL mồ côi bằng cách sử dụng các nguồn dữ liệu khác ngoài Google Analytics.

Bất kỳ công cụ nào sau đây sẽ có danh sách các trang được thu thập thông tin từ trang web của bạn:

SEMrush
Ahrefs
Moz Link Explorer
Raven Tools


Tôi không khuyên bạn nên đăng ký bất kỳ trang nào trong số đó chỉ để tìm kiếm các trang mồ côi, bởi vì họ sẽ cần phải thu thập thông tin bằng cách nào đó các trang này để tìm thấy chúng.

SEMrush và Ahrefs có các công cụ và thực hành cụ thể để giúp bạn khám phá các trang mồ côi.

Có thể trong một số trường hợp, các công cụ này sẽ tìm thấy các trang không thể thu thập dữ liệu trực tiếp vì chúng được tìm thấy bằng các phương tiện khác, thường là vào một thời điểm nào đó trong lịch sử khi trang có thể thu thập thông tin:

Làm việc với nhóm nhà phát triển của bạn để xem liệu họ có thể lấy danh sách URL đầy đủ trên trang web trực tiếp từ máy chủ hay không, vì đây sẽ là danh sách đầy đủ nhất có sẵn ở mọi nơi.

Bạn cũng có thể xem qua các tệp nhật ký của mình để tìm dữ liệu này.

Tệp nhật ký chứa thông tin về:

Ai đã truy cập trang web của bạn.
Họ đến từ đâu.
Những trang họ đã truy cập.


Bạn có thể thực hiện lần thu thập dữ liệu thứ hai trên trang web của mình, bỏ qua các lệnh như “nofollow” và “noindex” và so sánh nó với lần thu thập thông tin ban đầu của bạn.

Có thể có những trang chỉ có thể truy cập bởi trình thu thập thông tin bỏ qua các chỉ thị đó và những trang đó có thể là một nguồn trang mồ côi khác.

Cuối cùng, bạn có thể nhận được danh sách các URL từ báo cáo Phân tích tìm kiếm của Google Search Console.

Mặc dù các trang này rõ ràng đã được lập chỉ mục nếu chúng hiển thị ở đây, bạn vẫn có thể tìm thấy các trang không thể thu thập dữ liệu từ các liên kết nội bộ của mình và cần được sửa.

Kết luận: Tìm & Sửa Trang mồ côi

Các trang mồ côi không thể được lập chỉ mục bởi các công cụ tìm kiếm nếu chúng không hiển thị trong sơ đồ trang web của bạn – và chúng có thể tạo ra các vấn đề SEO khác ngay cả khi chúng xảy ra.

Khi bạn đã thực hiện các bước này và tìm thấy các trang mồ côi của mình, hãy tự hỏi mình một số câu hỏi:

-Trang này có quan trọng không? Nếu có, hãy tìm nơi để tích hợp nó. Nếu không, hãy loại bỏ nó.
-Trang này có xếp hạng cho bất kỳ từ khóa nào, mặc dù là một trang mồ côi? Nếu có, hãy tìm nơi để tích hợp nó. Nếu không, hãy loại bỏ nó.
-Trang sẽ tồn tại ở đâu trong phân loại trang web của bạn?
-Trang này trùng lặp hay gần trùng lặp? Cân nhắc gấp nội dung đó vào một trang tương tự không phải là trang dành cho trẻ mồ côi.
-Trang này có được tối ưu hóa không? Nó có thể được tối ưu hóa và liên kết tốt hơn từ?
-Trang có được liên kết đến từ các nguồn bên ngoài không?
-Sử dụng các phương pháp được nêu trong bài đăng này để tìm các trang mồ côi của bạn và giải quyết vấn đề này.

Nguồn :SEJ

Hướng dẫn cách cài và sử dụng công cụ Google Search Console cực kỳ đơn giản

Hướng dẫn các bước cài Google Analytics cực kỳ đơn giản

Top các công cụ hỗ trợ mà dân SEO nhất định phải biết

10 câu hỏi cần đặt ra trước khi muốn bài viết SEO đạt nhiều lượt truy cập

101 mẹo giúp cải thiện nhanh tình trạng SEO của bạn

Google nói thay vì tập trung vào “Link Juice”hãy tập trung vào yếu tố này.

Tổng hợp các thuật ngữ mà dân SEO nên biết

130 trang web chia sẻ xã hội tốt cho SEO và tăng lưu lượng truy cập

Làm sao để xây dựng một quy trình giúp bạn xây dựng 600 liên kết (links) trong 1 tháng?

Liên hệ đặt bài 

Liên hệ đặt bài/ xem portfolio qua gmail: ngathanh2703@gmail.com

Hoặc facebook Nga Nguyễn

Hoặc Fanpage: https://www.facebook.com/reviewsachvamarketingonline

DỊCH VỤ CỦA CHÚNG TÔI:

  • Viết bài chuẩn SEO, tăng thứ hạng từ khóa
  • Viết bài trên các trang mạng xã hội như Facebook, LInkedin, Instagram, Zalo…
  • Nhận chăm sóc và tăng like tự nhiên cho Fanpage
  • Xác minh Google Map
  • Chạy quảng cáo Google, Facebook

CÁC LĨNH VỰC CHÚNG TÔI ĐÃ LÀM

  • PR, Quảng cáo sách
  • Viết bài PR lĩnh vực công nghệ thông tin, blog du lịch…

CAM KẾT BÀI VIẾT CHUẨN SEO, Chuẩn AIDA…sửa bài theo đúng ý khách hàng