Vậy làm sao để Google biết URL nào là bài viết gốc?
Để giải quyết vấn đề này google đã đề ra thuật toán rel=”canonical” .Để đánh dấu với google đây mới là URL gốc còn tất cả các URL còn lại đều là bản sao chép thì ta làm như sau:
<head>
<link rel=”canonical” href=”http://seotopvn.com/duplicate-content/>
</head>
Web của bạn quá nhiều duplicate content?
Nếu trang bạn có quá nhiều duplicate content thì Google sẽ đánh giá
trang bạn kém chất lượng,Còn nặng hơn nếu site bạn toàn là duplicate
content rất có thể sẽ bị sandbox,Bạn nên xem thêm bài viết –>Google sandbox của mình đã viết lúc trước để hiễu rõ hơn hình phạt mà google đưa ra.Nội dung không duy nhất ảnh hưởng đến yếu tố SEO 2011 mà mình có đề cập trong bài viết trước là nội dung duy nhất.
Các trường hợp được xem là duplicate content :
1. URL Parameters
Biến url có thể tạo ra khá nhiều phiên bản sao chép của 1 URL giả sử
bạn cho demo 1 cái giao diện và căn cứ vào biến URL mà cho màu phụ thuộc
theo:
Ví dụ:http://your-domain/demo.php và http://your-domain/demo.php?color=red
2. Printer-Friendly
Xảy ra khi các trang có phiên bản dành cho in ấn
Ví dụ:http://your-domain/duplicate-content và http://your-domain/print/duplicate-content