История на Канада - накратко.

Имам сайт на два езика:

domain.com (German) en.domain.com (English) 

Съдържанието е литература. И двата сайта са само на съответния им език, но искам да предложа и двоен изглед, за да сравнявам текста на различни езици един до друг, както в този пример:

https://cn.nytimes.com/world/20180706/trump-germany-family-ancestry-kallstadt/dual/

Така че имам:

domain.com/afx9-artikel (German only) en.domain.com/afx9-article (English only) 

И след това, допълнително тези страници с двоен изглед за сравнение на езиците:

domain.com/afx9-artikel/en (German with English) en.domain.com/afx9-article/de (English with German) 

Какво трябва да направя с тези страници с двоен изглед?

  • Трябва ли да се свържа с тях само чрез rel = "nofollow"?
  • Трябва ли изобщо да не се свързвам с тях и да използвам Javascript, за да позволя на потребителите достъп до тези страници?
  • Трябва ли да използвам rel = "canonical" върху тях?
  • Трябва ли да ги блокирам чрез robots.txt?

Благодаря!

Това е интересен въпрос!

Трябва ли да се свържа с тях само чрез rel = "nofollow"?

Не, защото Google все още ще обхожда URL адресите, дори ако ги свържете с nofollow и те ще бъдат индексирани.

Трябва ли изобщо да не се свързвам с тях и да използвам Javascript, за да позволя на потребителите достъп до тези страници?

Това е валидна опция, въпреки че в зависимост от вашето внедряване и Google, който се подобрява при обхождането на JS, това означава, че те все още могат да се индексират.

Трябва ли да използвам rel = "canonical" върху тях?

Някои може да не, тъй като съдържанието не е идентично. Виждал съм обаче канонични тагове, реализирани по сходни начини, при които само 50% от съдържанието се дублира от страницата, която също е канонизирана, и те са работили добре.

Така че в тази ситуация бих приложил канонично, ще го наблюдавам и ще видя как се представя. Ако канонизираните страници останат извън индекса на Google, бих казал, че това е успех. Също така, ако някои страници са индексирани, но когато преглеждате кеша на Google на страницата, ако тя показва съдържанието от каноничната страница източник, а не от канонизираната страница, също бих отчел това като успех.

Ако каноничното не работи и всички тези страници са индексирани, бих ги блокирал да бъдат индексирани с роботи noindex, follow tag.

Причината да опитам първо канонична е, че каквато и да е външна SEO стойност на страниците, която страниците искам да запазя, така че тя ще бъде предавана заедно с канонични тагове, като при използване на маркера noindex ще бъде загубена най-вече.

Трябва ли да ги блокирам чрез robots.txt?

Бих ги блокирал само чрез robots.txt, след като съм преминал маршрута на маркера noindex и съм потвърдил, че са премахнати от SERPS.

Ако ги добавите в robots.txt преди, търсачките няма да виждат маркера noindex, тъй като не могат да обхождат страницата и страницата може да остане индексирана, ако е блокирана само в robots.txt.

И причината да ги блокирам както в meta tag на robots, така и в robots.txt, е да спестя бюджета за обхождане. Наистина не искам Google да обхожда страници, които не искам да индексира, когато може да бъде по-добре да прекарам в обхождането на валидните ми страници. Така че блокирането в robos.txt ще спре Google да ги обхожда

  • Ето видео от Google, където се посочва, че Google може да разбира двойни езици на дадена страница: youtu.be/3C6p_ip9ang?t=780 Не е точно този случай.

е работил за вас: Charles Robertson | Искате ли да се свържете с нас?

Полезна информация