Права на частна собственост във Венецуела

Имаме проблеми с това Google да индексира PDF файловете в нашия сайт. Има около 50 PDF и обхват от 20 KB до малко под два мегаграма. Те не са защитени, могат да се четат анонимно, а вътре в PDF Reader можете да търсите в документа.

Те са изброени в SiteMap.xml. Дори мога да разгледам регистрационните файлове на IIS и да видя как Googlebot чете PDF файловете, но освен пет, те никога не са включени в резултатите от търсенето.

Ако направя filetye: pdf, се показаха само пет PDF файла. Ако търся текст, който знам, че е вътре в PDF, PDF файловете никога не се показват (с изключение на петте, които са индексирани).

Някой има ли представа защо над 45+ PDF документа не са включени в индекса, въпреки че са в картата на сайта и Googlebot ги чете?

  • Посочвате ли типа съдържание за Google?

всички pdfs се намират на едно и също място? Веднъж имах проблема, че едно от моите pdf-местоположения беше в папка, която беше изключена от robots.txt. Изпратете вашата карта на сайта директно на сайта на инструментите на google-webmaster и може да получите ценна информация за причините, поради които pdfs не се появяват. в моя случай google ми каза „хей, тези 54 pdf документа са във вашата карта на сайта, но поради ограниченията robots.txt не можем да ги индексираме“. така че това беше доста полезно. но имайте предвид какво казва коментаторът, може да отнеме известно време, докато се появи тази информация.

Инструменти на Google за уеб администратори: https://www.google.com/webmasters/tools

  • Само ще добавя, че Google Webmaster Tools не предоставя цялата информация в реално време. Все пак това е жизненоважен ресурс.
  • Не, PDF файловете се намират на няколко различни места в сайта. Проверих и никой от тях не се блокира от robots.txt. Използвах Инструменти за уеб администратори и изпращах Sitemap и ще продължа да го правя. Благодарим ви за отзивите. Джим

Може да има доста забавяне между първоначалното четене на вашето съдържание от google и появяването му в индекса. Наскоро стартирахме отново сайт, изпращайки карти на сайта в google при стартиране и отне около 3 седмици, за да започнат да се показват новите страници в резултатите от търсенето.

Преди колко време изпратихте тези PDF файлове чрез вашата карта на сайта?

(с изключение на петте, които са индексирани)

Изглежда, че вашите PDF файлове се индексират, но отнема известно време. Предполагайки, че няма разлика в начина, по който са генерирани неиндексираните PDF файлове, тогава подозирам, че индексът просто отнема известно време да се актуализира.

На лек допир, един полезен инструмент, за който бих препоръчал да се регистрирате, е Google Webmaster - той ви показва честотата на обхождане, проблемите с вашия сайт, картите на сайта и индексирането в рамките на ден или нещо, след като Googlebot удари вашия сайт. Това може да ви спести малко време, преглеждайки вашите регистрационни файлове на IIS.

  • Изминаха около четири седмици, откакто за пръв път подадохме нашата карта на сайта. Току-що забелязах, че снощи индексираха още четири; така че може би просто трябва да продължа да чакам :)
  • Когато повторно стартирате сайта, ако отнемаха 3 седмици, за да започнат да се показват новите страници в резултатите от търсенето, това не означава ли, че в продължение на 3 седмици търсенето връща резултати на страници, които вече не съществуват на вашия сайт? това не доведе ли до много условия „страница не беше намерена“?
  • В нашата ситуация рестартирането съвпадна със стартирането на нова секция, старите връзки все още функционираха - 3-те седмици бяха времето, когато новата секция започна да се показва. Случайното време за изчакване може да бъде малко разочароващо!

Сканират ли се вашите PDF файлове с OCR, така че текстът да е избираем и да може да се търси? Или PDF файловете се сканират без OCR, в който случай текстът ще се съхранява като голямо изображение? Ако PDF са всички изображения, не мисля, че Google може да го индексира (все още). Или Google вече е намерил вашите страници?

Можете ръчно да го изпратите на Google, което понякога ускорява процеса.

е работил за вас: Charles Robertson | Искате ли да се свържете с нас?