Rīta mīklas biļetens 2020. gada 1. septembris

Mans Google tīmekļa pārziņa rīku konts rāda, ka man ir pārmeklēšanas kļūdas, kuras izraisa saites uz lapām, kas neeksistē (404 nav atrastas).

Bet, kad es skatos avota lapās, kurās tiek apsūdzēts par šo bojāto saišu esamību, tajās tādu nav.

Pašlaik man ir 6 404 kļūdas vietņu kartēs un 28 pārējā manā vietnē.

Piem., adrese http://www.webdesk.co.il/articles.php?id=13 neeksistē, tomēr Google norāda, ka man ir 3 lapas, kurās ir saites uz šo adresi:

http://www.webdesk.co.il/sitemapgen.php http://www.webdesk.co.il/articles.php?t=css http://www.webdesk.co.il/articles.php?id=17 //this address dont even exist 

Atverot katru no šīm lapām, redzēsit, ka tajās nav šo saišu.

Es domāju, ka tas varētu būt veca pārmeklēšanas rezultāts, kas vēl nav atjaunināts, taču šīs lapas nepastāv vairāk nekā 6 mēnešus, un Google norāda, ka visi pārmeklēšanas rezultāti ir atjaunināti (2012. gada 22. decembris).

Kāpēc Google turpina saņemt šīs 404 kļūdas?

  • Skatiet arī: Kā novērst rāpuļprogrammas “404 Not Found” kļūdas, par kurām Google ziņoja Search Console

Šķiet, ka Google ļoti ilgu laiku ir pakavējies pie vecajiem URL, es domāju, ka: -

  • Šīs saites eksistē citā vietnē kļūdas vai citas kļūdas dēļ.

  • Saturs, kas tur atradās ļoti sen, iespējams, ir bijusi vietnes vecā versija, kuru izveidojis, piemēram, bijušais domēna īpašnieks.

  • Veca saite, kas izskatās kā jauna saite htaccess novirzīšanas dēļ, piem. viena no manām vietnēm joprojām saņem saites uz savu neapbruņoto IP, taču tās tiek parādītas žurnālos kā domēns URL novirzīšanas iestatījumu dēļ (lai to izsekotu, bija nepieciešami gadi).

  • Saite pastāv html saturā, bet ne redzamajā lapas daļā - tas visbiežāk notiek vizuālo html redaktoru vai komentējamā satura kļūdu dēļ.

Vislabākais plāns ir panākt, lai jūsu serveris atbildētu uz šo URL pieprasījumiem ar statusa kodu 410, pretējā gadījumā google turpinās tos meklēt.

410 aizgājis Norāda, ka pieprasītais resurss vairs nav pieejams un vairs nebūs pieejams. Tas jāizmanto, ja resurss ir apzināti noņemts un resurss jāiztīra. Saņemot statusa kodu 410, klientam turpmāk vairs nevajadzētu pieprasīt resursu. Tādiem klientiem kā meklētājprogrammas resurss ir jānoņem no indeksiem. Lielākajā daļā izmantošanas gadījumu klienti un meklētājprogrammas neprasa resursa attīrīšanu, un tā vietā var izmantot “404 Not Found”.

Lūk, ko saka Google John Mueller (kurš strādā tīmekļa pārziņa rīkos un vietņu kartēs) par 404 kļūdām, kas parādās tīmekļa pārziņa rīkos:

PALĪDZĪBA! MANAJĀ VIETNĒ IR 939 KRAUMES KĻŪDAS !!

Šādu jautājumu redzu vairākas reizes nedēļā; jūs neesat viens - daudzās vietnēs ir pārmeklēšanas kļūdas.

  1. 404 kļūdas nederīgos vietrāžos URL nekaitē jūsu vietnes indeksēšanai vai rangam jebkādā veidā. Nav svarīgi, vai ir 100 vai 10 miljoni, tie nekaitēs jūsu vietnes rangam. http://googlewebmastercentral.blogspot.ch/2011/05/do-404s-hurt-my-site.html
  2. Dažos gadījumos rāpuļprogrammas kļūdas var izraisīt likumīga strukturāla problēma jūsu vietnē vai CMS. Kā jūs sakāt? Vēlreiz pārbaudiet rāpuļprogrammas kļūdas izcelsmi. Ja jūsu vietnē statiskajā HTML lapā ir bojāta saite, to vienmēr ir vērts izlabot. (paldies + Martino Mosna)
  3. Kā ir ar funky URL, kas ir “skaidri bojāti?” Ja mūsu algoritmiem patīk jūsu vietne, viņi var mēģināt tajā atrast vairāk lieliska satura, piemēram, mēģinot atklāt jaunus vietrāžus URL JavaScript. Ja mēs izmēģinām šos “URL” un atrodam 404, tas ir lieliski un gaidīts. Mēs vienkārši nevēlamies palaist garām neko svarīgu (šeit ievietojiet pārāk piestiprinātu Googlebot mēmu). http://support.google.com/webmasters/bin/answer.py?answer=1154698
  4. Tīmekļa pārziņa rīkos nav jālabo pārmeklēšanas kļūdas. Funkcija “atzīmēt kā fiksētu” ir paredzēta tikai jums, ja vēlaties tur sekot līdzi savam progresam; tas neko nemaina mūsu tīmekļa meklēšanas cauruļvadā, tāpēc nekautrējieties to ignorēt, ja jums tas nav nepieciešams. http://support.google.com/webmasters/bin/answer.py?answer=2467403
  5. Pārmeklēšanas kļūdas Tīmekļa pārziņa rīkos ir uzskaitītas pēc prioritātes, kuras pamatā ir vairāki faktori. Ja rāpuļprogrammas kļūdu pirmā lapa ir acīmredzami neatbilstoša, iespējams, nākamajās lappusēs neatradīsit svarīgas pārmeklēšanas kļūdas. http://googlewebmastercentral.blogspot.ch/2012/03/crawl-errors-next-generation.html
  6. Jūsu vietnē nav nepieciešams “labot” rāpuļprogrammas kļūdas. 404 atrašana ir normāla parādība, un to var sagaidīt no veselīgas, labi konfigurētas vietnes. Ja jums ir līdzvērtīgs jauns URL, laba novirzīšana uz to ir laba prakse. Pretējā gadījumā nevajadzētu veidot viltotu saturu, nevajadzētu novirzīt uz sākumlapu, kā arī nevajadzētu robots.txt neatļaut šos URL - visas šīs lietas mums apgrūtina jūsu vietnes struktūras atpazīšanu un pareizu apstrādi. Mēs tās saucam par “mīkstajām 404” kļūdām. http://support.google.com/webmasters/bin/answer.py?answer=181708
  7. Acīmredzot - ja šīs rāpuļprogrammas kļūdas tiek rādītas jums svarīgiem vietrāžiem URL, iespējams, vietrāžiem URL jūsu vietnes kartes failā, jums nekavējoties jārīkojas. Ja Googlebot nevar pārmeklēt jūsu svarīgos vietrāžus URL, tie var tikt izmesti no mūsu meklēšanas rezultātiem, un lietotāji, iespējams, arī nevarēs tiem piekļūt.

strādāja par jums: Charles Robertson | Vēlies ar mums sazināties?