Jums ir reklāmu rāpuļprogrammas kļūdas, kuras var izraisīt zaudētos ieņēmumus Kā to novērst TechnoGuru oficiālais |

Es joprojām esmu iesācējs visā SEO pasaulē. Apskatīsim manu piemēru. Man ir vietne, kas ir ļoti līdzīga emuāra stila vietnei. Vietrāžiem URL ir maz modeļu, visi ir ļoti vienkārši un ļauj tos pārmeklēt.

Katru dienu es iesniedzu jaunu vietnes karti ar pieejamu saturu ar biežumu = katru dienu. Lietas vietnē mainās ļoti bieži. Turklāt man ir daudz emuāru katalogu ar lapojumu, viens emuārs var būt dažos katalogos. Vietnes kartē es iesniedzu tikai galvenās lapas, ja katalogi. Katalogus ir atļauts pārmeklēt.

Man ir sajūta, ka rāpuļprogramma veic ļoti smagu darbu, jo tam ir jāpārbauda katrs katalogs ar faktiski jau indeksētu saturu, jo katru emuāru varēja pārmeklēt no iepriekšējā kataloga vai no vietnes kartes. Tāpēc izskatās, ka rāpuļprogramma nekad nepabeigs savu darbu. Tīmekļa pārziņa rīkos es redzu daudz lapu, kas tika iesniegtas pirms mēnešiem, pašlaik ir izdzēstas, un joprojām indeksā domāju, ka es izguvu 404 ar opciju noindex. Nejēga ir tāda, ka es indeksā varu atrast vecu vietnes karti, bet kā tas ir, es domāju, ka vismaz vietņu karšu faili katru dienu būtu jāindeksē.

Kāda manā gadījumā ir vēlamā stratēģija. Vai man tikai atzīmēt katalogu lapošanu kā “nofollow” saturu un katram katalogam atstāt tikai galveno lapu. Faktiski man ir nepieciešams indeksēt tikai vietnes kartes saturu. Tāpēc, ka viss, izņemot emuāru, ir tikai tūkstošiem lapu, kas novirza uz vieniem un tiem pašiem emuāriem. Iepriekš man bija ļoti interesanta ideja par to, ka daudzu katalogu vietā tiek izmantots arhīvs ar datuma navigāciju, un rāpuļprogrammai atļautu tikai to.

Kāds ir tavs viedoklis? Paldies!

Kāpēc jūsu vietrāži URL tik ļoti maisa? Tu raksti:

"[Ne] tīmekļa pārziņa rīkos es redzu daudz lapu, kas tika iesniegtas pirms mēnešiem, pašlaik ir izdzēstas, un joprojām ir rādītājā, domājot, ka es izguvu 404 ar opciju noindex."

Ja pirms to dzēšanas savas lapas uzturat tikai mēnesi vai divus, nav brīnums, ka Google nespēj sekot līdzi.

Īpaši paturiet prātā, ka Google, saņemot atbildi uz 404, nekavējoties nemetīs lapas no sava rādītāja - viņi nedaudz pagaidīs, ja kļūda bija īslaicīga un saturs atgriezīsies vēlāk.

Papildus vietnes kartes regulārai atjaunināšanai, lai atspoguļotu jauno saturu, varat veikt dažas citas lietas, kas varētu palīdzēt Google (un citām meklētājprogrammām) sekot līdzi bieži mainīgajai vietnes struktūrai:

  • Ļaujiet noņemtajām lapām rādīt 410 atbildes, nevis 404, kas nav atrastas. Kopš pirms dažiem gadiem Google ir atbildējis uz šādām atbildēm kā "mazliet pastāvīgākām" nekā 404 un var ātrāk noņemt šādas lapas no sava rādītāja. (Alternatīvi, var darboties arī 301 pastāvīga novirzīšana uz kādu stabilu mērķa lapu.)

  • Ja iepriekš zināt, kad lapa, iespējams, tiks noņemta vai mainīta, nosūtiet atbilstošu galveni HTTP beidzas. Tas galvenokārt ir paredzēts pārlūkprogrammām un starpniekiem, taču arī meklētājprogrammas tam var pievērst uzmanību.

Varat arī apsvērt iespēju īslaicīgas vai bieži mainīgas lapas atzīmēt ar noindex metatags, it īpaši, ja šo lapu saturs ir pieejams arī stabilākos vietrāžos URL citur.

Izmantojot a robots.txt failu, lai noturētu robotus no bieži mainīgām vietnes daļām varenība arī palīdzēt robotprogrammām koncentrēties uz tām jūsu vietnes daļām, kuras jūs gribu tos indeksēt, taču paturiet prātā, ka tas arī neļauj neatļautajām lapām nodot PageRank. Varat arī izmēģināt tagus savās vietnes kartēs, lai roboti novirzītos uz lapām, kuras vēlaties visvairāk indeksēt.

Tomēr es domāju, ka patiesā problēma ir vienkārši tā, ka Google vislabāk darbojas ar vietrāžiem URL, kuriem nav maijvaboles mūža. Tipiskā emuārā, kas, jūsuprāt, līdzinās jūsu vietnei, tiklīdz ziņa iet uz augšu, tā paliek augšā, un katrai ziņai parasti ir stabils URL, kas uz to norāda. Nezinot vairāk par jūsu vietni faktiski ir grūti pateikt, cik tas būtu praktiski vai nē, bet kopumā, ja saturs pilnībā nepazūd no jūsu vietnes, mēģiniet izveidot URL struktūru tā, lai saites pieraduši darbs pagātnē turpinās novest pie tā paša satura, kad vien iespējams.


Rediģēt: Vēl viena lieta, ko jūs varētu izmēģināt īslaicīgi noņemtām lapām būtu jāatgriež 200 OK atbildes kods ar a noindex metatags (un, protams, īss skaidrojums lietotājiem). Google parasti attur no šādām "mīkstajām 404" lapām, taču, ja sagaidāt, ka saturs drīzumā atgriezīsies, tās varētu būt piemērotas. Šī lapa it īpaši nozīmē, ka Google pazeminās noindexlapas no viņu rezultātiem uzreiz pēc taga redzēšanas, savukārt komentāri, uz kuriem es iepriekš saistīju, liek domāt, ka viņi var arī pārmeklēt šādas lapas biežāk nekā tās, kas ir noņemtas kā 404 lapas.

  • Paldies, lieliska atbilde. Pēdējais jautājums, pieņemsim, ka es atbildēju ar 410 par bloķēto saturu, un, kad saturs atkal ir pieejams, es to vienkārši pievienoju vietnes kartei, un rāpuļprogramma to atkal sāk pārmeklēt bez problēmām, saturu ar to pašu saiti?
  • Ja godīgi, man nav ne mazākās nojausmas. Es domāju, ka jūs to varētu izmēģināt un redzēt, kas notiek. Tomēr patiesībā nav domāts 410 atbildes kods, tāpēc dažādi rāpuļprogrammas var reaģēt uz to dažādi.

Vispirms pārtrauciet vietnes kartes iesniegšanu katru dienu. Protams, jūs varat turpināt to atjaunināt, un Google periodiski pārbaudīs, vai tajā nav atjauninājumu. Bet, kamēr jūsu vietne ir pārmeklējama, tas ir svarīgāk. Varat arī iesniegt savu RSS plūsmu, kas palīdzēs Google atrast jūsu jaunāko saturu.

Kas attiecas uz "katalogu", es domāju, ka tas, kā jūs to pašlaik darāt, ir labi, ja vien katalogu lapu ir ierobežots skaits, un tās netiek dublētas.

  • Paldies par padomu attiecībā uz katalogu, es uzskatu, ka jūs to domājat, bet mana problēma ir tā, ka es nezinu, cik ilgs laiks nepieciešams, lai google meklētu visu vietni, es pieņemu, ka nedēļas, ja ne mēneši, un 90% no viņa darba ir tikai lapošana, Pašreizējā situācija patiešām ir apgrūtinoša. Esmu aprakstījis, kāpēc, man ir veca vietnes karte indeksā, lapas ar novecojušu saturu, kas tika atjaunināta pirms nedēļām utt. Tātad vismaz ir problēma ar to, ko es šobrīd daru

strādāja par jums: Charles Robertson | Vēlies ar mums sazināties?