Google izstrādātāju diena ASV - KML meklēšana un izstrāde. Maps Mashups

Es izstrādāju jaunu mūsu vietnes versiju apakšdomēnā (dev.oursite.com) un robots.txt Ar Disallow kādā brīdī tika nomainīts, tāpēc vietni indeksēja Google un citas meklētājprogrammas. Tas neuzrāda augstu rezultātu vai neko citu, taču tam ir viss satura dublikāts, un es gribētu, lai tā nebūtu.

Apakšdomēna tagad vairs nav, un man ir 301, kas novirza katru lapu no dev.oursite.com/page-name uz http://oursite.com/page-name.

Vai man ir vēl kaut kas jādara, lai vietne Dev tiktu noņemta no rādīšanas Google tīklā? Vai tas galu galā pazudīs pats?

  • 4 Google rīcībā ir noderīga FAQ lapa: support.google.com/webmasters/bin/…

Pārbaudiet URL noņemšanas rīku Google tīmekļa pārziņa rīkos. Es vēlētos arī 404 lapas, nevis novirzīt tās, lai tās ātrāk noņemtu nākotnē robots.txt jūs varētu iemest rel='canonical' lai pārliecinātos, ka Google zina, ka vietne dev ir tikai galvenās vietnes kopija un nav indeksējama.

Mani vienmēr uztrauc tas, ka attīstības vietnes tiek indeksētas. Es neuzticos robots.txt vai meta noindex, kamēr es tos izmantoju, es arī aizsargāju vietnes ar paroli, ja tas nav nekas neērts. Bet vēl viena iespēja ir izmantot .htaccess un liegt piekļuvi visiem, izņemot IP jūsu uzņēmumā, kā arī kolēģiem un izstrādātājiem. Vienkārši pievienojiet viņu C klasi.

  • 1 Tas ir labākais veids. 403 visi, izņemot adrešu vai adrešu bloku virkni. Pārējā pasaule iet prom, un to var tikai tie, kuriem tā jāredz. Pēc fakta par šo jautājumu, bet ir labi zināt nākotnē. Jums var būt nepieciešama privāti pieejama izstrādes vietne pat pēc jaunināšanas izmēģinājumu uzsākšanas, pielāgotu programmēšanu no trešo pušu izstrādātājiem utt.

Papildus pareizajai Džošaka atbildei es vēlētos sniegt jums padomu, kā to novērst.

Tas, ko esmu darījis, lai atrisinātu šo pašu problēmu, ir piespiest robot.txt ierakstīt Apache httpd vhost definīcijā. Tādējādi nekādā gadījumā "neatļaut" var pazust vai to var mainīt jebkurš izstrādājamās vietnes kods. Visas manas vhost definīcijas izskatās apmēram šādi:

 DocumentRoot /var/www/html/Hosting/test.example.com/newsite.com ServerName newsite.com.test.example.com ServerAlias *.newsite.com.test.example.com UseCanonicalName on RewriteEngine on RewriteRule ^/robots.txt /var/www/no-indexing-robots.txt [NC,L]  

strādāja par jums: Charles Robertson | Vēlies ar mums sazināties?