Barbra Streisanda, Selīna Diona - saki viņam (oficiālais video)

Es apkopoju lielu skaitu vietrāžu URL. Es neesmu atbildīgs par attiecīgajām vietnēm, un es vēlos noņemt izsekošanas parametrus, kas neietekmē vietnes saturu. Izmantojot izsekošanas parametrus, nav iespējams noteikt divus vietrāžus URL, kas jāuzskata par vienādiem.

Piemēram, ja man ir šādas saites:

  1. http://example.com/blog/post1?utm_xyz=1234
  2. http://example.com/blog/post1?utm_xyz=5678
  3. http://example.net/viewblog?post_id=2&utm_xyz=9999

Es vēlos konvertēt uz līdzvērtīgiem kanoniskā tipa URL:

  1. http://example.com/blog/post1
  2. http://example.com/blog/post1
  3. http://example.net/viewblog?post_id=2

Pirmie divi ir paredzēti vienam un tam pašam saturam, taču tiem ir atšķirīgi izsekošanas parametri. Pēdējais piemērs parāda, kāpēc es nevaru vienkārši noņemt visus vaicājuma parametrus.

Visizplatītākie no tiem ir utm_ vienus, bet esmu arī atradis:

  • Piwik: pk_campaign un pk_kwd
  • WebTrends: WT.nav, WT.mc_id
  • nezināms, varbūt Apple: campaign_id
  • Wikimedia: wprov
  • HootSuite: hootPostID

Vai ir kāds labi zināms šo vaicājuma parametru saraksts, kurus es varu droši noņemt?

(Es izmantoju kanoniskos URL, kur tie tiek piegādāti HTML metadatos, bet es vēlos izmantot šo pieeju, ja neviens no tiem netiek piegādāts.)

  • Ko jūs domājat ar "droši noņemt"? Kādā kontekstā? Noņemot šos vaicājuma parametrus, acīmredzami tiks pārtraukta izsekošana, kāpēc jūs tos vēlaties noņemt?
  • 1 Es vācu vietrāžus URL (daru kaut ko līdzīgu meklētājprogrammas rāpuļa darbināšanai). Es vēlos noņemt izsekošanas parametrus no šiem vietrāžiem URL, lai izveidotu kanonisku URL. Ar vārdu “droši” es domāju nenoņemt parametrus, kas kalpos atšķirīgam saturam. Piemēram post_id emuāra ziņā URL ir svarīgs.
  • Tam ir jēga. Es zinu, ka Googlebot automātiski ignorē UTM izsekošanas parametri. Es pieņemu, ka tas, iespējams, to dara arī dažiem citiem izsekošanas parametriem. Tomēr es nekad neesmu redzējis publicētu šo parametru sarakstu no jebkura meklētājprogrammas rāpuļprogrammas. Noteikti būtu jauki izveidot šādu sarakstu.
  • Piekritu. Es priecājos, ka man netrūka kaut kā acīmredzama!
  • Tas ir noderīgs jautājums. Piemēram, Wikipedia aizliedz URL izsekošanas parametrus.

Es domāju, ka jūsu nolūks ir notīrīt nokasītos URL.

Varat atsaukties uz rakstiem par UTM lietošanas paraugpraksi. Parasti izmantotie atslēgvārdi vietnei utm_medium ir balstīti uz Google Analytics izmantotajām vārdu piešķiršanas metodēm, piemēram, sociālie, novirzīšanas, e-pasta ziņojumi.

Dienas beigās nav laba veida, ja to darāt, pamatojoties uz fiksētu atslēgvārdu sarakstu. Tā kā parametri var būt jebkas.

Jums būs lielākas iespējas iztīrīt rezultātus, izmantojot regex, lai atklātu un noņemtu visus UTM parametrus.

Par tādu URL kā https://example.com?utm_source=facebook&utm_medium=social&utm_campaign=book-launch-2014 jums ir jāmeklē un jāaizstāj parametri ar neko:

  • utm_source
  • utm_medium
  • utm_campaign
  • utm_term
  • utm_content

Daļa no manas RewriteCond ko izmanto URL deduplikācijai efektīvākai kešatmiņai: utm_(?:source|medium|campaign|term|content)|gclid|fbclid|msclkid|emci|emdi|ceid|sourceid|hootPostID|__s

  • gclid
  • fbclid
  • msclkid
  • hootPostID (uzminēts)
  • __s
  • emci / emdi / ceid: Noķerti no maniem žurnāliem. Varbūt no šī
  • sourceid: Noķerts no maniem žurnāliem

strādāja par jums: Charles Robertson | Vēlies ar mums sazināties?