Izveidot rāpuļprogrammu: Python OR Octoparse?

Ņemsim filmas vietnes piemēru. Labi strukturēts URL kopums šai vietnei var būt:

  • Filmas lapa - example.com/movies/the-matrix
  • Pārskats par filmu - example.com/movies/the-matrix/reviews
  • Filmas treileri - example.com/movies/the-matrix/trailers
  • Īpaša filmas piekabe - example.com/movies/the-matrix/trailers/trailer1

kur ir iespējams orientēties resursā, pat nemanāmi tieši izdzēšot / pievienojot resursa nosaukumu.

SEO nolūkos es kaut kur lasīju, ka divām norādītajām lapām Google priekšroku dos lapai, kuras URL hierarhijā cita starpā ir meklēšanas vaicājumi. Tātad norādītajiem 2 URL un vaicājumam "matricas reklāmklips"

example.com/movies/the-matrix/trailers example.org/trailers/the-matrix/ ` 

Google, iespējams, dod priekšroku otrajam URL, jo tam pirmajā līmenī ir atslēgvārds "piekabe", salīdzinot ar pirmo URL, kura trešajā līmenī ir "piekabe" (resursi, kas atrodas dziļāk URL hierarhijā, var būt mazāk svarīgi).

Ja tas ir pareizi, var rasties kārdinājums izveidot URL hierarhiju, kas ir līdzīga

  • Filmas lapa - example.com/movies/the-matrix
  • Pārskats par filmu - example.com/reviews/the-matrix/
  • Filmas treileri - example.com/trailers/the-matrix/
  • Īpaša filmas piekabe - example.com/trailers/the-matrix/trailer1

kas izjauks nemanāmo hierarhiju.

Mani jautājumi ir:

  • Vai taisnība, ka resursiem, kas atrodas dziļāk URL hierarhijā, mēdz būt mazāk svarīgi, salīdzinot tos ar citu vietņu URL?
  • Vai šai SEO optimizācijai ir vērts upurēt jēgpilnu, nevainojamu hierarhiju?

  • 2 Ja jūs gatavojaties veidot vietrāžus URL SEO, svarīgs ir arī domēna nosaukums, ieskaitot apakšdomēnu. Tādēļ apakšdomēniem, piemēram, the-matrix.site.com/the-matrix/trailer, būs nedaudz labāks SEO nekā vietnei.com/the-matrix/trailer, pieņemot, ka viss pārējais saturs ir identisks. SEO ir nenormāli sarežģīts un pastāvīgi mainās. Mans vispārējais ieteikums ir vai nu pilnībā pielāgoties SEO, vai arī koncentrēties uz jēgpilnu semantiku, jo jēgpilnu semantiku Google labi atalgo. Protams, saturs ir karalis, tāpēc tas viss pieņem, ka jūs tērējat pietiekami daudz laika kvalitatīvam saturam.

Es nepiekrītu komentāram, ka SEO ir ārkārtīgi sarežģīts. Patiesībā tas ir veselā saprāta sīkumi. Nav burvju, voodoo, īpašas formulas, iemiesojumi, īpaša pogu un slēdžu secība utt. Jums nav nepieciešama voodoo priesteriene Asiņainā Marija, lai ierastos jūsu mājā vai birojā. Meklētājprogrammu darbība ir ļoti vienkārša, un lielākajai daļai algoritmu tiek piemēroti tikai daži paņēmieni, kas ir labi dokumentēti pētnieciskajos dokumentos (kuriem ir maz vai nav nekā kopēja ar meklēšanu). Vislielākās SEO novirzes ir tad, ja meklētājprogrammas nolemj, ka kaut kas ir laba ideja, un patiesībā tā nav. Piemēram, atslēgvārdu precīzās atbilstības domēnu jēdzienam ir jāpiešķir īpašs svars, kas to izceļ. Tas jau no paša sākuma bija dumjš. Ja atslēgvārdi būtu svērti dabiski, jo tie ir visvairāk visur citur, mēs būtu varējuši izvairīties no šī muļķības.

To pateicis.

Nesarežģī lietas. Domājiet vienkārši.

Uzskatu, ka apakšdomēna veiktspēja ir labāka, kā komentārā, nevar rēķināties. Vienīgā priekšrocība ir viena vai divu atslēgvārdu pievienošana vietrādī URL, kas mūsdienās tiek ļoti svērts iepriekš minēto precīzo domēnu svēršanas dēļ. Jums jācīnās ar faktu, ka apakšdomēnam būtu jāaizpilda saturs kā pilna vietne un jāoptimizē pats par sevi, lai tam būtu kāda ietekme. Pārāk daudz darba tik mazam ieguvumam. Kā arī tas ir pārāk liels risks.

Tagad pie sava jautājuma:

Iemesls, kāpēc, kā jūs minējāt, Google dod priekšroku lapai, kuras URL hierarhijā ir meklēšanas vaicājums, var izskaidrot ar to, kā Google un lielākā daļa meklētājprogrammu veido vaicājumu atbilstību. Izmantosim jūsu piemēru.

Sākt:

  • Google izsver atslēgvārdus no kreisās uz labo, ar dažiem izņēmumiem.
  • Google vairāk nosver zināmās atslēgvārdu frāzes.
  • Google sver URI atslēgvārdu frāzes / kopas, kas atdalītas ar slīpsvītru [/] no kreisās uz labo.
  • Google parasti biežāk lietotos atslēgvārdus sver mazāk nekā specifiskākus atslēgvārdus.
  • Google vairāk nosver atslēgvārdu modifikatorus.
  • Google izsver atslēgvārdus, pamatojoties uz popularitātes tendencēm.
  • Sverot atslēgvārdus, Google noņems visas īpašās (bez burtciparu) rakstzīmes.

Izmantojot jūsu piemēru, / the-matrix / trailers /

Google uztver URI kā matricas piekabes. Pielietojums , pieturas vārds, parasti tiek noraidīts, jo tam ir maza vērtība vai nav nekādas vērtības, jo tā ir daļa no zināmas frāzes Matrica, atslēgvārdi tiek uztverti kopā kā frāze, un to svars būs lielāks nekā atsevišķi. Pielietojums piekabe iepriekšējās meklēšanas vēsturē un valodniecības analīzē tiktu uzskatīts par frāzes modificētāju Matrica un tā svars būtu lielāks nekā pati frāze. Tas būtu taisnība arī matricas atsauksmes un citas līdzīgas situācijas.

Apsveriet arī meklēšanas vēsturi un SERP saišu VKS. Kad kāds meklē matrica, viņus neinteresē Matrica pati par sevi, bet kaut kas par Matricu. Viņi meklē papildu informāciju. Parasti meklējiet matrica var radīt VKS SERP saitēs, kas dod papildu norādes. Piemēram, URI varētu būt / the-matrix / reviews /, / the-matrix / rating /, / the-matrix / trailer /, / the-matrix / cast / utt. Katrā lappusē vienā laika periods. Tas piešķir svaru konkrētajai lapai un atslēgvārdu modifikatoriem. Kā arī vispārējā meklēšanā matrica, atslēgvārdi vērtējumi var darboties labāk nekā cast, atsauksmes var darboties labāk nekā vērtējumi, un piekabe var darboties labāk nekā atsauksmes. Bet ko tad, ja lietotājs neko nenoklikšķina, bet veic vēl kādu konkrētāku meklēšanu? Google bieži meklē meklēšanas norādījumus, izmantojot sekundārus meklējumus, un uzskata to par svarīgu meklēšanas nodomam. Šajā gadījumā meklēšana ir precīzāka, cenšoties izveidot vēlamāku SERP saišu sarakstu. Sekundārā meklēšanas vēsture var atspoguļot atslēgvārdu modifikatoru sākotnējo SERP VKS vai nē. Tomēr tie tiek svērti daudz vienādi un var būt nedaudz augstāki par modifikatoriem, lai meklētu tikai matrica.

Google paņems URI un sadalīs to slīpsvītrā [/] un savā ziņā uztvers URI segmentus kā masīvu. Pirmais segments sver vairāk nekā otrais, kas sver vairāk nekā trešais. Tas ir balstīts uz pieņēmumu, ka apakškatalogi pēc tēmas ir šaurāki nekā vecākiem, tāpēc pieprasa šaurāku meklēšanas nolūku un jo tālāk no mājas lapas atrodas cita lapa, jo mazāk svarīga tā ir. Tātad svērs URI / matrica / piekabe / matrica vairāk par piekabe. Ja jums būs URI / piekabe / matrica / piekabe būs lielāka par matrica. Paturiet to prātā.

Apsveriet, kā cilvēki meklē. Ievadot meklētāju, meklēšanas vaicājums vienmēr tiek sakārtots pēc svarīguma no kreisās uz labo. Tas ir tāpēc, ka lielākajai daļai no mums mēs iemācāmies lasīt no kreisās uz labo pusi un tādējādi sākam domāt no kreisās uz labo pusi. Protams, ir izņēmumi citām valodām, kurus Google ņem vērā. Tātad meklēt matricas piekabe nosvērtu frāzi matrica augstāk par piekabe. Bet piekabe mēs zinām, ka tas ir modifikators, un tam ir lielāks svars. Google pārkārto meklēšanas vaicājumu pēc svara (un tādējādi ar nolūku) piekabināt matricu. Kopš matrica ir zināma frāze, efekts būtu piekabe "matrica". Meklēt matricas piekabe rezultātā radīsies cits SERP saraksts nekā tad, ja visu meklēšanas vaicājumu būtu citējis kā "matricas piekabe". Tā kā Google patīk precīzas nolūka (pievērsiet uzmanību šim vārdam) atbilstības, nevis precīzas atslēgvārdu atbilstības, jebkura atbilstība piekabe "matrica", tiktu novietoti augstāk SERP.

Labi. Tas ir tikai nedaudz sarežģītāk par šo, bet tas viss ietilpst vienā sfērā. Tātad jūs saprotat manu viedokli.

Ātri pāriet uz dažiem citiem punktiem.

Lūdzu, saprotiet arī to, ka ne vienmēr URL / URI ir jāievieto atslēgvārdi, title tagu vai h1 lai iegūtu tādu pašu vai labāku efektu. Piemēram, es atklāju, ka atslēgvārdi ir atrodami description metatags un h2, h3utt. tagi var pārspēt URL / URI atrodamos atslēgvārdus, kurus dažkārt pilnībā ignorē, jo tie ir tik izplatīti. Šajā gadījumā es šos atslēgvārdus neliktu URL / URI, title tagu vai h1 tagā, bet h2 un iespējams h3 tagus. Iemesls tam ir vienkāršs. Pārmērīga atslēgvārdu izmantošana daudzās vietnēs var kaitēt. Šajā gadījumā Google ignorēs dažus atslēgvārdus, kas tiek izmantoti šajos tagos, un dod priekšroku tiem saturā, līdz ar to h2 tagu. Tas ir tāpēc, ka Google vienkārši dod priekšroku satura norādēm, nevis atslēgvārdu optimizācijai, īpaši ļoti izplatītai atslēgvārdu optimizācijai, kas nav pietiekami spēcīga, lai attaisnotu sodu vai pat otru izskatu.

Bet kā ar vietnes izveidi cilvēkiem? Tas nozīmētu, ka URI / matrica / piekabe / būtu vēlamāka? Jā, tā varētu būt. Jums jānosver, vai kāds manuāli ievadīs jūsu URL / URI vai izmantos to paredzamā veidā. Ja atbilde ir jā, tad / matrica / piekabe / varētu būt vislabākā. Ja atbilde ir nē, tad / trailer / the-matrix / var dot vairāk meklēšanas lietotāju ar skaidru nolūku. Tas viss ir par lietotāju vēlmju saskaņošanu vairāk nekā jebkas cits. Jo neviena optimizācijas summa nevar pārspēt augstu atlēcienu līmeni.

Tātad, lai būtu konkrētāk, vai / matrica / piekabe / ir labāka vai sliktāka par / piekabi / matricu /? Tas būtu atkarīgs no meklēšanas vēstures. Mēs nekad to nekad nevaram droši zināt. Bet visticamāk, ka / trailer / the-matrix / vairāk atbilst lietotāja nodomiem nekā / the-matrix / trailer / pamatojoties uz to, ko mēs zinām par to, kā Google apstrādā meklēšanu. Vienīgais veids, kā droši zināt, ir eksperimentēt.

Apsvērsim vēl vienu galīgo apsvērumu. Cik man būtu The Matrix treileru? Viens. Bet cik daudz piekabju man būtu manā vietnē? Vairāk nekā vienu (es pieņemu). Tāpēc ir loģiski, ka piekabes būtu TLD (augstākā līmeņa direktorijs), pamatojoties uz šo jēdzienu. Organizatoriski tam var būt lielāka jēga.

  • Es vēlos, lai es varētu balsot vairāk nekā vienu reizi. Lielisks izskaidrojums.
  • 1 Vai var droši uzskatīt, ka arī rīvmaize ir svērta no kreisās uz labo?
  • 1 @Hector Esmu lasījis Google oriģinālos izpētes darbus, patentus, grāmatas, baltās grāmatas utt. Un strādājis pie nišas meklētājprogrammām, kas izveidotas ar lielāko meklētājprogrammu plūsmām, izmantojot Harvest. Kā arī esmu lasījis dažādas vietnes ar daudz sāls. Problēma ir tā, ka tikai nedaudziem no viņiem ir kāda īpaša vērtība, un pat labākie to kļūdās un jūs maldinās. Dažreiz tas ir tīši, un dažreiz tas notiek nezināšanas dēļ. Galvenais ir izvairīties no vietnēm, kas papagailē citas vietnes. Dīvainā kārtā šī ir labākā vietne specifiskai informācijai.
  • 3 @Hector Jums jāatceras, ka gandrīz visas SEO vietnes jums kaut ko pārdod vai mēģina iegūt reklāmas pīrāga šķēli. Es atjauninu savas lapas (kuras pašlaik ir nepieredzējušas), bet būs tikpat informatīvas kā šī ziņa caur un caur. Es ceru, ka tas tiks darīts ziemā. Ņemot vērā to, MOZ, iespējams, ir labākais, lai gan es uzskatu neprecizitātes, kas, šķiet, ir pretrunā ar to, ko Google patiesībā saka. Tāpat turieties tālāk no tām vietnēm, kurās pārāk daudz tiek citēts Mets Kutts. Mets nav problēma. Vienkārši cilvēki pārāk bieži nepareizi izlasa viņa teikto un pārāk daudz koncentrējas uz vienu informācijas avotu.
  • 2 @Ratan Jūsu piemēros nav nekā nepareiza, izņemot to, ka no semantikas viedokļa Google izmanto / kā atdalītāju un apvieno terminus starp tiem. Tāpat domājiet par katru direktorijas / hierarhijas līmeni kā kaut ko līdzīgu tagam emuārā. Jūsu piemēri ir lieliski, taču tie nedod tik lielu potenciālu.

Kad es meklēju Google meklēšanu "Matrix Trailer", es saņemu 8 vietnes, kas neievēro nevienu no URL ieteikumiem. 1, kas daļēji seko. 1 Tas ir gandrīz precīzi šiem ieteikumiem.

Piemēram, tas ir IMDB URL: http://www.imdb.com/title/tt0133093/trailers. Pat nesaka "Matrica". Bet IMDB ir autoritāte attiecībā uz filmām, aktieriem uc ... Mans viedoklis, neaizmirstiet, izveidojot perfektu URL. Galvenie faktori ir jūsu vietnes atbilstība un autoritāte.

Lai gan man ir pazīstams jēdziens, ka Google ierindo apakšdirektorijus un to pakārtotos direktorijus ar dažiem svērumiem, pamatojoties uz viņu pozīciju direktoriju struktūrā, es esmu diezgan pārliecināts, ka tas ir faktiskais faktors.

Vienā brīdī tas bija faktors, taču tas notika pirms kofeīna ieviešanas, Google pašreizējā meklēšanas indeksa. Senākos laikos, pirms Igija Azalea un automašīnām bez vadītāja, Google, to atklājot, nepievienoja „pilnīgu” punktu skaitu un svaru, tādējādi viņi izdarīja pirmās kārtas pieņēmumus par lapām - un viens no tiem bija tāds, ka, ja jūsu mājas lapa ( noklusējuma lapa dokumenta saknē) PageRank (PR) bija 5, tad example.com/1leveldown/subpage.htm lapas rangs būtu 4 un example.com/1leveldown/2levelsdown/subpage.htm būtu PR 3.

Šos novērojumus es un citi pārbaudījām vēl un vēl, bet tas bija jau sen. Un pēc pašreizējām lapu indeksēšanas un vērtēšanas metodēm tam vairs nav īstas vajadzības.

URL nosaukšana tagad ir ievērojami pārvērtēta, jo agrāk tā bija ārkārtīgi efektīva pietiekama mēroga vietnēs.

Aplūkojot augšējā atbildē izmantotos piemērus, redzēsit, ka SERP īsti nerīkojas nekādā saistībā ar URL struktūru. Tā vietā jūs bieži atradīsit to, ka SERPS modelē sistēmas apjomu un autoritāti iekšējā saistīšana uz lapu.

Viena lieta, ko es jums varu pateikt, ir tas, ka šajās dienās "treileris" izvirza lielu zināšanu diagrammas ierakstu, kas kā pirmais rezultāts ir vienkārši ievietots treilera YouTube. "Piekabe" vispirms izvirza daudzus YouTube saites.

Manas atbildes uz jūsu jautājumiem:

Vai taisnība, ka resursiem, kas atrodas dziļāk URL hierarhijā, mēdz būt mazāk svarīgi, salīdzinot tos ar citu vietņu URL?

"Jā, visas citas lietas ir vienādas, kādas tās nekad nav, tāpēc patiesībā nē."

Vai šai SEO optimizācijai ir vērts upurēt jēgpilnu, nevainojamu hierarhiju?

"Absolūti nē. Piešķiriet Google vienotu hierarhiju, lai tā varētu pārmeklēt vietas, kur visam ir metadati un teksts lapā, kas atspoguļo lietotāja vajadzības, kuru mēģināt apmierināt ar lapu, un jūs gūsiet peļņu.

Jūsu jautājumi bija:

Vai taisnība, ka resursiem, kas atrodas dziļāk URL hierarhijā, mēdz būt mazāk svarīgi, salīdzinot tos ar citu vietņu URL?

Nē, tā nav taisnība, jo viss ir atkarīgs no mērķa satura un sākotnējā atslēgvārda.

Vai šai SEO optimizācijai ir vērts upurēt jēgpilnu, nevainojamu hierarhiju?

Jā, viss atrodas vienā domēnā. Skatieties, kad Google piešķir jums ne tikai lapas rangu example.com iegūt lapas rangu, bet to iegūst visas saites un apakšdomēns.

strādāja par jums: Charles Robertson | Vēlies ar mums sazināties?