300 zirgspēku un vilšanos? 2018. gada Infiniti Q50 3.0T pārskats

Es vadu vietni, kurā tiek sniegti metadati no specializētas elektronikas (tādi dati kā svars, izmēri, pielietojums, spriegums utt.). Tas arī salīdzina produktus, izmantojot visus šos datus, lai lietotājs varētu redzēt atšķirības starp diviem produktiem.

Man ir daudz jāstrādā, lai izpētītu šos datus un ievietotu tos savas vietnes strukturētā datu bāzē.

Konkurents izgatavoja "rāpuļprogrammas robotu", kas automātiski skenē manu vietni, satver visus strukturētos datus un atkārto tos savā vietnē. Viņš lasa HTML kodu, parsē tabulas, iegūst vērtības, viņš iegūst pat “rīka padomu aprakstus”, kurus es uzrakstīju katram īpašumam, un ar visiem šiem datiem viņš baro pats savu datu bāzi, lai varētu attēlot datus, kā vēlas.

Es ievietoju jaunu produktu savā vietnē, un produkts atrodas konkurentu vietnē dažas stundas vēlāk. Tā nav "vienkārša HTML kopija". Viņš parsē visus datus un strukturēti tos saglabā. Viņš pat lejupielādē visus produkta attēlus un mitina tos savā serverī. Tas ir diezgan uzlabots kāpurķēžu robots.

Es gribu veidu, kā neļaut konkurentam to darīt.

Es plānoju vienkārši bloķēt visu viņa valsti savā WebServer, bet es domāju, ka tas viņu neapturēs ļoti ilgu laiku. Viņš, iespējams, atradīs veidu, kā to apiet (es gribētu).

Es arī nevaru vienkārši “attēlot kodu” savus datus, jo tas ir ļoti SEO nedraudzīgs. Un man vajag, lai Google mani atrod.

Ko tu iesaki?

  • "lai viņš varētu attēlot datus, kā viņš vēlas." - Tātad "klonētā" vietne to dara Skaties fiziski atšķiras HTML struktūrā; vairāk nekā tikai izmaiņas CSS?
  • 3 @DanielRibeiro Tālāk ir sniegtas dažas taisnīgas atbildes. Es iesaku izpētīt jūsu servera žurnālus un mēģināt noteikt dažus to robota indikatorus / pēdas, iespējams, izveidojot medus podu ar datiem, kurus tikai viņi, iespējams, pieprasīs. Pamatojoties uz šī pieprasījuma servera žurnālu, jūs, iespējams, pamanīsit IP modeli, lietotāja aģentu, ilgumu (roboti bieži ir daudz ātrāki nekā cilvēku apmeklētāji), secīgus / ātrus pieprasījumus utt. , pievienojiet un konfigurējiet tīmekļa servera drošības moduli.
  • 1 Jā @MrWhite, vietne fiziski "izskatās" savādāk ... Problēma ir mana satura kopija, strukturētie dati ... Man nav problēmu ar savu izkārtojumu vai noformējumu ... Problēma ir biznesa dati.
  • "Viņš lasa HTML kodu" - vai jūs izmantojat kādu JavaScript, lai ģenerētu savu saturu? Tikai jautājums, cik sarežģīts ir rāpuļprogramma ... vai viņš burtiski vienkārši nokasa HTML atbildi, vai arī viņš izmanto pārlūku bez galvas, lai nokasītu kausēts izeja?

Parasti izsmalcināti roboti var pārmeklēt visu, kas sabiedrībai redzams. Vietas var viltot, IP adreses var maskēt, captcha-solves var iegādāties.

Jūsu labākais risinājums šajā gadījumā var būt likumīgs. Vispirms nosūtiet uzņēmumam Google DMCA noņemšanas pieprasījumu, lai viņa vietne tiktu noņemta no Google meklēšanas, tādējādi palēninot viņa darbību. Ja konkurents atrodas jurisdikcijā, kurai varat likumīgi pieskarties, jūs varētu arī apsvērt iespēju sarunāties ar advokātu par fiktīvu autortiesību slazdu izveidošanu.

Šim līdzīgajam pavedienam ir padomi, ja konkurents konkurents nozog jūsu saturu un ierindojas Google meklēšanā virs jums, kas varētu būt noderīgi:

Cita vietne atspoguļo un meklēšanas rezultātos ierindojas virs manas vietnes

Es neesmu jurists, un tas nav juridisks padoms.

  • 1 Ja autortiesības uz Wikipedia ir pareizs, autortiesību slazdu idejai ir iespējama pielīmēšanas vieta. "Lai parādītu kopēšanu, var izmantot fiktīvus ierakstus, taču, lai pierādītu likumīgu pārkāpumu, materiālam ir jāpierāda arī autortiesības. Tomēr Feist pret Rural un Fred Worth tiesas prāvas dēļ, kur Augstākā tiesa nolēma, ka" tikai informācija bez minimāla oriģinālā radošuma nevar aizsargāt autortiesības, ir ļoti maz gadījumu, kad autortiesības ir pierādītas. "
  • Labs punkts, @ChrisRogers. Šķiet, ka tādā gadījumā tas ir atkarīgs no tā, vai attiecīgajiem datiem ir oriģināls radošums.
  • @ChrisRogers Prasība, uz kuru atsaucāties, bija saistīta ar tālruņu grāmatām, un tai nav nekāda sakara ar Autortiesību likumiem saistībā ar internetu.
  • Vai varat paskaidrot, kā a fiktīvs autortiesību slazds varētu būt saistīts ar OP datu nokasīšanas problēmu viņa vietnē?
  • 2 @elbrant OP izveido fiktīvu ierakstu, konkurents kopē ierakstu, tad OP ir pārliecināts pierādījums tam, ka otra vietne vienkārši kopē viņu, un viņi nevarēja saprast, ka viņi neatkarīgi apkopoja datus no citiem avotiem.

Šādi džeki nonāca tiešsaistē gandrīz tajā brīdī, kad piedzima internets. Pāris pārdomātu iespēju:

  1. Jūs varētu uzrakstīt kodu CGI / Perl vai PHP, kas izsauc jūsu datus (un lapas) "lidojumā". Datu ievietošana produktu failos vai dataBases, nevis standarta HTML, var kavēt viņu robotu iespēju nozagt datus. Protams, viņiem varētu būt kāds darbinieks, kurš ierodas jūsu vietnē un iegūst datus, taču tas nebūs tik pievilcīgs kā robotu programma, kas nozog datus. Ja tas notiek, tas nozīmē, ka lapas tiek ražotas tajā brīdī, tāpēc nav "statisku" lapu, no kurām varētu zagt. Nav ideāls, bet tam ir potenciāls.
  2. Jūs varētu izmantot .htaccess mēģināt: bloķēt bezsaistes pārlūkprogrammas un BadBots vai atteikt apmeklētājus pēc IP adreses. Tas varētu viņus nedaudz apturēt.
  3. Jūs varat autortiesības uz savu vietni. Jums jāsaprot, ka produkta specifikācijas (izmērs, svars, izmērs utt.) Nevar tikt aizsargātas ar autortiesībām. Ikviens, kurš piedāvā produktu savā vietnē, ir tiesīgs izmantot šo informāciju. Tomēr jūs norādījāt, ka jūs esat autors "rīku padomi" un ka šos aprakstus apkopo arī robots. To jūs varat ievietot kā autortiesību pārkāpumu. Izpētiet to. (Piezīme. Autortiesību noteikumi dažādās valstīs atšķiras.)
  • 1 CGI / Perl / PHP palaiž servera pusi un pēc tam nosūta klientam standarta HTML, lai tas nedarbotos ... Ciktāl tas attiecas uz AJAX lietošanu, ar mūsdienu rīku palīdzību ir ļoti viegli uzrakstīt robotu, kas parsē un izpilda JavaScript .
  • Kā norāda @MaximillianLaumeister, PHP un tamlīdzīgu līdzekļu izmantošana netraucēs kādam nokasīt datus no iegūtās lapas, izmantojot JavaScript uc. .htaccess gan.

Tehniski jūs nevarat novērst šo darbību.

Lai gan jūs varat darīt kaut ko tādu, lai kaut kā "nojauktu" šīs dublikātus vai zemas kvalitātes lapas, kas var kaitēt jūsu rangam.

  • Jūs varat ievietot kanonisko saiti savā iekšpusē body tagā un galvenā satura sadaļā.
  • Jūs varat ievietot firmas saiti savā galvenajā saturā, lai klonētajam saturam būtu saite uz jūsu vietni.
  • 2 Tas nedarbosies, jo konkurenta robots ir pietiekami gudrs, lai aizstātu visas saites no maniem datiem. Turklāt viņš nekopē "lapu", viņš kopē "datus" ... Ja man ir produkts, kas saka "Darba spriegums: 24V", viņš parsēs šo informāciju un saglabās tikai "24" sadaļā "Darba spriegums". "produkta īpašums.

strādāja par jums: Charles Robertson | Vēlies ar mums sazināties?

noderīga informācija