Guida per principianti alla prevenzione del rottame del contenuto del blog in WordPress

Guida per principianti alla prevenzione del rottame del contenuto del blog in WordPress / Guida per principianti

Se scrivi contenuti originali giorno dopo giorno, sei già consapevole del fatto che i tuoi post finiranno su un gruppo di siti SPAM in pochi giorni, a volte anche pochi minuti. Alcuni utenti hanno anche notato che il sito con contenuti rubati superava il post originale. È molto frustrante come proprietario di un sito Web vedere che qualcuno sta rubando i tuoi contenuti senza autorizzazione, monetizzandoli, superandoli in SERP e rubando il tuo pubblico. Content Scraping è un grosso problema in questi giorni considerando che è così facile per qualcuno rubare i tuoi contenuti. In questo articolo parleremo di scraping del contenuto del blog, come catturare scrapers del contenuto, come trattare gli scrapers del contenuto, come ridurre e prevenire il scraping dei contenuti, come sfruttare il scraping dei contenuti, come guadagnare dai scrapers dei contenuti e il contenuto è sempre buono?

Cos'è lo scraping del contenuto del blog?

Lo scraping del contenuto del blog è un atto solitamente eseguito con script che estrae il contenuto da numerose fonti e lo trascina in un unico sito. È così facile ora che chiunque può installare un sito WordPress, inserire un tema libero o commerciale e installare alcuni plugin che andranno a grattare i contenuti dei blog selezionati, in modo che possano essere pubblicati sul loro sito.

Perché stanno rubando il mio contenuto?

Alcuni dei nostri utenti ci hanno chiesto perché stanno rubando i miei contenuti? La semplice risposta è perché sei FANTASTICO. La verità è che questi scrapers contenuti hanno secondi fini. Di seguito sono riportati solo alcuni dei motivi per cui qualcuno dovrebbe analizzare i tuoi contenuti:

  • Commissione di affiliazione - Ci sono alcuni sporchi marketer affiliati là fuori che vogliono solo sfruttare il sistema per guadagnare qualche soldo in più. Utilizzeranno i tuoi contenuti e i contenuti di altri per portare traffico al loro sito attraverso il motore di ricerca. Questi siti di solito sono indirizzati verso una nicchia specifica, quindi hanno prodotti correlati che stanno promuovendo.
  • Lead Generation - Spesso vediamo avvocati e agenti immobiliari farlo. Vogliono sembrare leader del settore nelle loro piccole comunità. Non hanno la larghezza di banda per produrre contenuti di qualità, quindi escono e raccolgono contenuti da altre fonti. A volte, non sono nemmeno a conoscenza di questo perché stanno pagando alcuni $ 30 / mese di merda per aggiungere contenuti e aiutarli a ottenere una migliore SEO. Ne abbiamo incontrati parecchi in passato.
  • Entrate pubblicitarie - Alcune persone vogliono solo creare un "hub" di conoscenza. Un one-stop-shop per gli utenti in una nicchia specifica. Se avessi un soldo per ogni volta che qualcuno lo avesse fatto con i nostri contenuti, avremmo avuto qualche centinaio di penny. Spesso notiamo che il contenuto del nostro sito viene raschiato. Il raschietto risponde sempre, stavo facendo questo per il bene della comunità. Tranne il sito è intonacato con annunci.

Questi sono solo alcuni dei motivi per cui qualcuno potrebbe rubare i tuoi contenuti.

Come catturare i raschiatori di contenuti?

La cattura di scrapers del contenuto è un compito noioso e può richiedere molto tempo. Ci sono alcuni modi in cui puoi utilizzare per catturare gli scrapers del contenuto.

Cerca su Google con i titoli dei tuoi post

È così doloroso come sembra. Probabilmente questo metodo non vale la pena, specialmente se stai scrivendo di un argomento molto popolare.

Trackbacks

Se aggiungi dei link interni nei tuoi post, noterai un trackback se un sito ruba i tuoi contenuti. In questo modo è più o meno il raschietto che ti dice che stanno raschiando i tuoi contenuti. Se si utilizza Akismet, molti di questi trackback verranno visualizzati nella cartella SPAM. Di nuovo, questo funzionerà solo se hai i link interni nei tuoi post.

Strumenti per i Webmaster

Se usi gli strumenti per i webmaster di Google, probabilmente conosci i Link alla tua pagina del sito. Se guardi sotto "Traffico", vedrai una pagina che dice Link al tuo sito. Probabilmente i tuoi raschiatori saranno tra i migliori. Avranno centinaia se non migliaia di link alle tue pagine (considerando che hai collegamenti interni).

FeedBurner Usi non comuni

Se hai impostato Feedburner per il tuo blog WordPress, puoi vedere alcuni usi non comuni. Nella scheda Analizza in Feed Statistiche, vedrai "Usi non comuni". Lì vedrai una lista di siti.

Come gestire i contenuti di Scrapers

Ci sono pochi approcci che le persone prendono quando si tratta di scrapers di contenuti. The Do Nothing Approach, uccideteli tutti avvicinatevi, approfittatene.

L'approccio Do Nothing Nothing

Questo è di gran lunga l'approccio più semplice che puoi adottare. Di solito i blogger più popolari lo raccomandano perché impiega MOLTO tempo a combattere i raschietti. Questo approccio suggerisce semplicemente che "invece di combatterli, passa il tuo tempo a produrre contenuti di qualità ancora maggiore e divertirsi". Ora, ovviamente, se si tratta di un blog ben noto come Smashing Magazine, CSS-Tricks, Problogger o altri, allora non devono preoccuparsene. Sono siti di autorità agli occhi di Google.

Tuttavia, durante l'aggiornamento di Panda, sappiamo che alcuni buoni siti sono stati contrassegnati come scraper perché Google riteneva che i loro scraper fossero contenuti originali. Quindi questo approccio non è sempre il migliore secondo noi.

Uccidili tutti Avvicinati

L'esatto opposto del "Do Nothing Approach". Con questo approccio, è sufficiente contattare il raschietto e chiedere loro di ridurre il contenuto. Se si rifiutano di farlo o semplicemente non rispondono alle tue richieste, allora presenti un DMCA (Digital Millennium Copyright Act) con il loro host. Nella nostra esperienza, la maggior parte dei siti web di scraping non ha un modulo di contatto disponibile. Se lo fanno, quindi utilizzarlo. Se non hanno il modulo di contatto, allora devi fare una ricerca Whois.

Puoi vedere le informazioni di contatto sul contatto amministrativo. Di solito il contatto amministrativo e tecnico è lo stesso. Il whois mostra anche il registrar di domini. Le società di hosting web e i registrar di domini più noti hanno moduli DMCA o e-mail. Puoi vedere che questa persona specifica è con Hostgator a causa dei loro server dei nomi. HostGator ha un modulo per i reclami DMCA. Se il server dei nomi è qualcosa come ns1.theirdomain.com, allora devi scavare più a fondo eseguendo ricerche IP inverse e cercando gli IP.

Puoi anche utilizzare un servizio di terze parti per DMCA.com per le richieste di rimozione.

Jeff Starr nel suo articolo suggerisce che dovresti bloccare gli IP del cattivo ragazzo. Accedi ai tuoi log per il loro indirizzo IP, quindi bloccalo con qualcosa di simile nel tuo file .htaccess di root:

Rifiuta da 123.456.789

Puoi anche reindirizzarli a un feed fittizio facendo qualcosa del genere:

RewriteCond% REMOTE_ADDR 123 \ .456 \ .789 \. RewriteRule. * Http://dummyfeed.com/feed [R, L]

Puoi diventare davvero creativo qui come suggerisce Jeff. Mandali a feed di testo molto grandi completi con Lorem Ipsum. Puoi inviare loro immagini disgustose di cose cattive. Puoi anche inviarli di nuovo al loro server causando un ciclo infinito che farà crashare il loro sito.

L'ultimo approccio che prendiamo è di approfittarne.

Come trarre vantaggio dai contenuti di Scrapers

Questo è il nostro approccio nel trattare con i content scrapers, e si rivela abbastanza bene. Aiuta il nostro SEO e ci aiuta a fare soldi extra. La maggior parte degli scraper usa il tuo feed RSS per rubare i tuoi contenuti. Quindi queste sono alcune delle cose che puoi fare:

  • Collegamento interno - Devi interconnettere il CRAP dai tuoi post. Con la funzione di collegamento interno in WordPress 3.1, ora è più facile che mai. Quando hai collegamenti interni nel tuo articolo, ti aiuta ad aumentare le visualizzazioni di pagina e a ridurre la frequenza di rimbalzo sul tuo sito. In secondo luogo, ti ritrovi a ritroso dalle persone che stanno rubando i tuoi contenuti. Infine, ti permette di rubare il loro pubblico. Se sei un blogger di talento, comprendi l'arte del collegamento interno. Devi posizionare i tuoi link su parole chiave interessanti. Fai in modo che l'utente faccia clic su di esso. Se lo fai, anche il pubblico del raschietto farà clic su di esso. Proprio così, hai preso un visitatore dal loro sito e li hai riportati dove avrebbero dovuto essere in primo luogo.
  • Parole chiave di collegamento automatico con collegamenti di affiliazione - Ci sono alcuni plugin come Ninja Affiliate e SEO Smart Links che sostituiranno automaticamente le parole chiave assegnate con i link di affiliazione. Ad esempio: HostGator, StudioPress, MaxCDN, Gravity Forms << These all will be auto-replaced with affiliate links when this post goes live.
  • Diventa creativo con RSS Footer - Puoi utilizzare il Footer RSS o SEO SEO di Yoast Plugin per aggiungere elementi personalizzati al tuo RSS Footer. Puoi aggiungere qualsiasi cosa tu voglia qui. Conosciamo alcune persone a cui piace promuovere i propri prodotti ai propri lettori RSS. Quindi aggiungeranno banner. Indovina cosa, ora quei banner appariranno anche sul sito di questi scraper. Nel nostro caso, aggiungiamo sempre un piccolo disclaimer in fondo ai nostri post nei nostri feed RSS. Si legge semplicemente come "Come mettere il tuo sito WordPress in stato di sola lettura per le migrazioni e la manutenzione del sito è un post di: WPBeginner che non può essere copiato su altri siti." Così facendo, otteniamo un backlink all'articolo originale dal sito di Scraper che consente a google e altri motori di ricerca di sapere che siamo autorizzati. Inoltre, consente agli utenti di sapere che il sito sta rubando i nostri contenuti. Se sei bravo con i codici, allora puoi diventare totalmente pazzo. Come aggiungere post correlati solo per i tuoi lettori RSS e molte altre cose. Consulta la nostra guida per manipolare completamente il tuo feed RSS WordPress.

Come puoi ridurre il rottame del contenuto del blog e probabilmente prevenirlo

Considerando se si prende il nostro approccio di molti collegamenti interni, aggiungendo link di affiliazione, banner rss e tali possibilità sono che si ridurrà il raschiamento dei contenuti in buona misura. Se si prende in considerazione il suggerimento di Jeff Starr di reindirizzare gli scrapers del contenuto, anche questo fermerà quei raschietti. A parte ciò che abbiamo condiviso sopra, ci sono alcuni altri trucchi che puoi usare.

Feed RSS completo e riepilogativo

C'è stato un dibattito nella comunità dei blog se avere un feed RSS completo o un feed RSS riassuntivo. Non forniremo molti dettagli su questo dibattito, tuttavia uno dei PRO di un feed RSS di solo sommario è che si impedisce il raschiamento dei contenuti. Puoi modificare le impostazioni andando sul tuo pannello di amministrazione di WordPress e andando in Impostazioni »Lettura. Quindi modifica l'impostazione Per ciascun articolo di un feed show: Riepilogo.

Nota: abbiamo un feed completo perché ci interessa più dei nostri lettori RSS che degli spammer.

Trackback SPAM

Trackbacks e Pingbacks hanno sicuramente avuto grandi usi, ma ora vengono costantemente maltrattati. Spesso i temi mostrano trackback e pingback sotto o tra i commenti. Questo dà allo spammer un incentivo a raschiare il tuo sito e inviare i riferimenti. Se lo approvi per errore, ottengono un backlink e menzioni dal tuo sito. Ecco come disabilitare i trackback su tutti i post futuri. Ecco un articolo che ti mostrerà come disabilitare trackback e ping su post WordPress esistenti.

Il contenuto è sempre buono?

Può essere. Se vedi che stai facendo soldi dal sito del raschietto, allora certo che può essere. Se vedi molto traffico dal sito di un raschietto, allora può essere. Nella maggior parte dei casi, tuttavia, non lo è. Dovresti sempre provare a far decollare i tuoi contenuti. Ma ti renderai conto che man mano che il tuo blog diventa più grande, è quasi impossibile tenere traccia di tutti gli scraper dei contenuti. Continuiamo a inviare reclami DMCA, tuttavia sappiamo che ci sono un sacco di altri siti che stanno rubando i nostri contenuti che semplicemente non possiamo tenere il passo con.

Quali sono i tuoi pensieri? Usi altri meccanismi per prevenire il raschiamento dei contenuti? Mi piacerebbe sentire i tuoi pensieri.