DUPLIKACIJA TEKSTA

ili duplikacija sadržaja

Ovde govorimo o duplikatu sadržaja, koji može dovesti do problema, pa i kazne za neke sajtove (čak i bez krađe teksta)


„Dvostruki sadržaj“ je tehnički pojam iz oblasti optimizacije pretraživača. Termin opisuje duplirani sadržaj na Internetu: Isti sadržaj se može pristupiti pod različitim URL-ovima, pa ga Google indeksira pod više URL-ova.


Dvostruki sadržaj nije jednostavno izjednačiti sa plagijarizmom drugog teksta, već ima praktično značenje u svetu SEO-a koje prevazilazi aproprijaciju intelektualnih dostignuća drugih.


Budući da se na Internetu duplicirani sadržaj stvara ne samo namernim ili nehajnim kopiranjem sadržaja nezavisnih proizvođača, već i netačnom konfiguracijom vašeg sistema za upravljanje sadržajem ili vašeg veb servera, kroz stvaranje sveobuhvatnih struktura za niz članaka ili potpuno legalno usvajanje opisa članaka.


Drugim rečima: Budući da algoritmi pretraživača ne mogu da procene suštinu teksta, već samo niz reči, veb sadržaj se takođe klasifikuje kao duplirani sadržaj ako bi zaista imalo smisla da ga koristite dva puta ili više (besmislen ili jednostavno opisan). Akcenat je stavljen na „bi“, jer operateri veb lokacija moraju računati sa nedostacima ako Google otkrije duplicirani sadržaj na njihovim stranicama:





Zašto bi trebalo izbegavati duplirane sadržaje?

Ako Google popisivač skenira veb lokaciju u svrhu indeksiranja za pretraživač i pronađe duplikat sadržaja na ovoj veb lokaciji, to ima barem negativan uticaj na rangiranje u rezultatima pretrage, a u najgorem slučaju može dovesti i do isključenja od indeksiranja.


Ovim pristupom Google promoviše ciljeve koje treba postići izlaznim rezultatima i sortiranjem rezultata pretraživanja:


Pravog plagijarizma teksta treba izbegavati iz razloga autorskih prava, ali Google ne želi (ne može, ne sme) istraživati ko je ovlašćeni autor

Google želi da pretraživaču pruži najbolji odgovor na njegov upit na vrhu rezultata pretrage!

I to je najbolji odgovor, jer nakon Google-ovog iskustva frustrira korisnike što moraju da biraju između dve stranice sa delimično dupliranim sadržajem

Devalvacija dupliranog sadržaja takođe je namenjena sprečavanju neželjenih poruka ključnih reči (fraza) kojima se treba manipulisati rangiranjem

Zbog toga je jedinstvena kontrola tekstova jedna od glavnih aktivnosti algoritama za pretraživanje i indeksiranje pretraživača, jer jedinstvenu kontrolu vrše algoritmi, a ne ljudi, a pretraživač sortira samo prema (pretpostavljenim) kriterijumima korisnika umesto da procenjuje sadržaj, on pod okolnostima dovodi do devalvacije čak i tamo, gde bi objavljivanje duplikata sadržaja zapravo bilo sasvim u redu.


Google je toga svestan, u podršku se navodi i da „duplirani sadržaj na veb lokaciji nije razlog za preduzimanje radnji protiv ove stranice ako stranica ne ostavlja utisak da se sa rezultatima pretraživača treba manipulisati ili da se korisnici obmanjuju ”. Slede uputstva o postupanju sa „legalnim“ duplikatom sadržaja (koji će biti opisani u nastavku); ako se ne poštuju, Google će se potruditi da u rezultatima pretrage prikaže samo jednu verziju dupliranja.


Međutim, da li će stranica stvoriti utisak da manipuliše rezultatima pretraživača ili obmanjuje korisnike, odlučuje Google; Ako odluke o posledicama dupliranog sadržaja ne želite da prepustite Google-u, bilo bi dobro da na svojim stranicama proverite da li postoji duplikat sadržaja.


duplikat_sadržaja

Kako nastaje duplirani sadržaj: vrste i uzroci

Dvostruki sadržaj može nastati iz sledećih radnji ili propusta:


1. Usvajanje sadržaja treće strane

Ovde se radi o plagijarizmu poznatom iz sveta štampanih tekstova, prisvajanju stranih intelektualnih sadržaja. Svako ko nešto objavi na Internetu mora poštovati potpuno iste granice u pogledu tekstova trećih lica koja se odnose i na knjige, disertacije i sva ostala štampana dela: taj tekst mora biti označen kao citat, originalno delo i autor moraju biti imenovani.


Za razliku od tekstova koji su dostupni samo u štampi (koji se neprestano smanjuju, ali i dalje postoje), plagijarizam se može brzo pronaći na Internetu. Ovo se odnosi i na prevode koji su preuzeti nepromenjeni od Google Translator-a. Ovi „pravi plagijarizmi“ ne samo da dovode do devalvacije od strane Googlea, već i do problema sa pravim autorom: Ako je on u dobroj poziciji u rezultatima pretrage u