Conteúdo Duplicado: o que é e por que prestar atenção nisso?

Conteúdo duplicado é todo aquele que contém partes similares ou idênticas às de outras postagens anteriores. Você provavelmente já encontrou algumas referências a este termo em suas pesquisas sobre marketing de conteúdo ou temas relacionados. Uma outra forma de caracterizá-lo é pensar que conteúdo duplicado são de trechos de informação que existem em mais de uma URL.

O conteúdo duplicado pode prejudicar o seu ranking, mas não necessariamente é passível de punições do Google, como a maioria poderia pensar.

De fato, considere o seguinte, se as spiders dos motores de buscas encontram o mesmo blocos de texto em vários endereços na internet, essa análise não vai deixar de mostrar os vários, como se esperaria em uma penalização, e sim privilegiar uma das fontes em detrimento das outras.

Bem, vejamos qual é a definição do próprio Google:

“O conteúdo duplicado geralmente faz referência a substanciais blocos de conteúdo dentro de ou entre domínios que combinam de forma total ou são notavelmente similares. Geralmente, sem intenções enganosas”

Claro está que a ocorrência das mesmas informações em várias fontes não é necessariamente um problema quando a intenção é complementar os conhecimentos que um conteúdo em si tenta compartilhar com os usuários. Aliás, quem nunca usou um quote para ilustrar melhor uma ideia?

 

Conteúdo duplicado e limites

Inclusive, é difícil objetivar a tolerância ou entendimento do que o Google considera cópia ou duplicata. Uma produção de conteúdos para web pode usar trechos de outros, sem que essa inserção tenha sido feita de forma a tirar vantagem de textos já publicados.

O que o mecanismo de busca tenta é decifrar a intenção do autor. Inclusive, podemos entender que a grande busca do Google é fazer com que seus algoritmos avaliem as informações disponíveis na web da forma mais parecida como faria um ser humano.

Prova disso é nossa entrada na era da web semântica e associações indiretas que os algoritmos tentam fazer entre os resultados que podem exibir. Eles já deixam de entender tudo literalmente e começam também a buscar informações em sub-níveis, como você pode ver em nosso post sobre web semântica.

Com isso, dilatam-se os limites da interpretação que um sistema de avaliação, no caso, os algoritmos, podem ter sobre o que se considera um conteúdo relevante. O fato é que o Google, aos poucos, vai evoluindo em sua forma de entender o que é postado em blogs e sites de todo o mundo.

 

Conteúdo duplicado x conteúdo copiado

A definição de conteúdo duplicado é capaz de confundir qualquer um. Para o Google, a maioria dos conteúdos duplicados tem origem técnica, mas ele não deixa de avaliar o conteúdo em geral, onde estão inseridos os trechos.

Por exemplo, se você tiver duas urls com partes do mesmo artigo original, qual será penalizada ou exibida? Tipo, se você tiver um trecho original de seu próprio domínio e usar em outras páginas do mesmo domínio, considera-se como conteúdo duplicado?

Aqui, é importante dizer que um conteúdo duplicado pode ser classificado como cópia de conteúdo se você duplicar um texto completo na íntegra ou somente mudar ou inserir algumas palavras. Não importa se você só inseriu algumas palavras-chave, este tipo de comportamento é inaceitável.

Quer piorar a situação? Jogue estes trechos minimamente modificados ou copiados totalmente em um conteúdo que não agrega valor ao usuário – o chamado thin content (conteúdo pobre) – e você vai entrar em um terreno muito, muito arriscado.

É só lembrar da atualização do Panda e como a qualidade do conteúdo e práticas como a black hat começaram a sofrer penalizações. Ou seja, conteúdo é pro usuário, não pro Google, e o mecanismo leva essa questão muito a sério.

Se quiser acompanhar uma conversa com alguns dos maiores nomes da internet debatendo sobre a natureza do conteúdo duplicado, não deixe de dedicar o tempo para assistir a este vídeo:

 

 

No vídeo, Andrey Lipattsev é taxativo: Não existe penalidade para conteúdos duplicados. Mas, então, como o Google considera e exibe conteúdos com trechos de outras fontes?

 

Conteúdo duplicado e versão primária

Ok, se não há necessariamente sanções que sejam aplicadas em páginas com conteúdo duplicado, o mecanismo de busca deve estabelecer algum tipo de critério para privilegiar a exibição. Se dermos uma olhada no artigo da Dejan Marketing, veremos que um enunciado afirma que:

“Quando existam múltiplas instâncias de um mesmo documento na web, a URL de maior autoridade torna-se a versão canônica. As outras são consideradas duplicadas.”

Entretanto, duas patentes registradas pelo Google, especificamente as Identifying a primary version of a document e Representative document selection for a set of duplicate documents parecem ampliar a discussão, como defende Bill Slawski em um artigo sobre primary versions of duplicated pages.

De acordo com Bill, em nenhum momento o Google afirma que a versão original de um documento (primary version) é considerada a versão canônica. O que sugere é que vários atributos são levados em conta, de todas as páginas que compartilham o mesmo conteúdo, para só depois eleger o que seria a mais indicada a exibir para os usuários. Entre eles:

  • Autoria;
  • Título;
  • Editor;
  • Data de publicação;
  • Local de publicação;
  • Palavras-chave;
  • Page Rank;
  • Informação sobre o quote;
  • Identificadores de artigos, tais como o DOI (Digital Object Identifier), PubMed Identifier, SICI, ISBN, etc.;
  • URL;
  • Idioma;
  • entre outros.

O que nos leva a pensar que, por mais que um conteúdo original seja de sua autoria, é possível que outras páginas, que aproveitem fragmentos da sua publicação, sejam privilegiadas no ranking em função do conjunto de atributos que podem chegar a acumular e sejam superiores ao do seu domínio.

 

Duplicar ou não duplicar, eis a questão

Compartilhar informações de terceiros não é um problema. De fato, as citações contribuem para a criação de conteúdos de maior valor agregado. O conhecimento não é individual e buscar suporte em fontes com mais propriedade é uma boa opção para corroborar seus argumentos.

Obviamente, o que não pode ser feito é usar conteúdo de terceiros como base e, a partir disso, inserir uma ou outra consideração. Neste caso, você corre um sério risco de ser penalizado por conteúdo duplicado. Aqui, vamos considerar também os populares e tão comuns refritos, quando uma página reescreve o conteúdo de terceiros com outras palavras.

A ideia é sempre pensar em quem mais importa, no usuário. Qual é a questão que você quer levantar? Quais são as explicações que você quer compartilhar com seu público? Como você busca ajudar os internautas a resolverem seus problemas, encontrar respostas para as suas dúvidas ou passos de um procedimento?

Aqui na ÀBr a gente leva esta questão muito a sério, não necessariamente em função das punições passíveis, mas porque o mais importante é o user. Ao invés de pensar somente no SEO da empresa, crie conteúdo para sua audiência, específico, personalizado e que entregue informações úteis e você não vai precisar se preocupar com penalidades de quaisquer mecanismos de buscas.

Quer criar conteúdos incríveis? Aprenda a fazer um planejamento de conteúdo eficaz!