SEO CheatSheet para principiantes

Uma pequena referencia para quem quer aprender SEO.
A partir de hoje torna-se necessário registares-te para poderes comentar no blog.
Decidi tomar esta medida agora antes que o blog cresça e tenha demasiados utilizadores e desta forma controlo também o spam antes de me começar a chatear.
Conto que com o tempo se registem mais e mais pessoas e que dêem o vosso contributo não apenas através dos comentários mas com ideias, possíveis parcerias e contribuições ![]()
Ora aqui está a prova de que resultados de pesquisas podem ser facilmente manipulados. Nas ultimas semanas o Google Trends tem sido manipulado para diversão de alguns utilizadores de foruns que decidiram mostrar como é fácil manipular os resultados do Google Trends. Algo que é baseado na quantidade de pesquisa basta meter milhares de pessoas a pesquisar o mesmo criando uma pesquisa viral para conseguir alcançar um lugar de destaque no Google Trends.
A noticia chegou-me via TechCrunch mas muitos outros blogs têm falado do mesmo, parece que antes do resultado que aparece na imagem houve uma brincadeira com uma suástica. Na imagem á direita se olharem atentamente e lerem da direita para a esquerda verão que está escrito “fuck you google” de cabeça para baixo.
É sem dúvida obra de quem se quer divertir explorando uma falha simples no Google Trends. Excelente campanha SEO ![]()
Trabalhando diariamente com sites é muito comum encontrar sites onde não existe qualquer preocupação em criar padrões, regrar e restrições nos sites.
Um dos problemas, especialmente nos blogs, é o conteúdo duplicado.
Mesmo um site com páginas estáticas o simples facto de ter 2 versões (uma com www e outra sem o www) pode ser penalizado por conteúdo duplicado. A penalização não implica que sejam medidas radicais como ver o site banido dos motores de busca, mas poderá implicar dispersão de pagerank que implica menor visibilidade no motor de busca, penalizações na posição nos motores de busca, etc…
Só para que fique bem claro aqui estão possíveis situações que podem ser interpretadas como conteúdo duplicado:
O Google tem uma forma muito peculiar de lidar com estas situações. Irá baixar o pagerank de uma e atribuir outro pagerank a outra versão, portanto o site com www pode ter pagerank 6 e o site sem www pode ter pagerank 4 é apenas um exemplo. Mas o pagerank é a menor das preocupações a nivel funcional.
Estes problemas podem fazer com que a regularidade que os robots visitam as páginas baixe ou seja mais demorada, o que no caso de novos sites poderá ser considerável, pelo facto de estarem a fazer crawl de endereços diferentes com conteúdo igual.
A melhor ferramenta gratuita que posso recomendar é sem dúvida o Google Webmaster Tools que te permite ter analises pormenorizadas do desempenho do site site em diversos aspectos.
Para quem não sabe canonificação de urls implica criar uma norma pela qual o endereço do site se rege.
Isto é normalmente usado para colocar WWW ou retirar WWW dos endereços. Podes não saber mas http://www.mercadoblogger.com e http://mercadoblogger.com podem ser intendidos, pelos motores de busca, alguns sistemas de login e navegação como sites independentes.
Isto torna necessário a criação de uma norma pela qual o endereço do site rege.
Nas minhas analises ao site domelhor.net e ao site do meteo.pt apontei para este problema. No caso do meteo.pt a questão já foi resolvida no caso domelhor.net apesar de ter colocado o artigo no site parece que não se dão ao trabalho.
- Analise ao meteo.pt
- Analise ao domelhor.net
Agora vamos ao que interessa. Existe uma forma universal de obrigar os endereços a incluir ou excluir o www sem ser necessário fazer referência ao site e que até é relativamente simples:
Este código deve ser incluído num ficheiro .htaccess, se estás a usar o windows é possível que não te deixe criar o ficheiro. Neste caso podes criar um ficheiro htaccess.txt editas e quando o colocares no servidor alteras o nome para .htaccess
RewriteEngine On
RewriteBase /
RewriteCond %{HTTP_HOST} !^www\. [NC]
RewriteCond %{HTTP_HOST} ^([^.]+\.[a-z]{2,6})$ [NC]
RewriteRule ^(.*)$ http://www.%1/$1 [R=301,L]
Com este código todos os endereços passarão a ser direccionados para http://www, isto impede que o teu site tenha, por exemplo, dois pageranks, um para o site com www e outro para o site sem www.
RewriteEngine On
RewriteBase /
RewriteCond %{HTTP_HOST} !^mercadoblogger\.com$ [NC]
RewriteRule ^(.*)$ http://mercadoblogger.com/$1 [R=301,L]
Aqui infelizmente é necessário incluir o nome do domínio, não é trabalhoso mas torna-se necessário editar o ficheiro .htaccess caso o queiras copiar para outro site.
Alguma dúvida que possa surgir, deixa comentário!
#11 - Usa keywords nos links
Os links, internos ou externos, devem conter keywords relevantes ao seu conteúdo.
Trata-se de um bom principio de linkagem que não só ajuda o leitor a intender de imediato de que se trata o link como também ajuda o link a ganhar notabilidade nos motores de busca.
Evita usar palavras como “clica aqui”, “ve aqui”, “visita este link”, “esta página”, etc…
Imagina que queres linkar para este artigo, usa o titulo do artigo como link.
Imagina que queres linkar para uma noticia qualquer, é sempre preferível usar o titulo da noticia que um texto a dizer “pormenores aqui”. Pormenores do quê?
Eventualmente podes incluir também o nome do site como referencia. A informação passada para o leitor acaba por ser fundamental e ajuda também na melhor indexação dessa página nos motores de busca.
Embora o video não seja muito pratico de certeza que vai ajudar alguns leitores a intender melhor como funciona o algoritmo do pagerank.
O Instituto de Meteorologia lançou uma nova versão do seu site.
O Ivo falou por alto do novo meteo.pt realçando alguns aspectos que deveriam ser corrigidos especialmente a nível de HTML, acessibilidade e usabilidade.
Novamente os aspectos a nível de optimização do site para motores de pesquisa foram deixados de lado.
Dando uma vista de olhos no código não existem meta tags para descrição nem com keywords assim como não usam qualquer tag de cabeçalhos (h1,h2,h3, etc…) nem palavras a negrito ou itálico sendo que as palavras homepage, registe-se, esqueceu a senha, entre outras têm o mesmo peso que as palavras do menu superior (O Tempo, O clima, Sismologia, Aeronáutica, Marítima, etc..).
A nível de código HTML podiam fazer melhor já que criaram quase tudo usando divs não vejo lógica em usarem tabelas para alinhar o site e mesmo assim existem erros a nível de html e corrigir alguns dos erros na semântica?:?:
O mais grave neste momento é o facto do endereço http://www.meteo.pt/pt/ e http://meteo.pt/pt/ apontarem para sites distintos. É um erro grave que se resolve facilmente adicionando as seguintes linhas a um .htacess:
RewriteBase /
RewriteCond %{HTTP_HOST} !^www\. [NC]
RewriteCond %{HTTP_HOST} ^([^.]+\.[a-z]{2,6})$ [NC]
RewriteRule ^(.*)$ http://www.%1/$1 [R=301,L]
Este código redirecciona o site sem www para o site com www no endereço caso o utilizador não o faça.
Em última analise o site do Instituto de Meteorologia tem falta de referências, os links para o site são praticamente inexistentes. Uma possibilidade de ganhar visibilidade seria a inclusão de widgets para os utilizadores incluirem nos seus sites.
Um excelente vídeo do pessoal do SEOmoz que fala dos princípios básicos necessários para fazer uma analise SEO a um site.
Muitos utilizadores quando criam um blog usando a plataforma do wordpress.org simplesmente não dão importancia ou desconhecem que existe uma série de acções que devem tomar para melhorar o seu blog. A instalação do WordPress apenas não chega e é preciso criar ficheiros .htaccess e robots.txt para impor alguns limites.
Antes de continuar quero apenas deixar aqui uma nota:
$ - significa fim do ficheiro
* - Significa que tem caracteres antes
Disallow: /*? - Esta linha bloqueia todas as urls que possuam ? (ponto de interrogação) nelas. Obviamente que no caso do mercadoblogger.com se aplica esta regra, mas blogs que não usem urls amigáveis (idênticas ás dos artigos no mercadoblogger.com). não é boa ideia.
Disallow: /*.php$ - Bloqueia todos os ficheiros .php
Disallow: /*.inc$ - Esta é importante. Não deves mostrar ficheiros .inc nos motores de busca correndo o risto de o teu blog ser assaltado por alguém con más intenções.
Disallow: /*.css$ - É opcional mas porque razão quererás indexar o teu ficheiro de css?
Disallow: */feed/ - Compreende-se que queiras indexar as tuas feeds, quem sabe não ganhas mais uns leitores á pala disso. Mas o problema é que duplicas o teu conteúdo.
Disallow: */trackback/ - Esta é uma das minhas preferidas, impedir a indexação do trackback que normalmente é SPAM!
Disallow: /page/ - Bloqueia a indexação de urls com /page/.
Disallow: /tag/ - Navegação por páginas através de tags é bom para os leitores, não para os motores de busca.
Disallow: /category/ - Pela mesma razão que as tags.
Se tiveres curiosidade, ve o meu robots.txt. Estás á vontade para copiar e adaptar ao teu blog!
Este artigo foi criado com base no artigo WordPress Robots.txt do shoemoney