Hace unos días comentábamos cómo se debería trabajar con sitios en varios países/idiomas y similares. Ahora toca el turno a sitios que contienen la misma información pero en varios idiomas.
Para empezar hay que saber que Google no utiliza los códigos o meta-datos que hacen referencia a los idiomas para detectar en qué está publicado un sitio, sino que utiliza su sistema interno de traducción para la detección del idioma. Es por eso que si tienes una página en un idioma, cada párrafo o similar puede estar en distintos y poder ser detectado.
En cuanto a la distribución de contenidos por URL, no se debe crear una estructura especial por idioma. Sí que se recomienda que no esté diferenciada por parámetro, sino que se haga por carpetas o subdominios. En este caso los nombres deberían ser en el ISO de 2 letras.
Otro elemento importante es que en las direcciones URL no hayan caracteres extraños. En caso de que los haya han de estar en codificación UTF-8, ya que son la manera más sencilla de poder deshacer esa conversión y mostrarla correctamente en los resultados de búsqueda.
A la hora de rastrear un sitio, se recomienda no utilizar traducciones automáticas, ya que se pueden considerar spam en algunos casos. Lo que sí que hay que plantear es que cada página esté enlazada contra sí misma en otros idiomas. Otro elemento a tener en cuenta es que no se debe redireccionar a los usuarios según su idioma, sino que sean ellos los que decidan cambiar.