Los idiomas según Google

Google sigue ofreciendo su serie de artículos sobre la calidad de los resultados y en esta ocasión le ha tocado el turno al tema de los idiomas.

Como bien dicen, es verdad que en un mismo idioma hay palabras que quieren decir lo mismo y se escriben diferente y todo lo contrario, palabras que se escriben igual y significan diferentes cosas en diferentes países.

Para comenzar con un idioma nuevo, lo primero que se hace es analizar la mayor cantidad de documentos (más o menos oficiales) que haya sobre el idioma. De esta forma se asegura un proceso más preciso y amplio. Ahora mismo este proceso se está aplicando al swahili utilizando páginas del Parlamento de Tanzanía.

Una vez se ha creado el modelo de lenguaje se ayuda a la clasificación de documentos durante el rastreo y la indexación para poder analizar las consultas del usuario.

Una vez un idioma se comienza a utilizar con cierta frecuencia, se comienzan a añadir algunas aplicaciones como el corrector, dando sugerencias (el «quiso decir…»). Además, también es importante utilizar las palabras acentuadas, sobretodo en aquellas en las que significan diferentes depende de donde lleven la tilde (acentos diacríticos), ya que mostrarán resultados diferentes.

Otros elementos son los sinónimos, las palabras compuestas o las palabras que provienen de una misma raíz… lógicamente todo esto variará según el idioma, ya que no todos cumplen las mismas reglas de juego.

Algunos elementos más son, por ejemplo, los detalles como las siglas. En algunos idiomas, por ejemplo, se indican con un punto al final. En China los usuarios, para solicitar las cotizaciones indicas un símbolo » o para designar las fechas un símbolo æ—¥. Además, los idiomas que no permiten el uso de teclados ASCII necesitan unas tipografías muy diferentes que también se han de analizar. Incluso, un elemento importante que se ha comenzado a tener en cuenta es el de escribir tal y como se habla, de forma que podemos encontrar palabras con muchos errores pero que se sabe que significan otras palabras porque están escritas como se pronuncian.

Una de las razones por las que se han lanzado sistemas de sugerencias de palabras en el propio cajetín de búsqueda es para reducir las posibilidades de error a la hora de hacer una consulta, y de esta forma poco a poco irán apareciendo estos servicios en los diferentes idiomas.

Además, un elemento interesante es el tema de la geolocalización. No es lo mismo realizar la búsqueda [Côte d’Or] desde Francia, donde aparecerá información privilegiada sobre esta región que realizar la misma búsqueda en Bélgica, donde aparecerá información sobre la empresa que fabrica chocolates.

Otros elementos son por ejemplo los signos de puntuación. Muchos países utilizan las comas o los puntos al revés para indicar una misma medida. Un claro ejemplo es a la hora de buscar las temperaturas de un lugar… en unas ocasiones encontraremos Celsius y en otros Fahrenheit.

1 comentario en «Los idiomas según Google»

  1. Buenas tardes Javier,

    Soy Sergio Cerrutti (el de las coñas de los bollitos de IdeUp! jeje), solo decirte que tu «charla» fue cojonuda, no me esperaba algo tan bueno ni de lejos, aún sabiendo lo experto que eres en el tema SEO, pero fue muy educativa y amena.

    Por supuesto, siempre y cuado estés en disposición, animo a todas las empresas a que hagan lo que ha hecho IdeUp!, que se animen a que aportes tus conocimientos a los trabajadores.

    Un saludo y gracias, y perdona por escribirte en este post que no tiene «nada» que ver.

Deja un comentario