Hadoop ordena un Petabyte en tiempo récord

Yahoo! ha logrado un nuevo hito en lo que a tecnologías de búsqueda se refiere. Como algunos ya sabréis, Hadoop es un sistema de almacenamiento creado en su día por Apache basado en los papers de la infraestructura de Google que plantean un sistema de almacenamiento de datos distribuido que ayudaría a la hora de indexar y ordenar resultados de búsqueda.

Ahora, gracias a las pruebas del gigante de Sunnyvale se ha logrado un nuevo hito en las tecnologías de búsqueda. El objetivo era el de medir el tiempo para ordenar los diferentes números de registros de 100 bytes. Los primeros 10 bytes de cada registro es la clave y el resto es el valor.

Los datos del hito han sido publicados por la gente de Yahoo! Developer además de haber creado un paper interesante en el que se pueden encontrar muchos datos relevantes.

Deja un comentario