FoWS: Mobile personalized service

Qué hace falta para personalizar un servicio de búsquedas para dispositivos móviles es lo que está presentando Ben Bratu de Motorola Labs.

Una de los primeros retos que plantea es el del hardware, ya que ha de estar todo preparado para tener soporte por todos los dispositivos, y eso es algo complejo, además de encontrarse problemas con las redes y sus tecnologías, ya que hay muchas y para muchos tipos de dispositivos. Los proveedores de contenido y las propias aplicaciones también han de decir mucho.

Con respecto a la personalización, hay que generar un contexto para el usuario, en base a las aplicaciones y contenidos, además de factores como tiempo y espacio.

Lo que queda claro (después de muchos recursos técnicos) es que el tipo de búsquedas ha de ser diferentes a las de web, y que hay que tener contenidos diferentes para las versiones móviles, muy enfocado a metadatos.

FoWS: MyMobileSearch

José Manual Cantera muestra la necesidad de contar con contenidos específicos para dispositivos móviles e indica que los dominios .mobi han dado un empujón a que esto se produzca. El usuario, una de las cosas que no quiere, es encontrar información que no pueda gestionar desde el dispositivo si no está adaptado a él.

Uno de los retos que hay para que esto ocurra es la necesidad de mejores metadatos, un índice específico para estos contenidos (por ejemplo uno en el que influya el contenido geográfico).

El proyecto MyMoSe lo que plantea es enfocar la red a dos factores: Localización y Legibilidad para Móviles y para ello también hace falta un prototipo de interfaz. Además, el sistema debe revisar los diferentes formatos y adaptarlos. Para ello se ha comenzado a indexar contenido para móvil y contenido clásico y se clasifica. La siguiente fase sería la de clasificar la información. Para ello hay que dividir los contenidos en «optimizados para móvil», amigables o descartables.

FoWS: Time in Web Search

Desde A9 llega Omar Alonso que nos dice que el factor tiempo existe en todos los aspectos de la vida y, por supuesto, de las búsquedas y los elementos que la componen, además de ser preciso o muy aproximado.

A veces se puede producir una necesidad de separar un evento o momento en varias fechas… por ejemplo, cuando hablamos de la Copa del Mundo de Alemania, ¿es la de 1974 o la de 2006?

En la búsqueda podemos ver aplicado el factor tiempo en elementos como la búsqueda web, los blogs, las noticias, o el experimento de Google view:timeline. El paso siguiente sería el de extraer la información y organizarla en clusterings de tiempo.

Una de las cosas que se podría utilizar es el sistema de TimeBank, una especificación que permite indicar fechas en los contenidos de texto y que ayudarían a organizar la información de una manera bastante más lógica.

Un ejemplo del sistema sería el siguiente:

<TIMEX3 tid="t1" type="DURATION" value="P60D" mod="EQUAL_OR_LESS">>
no more than 60 days
</TIMEX3>

que indica que la duración es de igual o menos de 60 días…

FoWS: Search and Recommendation

Comienzan las charlas del sábado con Xavier Amatriain de Telefónica I+D, con una que habla sobre las búsquedas y las recomendaciones. Interesante que lo primero que comente es que la época en la que se buscaba ha finalizado y que ahora comienza la época de las recomendaciones.

La idea es plantear una plataforma única (web, television, móvil) en la que se disponga de un sistema múltiple de búsqueda con recomendaciones y un paso para hacerlo podría ser a través de Loomia.

Formas de recomendar puede ser a través de sistemas colaborativos o en base a contenidos. Los colaborativos pueden ir dados en base a elementos similares pasados, basados en experiencias del usuario o por similitud de elementos.

Hay que tener en cuenta que hay que sorprender al usuario, no mostrarle elementos que ya conoce o ha visitado, hacer que pruebe cosas nuevas… La idea sería la de poder generar un sistema híbrido Search-Recommender.

FoWS: Graph-Based Search

Aunque esta charla de Aristides Gionis ha sido más bien teórico-científica, me he quedado con un par de detalles interesantes que vale la pena comentar.

Entre los temas que se trataban, se hablaba de cómo mejorar la relevancia de las búsquedas. Para ello se partía de dos bases, la desambiguación (dos palabras que significan lo mismo) y de encontrar enlaces apropiados (por ejemplo los internos de la Wikipedia).

Para ello hay que revisar muy concienzudamente el contexto similar entre sitios, que los enlaces sean lo más directos entre el contenido y el destino y el PageRank de un contexto específico.

FoWS: Exploiting Semantics

Que Yahoo! se está poniendo las pilas en cuanto en tanto a los Microformatos y similares no es ninguna novedad, y la charla de Peter Mika ha ido por estos lares.

Ha comentado que aunque hay muchos sistemas para anotar la web como los microformatos o los Open Data, además de las Social Network como Dataportability, Open Social o Windows Live Contacts API, se podrían estudiar sistemas como la forma de enlazar de la Wikipedia. El problema de hacer tagging con la Wikipedia es la detección de entidades, aunque para ello se podía hacer uso de los propios enlaces del sitio, ya que si se enlaza de una página a otra de la misma, quiere decir que lo que se enlaza es una entidad.

Yahoo! Research Barcelona ya ha desarrollado varios proyectos entre los que hay que destacar Yahoo! Research Microsearch, un buscador de microformatos en el que, si por ejemplo haces una búsqueda de una persona [Javier Casares] podrás observar elementos relacionados.

Yahoo! Research Microsearch

FoWS: Rank Answers from Q&A

la siguiente charla es la de Mihai Surdeau que trata sobre cómo se puede extraer información de sitios como Yahoo! Respuestas en las que hay gran cantidad de preguntas y respuestas. Lo primero que hay que plantearse es separar las preguntas y respuestas interesantes del resto, y para hacer el ranking hay que tener en cuenta sistemas que detecten soluciones similares, por traducción o por frecuencia, generando un ranking discriminativo.

Por ejemplo, puntos positivos pueden ser aquellas respuestas que los usuarios han elegido como la mejor, y como puntos negativos podríamos tener aquellas respuestas que se han tomado simplemente por IR (Recuperación de Información).

El sistema se centra en preguntas del tipo «how to» y se eliminan las respuestas que tienen pocas palabras o que no tienen calidad.

FoWS: Visual Content searchable

Jan ErikUno de los proyectos más interesantes que tenía ganas de ver es el de Polar Rose, tecnología de reconocimiento de imágenes que he podido ver por primera vez hoy de una forma más interna.

La charla de Jan Erik ha sido muy dinámica y ha comentado varios temas. Como base, su objetivo es encontrar a gente en fotos, de forma que el sistema luego pueda reconocer y asociar imágenes. y de esta forma hacerlas «encontrables».

En una comparativa de la búsqueda de personas con Google Imágenes o Yahoo! Imágenes, la verdad es que la calidad es muy superior. Para conseguirlo, la gente que está dada de alta en la beta privada de Polar Rose tiene la posibilidad de instalarse un plugin para Explorer o Firefox gracias al cual cuando ve una imagen puede decirle ¿quién es? y de esta forma el sistema aprende.

Polar Rose (plugin)

Detalles que me han impresionado es que el sistema es capaz de detectar imágenes que han sido cortadas o retocadas, e incluso sabe detectar las imágenes duplicadas, de forma que, las imágenes que más veces aparecen son las que mejor aparecen en los rankings. Además, se puede llegar a detectar cuál es la imagen original ya sea por la fecha de la propia imagen o por el tamaño de la misma.

En la imagen siguiente, la primera fila muestra imágenes que son la misma pero en diferentes fondos y sistemas… en la segunda fila nos encontramos con la misma imagen recortada, dando el sistema por hecho que la última imagen (en la que incluso aparece otra persona) es la original, ya que dispone de más información.

Polar Rose (comparativa)

Para organizar la información, internamente lo que se hace es dividir la información de la imagen en muchos bloques y cada uno de ellos dispondrá de una información para aprender qué contenidos hay en la imagen.

FowS: Audio-Video Search

Julien Law-ToAhora es la ocasión de Julien Law-To de Exalead. En principio comenta que en la parte de imágenes lo principal es sacar el reconocimiento de rostros, y de esta forma identificarlos.

De la misma manera pasaría con los vídeos… el principal objetivo es el reconocimiento de rostros y del contenido del vídeo, para poder llegar a hacer una búsqueda del tipo: reconocimiento del orador.

Para acabar, otro de los objetivos es el de la conversión de conversaciones a texto, algo que ya hacen con los vídeos y los audios, e incluso ha puesto un ejemplo de audio de una emisora de radio en español, aunque la transcripción no era excesivamente buena.

FoWS: Future of Video Search

Wesell KraaijYa estamos aquí… digo estamos porque he visto caras conocidas como la de nuestro compañero José Agüera y la de Jaume Ferré con el que he venido.

La primera charla ha sido la de Wesell Kraaij que ha hablado sobre el futuro del video search. Me he quedado con varios detalles como:

  • Pequeñas mejoras en las búsquedas de vídeos harían que se pudiera llegar casi al nivel de las búsquedas de texto.
  • No es lo mismo la búsqueda de información que la de entretenimiento, y han de tratarse de formas diferentes.
  • El uso de tags bien puestos daría pie a que los resultados de búsqueda mejorasen enormemente; un ejemplo es el bueno uso que se hace en servicios como Flickr.

Personalmente, sigo pensando que la transcripción del contenido de los vídeos, haría también mucho.