martes, 10 de marzo de 2009

¿Qué funciones hace un buscador automático y donde aporta valor un especialista humano? (I)

En un post anterior comentábamos, sin entrar en detalles, sobre la nueva ola de buscadores que incluyen a las personas como parte de su modelo de funcionamiento (nos referimos a servicios de búsqueda que incluyen a personas de forma “activa”, a fin de cuentas, el algoritmo de Google, PageRank, también incluye a las personas cuando analiza la red de enlaces, pero en este caso se trataría de una inclusión “pasiva”). En esta entrada profundizaremos en los enfoques de que adoptan los nuevos servicios de búsqueda donde se incluye participación humana de forma activa.

Básicamente un servicio de búsqueda, sea automático, híbrido (“powered by human”), o totalmente realizado por humanos, debe cubrir cuatro funciones: rastrear información; indexar la información para su posterior recuperación; proveer una interface de consultas y recuperación y ordenar los resultados según su pertinencia respecto a la consulta realizada.

¿En qué parte de este proceso participan los humanos en los nuevos buscadores? Comencemos por las dos primeras funciones.

Rastrear: En el modelo directorio (Yahoo!, DMOZ), los usuarios se encargan de hacer esta función, sin embargo, dado el crecimiento de Internet no es viable depender exclusivamente de personas para rastrear y clasificar toda la web. Por ello han aparecido servicios de búsqueda que combinan el rastreo humano para una parte muy acotada de la Web (un ámbito temático, geográfico, u otro criterio), con el rastreo automatizado del resto del espacio web. El ejemplo más paradigmático de este tipo de enfoque es Mahalo, donde un grupo de editores (buscadores humanos), realizan búsquedas para los términos más comunes.

Indexar: El problema de la escalabilidad que planteamos para la función de rastreo también aparece con la indexación. En este caso, una manera de gestionarlo ha sido la creación colaborativa de “tags”, mediante el cual los contenidos de Internet son clasificados directamente por los propios usuarios. Este tipo de servicios se le ha dado en llamar “marcadores sociales” y como ejemplo tenemos a Del.ici.us, o Mister Wong. La desventaja principal de este modelo proviene de su propio principio de funcionamiento anárquico (cada usuario marca el texto como considera) lo cual puede dificultar el proceso de recuperación de la información.

En la próxima entrada revisaremos las dos funciones restantes.

Saludos, y que encuentres lo que buscas.

3 comentarios: