viernes, 27 de marzo de 2009

Las bases de datos factuales y la nueva “calculadora” de respuestas

El enfoque de solución predominante en los grandes buscadores actuales (indización masiva de contenidos; búsqueda basada en palabras claves; ordenación de resultados siguiendo diferentes criterios de relevancia), suele ser poco eficiente cuando se desea buscar un dato o hecho concreto.

Por ejemplo, si buscamos en Google, “¿en qué año ganó el Nobel García Márquez?”, los resultados de Google muestran en primer lugar un sitio que contiene la biografía del escritor colombiano, la cual debemos revisar para encontrar el dato buscado. Los siguientes resultados de la lista son peores, mostrando noticias relacionadas con el escritor, y no la respuesta deseada. Nosotros simplemente queríamos que nos respondieran: “1982”.

Para este tipo de búsqueda es mucho más efectivo utilizar las obras de referencias tradicionales o una base de datos factual, como FreeBase o True Knowledge, que almacenan una amplia cantidad de datos y hechos, organizados en áreas temáticas. Estas herramientas poseen diferentes modelos para que el usuario recupere la información buscada, que van desde la navegación tipo directorio, hasta la búsqueda en lenguaje natural.

Hace menos de un mes se ha anunciado la llegada de un nuevo concepto de “answer engine”: el proyecto “Wolfram Alpha”, liderado por el prestigioso científico Stephen Wolfram. Lo novedoso de este proyecto es que su enfoque no es “encontrar” la respuesta, sino calcularla utilizando todo el conocimiento disponible y un conjunto de algoritmos, reglas de cálculos y modelos de representación lógicos, teoremas, procesamiento lingüístico, heurísticas, etc.

La idea, como explica en su blog Nova Spivack (uno de los pocos que ha visto la herramienta funcionando), no es almacenar todos las preguntas y todos los hechos que le responden en una gran base de datos, sino calcular la respuesta en tiempo real, partiendo de datos primarios y la aplicación del conocimiento existente. La diferencia es notable: Google, indiza la web y devuelve documentos que pueden contener la respuesta; las bases de datos factuales almacenan hechos para poder responder una solicitud de usuario mientras que “Wolfram Alpha”, almacena hechos y aplica modelos de conocimientos que calculan la respuesta.

Evidentemente, este tipo de herramienta tendrá limitaciones importantes en aquellas búsquedas que no sean netamente factuales, pero su lanzamiento el próximo Mayo’09, levanta grandes expectativas.

Saludos y que encuentres lo que buscas,

Equipo Wenthia

No hay comentarios:

Publicar un comentario