martes, 6 de octubre de 2009

Humor en la Industria de los Buscadores (I)

Aún en los temas más serios, un poco de humor nunca está de más. Algunas veces, el humor, en cualquiera de sus formas, nos hace reflexionar tanto como una ponencia rigurosa y profesionalmente expuesta. Así que hemos pensado recopilar algunas piezas humorísticas que reflejen la dinámica de la industria de los buscadores.

Comenzamos esta sección con una mirada “especial” al futuro de los buscadores, una obra de Randy Siegel, publicada hace ya un tiempo (aunque no por ello ha perdido vigencia) por "The New York Times":



Saludos y que encuentres lo que buscas,

Equipo Wenthia

jueves, 1 de octubre de 2009

Gestión de la Reputación Online (Reputation Management)

Pues sí, con tanta información disponible en la red, es normal que resulte un auténtico calvario saber lo que se dice de nuestra empresa, de nuestras marcas, de nuestros productos o servicios. Ya no basta tener un departamento de “Atención a Clientes”, con encuestas estructuradas encargadas al “call center”. Hoy más que nunca el “boca a boca” es verdaderamente global. Para bien y para mal.

Los tradicionales servicios de monitorización/seguimiento informativo y press-clipping, se tienen que adaptar a los nuevos tiempos, y aquí entra la Gestión de la Reputación Online (Reputation Management). Como su nombre sugiere, se trata de un conjunto de técnicas y herramientas para mantenernos al tanto de lo que la opinión pública expresa libremente sobre un determinado tema. La tarea es colosal, y podemos simplificarlas en tres grandes retos:
  1. Recopilar toda la información pertinente de páginas webs, de blogs corporativos y personales, de portales especializados, twitters y demás plataformas sociales, incluyendo fuentes de audio y video (podcasts, youtube, etc).

  2. Asignarle un peso relativo a cada emisor de manera de poner en contexto la importancia de tal información/opinión. No tiene el mismo efecto la opinión sobre nuestro producto de un usuario anónimo que la opinión de una fuente de información que sea referente en el tema concreto que se evalúa/opina (una vez más, el tema de Calidad de Información que ya hemos comentado en este blog)

  3. Determinar el impacto de una información sobre el sujeto (empresa/marca/producto/personalidad): positivo, neutral, negativo

Sin dudas, la más “fácil” de las tres, es la recopilación de información, la cual se puede hacer con herramientas sencillas de usar, como Google Alerts. Más interesantes son las herramientas que comienzan a tratar los otros dos puntos, como por ejemplo Trackur, la cual puedes probar gratis por quince días, o la española MambaIQ.





Saludos y que encuentres lo que buscas,
Equipo Wenthia

lunes, 31 de agosto de 2009

Google – La marca más valiosa según el ranking BrandZ 2009

En el mundo moderno las marcas adquieren una importancia crucial en el éxito de una empresa. Una marca fuerte impacta tanto o más en la credibilidad de una empresa que indicadores tradicionales como las ventas anuales o los márgenes de operación. La compañía Millward Brown creó el ranking BrandZ Top 100, que calcula el valor intrínseco de las marca, derivado de su capacidad para generar demanda.
En el ranking del 2009, Google se alza con el número uno, por encima de otras marcas sumamente potentes como Microsoft, Coca Cola, Mc Donald o Marlboro, por solo citar algunas.

Saludos y que encuentres lo que buscas,
Equipo Wenthia

jueves, 6 de agosto de 2009

Microsoft (Bing) + Yahoo = ¿?

El acuerdo entre Microsoft y Yahoo, si le quitamos toda la parafernalia legal, es más o menos claros: en términos simples se trata de compartir la tecnología de búsqueda (aportada por Microsoft, o sea BING) y las redes de comercialización de espacios publicitarios, de manera de plantar cara y ganar cuota de mercado al gigante Google. Por supuesto, hay muchos otros elementos empresariales en juego: duración del acuerdo, contraprestaciones económicas, etc., pero estas atañen principalmente a los dos actores, es decir, a Microsoft y Yahoo, y tienen un impacto relativamente menor para los consumidores/usuarios (ojo con la matización, relativamente).

Volviendo a la lógica del acuerdo, es muy sencilla: mejor tecnología de búsqueda permite tener mejores resultados, con lo cual se atrae a más usuarios, quienes con sus clicks en la publicidad, atraen más dinero. ¿Cómo no se nos había ocurrido antes?

Ironías aparte, como usuario y especialista en buscar información, creo que es bueno que aparezcan en el mercado competidores que puedan plantar cara y luchar en el mercado de tú a tú con el líder. Esto es válido en cualquier campo de los negocios. Frente a un líder con una aplastante cuota de mercado, los usuarios/consumidores tenemos muy poca capacidad de negociación, e inevitablemente, la innovación y el desarrollo del sector pierde ritmo. Por cierto, ahora que lo menciono, sería interesante hacer un análisis de las cinco fuerzas de Porter, con sus revisiones modernas y actualizadas a la economía digital, aplicadas a la industria de las búsquedas de información. Un análisis serio quiero decir que cotilleos en blogs como este, hay muchos…me lo pensaré.

Para los interesados en toda la información del acuerdo entre Microsoft y Yahoo, las opiniones de analistas, notas de prensa, videos explicativos de sus respectivos CEOs, etc., las dos compañías ha creado el sitio “Choice. Value. Innovation”.

Pues lo dicho: Bienvenido el acuerdo, aunque echo en falta un plan claro para seducir al 80% del mercado restante (el market share actual de Google), pues por mucho que se compartan tecnologías y redes comerciales, el cliente está en la empresa de la caja blanca.

Saludos y que encuentres lo que buscas,
Equipo Wenthia

viernes, 24 de julio de 2009

Reutilización de la información del Sector Público

Nuestros lectores de España, y especialmente aquellos vinculados al mundo de la información, la bibliotecología y la documentación, pensarán con bastante probabilidad, que este post va orientado a comentar sobre el proyecto Aporta, una iniciativa del Gobierno Español, en línea con la Directiva Europea 2003/98/CE sobre reutilización de la información del sector público, traspuesta en la normativa española a través de la Ley 37/2007.

Este importante proyecto, abre un sinfín de oportunidades para las empresas infomediarias españolas, las cuales reutilizan la información generada por el sector público, le agregan valor y la ponen a disposición de ciudadanos y empresas para su explotación. Numerosos estudios, tanto europeos como nacionales, dan cuenta del importante potencial de este mercado.

Sin embargo, mientras que en Europa y en España damos pasos importantes (pero insuficientes) para activar esta industria, en Estados Unidos, el Presidente Obama, el 21 de Enero del 2009, en su primer día de mandato, envío un memorándum a las agencias federales sobre Transparencia y Gobierno Abierto, que en solo un folio, establece verdaderas bases programáticas sobre uso de la información por parte de los ciudadanos, la participación ciudadana y trabajo colaborativo.

Dentro de las iniciativas lanzadas de Gobierno Abierto está Data.gov, lanzado públicamente en Mayo’09, cuatro meses después del anuncio del presidente Obama. Data.gov pone a disposición de los agentes sociales (ciudadanos, empresas, ONGs, etc), conjuntos de datos generados por la administración pública federal de manera que puedan ser reutilizados y tratados para diferentes fines. Los datasets se suministran en formatos electrónicos, de manera que puedan ser reutilizados y se les agregue valor, para satisfacer necesidades de información de diferentes grupos de ciudadanos y empresas. En la actualidad hay disponibles cerca de 400 datasets de diferentes áreas temáticas y algunos medios de prensa, como el The New York Times, predicen que llegarán a más de 240.000 en unos meses.

Resulta sorprendente la enorme diferencia de ritmos entre Europa/España y Estados Unidos. Mientras que en Europa tenemos una directiva sobre el tema que ha cumplido ya más de 10 años, y en España, una Ley desde el 2007, en Estados Unidos, en apenas 6 meses y haciendo gala de su particular pragmatismo, están disponibles cientos de fuentes de datos (creciendo mes a mes) a disposición de las empresas infomediarias y de los ciudadanos para su uso. Claramente, muchos de estos datasets estaban ya disponibles y dispersos en las diferentes agencias federales, incluso con herramientas sofisticadas para su tratamiento y gestión, las que por cierto, también se puede acceder desde el “Tool Catalog” del portal Data.gov

Saludos y que encuentres lo que buscas,
Equipo Wenthia

martes, 14 de julio de 2009

Google Wonder Wheel

Google Wonder Wheel es una de esas opciones que tiene Google que pocos usuarios utilizan. Esta herramienta establece relaciones entre los términos de búsqueda que el usuario ha especificado con otros términos vinculados semánticamente, mostrando dicha relación de forma gráfica. Por ejemplo, si buscamos “energías limpias”, y seleccionamos la opción de visualización de Wonder Wheel, el resultado es el siguiente:

El gráfico resultante puede ser “navegado” haciendo click en cualquiera de los términos relacionados:

Google Wonder Wheel es en realidad otra forma de presentar los resultados, con la ventaja que nos presenta de forma sencilla las relaciones con otros temas que pueden ser de nuestro interés, permitiendo que naveguemos por el conocimiento al tiempo que vamos filtrando resultados.

Por cierto, para utilizar esta opción debes utilizar la versión del buscador en Google.com, pues la versión en español (Google.es) no la tiene disponible.

Saludos y que encuentres lo que buscas,
Equipo Wenthia

jueves, 25 de junio de 2009

100 Buscadores Alternativos

Aunque las estadísticas varían según el mercado, a nivel global, aproximadamente el 90% de las búsquedas en Internet son realizadas por los tres grandes motores: Google, Yahoo y Bing (el nuevo buscador de Microsoft), lo que representa una concentración muy relevante en un mercado cada vez mayor. Sin embargo, muchas de las innovaciones tecnológicas en este mercado han surgido a partir de buscadores alternativos, muchos de los cuales no logra estabilizarse en el mercado, pero que contribuyen a mejorar nuestra experiencia de búsqueda actual y futura.

El sitio Alt Search Engine ha publicado una nueva lista de 100 buscadores alternativos que destacan por su enfoque, especialización y características especiales (algunos de los buscadores alternativos mencionados, como Bing, Kosmix, iSeek, ChaCha, Yahoo BOSS, entre otros, los hemos analizado en este blog en post anteriores).

La lista completa la podéis encontrar en el documento “A new top 100 alternative search engines list”, junto a una breve descripción de las funcionalidades de cada uno de ellos. (Ojo: Los editores del sitio han cambiado un par de veces el URL de este recurso, con lo cual si no lo encontráis, sugiero que hagáis una búsqueda usando el nombre del documento dentro del propio portal).

Saludos y que encuentres lo que buscas,
Equipo Wenthia

martes, 23 de junio de 2009

BuscadorTIC, especializado en Tecnologías de la Información y las Comunicaciones (TIC)

Resulta llamativa la relativa baja cantidad de buscadores verticales que existen para el mercado hispano si lo comparamos con la gran variedad disponible en inglés: prácticamente cada sector y subsector cuentan con buscadores muy especializados en este idioma.

Coincidiendo con el Día del Español, desde Wenthia hemos liberado el BuscadorTIC, un motor de búsqueda especializado en Tecnologías de la Información y las Comunicaciones (TIC) que acota el universo de búsqueda a sitios escritos en idioma español seleccionados por su calidad y especialización en esta temática.

El BuscadorTIC emplea la tecnología de Google, líder mundial en búsquedas de información, al utilizar su herramienta para construir buscadores verticales: Google Custom Search, que ya hemos comentado en este blog.

Usando esta tecnología, el BuscadorTIC, busca información en más de 130 sitios especializados, indizando más de 35.000 páginas de la temática: portales y revistas especializadas, asociaciones empresariales, asociaciones profesionales, universidades y escuelas técnicas especializadas, empresas líderes del sector y por supuesto, los blogs de referencia. Esperamos que la herramienta siga creciendo en las próximas semanas, con la incorporación de nuevos sitios de España y de América Latina.

Según datos de ASIMELEC (Asociación Multisectorial de Empresas Españolas de Electrónica y Comunicaciones), en el 2008, el macro sector TIC generó el 7,07% de PIB español y más de 350.000 empleos directos. A nivel Europeo, el sector TIC representa el 8% del PIB de la UE-27, supone un 25% del crecimiento económico, un 6% del empleo y un 20% del gasto en I+D+i. Se trata, en resumen, de un sector estratégico para la economía del conocimiento.

La dinámica de crecimiento, la acelerada transformación tecnológica y la intensa actividad de I+D+i, hace al sector TIC especialmente sensible a la gestión de la información. Por ello, resulta importante la ayuda que puede brindar el BuscadorTIC, ofreciendo resultados relevantes y de calidad, ahorrando tiempo y mejorando la productividad de los profesionales del sector.

Saludos y que encuentres lo que buscas,
Equipo Wenthia

sábado, 20 de junio de 2009

Internet, el idioma español y las búsquedas de información - “El Día E”

Wenthiando se suma a la celebración, hoy 20 de Junio, del Día del Español, una iniciativa del Instituto Cervantes para promover el español en el mundo que nace con vocación de permanencia y que se celebrará el sábado más próximo al solsticio de verano.

Según el estudio “El Español: Una Lengua Viva”, publicado por el propio Instituto Cervantes, el español es la cuarta lengua del mundo por número de hablantes, y la tercera lengua más utilizada en la Red, creciendo su uso en la red un 620% entre los años 2000 y 2008.

Este mismo informe, citando a su vez al estudio “Las lenguas y culturas en la red”, de Funredes y Unión Latina, afirma que, “…en los últimos años, la presencia relativa de las lenguas románicas y el alemán frente al inglés ha disminuido. La razón principal de este fenómeno no es la reducción de la presencia de las lenguas latinas en el ciberespacio, sino la disminución de su presencia en los espacios indexados por los grandes motores de búsqueda. El porcentaje de páginas indexadas se ha mantenido tradicionalmente entre el 60 y el 80 %...”.


Esto quiere decir que un porcentaje relevante de documentos en español queda literalmente invisible a los grandes buscadores. Al mismo tiempo, es evidente que los grandes motores optimizan sus técnicas de búsquedas semánticas al idioma inglés, y en muchas ocasiones no se plantean hacer una versión para el idioma español. En este contexto existe una oportunidad interesante para abordar el mercado de búsquedas del “infoespacio español”, aunque en realidad, vemos pocas iniciativas empresariales en este sentido.


Por otro lado, en el segmento de servicios de información especializados en Internet orientados específicamente al mercado hispano (portales temáticos, buscadores verticales, etc.) también hay amplios espacios de desarrollo y negocio, aunque me temo que su proliferación será más lenta que lo deseable, pues en cierta medida es un reflejo directo de la menor cultura de uso de la información como activo estratégico, que se evidencia en nuestras empresas e instituciones.


Saludos y que encuentres lo que buscas,
Equipo Wenthia

miércoles, 17 de junio de 2009

2009-Ranking de buscadores en Estados Unidos

A continuación, los datos de evolución de la penetración de mercado de los cuatro grandes buscadores en Estados Unidos, durante los meses de Febrero a Mayo del 2009, según Hitwise:

Indudablemente, que cuatro compañías se repartan el 98% de las búsquedas en un mercado tecnológicamente maduro como Estados Unidos, es una situación singular y relevante, quizás derivada de las fuertes inversiones necesarias para desarrollar y promover una nueva herramienta de búsqueda generalista. Estas mismas razones explicaría la proliferación de herramientas de búsquedas cada vez más especializadas que cubran nichos de mercado concretos de forma mucho más eficiente. En este sentido la “industria de las búsquedas” puede estar siguiendo el camino de evolución de la televisión de pago: de canales generalistas a canales temáticos cada vez más específicos.

Saludos y que encuentres lo que buscas,
Equipo Wenthia

viernes, 12 de junio de 2009

Nuevo buscador: Wolfram Alpha – Una breve compilación de opiniones, noticias y herramientas relacionadas

Después de unos días del esperado lanzamiento de Wolfram Alpha, hemos hecho el ejercicio de indagar qué se ha estado opinando al respecto en el entorno hispanoparlante.

Utilizando nuestro Buscador sobre Tecnologías de la Información – BuscadorTIC (que por cierto os sugiero probéis y al que “presentaremos” formalmente en un próximo post), hemos encontrado varias referencias que analizan al nuevo buscador.

En nuestro idioma los blogueros llevan la delantera por amplio margen. Está claro que actualmente todo lo que “se cuece” en internet tiene su primer impacto en los blogs. He aquí algunos de los análisis que hace la “blogsfera hispana” de este buscador:

Aunque también hay medios tradicionales que se pronuncian y opinan sobre esta nueva herramienta: http://www.elpais.com/articulo/semana/respuesta/Wolfram/Alpha/elpeputeccib/20090528elpciblse_1/Tes

Asimismo, hemos comprobado que ya existen algunas versiones experimentales de “add-ons”:
Por ejemplo podemos usar Wolfram Alpha desde la caja de búsquedas de Firefox:
http://bitelia.com/2009/05/utiliza-wolfram-alpha-desde-la-caja-de-busquedas-de-firefox

O un “híbrido” de resultados Wolfram Alpha - Google que puedes bajar y probar de:
http://wolfram-alpha-google.softonic.com/

Habrá que seguir atentos a ver qué novedades se avecinan,
Saludos y que encuentres lo que buscas,
Equipo Wenthia.

martes, 9 de junio de 2009

Oversharing (Too Much Information) - la sobre exposición de información personal

La terminología técnica parece seguir la dinámica de la famosa Ley de Moore: cada cierto tiempo se “duplican” los vocablos y la jerga técnica que dan fe del ritmo frenético de desarrollo de las tecnologías de la información y las comunicaciones.

El incremento del uso de las redes sociales ha puesto sobre la mesa un nuevo fenómeno: el oversharing, considerado como el acto de compartir “demasiada” información personal, información que bajo ciertos usos nos puede resultar incómoda o sencillamente inaceptable.

Por ejemplo, el perfil de una persona en Facebook puede tener fotos y otro tipo de información del ámbito familiar y su círculo de amistades, a diferencia del perfil de la misma persona en LinkedIn, una red social de carácter profesional. Si la información de ambos perfiles (y de otros muchos “rastros” que vamos dejando en la red) se mezcla pueden producirse situaciones no deseadas ni imaginadas.

Evidentemente la privacidad de la información es en última instancia una responsabilidad de cada uno y de los permisos que conceda a las redes sociales a las que pertenezca para que aparezcan públicamente en un buscador. Sin embargo, si usted es un usuario frecuente de la red, se sorprendería de la cantidad de información que puede estar en la red sobre su persona (si quiere ver cuán “expuesto” está pruebe por ejemplo en 123People.com)

Evidentemente, “demasiada información personal”, es una definición completamente subjetiva, y que varía de persona a persona, y entre diferentes grupos generacionales; por ejemplo, los jóvenes, acostumbrados a “twittear” pueden sentirse más cómodos con esta “sobre exposición”.

En definitiva, un fenómeno del cual cada día oiremos hablar más…De momento “Overshare” fue la palabra del año 2008, según Facebook y el Webster’s New World – Word of the Year.

Saludos y que encuentres lo que buscas,
Equipo Wenthia

viernes, 5 de junio de 2009

Nuevo buscador de Microsoft: BING

Desde el 1 de Junio está activo el nuevo servicio de búsqueda de Microsoft, llamado Kumo en su etapa de desarrollo y lanzado oficialmente con el nombre de BING.

Aunque el servicio ya está disponible en España (http://www.bing.es/) y otros mercados latinoamericanos en versión beta, como suele ser habitual, si quieres revisar todas las funcionalidades nuevas de este buscador deberéis utilizar la versión liberada para el mercado norteamericano (http://www.bing.com/).

Entre las características más interesantes que ha incorporado Microsoft está las llamadas “búsquedas inteligentes”. Se trata de una funcionalidad ya vista en otros buscadores comentados en nuestro blog (Kosmix, iSeek, etc), donde partiendo de los términos indicados por el usuario, se complementa el resultado obtenido con información que puede estar relacionada con la necesidad expresada. En el siguiente ejemplo, buscado “presidente de México”, el buscador muestra a la izquierda una serie de enlaces interesantes y útiles:

En un segundo ejemplo, si pidiéramos información de “Pau Gasol”, jugador español de la NBA que juega actualmente la final de esta competencia, los resultados que ofrece el buscador comienzan precisamente con el marcador del último partido jugado y el rendimiento de este jugador en dicho encuentro, además de las búsquedas relacionadas y los enlaces a páginas dedicadas a Gasol. Es verdaderamente notable el análisis del contexto y la experiencia de búsqueda resultante.
Otra característica novedosa, pero también ya vista en otros buscadores alternativos, es la capacidad de previsualizar las páginas resultantes de la búsqueda de manera que el usuario pueda repasar rápidamente la relevancia de la misma respecto a sus objetivos.

Interesante también la opción de previsualizar un video sin tener que ir a la página que lo aloja, sino directamente en el buscador. Ambas características de previsualización les han jugado una mala pasada al buscador, al permitir previsualizar contenidos para adultos de manera indeseada. Por esta razón Microsoft ha tenido que liberar un primer parche de la herramienta para que el usuario indique explícitamente su preferencia en este punto.

Una novedad que salta a primera vista cuando entramos al buscador es la incorporación de imágenes en la portada del servicio. Esta imagen, que cambia cada día, es una imagen “activa”, conteniendo zonas enlazadas con información relevante a su contenido. Una funcionalidad de dudosa utilidad cuando usamos el buscador para temas concretos y quizás queda como un valor adicional para el usuario en tanto cultura y conocimiento general.

En resumen, creo que Microsoft ha dado un paso adelante en su herramienta de búsqueda, aunque varias de las características que incorpora no son del todo innovadoras.

Saludos y que encuentres lo que buscas,
Equipo Wenthia

lunes, 25 de mayo de 2009

Wolfram|Alpha – impresiones preliminares

Después de algunos meses de expectación, ya tenemos on-line a WolframAlpha, un nuevo buscador con una filosofía diferente: calcular las respuestas partiendo de los datos acumulados en sus bases y de los algoritmos apropiados para transformarlos. En resumen, usar el conocimiento acumulado y explícitamente formulado.

Como todo en la vida, evaluar estos primeros resultados depende mucho de las expectativas que te hayas creado. En nuestro caso, en algunas consultas esperaba mucho más, y en otras he obtenido un resultado atractivo y con más riqueza informacional de lo que esperábamos.

Una cosa ha quedado clara y es que es un nuevo tipo de buscador, y por tanto, tendremos que adiestrarnos un poco para sacarle el máximo partido. Su interfaz de consulta no es nada obvia ni intuitiva, y necesitas revisar detenidamente los ejemplos aportados (algunos bastante exóticos), para ver dónde y cómo utilizarlo, y aún así, la mejor manera de “entenderlo” es con el clásico “prueba y error”.

Así por ejemplo, he puesto en su caja de búsqueda “Madrid, Santiago de Chile, Buenos Aires”, y me ha devuelto una comparativa de estas ciudades en algunas variables básicas (población, distancias, husos horarios, altitud, etc.), con los respectivos enlaces a Wikipedia para conocer más de estas ciudades. Esta información sería fácil de encontrar en Google, por poner un ejemplo, pero necesitaríamos más tiempo para navegar y editar el resumen que Wolfram ofrece directamente. Ciertamente, me hubiese gustado que esta información se complementara con otro tipo de indicadores socioeconómicos o al menos se ofreciese una funcionalidad tipo “Saber más…”. (Para regiones y ciudades de los Estados Unidos, este tipo de comparativa es mucho más rica, lo cual sugiere sencillamente que no es un problema de método sino solo de disponibilidad del dato).

Es mejorable también el procesamiento de los datos suministrados por el usuario para intuir la necesidad de información expresada. Como ejemplo, WolframAlpha responde una pregunta muy sencilla sobre mi localización ((Where I am?, Respuesta: Madrid), basado en mi dirección IP, para a continuación decirme que no entiende cuando le pregunto por “Zapatero”. Reconociendo que Zapatero es el segundo apellido del jefe de estado español, y que para una máquina computacional puede ser difícil inferir mis intenciones, lo ayudo un poco mejorando la expresión como “Rodríguez Zapatero”, pero aún así no hay inferencia correcta (me sugiere mirar “City Rodríguez”). Tampoco hay suerte con Jose Rodríguez Zapatero y solo reconoce al personaje cuando expresamos el nombre completo. Otros ejemplos han sido igual de frustrantes, por ejemplo, cuando quise conocer el número de usuarios de Internet en Latinoamérica.

Por otro lado, la interfaz de consulta solo interpreta el idioma inglés, de momento no existe (ni hay noticias) de versiones del buscador optimizados para otros idiomas. (Si quieres preguntar por el producto interno de España, no preguntes “PIB España”, sino “GDP Spain”.)

En fin, son solo algunos apuntes básicos de una primera impresión. De momento, parece una buena herramienta para usos puntuales, quizás de mayor uso en el ámbito académico y estudiantil.

Hay que dar un margen de tiempo mayor, para que el buscador vaya mejorando algoritmos, afinando procesos, y sobre todo para que los usuarios aprendamos a usarlo. De momento, le recomiendo paciencia pues el mensaje “WolframAlpha isn't sure what to do with your input” aparece más frecuentemente de lo que desearíamos.

Saludos y que encuentres lo que buscas,
Equipo Wenthia

jueves, 14 de mayo de 2009

Wolfram|Alpha sera lanzado el próximo 18 de Mayo y el nuevo buscador de Microsoft (Kumo) lo hará en Junio’09

Se mueve el mercado de los buscadores. Danny Sullivan editor en jefe de Search Engine Land, nos adelanta que el lanzamiento oficial de Wolfram Alpha será el próximo 18 de Mayo. Queda poco para poder probarlo!

Mientras tanto, otras noticias apuntan a que Microsoft puede tener planes de lanzar su nuevo motor de búsqueda, KUMO, a comienzos del mes de Junio.

Saludos y que encuentres lo que buscas,

Equipo Wenthia

viernes, 8 de mayo de 2009

El mercado de los buscadores...

Saludos y que encuentres lo que buscas,
Equipo Wenthia

lunes, 4 de mayo de 2009

¿Puede un buscador pronosticar un brote de influenza?

Google piensa que sí. Su argumento es simple y sencillo: las consultas de los usuarios buscando información médica en la red está muy relacionada con la ocurrencia real de las enfermedades que se buscan. Así, las personas buscan información sobre influenza cuando el fenómeno se está produciendo.

Partiendo de esta idea, Google ha estado trabajando hace meses en su “Google Flu Trends”, una herramienta que agrupa todas las consultas relacionadas con la gripe o enfermedades vinculadas y realiza estimaciones y alarmas para detectar posibles epidemias de influenza en los Estados Unidos.

Bueno, esto parece lógico, pero ¿los sistemas de salud pueden hacer un uso efectivo de esta información? El argumento principal para defender su uso radica en el coste y demora de los mecanismos tradicionales de vigilancia epidemiológica. En el caso de las consultas en un buscador, la recopilación y procesamiento de información es automático e inmediato ¿Son fiables estas estimaciones? Un estudio comparó datos de 5 años arrojados por “Google Flu Trends” con los resultados del sistema de supervisión del Centro para el Control y Prevención de Enfermedades de Estados Unidos (CDC por sus siglas en inglés), con resultados sorprendentes:

El número de Febrero 2009 de la prestigiosa revista Nature, recoge el resultado de los estudios conjuntos Google – CDC en un artículo titulado “Detecting influenza epidemics using search engine query data”.

Google se ha apresurado a publicar esta semana una herramienta equivalente para México, al calor de la actual crisis de influenza porcina. Sin embargo, Google reconoce que esta herramienta no ha sido validada con series históricas y sus resultados son “experimentales”.

Es evidente que este tipo de herramienta no lo puede hacer cualquier buscador: lo puede hacer Google por su enorme penetración de mercado, que le permite tener un banco de datos lo suficientemente grande como para correlacionar datos e inducir nueva información a partir de un análisis agregado de los mismos.
Saludos y que encuentres lo que buscas,
Equipo Wenthia

sábado, 25 de abril de 2009

La Biblioteca Digital Mundial

Acaba de ser lanzada una iniciativa llamada la “Biblioteca Digital Mundial”, desarrollada por la UNESCO y la Biblioteca del Congreso de los Estados Unidos, cuyo objetivo es, según sus propias palabras, “descubrir, estudiar y disfrutar de los tesoros culturales de todo el mundo”. Estos tesoros culturales incluyen, pero no se limitan a, manuscritos, mapas, libros poco comunes, partituras musicales, grabaciones, películas, grabados, fotografías y dibujos arquitectónicos.

El sitio, además de los contenidos de alta calidad, destaca por su sencillez de navegación: por área geográfica, por tiempo, por tema, tipo de artículo, e institución que aporta el contenido. A destacar también la descripción general de cada artículo y los metadatos, elaborados por profesionales de las instituciones participantes, siempre disponibles en siete idiomas: inglés, español, francés, ruso, árabe, portugués y chino.

Asímismo los materiales se han digitalizado íntegramente y con un alto nivel de calidad, permitiendo diferentes niveles de zoom, lo cual permite consultar cómodamente materiales de varios siglos atrás.

En resumen un sitio muy valioso, que pone a disposición de los investigadores y público en general, material histórico y cultural de alto valor, que sin una iniciativa como esta, sería difícil de encontrar organizados en un único sitio. Esperemos que a futuro se sigan incorporando instituciones, para aumentar el número de artículos disponibles actualmente.


Saludos y que encuentres lo que buscas,
Equipo Wenthia

miércoles, 8 de abril de 2009

“¿Cuánta información hay?” y “La Historia de la Información”

Como suele ocurrir, vagando por la red, de sitio en sitio, sin “rumbo fijo”, he recalado en un sitio interesante: Global Information Industry Center, de la Universidad de San Diego en California, un centro de investigación focalizado en el impacto de las tecnologías de la información en la empresa, los individuos y la sociedad en general. Lo que ha llamado mi atención han sido los dos primeros programas de investigación lanzados por este centro: “How Much Information?” y “The History of Information”.
How Much Information?” es un programa que investiga el ritmo de crecimiento de la información en el mundo, quién la produce, y cómo se distribuye la producción de la misma en las diferentes regiones geográficas del mundo. (Esfuerzos parecidos han sido realizados también desde el ámbito empresarial, entre los cuales recomiendo los estudio de IDC y EMC realizados en el 2007 y 2008: The Diverse and Exploding Digital Universe, el cual podemos revisar en otra entrada).

Por su parte, “The History of Information”, tiene como objetivo representar las grandes ideas, invenciones, hitos y personalidades que han influido a través del tiempo en el desarrollo de la sociedad de la información. De momento, el sitio presenta un pequeño video para cada una de las seis grandes “eras de la información”, según su propia clasificación:
  • The Dawn of Information
  • Storage & Retrieval
  • Mass Reproduction
  • Dawn of the Electronic Age
  • The Information Age
  • Dawn of the Internet

Debo reconocer que esperaba un poco más de ambos sitios y me quedé con “gusto a poco”. No obstante, dada la calidad de las instituciones implicadas (además de la Universidad de San Diego, están el MIT y la UC Berkeley, y varias empresas líderes como IBM, AT&T, Oracle, Cisco, etc.) cabe esperar nuevos contenidos vinculados a los resultados de ambos programas. Sin dudas un sitio para “visitar” nuevamente más adelante.

Saludos y que encuentres lo que buscas,
Equipo Wenthia

lunes, 6 de abril de 2009

Nuevas ideas, nuevos buscadores

Apuntaba en el artículo anterior la dinámica de innovación que fluye alrededor del mundo de la búsqueda de información, algo que refuerza la opinión vertida en nuestra primera entrada del blog donde comentábamos que este era el gran reto de la Sociedad de la Información.

He leído en el blog de Yahoo una interesante entrada donde se clasifica la innovación en el mundo de los buscadores en cuatro grandes grupos, las cuales comento y apunto con mis propias observaciones:
  1. Buscadores verticales. Los grandes buscadores generalistas se han puesto manos a la obra y han diseñado herramientas que permiten a un tercero crear un buscador especializado en un área temática o de interés particular. Yahoo tiene su Yahoo BOSS (Build your Own Search Service), y Google su “Google Custom Search Engine

  2. Búsquedas semánticas. Uso de lenguaje natural u otros enfoques para comprender mejor la intención de la consulta. En este grupo estaría por ejemplo el proyecto “Wolfram Alpha” ” que ya hemos comentado.

  3. Exploración. En este grupo estarían herramientas que integran información de bases de datos estructuradas de la llamada “web profunda” con información de sitios de calidad previamente filtrados y seleccionados para entregar al usuario un punto inicial de navegación y exploración de contenido. En este grupo estaría Kosmix, revisado en nuestro último post, o iSeek, una herramienta que me ha gustado mucho en mis primeras pruebas, y que ha ganado el premio “Buscador Alternativo del 2008”

  4. Nuevos modelos de presentación: Herramientas que se centran en innovar alrededor de la forma en que se presentan los resultados, agrupándolas gráficamente y mostrando relaciones existentes, tendencias y otras características visuales. Ejemplo de este tipo de innovación pueden verla en SearchMe, que muestra la previsualización de las páginas de resultados (ver ejemplo más abajo buscando "Penelope Cruz"); ó Quintura , que muestra la “nube” de elementos relacionados con la búsqueda lanzada.

Bienvenida la innovación y la creatividad…

Saludos y que encuentres lo que buscas,
Equipo Wenthia

viernes, 3 de abril de 2009

Kosmix – La nueva guía del Web

Tan dinámico es el mundo Internet que es prácticamente imposible seguir la pista de cada nuevo servicio de búsqueda de información que surge en el mercado.

Sin dudas, la saturación de información ha disparado el número de iniciativas que buscan posicionarse como los buscadores de la nueva ola de Internet, marcada por varios fenómenos que confluyen: la personalización de servicios, la socialización de nuestra presencia virtual, la semántica y la inteligencia contextual, etc… En definitiva, en formas superiores de interacción hombre-máquina, máquina-máquina, y hombre-hombre.

Leyendo un artículo publicado por el New York Time “New Search Technologies” se descubren cosas muy interesantes, como Kosmix, un nuevo servicio que se auto presenta como “la guía del Web”, donde ha invertido gente tan conocida como Jeff Bezos (Amazon.com).

Detrás de este concepto de “guía” subyace la idea de diferenciarse de los buscadores actuales, posicionándose como la herramienta adecuada para explorar un tema en particular.

Ciertamente, los usuarios utilizan los buscadores para dos funciones diferentes: en un caso los usan para buscar un tema concreto, muy bien acotado; y en otros casos, simplemente se dejan llevar, explorana ver qué hay”, sin un fin concreto más allá de informarse y conocer un poco más.

Kosmix centra su oferta en este último uso: raestra la web, la visible y la invisible, clasificando sitios, bases de datos, y contenidos, en una taxonomía propia. Cuando el usuario introduce su consulta, su algoritmo determina la clasificación apropiada y le muestra un conjunto de resultados convenientemente organizados: un “primer vistazo”, imágenes, noticias, videos, blogs, e incluso temas “relacionados”, evidenciando que el motor establece complejas relaciones en su taxonomía para ofrecer otros elementos de interés vinculados a la búsqueda original.

Por ejemplo, buscando “Fernando Alonso” en Kosmix, se obtiene en el primer vistazo, una breve biografía del piloto, videos e imágenes de diferentes fuentes, algunos resultados pertinentes de Google, artículos a la venta, y la sugerencia de un conjunto de temas “cercanos” informacionalmente al corredor: La Fórmula 1, Asturias, Renault, Raquel del Rosario, etc. (¿qué pasaría si fuésemos menos específicos y sólo escribiésemos “Alonso” en la caja de búsqueda? Pues Kosmix entiende que no tiene suficiente información para dar una respuesta exacta y sugiere varios posibles “caminos”: Xabi Alonso, Fernando Alonso, Alicia Alonso, y varios más)


Este enfoque de construir una “guía personalizada y en tiempo real”, organizando y agregando contenido disperso en la web con una visión panorámica (360º), es una forma excelente de comenzar a navegar o explorar la Web sobre un tema concreto.

Saludos y que encuentres lo que buscas,

Equipo Wenthia

miércoles, 1 de abril de 2009

Google Suggest en Español

Lo saben todos los que han usado Google en español durante el día de hoy, es decir, algunos millones de personas. Es la “anti-noticia”...pero aún así no puedo dejar de comentarlo: finalmente tenemos a Google Suggest en español, ocho meses después de su “graduación” de Google Labs, y de su puesta en producción en el sitio internacional Google.com

Esta funcionalidad te sugiere cómo completar el término de búsqueda que has comenzado a escribir, y te adelanta el resultado, en términos de número de páginas que devolvería el buscador para dicho término.

Es una característica verdaderamente útil pues te ayuda a formular tu consulta completándola con otros términos relevantes, te evita errores tipográficos (especialmente importante si buscas información en otros idiomas), y te permite “calibrar” el esfuerzo que debes hacer filtrando resultados versus reformular la consulta de manera más precisa….bueno, colateralmente, también sirve para demostrarnos aquello del “information overload”.

Usando Suggest puedes ver claramente fenómenos, no por obvios menos interesantes, respecto al uso de la información: la crisis económica actual pone de "moda" nuevamente el interés de las personas por conocer más sobre la crisis del 29.















Saludos y que encuentres lo que buscas,
Equipo Wenthia

lunes, 30 de marzo de 2009

¿Buscamos juntos?

En los sectores intensivos en conocimientos es bastante usual organizar el trabajo en base a proyectos, como unidad básica alrededor del cual se estructuran los recursos humanos, técnicos y económicos de la organización.

En este contexto el trabajo en equipo es uno de los factores críticos para el éxito. Sería lógico entonces pensar, que la búsqueda y procesamiento de la información que el proyecto requiera, también se hiciera de forma colaborativa y coordinada. Sucede, sin embargo, que la mayoría de las herramientas de búsqueda actuales están pensadas y diseñadas para un uso individual: vas al buscador, ingresas las palabras claves y filtras los resultados.

Ciertamente, va emergiendo el concepto de “búsqueda social” (social search), donde los usuarios participan, mejoran y facilitan el proceso de búsqueda, creando “tags”, compartiendo sus marcas (“bookmarks”), o valorando los resultados que devuelve el buscador.

Sin embargo, aunque la “búsqueda social” es un paso adelante, aún me parece insuficiente (e ineficiente) como mecanismo de trabajo de un grupo de personas en un proyecto común concreto. Sería interesante tener herramientas colaborativas específicas para compartir el trabajo de búsqueda y procesamiento de información basado en Web, para un proyecto concreto y para búsquedas específicas.

Comienzan a aparecer herramientas orientadas a satisfacer esta necesidad. La revista Technology Review incluye un interesante artículo, “Searching as a Team” en su edición del mes de Marzo del 2009, donde se reseña la versión beta de “SearchTogether”, una herramienta salida de Microsoft Research.

SearchTogether es un plug-in de Internet Explorer 7 y permite a un grupo de trabajo distribuirse las labores de búsqueda y selección de información, independientemente del buscador que cada persona use. Incluye la posibilidad de mantener una historia de las búsquedas realizadas, comentar y evaluar resultados, dividir el trabajo de valoración, etc. Pudiéramos llamarle “búsqueda colaborativa”.

En Wenthia esta posibilidad nos parece extraordinaria, y sin dudas es un mecanismo muy interesante para nuestro propio funcionamiento, donde varios colaboradores pueden trabajar juntos en una solicitud concreta expresada por un cliente a nuestro Centro de documentación online.

Saludos y que encuentres lo que buscas,
Equipo Wenthia

viernes, 27 de marzo de 2009

Las bases de datos factuales y la nueva “calculadora” de respuestas

El enfoque de solución predominante en los grandes buscadores actuales (indización masiva de contenidos; búsqueda basada en palabras claves; ordenación de resultados siguiendo diferentes criterios de relevancia), suele ser poco eficiente cuando se desea buscar un dato o hecho concreto.

Por ejemplo, si buscamos en Google, “¿en qué año ganó el Nobel García Márquez?”, los resultados de Google muestran en primer lugar un sitio que contiene la biografía del escritor colombiano, la cual debemos revisar para encontrar el dato buscado. Los siguientes resultados de la lista son peores, mostrando noticias relacionadas con el escritor, y no la respuesta deseada. Nosotros simplemente queríamos que nos respondieran: “1982”.

Para este tipo de búsqueda es mucho más efectivo utilizar las obras de referencias tradicionales o una base de datos factual, como FreeBase o True Knowledge, que almacenan una amplia cantidad de datos y hechos, organizados en áreas temáticas. Estas herramientas poseen diferentes modelos para que el usuario recupere la información buscada, que van desde la navegación tipo directorio, hasta la búsqueda en lenguaje natural.

Hace menos de un mes se ha anunciado la llegada de un nuevo concepto de “answer engine”: el proyecto “Wolfram Alpha”, liderado por el prestigioso científico Stephen Wolfram. Lo novedoso de este proyecto es que su enfoque no es “encontrar” la respuesta, sino calcularla utilizando todo el conocimiento disponible y un conjunto de algoritmos, reglas de cálculos y modelos de representación lógicos, teoremas, procesamiento lingüístico, heurísticas, etc.

La idea, como explica en su blog Nova Spivack (uno de los pocos que ha visto la herramienta funcionando), no es almacenar todos las preguntas y todos los hechos que le responden en una gran base de datos, sino calcular la respuesta en tiempo real, partiendo de datos primarios y la aplicación del conocimiento existente. La diferencia es notable: Google, indiza la web y devuelve documentos que pueden contener la respuesta; las bases de datos factuales almacenan hechos para poder responder una solicitud de usuario mientras que “Wolfram Alpha”, almacena hechos y aplica modelos de conocimientos que calculan la respuesta.

Evidentemente, este tipo de herramienta tendrá limitaciones importantes en aquellas búsquedas que no sean netamente factuales, pero su lanzamiento el próximo Mayo’09, levanta grandes expectativas.

Saludos y que encuentres lo que buscas,

Equipo Wenthia

lunes, 23 de marzo de 2009

Búsqueda de información e interacción social

Nova Spivack, creador de Twine, posiciona algunas compañías en un gráfico cartesiano donde “cruza” la capacidad para encontrar nuevos contenidos, con el grado de interacción social que cada site/herramienta soporta.

Discrepo del posicionamiento que Spivack establece para algunas redes sociales en el eje de “Content Discovery”, pero como ejercicio conceptual me parece un acierto: es indudable que la interacción social es y será un factor clave en la búsqueda y recuperación de contenidos de calidad en la red.


Saludos, y que encuentres lo que buscas,
Equipo Wenthia

domingo, 22 de marzo de 2009

¿Son efectivos los buscadores actuales?

A comienzos de este mes de marzo comenzó a circular en la red la noticia del desarrollo del nuevo buscador de Microsoft, llamado Kumo. No quiero repetir innecesariamente lo que se dice de Kumo (en realidad poco se sabe, más allá de algunos pantallazos, de su apuesta por la web semántica y de una probable fecha de lanzamiento a finales del 2009), sino llamar la atención de algunos datos aportados por Satya Nadella, Vicepresidente Senior de Investigación y Desarrollo de Microsoft, en el correo interno que envió a sus empleados, en ocasión del comienzo del período de pruebas internas de Kumo. Textualmente:

"In spite of the progress made by search engines, 40% of queries go unanswered; half of queries are about searchers returning to previous tasks; and 46% of search sessions are longer than 20 minutes. These and many other learnings suggest that customers often don’t find what they need from search today".

Saludos, y que encuentres lo que buscas,

Equipo Wenthia

viernes, 20 de marzo de 2009

Las Tendencias del 2009 y la Arquitectura de la Información

Hace un año aproximadamente, leí en Infonomia una interesante nota reseñando a “Now and Next”, un sitio web dedicado a analizar los acontecimientos que marcan tendencias, escrito por Richard Watson, a consultor de reconocido prestigio, y autor del libro "Future Files". Los contenidos que produce “Now and Next” son verdaderamente interesantes y recomendables, pero lo que me ha parecido especialmente innovador en su caso ha sido la forma en que presenta algunos de sus productos.

Por ejemplo, compactar las grandes tendencias sociales, tecnológicas, políticas, económicas, de negocio, medioambientales, de los medios de difusión y del entorno familiar, en una sola hoja, parece una misión imposible, más aún, si estas tendencias se solapan e intercomunican entres sí. Pues bien, “Now and Next” lo consigue de forma elegante en sus Mapas de tendencias”, a través de un diseño informacional cuidadosamente trabajado. El Mapa del 2007, por ejemplo, se inspira en el conocido esquema de diseño de los metros urbanos para presentarnos las tendencias de las mencionadas áreas temáticas. Un diseño simple y familiar que encapsula una enorme complejidad conceptual.

En un espacio informacional saturado, resulta esencial encontrar una forma de presentar la información que permita la asimilación del contenido por parte del usuario. A esto, entre otras cosas, se dedica la joven disciplina que llamamos “Arquitectura de la Información”.

Por cierto, no dejen de consultar el Mapa de Tendencias del 2009… solo llamo la atención en un punto: ¿Cuál creen que sea la tendencia de mayor impacto del 2009, según la opinión de estos consultores, en el eje dedicado a los medios de información? “Too Much Information”… En Wenthia compartimos esta opinión…

Saludos, y que encuentres lo que buscas,

lunes, 16 de marzo de 2009

I+D en los buscadores: Microsoft adCenter Labs

De vez en cuando es recomendable hacer un paseo virtual por los sites de los grupos de investigación de los grandes buscadores: Google, Microsoft y Yahoo. No significa que sean ellos los únicos que investigan e innovan en este campo, pero siendo los líderes del mercado, es interesante saber “en qué andan”. Además, en esos sites puedes probar “los juguetes nuevos”, es decir, las innovaciones que mañana encontraras incorporadas en sus respectivos buscadores.

Hoy vamos a resumir las grandes áreas donde están trabajando los expertos de Microsoft, en su adCenter Labs.

  • Audience Intelligence: Este grupo crea herramientas para estudiar y predecir el comportamiento de los usuarios del Web partiendo de la información que se genera en sus acciones on-line: búsquedas, navegación, etc. Especialmente interesante me ha parecido la herramienta “Detecting Online Commercial Intention” que establece una probabilidad sobre la intención del usuario de adquirir un producto basado en los términos que emplea en el buscador o los sitios que ha visitado recientemente.

  • Keyword Research: Un conjunto de herramientas diseñadas para gestionar y mejorar el tratamiento que los buscadores hacen de las palabras claves. Con técnicas avanzadas de “text mining” se intenta utilizar al máximo las relaciones semánticas de los términos (sinónimos, antónimos, palabras similares, relación de jerarquías, de pertenencia, relación de “atributo de”, etc.). Por ejemplo, la herramienta llamada “Keyword Group Detection”, ayuda a encontrar un grupo de términos relacionados o similares partiendo del análisis de búsquedas realizadas por otros usuarios. También nos ha resultado muy interesante la herramienta “Entity Association Graph”, que partiendo de una palabra clave, devuelve un gráfico que muestra las relaciones del mismo con otros términos, en base a la concurrencia de ambos en las búsquedas de los usuarios. Así por ejemplo, he visto que muchas veces que se busca “Paris” también se busca “hotel”, pero más relacionado está con “Hilton”!!
  • Content Analysis: Se trata de analizar el contenido de páginas Web , o de las consultas que realizan los usuarios para poder dar un servicio más personalizado. Por ejemplo, la herramienta llamada “Content Categorization Engine” determina la categoría más relevante donde puede clasificarse un website, basado en su contenido. Así por ejemplo, si probamos con http://www.iberia.com/, la clasifica en “Travel\Trip Planning”, y si probamos con el website de la Casa Blanca, lo clasifica en “Library\Government & Politics”…No está mal. Este grupo de trabajo tiene bastantes herramientas útiles, que sería interesante revisar en otros post. Pruébenlas!
  • Video & Interactive Media: Se tratan de investigaciones encaminadas a analizar el contenido de material audiovisual, basadas en algoritmos de visión por ordenador, reconocimiento del habla, interacción hombre máquina, etc. Una de las herramientas que comentan, el Video Hyperlink, permite al usuario obtener más información de un objeto cuando hace click sobre el mismo en el video. Es evidente, no solo por la cantidad de herramientas de prueba disponibles, sino también por los ejemplos, que está área todavía tiene mucho camino por recorrer.

Saludos, y que encuentres lo que buscas.

domingo, 15 de marzo de 2009

BBVA Open Talent: Nuestra particular "plantá"

Día 15 de marzo. Como cada marzo Valencia se viste de fiesta fallera. Hoy es la plantá: el trabajo de todo un año de los artistas falleros ve por fin la luz y los ninots salen a las calles de Valencia.

En cambio nosotros este año hemos estado un tanto al margen de las fallas y sus celebraciones. Hemos estado metidos en nuestro proyecto y hoy nos vence el plazo para presentarnos al concurso del BBVA y por tanto el web y demás documentos debían estar listos sí o sí.

Así que nada, una bonita coincidencia: en Wenthia también hemos tenido nuestra particular plantá. Nuestro "beta-ninot" por fin ha visto la luz: http://www.wenthia.com/. También hemos quedado formalmente inscritos en el concurso, y, si pasamos el primer filtro, podrán votar por nuestro proyecto muy pronto en http://www.bbvaopentalent.com/

Veremos cómo nos va y si el mercado nos "indulta"... de momento, una "mascletá" por todos nosotros! Gracias a todo el equipo, a todos los que nos han ayudado y han estado pendientes del proyecto.

Ya estamos on-line..!

Saludos, y que encuentres lo que buscas,

miércoles, 11 de marzo de 2009

¿Qué funciones hace un buscador automático y donde aporta valor un especialista humano? (II)

En esta entrada vamos a concluir el análisis de los enfoques que adoptan los nuevos servicios de búsqueda que incluyen participación humana de forma activa.

Recordemos que un buscador debe cubrir cuatro funciones: rastrear información; indexar la información para su posterior recuperación; proveer una interface de consultas y recuperación y ordenar los resultados según su pertinencia respecto a la consulta realizada.

La participación humana en las dos primeras funciones la revisamos en un post anterior. Veamos cual son los enfoques de intervención humana en las dos restantes.

Consultas: Más que una “interface de consulta”, algunos servicios de información basan su modelo de funcionamiento en agrupar o tener a personal especializado en contestar o ayudar al usuario con su solicitud. Hay varios enfoques diferentes:

  • El primero es el llamado sistemas de Preguntas y Respuestas donde el usuario formula una pregunta que será contestada por otro usuario. Se trata de un modelo colaborativo donde se establece una plataforma de contacto entre usuarios. Como ejemplos tendríamos Yahoo!Respuestas.
  • Un enfoque más interesante para lo que son las búsquedas profesionales son servicios donde las solicitudes de información son atendidas por personal especializado. En estos casos la respuesta no se obtiene de forma inmediata, sino que puede tardar minutos, horas o días, dependiendo de su complejidad y de la calidad del servicio. En este grupo están uClue, Ask A Librarian, pregunte.es, o nuestro futuro WenthiaDOC.
  • Un último enfoque permite al usuario expresar su consulta en lenguaje natural, la cual se procesa con un enfoque híbrido (máquina - hombre) para darle una respuesta adecuada. Ejemplo, el servicio de ChaCha.


Ranking: ¿cómo intervienen los humanos en el proceso de ordenar los resultados? Aquí hay mucha tela por donde cortar, y también muchos intereses en juego pues está demostrado que el usuario tipo “consume” la información contenida en los primeros puestos del ranking de resultados sugeridos.

  • Para comenzar, es lógico considerar que sistemas basados en rastreo manual como Mahalo, también tengan un alto componente humano en el ranking sugerido.
  • Un enfoque diferente es el que permite a los usuarios votar los resultados obtenidos por un algoritmo automático, y dicha valoración retroalimenta al motor de búsqueda. Ejemplo, Sprooze y su “human popularity voting,” . (Algunas noticias recientes en la red sugieren que Google está evaluando esta opción!!)
  • Un tercer enfoque, bastante más sofisticado, son los sistemas de recomendación (filtrado colaborativo), que recomiendan al usuario determinada información basado en su comportamiento. Este modelo, bastante utilizado en aplicaciones de comercio electrónico (caso Amazon), comienza a explorarse en el mundo de la información, por ejemplo, para el filtrado de noticias.

En fin, que hay mucho espacio donde innovar y competir!

Saludos, y que encuentres lo que buscas.

martes, 10 de marzo de 2009

¡Estados Unidos tiene un CIO!

Estados Unidos ya tiene su CIO (Chief Information Officer). El presidente Barak Obama ha cumplido su promesa electoral y ha nombrado a Vivek Kundra para este nuevo cargo, desde donde supervisará el uso de las tecnologías de la información en los organismos gubernamentales.

Estoy seguro que esta es una decisión histórica para el sector tecnológico y marcará un cambio en el estilo y el ritmo en que las administraciones públicas funcionan. No será un cambio fácil ni rápido, pero la sola idea de visualizar un responsable tecnológico, una cabeza claramente visible en estos temas, marcará un antes y un después, no solo de la administración pública norteamericana sino de las de buena parte del mundo.

Ya Obama se había convertido en un “caso de éxito” del uso de las redes sociales con fines políticos. Ahora ha ido un paso más allá, y ha hecho una apuesta clara por la información y por la tecnología.

En su conferencia de estreno, Vivek Kundra ha declarado que entre sus primeras iniciativas estará “…crear el sitio Data.gov, que servirá como un depósito de la información almacenada por el gobierno. Hay mucha información que posee el gobierno federal y necesitamos que todos estos datos no sean privados o restringidas por razones de seguridad nacional…”.

Como primeras declaraciones no están mal...Supongo que nuestros colegas information brokers americanos tendrán mucho trabajo!

La información está cambiando el mundo, tan rápido como nunca antes en el desarrollo de la humanidad…tan rápido vamos que a pocas horas de su nombramiento, el “OBAMA-CIO” ya tiene su entrada en la Wikipedia…así es la vida 2.0

Saludos, y que encuentres lo que buscas!

¿Qué funciones hace un buscador automático y donde aporta valor un especialista humano? (I)

En un post anterior comentábamos, sin entrar en detalles, sobre la nueva ola de buscadores que incluyen a las personas como parte de su modelo de funcionamiento (nos referimos a servicios de búsqueda que incluyen a personas de forma “activa”, a fin de cuentas, el algoritmo de Google, PageRank, también incluye a las personas cuando analiza la red de enlaces, pero en este caso se trataría de una inclusión “pasiva”). En esta entrada profundizaremos en los enfoques de que adoptan los nuevos servicios de búsqueda donde se incluye participación humana de forma activa.

Básicamente un servicio de búsqueda, sea automático, híbrido (“powered by human”), o totalmente realizado por humanos, debe cubrir cuatro funciones: rastrear información; indexar la información para su posterior recuperación; proveer una interface de consultas y recuperación y ordenar los resultados según su pertinencia respecto a la consulta realizada.

¿En qué parte de este proceso participan los humanos en los nuevos buscadores? Comencemos por las dos primeras funciones.

Rastrear: En el modelo directorio (Yahoo!, DMOZ), los usuarios se encargan de hacer esta función, sin embargo, dado el crecimiento de Internet no es viable depender exclusivamente de personas para rastrear y clasificar toda la web. Por ello han aparecido servicios de búsqueda que combinan el rastreo humano para una parte muy acotada de la Web (un ámbito temático, geográfico, u otro criterio), con el rastreo automatizado del resto del espacio web. El ejemplo más paradigmático de este tipo de enfoque es Mahalo, donde un grupo de editores (buscadores humanos), realizan búsquedas para los términos más comunes.

Indexar: El problema de la escalabilidad que planteamos para la función de rastreo también aparece con la indexación. En este caso, una manera de gestionarlo ha sido la creación colaborativa de “tags”, mediante el cual los contenidos de Internet son clasificados directamente por los propios usuarios. Este tipo de servicios se le ha dado en llamar “marcadores sociales” y como ejemplo tenemos a Del.ici.us, o Mister Wong. La desventaja principal de este modelo proviene de su propio principio de funcionamiento anárquico (cada usuario marca el texto como considera) lo cual puede dificultar el proceso de recuperación de la información.

En la próxima entrada revisaremos las dos funciones restantes.

Saludos, y que encuentres lo que buscas.

domingo, 8 de marzo de 2009

¿Voy a tener suerte?


Tengo una relación difícil y contradictoria con este botón de Google. Reconozco que me genera cierta simpatía. Su nombre me sugiere desenfado, frescura y un espíritu optimista que me gusta. Sin embargo, no puedo aceptar ni compartir su propuesta de dejar a mi suerte el resultado de mis búsquedas.

A pesar de todo, de vez en cuando lo utilizo. Más que nada por curiosidad, pero salvo para búsquedas muy básicas, el resultado no es lo que necesito…

La suerte no es suficiente para buscar información con fines profesionales. Lo que verdaderamente necesitamos se resume en tres grandes bloques:

  1. Conocer la temática sobre la que buscamos. (Axioma: La capacidad de obtener resultados de calidad es directamente proporcional a nuestro conocimiento de la materia sujeto de la búsqueda.)
  2. Conocer las fuentes de información con autoridad en la materia. (Atención: Conocer la temática es condición necesaria pero no suficiente para conocer las fuentes!)
  3. Conocer cuáles son las mejores herramientas para bucear en las fuentes de calidad anteriores y sacarle el máximo partido. ( Google no es la herramienta idónea en todos los casos, y en caso que lo sea, tiene muchísimas más funcionalidades que una caja blanca esperando un par de términos.)

Saludos, y que encuentres lo que buscas.

La industria de las búsquedas necesita de nosotros!

“Había una vez el secreto mejor guardado del mundo de los negocios era la fórmula de la Coca-Cola; hoy es el algoritmo de Google”. Así comienza un interesante artículo ("The Human Touch That May Loosen Google’s Grip") de The New York Time, del verano del 2007, que después de repasar brevemente el entorno competitivo de la industria de los buscadores, deriva en un análisis sobre la importancia de la aportación humana como mecanismo eficaz para obtener resultados de calidad en Internet.

En la misma dirección se pronunciaba, un tiempo después, la prestigiosa revista WIRED, quien fue mucho más lejos, y consideraba la (re) incorporación de los humanos a la industria de la búsquedas como una de las grandes tendencias de negocio del 2008 ("Algorithms Are Terrific. But to Search Smarter, Find a Person").

No son opiniones aisladas. Una gran cantidad de iniciativas empresariales enmarcadas en la industria de los buscadores comienzan a apoyarse en mayor o menor medida en la participación de un equipo humano (Vean Mahalo, ChaCha, Squidoo, etc).

No se trata de una “vuelta a los orígenes”, o sea, a la simple recopilación de links en formato directorio que impuso Yahoo! a mediados de los ’90. Ese modelo, adecuado para los inicios de Internet, con relativamente pocas fuentes de información, con autoridad contrastada, se vio superado con el crecimiento explosivo de la red.

Comenzó entonces la era Google, cuyo algoritmo PageRank interpretó mejor que nadie cual debería ser el nuevo modelo de “autoridad” en la red: la propia estructura de links de la red confiere más importancia a unos sitios que a otros. Este modelo algorítmico funciona excelentemente, y supera un obstáculo insalvable para los buscadores humanos: la escalabilidad.

Sin embargo, tampoco es perfecto. Los algoritmos (sea PageRank o cualquier otro), aunque sofisticado y en contaste evolución, pueden ser engañados con técnicas malintencionadas (link spam; google bomb; cloaking; doorway; etc.).

Comienzan entonces a aparecer enfoques híbridos “algoritmo-hombre”, que combinan la potencia de las máquinas para procesar grandes cantidades de información, y la inteligencia única del ser humano para distinguir y separar “el grano de la paja”.

Por otro lado, la evaluación que hace “un buscador” en lo relacionado con la autoridad de la fuente y la calidad de la información, es un elemento decisivo en una sociedad donde impera la sobrecarga informativa.

En este sentido los seres humanos, y en particular los profesionales de la información y los expertos en una determinada área temática, somos capaces de evaluar la calidad de la información que nos muestra una fuente, basados en nuestra experiencia y conocimientos, de forma natural y con un alto por ciento de aciertos, cosa que está por demostrar en un modelo cien por cien algorítmico.

La diferencia fundamental radica en cómo abordamos el problema…y los algoritmos aún están muy lejos de imitar el funcionamiento de nuestros cerebros. ¿Cómo funciona nuestra memoria? ¿Cómo “conectamos” conceptos? ¿Cómo asociamos situaciones? ¿Cómo los humanos buscamos? Son temas apasionantes que seguro ocupara mucho espacio en nuestro blog.

Sea como sea, vivimos un momento apasionante de la era de la información, y por lo pronto, la industria de los buscadores nos seguirá necesitando por mucho tiempo…así que nada, a seguir Wenthiando…

Saludos, y que encuentres lo que buscas.

lunes, 2 de marzo de 2009

Wenthiando

La búsqueda y recuperación de la información es uno de los ámbitos profesionales más apasionantes de la sociedad actual. Yo diría más, es El RETO de la sociedad de la información. Un reto que aumenta en la misma proporción que crece la información disponible.

Piensen en la “cadena de valor” de la información: generar, almacenar, transmitir y acceder a la información no son actualmente un gran problema, tenemos soluciones técnicas eficientes, baratas y cómodas que siguen evolucionando a un ritmo frenético. Sin embargo, encontrar la información que necesitamos, en el momento preciso, y de calidad contrastada, es cada día más complejo, como nos ilustra genialmente James Victore de la revista WIRED.

Y no solamente estoy pensando en Internet…El mismo problema ocurre al interior de las organizaciones. Muchos datos, mucha información, pero poca capacidad de utilizarla eficaz y eficientemente.


Lo apasionante del asunto es que este tema nos toca de cerca de todos, tanto a los usuarios como a los profesionales de la información. Lo apasionante es que no se reduce a un “debate técnico” de algoritmos, sino que también y fundamentalmente, es un debate que cruza múltiples aspectos sociales y económicos.


En este blog queremos compartir ideas sobre la forma en que buscamos, procesamos y accedemos a la información. Pero sobre todo queremos reflexionar sobra la forma de encontrarla. A fin de cuentas, buscar no es lo mismo que encontrar. ..

En este blog queremos revisar el pasado, cuestionarnos el presente e imaginar futuros.

Queremos pensar en voz alta, provocar y debatir.

Queremos escuchar. Queremos saber vuestra opinión sobre estos temas.

Sois todos bienvenidos al Blog de Wenthia

Saludos, y que encuentres lo que buscas.