lunes, enero 31, 2005

Tecnología Los buscadores del futuro

Los motores de búsqueda, como Google y Yahoo!, se renuevan con más funciones y herramientas. Otros colosos se suman a la batalla.

Tecnología Los buscadores del futuro

(NEW YORK TIMES).- De pronto, el mundo de la computación despierta interés una vez más. El último trimestre de 2004 trajo más innovación a una velocidad mayor de la que los usuarios vieron en años. El aluvión reciente de productos y servicios difiere de aquellos de los tiempos muy competitivos de antes en dos aspectos: las novedades más atractivas son gratuitas y se concentran en el flamante campo del search (búsqueda).

Google, el coloso de los sistemas de búsqueda en Internet, no abandonó su modelo de introducir características y productos cada dos o tres semanas. Además de su célebre plan de indexar los contenidos de varias bibliotecas universitarias, acaba de lanzar versiones beta (de prueba) del Google Scholar, que presenta resúmenes de trabajos académicos y muestra con qué frecuencia éstos son citados por otros investigadores, y del Google Suggest, una característica de lo más intrigante que intenta descubrir el objetivo de una búsqueda después de que uno tipeó una letra o dos. Por ejemplo, si uno pone po muestra enlaces a poesía, Pokémon y a otras búsquedas frecuentes. (Si uno se detiene en la P, sugerirá París, Hilton.) En la práctica, es más útil de lo que parece.


Microsoft, otro peso pesado, pero del resto del reino de la computación, pelea por estar a la par de las innovaciones de Google y otros. El 10 de diciembre último, un funcionario de la empresa hizo una revelación alarmante. Durante años Microsoft destacó la importancia del WinFS, un sistema de archivos fundamentalmente nuevo que facilitaría a los usuarios la búsqueda y el manejo de información en sus propias computadoras. El verano boreal último, la empresa dijo que el WinFS no estaría listo a tiempo como para salir con su nueva versión de Windows, llamada Longhorn. Las últimas novedades eran que el WinFS no estaría listo ni siquiera para después, lo que posterga su entrega cinco años más. Según parece, esto dejaría a Microsoft fuera de carrera en la búsqueda en las computadoras. Pero en tres días había lanzado una versión beta de su nuevo utilitario de búsqueda, del que se había dicho que no estaría disponible en meses.

Mientras tanto, una racha de fusiones, anuncios y convenios por parte de empresas nuevas produjo una variedad deslumbrante de nuevas posibilidades de búsqueda. A principios de este mes, Yahoo! dijo que usaría el excelente programa para indexar X1 como base para su propio sistema de búsqueda para computadoras de escritorio, el que se distribuiría sin cargo entre sus usuarios. La compañía de búsqueda Autonomy, que se especializa en codificación de datos corporativos, también se sumó a la nueva competencia, lo mismo que Ask Jeeves y otras empresas pequeñas, como dTSearch, Copernic, Accoona y muchas otras.

Tengo la mayoría de estos sistemas juntos funcionando en mi computadora y si no la funden o hacen explotar, diré cómo corre cada uno. Pero el tema de hoy es la estrategia de búsqueda prácticamente sin publicidad de otro peso pesado de la industria: IBM.

IBM entra en juego

Hace unas semanas visité el Centro de Investigaciones Thomas J. Watson de Hawthorne, 30 km al norte de Nueva York, para escuchar a seis científicos de IBM describir el concepto que tiene su empresa sobre "el futuro de la búsqueda". Los conceptos y las demo son distintos de los productos que se envían y venden, por eso es injusto comparar lo que IBM promete con lo que otros hacen en este momento. No obstante, la promesa parece grandiosa.

Dos semanas antes de nuestro encuentro, IBM lanzó el OmniFind, el primer programa que aprovecha su nueva estrategia para resolver problemas de búsqueda. Esta tecnología, que se llama arquitectura de administración de información desestructurada, conocida con las siglas en inglés UIMA, conducirá, según IBM, a una tercera generación en la capacidad de recuperar datos computarizados. La primera generación, de acuerdo con este esquema, es el uso de simples palabras clave que permiten encontrar todos los documentos que contienen un determinado nombre o una determinada dirección. Esto es lo que básicamente todos los sistemas de búsqueda de las PC pueden hacer, o necesitan hacer, porque lo que uno busca básicamente es un mensaje de correo o un memo que sabemos que está ahí. La segunda generación es la de la búsqueda basada en la Web, en la que se destaca la actuación de Google, que usa palabras clave y muchas otras indicaciones para combinar una pregunta con un listado de sites.

IBM afirma que sus herramientas permitirán un nuevo enfoque de búsqueda, el "sistema de descubrimiento", que extraerá el significado subyacente de material almacenado sin importar en qué forma esté estructurado (bases de datos, archivos de e-mail, grabaciones de audio, fotografías o archivos de video) o incluso en qué idioma esté. Los medios específicos para hacerlo incluyen pasos que despertarán sospechas entre muchos veteranos de la informática. Esto incluye "procesamiento natural de idioma", traducción computarizada de idiomas extranjeros y otros esfuerzos que rompieron los corazones de los investigadores de inteligencia artificial durante años. Pero la combinación de computadoras aún más rápidas y programas en evolución continua permitió que los sistemas que vi realizaran con éxito tareas que vencieron a sus predecesores.

Saber preguntar

Un ejemplo es el planteo de preguntas. Los motores de búsqueda del tipo de Google son fabulosos para reunir datos aleatorios, pero mediocres en el manejo de interrogantes más sutiles. Con Google o Ask Jeeves uno puede hallar prácticamente cuantas páginas de la Web de todo el mundo que estén en los idiomas principales, pero resultan lentos y frustrantes cuando uno quiere saber, por ejemplo, el lugar de nacimiento de Mozart. Jennifer Chu-Carroll, de IBM, hizo una demostración de un sistema llamado Piquant, que analizaba la estructura semántica de un texto y por lo tanto expuso "conocimiento" que no estaba explícitamente allí. Después de ojear un artículo periodístico sobre la política de Canadá, el sistema respondió correctamente a la pregunta: "¿Quién es el primer ministro de Canadá?", aun cuando esas palabras exactas no aparecían en el artículo.

El análisis semántico demostrado por Eric Brown y Dave Ferrucci mostró otra manera de exponer el significado latente. Los funcionarios de IBM dijeron que el mejor uso para esta tecnología serían call centers de soporte al cliente: mientras los representantes tomaban nota de los problemas que la gente tenía con sus vehículos o computadoras o medicamentos, una interpretación automática de los resultados revelaría patrones útiles. Arthur Ciccolo, estratega de IBM dedicado al proyecto de información desestructurada, opinó que los call centers serían el primer lugar para aplicar los nuevos sistemas de búsqueda. Los proyectos de investigación del genoma, donde las correlaciones inesperadas pueden ser cruciales, podría ser el segundo. Pero la demostración indicó otro mercado probable, dado que cada bit de texto de muestra fue una transcripción de llamadas interceptadas, al parecer entre personas sospechosas de pertenecer a organizaciones terroristas. ("Hizo dos llamadas desde Francfort en esos días...") Si eso fue verdad, aún no lo sé.

Traducción simultánea

Salim Roukos demostró un sistema que me gustaría tener el día de mañana: una clasificación variada de titulares, comparable más o menos a Google News, pero de fuentes que no están en idioma inglés. El sistema automática y comprensivamente traduce los titulares y lo conduce a uno a cada artículo. Si uno quisiera leer más, presiona un botón y en 15 o 20 segundos aparece una traducción bastante aceptable.

Ciccolo, el estratega de la investigación, explicó que de algún modo su equipo intentaba combinar los logros de Google. Dijo: "A medida que se expandió el uso de Google, los usuarios comenzaron a preguntarse por qué era mucho más fácil encontrar material en la Web externa que en sus propias computadoras o en los sitios Web de sus empresas". Y añadió: "Google fijó un estándar muy alto para la Web. Nos gustaría fijar el próximo para que a la gente le resulte tan fácil buscar material en el trabajo que se tenga que preguntar por qué no lo pueden hacer en Internet". ¿En cuánto tiempo podría suceder esto? Ciccolo respondió, riéndose entre dientes: "Bueno, si pudiese congelar lo que los demás hacen, podría ser en dos años".

Lo más interesante de esto es que la competencia no se detendrá. Al menos, esa parte del futuro parece brillante.


Fuente: La Nación

No hay comentarios: