Debate con Ricardo Baeza-Yates


El currículum de Ricardo Baeza-Yates impresiona. A parte de su cargo en Yahoo! Research como vicepresidente de investigación para Europa y Latinoamérica, es miembro de la junta de Yahoo! Israel y Yahoo! Hungría, catedrático ICREA y fundador del Grupo de Investigación de la Web en el Deptartamento de Tecnologías de la Información y las Comunicaciones de la Universitat Pompeu Fabra en Barcelona. Puede presumir de una larga lista de premios y de una amplia experiencia laboral, incluido el campo académico, los proyectos de investigación y la publicación de artículos y libros, además de dar conferencias a nivel internacional.

Como estudiante del Máster en Buscadores yo y mis compañeros tenemos la oportunidad de participar en un debate con Ricardo Baeza-Yates a partir de una entrevista realizada por la UPF que gira entorno a la recuperación de información de los motores de búsqueda.  La verdad es que se agradece poder ver el pasado, presente y futuro de los buscadores a través de los ojos de un profesional de este nivel, sobre todo para las personas que, como yo, nos iniciamos en este mundo.

Durante el debate se trataron temas muy interesantes y se hicieron reflexiones sobre el futuro de los motores de búsqueda que vale la pena sintetizar. A continuación se resumen los puntos más interesantes.

Web semántica

En relación a la web semántica, Ricardo apunta que su implantación «…no es un problema tecnológico, es un problema de uso de tecnologías de parte de los que publican información. Podría implantarse ahora mismo si todos usarán las tecnologías adecuadas, pero veo difícil que eso ocurra«. Además, explica que «un buscador usa datos de la Web semántica (por ejemplo, tripletas en RDF) para poblar una base de datos de objetos que aparecen en la Web, con sus atributos y valores. Esto complementa técnicas de extracción de información en el contenido de la Web. Estos objetos luego son usados para respuestas más estructuradas cuando detectamos que la intención de la consulta tiene que ver con este objeto (por ejemplo un pasaje de avión)».

Smartphones

El uso actual de los smartphones también tiene un impacto en los buscadores, ya que sus usuarios «ahora son un porcentaje alto de los usuarios con acceso a Internet. También porque las intenciones de consulta están relacionadas con el lugar donde están y entonces es necesario contextualizar la respuesta a ese lugar. El problema es que no siempre el lugar donde está el usuario es compartido por el mismo». Y es que la tendencia actual y futura es personalizar la búsqueda según las preferencias e intenciones del usuario, tema que se menciona en uno de los siguientes apartados.

Búsqueda de imágenes

La identificación y posterior indexación de imágenes por parte de los buscadores no es una tarea sencilla. Muchas veces nos encontramos con fotografías que poco tienen que ver con lo que estamos buscando, y esto es debido en parte a que los buscadores tienen en cuenta las palabras que contiene el título que se le pone a dichas imágenes. Sobre este tema Ricardo nos cuenta que el problema es en realidad el gran volumen de imágenes que hay en la web: «hemos desarrollado tecnologías muy interesantes que combina técnicas basadas en texto con técnicas basadas en procesamiento de imágenes. El problema de fondo es el volumen. Aún nadie ha encontrado una técnica que permita escalar de millones de imágenes a miles de millones de imágenes y seguir buscando en tiempos menores a un segundo. Pero la comunidad científica sigue haciendo investigación en este tema y aunque el problema es difícil, espero ver resultados en los próximos años«.

¿Personalización de los resultados o limitación de información?

Actualmente, cada vez que una persona realiza una búsqueda recibe resultados distintos. Esta disparidad es el resultado de la personalización de los resultados en función de muchos parámetros decididos por el buscador (historial de la persona y sus preferencias, etc.).

Esto podría plantear una doble visión: por una parte recibimos, en teoría, resultados más relevantes; por otra parte, podríamos pensar que el buscador limita nuestro acceso a la información (obtenemos las respuestas que nos gustan en lugar de todas las respuestas posibles).

En relación a este tema, Ricardo nos habla del caso de Yahoo: «nosotros personalizamos los resultados de búsqueda sólo si explícitamente el usuario nos lo aprueba y esto ocurre sólo cuando se ha registrado (login), pues está incluido en las condiciones y términos de uso que nadie lee. Así que de esta forma tú puedes tener o no personalización. Por otra parte, lo que usamos en Yahoo! News es contextualización, pues depende más del país, del idioma y de lo que están viendo otros usuarios. Ver las noticias que más le importan a los españoles o a los italianos no creo que realmente sea peor que la burbuja comunicacional en la que ya estamos lamentablemente inmersos».

Por otra parte, profundizando en la inquietud sobre si podría existir o no una dictadura del buscador en su camino hacia la predicción de la intención de las búsquedas, Ricardo nos aclara que «una de las cosas en que un buscador tiene mucho cuidado es en no engañarse a si mismo. Por ende, todos los análisis se realizan como si fueran distribuciones al azar y no sesgadas por lo que hace el buscador. Por ejemplo un click en la posición 37 vale más que uno en la posición 1 pues este último está sesgado por el ranking y la interfaz. Además hoy en día se agrega diversidad y novedad a las respuestas para evitar los problemas de este tipo. Al final, si hay alguna dictadura, es la de los mismos usuarios, pues su interacción es la más importante para el ranking de un buscador«.

5 consejos para mejorar el SEO

Ricardo Baeza-Yates nos ofreció además durante el debate sus 5 consejos más importantes para mejorar el SEO:

1. Poner énfasis en el contenido, al final la reputación depende sólo de esto.

2. Ser minimalista en el diseño y usar HTML. Esto permite un mejor acceso a los buscadores.

3. Tener un buscador interno del sitio Web para poder saber después qué cosas los usuarios quieren y no encuentran.

4. Preocuparse de la esencia de la información (information scent). Es decir, escoger muy bien las palabras que usarás para que las personas te encuentren.

5. Poner enfásis en el contenido, al final la reputación depende sólo de esto.

Etiquetas:

Deja un comentario