Recuperacion organizacion informacion metadatos documentos arquitectura bbdd buscadores recuperacion

Arquitectura de Bases de Datos para buscadores WEB

::--Wikipedia--::



Base de datos

Las bases de datos son utilizadas por los buscadores para mostrar los resultados de las búsquedas y almacenar la información de estas páginas. Estas bases de datos son alimentadas por arañas que se encargan de rastrear la WEB creando un mapa WEB y dando unos pesos específicos a cada página.

Los motores de búsqueda y los directorios no pueden buscar en toda la red. En Internet existe mucha información útil que sólo aparece si buscamos en bases de datos accesibles a través de ésta. Es lo que se conoce como "web invisible". Estas bases de datos, que no pueden ser indizadas por los motores de búsqueda, están mantenidas normalmente por instituciones académicas o gubernamentales e incluyen información de referencia y sobre todo artículos de revistas.

Muchas de estas bases de datos son de acceso gratuito. Por ejemplo en este directorio http://www.invisibleweb.com/ podrás buscar simultáneamente en muchas bases de datos optimizando con ello los resultados.

Básicamente una base de datos contiene todos los URL encontrados, y asociados a ellos, la información relativa sobre sus contenidos:

  • Su título.
  • Parte de texto.
  • Hiperenlaces.
  • Descriptores (palabras claves).
  • etc.

Está actualizada continuamente por los robots que añaden nuevas páginas o referencias , actualizan las que han cambiado y borran las que ya no existen.

 

Página realizada por: Sergio Holgado Jiménez - Abril de 2006


© 2006 RAI - UC3M