lunes, 19 de octubre de 2015

Web Superficial y Web Profunda

La Web Superficial o visible

Incluye los sitios cuya información puede ser incluida en los índices de los buscadores convencionales, siendo posible recuperarla mediante una consulta en sus formularios de búsqueda.

Sus características principales son: 


  • Su información no se incluye en las bases de datos.
  • Es de acceso libre.
  • No es preciso registrarse para acceder a sus contenidos.
  • En su mayoría está compuesta por páginas estáticas con una dirección url fija que mantiene enlaces con otras páginas.


La Web Profunda o invisible

Es aquella amplia porción de la Web cuyos contenidos no están disponibles en Internet realizando las búsquedas habituales en los buscadores convencionales.

  • Suele ser información almacenada y accesible mediante bases de datos. 
  • Son páginas que no tienen una url fija, construyéndose las mismas en el momento en que son consultadas para desaparecer inmediatamente después de ser cerradas. 
  • Se pueden subdividir a su vez en cuatro categorías: la Web opaca, la Web privada , la Web propietaria y la Web realmente invisible. 


La Web opaca se compone por archivos que, pudiendo estar indexados, no lo están por alguno de los siguientes motivos:
  • Extensión: muchas veces no todas las páginas de un sitio se incluyen, por pura economía.
  • Frecuencia con que se actualiza su registro: los buscadores no tienen capacidad para registrar en sus índices todas las páginas existente, siendo constante y continuo el flujo de actualizaciones de las mismas que los desbordan.
  • Número máximo de resultados visibles.
  • Páginas desconectadas: los actuales buscadores presentan los documentos priorizando la relevancia basada en el número de veces que son referenciados por otros sitios web. 
La Web privada se conforma con aquellas páginas que son excluidas por alguno de estos motivos de manera deliberada: 
  • Requieren contraseñas.
  • Contienen archivos e instrucciones que evitan que aparezcan en los índices.  
La Web propietaria (que me parece a mí casi lo mismo que la privada) comprende aquellos sitios web que requieren del registro necesario para el acceso, ya sea gratuito o de pago.

La Web realmente invisible termina siendo toda aquella cuyos contenidos escapan a la indexación:

  • Al contener programas ejecutables y archivos comprimidos.
  • Por ser páginas dinámicas generadas a partir de datos que introduce el usuario.
  • Debido a estar constituida por información almacenada en bases de datos relacionales y que no se extrae a menos que se realice una petición concreta y específica.





1 comentario: