Blog

¿Conoces la parte oculta de Internet?

Foto representando dark web

Hoy en día existen una infinidad de servicios, utilizados por todo tipo de usuarios, que basan su funcionamiento en Internet. Sin duda, las búsquedas de información utilizando navegadores se han convertido en una acción habitual para las personas. Un estudio realizado por INTECO data el siguiente volumen de información y usuarios en 2015 en distintas webs y buscadores:

  • Google: 30 billones de páginas web que suponen unos 1.000 terabytes de información.
  • Facebook: 1100 millones de usuarios, 50 millones de páginas y 240 millones de fotos.
  • Twitter: 230 millones de usuarios y 500 millones de tweets diarios.
  • Badoo: 175 millones de usuarios.
  • Tumblr: 175 millones de blogs y 50000 millones de posts.
  • Flickr: 84 millones de usuarios y 8000 millones de fotos.

¿Pero los usuarios son conscientes de la amplitud de Internet? Realmente, el fragmento accesible a través de navegadores convencionales se calcula que es aproximadamente un 10% del contenido real que existe en Internet. Esta zona, la más “superficial”, se denomina “Surface Web”.

El criterio general para separar “zonas” dentro de Internet es atender a si contienen información indexada o no. Se considera información indexada a aquella que puede ser accedida desde un buscador convencional (como Google, Yahoo o Bing). Por su parte, la información no indexada necesita buscadores específicos que permitan llegar hasta ella. Este tipo de información hace referencia a contenido de bases de datos, redes P2P, información científica o académica, etc. Para describir y entender las distintas capas que forman Internet en su totalidad suele utilizarse una comparación con un iceberg, como muestra la imagen. Existen distintas opiniones sobre los límites entre ellas. En este caso se establecerán dos grupos diferenciados:

Surface Web

Ya ha sido brevemente introducida con anterioridad. Engloba aquella información que es indexable en Internet. Dentro de la surface web, destacan distintas categorías de páginas: redes sociales, blogs, foros, wikis, eCommerce. Como puede observarse en la imagen, la surface web sería la parte visible del iceberg.

Deep Web

Es la parte del iceberg que queda bajo el agua, la parte no visible. Contiene la información no indexable en Internet, los datos que no pueden ser accedidos mediante los buscadores usados habitualmente por los usuarios. Las redes que funcionan en la deep web permiten el anonimato en las comunicaciones. Este objetivo se consigue con técnicas como la encriptación de las tramas de información que se envían o la generación “ruido” en la comunicación con patrones que solo entienden origen y destino. A este ámbito pertenecen redes como TOR, Freenet o I2P. Sin duda, la más conocida y utilizada es TOR, y será de la que se hablará de aquí en adelante para hacer referencia a la deep web.

Representación Iceberg Web

TOR son las siglas de “The Onion Router”, y recibe este nombre porque consigue el anonimato a base de deshacer “capas” de encriptación en cada nodo de red por el que pasa. La red TOR puede ser accedida por cualquier usuario que instale el cliente correspondiente. Se considera que TOR, junto con las otras redes mencionadas con anterioridad, pertenece a la parte más “oscura” de la deep web: la dark web. ¿Por qué se ha hecho esta nueva clasificación dentro de la deep web? En principio, el hecho de que una red permita el anonimato, prácticamente total, en las comunicaciones no es más que añadir seguridad. TOR es utilizada por muchos usuarios a los que les preocupa preservar la integridad y la confidencialidad de la información que intercambian. Mediante TOR se puede acceder a sitios webs como Facebook o Youtube, además de a los dominios propios de la red (dominios .onion).

Y es justo aquí donde el anonimato de una comunicación puede volverse contraproducente. La red TOR permite la publicación de servicios ocultos, y esta capacidad está siendo utilizada para realizar compraventa de todo tipo de productos (drogas, armas, asesinos a sueldo, etc.) y visualización de contenidos ilegales de cualquier índole. En TOR no puede identificarse al origen de la comunicación, por lo que no es posible detectar quién está realizando este tipo de peticiones. Si estas redes deberían estar prohibidas o no, es un debate que continua abierto en los medios.