Deep Web
Mit dem Begriff Deep Web oder auch Invisible Web bezeichnet man einen erheblichen Teil des Internets, der von konventionellen Suchmaschinen nicht erreicht werden kann. Zum Deep Web gehören zum Beispiel E-Mails, Chat-Nachrichten, private Inhalte in sozialen Netzwerken wie Facebook oder Twitter, aber auch elektronische Kontoauszüge und Gesundheitsdaten, die allesamt über das Internet erreicht werden können, dabei aber nicht von den Crawlern von Google, Yahoo, Bing oder DuckDuckGo erreicht und indiziert werden können.
Die Gründe dafür sind unterschiedlich. So kann es etwa sein, dass die Inhalte nur von Personen aufgerufen werden können, die sich über ein VPN (Virtual Private Network) damit verbinden. Andere Daten sind kommerzieller Natur und werden durch eine Paywall vor fremden Zugriffen geschützt. Erst nach Zahlung einer Gebühr oder nach Abschluss eines kostenpflichtigen Abonnements sind diese Informationen dann zugänglich. Eine andere Möglichkeit ist, dass die Inhalte auch personenbezogene Daten enthalten. In diesem Fall werden sie etwa durch die Datenschutz-Grundverordnung (DSGVO) besonders geschützt, so dass sie zum Beispiel nur über ein Portal aufgerufen werden können, dass nur autorisierten Personen einen Zugriff ermöglicht. Manche Daten haben aber auch einfach keine permanente URL (Uniform Ressource Locator), so dass sie dadurch ebenfalls zu einem Teil des Deep Webs werden.
Es ist nicht genau bekannt, wie groß das Deep Web ist. Nach Ansicht von Experten haben Suchmaschinen aber nur einen Zugriff auf weniger als ein Prozent der Daten, die im Prinzip über das Internet erreicht werden können. Dieser Teil des Internets, der von den Crawlern der Suchmaschinen indiziert werden kann, wird im englischen Sprachraum manchmal auch als Surface Web bezeichnet, also als ein Teil der sich an der Oberfläche des Internets befindet. Der Begriff Deep Web wurde erstmals im Jahr 2001 von dem Unternehmen BrightPlanet in einem Whitepaper mit dem Namen The Deep Web: Surfacing Hidden Value verwendet. In den Medien wird er allerdings immer wieder auch mit der Bezeichnung Dark Web verwechselt, der eigentlich nichts damit zu tun hat. Wie beim Deep Web sind die meisten Inhalte im Dark Web ebenfalls nicht für Suchmaschinen zugänglich. Der Grund ist aber häufig, dass sie illegal sind und deshalb nicht aufgefunden werden sollen.