Дълбока мрежа (deep web)
от Уикипедия, свободната енциклопедия
Дълбока мрежа (понякога наричана невидимата мрежа, скритата мрежа, (deep web, invisible web, hidden web)) — част от World Wide Web, не индексирана от търсещите машини. Не бива да се бърка понятието "дълбоката мрежа' с "тъмна мрежа".
Съдържание |
[редактиране] Проблеми на WWW
В дълбоката мрежа, се намират страниците, които не са свързани с останалите - например, страници динамично създавани от базите от данни. Дълбоката мрежа включва и страници, достъпът до които е разрешен само за регистрирани потребители. Търсещите машини използват търсещи роботи (crawler), които индексират хипервръзките и съдържанието на страниците. Обикновенно тези "роботи" не отправят заявки към базата от данни (в изключение на случаите указани в отделна хипервръзка на сайта). Поради тази причина огромна част от World Wide Web се оказва на "дълбоко", скрита от търсещите системи.
[редактиране] Мащаби
През 2000 година търсачката «BrightPlanet» провежда изследване, чиито резултати показват, че в дълбоката мрежа се намират 500 пъти повече документи, от колкото в достъпната. Тези цифри са приблизителни, но неефективността на съвременните търсещи мишини е шокираща.
[редактиране] Решения
През 2005 година компанията «Yahoo!» прави сериозна крачка към решението на този проблем. Тя създава търсещия робот «Yahoo! Subscriptions», който индексира сред страници с регистриран достъп на потребители (макар и малко на брой, засега).
Това не е цялостно решение на проблема. Експертите в тази област, продължават с усилията си да индексират съдържанието на базите от данни и страниците без свободен достъп.
[редактиране] Специални търсещи машини
- Yahoo! Subscriptions
- QProber: Класификаия и "търсене" сред "скрити" бази от данни
- MetaQuerier: Интегрира и изследва дълбоката мрежа