На страницу 1, 2 След. |
|
|
Гугл анонсировал свой маленький праздник. По состоянию на 25-ое июня, в индексе поисковика находится 1 триллион веб-документов (1,000,000,000,000). А еще в 1998 году этих страниц было "всего" 26 миллионов.
Как же к этому пришел Гугл? Он начал с набора определенных начальных страниц и пошел по исходящим с них ссылкам (считается, что это были сайты Microsoft, Adobe, Netscape, DMOZ и CNN - но версии разнятся). И так, ссылка за ссылкой накопился огромный "линк-лист". Но не все документы, на которые были разнообразные ссылки попали в индекс. Многие из этих документов дублировали друг-друга, некоторые были автогенерируемые (гы!). Отсеяв такие "ненужные" документы гугл и получил показатель в 1 триллион. И при этом количество страниц известных гуглу вырастает ежедневно на несколько миллиардов!
Так сколько же всего уникальных документов в сети? Этого даже не знает Гугл. Он попросту не успевает пересчитать все страницы сразу.
Полный текст документа (со всякими интересностями):
http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html |
|
|
|
|
|
интересно, а страницы доров (особенно многостраничных) вошли в этот триллион?
или они как раз отсеялись как "ненужные документы"? |
|
|
|
|
|
Недавно один человек вогнал несколько сот МИЛЛИАРДОВ страниц в индекс. Вот это тема была
Правда спалили быстро. |
|
|
|
|
|
Chin, вот на таких вот людях и держится гугл с рекордом в "триллионом"!  |
|
|
|
|
|
|
вах! это тот человек, о котором говорит Чин?
я так понял это фрихост какой-то, там много всяких разношерстных доров. |
|
|
|
|
|
t1ps2see.com
rfni70.org
jkthy0.org
geku8h.org
Это тоже его сайты? |
|
|
|
|
|
Да, вывести миллиарды страниц за две недели это что то? |
|
|
|
|
|
Hello_Kitty,
Да именно он. Он нашел какой то глюк в гугле, но быстро об этом стало известно и инженеры закрыли багу. |
|
|
|
|
|
Я не буду утверждать, но я на 90% уверен что это молдаван был.
Если это был не представитель молдовы - я сильно удивлюсь. |
|
|
|
|
|
Этот человек - мудак. Жертва собственной жадности. Его очень нелюбят. Тема работала давно и успешно. Но все кто были в курсе - работали аккуратно. Ну 10К страниц, ну 100К с домена. Ну может миллион. Это было незаметно и это работало. И тут кому-то (денег на домены что-ли не было?) пришла в голову "гениальная" идея наплодить миллиарды страниц. Естественно, что это не прошло незамеченным, поднялся шум и гугл поправил багу. В принципе, за отмену трастовости сабдоменов основного домена можно сказать "спасибо" этому человеку. |
|
|
|
|
|
Chin, чё молдован то сразу? |
|
|
|
|
|
Lkv7 писал(а): |
Chin, чё молдован то сразу?
|
http://umaxforum.com/showthread.php?t=12590
пысы. Случай этот произошел два года назад. Гугль так и не признался в том, что его найипали и сказал, что это был, цитирую, "bad data push"  |
|
|
|
|
|
Lkv7, потому что половину топов PPC молдоване держали. Год назад по крайней мере, когда я еще с ппц работал. |
|
|
|
|
|
Кажется, я становлюсь нацистом  |
|
|
|
|
|