РекламаРеклама

business line
Новости
Бизнес в мире
Бизнес и Интернет
Платежи и системы
Заметки о бизнесе
Бизнес идеи
Бизнес вокруг нас
Забавные факты
Технологии успеха
Добавить статью
Термины и понятия
Бизнес план
Готовый бизнес
Ипотека
Консалтинг
Франчайзинг
Платежи
Webmoney
Rupay
Яндекс.Деньги
Paycash
Easypay
E-gold
Stormpay
Moneybookers
Fethard
MoneyMail
CyberPlat
Рапида
ASSIST
Emoney
Paypal
Авторизация





Забыли пароль?
Ещё не зарегистрированы? Регистрация
Праздники России


статистика Rambler's Top100
Наши партнёры
бизнес линия
Google проиндексировал 1 триллион веб-страниц
Добавь в закладки:
Забобрить
Google
Memori
Mister-wong
Моё Место
News2.ru
Newsland
Добавить новость на SMI2
Forstart
28.07.2008 г.

В компании Google сообщили, что интернет-поисковик Google.com успешно проиндексировал триллионную по счету веб-страницу. В официальном блоге компании говорится, что поисковик ведет создание индекса уже 10 лет - с августа 1998 года.

До конца 1998 года в поисковом индексе Google.com насчитывалось уже 26 млн страниц. В 2000 году был проиндексирован первый миллиард страниц. "За последние 8 лет интернет значительно вырос и увеличились объемы данных в поисковом сервисе", - говорит Джесси Алперт, программный инженер Google.

В компании говорят, что поисковик уже давно научился отыскивать и удалять из индекса дубликаты страниц и страницы с разными адресами. "Старт работы по индексированию начался с того, что поисковый робот начал запоминать содержимое страниц и следовать по гиперссылкам, присутствующими на данных страницах. Система постоянно следует по ссылкам, переходя с сайта на сайт и запоминая содержимое уже изученных страниц. В реальности Google.com проиндексировал уже более триллиона страниц, однако далеко не все из них являются уникальными автономными страницами. Многие из них имеют по несколько адресов, другие являются автокопиями друг друга", пишет в официальном блоге компании Ниссан Хаджай, один из разработчиков поисковой системы.

Инженеры Google говорят, что поисковик для того, чтобы избежать безконтрольного разбухания поискового индекса должен обладать изрядной долей интеллекта и отличать автоматически генерируемые страницы от настоящего пользовательского контента.

"Например многие онлайновые календари, работающие в интернете, имеют ссылку "следующий день", нажав на которую можно начать планирование на предстоящий день, однако парадокс состоит в том, что продвигаться по данной ссылке, каждый раз нажимая "следующий день" можно до бесконечности. Потому реальный размер интернета с точки зрения поисковой системы зависит только от того, насколько строги параметры индексирования робота и насколько он способен распознать степень полезности той или иной страницы", - говорят в Google.

Ранее в Google использовалась так называемая узловая система работы с веб-данными. Так один компьютер мог обсчитать граф информации для PageRank из 26 млн страниц за пару часов и эта информация использовалась в качестве индекса на протяжении жестко указанного периода времени. В случае с Google.com этот временной промежуток составлял пару дней.

Сегодня, как рассказывают в компании, пополнение веб-данных не останавливается ни на секунду, а благодаря распределенной системе обсчета данных и оперативному обновлению информации весь поисковый индекс ранжируется заново по несколько раз в сутки.

"Такой граф из триллиона страниц можно сравнить с разветвленной системой дорог, каждая из которых по триллиону раз пересекается с другой. Подобная система соотношения "многие ко многим" позволяет максимально быстро изучать петабайты данных", - пишет в блоге компании Джесси Алперт.

Cybersecurity


Источник


Хотите завести
электронные деньги?
Не получается?

Новый видеокурс по платежным
интернет-системам научит вас
всем тонкостям с ноля.

Подробности




Ваш коментарий будет первым

Добавить коментарий
Имя:
Домашняя страница
Коментарий:

Код:* Code

 
Найди информацию
Курс валют ЦБ
 1   GBP    42.49р.
 1   USD    29.39р.
 1   EUR    41.43р.
 10   UAH    38.30р.
Последнее обновление:
09.01.2009 22:52
Котировки
Индексы и котировки - в реальном времени. Валюта, акции - с задержкой 15 мин, итоги - без задержки (обновление информации - по Refresh/Reload)

Котировки валют Forex Котировки валют Forex
Котировки FOREX
 |  EURUSD  |  USDJPY  |  USDCHF  | 
 |  GBPUSD  |  GBPJPY  |  EURCHF  | 

M1 | M5 | M15 | M30 | H1 | H4 | D1
Экспорт новостей
Вы можете получать последние новости и материалы портала в RSS формате.

rss бизнес новости финансы курсы валют платежи Бизнес и Интернет

rss бизнес новости финансы курсы валют платежи Бизнес в мире

rss бизнес новости финансы курсы валют платежи Платежи и системы

rss бизнес новости финансы курсы валют платежи Все новости

rss бизнес новости финансы курсы валют платежи Бизнес идеи

rss бизнес новости финансы курсы валют платежи Бизнес вокруг нас

rss бизнес новости финансы курсы валют платежи Забавные факты