Воронежский государственный университетФакультет компьютерных наукКафедра информационных системСтановление ИПС Web: краткий исторический обзор
Краткая история ИПС Web 1990 – Archie (Alan Emtage – McGill University, Montreal):программа-обработчик списков ftp-ресурсов, поиск по именам файлов с использованием рег. Выражений1993 – Veronica (Nevada University) серверы GopherWWW Wanderer (Matthew Gray)база данных URLвысокий траффикОктябрь 1993 – ALIWEB (Martijn Koster) http-серверывладельцы сайтов сами представляют информацию о сайтемалый объем базы данных
Краткая история ИПС Web Декабрь 1993:Jump Station – индексирование заглавий и заголовков – линейный поиск в базе данныхWWW Worm – индексирование заглавий и URL, использование рег. выражений для поискаRSBE (Repository-Based Software Engineering) – ранжирование по ключевым словамФевраль 1993 - Excite использование статистического анализа связей между словами для эффективного поиска
Краткая история ИПС Web Январь 1994 - Tradeware Galaxyгруппировка гиперссылок по иерархическим категориямручная группировка ссылок – высокое качество ссылок – незначительное количество найденных страницАпрель 1994 – Yahoo (David Filo, Jerry Yang)каталог с возможностями поискаавтоматизация процесса сбора и классификации
Краткая история ИПС Web 1994 – WebCrawler (Brian Pinkerton – Wash. Univ.)индексирование полного текста страницыИюль 1994 - Lycos (Michael Mauldin – Carnegie Mellon Univ.)ранжирование по релевантностичастичное соответствиеучет пространственной близости словЯнварь 1994 – Infoseekдружественный интерфейскаталог
Краткая история ИПС Web Декабрь 1995 – AltaVista (DEC)Первая ИПС промышленного масштаба (миллионы запросов в день)Использование естественного языка в запросахПоддержка логических операторовПоиск по названиям изображений, Java апплетов и ActiveX объектовДобавление и удаление пользователем своего URL в индексеПоиск сайтов, ссылающихся на конкретный URLКонтекстная помощь
Краткая история ИПС Web 1995 – MetaCrawler (Eric Selburg – Wash. Univ.)Выполнение запроса одновременно несколькими поисковыми системамиСбор и переформатирование результатов на одной страницеОтображение рекламы
Краткая история ИПС Web Май 1996 - Inktomiпервая система, которая включала сайты в выдачу за плату. Апрель 1997 - Ask Jeeves (затем Ask.com) попытка ранжировать сайты на основе их популярности, однако алгоритм имел слабую защиту перед спамом.в 2000 появилась поисковая система Teoma, которая использовала кластеризацию для группировки сайтов по Тематической Популярности (Subject Specific Popularity). На разработку данной системы большое влияние оказала статья Джона Кляйнберга “Authoritative sources in a hyperlinked environment ”.
Краткая история ИПС Web 1998 - Overture Впервые была реализована модель “платы за клик”.
Краткая история ИПС Web 1999 – Google (Sergey Brin, Larry Page – Stanford Univ.)Алгоритм ранжирования PageRankОптимизация архитектуры системыМасштабирование и распараллеливание (Linux-кластеры)Восстановление текста документа без обращения к его оригиналу в Интернет
История ИПС Web в России ЯндексRamblerАпорт
Яндекс 1990 – компания Аркадия (Аркадий Борковский и Аркадий Волож):Начало разработки поискового программного обеспечения. За два года работ созданы Международная классификация Изобретений и Классификатор Товаров и Услуг1993 – Аркадия становится подразделением CompTek. Сотрудничество с лабораторией Ю.Д.Апресяна (ИППИ РАН). Создание словаря для поиска с учетом морфологии русского языка (300 КБ).Начало 1996 г. Разработан алгоритм построения гипотез (снятие привязки к словарю) для незнакомых слов.Лето 1996. Руководство CompTek и разработчики пришли к выводу о самоценности развития самой технологии. Появление “Яndex” в Интернете.“Яndex” = “языковой индекс”, “Yet Another Index”. “I” = “Я”.
Яндекс Осень 1997 г.:открытие Yandex.ruреализован естественно-языковой интерфейсМай 2001 г. Новая версия ИПС “Яндекс”.
Яндекс Как устроен Яндекс
Яндекс Яндекс в железе
Rambler 1991 – команда единомышленников.1996 – запуск в эксплуатацию поискового механизма Rambler.ruФевраль 1997 – рейтинговая система Rambler’s Top100.
Апорт 1996 – демонстрация поисковой машины “Апорт”.Октябрь 1999 – “Апорт 2000”, интегрированная с каталогом “Каталог-Апорт”.Первая российская поисковая машина, реализовавшая учет “ранга страницы” и обработку запроса с ориентацией на HTML-код страницы.
Источники http://www.search-marketing.info/search-engine-history/http://company.yandex.ru/history/pred.xmlhttp://company.yandex.ru/programs/web_200203.htmlhttp://www.rambler.ru/doc/about.shtml