ЧТО ТАКОЕ РЕЛЕВАНТНОСТЬ Часто используемый термин при работе с поисковыми машинами. Посмотрите на определение слову "Релевантность" глазами Google. Если мой знакомый спрашивает меня "Который час?", а я отвечаю "Я не голоден" или отвечаю: А зачем тебе?", то этот ответ не был бы релевантным. Если бы я ответил: "Сегодня пятница" - это был бы ответ хотя бы касающийся времени. Такой мой ответ: "Уже вечер" был бы более релевантным. Ответ: "Около семи часов вечера" был бы более релевантным, чем предыдущий, но все же не полностью релевантным. Вот если бы я ответил: "18 часов 57 минут 25 секунд" - это был бы ответ в максимальной степени точным, хотя мои часы все равно бы могли иметь погрешность. Но запрос не включал в себя "Сколько времени на твоих часах?" и не включал в себя поправку на погрешность моих часов. Таким образом последний ответ можно считать полностью релевантным.
Начиная с 1994 года самые главные задачи по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины (World Wide Web Consortium, WЗС), который организовал и до сих пор возглавляет Ким Бернес-Ли. Консорциум разрабатывает и внедряет технологические стандарты для Интернета и Всемирной паутины. Миссия WЗС : «Полностью раскрыть потенциал Всемирной паутины, путем создания протоколов и принципов, гарантирующих долгосрочное развитие Сети». WЗС разрабатывает «Рекомендации», что бы достичь совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все рекомендации, которые разрабатывает Консорциум Всемирной паутины открыты, то есть не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму. А каким способом можно использовать глобальную сеть, чтобы простой смертный мог пользоваться ее глобальностью, не затрачивая усилий на специальную подготовку? В ответ был разработан специальный язык HTML, на котором создавались гипертекстовые документы
Связь между документами осуществляется при помощи гипертекстовых ссылок (или просто гиперссылок). Гиперссылка, ссылка, линк — - это элемент Web-документа(текст или иллюстрация), "привязанный" к другому фрагменту данного документа или к совершенно иному документу. При использовании гиперссылки (обычно для этого требуется навести на нее указатель мыши и один раз щелкнуть) происходит переход по гиперссылке — открытие Web-страницы, на которую указывает ссылка. Механизм гиперссылок позволяет организовать тематическое путешествие по World Wide Web без использования (и даже знания) адресов конкретных страниц. Обычно для того, чтобы проследовать по ссылке, достаточно "кликнуть" мышью по соответствующему активному участку. Гиперссылки - это один из самых существенных элементов любой гипертекстовой или гипермедийной системы, включая WWW. Именно легкость перехода от одного документа к другому посредством гиперссылок и является одной из причин, по которой World Wide Web завоевала всемирную популярность. Именно легкость перехода от одного документа к другому посредством гиперссылок и является одной из причин, по которой World Wide Web завоевала всемирную популярность.
Провайдер – (provider) интернет-провайдер продоставляет доступ в интернет хостинг-провайдер предоставляет сервер регистратор предоставляет доменное имя Подробнее… Browser (браузер) – специальная программа для выхода в Интернет и для отображение документа на конкретном компьютере. “Web browsers” – не что иное, как средства просмотра информации в сети. Web-страница содержит определенный набор стандартных элементов, являющихся обязательными компонентами каждого ресурса Интернета. Подробнее… Гипертекстовый документ – (веб-документ) может быть размещен на сервере любого континента, а Вы его спокойно просматриваете на домашнем компьютере, абсолютно не интересуясь расстоянием :) подробнее… Выбор кодировки – Кодировка представляет собой таблицу, где каждому символу - буквам алфавита, цифрам и специальным знакам - соответствует свой уникальный номер, код символа. Подробнее…
Социальная сеть – (social network) - социальная структура, состоящая из группы узлов, которыми являются социальные объекты (люди или органи-зации), и связей между ними. Подробнее… Блоги – это публичный дневник с комментариями, состоящий из записей в обратном хронологическом порядке. Слово произошло от английского weblog — «веб-журнал». Обычный дневник мало кому показывают. Блог открыт для чтения, более того, читатели могут оставлять к записям свои комментарии. Совокупность блогов называется блогосферой. Подробнее… Форум –место сетевого общения нескольких авторов, где записи объединены общей темой. Чат - (от англ. to chat - болтать) Чат - это общение в интернете, когда разговор ведется в реальном времени. Содержание чата существует только "здесь и сейчас" - чат выглядит как окно, в котором идет поток сообщений от всех участников чата. Подробнее…
Адрес является ещё одним понятием, часто встречающимся при использовании Интернета. Чтобы можно было однозначно обозначить любой компьютер в Интер-нете, применяется специальная система адресов, называемая IP-адресами. Каждый компьютер получает свой уникальный адрес. При пересылке информации протоколами TCP/IP используются присвоенные адреса. Адреса в Интернете мо-гут быть представлены как последовательностью цифр, так и именем, построен-ным по определенным правилам. Компьютеры при пересылке информации ис-пользуют цифровые адреса, а пользователи в работе с Интернетом используют, в основном, имена. Хотя нет центра управления Интернетом, но есть организации, занимающиеся проверкой и выдачей адресов. Так что вы не можете самостоя-тельно, ни с кем не посоветовавшись, присвоить себе любой адрес. URL – Uniformed Resource Locator(универсальный указатель адресов) указывает точные координаты документа в Интернете (пути) имя, используемое для доступа протокола http://fipi.ru/view/sections/92/docs/ URL-адрес состоит из трех частей: доменное имя сервера, на котором храниться ресурс полное имя файла на сервере
В Интернете используется так называемая доменная система имен. Она ставит в соответствие числовому IP- адресу компьютера уникальное доменное имя. Эта система имеет иерархическую структуру. Домены верхнего уровня бывают двух типов: географические и административные. Основной сервер компании Microsoft имеет имя WWW.microsoft.com, а сервер компании МИОО- iit.metodist.ru WWW COM RU metodist IIT Админист-ративные тип организации Географи-ческие страна .com коммерческая .ca Канада .edu образовательная .de Германия .gov правительственная .jp Япония .int международная .ru Россия .mil военная .uk Англия/Ирландия .net компьютерная сеть .us США .org некоммерческая .su CCCPбывший
Статистика использования Интернета в 2008 г.
БРАУЗЕР MICROSOFT INTERNET EXPLORER (IE)
БРАУЗЕР MOZILLA FIREFOX
БРАУЗЕР OPERA
БРАУЗЕР NETSCAPE NAVIGATOR
БРАУЗЕР AMAYA
БРАУЗЕР SAFARI
Глава 2. Поиск информации в сети В Интернете сосредоточено огромное количество Web-страниц и файлов. Для поиска информации используются специальные поисковые серверы (машины) - также поисковая система, поисковик, искалка - программно-аппаратный комплекс, предназначенный найти и изучить все страницы всех сайтов в Интернете (или какой-либо его части) и затем по запросу пользователя предоставлять ему адреса страниц, которые максимально соответствуют запрашиваемому. Любая поисковая машина представляет из себя специальный сайт. Поисковые машины просты в обращении и очень помогают в повседневности. Сегодняшний Интернет нельзя представить без поисковых машин. В действительности поисковая машина - это робот., т.е. ряд программ под управлением главной программы. В специальное окно для ввода запроса введём фразу «Как связать шапочку» . Поисковик выдаст огромное количество адресов страниц сайтов, в которых встречаются множества Рекомендаций (в том числе из специализированных журналов по вязанию) и описаний подобных операций
Согласно разным статистическим данным, наиболее распространённым браузером на сегодняшний день остаётся Internet Explorer (далее для краткости Эксплорер). В России его используют от 70 до 95 процентов серверов. Стремительно набирает популярность (особенно под Linux) Mozilla Firefox (на втором месте). На третьем месте по объективной популярности стоит Opera (далее Опера), последние версии которой — 6.x, 7.x и 8.x, ожидается 9, некоторые используют и 5.x, но не более старые, потому что этот браузер вплоть до 4-й версии был платным. Пренебрегать не стоит ни Оперой, ни Нетскейпом. Есть и другие браузеры: Lynx и подобные (текстовые браузеры, эмуляцию результата отображения веб-страниц, в которых можно посмотреть через Оперу), Amaya (персональный браузер организации w3c), Safari (браузер по умолчанию в современных операционных системах MacOS для компьютеров Macintosh) и масса других, которыми пользуются единицы пользователей. Amaya почти не используется, особенно в России. А ещё нужно помнить, что у разных пользователей разное разрешение экрана и разные операционные системы. Иногда это может приводить к искажениям при загрузке иллюстраций или даже к более заметным неприятностям. И очень просто. Особенно в Опере.
В настоящее время самыми популярными для российских пользователей Интернета являются крупные поисковые системы индексного типа: Эти системы учитывают грамматические особенности русского языка, поэтому результаты их поиска в русскоязычных ресурсах отличаются более высоким качеством, чем у западных систем. Яндекс (Поисковая система Yandex) Рамблер (Поисковая система Rambler) Google (Поисковая система Google) Yahoo (Поисковая система Yahoo) AltaVista (Поисковая система AltaVista) Апорт (Поисковая система Aport) Nigma (Поисковая система Nigma)
Яндекс — российская система поиска в Сети. Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года. Отличительная особенность Яндекса — возможность точной настройки поискового запроса. Rambler –создан в 1996 году. Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова. Интеллектуальная поисковая система Nigma.ru - это первая кластеризующая поисковая система в Рунете. В рамках проекта команда программистов работает над созданием системы, построенной на основе разработок в области искусственного интеллекта. Конечная цель проекта - создание программного обеспечения, позволяющего анализировать проиндексированные документы и выдавать конкретную информацию на запрос пользователя, а не ссылки на другие сайты. Разработчиками были созданы такие сервисы, как Nigma-математика, Nigma-химия и Nigma-музыка. Ежедневно пользователи поисковой машины Nigma.ru делают более 1 миллиона переходов на сайты, ежемесячная аудитория сайта Nigma.ru составляет более 3 000 000 уникальных посетителей. Руководитель проекта — Виктор Лавренко — выпускник факультета Вычислительной математики и кибернетики (ВМК) Московского государственного университета, ранее работавший в компании Mail.ru в должности вице-президента по стратегии и финансам. AltaVista (буквально - "взгляд сверху" - может считаться крупнейшей поисковой системой Интернета, имеющей в базе данных более 100 миллионов документов, фантастически быстрый полнотекстовый (включая точные фразы) поиск в которой имеет целый фейерверк возможностей продвинутого поиска. Не стоит забывать и о "маленькой детали": запросы, направляемые в "пижонский каталог" Yahoo!, в случае отсутствия результатов, автоматически перенаправляется в AltaVista, где в любом случае найдется все, что угодно...
ПОИСКОВАЯ СИСТЕМА YAHOO.RU
ПОИСКОВАЯ СИСТЕМА APORT.RU
ПОИСКОВАЯ СИСТЕМА MAIL.RU
ПОИСКОВАЯ СИСТЕМА ALTAVISTA.RU
ПОИСКОВАЯ СИСТЕМА NIGMA.RU
ПОИСК ИНФОРМАЦИИ В YANDEX' е
ПОИСК ИНФОРМАЦИИ В YANDEX' е
– это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы. Множество ссылок на выходе системы распределяется программой в порядке убывания релевантности, то есть от наибольшей степени соответствия ссылки запросу к наименьшей. При поиске в Интернете важны две составляющие – полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом – релевантность, то есть соответствие ответа вопросу. Почему нужный документ не может быть обнаружен? Прежде всего, документ не будет найден поисковой машиной, если он на ней не прописан. Запомните! Недостаточно разместить что-либо в Интернете. Надо прописать это на поисковой машине, иначе найти размещенный в сети материал постороннему человеку будет очень сложно. Следующее – это специализация поисковых машин. Поисковые машины yandex.ru, rambler.ru, yahoo.ru относятся к группе общего назначения. Именно с них следует начать поиск в Интернете. Глава 3. Особенности составления запросов
Поисковая система km.ru используется для поиска в различных энциклопедиях и учебных пособиях, вышедших после 1990 года. AltaVista – коммерческая поисковая машина, Google – новости. На поисковых машинах Fast, Инфоарт, ИППИ РАН, Русский интернет и Апорт можно найти информацию, связанную с куплей-продажей. Конечно, немаловажно правильно подобрать поисковую машину, но самое главное все-таки умение корректно составить запрос. Для того чтобы это сделать, необходимо знать некоторые правила, в соответствии с которыми нужно составлять запросы для поисковой машины. Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом. Запрос состоит из слова (фразы), которое(ая) является «ключом» для поиска документа. Ключевые слова в запросе следует писать строчными (маленькими) буквами. Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы. В общем случае, регистр написания поисковых слов и операторов значения не имеет, то есть слова «дом», «Дом», «доМ» и «ДОМ» - все будут восприниматься одинаково. Это полностью касается и латиницы.
Знаки пунктуации, такие как точка(.), запятая(,), двоеточие(:) и точка с запятой(;), игнорируются запросом. Символ (*) позволяет строить запрос с неполными словами, например, запрос «cтр*» соотвествует словам «cтроитель», «cтрока», т.е. всем словам с совпадающими начальными буквами (или символами). Запрос игнорирует «noise» слова (союзы, артикли и т.п.). Например, если ваш запрос «Я и Ты», то этот запрос также равносилен запросу «Я не Ты» и другим аналогичным. При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе. Например, при поиске по слову «человек» будут также найдены документы, содержащие слова «о человеке», «человеку», «человеком», «человека» и, что очень важно даже слова «люди» , «людям» , «людей» . Чтобы провести поиск только по одной определенной форме слова, нужно взять его в двойные кавычки или воспользоваться поиском точной фразы в расширенном поиске. Для поиска устойчивого словосочетания следует заключить слова в кавычки, например «домик в деревне». Для поиска по точной словоформе перед словом надо поставить восклицательный знак. Например, для поиска слова «доклад» в родительном падеже следует написать «!доклада».
Два запроса, соединенные оператором AND (&, И) образуют сложный запрос, которому удовлетворяют только те документы , которые одновременно удов-летворяют обоим этим запросам. Иными словами, по запросу “школаANDма-тематика” или “школа&математика” найдутся только те документы, которые содержат и слово ‘школа’, и слово ‘математика’ одновременно. Если эти слова встретятся в текстах отдельно, поисковая машина Вам эти тексты не покажет. Сложному запросу, состоящему из двух запросов, соединенных оператором OR (|, ИЛИ) удовлетворяют все документы, удовлетворяющие хотя бы одному из этих двух запросов. По запросу “школа OR математика” или “школа|мате-матика” найдутся документы, в которых есть хотя бы одно из этих двух слов, или либо оба эти слова вместе. Оператор NOT (!, НЕ) образует запрос, которому отвечают документы, удов-летворяющие левой части запроса и не удовлетворяющие правой. Так, результатом поиска по запросу “школа NOT математика” или “школа!математика” будут показаны все документы, в которых есть слово «школа» и при этом в данном документе отсутствует слово «математика». Если оператор явно не указан, используется оператор по умолчанию AND- находятся только документы, содержащие все слова запроса. Так запрос «информация школа успеваемость» будет истолкован как «информация AND школа AND успеваемость» . На странице Расширенного поиска оператор по умолчанию может заменить на OR (Искать слова запроса : хотя бы одно).
Ищите больше, чем по одному слову. Одно слово, указанное для поиска, даст множество бесполезных ссылок. Поэтому лучше набирайте больше ключевых слов, связанных с искомой темой. Многие поисковые машины чувствительны к регистру букв. Начиная слово с большой буквы, вы не найдете слов, написанных с маленькой буквы, если это слово не первое в предложении. Поэтому не набирайте обычные слова с большой буквы (используйте их только в именах собственных). Если один из найденных документов ближе к искомой теме, чем остальные, нажмите на ссылку "найти похожие документы". Используйте синонимы. Если список найденных страниц слишком мал или не содержит полезных страниц, попробуйте изменить слово. Проверяйте орфографию. Если поиск не нашел ни одного документа, то вы, возможно, допустили орфографическую ошибку в написании слова. Проверьте правильность написания!
ДО ПРИЯТНЫХ ВСТРЕЧ В ПАУТИНЕ