Тема: Использование сервисов Интернета: поиск информации, создание электронного адреса, регистрация в Интернет - сообществах и др. Информационно-поисковые системы (ИПС). Порядок работы с ИПС.

Интернет — глобальное информационное пространство, основанное на самых передовых технологиях, обладающее широким спектром информационных и коммуникационных ресурсов, содержащее колоссальные объемы данных. Появление Интернета принято связывать с 1969 г. Именно тогда в США начались работы по объединению в небольшие сети групп компьютеров. Это делалось с целью обеспечения сохранности информации в  критических условиях. Уже в 1971 г. на основе этих разработок возникла электрическая почта. Успех этих начинаний  и заложил основы Интернета в нынешнем виде. Настоящий расцвет Интернета начался в 1992 году, когда была изобретена новая служба, получившая название «Всемирная паутина» (World Wide Web, или WWW, или просто Web (веб)). WWW позволяет любому пользователю Интернета представлять свою информацию в мультимедийной форме, связывая ее с публикациями других авторов и предоставляя удобную систему навигации (быстрого перехода по ссылкам от одной публикации к другой).

Каковы основные направления использования Интернета для пользователя? Здесь можно выделить три направления:

·      источник информации;

·      средство обмена информацией;

·      место размещения личной информации.

Из всех направлений работы библиотеки наиболее быстрое и ощутимое влияние Интернет оказывает на информационно-библиографическую деятельность. Тот факт, что энциклопедические, справочные и библиографические источники трансформируются в электронную форму быстрее любых других видов документов, уже в ближайшие два-три года приведет к тому, что цифровые или электронные ресурсы и технологии будут полностью доминировать в информационно-библиографической деятельности библиотек. Согласно данным Интернет-статистики ГПНТБ России, спрос на электронные ресурсы в настоящее время в 5-7 раз превосходит спрос на ресурсы печатные. Это означает, что электронные ресурсы «работают» в 50–70 раз активнее, чем печатные.

В отличие от поиска документов в библиотеке или архиве, поиск в Интернете не дает в руки пользователя непосредственно сам ресурс. При таком поиске определяется только место, где ресурс физически хранится. Это место называется адресом ресурса. Пользователю сообщаются все адреса, где находятся ресурсы, которые могут представлять для него интерес. Затем пользователь сам выбирает потенциально интересные ему адреса. Адрес ресурса называется Uniform Resource Locator (Унифицированный указатель ресурса). Сокращенно его называют  URL-адрес.

 Интернет. Основные сервисы

 Рассмотрим основные ресурсы (службы) Интернета. К основным сервисам Интернета на сегодняшний день можно отнести следующие сервисы:

·      всемирная паутина (World Wide Web, WWW);

·      электронная почта (e-mail);

·      файловые архивы FTP;

·      общение в Интернете.

Самым популярным ресурсом Интернета является всемирная паутина или WWW, которая представляет собой огромное количество (свыше миллиарда) мультимедийных документов, отличительной особенностью которых является возможность ссылаться друг на друга. Это означает присутствие в текущем документе ссылки, реализующей переход на любой документ WWW, который физически может быть размещен на другом компьютере сети Интернет. Информация в WWW представляется в виде документов, каждый из которых может содержать как внутренние перекрестные ссылки, так и ссылки на другие документы, хранящиеся на том же самом или на любом другом сервере.

Гипертекст - множество отдельных документов (страниц), которые имеют ссылки друг на друга. В Интернете существует несколько способов передачи данных (протоколов). Самым популярным в сети является протокол передачи гипертекста – http (Hyper Text Transfer Protocol)

Гипертекстовая ссылка - выделенная часть документа, реализующая переход к другому документу. Реализуется в виде подчеркнутого текста, кнопки или картинки.

E-mail (электронная почта). Старейшим ресурсом Интернета является E-mail (электронная почта) - система пересылки электронных писем. E-mail – это средство обмена информацией, подготовленной в электронном виде, между людьми, имеющими доступ к компьютерной сети. Основными областями применения электронной почты являются ведение личной переписки и работа с некоторыми информационными ресурсами Интернета, такими как списки рассылки, off-line группы новостей и системы пересылки файлов по электронной почте. Электронная почта (e-mail) широко используется в библиотечном процессе. Это и просто деловая переписка, и технологическая основа служб - ЭДД, «Запрос-ответ».

FTP (File Transfer Protocol, протокол передачи файлов) - хранилище и система пересылки всевозможных файлов. FTP позволяет подключаться к серверам FTP, просматривать содержимое каталогов и загружать файлы с сервера или на сервер; кроме того, возможен режим передачи файлов между серверами хранилищ и система пересылки всевозможных файлов.

ICQ - система, реализующая связь, подобную пейджинговой, через Интернет. Позволяет получить уникальный номер, называемый UIN (Universal Internet Number, универсальный номер Интернета), используемый для вызова и прямого общения. Замечательной возможностью системы является поиск абонента сети ICQ по косвенным данным, например, по адресу электронной почты. После установления связи с абонентом можно побеседовать с ним, отправляя текстовые сообщения.

 Информационно-поисковые системы Интернета 

Все поисковые системы объединяет то, что они расположены на специально-выделенных мощных серверах и привязаны к эффективным каналам связи. Поисковые системы называют еще информационно-поисковыми системами (ИПС). Количество одновременно обслуживаемых посетителей наиболее популярных систем достигает многих тысяч. Самые известные обслуживают в сутки миллионы клиентов. В случаях, когда поисковая система имеет в своей основе каталог, она называется каталогом. В ее основе лежит работа модераторов. В основе же ИПС с полнотекстовым поиском лежит автоматический сбор информации. Он осуществляется специальными программами. Эти программы периодически исследуют содержимое всех ресурсов Интернета. Для этого они перемещаются, или как говорят, ползают, по разным ресурсам. Соответственно такие программы называются роботы. Есть и другие названия: поскольку WWW – это аббревиатура выражения Всемирная паутина, то такую программу естественно назвать спайдером по англ. – паук. В последнее время используются другие названия: автоматические индексы или директории. Все эти программы исследуют и «скачивают» информацию с разных URL-адресов. Программы указанного типа посещают каждый ресурс через определенное время. Ни одна поисковая система не в состоянии проиндексировать весь Интернет. Поэтому БД, в которых собраны адреса проиндексированных ресурсов, у разных поисковых систем разные. Тем не менее, многие из них стремятся, по возможности, охватывать в своей работе все пространство мировой Сети. Это универсальные системы.

Итак, работа поисковой системы обеспечивается тремя составляющими:

·      Программа «робот» (спайдер). Она анализирует ресурсы и производит их индексацию.

·      Индексы поисковой системы. Они формируют создаваемые поисковой системой собственные БД.

·      Программа, которая в соответствии с запросом пользователя готовит ему ответ на основе анализа индексов, то есть собственных БД.

Пользователь реально имеет дело только с последней из этих трех составляющих.

Мощные поисковые системы универсального типа созданы для работы на всех основных языках мира. Каждая страна старается создать хотя бы одну собственную поисковую систему. Познакомимся с основными отечественными и зарубежными поисковыми системами.

Яndex (http://www.yandex.ru) – самая популярная в настоящее время отечественная поисковая система. Начала работу в 1997 г. Она содержит более 33 миллионов документов, поддерживает собственный каталог Интернет-ресурсов. Также является лучшей поисковой системой для выявления иллюстраций. Англоязычный вариант снабжен справочником ресурсов Интернет. Обладает развернутой системой формирования запроса. В частности, допускается ввод поискового предписания на естественном языке - в этом случае все необходимые расширения производятся автоматически. Более детальный запрос может быть составлен с помощью режима «Расширенный поиск» (знак +), в котором применяется система многоступенчатых меню.

Яндекс - единственная российская поисковая система, индексирующая документы в форматах PDF, DOC, RTF, SWF, PPT и XLS. Актуализация базы осуществляется еженедельно.

Rambler (http://www.rambler.ru) – одна из первых российских ИПС, открыта в 1996 году. В конце 2002 года была произведена коренная модернизация, после которой Rambler вновь вошел в группу лидеров сетевого поиска. В настоящее время объем индекса составляет порядка 150 миллионов документов. Для составления сложных запросов рекомендуется использовать режим «Детальный запрос», который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню.

АПОРТ (http://www.aport.ru). На сегодняшний день объем ее базы составляет более 20 миллионов документов. Система обладает широким спектром поисковых возможностей. АПОРТ обладает функцией встроенного переводчика, это дает пользователю возможность формулировать запросы, как на русском, так и на английском языках. Кроме того, АПОРТ имеет специальные режимы для поиска иллюстраций и аудио файлов.

Поисковая система компании Mail.ru  начала работать в 2007 году. Объем индексного файла весной 2009 г. составлял более 1.5 миллиарда страниц, расположенных на русскоязычных серверах. Помимо разыскания текстов, системой осуществляется поиск иллюстраций и видеофрагментов, размещенных на специализированных "самонаполняемых" российских серверах: Фото@Mail.Ru, Flamber.Ru, 35Photo.ru, PhotoForum.ru, Видео@Mail.Ru, RuTube, Loadup, Rambler Vision и им подобных. Gogo.ru позволяет ограничивать область поиска сайтами коммерческой направленности, информационными сайтами, а также форумами и блогами. Форма "Расширенного поиска" также дает возможность ограничить разыскания определенными типами файлов (PDF, DOC, XLS, PPT), местом положения искомых слов в документе или определенным доменом.

Наиболее популярными зарубежными поисковыми системами являются Google, Alta Vista, Scirus.

Google (http://www.google.com) — одна из самых полных зарубежных ИПС. Объем ее базы составляет более 560 миллионов документов. Отличительной особенностью ИПС Google является технология определения степени релевантности документа путем анализа ссылок других источников на данный ресурс. Чем больше ссылок на какую-либо страницу имеется на других страницах, тем выше ее рейтинг в ИПС Google.

AltaVista (http://www.altavista.com) – одна из старейших поисковых систем занимает одно из первых мест по объему документов – более 350 миллионов. AltaVista позволяет осуществлять простой и расширенный поиск. «Help» позволяет даже неподготовленным пользователям правильно составлять простые и сложные запросы.

 Основные виды поиска 

Поиск информации является одной из  составляющих человеческой деятельности. В Интернете ежедневно появляется и исчезает огромное количество ресурсов. Необходимо уметь в них ориентироваться. Чтобы эффективно выполнить поиск, нужно умело составить запрос к поисковой системе. Если ответ ищется в каталоге, то особых сложностей при работе здесь нет. Создатели каталога и модераторы озаботились созданием разделов каталога. Пользователь должен только четко определиться с предметом поиска и затем воспользоваться структурой, которая ему предложена.

В основе полнотекстового поиска лежит умение удачно составить поисковый запрос. При прочих равных условиях следует выбирать для поиска наиболее суженное, мало распространенное слово. В то же время может случиться и так, что поиск по слишком узкому термину не дает результатов. Тогда надо переходить к более широким терминам.

Если поиск по узкому термину не дает результатов, то следует постепенно расширять поисковое понятие или же переходить к смежным терминам.

Поиск по возможности лучше вести по нескольким словам, их сочетаниям, а иногда и по конкретным фразам.

При проведении поиска и оценке его результатов необходимо помнить:

·      Слепое доверие к результатам, размещенным в Сети, чревато ошибками.

·      Остерегайтесь анонимных сведений, т. к. их источник установить очень трудно.

·      В сомнительных случаях не ленитесь проверить найденные сведения запросом в Сети отзывов и мнений по поводу найденных сведений.

·      Неожиданно появляющиеся и затем быстро исчезающие ресурсы не надежны.

·      В сомнительных случаях необходимо обращаться к таким проверенным источникам, как сетевые энциклопедии, справочники и специальные учебные сайты.

Избегайте  «сенсационных» данных, результатов с чрезмерно большой точностью, чисто полемических, рекламных и необъективных материалов.

Приступая к поиску, вы вводите одно или несколько ключевых слов, выбираете вид поиска и нажимаете на клавишу Enter. В ответ выдается список адресов (URL) – список всех индексированных страниц, содержащих любые ключевые слова. Нередко число совпадений при таком поиске огромно. Однако если поисковая система хорошо сортирует результаты по тематике, то нужную страницу можно найти в верхней части списка. Поиск по любому слову может быть удобен в случаях, когда пользователь не уверен в ключевых словах.

Следует иметь в виду, что поисковые машины относятся к словам по-разному. Такие ИПС как «Яндекс» понимают слово во всех его грамматических формах и с учетом этого будут его искать. Им известна морфология русского языка, т. е. если в запросе написать и «человек» и «люди», то ответ будет одним и тем же.

При поиске в Интернете  используются следующие логические операторы:

-    AND – и (и то и то – два термина вместе);

-    OR – или (или тот термин или тот);

-    NOT – не (не нужен такой-то термин).

Используя значок *, можно расширить запрос  до всех слов, содержащих введенную часть. Например, если ввести электротехни* то в результатах поиска окажутся страницы, содержащие электротехника, электротехнический и т. п. Знак усечения * может быть подставлен в ключ справа, слева и внутри. В Yandex можно запрашивать конкретную форму слова при поиске (исключив другие словоформы), поставив перед ним знак «!».

  Информационные ресурсы

Термин «информационные ресурсы» появился в 70-е годы 20 века в работах, посвященных вычислительной технике и автоматизированным информационным системам. В 80-е годы этот термин получил широкое распространение. Информационные ресурсы относят к экономическим ресурсам в качестве четвертой их составляющей (в дополнение к трудовым, материальным и финансовым).

В общем случае под информационными ресурсами понимается вся совокупность сведений, получаемых и накапливаемых в процессе развития науки и практической деятельности людей, для их многоцелевого использования в общественном производстве и управлении. Информационные ресурсы отображают естественные процессы и явления, зафиксированные в результате научных исследований и разработок или других видов целенаправленной деятельности в различного рода документах (отчеты о НИР, патенты, массивы данных и т. д.), понятиях и суждениях и др.

Существует узкое и широкое значение понятия «информационные ресурсы»: в первом случае имеют в виду только сетевые  информационные ресурсы, доступные через компьютерные средства связи,  а  в широком значении – любую зафиксированную на традиционных или электронных носителях информацию, пригодную для сохранения и распространения.

Состав информационных ресурсов раскрыт в законе РФ «Об информации, информатизации и защите информации»: «Информационные ресурсы – это отдельные документы и отдельные массивы документов, документы и массивы документов в информационных системах (библиотеках, архивах, фондах, базах данных и других информационных системах)».

В настоящее время информационные ресурсы представляют собой сложный и многообразный объект, характеризующийся множеством параметров, наиболее значимыми из которых являются:

·      содержание (тематика) информации;

·      форма собственности на информацию: общественное достояние, государственная собственность, собственность общественных организаций, собственность юридического лица (частная);

·      собственность физического лица (личная);

·      доступность информации: открытая, закрытая, секретная, конфиденциальная, коммерческая тайна, служебная тайна, профессиональная тайна;

·      форма представления информации: текстовые документы – первичные, вторичные, обзоры; структурированные данные  – базы данных, банки данных; язык представления.

Более детально состав информационных ресурсов может быть охарактеризован как:

·      созданные прежде и создаваемые в настоящее время опубликованные и неопубликованные первичные документы на любых носителях (книги, периодические издания, нотные и изоиздания, диссертации и т. д.);

·      полнотекстовые базы данных;

·      фонды опубликованных и неопубликованных первичных документов, собираемые библиотеками, центрами информации, архивами и другими учреждениями;

·      созданная прежде и создаваемая библиографическая продукция;

·      справочно-библиографический аппарат (СБА) библиотек, информационных центров и архивов, в том числе каталоги и библиографические картотеки;

·      фактографические базы  данных;

·      обзорно-аналитическая продукция (аналитические обзоры. Прогнозы, дайджесты и т. д.);

·      услуги, предлагаемые на информационном рынке;

·      компьютерные сети связи;

·      программные средства, обеспечивающие создание информационных систем и развитие телекоммуникационных сетей;

·      учреждения (редакции, издательства, библиотеки, информационные центры, книготорговые учреждения и т. д.), обеспечивающие создание информационной продукции, накопление и использование информационных ресурсов.

В зависимости от масштабов формирования и использования различают совокупные мировые, национальные, региональные и локальные ресурсы (ресурсы отдельных учреждений).

Информационные ресурсы обладают рядом специфических особенностей:

·      нерасходуемость, неисчерпаемость, обеспечивающие возможность многоразового и многоцелевого их использования, возможность обмена или продажи информационных ресурсов;

·      постоянный рост объема потоков;

·      изменчивость состава информационных ресурсов как реакция на изменения информационных потребностей общества и обусловленный этим динамизм продукции и услуг, предлагаемых на информационном рынке;

·      сложность вычленения активной и пассивной части ресурсов из-за различных темпов старения информации; отсутствие прямой зависимости между временем создания информации и ее полезностью (ценностью), поскольку информацию старит не время, а появление нового знания, опровергающего прежнее;

·      неразрывное единство элементов, составляющих совокупные информационные ресурсы общества, и поэтому невозможно или нецелесообразно использовать только какую-либо их часть (только какого-либо региона, одной страны и т. д.).

Электронная форма представления информации – способ фиксации информации, допускающий хранение, обработку, распространение и предъявление пользователю информации с помощью средств вычислительной техники.

Соответствие копий оригиналу означает, что информационный продукт, который каждый раз формируется под конкретного пользователя, не может называться электронным изданием, поскольку в  этом случае речь идет об услугах.

Основные виды ЭИ:

·      электронные текстовые эквиваленты печатных изданий, таких как книги, журналы и др.;

·      электронные образы печатных изданий, когда элементы последних (страницы) представлены как целостные  графические образы, к этому же виду ЭИ относятся образы рукописных материалов (факсимиле);

·      базы данных, отвечающие требованиям, предъявляемым к ЭИ, например, библиографические, адресные, статистические, лингвистические; к этому виду относятся и полнотекстовые базы данных;

·      новые формы публикации, не имеющие печатных аналогов: материалы электронных конференций и другие электронные сообщения, доступные пользователям через телекоммуникационные сети;

·      электронные публикации аудио- и видеоинформации;

·      мультимедийные продукты;

·      программные продукты;

·      электронные игры.

·      Количество электронных изданий растет с каждым годом. Ведущие научные издательства мира («Elsevier», «Wiley», «Academic press», «Kluwer», «Springer») выпускают свои издания в электронном виде, постоянно увеличивая их число. С конца 1998 г. издательство «Elsevier» все свои журналы, а это около 1200 названий, выпускает в электронном виде.

Механизм распространения электронных и печатных изданий примерно одинаков. Некоторые издательства предпочитают прямые связи с библиотеками, среди них «Academic press», «Elsevier». Другие – предоставляют право распространения электронных изданий посредникам, в том числе и подписным агентствам. Такими посредниками являются агентства «Swets», «EBSCO». Так, в арсенале «EBSCO» около 3500 электронных версий научных журналов, которые по договоренности с издательствами предоставляет в пользование только «EBSCO».

В России большая часть журналов имеет свои Интернет-страницы, многие журналы предоставляют в бесплатном доступе электронные архивы. Крупнейшее издательство Академиздатцентр «Наука» предоставляет доступ к журналам на сайте Научная электронная библиотека eLIBRARY  проекте РФФИ (www.elibrary.ru). На Федеральном портале по научной и инновационной деятельности (www.sci-innov.ru) в разделе «Научные исследования и разработки» даются ссылки к сайтам научным журналов, а также можно найти много другой полезной информации, которая связана с БД, относящимися к исследовательской работе.

 

Работа с информационно-поисковыми системами (общие сведения, порядок работы, сохранение и редактирование найденной информации)

Информационно-поисковая система - совокупность информационно поискового правил перевода с естественного языка на информационно - поисковый и обратного перевода, а также критерия соответствия, предназначенная для осуществления информационного поиска. В число составных частей конкретной информационно - поисковой системы (ИПС), кроме информационно-поискового языка, правил перевода и критерия соответствия, входят также средства ее технической реализации, массив текстов (документов), в котором осуществляется информационный поиск, и люди, непосредственно участвующие в этом поиске.

Информационный поиск - процесс отыскания в некотором множестве текстов (документов) всех таких, которые посвящены указанной в запросе теме (предмету) или содержат нужные потребителю факты, сведения. ИП осуществляется посредством информационно-поисковой системы и выполняется вручную либо с использованием средств механизации или автоматизации. Непременным участником ИП является человек. В зависимости от характера информации, которая содержится в выдаваемых информационно - поисковой системой (ИПС) текстах, ИП может быть документальным, в том числе библиографическим, и фактографическим. ИП нужно отличать от логической переработки информации, без которой невозможна непосредственная выдача человеку ответов на задаваемые им вопросы. При ИП отыскиваются - и могут быть найдены - такие и только такие факты или сведения, которые были введены в ИПС. Перед вводом в ИПС текста (документа) определяется его основное смысловое содержание (тема или предмет), которое затем переводится и записывается на одном из информационно-поисковых языков. Эта запись называется поисковым образом текста. Так же поступают и когда в ИПС вводят определённым образом записанные факты, сведения. Поступивший запрос также переводится на информационно-поисковый язык, образуя поисковое предписание. Поскольку поисковые образы текстов и поисковые предписания записаны на одном и том же языке, выражения на котором допускают только одно истолкование, то, возможно сравнивать их формально, не вникая в смысл. Для этого задаются определённые правила (критерии соответствия), устанавливающие, при какой степени формального совпадения поискового образа с поисковым предписанием текст следует считать отвечающим на информационный запрос и подлежащим выдаче.

Техническая эффективность ИП характеризуется двумя относительными показателями - коэффициентом точности (отношением числа текстов, отвечающих на информационный запрос, к общему числу текстов в данной выдаче) и коэффициентом полноты (отношением числа текстов, отвечающих на информационный запрос, к общему числу таких текстов, содержащихся в данной ИПС). Необходимые значения этих показателей зависят от специфики информационных потребностей. Например, при поиске патентных описаний с целью проведения экспертизы патентной заявки на новизну необходима 100%-ная полнота выдачи; при поиске, ориентированном на обычного исследователя или инженера, очень хорошей считается точность выдачи около 80%, полнота - около 50%.

Процесс поиска

Рисунок 1 - Процесс поиска

ИП может быть двух типов - избирательное (или адресное) распространение информации и ретроспективный поиск. При избирательном распространении информации ИП производится по постоянным запросам некоторого числа потребителей (абонентов), осуществляется периодически (обычно один раз в неделю или в две недели) и выполняется лишь в массиве текстов, поступивших в ИПС за этот период времени.

Между ИПС и потребителями (абонентами) устанавливается эффективно действующая обратная связь (абонент сообщает, в какой степени этот текст соответствует запросу и нужна ли ему копия полного текста, о степени соответствия этого текста его информационной потребности), которая позволяет уточнять потребности абонентов, своевременно реагировать на изменения этих потребностей и оптимизировать работу системы.

ADVERTISEMENT

При ретроспективном поиске ИПС отыскивает содержащие требуемую информацию тексты во всём накопленном массиве текстов по разовым запросам.

Архитектура современных информационно-поисковых систем WWW.

Рассмотрим типовую схему такой системы. В различных публикациях, посвященных конкретным системам, приводятся схемы, которые отличаются друг от друга только применением конкретных программных решений, но не принципом организации различных компонентов системы. Поэтому рассмотрим эту схему на представленном примере:

Структура ИПС для Internet

Рисунок 2 - Структура ИПС для Internet

На этой схеме обозначены:

client - это программа просмотра конкретного информационного ресурса. В настоящее время наиболее популярны мультипротокольные программы типа Netscape Navigator. Такая программа обеспечивает просмотр документов World Wide Web, Gopher, Wais, FTP-архивов, почтовых списков рассылки и групп новостей Usenet. В свою очередь все эти информационные ресурсы являются объектом поиска информационно-поисковой системы.

user interface - интерфейс пользователя - это не просто программа просмотра. В случае информационно-поисковой системы под этим словосочетанием понимают и способ общения пользователя с поисковым аппаратом системы, т.е. с системой формирования запросов и просмотров результатов поиска. Просмотр результатов поиска и информационных ресурсов сети - это совершенно разные вещи, на которых остановимся чуть позже.

search engine - поисковая машина служит для трансляции запроса пользователя, который подготавливается на информационно-поисковом языке (ИПЯ), в формальный запрос системы, поиска ссылок на информационные ресурсы Сети и выдачи результатов этого поиска пользователю.

index database - индекс - это основной массив данных информационно-поисковой системы. Он служит для поиска адреса информационного ресурса. Архитектура индекса устроена таким образом, чтобы поиск происходил максимально быстро и при этом можно было бы оценить ценность каждого из найденных информационных ресурсов сети.

queries - запросы пользователя сохраняются в его личной базе данных. На отладку каждого запроса уходит достаточно много времени, и поэтому чрезвычайно важно хранить запросы, на которые система дает хорошие ответы.

index robot - робот-индексировщик служит для сканирования Internet и поддержки базы данных индекса в актуальном состоянии. Эта программа является основным источником информации о состоянии информационных ресурсов сети.

www sites - это весь Internet. А если говорить более точно, то это те информационные ресурсы, просмотр которых обеспечивается программами просмотра.

Поисковые системы обычно состоят из трех компонентов:

1. агент (паук или кроулер), который перемещается по Сети и собирает информацию;

2. база данных, которая содержит всю информацию, собираемую пауками;

3. поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.