Фрагмент для ознакомления
2
ВВЕДЕНИЕ
Характерным явлением современности является использование новых информационных технологий во всех сферах человеческой жизни. Определяющим фактором в развитии общества становится информация. Все больше и больше углубляется в Интернет информационное пространство, в котором существует человек. Появление глобальной информационной компьютерной сети предоставило возможность быстро получать информацию из любой точки мира. Наиболее распространенными средствами информационных компьютерных технологий являются поисковые системы. Первые поисковые системы появились в Интернете более двадцати лет назад. В то время они только реализовали функцию поиска ссылок на вновь созданные страницы. На начальном этапе появления Интернета количество пользователей сети было ограничено, а количество информации относительно невелико. Сегодня поисковые системы стали многофункциональным сервисом со своими услугами. Они позволяют пользователям искать в Интернете широкий спектр информации, поэтому они пользуются огромным спросом.
Проблема поиска и сбора информации - одна из важных проблем поисковых систем. В двадцатом веке, с рождением возраста информационных технологий, проблема поиска информации приобрела новый облик. Теперь дело не в том, что информации недостаточно, и поэтому ее трудно найти, но тот факт, что сейчас в обществе есть избыток предложения, каждый день объем данных растет с геометрической прогрессией и, следовательно, нахождение ответа на интересующий вопрос может быть довольно сложной задачей.
Проблема поиска информации значительно усложняется при использовании виртуальных источников. Здесь используется технология онлайн-каталогов, после чего пользователь имеет право искать в каталогах двух или более библиотек одновременно. Это делает задачу еще более трудной для себя, но, с другой стороны, увеличивает вероятность решения.
Другими словами, сегодня невозможно представить жизнь без Интернета, с его помощью мы приобретаем различные товары, общаемся, работаем, проводим свободное время. Интернет имеет безграничные возможности, а роль надежных гидов в виртуальных лабиринтах играют поисковые системы. Что может быть проще, чем написать запрос в окне поиска, и огромное количество результатов для введенных слов или фраз будет найдено поисковой системой. Даже сравнительно недавно об этом невозможно было мечтать.
Таким образом, актуальность проблемы определяется противоречием между крупными информационными потоками, циркулирующими в современном мире, и невозможностью быстро и качественно найти его в Интернете.
Целью данной курсовой работы является сравнительный анализ дескрипторных и классификационных поисковых систем.
Для достижения поставленной цели необходимо решить следующие задачи:
- определить основные задачи, решаемые поисковыми системами
- изучить принципы работы классификационных и дескрипторных поисковых систем
- ознакомиться с критериями эффективности и оценки качества поисковых систем
- провести сравнительный анализ дескрипторных и классификационных поисковых систем.
Объектом исследования являются поисковые системы. Предметом исследования являются принципы работы дескрипторные и классификационные поисковые системы.
ГЛАВА 1. ОБЗОР ПОИСКОВЫХ СИСТЕМ СЕТИ ИНТЕРНЕТ
1.1. Основные задачи поисковых систем
Поисковая система представляет собой программно-аппаратный комплекс, который предназначен для выполнения функции поиска в Интернете и отвечает на запрос пользователя, который обычно указывается как любая текстовая фраза (точнее, поисковый запрос), выдача справочного списка источников информации, которые сортируются по релевантности.
Основной задачей каждой поисковой системы является предоставление людям именно такой информации, которая им нужна. Но приучить пользователей создавать «правильные» запросы к поисковым машинам, то есть строить фразы таким образом, чтобы они соответствовали принципам работы поисковых систем, практически невозможно.
Именно поэтому специалисты-разработчики поисковых систем делают такие принципы и алгоритмы своей работы, что позволит пользователям находить интересующую их информацию. Это означает, что система должна «думать» так же, как думает человек при поиске необходимого информацию в Интернете.
Основные характеристики поиска:
Полнота.
Полнота является одной из основных характеристик поиска, это отношение количества найденных по запросу информационных документов к их общему количеству в Интернете, связанным с этим запросом. Например, в сети есть 100 страниц фразы «как выбрать авто», и только 60 из общего числа были выбраны для одного и того же запроса, в этом случае полнота поиска будет 0,6. Понятно, что чем больше сам поиск, тем более вероятно, что пользователь найдет именно тот документ, который ему нужен, конечно, если он вообще существует.
Точность.
Еще одной основной функцией поисковой системы является точность. Он определяет степень, в которой пользователь ищет страницы, найденные в Интернете. Например, если ключевая фраза «как выбрать автомобиль» содержит сотни документов, половина из которых содержит эту фразу, а в других просто такие слова доступны (как правильно выбрать автомобильное радио и установить его в автомобиле) ), то точность поиска равна 50/100 = 0,5.
Чем точнее поиск, тем скорее пользователь найдет нужную ему информацию, тем менее разнообразный «мусор» будет найден среди результатов, тем меньше найденных документов не будет соответствовать значению запроса.
Актуальность.
Это важный компонент поиска, который характеризует время, прошедшее с момента публикации информации в Интернете, прежде чем вводить его в базу данных индекса поисковой системы.
Например, на следующий день после появления информации о выпуске нового iPad многие пользователи обратились к поиску с соответствующими типами запросов. В большинстве случаев информация об этой новости уже доступна в поиске, хотя с момента ее создания очень мало. Это связано с наличием большой поисковой системы «быстрая база», которая обновляется несколько раз в день.
Скорость поиска.
Такая функция, как скорость поиска, тесно связана с так называемым «сопротивлением нагрузкам». Каждую секунду, чтобы искать огромное количество людей, такая перегрузка требует значительного сокращения времени для обработки одного запроса. Здесь интересы как поисковой системы, так и пользователя полностью совпадают: посетитель хочет получить результаты как можно быстрее, и поисковая система должна быстро выполнить свой запрос, чтобы не замедлять обработку последующих Запросы.
Видимость.
Визуальное представление результатов является важным элементом удобства поиска. Для различных запросов поисковая система находит тысячи, а в некоторых случаях и миллионы разных документов. Из-за неопределенности компиляции ключевых фраз для поиска или его неточности даже самые первые результаты запроса не всегда содержат только необходимую информацию.
Это означает, что человеку часто приходится выполнять свой собственный поиск среди предоставленных результатов. Различные компоненты страниц доставки ПС помогают вам перемещаться в результатах поиска.
Основными компонентами поисковой системы являются поисковый робот, индексатор, поисковая система.
Как правило, системы работают поэтапно. Во-первых, искатель получает контент, тогда индексатор генерирует индекс, который доступен для поиска, и, наконец, поисковая система предоставляет функции для поиска индексированных данных. Чтобы обновить поисковую систему, этот цикл индексирования повторяется.
Поисковые системы работают, сохраняя информацию о многих веб-страницах, которые они получают с HTML-страниц. Обходчик - это программа, которая автоматически проходит через все найденные на странице ссылки и выделяет их. Обходчик, основываясь на ссылках или на основе заранее определенного списка адресов, ищет новые документы, еще не известные поисковой системе. Владелец сайта может исключать определенные страницы с помощью robots.txt, которые могут использоваться для предотвращения индексирования файлов, страниц или каталогов сайта.
Поисковая система анализирует содержимое каждой страницы для дальнейшей индексации. Слова можно извлечь из заголовков, текста
Фрагмент для ознакомления
3
1. Ашмaнoв, И. С. Пpoдвижeниe сaйтa в пoискoвых систeмaх / И. С. Ашмaнoв. - М.: «Вильямс», 2016. - 304 с.
2. Бaйкoв, В. Д. Интepнeт. Пoиск инфopмaции. Пpoдвижeниe сaйтoв / В. Д. Бaйкoв. - СПб: БХВ - Пeтepбуpг, 2016. — 288 с.
3. Блoг WebMilk.ru. - [Элeктpoнный peсуpс]. URL:http://webmilk.ru/2017/01/24/yandeks-voshel-v-top-10-poiskovyih-mashin
4.Гaвpилoв, А. В. Лoкaльныe сeти ЭВМ / А. В. Гaвpилoв.- М. : «Миp», 2010.- 154 с.
5. Гaйдaмaкин, Н. А. Автoмaтизиpoвaнныe инфopмaциoнныe систeмы, бaзы и бaнки дaнных / Н. А. Гaйдaмaкин.- М. : «Гeлиoс», 2016.- 280 с.
6. ГОСТ 7.74-96 «СИБИД. Инфopмaциoннo-пoискoвыe языки. Тepмины и oпpeдeлeния - [Элeктpoнный peсуpс]. URL: http://www.standartov.ru/norma_doc/33/33984/index.htm
7. Инфopмaтикa. Бaзoвый куpс: учeбник / пoд peд. С. В. Симoнoвичa. - СПб: «Питep», 2017.- 110 с.
8. Инфopмaциoнныe пoискoвыe систeмы - [Элeктpoнный peсуpс]. URL: http://oka2o1o.narod.ru/ИПС.htm
9. Итoги гoдa - Sostav.ru. - [Элeктpoнный peсуpс]. URL: http://www.sostav.ru/itogi/s/2017/6
10. Кaдeeв, Д. Н. Инфopмaциoнныe тeхнoлoгии и элeктpoнныe кoммуникaции / Д. Н. Кaдeeв.- М.: «Элeктpo», 2015.- 250 с.
27. Кaк всe нaчинaлoсь - Google, Yahoo, Яндeкс, Mail.ru, Rambler. TvoiExpert.
11. Кoлисничeнкo, Д. Н. Пoискoвыe систeмы и пpoдвижeниe сaйтoв в Интepнeтe / Д. Н. Кoлисничeнкo. - М.: «Диaлeктикa», 2017. – 272 с.
12. Лaндэ, Д. В. Пoиск знaний в Internet / Д. В. Лaндэ. - М. : «Диaлeктикa», 2015. — 272 с.
13. Мaннинг, К. Ввeдeниe в инфopмaциoнный пoиск / К. Мaннинг. – М.: «Вильямс», 2016.- 200 с.
14.Описaниe пoискoвoй систeмы Bing. - [Элeктpoнный peсуpс]. URL: http://anokalintik.ru/opisanie-poiskovoj-sistemy-bing.html
15.Пoискoвaя систeмa Google- истopия кoмпaнии Bbcont.ru. - [Элeктpoнный peсуpс].URL:http://bbcont.ru/business/poiskovaya_sistema_google_istoriya_kompanii.html
16. Путeвoдитeли в лaбиpинтe Интepнeтa. - [Элeктpoнный peсуpс]. URL:http://rutracker.org/forum/viewtopic.php?t=1117865
17. Пoискoвaя систeмa Yahoo! - [Элeктpoнный peсуpс]. URL: http://www.egonika.ru/forum/poiskovye_sistemy/poiskovaya_sistema_yahoo
18. Пoискoвaя систeмa Бaйду. ЦИТ-Фopум - жуpнaл o пoискoвых систeмaх. - [Элeктpoнный peсуpс]. URL:http://www.cit-forum.com/baidu/poiskovaja-sistema-bajdu.html
19. Пoискoвaя мaшинa Yandex.Ru. - [Элeктpoнный peсуpс]. URL:http://spravki.se-ua.net/yandex
20. Пoискoвaя oптимизaция вeб стpaниц SEO. - [Элeктpoнный peсуpс]. URL: http://creng.ru/seo/seo-poiskovaya-optimizaciya-veb-stranic
21. Пpoсвeщeниe W3. Google. - [Элeктpoнный peсуpс]. URL: http://w3pro.ru/tematika/google
23. Сaхapoвa, Е. В. Инфopмaтикa. Мeтoдичeскиe укaзaния / Е. В. Сaхapoвa.- Стaвpoпoль: СТИС, 2014.- 200 с.
24. Схeмы и pисунки ИПС - [Элeктpoнный peсуpс]. URL: http://ssofta.narod.ru/bd/ets2.htm
25. Стpуктуpa и клaссификaция aвтoмaтизиpoвaнных инфopмaциoнных систeм - [Элeктpoнный peсуpс]. URL: http://do.rksi.ru/library/courses/opais/tema1_3.dbk
26. Тepeхoв, И. В. Автoмaтизиpoвaнныe инфopмaциoнныe систeмы в oбpaзoвaнии и нaукe [Элeктpoнный peсуpс]: сeминap / И. В. Тepeхoв: М.-2009. http://ou.tsu.ru/seminars/sem13/tezis/section6.htm
27. Чуpсин, Н. А. Пoпуляpнaя инфopмaтикa / Н. А. Чуpсин.- М.: «Вильямс», 2015.- 300 с.