google_effektivniy_poisk

Page 55

Символы кириллицы могут кодироваться по-разному. В настоящее время наибольшее распространение получили кодировки KOI8-R и Windows-1251, однако иногда используются кодировки ISO-8859-5, UTF-8 и др. Обычно браузер определяет кодировку Web-страницы автоматически, в противном случае ее можно подобрать вручную. Поисковая машина также должна уметь определять кодировку, использованную на странице, которую она индексирует, иначе она потом не сможет найти в своей базе данных документы, релевантные запросу пользователя, даже если они там будут. Все русскоязычные ИПС и Google хорошо решают проблему кодировок, о других зарубежных ИПС этого сказать нельзя. Поэтому при их использовании для поиска русскоязычных документов пользователь может увидеть в описаниях найденных страниц множество вопросительных знаков.

54

Глава 3. Терминология и немного теории


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.