Символы кириллицы могут кодироваться по-разному. В настоящее время наибольшее распространение получили кодировки KOI8-R и Windows-1251, однако иногда используются кодировки ISO-8859-5, UTF-8 и др. Обычно браузер определяет кодировку Web-страницы автоматически, в противном случае ее можно подобрать вручную. Поисковая машина также должна уметь определять кодировку, использованную на странице, которую она индексирует, иначе она потом не сможет найти в своей базе данных документы, релевантные запросу пользователя, даже если они там будут. Все русскоязычные ИПС и Google хорошо решают проблему кодировок, о других зарубежных ИПС этого сказать нельзя. Поэтому при их использовании для поиска русскоязычных документов пользователь может увидеть в описаниях найденных страниц множество вопросительных знаков.
54
Глава 3. Терминология и немного теории