Page 1

Лекция «Кодирование и обработка текстовой информации» 10 класс

6.

Кодирование текстовой информации. Текстовые редакторы Создание документов в текстовых редакторах Форматирование документов в текстовых редакторах Компьютерные словари и системы компьютерного перевода текстов. Системы оптического распознавания документов.

1.

Кодирование текстовой информации

1. 2. 3. 4. 5.

Информация, выраженная с помощью естественных и формальных языков и формальных языков в письменной форме, обычно называется текстовой информацией. Начиная с конца 60-х годов прошлого века, компьютеры все больше стали использоваться для обработки текстовой информации. Кодирование и декодирование текстовой информации Для кодирования прописных и строчных букв русского и латинского алфавитов, цифр и ряда специальных знаков (знаки арифметических операций, знаки препинания) достаточно 256 различных символов. По формуле, связывающей количество сообщений N и количество информации I, можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак: N = 2 I ⇒ 256 = 2 I ⇒ 2 8 ⇒ I = 8 бит = 1 байт Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер – по их коду. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну ячейку. В процессе вывода символа на экран компьютера производится обратный процесс – декодирование, т.е. преобразование кода символа в его изображение. Кодировки русского алфавита Важно, что присваивание символу конкретного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Во всем мире в качестве стандарта принята таблица ASCII (American Standard Code for Information Interchange), кодирующая ровно половину возможных символов - от 0 до 127. Первые 33 кода (с 0 по 32) этой таблицы соответствует не символам, а операциям (перевод строки, ввод пробела и т.д.). Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы. Существуют 5 однобайтовых кодовых таблиц для русских букв (Windows, MS-DOS, KOИ-8, Мас, ISO), поэтому тексты, созданные в одной кодировке не будут правильно отображаться в другой. В настоящее время широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ 2 байта и поэтому с его помощью можно закодировать не 256 символов, а N = 2 16 ⇒ 65536 различных символов. 1.

Текстовые редакторы


Текстовый редактор – программное средство, предназначенное для создания (ввода, набора), редактирования и оформления текстов. Основные функции текстового редактора: ● Обеспечение ввода текста с клавиатуры или из существующего файла; ● Редактирование текста (добавление, изменение, удаление или копирование фрагментов текста – символов, слов); ● Оформление текста (выбор шрифтов, способа выравнивания, установление междустрочного интервала, интервала между абзацами и т.п.); ● Размещение текста на странице (установка размера страницы, полей, отступов; разбиение на колонки; расстановка номеров страниц, колонтитулов и пр.); ● Сохранение текста в файле на внешнем носителе или печать; ● Проверка орфографии, подбор синонимов, контекстный поиск и замена; выдача подсказок и прочее. Если рассматривать текст как систему, то элементами его будут отдельные символы, слова, строки, предложения, абзацы. Абзацем в обычном тексте называют часть текста от одной красной строки до другой. В текстовом редакторе абзац – это часть текста от одного признака конца строки до другого (нажатие клавиши ввода). В текстовых редакторах большинство операций по преобразованию текста осуществляется над выделенными фрагментами текста. Наиболее распространенные текстовые редакторы: NotePad, Edit, Лексикон, Write, Блокнот. Текстовый процессор отличается от текстового редактора более широкими функциональными возможностями: ● Настраиваемое пользователем меню; ● Использование контекстного меню; ● Сопровождение текста таблицами и проведение в них простейших расчетов; ● Вставка графических объектов (рисунков, диаграмм, заголовков и пр.) или создание рисунков с помощью встроенных инструментов; ● Вставка формул, графиков, диаграмм; ● Оформление текста списками, буквицами; ● Использование инструмента автокоррекции текста; ● Создание и использование макросов, гиперссылок; ● Фоновая проверка орфографии, синтаксиса и многое другое. Наиболее распространенные текстовые процессоры: Word (Microsoft Office), Word Pro (lotus SmartSuite), WordPerfect (Perfect Office), WordExpress, Accent, WordPad. Редакционно-издательские системы (программы верстки), которые обеспечивают все функции текстового процессора, а также: ● Воспринимать тексты, созданные в различных текстовых редакторах; ● Воспринимать отсканированные или нарисованные в графических редакторах иллюстрации, созданные на ПК разных платформ, корректировать их цвета; ● Иметь большой набор шрифтов и возможность их графического преобразования (сжатие, растяжение или симметричное отражение по вертикали или горизонтали); ● Иметь возможности для различного обтекания рисунка текстом; ● Обеспечивать автоматическое оптимальное размещение текста на странице, автоматическую нумерацию страниц; ● Обеспечивать адаптацию к различным печатающим устройствам и прочее. 2.

Создание документов в текстовых редакторах ●

Выбор параметров страницы;


Колонтитулы и номера страниц; ● Ввод текста; ● Вставка изображений, формул и других объектов в документ; ● Копирование, перемещение и удаление фрагментов документа. ● Поиск и замена слов; ● Проверка правописания; ● Автозамена частых опечаток; ● Сохранение исправлений; ● Сохранение документов; ● Печать документов. В процессе сохранения документа необходимо в иерархической файловой системе компьютера выбрать диск и папку, в которой файл документа необходимо сохранить. Кроме того необходимо выбрать формат файла, который определяет способ хранения текста в файле. Существуют универсальные форматы текстовых файлов (ТХТ, RTF, DOC, HTML), которые могут быть прочитаны большинством текстовых редакторов, и оригинальные форматы (ОDT) используется только текстовым редактором OpenOffice Writer; (DOCX) используется только Word2007. ●

3.

Форматирование документов в текстовых редакторах ●

● ● ● ●

Форматирование символов: шрифт (растровый и векторный), размер шрифта, начертание символа (полужирное, курсив, подчеркивание, разреженный, уплотненный, зачеркнутый); цвет шрифта; Форматирование абзацев; Нумерованные и маркированные списки; Стили форматирования; Оглавление документа;

! Таблицы.

Текстовый редактор - прикладная программа для создания, редактирования, форматирования, сохранения и организации печати текстового документа. Редактирование -процесс исправления, удаления, перемещения, вставки объектов в документе Форматирование -процесс оформления документа в соответствии с требованиями. Документ – это зафиксированная на материальном носителе информация с реквизитами, позволяющая ее идентифицировать. Федеральный закон «Об информации, информатизации и защите информации»

Документ – это объект, обладающий набором свойств (характеристик).

Элементы управления окном тестового процессора Word 2


3 1

В Word 2007 привычные панели инструментов заменены лентой (ribbon), представляющей собой наборы команд, сгруппированные в определенном месте экрана. Переключение между этими группами команд осуществляется автоматически либо после щелчка левой кнопки мыши на вкладках, которые их представляют. Каждая вкладка, в свою очередь включает группу 1.

команд.Активная лента

вкладки– «Главная»

7 5 4 6

1.

2. 3. 4. 5. 6. 7.

Ст рока заголовка: название приложения, название документа, кнопки управления окном, кнопка быстрого сохранения, отменить, вернуть. Вкладки: Главная, Вставка, Разметка страницы, Ссылки, Рассылки, Рецензирование, Вид. Кнопка «Office»: Линейки: горизонтальная и вертикальная. Полосы прокрутки (отсутствуют, когда документ умещается на экран. Строка состояния. Кнопки прокрутки листов.


Активная лента вкладки – «Вставка»

5

2.

Активная лента вкладки – «Разметка страницы»


3.

4.

Активные функции команды меню– «ВИД»

5.

Активные команды кнопки– «Office»


Учитель информатики – Смарыгина Т.Д.


10-02 Кодирование и обработка текстовой информации  
Advertisement
Read more
Read more
Similar to
Popular now
Just for you