Transcript
Page 1: 11-04 Кодирование и обработка текстовой информации

Лекция«Кодирование и обработка текстовой информации»

10 класс1. Кодирование текстовой информации.2. Текстовые редакторы3. Создание документов в текстовых редакторах4. Форматирование документов в текстовых редакторах5. Компьютерные словари и системы компьютерного перевода текстов.6. Системы оптического распознавания документов.

1. Кодирование текстовой информацииИнформация, выраженная с помощью естественных и формальных языков и формальных языков в письменной форме, обычно называется текстовой информацией.Начиная с конца 60-х годов прошлого века, компьютеры все больше стали использоваться для обработки текстовой информации.

Кодирование и декодирование текстовой информацииДля кодирования прописных и строчных букв русского и латинского алфавитов, цифр и ряда специальных знаков (знаки арифметических операций, знаки препинания) достаточно 256 различных символов. По формуле, связывающей количество сообщений N и количество информации I, можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:N = 2 I ⇒ 256 = 2 I ⇒ 2 8 ⇒ I = 8 бит = 1 байтКодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер – по их коду.При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну ячейку.В процессе вывода символа на экран компьютера производится обратный процесс – декодирование, т.е. преобразование кода символа в его изображение.

Кодировки русского алфавитаВажно, что присваивание символу конкретного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Во всем мире в качестве стандарта принята таблица ASCII (American Standard Code for Information Interchange), кодирующая ровно половину возможных символов - от 0 до 127. Первые 33 кода (с 0 по 32) этой таблицы соответствует не символам, а операциям (перевод строки, ввод пробела и т.д.). Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы. Существуют 5 однобайтовых кодовых таблиц для русских букв (Windows, MS-DOS, KOИ-8, Мас, ISO), поэтому тексты, созданные в одной кодировке не будут правильно отображаться в другой.В настоящее время широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ 2 байта и поэтому с его помощью можно закодировать не 256 символов, а N = 2 16 ⇒ 65536 различных символов.

1. Текстовые редакторыТекстовый редактор – программное средство, предназначенное для создания (ввода, набора),

редактирования и оформления текстов.

Page 2: 11-04 Кодирование и обработка текстовой информации

Основные функции текстового редактора:● Обеспечение ввода текста с клавиатуры или из существующего файла;● Редактирование текста (добавление, изменение, удаление или копирование фрагментов текста

– символов, слов);● Оформление текста (выбор шрифтов, способа выравнивания, установление междустрочного

интервала, интервала между абзацами и т.п.);● Размещение текста на странице (установка размера страницы, полей, отступов; разбиение на

колонки; расстановка номеров страниц, колонтитулов и пр.);● Сохранение текста в файле на внешнем носителе или печать;● Проверка орфографии, подбор синонимов, контекстный поиск и замена; выдача подсказок и

прочее.Если рассматривать текст как систему, то элементами его будут отдельные символы, слова, строки, предложения, абзацы.Абзацем в обычном тексте называют часть текста от одной красной строки до другой. В текстовом редакторе абзац – это часть текста от одного признака конца строки до другого (нажатие клавиши ввода). В текстовых редакторах большинство операций по преобразованию текста осуществляется над выделенными фрагментами текста.Наиболее распространенные текстовые редакторы: NotePad, Edit, Лексикон, Write, Блокнот.

Текстовый процессор отличается от текстового редактора более широкими функциональными возможностями:

● Настраиваемое пользователем меню;● Использование контекстного меню;● Сопровождение текста таблицами и проведение в них простейших расчетов;● Вставка графических объектов (рисунков, диаграмм, заголовков и пр.) или создание рисунков

с помощью встроенных инструментов;● Вставка формул, графиков, диаграмм;● Оформление текста списками, буквицами;● Использование инструмента автокоррекции текста;● Создание и использование макросов, гиперссылок;● Фоновая проверка орфографии, синтаксиса и многое другое.

Наиболее распространенные текстовые процессоры: Word (Microsoft Office), Word Pro (lotus SmartSuite), WordPerfect (Perfect Office), WordExpress, Accent, WordPad.Редакционно-издательские системы (программы верстки), которые обеспечивают все функции текстового процессора, а также:

● Воспринимать тексты, созданные в различных текстовых редакторах;● Воспринимать отсканированные или нарисованные в графических редакторах иллюстрации,

созданные на ПК разных платформ, корректировать их цвета;● Иметь большой набор шрифтов и возможность их графического преобразования (сжатие,

растяжение или симметричное отражение по вертикали или горизонтали);● Иметь возможности для различного обтекания рисунка текстом;● Обеспечивать автоматическое оптимальное размещение текста на странице, автоматическую

нумерацию страниц;● Обеспечивать адаптацию к различным печатающим устройствам и прочее.

2. Создание документов в текстовых редакторах● Выбор параметров страницы;● Колонтитулы и номера страниц;● Ввод текста;● Вставка изображений, формул и других объектов в документ;

Page 3: 11-04 Кодирование и обработка текстовой информации

● Копирование, перемещение и удаление фрагментов документа.● Поиск и замена слов;● Проверка правописания;● Автозамена частых опечаток;● Сохранение исправлений;● Сохранение документов;● Печать документов.

В процессе сохранения документа необходимо в иерархической файловой системе компьютера выбрать диск и папку, в которой файл документа необходимо сохранить. Кроме того необходимо выбрать формат файла, который определяет способ хранения текста в файле.

Существуют универсальные форматы текстовых файлов (ТХТ, RTF, DOC, HTML), которые могут быть прочитаны большинством текстовых редакторов, и оригинальные форматы (ОDT) используется только текстовым редактором OpenOffice Writer; (DOCX) используется только Word2007.

3. Форматирование документов в текстовых редакторах● Форматирование символов: шрифт (растровый и векторный), размер шрифта, начертание

символа (полужирное, курсив, подчеркивание, разреженный, уплотненный, зачеркнутый); цвет шрифта;

● Форматирование абзацев;● Нумерованные и маркированные списки;● Стили форматирования;● Оглавление документа;

!Таблицы.Текстовый редактор - прикладная программа для создания, редактирования, форматирования, сохранения и организации печати текстового документа.Редактирование -процесс исправления, удаления, перемещения, вставки объектов в документеФорматирование -процесс оформления документа в соответствии с требованиями.Документ – это зафиксированная на материальном носителе информация с реквизитами, позволяющая ее идентифицировать.

Федеральный закон «Об информации, информатизации и защите информации»

Документ – это объект, обладающий набором свойств (характеристик).

Элементы управления окном тестового Wordпроцессора

2

3

1

1. Word 2007 В привычныепанелиинструментов замененылентой (ribbon), , представляющей собой наборыкоманд сгруппированные в

Page 4: 11-04 Кодирование и обработка текстовой информации

. определенномместе экрана Переключениемежду этими группами команд осуществляется автоматически либо послещелчка левой

, . кнопкимышина вкладках которыеих представляют Каждая

, .вкладка в своюочередь включает группу командАктивная – « »лента вкладки Главная

7

5

4

6

1. Ст рока заголовка: , , название приложения название документа кнопки

, , , .управления окном кнопка быстрого сохранения отменить вернуть2. Вкладки: , , , , , Главная Вставка Разметка страницы Ссылки Рассылки

, .Рецензирование Вид3. «OfficeКнопка »: 4. :Линейки .горизонтальная и вертикальная5. Полосыпрокрутки ( , .отсутствуют когда документ умещается на экран6. Строка состояния. 7. Кнопки прокрутки листов.

Page 5: 11-04 Кодирование и обработка текстовой информации

– « »Активная лента вкладки Вставка

5

2. – « »Активная лента вкладки Разметка страницы

Page 6: 11-04 Кодирование и обработка текстовой информации

3.

4. – « » Активныефункции командыменю ВИД

5. – «Office» Активныекомандыкнопки

Page 7: 11-04 Кодирование и обработка текстовой информации

– . .Учитель информатики Смарыгина ТД


Recommended