ГИА СИУ

3. Кодирование информации.

Кодирование информации.

Под кодированием понимается любое преобразование информации, идущей от источника, в форму, пригодную для ее передачи по каналу связи. На заре эры радиосвязи применялся код азбуки Морзе. Текст преобразовывался в последовательность точек и тире и передавался в эфир. Принимавший на слух такую передачу человек должен был суметь декодировать код обратно в текст. Передача информации с помощью азбуки Морзе – пример дискретной связи. В настоящее время широко используется цифровая связь, когда передаваемая информация кодируется в двоичную форму, а затем декодируется в текст, изображение, звук. Цифровая связь также является дискретной.

Американским ученым, одним из основателей теории информации, Клодом Шенноном была предложена схема процесса передачи информации по техническим каналам связи.

Клодом Шенноном была разработана специальная теория кодирования, описывающая методы борьбы с шумом. Одна из идей этой теории состоит в том, что передаваемый по линии связи код должен быть избыточным. За счет этого потеря какой-то части информации при передаче может быть компенсирована. Однако нельзя делать избыточность очень большой, так как это приведет к задержкам и удорожанию связи. Теория кодирования К. Шеннона как раз и позволяет получить такой код, который будет оптимальным. При этом избыточность передаваемой информации будет минимально возможной, а достоверность принятой информации – максимальной.

В современных системах цифровой связи часто применяется следующий прием борьбы с потерей информации при передаче. Все сообщение разбивается на порции – блоки. Для каждого блока вычисляется контрольная сумма (сумма двоичных цифр), которая передается вместе с данным блоком. В месте приема заново вычисляется контрольная сумма принятого блока, и если она не совпадает с первоначальной, то передача данного блока повторяется. Так будет происходить до тех пор, пока исходная и конечная контрольные суммы не совпадут.

Имеются и другие способы борьбы с потерей информации. Если в каждом блоке подсчитывать и передавать вместе с ним контрольные суммы по строкам и столбцам, то можно определить «адрес» бита, в котором возникла ошибка, и исправить ее. Такой код называется самоисправляющимся.

Компьютер является универсальным средством обработки и хранения информации, поскольку может обрабатывать информацию любого вида: текстовую, звуковую, видео, графическую. Каким же образом это возможно осуществить? Все очень просто, для самого компьютера любая информация представлена одинаково в виде последовательности электрических импульсов (уровней напряжения): есть импульс (напряжение) – (1), нет – (0). Такое представление информации в виде нулей и единиц называется двоичным кодированием. Количество информации в битах равно количеству цифр двоичного машинного кода.

Двоичное кодирование текстовой информации.

Начиная с конца 60-х годов ХХ века, компьютеры все больше стали использоваться для обработки текстовой информации, и в настоящее время основная доля персональных компьютеров в мире (и большая часть времени) занята обработкой именно текстовой информации.

Текстовая информация, как и любая другая, хранится в памяти компьютера в двоичном виде. Для этого каждому символу ставится в соответствие некоторое неотрицательное число, называемое кодом символа, и это число записывается в компьютерную память в двоичном виде. При этом из технических соображений и из соображений удобства кодирования-декодирования следует пользоваться двоичными группами равной длины. Конкретное соответствие между символами и их кодами называется системой кодировки.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111.

Важно, что присвоение символу конкретного кода ? это вопрос соглашения, которое фиксируется в кодовой таблице. Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

В качестве международного стандарта принята кодовая таблица ASCII (American Standart Code for InformationInterchange). Первые 33 кода таблицы ASCII (с 0 по 32) обозначают не символы, а операции (перевод строки, ввод пробела и т. д.). Коды с 33 по 127 ? интернациональные и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Коды со 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы.

В настоящее время существует пять различных кодовых таблиц для кириллицы (КОИ8–Р, Windows, MSDOS, Масintosh, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой. Каждая кодировка задается своей собственной кодовой таблицей. Одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы.

В последнее время появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, а N = 216 = 65536 различных символов. Эту кодировку поддерживают последние версии платформы Microsoft Windows & Office (начиная с 1997 года).

Пример 1. Представить слово Hit в форме для записи в ячейки памяти ПК.
Символ
Шестнадцатеричный код Двоичный код H 48 01001000 i 69 01101001 t 74 01110100

Ответ. Слово Hit в памяти ПК представляется кодом: 01001000 01101001 01110100.

Двоичное кодирование графической информации

С 80-х годов интенсивно развивается технология обработки графической информации с помощью компьютера. Компьютерная графика позволяет создавать и редактировать рисунки, схемы, фотографии, анимации и т.д.

Весь экран дисплея делится на точки – пиксели, подсвечивание которых создает видимое отображение текста и рисунков. Различают растровую и векторную графику.

Пространственная дискретизация. В процессе кодирования изображения производится его пространственная дискретизация. Пространственную дискретизацию можно сравнить с построением изображения из мозаики. Изображение разбивается на отдельные элементы (точки), каждому из которых присваивается его цвет.

Качество изображения зависит от двух параметров. Во-первых, качество изображения тем выше, чем меньше размер точки и соответственно большее количество точек составляет изображение.

Во-вторых, чем большее количество цветов, тем большее количество возможных состояний точки изображения используется, тем более качественно кодируется изображение (каждая точка несет большее количество информации). Используемый набор цветов образует палитру цветов.

Формирование растрового изображения. Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, которые, в свою очередь, содержат определенное количество точек (пикселей).

Качество изображения определяется разрешающей способностью монитора, т.е. количеством точек, из которых оно складывается. Чем больше разрешающая способность, т.е. чем больше количество строк растра и точек в строке, тем выше качество изображения. В современных персональных компьютерах обычно используются четыре основных разрешающих способности монитора: 480 на 640, 600 на 800, 768 на 1024 и 1024 на 1280 точек.

Рассмотрим формирование на экране черно-белого монитора растрового изображения, состоящего из 600 строк по 800 точек в каждой строке (всего 480000 точек). В простейшем случае (черно-белое изображение без градаций серого цвета) каждая точка экрана может иметь одно из двух состояний ("черная" или "белая"), т.е. для хранения ее состояния необходим 1 бит.

Цветные изображения формируются в соответствии с двоичным кодом цвета каждой точки, хранящимся в видеопамяти. Цветные изображения могут иметь различную глубину цвета, которая задается используемым количеством бит для кодирования цвета точки. Наиболее распространенными значениями глубины цвета являются 4, 8, 16 или 24 бита на точку.

Качество изображения определяется разрешающей способностью экрана и глубиной цвета.

Каждый цвет можно рассматривать как возможное состояние точки, тогда количество цветов, отображаемых на экране монитора, может быть вычислено по формуле:

K = 2N , где N – битовая глубина, К – число цветов, воспроизводимых на экране дисплея.
Глубина цвета и количество отображаемых цветов
Глубина цвета (N)
Количество отображаемых цветов (K)

4
24 = 16

8
28 = 256

16 (High Color)
216 = 65536

24 (True Color)
224 = 16777216

Цветное изображение на экране монитора формируется за счет смешивания трех базовых цветов: красного, зеленого и синего. Такая цветовая модель называется RGB моделью, по первым буквам английских названий цветов (Red, Green, Blue).

Для получения богатой палитры цветов базовым цветам могут быть заданы различные интенсивности. Например, при глубине цвета в 24 бита на каждый из цветов выделяется по 8 бит, т.е. для каждого из цветов возможны N = 28 = 256 уровней интенсивности, заданные двоичными кодами (от минимальной – 00000000, до максимальной – 11111111).

Графический режим. Для того, чтобы на экране монитора формировалось изображение, информация о каждой его точке (код цвета точки) должна храниться в видеопамяти компьютера. Рассчитаем необходимый объем видеопамяти для одного из графических режимов, например, с разрешением 800 на 600 точек и глубиной цвета 24 бита на точку.

Всего точек на экране 800 ? 600 = 480000.

Необходимый объем видеопамяти 24 бит ? 480000 = 11520000 бит = 1440000 байт = 1406,25 Кбайт = 1,37 Мбайт.

Аналогично рассчитывается необходимый объем видеопамяти для других графических режимов.
Формирование векторного изображения. Векторное изображение состоит из набора графических примитивов: линий прямоугольников, окружностей и т.п. При векторном способе создания изображений хранится не графическое изображение, а только координаты и характеристики изображения его деталей. Поэтому для хранения векторных изображений требуется существенно меньше памяти, чем изображений растровых. При запуске программы с векторным рисунком он создается каждый раз вновь, после чего в растровом виде может сохраняться в видеопамяти.

С помощью специальных программных средств (редакторов звукозаписей) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи и, в результате, появляется возможность управления компьютером при помощи голоса.

Дискретизация звука. Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Частота волны измеряется в герцах (Гц). Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов.

В процессе кодирования фонограммы, т.е. непрерывного звукового сигнала, производится его дискретизация по времени, или, как говорят, "временная дискретизация". Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Каждой "ступеньке" присваивается значение уровня громкости звука, его код (1, 2, 3 и т.д.). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

Современные звуковые карты обеспечивают 16-битную "глубину" кодирование звука. Количество различных уровней сигнала или состояний при данном кодировании можно рассчитать по формуле: K = 2N = 216 = 65536. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, т.е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

Качество звукового сигнала определяется глубиной и частотой дискретизации.

Количество измерений в секунду может лежать в диапазоне от 8000 до 48000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц. При частоте 8 кГц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте
48 кГц ? качеству звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стереорежимы.

Можно оценить информационный объем стереоаудиофайла длительностью звучания 1 секунду при высоком качестве звука (16 бит, 48 кГц). Для этого количество бит на одну выборку необходимо умножить на количество выборок в 1 секунду и умножить на два (умножение на коэффициент 2 связано с тем, что хранится стереоаудиофайл):

16 бит ? 48000 ? 2 = 1536000 бит = 192000 байт = 187,5 Кбайт.

Сайт создан по технологии «Конструктор e-Publish»