Кодирование звука и видео

ЗвукЗвук представляет собой волну с меняющейся интенсивностью и частотой (громкостью и его тональностью соответственно). Чем больше амплитуда, тем громче звук. Чем больше частота, тем больше тон. Хранение и передача аналогового звукового сигнала осуществляется за счёт представления его в виде электрического сигнала с помощью модуляции. Звуковой сигнал

Модуляция - процесс изменения одного или нескольких параметров (амплитуды, частоты или фазы) высокочастотного колебания по закону низкочастотного сигнала (несущей частоты).

Существуют разные виды модуляции: Амплитудная (АМ, amplitude modulation ) - изменение высокочастотных колебаний с частотой, равной частоте звукового сигнала. Например, несущей частотой может быть питание сети - 50 Гц. Или радиоволна СВ (MW) диапазона от 300 кГц до 3 МГц.Модуляция сигнала

 

Частотная (FM, frequency modulation - модуляция при которой информационный сигнал управляет несущей частотой. По сравнению с амплитудной модуляцией здесь амплитуда остаётся постоянной.


Цифровой сигнал

Для того чтобы аналоговый (непрерывный) сигнал представить последовательностью чисел определённой разрядности, его необходимо превратить в дискретный (прерывистый) сигнал, а затем подвергнуть квантованию. Дискретизация и квантованиеЗа кодирование звука отвечает звуковая карта, чем выше разрядность звуковой карты, тем больше уровней квантования она выдаёт и тем точнее становится звук при прослушивании. На современном ПК карта всегда интегрирована в материнской плате, и имеет разрядность не ниже 24 бит.

Оцифровка звука - дискретизация и квантование аналогового сигнала.

1-й этап: Дискретизация сигнала по времени

Допустим, Вы, с помощью микрофона записали свой голос длительностью 5 сек. Этот фрагмент можно разбить на равные малые временный отрезки, которые в сумме дают нам 5 сек. Получаем частоту дискретизации (f, Гц), которая является обратной величиной времени: t сек. При частоте дискретизации 8 кГц=8 000 Гц, из формулы получаем отрезок, равный 0,000125  сек. или 125 миллисекунд.

Частота дискретизации 2-й этап: Квантование сигнала по уровню

Чем больше уровней будет доступно для кодирования временных отрезков, тем ближе к аналогу будет закодированный файл, но при этом объём файла увеличится. Например, возьмём 8 уровней, чтобы их закодировать в двоичный код нам достаточно 3 бита, что мы получаем из формулы Хартли: формула Хартли

 

2³=8 - комбинаций двоичного ряда чисел от 000 до 111. Параметр (i) - называется глубина кодирования. 8 бит - 256 уровней, 16 бит - 65 536 уровней, 24 бита - более 16 млн. уровней.

3 этап: Определяем скорость потока звука

Частота дискретизации - 22 кГц, глубина кодирования - 16 бит. Произведение этих двух величин дает нам скорость потока 352 кбит/сек.

 

скорость потока Именно такой канал передачи данных потребуется для воспроизведения звукового файла в режиме он-лайн.

Расчёт количество звуковой информации

Для определения информационного объёма звуковой информации, нам необходимы следующие параметры: Объём звуковой информации

  • f - частота дискретизации (Гц);
  • t - время звучания звукового файла (сек.);
  • i - глубина кодирования (бит);
  • n - количество звуковых каналов (n = 1, моно; n = 2, стерео).

Задача 1: Одна минута записи цифрового аудиофайла занимает 1,3 МБ, разрядность звуковой платы — 8 бит. С какой частотой дискретизации записан звук? Решение: сетка Воспользуемся формулой: I=f∙t∙i∙n , из формулы видно что для нахождения частоты дискретизации формула примет вид: f=I/t∙i∙n. 1,3 МБ = 13,31,2 КБ = 1 363 148,8 Байт. Принимая во внимание что 8 бит = 1 Байту, делим 1 363 148,8 на 60, канал у нас записан 1, поэтому n=1. Ответ: 22719,1 Гц  или 22 050 Гц, см. основные настройки параметров звукового файла в программе Audacity

 

audacity

 

Задача 2: Две минуты записи цифрового аудиофайла занимают на диске 5,1 МБ. Частота дискретизации — 22 050 Гц. Какова разрядность аудиоадаптера? сетка

 

Решение: 5,1 МБ = 5 347 737,6 Байт, делим по формуле: i  = I / f∙ t ∙ n. 5 347 737,6 / 22 050 ∙ 120 = 2,02 Байт. Ответ: 16 бит.


Кодирование видео

Информация хранится на различных носителях в виде файлов. Файл занимает память и может быть измерен в единицах измерения информации: бит, Байт, КБ и т.д. Стремительное развитие интернета резко увеличило обмен информацией между людьми, для  оптимизации хранения данных люди стали использовать специальные алгоритмы сжатия. В основе цифрового видео лежит графический и звуковой файлы. Если рассчитать объём видеофайла без сжатия, нам необходимо учитывать тот факт, что человек начинает воспринимать смену кадров (картинок), как непрерывное плавное движение, если за 1 сек. будет мелькать 24 кадра.

Основы ТВ

Для приёма телевизионного сигнала используется антенна и приёмник. Приёмник - это электронная схема, которая преобразует сигнал в изображение на экране. В этом процессе участвует генератор кадровой развёртки и строчной. Кадровая развёртка формируется на частоте, близкой к частоте переменного тока в бытовых электросетях - 50 Гц. Кадровая развёртка, в сочетании со строчной служит для преобразования плоского двумерного изображения в одномерную последовательность, то есть, видеосигнал, а в телевизоре или мониторе компьютера для преобразования видеосигнала обратно в изображение на экране. Для создания такой последовательности, используются специальные стандарты разложения: 576i, 625/50 — стандарт разложения, принятый для аналогового и цифрового телевидения в Европе, России, Австралии, странах Африки и Азии. 576 - это количество активных строк для аналогового телевидения и число пикселей по вертикали, для цифрового. Буква «i», англ. Interlace означает чересстрочную развёртку, передающую 25 целых кадров в 50 полях за 1 секунду. 480i, 525/60 — стандарт разложения, принятый в США, число активных строк составляет 480. Существует также прогрессивная (p) кадровая развёртка, где все строки каждого кадра отображаются последовательно. Прогрессивная развертка стала широко распространена с появлением персональных компьютеров. Для комфортного чтения мелкого текста с экрана монитора, чересстрочная развертка стала малопригодна, так как мерцание строк вызывало быстрое утомление глаз. Помимо развёртки существует ещё и соотношение сторон: аналоговое ТВ - 4:3, цифровое ТВ - 16:9, широкоформатное.

Форматы со сжатием

Давайте для начала посчитает объём видеофайла без сжатия, длительность 1 час 30 мин., 576i, 16:9. Звук записан с частотой дискретизации - 44 100 Гц, глубина кодирования 24 бит. Решение:

 

Видео: I = 576 ∙ 1024 ∙ 25 ∙ 5400 ∙ 24 = 1 911 029 760 000 бит = 222,5 ГБ Звук: I = 44 100 ∙ 5400 ∙ 24 = 5 715 360 000 бит = 681,3 МБ = 0,665 ГБ Ответ: 223,2 ГБ. Графический формат JPEG Алгоритм JPEG (от англ. Joint Photographic Experts Group) в большей степени пригоден для реалистичных изображений с плавными переходами яркости и цвета, таковыми являются фотографии. В основу алгоритма заложен переход от цветового пространства RGB к цветовому пространству YCbCr. Y - компонент яркости, Cb и Cr - синий и красный цветоразностные компоненты. Суть сжатия состоит в том что для каждого блока пикселей 2х2 записывается не 12 значений, а 6, за счёт использования усреднённого компонента цвета.   Видео  и аудио форматы MPEG Алгоритм MPEG (англ. Moving Picture Experts Group) - стандарты сжатия и передачи цифровой видео и аудио информации. Базовым объектом кодирования в стандарте MPEG является кадр телевизионного изображения. Поскольку в большинстве фрагментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, сжатие начинается с создания исходного кадра. При сжатии аудио используются хорошо разработанные психоакустические модели, чтобы выбросить звуки, которые не слышны человеческому уху. Современные цифровые стандарты Современные дисплеи и мониторы уже давно вышли за рамки старых добрых стандартов. Видео форматы

Стандарты современных дисплеев:

Стандарты дисплеев

Кодирование текстовой информации

Текстовая или символьная информация представляется в компьютере в виде двоичных чисел, где каждому коду соответствует свой символ. Всё зависит от того какое количество разрядов имеет число (код). Это даёт нам возможность определить общее число комбинаций.

Для этого давайте возьмём пример из жизни: Представьте что Вы забыли 3 цифры своего PIN кода, первую цифру Вы знаете, это, например, “4”, а остальные забыли.

Пин-код

У нас получается 1000 комбинаций, а если учесть что для перебора всех комбинаций мы будем тратить по 3 сек. времени, то общее время составит: 3*1000=3000/60=50 мин. Конечно, это время мы потратим только в том случае, когда будем последовательно проверять все комбинации, а “нужный” код будет проверен в конце.

В идеале, чтобы не запутаться, лучше коды вводить по правилам счёта: 000, 001, 002, 003, ……  999.

Если же мы используем двоичные числа, то количество комбинаций для трёх разрядного числа, будет составлять всего 8. Это последовательный ряд: 000, 001, 010, 011, 100, 101, 110, 111.

Бинарный код Это значит что каждому символу можно присвоить свой уникальный двоичный код.

Кодовые таблицы

Давайте теперь рассчитаем сколько нам понадобится кодов для того чтобы закодировать символьную информацию.

Стандартная клавиатура состоит:Формула Хартли

  • латиница – 26*2=52 символа.
  • кириллица – 33*2=66 символов.
  • цифры – 0….9=10.
  • математические знаки – 20 знаков.
  • знаки препинания – 10 знаков.
  • специальные символы, включая пробел – 20 символов.

Подсчитаем сумму: 52+66+10+20+10+20=178 символов

По формуле Хартли, разрядность двоичного числа, а, следовательно и информационный вес 1 символа укладывается в диапазоне от 7 до 8 бит. 2 в степени

Первая в мире кодовая таблица символов появилась в 1963 году, её название: “ASCII – American Standart Code for Information Interchange“. Поначалу 1 символ занимал 7 бит информации, что давало в совокупности 128 кодов символов. Этого было достаточно для одноязычной клавиатуры, позднее понадобилось уже 8 бит.

Так 8 бит или 1 Байт – базовая стандартная величина, определяющая количество текстовой (символьной) информации.

Состав таблицы ASCII:

  1. Первые 32 кода (0….31) – непечатные (служебные) коды.
  2. Основная таблица (32…..127) – буквы, цифры, знаки препинания в английской раскладке.
  3. Расширенная таблица (128…..255) – буквы, знаки препинания в русской раскладке (Кириллица Win 1251, 1252 и т.д.).

Основная таблица ASCII

ASCII основная

Расширенная таблица ASCII

ASCII cirillic 

Таблицы кодов UNICODE:

Бурное развитие интернета обнажило большой недостаток однобайтных таблиц кодов, которые имеют огромное разнообразие расширенных таблиц: русский, иврит, арабский, греческий и пр. Пользователям интернета приходилось подбирать подходящую таблицу кодов для корректного отображения текстовой информации.

Сейчас такой проблемы нет, поскольку были реализованы универсальные кодовые таблицы UNICODE (universal code). Разница состоит в том, что информационный вес 1 символа стал составлять 2 байта (16 бит). Это позволило разместить в одной таблице 65 536 символов. Такого количества уникальных кодов достаточно для того чтобы разместить в одной таблице несколько расширенных таблиц (греческий, арабский, кириллица и т.д.).

2 в 16 степени


Решение задач:

Задача 1. Определите информационный объём текста: “Что посеешь, то и пожнёшь!

Для решения такой задачи на необходимо посчитать количество символов, учитывая пробелы и знаки препинания. В этом тексте 26 символов, если нет дополнительной информации, то будем считать по умолчанию, что используется 8-битная (1-байтная) кодировка.

Поэтому в данном сообщении 26*8 = 208 бит.


 Задача 2. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в Unicode, в кодировку КОИ-8. При этом информационное сообщение уменьшилось на на 480 бит. Какова длина сообщения?

Для решения такой задачи нам понадобится формула Хартли и формула для определения информационного объема текстового сообщения.

Формула Хартли

где, I – объём информационного сообщения;

К – количество символов в сообщении;

i – информационный вес 1 символа;

N – “мощность” (количество символов) алфавита.

Нам необходимо найти количество символов в сообщении. Для Unicode I = 16*K; когда его перекодировали в КОИ-8, его объём составил I = 8*K.

Длина сообщения (количество символов) не поменялось, поэтому можно составить уравнение: 16*K – 8*K = 480 бит.

Отсюда находим K = 480/8 = 60 символов.


Задача 3. Книга содержит 150 страниц. На каждой странице размещается 35 строк, в каждой строке – 50 символов. Текст записан в кодировке ASCII. Рассчитать объем информации, содержащейся в книге в КБ.

  1. Общее количество символов рассчитаем следующим образом: К = 150 стр. • 35 строк • 50 симв. = 262 500 символов
  2. Кодировка ASCII соответствует 8 битам или 1 Байту: i = 8 бит (1 Б)
  3. Находим объем информации книги по формуле: I = K • i ⇒ I = 262 500 Б = 262 500 / 1024 = 256,3 КБ.

 Задача 4. В таблице ниже представлен фрагмент кодовой таблицы ASCII:

Коды символов

Каков шестнадцатеричный код символа “q”?

  1. Практически во всех кодовых таблицах (ASCII не исключение) символы записываются в алфавитном порядке. Это относится и к цифрам и к буквам. В нашей таблице видно что заглавные латинские буквы от A до Z начинаются с десятичного кода 65-41_dec to hex
  2. Точно также строчные латинские буквы расставлены по алфавиту, начиная с символа с кодом97-61_dec to hex
  3. Отсюда следует, что разница кодов букв “q” и “a” равна разнице кодов букв “Q” и “A”, т.е. 81 – 65 = 16
  4. Тогда десятичный код буквы “q” будет равен коду буквы “a” + 16, т.е. 97 + 16 = 113
  5. Осталось осуществить перевод из десятичной системы счисления в шестнадцатеричную, для этого воспользуемся алгоритмом перевода:

113_dec to hexОтвет: Шестнадцатеричный код символа “q” –71_hex


 Задачи для самостоятельного решения:

  1. Считая, что каждый символ кодируется 1 Байтом, определите, чему равен информационный объем в битах следующего высказывания Рене Декарта:

Я мыслю, следовательно, существую.

  1. Считая, что каждый символ кодируется Unicode, определите, чему равен информационный объем в битах следующей фразы:

В шести литрах 6000 миллилитров.

  1. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 8-битном коде в 16-битную кодировку Unicode. При этом информационное сообщение увеличилось на 2048 Б. Каков был информационный объем сообщения до перекодировки?
  2. В таблице представлена часть кодовой таблицы ASCII:Каков шестнадцатеричный код символа «R»?
  3. Объем сообщения равен 11 КБ. Сообщение содержит 11 264 символа Какова максимальная мощность алфавита, использованного при передаче сообщения?
  4. Для передачи по каналу связи сообщения, состоящего только из символов А, Б, В и Г используется посимвольное кодирование: А-00, Б-11, В-010, Г-011. Через канал связи передается сообщение: БААВВГ. Закодируйте сообщение данным кодом, полученную последовательность переведите в шестнадцатеричный вид.
  5. Скорость передачи информации через канал связи равна 256 000 бит/с. Через данное соединение передают файл размером 3,8 МБ. Определите время передачи файла в сек.