MPEG видео стандарти
автор: Радослава Славова
MPEG (Moving Picture Expert Group) е обединен комитет на Международната Органзация по Стандартизация (ISO) и Международната Електротехническа Комисия (IEC). Тази група от експерти се среща около четири пъти годишно, за да разработи и утвърди международни стандарти за компресия на цифрово видео и звук. Основният критерий, който се обсъжда в комитета MPEG, е интензивността на потока от компресирани данни, определянa както от нивото на съвременните компютърни технологии, така и от сферата на използване на дадения формат. Разработваните стандарти носят името на експертния комитет. До момента са познати стандартите MPEG – 1, MPEG – 2,MPEG – 3, MPEG – 4, MPEG – 7, MPEG – 21.
MPEG – 1
Стандартът MPEG 1 е приет през декември 1993 г. Той специфицира поток от данни 1.5 – 4 Мbit/s, тоест компресирано по този стандарт видео да може да се проиграва и от едноскоростно CD – ROM устройство (150 КB/s). На практика за проиграване на видео, компресирано по MPEG – 1 стандарт е необходимо поне двускоростно CD-ROM устройство. Базовият алгоритъм ограничава скоростта на предаване на данни до 150 – 225 KB/s с разрешаваща способност 352×288 (PAL) или 320×240 (NTSC) при 25 или 30 кадъра в секунда съответно.
Стандартът MPEG 1 – “Kодиране на подвижни картини и свързания звук за възпроизвеждане от цифров носител при скорости до 1.5 Mbit/s” се състои от 5 части:
Част I – Системи – разглеждат се проблемите, свързани със съвместяването на един или повече потока данни от видео и звуковата част на MPEG стандарта и синхронизирането им за формиране на единичен поток, както е показано на фиг. 1.
Фиг.1. Основна MPEG декодираща система
Част II – Видео – определя описанието на кода, който може да се използва за компресия на видеопоток при скорост около 1.5 Mbit/s.
Използват се различни техники за постигане на висока степен на компресия. На първо място е изборът на подходяща разрешаваща способност. Използва се алгоритъм за блоково базирана компенсация на движението за намаляване на времевите излишъци. Компенсацията на движението се използва за предсказване на текущата картина от предишната картина, за предсказване на текущата картина от следващата, или за интерполативно предсказване едновременно от миналата и бъдеща картини. По-нататък компресията продължава с използване на дискретна косинусова трансформация (DCT) за намаляване на пространствените излишъци. Накрая векторите на движението се комбинират с DCT информацията и се кодират с използване на кодове с променлива дължина. Фиг.2 показва йерархията на структурите от данни във видеопотока, дефинирани в стандарта.
Част III _ Звук – определя описанието на кода, който може да се използва за компресия на аудио поток.
Част IV _ Тестване – определя как могат да бъдат създадени тестове за проверка на съответствието между кодирания поток и разработваните декодери съгласно изискванията на части 1, 2 и 3 на стандарта.
Фиг.2. Йерархия на данните във видеопотока при MPEG
Част V – Софтуерна симулация не е стандарт, а описание на програмно осигуряване за реализация на първите три части.
MPEG – 2
През ноември 1994 г. MPEG – 2 стандарта окончателно е одобрен. В неговата спецификация е определена интензивност на потока от данни от 2 до 15 Mbit/s. Предвиждало се е стандартът да е предназначен да обслужва телевизионен видеосигнал, разпространяван по ефир, по кабел и спътникова телевизия . В последствие към него е добавена и телевизията с висока разрешаваща способност. Първоначално се е предполагало за телевизията с висока разрешаваща способност да бъде разработен стандартът MPEG – 3. Оказало се, че с известна доработка методът на кодиране на MPEG – 2 може да покрие изискванията на телевизията с висока разрешаваща способност. В резултат на това работата по MPEG – 3 е била прекратена. MPEG – 2 стандартът покрива видео с разрешаваща способност 704 x 480 пиксела по NTSC и 704 x 576 по PAL и допуска разширяемост до HDTV. Съпровожда видео с прогресивна и с презредова развивка, 4:3 и 16:9 съотношение на размерите на екрана.
MPEG – 4
Той е предвиден за много ниски скорости на разпространение на потока от данни (звук и видео) за целите на видеоконферентните връзки, мултимедийна електронна поща и т.н.. Стандартът е оптимизиран за минимална разрешаваща способност до 176 x 144 пиксела при честота 10 Hz с интензивност на потока данни от 4 800 до 64 000 бита в секунда.
За съкращаване скоростта на цифровия поток, също както и при MPEG – 2, се използва дискретно косинусово преобразуване с междукадрово предсказване на движението. Характерно за MPEG – 4 е разработването на изображението на отделни обекти с последващо обработване и кодиране отделно за всеки обект. Цифровите сигнали на кодираните отделни обекти се обединяват в мултиплексор. Отделните обекти може да са подвижни или неподвижни. Всеки един от видеообектите се кодира по най – оптималния за него метод. Всъщност за разлика от MPEG – 2, където за обработка на видеосигнала се организира група от изображения (GOP), то при MPEG – 4 се организира група от видеообекти GOV.
В приемното устройство цифровия поток се демултиплексира на потоци за отделните видеообекти. Възстановеното изображение се получава като сума от отделните водеообекти.
MPEG – 7
Стандарт допълващ MPEG – 4 и предназначен за търсене, избор и филтриране на видео информация. Нарича се още „Интерфейс за описване на мултимедйиното съдържание”. Определя правилата за предаване на информацията и за съдържанието на цифровия поток, за използваната компресия, за авторските права, а също информация за архивирането и търсенето, необходими за работата на цифровите видеотеки.
MPEG – 21
Той е предназначен за създаване на оптимални условия за използване на мултимедийната информация, за обработването, архивирането и предаването й.
АЛГОРИТЪМ НА MPEG КОМПРЕСИЯТА
Проблемите, стоящи при разработката на алгоритъма на MPEG компресия, са от една страна изискванията към качеството на изображението: много-висока степен на компресия не може да се постигне само с вътрешно кадрова компресия, и от друга изискването за произволен достъп, което най-добре се удовлетворява именно само при вътрешно кадрова компресия. Високата степен на компресия се свързва с използване на междукадрово кодиране, при което възникват проблеми с достъпа до произволен кадър. Посоченото по-горе изисква внимателен баланс между обратимия и необратимия времеви излишък.
Алгоритъмът на MPEG видеокомпресия се основава на две базови техники: блоково базирано компенсиране на движението за намаляване на времевите излишъци и компресия на базата на дискретната косинусова трансформация (DCT) за намаляване на пространствените излишъци.
За осигуряване на произволен достъп до компресираното видео от една страна и за постигане на висока степен на компресия от друга, в MPEG алгоритъма се използват три типа картини:
- ключови картини – Intrapictures (I)
- предсказани картини – Predicted pictures (P)
- интерполирани картини за двупосочно предсказване – Bidirectional pictures (B)
I – картините са кодирани, като се използва само информацията, съдържаща се в самата картина. Те осигуряват точки за произволен достъп в компресираните видеоданни. При тях се използва само трансформационно кодиране. Обикновено използват два бита за кодиран пиксел.
P – картините са кодирани по отношение на най-близката предишна I или P картина.
Предсказаните картини осигуряват по-голяма степен на компресия и служат при изграждане на B – картини и бъдещите P – картини. Те използват компенсиране на движението за постигане на по-висока степен на компресия, отколкото I _ картините.
P – картините могат да разпространят грешки при предсказването си от предишни P – картини.
B – картините използват едновременно и предишни и бъдещи картини при изграждането си.
Организиране на видеопотока
MPEG алгоритъмът позволява на кодера да избере честотата и позицията на I – картините. Този избор се основава на необходимостта от произволен достъп и от позицията на началото и края на видеофрагментите.
В приложения, в които произволния достъп е от особенна важност I – картините са две за една секунда. (фиг. 5). Кодера също избира и броя на B – картините между описанията на I и P – картините. Това се определя главно от характера на компресираната видеопоследователност и обикновено е две B – картини между I и P – картини.
За да се оптимизира проиграването кодерът подрежда картините в записания компресиран видеопоток в ред, различен от този при проиграване. Описанието на картините, необходими за възстановяване на B – картините се изпраща преди свързаните с тях B – картини.
Компенсиране на движението
Компенсиране на движението е метод за увеличаване на степента на компресия при P и B – картините чрез премахване на излишъка от информация във времето. Този метод увеличава компресията от два до три пъти, сравнено с вътрешно кадровото компресиране. Извършва се на ниво макроблок от 16 x 16 пиксела. Когато макроблокът е компресиран с използване на компенсиране на движението, компресираният файл съдържа следната информация:
- пространствените разлики между описанието и кодирания макроблок (вектори на движението);
- съдържателните разлики между описанието и кодирания макроблок;
В случаите, когато не може да бъде предсказана цялата информация, тоест макроблокът в P – кадъра не може да бъде представен чрез компенсиране на движението, то той се кодира по същия начин, както и макроблока в I – картината. Пример: когато във видеофрагмента има отваряща се врата.
Макроблоковете в B – картините се кодират, като се използват описанията на предишната и бъдещата I или P – картина. По този начин са възможни четири типа кодиране:
- вътрешнокадрово кодиране: без компенсация на движението;
- предсказване напред: най-близката предишна I или P – картина се използва като описание;
- предсказване назад: най-близката бъдеща I или P – картина се използва като описание;
- двупосочно предсказване: използват се описанията на най-близката предишна I или P – картина и най-близката следваща I или P – картина;
Обратното предсказване може да бъде използвано за предсказване на области, които не се появяват в предишни картини.
Вътрешнокадрово (трансформационно) кодиране. Трансформационното кодиране при MPEG алгоритъма съдържа следните стъпки:
- дискретна косинусова трансформация (DCT).
- квантуване.
- кодиране RLE (run length encoding)
То служи за намаляване на пространствените излишъци. MPEG алгоритъмът трнсформира блокове от 8 x 8 пиксела в честотни коефициенти чрез DCT. По-нататък алгоритъмът квантува тези честотни коефициенти, като апроксимира всеки от тези коефициенти с една от ограничен брой допустими стойности. Човешкото възприемане на грешката от квантуването е по-ниска за по-високите пространствени честоти и те обикновенно се квантуват с по-малък на брой стойности отколкото нискочестотните коефициенти. В резултат на DCT и квантуването се получава нулева стойност за по-голяма част от честотните коефициенти, особенно за тези с висока пространственна честота. За да се получат дълги поредици от нули коефициентите се извличат в зиг-заг ред. Върху така получената поредица се извършва RLE кодиране.
ИЗПОЛЗВАНЕ НА MPEG
MPEG – 1
Качеството на видеоизображението, компресирано по този стандарт, е близко до това на обикновеното VHS видео. Ето защо този формат се използва преди всичко там, където е неудобно или непрактично да се използва стандартно аналогово видео.
Видео павилиони (VideoKiosk)
Видео павилионите или информационните павилиони дават възможност по нов начин да се организира и автоматизира информационното обслужване. Използват се в големите магазини, автомобилните салони, банките, музеите и т.н. Чрез използването на MPEG – 1 компресирано видео разработчикът лесно може да обновява информацията с часове нов видеоматериал. Добре изградената интерактивна програма може да съветва, показва, отговаря на въпроси на потребителя.
Обучение
MPEG компресираното видео и CD-ROM като носител представляват идеалната комбинация за създаване и разпространение на образователни програми. Високата цена на мултимедийните системи изградени на базата на лазерен видеодиск попречи на тяхното широко разпространение.Това, което преди бе възможно с цената на значителни средства, сега е възможно да се реализира с много по-малко средства.
Видео при поискване (Video on Demand)
Чрез тази услуга потребителят ще може да поръча излъчването на филм или друго предаване в определено време и получаването му направо в дома си.
Видеобиблиотеки
Организациите, разполагащи с големи видеоархиви, могат да ги прекодират в цифров вид и поставят на CD -носител или специален сървър. За разлика от аналоговите носители посоченият метод осигурява продължително съхранение, многократно проиграване без да се губи качество и бърз достъп до произволен видеофрагмент.
MPEG – 2
При MPEG – 2 компресирано видео качеството на изображението е много по-голямо. Постепенно то ще измести сега съществуващите аналогови видео и телевизия.
Кабелна телевизия (CATV: Cable Television)
Освен за кабелна телевизия стандартът ще се използва и при наземно излъчваната телевизия, както и тази, излъчвана от сателит.
Телевизия с висока разрешаваща способност (HDTV: High Definition Television)
MPEG – 2 стандартът за видеокомпресия е приет за основа на разработения стандарт за телевизия с висока разрешаваща способност.
Домашно видео на базата на DVD (Digital Versatile Disk)
Със своето високо качество MPEG – 2 компресирано видео, записано на DVD диск, ще измести съществуващите аналогови видеоформати (VHS, S-VHS, Video-8) при домашно възпроизвеждане на видеофилми.
ФУНКЦИОНАЛНА СХЕМА НА MPEG – 2 КОДИРАЩО И ДЕКОДИРАЩО УСТРОЙСТВО
MPEG – 2 кодирането представлява поредица от последователни операции:
- предварителна обработка на видеосигнала (Video – Pre – Procesing) основната от която е филтриране на шумовете;
- формиране блоковете и макроблоковете, които се подават на обработка в процеса на MPEG – кодирането;
- отстраняване на времевия излишък чрез компенсация на движението;
- отстраняване на пространствения излишък чрез дискретна косинусова трансформация;
- квантуване;
- ентропно кодиране чрез използването на таблици с различна дължина на кода;
- формиране на програмния и транспортния цифров поток.
Всичко това се извършва чрез MPEG – 2 видео декодер.
Във входната схема се осъществява филтрирането и децимацията на сигнала за яркост и на сигналите на цветовите разлики СR и СВ. Обработването на тези сигнали става паралелно. При филтрирането на сигнала се отстранява пространствения и времевия излишък в сигнала представляващ импулсен и статистически шум, които при по – нататъшна обработка на сигнала биха се възприели като промяна в съдържанието на картината и биха увеличили значително скоростта на изходния цифров поток. При оптимално изпълнено филтриране на шумовете се постига намаляване на скоростта на цифровия поток с до 50%.
Входната обработка на сигнала обхваща и пространствено филтриране, при което се потискат високочестотните части на сигнала и се отстраняват видимите артефекти. Времевото филтриране не допуска намаляване на разделителната способност на подвижните обекти в картината. При оптимално филтриране не трябва да се нарушава разделителната способност на изображението.
В следващия схемен възел се формират блоковете с 8х8 отчета на сигнала на яркост и на цветоразликовите сигнали и съответно сигналът от времевата област се преобразува в сигнал, координиран по време и място. Всички последващи обработки на сигнала се извършват по блокове.
В устройство за изваждане се получава разликата от текущия блок и предсказаната стойност на блока. Получената разлика се подава за дискретна косинусова трансформация. След нея се получава матрица с DCT – коефициенти, координирани по място и честота. Тази матрица се подава на квантуване, при което се отстраняват значителна част от DCT – коефициентите. Квантуваните матрици от една страна се подават към блок за зиг – заг четене, а от друга страна постъпват към стъпало за формиране на предсказването. В това стъпало се осъществява инверсно квантуване и инверсно дискретно косинусоидно Преобразуване (IDCT) и след суматор се възстановява изходното изображение на кадъра. Възстановеното изображение се запаметява и постъпва към блок за формиране на предсказването и в блок за оценка на движението (за формиране на вектора на движението). В блока за предсказване постъпва информация и от стъпалото за оценка на движението. Компенсация на движението се осъществява само за сигнала за яркост, като се формира вектор на движението за всеки макроблок. Векторът на движението е нула за макроблоковете, в които няма движение. Векторът на движението се подава към мултиплексора като разлика от предходния кадър и освен това е кодиран с променлива дължина (VLC).
Прочетената в зиг – заг последователност цифрова поредица, се кодира в цифров код с променлива дължина (VLC). Този код се подава на мултиплексор. В него освен това постъпва и цифровата информация за вектора на движението, за матрицата за квантуване, а така също и заглавието и индикацията за края на видеогрупата. В мултиплексора се формира цифровата информация на кодирания телевизионен сигнал и съответната служебна информация. Цифрова поредица постъпва към буферна памет, в изхода на която цифровия поток е с еднаква скорост. За да се подържа постоянна скорост буферната памет има връзка с блока за квантуване. Когато буферът започне да се запълва, се подава сигнал към блока за квантуване и се засилва степента на квантуване, което намалява обема на цифровата информация за кодираното изображение. В противен случай степента на квантуване се намалява и отново се възстановява постоянната скорост на кодирания цифров поток.
Когато кодиращото устройство работи съвместно с мултиплексор в статистически режим, буферната памет има двупосочна връзка с мултиплексора. В този случай при запълване на буферната памет се сигнализира към мултиплексора необходимост от увеличаване скоростта на цифровия поток. От своя страна мултиплексора управлява скоростта на цифровия поток от буферната памет.
В изхода на кодиращото устройство цифровия поток се предава чрез ASI интерфейс със скорост на цифровия поток 270 Mbit/s.
В приемната страна (фиг.8) от цифровата поредица се отделя полезната информация и тя постъпва на буферната памет и след нея на демултиплексора. Той разпределя информацията за вектора на движението и за матриците за DCT – коефициентите. Разпределените цифрови последователности постъпват на стъпало за инверсно преобразуване на цифровите пакети с променлива дължина в пакети с постоянна продължителност (инверсно VLC), а след това на стъпало за инверсно зиг – заг прочитане, инверсно квантуване и инверсно дискретно косинусоидно преобразуване (IDCT). В сумиращото устройство, на което се подава предвидената и постъпващата матрица на DCT – коефициентите на изображението, се възстановяват изходните матрици на отчетите на изображението, от които се реконструира телевизионното изображение.
Няма сходни статии.

