120
 Universidade de Aveiro 2004  Departamento de Electrónica e Telecomunicações Rui Jorge dos Santos Almeida Transmissão de Vídeo em Tempo Real na Internet

Codec Stream

Embed Size (px)

Citation preview

  • Universidade de Aveiro 2004

    Departamento de Electrnica e Telecomunicaes

    Rui Jorge dos Santos Almeida

    Transmisso de Vdeo em Tempo Real na Internet

  • Universidade de Aveiro 2004

    Departamento de Electrnica e Telecomunicaes

    Rui Jorge dos Santos Almeida

    Transmisso de Vdeo em Tempo Real na Internet

    Dissertao apresentada Universidade de Aveiro para cumprimento dos requisitos necessrios obteno do grau de Mestre em Engenharia Electrnica e Telecomunicaes, realizada sob a orientao cientfica do Dr. Armando Jos Formoso de Pinho, Professor Associado do Departamento de Electrnica e Telecomunicaes da Universidade de Aveiro

  • o jri

    presidente Doutor Jos Lus Guimares Oliveira Professor Associado da Universidade de Aveiro

    Doutor Armando Jos Formoso de Pinho

    Professor Associado da Universidade de Aveiro (orientador) Doutor Pedro Manuel Quintas Aguiar Professor Auxiliar do Instituto Superior Tcnico da Universidade Tcnica de

    Lisboa

  • agradecimentos

    Desejo agradecer ao Prof. Dr. Armando Pinho a orientao, a preciosa ajuda e a permanente disponibilidade prestada ao longo de todo o trabalho. Ao meu colega de Mestrado, Jos Antunes, pela colaborao que tornou possvel a concluso do primeiro ano do mestrado. Ao colega Antnio Jos Neves, no IEETA, pela imprescindvel e abnegada ajuda durante a fase experimental. Este trabalho dedicado minha esposa e ao meu filho, cuja pacincia e compreenso ao longo de todo o tempo em que me dediquei elaborao desta dissertao foi o maior incentivo persecuo dos objectivos que me foram propostos.

  • resumo

    O presente trabalho aborda o tema da transmisso de vdeo em tempo real na Internet. Ao longo do mesmo, so enunciadas e explicadas as principais dificuldades colocadas pela Internet para a transmisso deste tipo de multimdia. As principais evolues tecnolgicas que pretendem atenuar estas dificuldades e permitir a implementao destes sistemas so identificadas, principalmente no que diz respeito evoluo das normas de codificao e compresso como, por exemplo, as normas MPEG, e implementao da tecnologia de Streaming de vdeo. As novas tecnologias que ainda esto em desenvolvimento mas que prometem melhorar o desempenho dos sistemas de transmisso de vdeo em tempo real so tambm abordadas. Inclumos um captulo com experincias prticas reais de transmisso de vdeo em tempo real na Internet com diferentes condies de codificao e de transmisso e respectivos resultados. A transmisso de vdeo em tempo real pode vir a ser a principal aplicao para entretenimento ou fins profissionais da Internet a mdio prazo. Para isso, muito tm concorrido os vrios desenvolvimentos tecnolgicos, nomeadamente ao nvel da codificao e compresso de vdeo. Em poucos anos, devido contribuio de normas como o MPEG, o H.263, o AVC ou aos codificadores proprietrios, o tamanho final dos ficheiros de vdeo codificados diminuiu mais de 75%. Esto em fase de implantao novas normas, como o MPEG-7 e MPEG-21, que facilitaro o trabalho de pesquisa e de adaptao s condies individuais de cada utilizador e s suas prprias preferncias. Se conjugarmos este factor com o crescimento das velocidades de acesso Internet, por exemplo ao nvel da Banda Larga com o xDSL ou por Cabo, e com o crescimento da capacidade dos computadores pessoais ou dos telemveis, apenas ser necessrio que a vertente comercial esteja adequada s capacidades dos consumidores para que a transmisso de vdeo na Internet com qualidade seja, no s possvel, como tambm uma realidade para a generalidade das pessoas.

  • abstract

    This work intends to present a global view about the transmission of real-timevideo over the Internet. We present and explain the main problems caused by the architecture of the actual Internet. The principal technical solutions that seek to overcome these problems are introduced, with the focus on the evolution of compression developments like, among others, the MPEG standards, as well as on the explanation of Streaming video technology. We also address some of the new standards that might help to solve and improve transmission of this media. We include a practical chapter with the results of tests for real-time video transmission over the Internet for different conditions of compression and transmission. Transmission of real-time video over the Internet may become, in a few years, the main application for entertainment or business purposes. This objective has received strong contribution from technical evolutions, mainly in video compression. With the development of standards like MPEG, H.263, AVC or with the proprietary codecs, the length of the encoded video bitstream has been reduced over 75% in a short period of time. There are new ways that other tools, like MPEG-7 or MPEG-21, have been exploiting to find new forms of helping the user to find and get the best result according to his technical conditions and personal preferences. Additionally, there has been an important growing on the number of Broadband accesses, like xDSL or Cable modem, and on the capacities of PCs and other devices that supports Streaming video software. The last piece in this picture is the price of the Internet access and the software. If they are affordable to the consumers earnings, there is no doubt that quality real-time video over the Internet is possible and that it will be a reality.

  • 7

    ndice:

    CAPTULO I A INTERNET E A TRANSMISSO DE VDEO EM TEMPO REAL ...........................11

    I.1 A INTERNET .......................................................................................................................................................... 13 I.2 - PEQUENA HISTRIA DA INTERNET ..................................................................................................................... 13 I.3 DESCRIO FUNCIONAL DA REDE..................................................................................................................... 14 I.4 FORMAS DE ACESSO REDE............................................................................................................................... 16 I.5 PRINCIPAIS CONSTRANGIMENTOS TRANSMISSO DE VDEO EM TEMPO REAL......................................... 18

    CAPTULO II - CODIFICAO DE VDEO .......................................................................................................21

    II.1 CODIFICADORES CLSSICOS................................................................................................................................ 22 II.1.1 Compensao de Movimento.....................................................................................................................23 II.1.2 Transformada Discreta de Co-seno (DCT).............................................................................................27 II.1.3 Quantificao e Codificao por VLC.....................................................................................................28 II.1.4 - Organizao do bitstream.......................................................................................................................29

    II.2 PRIMEIRAS NORMAS DE CODIFICAO DE VDEO: H.261, H.263 E MPEG-1 E MPEG-2 .......................... 30 II.2.1 H.261..............................................................................................................................................................30 II.2.2 H.263..............................................................................................................................................................31 II.2.3 MPEG-1 e MPEG-2 ....................................................................................................................................35

    II.3 - MPEG-4 ............................................................................................................................................................... 39 II.3.1 - Modo de Funcionamento.........................................................................................................................40 II.3.2 Principais funcionalidades para adaptao Internet.........................................................................42

    II.4 ADVANCED VIDEO CODING (H.264 OU MPEG-4 PART 10)............................................................................ 46 II.4.1 Codificao (VCL).......................................................................................................................................47 II.4.2 Adaptao ao meio de transmisso (NAL)..............................................................................................49

    II.5 CODECS PROPRIETRIOS................................................................................................................................... 49 II.5.1 QuickTime .....................................................................................................................................................49 II.5.2 RealNetworks................................................................................................................................................50 II.5.3 Windows Media............................................................................................................................................51

    CAPTULO III - STREAMING DE VDEO ...........................................................................................................55

    III.1 - FUNCIONAMENTO DO STREAMING.................................................................................................................. 56 III.1.1 Codificao de Vdeo adaptada a streaming........................................................................................57 III.1.2 Codecs de Vdeo para Streaming de Mdia...........................................................................................59 III.1.3 Servidores para Streaming .......................................................................................................................59 III.1.4 Escalabilidade e Adaptao da taxa de transmisso...........................................................................61 III.1.5 Mecanismos de distribuio de streaming multimdia........................................................................61 III.1.6 Sincronizao de mdia............................................................................................................................62

    III.2 DESENVOLVIMENTOS NA COMPRESSO DE VDEO.......................................................................................... 63 III.2.1 Escalabilidades do tipo SNR, espacial e temporal...............................................................................63 III.2.2 Fine Granularity Scalability (FGS)........................................................................................................64 III.2.3 Progressive Fine Granularity Scalability (PFGS)...............................................................................66 III.2.4 Tcnicas de compresso hbridas Temporal/FGS................................................................................67

    III.3 DESENVOLVIMENTOS NO CONTROLO DE QUALIDADE DE SERVIO.............................................................. 68 III.3.1 Controlo de congestionamento ................................................................................................................68 III.3.2 Controlo de erros.......................................................................................................................................68

    III.4 DESENVOLVIMENTO DE SERVIOS DE DISTRIBUIO CONTNUOS............................................................... 69 III.4.1 Filtragem pela rede....................................................................................................................................69 III.4.2 Multicast do nvel de aplicao...............................................................................................................69 III.4.3 Replicao de contedos...........................................................................................................................71 III.4.4 Redes Distribudas.....................................................................................................................................71

    III. 5 DESENVOLVIMENTO DE PROTOCOLOS ADAPTADOS PARA STREAMING NA INTERNET.............................. 72 III.5.1 Protocolo de rede.......................................................................................................................................72 III.5.2 Protocolos de transporte...........................................................................................................................73

  • 8

    III.5.3 Protocolos de sesso..................................................................................................................................73 III.6 CONCLUSO.......................................................................................................................................................... 74

    CAPTULO IV O FUTURO DO VDEO EM TEMPO REAL NA INTERNET ......................................75

    IV.1 - NOVOS SERVIOS NA INTERNET...................................................................................................................... 76 Servios Integrados - IntServ ...............................................................................................................................76 Servios diferenciados - Diffserv .........................................................................................................................76

    IV.2 - DESENVOLVIMENTOS NOS ELEMENTOS DE REDE E FORMAS DE ACESSO ................................................... 77 IV.3 - NOVAS TCNICAS PARA STREAMING DE VDEO NA INTERNET .................................................................... 78

    Eficincia e Utilizao do AVC na Internet.......................................................................................................78 IV.4 ACESSO MULTIMEDIA UNIVERSAL, ESCALABILIDADE E TRANSCODIFICAO, MPEG-7 E MPEG-21......................................................................................................................................................................................... 79

    Escalabilidade e Transcodificao.....................................................................................................................80 MPEG-7 ...................................................................................................................................................................82 MPEG-21 .................................................................................................................................................................84

    CAPTULO V EXPERINCIAS PRTICAS DE TRANSMISSO DE VDEO NA INTERNET ....87

    V.1 HARDWARE E FERRAMENTAS DE SOFTWARE ................................................................................................ 87 V.2 DESCRIO DAS EXPERINCIAS....................................................................................................................... 88 V.3 RESULTADOS ....................................................................................................................................................... 90

    a) Windows Media Encoder, leitor no PC A ligado por ADSL......................................................................90 b) Windows Media Encoder, leitor no PC A ligado por Modem...................................................................91 c) Windows Media Encoder, leitor no PC B ligado por ADSL......................................................................92 d) Windows Media Encoder, leitor no PC B ligado por Modem...................................................................93 e) Real Producer, leitor no PC A ligado por ADSL.........................................................................................94 f) Real Producer, leitor no PC A ligado por Modem.......................................................................................95 g) Real Producer, leitor no PC B ligado por ADSL.........................................................................................96 h) Real Producer, leitor no PC B ligado por Modem......................................................................................97

    V.3 ANLISE DOS RESULTADOS.............................................................................................................................. 98 Influncia da velocidade de acesso.....................................................................................................................98 Influncia da capacidade do PC....................................................................................................................... 103 Comparao entre codificadores...................................................................................................................... 104

    CAPTULO VI CONCLUSES .......................................................................................................................... 111

    GLOSSRIO ................................................................................................................................................................. 116

    BIBLIOGRAFIA.......................................................................................................................................................... 117

    NDICE REMISSIVO ................................................................................................................................................ 120

  • 9

    ndice de figuras:

    Fig. I-1 Esquema simplificado da transmisso de vdeo na Internet....................................................................12 Fig. I-2 Esquema geral da Internet ............................................................................................................................15 Fig II-1a Duas imagens consecutivas de um trecho de vdeo [29].......................................................................23 Fig II-1b Diferena entre as duas imagens consecutivas exibidas na fig. II-1a [29]........................................24 Fig II-1c Vectores de movimento entre imagens consecutivas [29].....................................................................24 Fig II-1d Informao residual aps o processo de Compensao de movimento [29].....................................25 Fig II-2 Processo de criao do vector de movimento [27]...................................................................................26 Fig II-3 - Codificador com Compensao de Movimento..........................................................................................27 Fig. II-4 - Exemplo de Construo do bitstream por varrimento em zig-zag.........................................................28 Fig II-5 Codificador Clssico com Compensao de Movimento, DCT e Quantificao................................29 Fig II-6 - Codificador tpico para H.263......................................................................................................................32 Fig II-7 Codificador tpico para H.263++...............................................................................................................34 Fig II-8 - Codificador tpico para MPEG-2 .................................................................................................................37 Fig II-9 - Decomposio da imagem em Video Objects (VOs) [26] ......................................................................41 Fig II-10 - Escales para as ferramentas de codificao no MPEG-4 ...................................................................44 Fig II-11 Codificador tpico MPEG-4 .......................................................................................................................45 Fig. II-12 - Exemplo da aplicao de Codificao por Sprites ................................................................................46 Fig II-13 - Codificador tpico AVC................................................................................................................................48 Figura III-1 Esquema geral de streaming de vdeo.................................................................................................56 Fig. III-2 Qualidade/Velocidade para compresses escalveis e no escalveis..............................................58 Fig III-3 Codificador FGS ...........................................................................................................................................65 Fig. III-4 Descodificador FGS ....................................................................................................................................66 Fig III-5 Distribuio de Vdeo sem Multicast pela Rede......................................................................................70 Fig III-6 Distribuio de vdeo numa Rede com IP Multicast...............................................................................70 Fig. III-7 - protocolos numa sesso de streaming.......................................................................................................72 Fig. IV-1 Esquema geral do conceito Universal Multimedia Access...................................................................80 Fig. IV-2 Transcodificao para adaptao a diferentes condies de transmisso ou para necessidade de alterao do tipo de codificao....................................................................................................................................82 Fig. IV-3 Esquema geral para um sistema com MPEG-7 ......................................................................................84 Fig. IV-4 Sistematizao dos componentes da norma MPEG-21 .........................................................................86 Fig. V-1 Esquema da experincia prtica.................................................................................................................87 Fig. V-2 Exemplo de uma frame do vdeo original entrada do codificador. ...................................................98 Fig. V-3 Exemplo de frame codificada pelo Windows Media Encoder a 40 Kbps e recebida via modem....98 Fig. V-4 Exemplo de frame codificada pelo Real Producer Basic a 50 Kbps e recebida via modem............99 Fig. V-5 Exemplo de frame distorcida. Codificao pelo Windows Media Encoder a 40 Kbps e recebida via modem.................................................................................................................................................................................99

    Fig. V-6 Exemplo de frame distorcida. Codificao pelo Real Producer Basic a 50 Kbps e recebida via modem.............................................................................................................................................................................. 100 Fig. V-7 Exemplo de frame do vdeo original entrada do codificador. ......................................................... 100 Fig. V-8 Exemplo de frame codificada pelo Windows Media Encoder a 491 Kbps e recebida via ADSL. 101 Fig. V-9 Exemplo de frame codificada pelo Real Producer Basic a 450 Kbps e recebida via ADSL......... 101

    Fig. V-10 Exemplo de frame com sobreposio de imagens. Codificao pelo Windows Media Encoder a 691 Kbps e recebida via ADSL.................................................................................................................................... 102 Fig. V-11 Exemplo de frame distorcida. Codificao pelo Real Producer Basic a 700 Kbps e recebida via

    ADSL ................................................................................................................................................................................ 102 Fig. V-12 Comparao da percentagem de frames recebidas por cada PC ligado por ADSL .................... 103 Fig. V-13 Comparao da percentagem de frames recebidas por cada PC ligado por modem................... 104 Fig. V-14 Exemplo de frame do vdeo original entrada do codificador........................................................ 106 Fig. V-15 Exemplo de imagem obtida por codificao a 491 Kbps pelo Windows Media Encoder............ 106 Fig. V-16 Exemplo de imagem obtida por codificao a 450 Kbps pelo Real Producer Basic.................... 107 Fig. V-17 Exemplo de uma frame do vdeo original entrada do codificador. .............................................. 108 Fig. V-18 Exemplo de imagem obtida por codificao a 491 Kbps pelo Windows Media Encoder............ 108 Fig. V-19 Exemplo de imagem obtida por codificao a 450 Kbps pelo Real Producer Basic.................... 109 Fig VI-1 - Evoluo dos dbitos gerados pelas normas de codificao de vdeo [3]........................................ 112

  • 10

  • 11

    Captulo I A Internet e a Transmisso de Vdeo em Tempo Real O crescimento desmesurado da Internet e a sua consolidao como um meio eficaz de comunicao global para toda a humanidade, deixou de ser um objectivo utpico para se tornar numa realidade incontestvel, permitindo- lhe ser capaz de colocar em contacto pessoas ou entidades em qualquer parte do mundo. Hoje, a Internet deixou definitivamente de estar confinada aos meios universitrios ou institucionais e, atravs dos servios que suporta, est progressivamente a ocupar um lugar privilegiado na nossa vida privada e nos meios profissionais. Este meio de comunicao suporta aplicaes e servios que j so indispensveis para a actividade empresarial ou para a vida diria particular tais como o correio electrnico, vulgo e-mail ou a consulta de informao em pginas web. Um inqurito realizado por uma empresa norte-americana de software a alguns executivos e responsveis informticos de mdias e grandes empresas [5], revelou que a perda do e-mail pode ser mais traumatizante do que um divrcio... A Internet teve origem numa aplicao de comunicao privada militar norte-americana em meados dos anos 70, com o objectivo de interligar informaticamente algumas instalaes dispersas geograficamente. O conceito foi mais tarde transportado para uma escala global e veio a garantir a partilha de informao entre todos os pontos do mundo. As formas de aceder a esta rede mundial so bastante diversas, o que tem a vantagem de facilitar e generalizar o acesso, mas tambm o inconveniente de criar uma rede heterognea em termos de resposta e comportamento. Devido sua vasta implementao geogrfica, a Internet foi vista quase de imediato como um meio de distribuio de eventos em tempo real na forma de transmisso em directo de imagem e som. As aplicaes so to diversas como, por exemplo, uma videoconferncia, o fornecimento de servios de video-on-demand, o ensino distncia, as bibliotecas digitais ou simplesmente o entretenimento. O desenvolvimento de aplicaes especficas para a apresentao de vdeo em PCs (Computadores Pessoais) ou mesmo em PDAs (Personal Digital Assistent), permitiu difundir largamente a tecnologia e tornou os utilizadores finais receptivos a estas aplicaes, abrindo tambm a necessidade de corresponder s suas expectativas cada vez mais exigentes. Hoje, perfeitamente vulgar a transmisso de eventos desportivos, concertos musicais ou palestras pela Internet com milhares de clientes em simultneo. Por outro lado, a criao de canais comerciais de TV na Internet est em franco crescimento e contribuir, num curto espao de tempo, para o aumento da procura deste tipo de tecnologia. Numa viso muito global, poderamos descrever o processo de transmisso de um vdeo na Internet da seguinte forma: as imagens do evento a transmitir so captadas e digitalizadas por cmaras adequadas. Os ficheiros de vdeo resultantes tm a particularidade de serem enormes o que dificulta a sua transmisso ao longo de uma rede em que no h uma taxa de transmisso garantida, constituda por receptores completamente distintos ao nvel da ligao e desempenho de processamento dos dados como o caso da Internet. Seria absolutamente impossvel a sua transmisso em bruto e um dos grandes desafios que os investigadores desta rea tm de suplantar o da necessidade de compresso destes ficheiros. Os ficheiros, ou so enviados imediatamente pela rede ao cliente ou ficam armazenados em servidores que esto acessveis via Internet para que, aps um pedido do receptor, sejam enviados ao longo da rede. O receptor tem uma aplicao desenvolvida

  • 12

    para a leitura destes ficheiros cuja funo a de descomprimi- los e apresent- los em imagens (ver Fig I-1).

    Fig. I-1 Esquema simplificado da transmisso de vdeo na Internet No entanto, esta viso simplista esbarra na arquitectura da Internet e nos meios de acesso postos disposio dos utilizadores finais. Mais especificamente, as caractersticas do sinal de vdeo exigem do canal de transmisso um conjunto de requisitos bastante exigentes tais como necessidade de largura de banda e tempos de atraso muito pequenos, para garantir a continuidade da apresentao ao receptor humano que no deseja ver interrupes ou paragens no visionamento, e pequenas taxas de perda de pacotes para uma reconstruo eficaz da imagem final. No entanto, a Internet actual, sendo uma rede de best effort , no capaz de o garantir, quer devido s caractersticas dos componentes da rede, tais como os equipamentos activos ou as ligaes, quer devido s questes protocolares subjacentes prpria rede. O objectivo deste trabalho apresentar os vrios constrangimentos associados a esta tecnologia e analisar as solues que presentemente esto a ser estudadas, de forma a poder apontar caminhos de evoluo para as mesmas. Para colmatar ou reduzir alguns dos problemas existentes, vrios esforos tm vindo a ser feitos para desenvolver solues que tornem fivel e aplicvel a transmisso de vdeo em tempo real na Internet. O Streaming de vdeo, tecnologia que ser desenvolvida neste trabalho, tem caractersticas que permitem superar algumas destas dificuldades, nomeadamente a do tempo necessrio para a apresentao do objecto, pois permite ao utilizador final no ter de esperar pela chegada completa do ficheiro, ou as perdas ao longo da rede, dado possuir alguns mecanismos de deteco de erros e controlo de fluxo que minimizam ou ultrapassam as eventuais perdas de pacotes e atrasos na rede. Esta tecnologia ainda est em fase de desenvolvimento, no estando ainda suficientemente madura para se considerar absolutamente fivel.

  • 13

    I.1 A Internet A Internet uma ferramenta indissocivel do mundo actual. Esta rede global de comunicao foi capaz de criar e fortalecer laos de contacto entre indivduos ou entre empresas, independentemente do espao fsico ou cultural que os separe. A transmisso de vdeo em tempo real nesta rede surgiu quase naturalmente por necessidade dos prprios utilizadores que pretendiam utilizar as caractersticas de universalidade para terem acesso a eventos em qualquer parte do mundo. Nos prximos pontos deste Captulo pretende-se fazer uma descrio do actual estado da rede mundial e identificar os seus pontos fortes e fracos no que diz respeito implementao de aplicaes de vdeo em tempo real.

    I.2 - Pequena histria da Internet Na dcada de 60 do sculo passado, em plena guerra fria, os meios militares norte-americanos debatiam-se com a necessidade de partilharem informao em tempo real, de forma segura, sustentada por uma rede capaz de resistir a um ataque nuclear, dado que a principal limitao da tradicional rede telefnica era que a queda de um circuito cortava as comunicaes dos clientes sustentados nesse troo [1]. Foi ento criada a ARPA (Advanced Research Projects Agency) que, atravs de colaboraes com universidades e algumas empresas, se dedicou construo de uma rede de comutao de pacotes em que cada terminal estava ligado a pelo menos outras 2 mquinas da rede para que, no caso da queda de um troo, as comunicaes fossem automaticamente encaminhadas por um percurso alternativo. Originalmente, utilizaram-se circuitos a 56 Kbps alugados s companhias telefnicas para interligar os computadores numa arquitectura de servidores e clientes, com protocolos desenvolvidos especificamente para garantir as comunicaes entre todos os elementos da rede. Assim surgiu a ARPANET que comeou a crescer atravs da progressiva integrao de instituies de ensino superior norte-americanas que por sua vez contribuam com investigao e desenvolvimento para a melhoria do desempenho da mesma, incluindo a possibilidade de ligao via rdio ou satlite. Quando o crescimento obrigou implementao de subredes, foi necessrio um protocolo especfico para a interligao das mesmas e surgiu o modelo TCP/IP (Transport Control Protocol / Internet Protocol), que foi considerado o seu protocolo oficial em 1 de Janeiro de 1983, e posteriormente de um sistema de correspondncia entre nomes e endereos, o DNS (Domain Name System). Dado o enorme sucesso e fiabilidade desta rede, a National Science Foundation (NSF) nos EUA teve a ideia de criar uma rede semelhante para interligar todas as instituies de ensino, desta vez sem a necessidade de existncia de acordos com a ARPA, para a troca de informaes cientficas e prevendo a ligao de investigadores a nvel individual instalados em suas casas ou a museus, laboratrios e bibliotecas. Surgiu ento a NSFNET, que manteve a ligao ARPANET mas, por questes de segurana, sem a componente de ligao s instituies militares. O crescimento desta rede foi exponencial, e pela primeira vez, foi utilizado um backbone em fibra ptica com PCs IBM a servirem de Routers. O passo seguinte foi a entrada de empresas que exploraram comercialmente a NSFNET que acabou por ser vendida America On Line (AOL). Por outro lado, na Europa, esta ideia de criao de uma rede IP foi seguida com a criao da EuropaNET, sendo posteriormente criadas redes nacionais em cada pas que se interligavam mutuamente.

  • 14

    Desta forma comeou-se a falar frequentemente de uma Internet at o termo se tornar vulgar na dcada de 80 para designar a rede IP de dimenso global. O seu crescimento tem sido desmesurado: em 1990 existiam cerca de 300 000 utilizadores, em 1992 atingiu-se o primeiro milho. Por cada ano que passou na dcada de 90 o seu tamanho duplicou e foram sendo diversificadas as formas de ligao com a integrao da ligao via redes mveis, por exemplo [1]. A Internet, com todas as suas vantagens e desvantagens, o veculo de aplicaes importantssimas hoje em dia, tais como a vulgar navegao em Pginas Web, o correio electrnico, vulgo e-mail, a transferncia de ficheiros atravs do FTP ( File Transfer Protocol), a conversa escrita em tempo real, atravs do IRC (Internet Relay Chat) e, mais importante para este trabalho, a transmisso de eventos em vdeo e/ou udio. A transmisso de vdeo na Internet comercialmente muito interessante para um fornecedor de contedos de vdeo, pois pode difundi- los numa rede vasta onde encontra numerosos potenciais clientes. Por outro lado, do ponto de vista do cliente, uma forma de aceder a eventos que ocorrem em stios distantes e que, de outra forma, estaria impossibilitado de lhes aceder. Entre as vrias aplicaes possveis podemos indicar:

    ? Videoconferncia; ? Video on-demand; ? Transmisso de eventos em directo, como por exemplo concertos musicais ou

    eventos desportivos; ? Ensino distncia; ? Sistemas de vigilncia remota; ? Acesso a documentos na forma de bibliotecas multimdia;

    I.3 Descrio funcional da rede A Internet pode ser definida tecnicamente como uma rede de mquinas (computadores pessoais, servidores, PDAs, telemveis de terceira gerao, etc.) que [2]:

    ? utilizam o protocolo TCP/IP ou UDP ? tm um endereo IP ? tm a capacidade de enviar e receber pacotes de e para qualquer mquina na

    Internet Cada mquina est ligada a um Internet Service Provider (ISP) que o coloca em contacto com o resto da rede. Esta ligao pode ser feita de formas bastante distintas quer ao nvel fsico (cabo ou wireless) quer ao nvel da velocidade de ligao (desde alguns Kbps at aos Gbps), como tambm no que diz respeito ao acordo comercial entre a entidade que se liga e o ISP. A rede no tem, globalmente, uma estrutura pr-definida e pode ser vista como uma interligao de subredes de circuitos de alto dbito (backbones), tipicamente em fibra ptica, e routers de alta capacidade. A estes backbones ligam-se redes mais pequenas, ao nvel regional, com cabos e routers menos potentes e que por sua vez suportam as ligaes aos utilizadores finais, quer sejam PCs individuais ou LANs de empresas ou escritrios (ver Fig I-2).

  • 15

    Fig. I-2 Esquema geral da Internet

    O grande responsvel pela boa ligao de todos estes elementos o protocolo IP (Internet Protocol), desenvolvido com o grande objectivo de fazer chegar pacotes de dados entre dois elementos mesmo que estejam fisicamente em redes diferentes. Cada mensagem enviada dividida em pequenos pacotes, e cada um destes recebe uma etiqueta que identifica, entre outros, a sua origem, o seu destino e o tipo de dados. A identificao de cada elemento da rede feita univocamente atravs do seu endereo IP. Um endereo IP constitudo por 32 bits na verso ainda corrente denominada IPv4 e passar a 48 bits na verso IPv6 que est a ser desenvolvida. O endereo IP permite tambm obter informao da rede a que pertence a mquina que o detm. Os Routers ao longo da rede podem encaminhar cada um dos pacotes por caminhos distintos, em funo do estado da rede, tal como tinha sido condio na gnese da ARPANET, embora no seja garantida a entrega de todos os pacotes (em situaes de congestionamento alguns podem ser descartados). O Transport Control Protocol (TCP) um protocolo orientado ligao e que foi concebido para garantir uma ligao fivel extremo a extremo numa rede constituda por troos completamente distintos e que, por si s, no oferece garantias. Cabe ao TCP fazer com que pacotes perdidos na rede possam ser reenviados, evitar congestionamentos e tambm reorganizar os pacotes recebidos dado que geralmente no chegam na ordem em que foram enviados. Outro dos protocolos de transporte o User Data Protocol (UDP). O UDP um protocolo no orientado ligao, mais leve do que o TCP, e que se utiliza em situaes em que se pretende privilegiar a velocidade da rede e onde no h grandes necessidades de segurana

  • 16

    e redundncia da informao transmitida. No garante a entrega dos pacotes, mas detecta a sua perda. Por ser mais simples e ocupar menos recursos da rede o preferido por aplicaes de transmisso de vdeo como ser apresentado ainda neste Captulo. O protocolo HTTP (Hiper Text Transfer Protocol), utilizado na World Wide Web, no apropriado para streaming vdeo em tempo real, pois embora esteja suportado em TCP e isso lhe permita garantir a entrega da informao, no oferece estabilidade na taxa de transmisso. As primeiras solues para este problema implicam a existncia no receptor de um buffer denominado preroll buffer, cuja funo a de funcionar como uma barragem num rio de forma que a sua sada tenha um fluxo constante. Desta forma, se definirmos um tempo de buffer entre os 5 e os 20 segundos, teremos uma entrega de dados de uma forma constante, pois tipicamente no se registam atrasos superiores na transmisso da informao. A implementao do buffer feita na aplicao de leitura do vdeo instalada no receptor. No captulo III, iremos apresentar alguns protocolos especficos que se aplicam transmisso de vdeo na Internet que foram desenvolvidos com o fim de suplantar as limitaes do TCP e do UDP.

    I.4 Formas de acesso rede A enorme heterogeneidade da rede um dos pontos fracos para a distribuio de vdeo. O facto de cada utilizador ter condies quase nicas faz com que os fornecedores de vdeo na Internet tenham de desenvolver solues que incluam algoritmos que permitam servir clientes com diferentes velocidades de transmisso da informao e, principalmente, que possam adaptar-se a essa velocidade atravs de variaes da qualidade do vdeo final. De entre a multiplicidade de formas de ligao de um utilizador rede podemos identificar as principais:

    1. GSM : Trata-se da possibilidade de aceder Internet por um terminal mvel suportado na rede GSM. Por exemplo, pode ser feito ligando um PC dotado de uma placa do tipo PCMCIA a um telemvel. As velocidades alcanadas no ultrapassam os 9.6 Kbps o que torna muito difcil a transmisso de vdeo em tempo real por este tipo de ligao.

    2. GPRS: O GPRS, conhecida por gerao 2.5 das redes mveis, utiliza a capacidade de agregao de canais de transmisso da rede GSM para aumentar as velocidades de ligao, prometendo uma ligao at 171,2 Kbps. No entanto, a velocidade de ligao depende do nmero de utilizadores de voz e dados no raio de aco da sua clula, o que em termos prticos significa que no h uma velocidade fixa de ligao e, tipicamente em meios urbanos, as velocidades no so famosas. Ainda est em fase embrionria a implementao da rede UMTS pelos operadores mveis que pretende revolucionar a utilizao de aplicaes multimdia nas redes mveis.

    3. Ligao via linha telefnica analgica com modem : Os modems analgicos atingem, via ligaes dial, os 56 Kbps, muito melhor que os 9.6 ou 22 Kbps dos primeiros tempos desta tecnologia. Embora o modem possa suportar essa velocidade, h outros factores que influenciam a verdadeira velocidade da ligao, tais como a qualidade do par de cobre que liga o utilizador sua central telefnica e as capacidades dos POPs (Point of Presence) do seu ISP. O acesso analgico rede telefnica est espalhado por quase todos os lares, o que o faz ser ainda o principal

  • 17

    meio de acesso Internet. Os fornecedores de contedos de vdeo que optam por fornecer diferentes verses do vdeo consoante o tipo de ligao ainda costumam utilizar os 56 Kbps de ligao como uma das referncias para as verses disponveis. Genericamente, a qualidade que se obtm no famosa, mas para um utilizador pouco exigente j permite uma razovel implementao da tecnologia de vdeo em tempo real na Internet.

    4. Ligao via linha telefnica RDIS: Uma linha RDIS um acesso Digital que funciona em canais individuais de 64 Kbps com capacidade de agregao dos 2 canais permitindo ligaes a 128 Kbps, necessitando de um modem digital que implemente a norma RDIS. Trata-se de uma ligao com qualidade superior da linha analgica com a consequente melhoria de qualidade das aplicaes de vdeo.

    5. ADSL (Assymetric Digital Subscriber Line) : uma tecnologia em franca expanso comercial e que permite rentabilizar os pares de cobre utilizados na rede telefnica analgica ou RDIS para fornecer um acesso de alta velocidade assimtrico, ou seja, com diferentes velocidades de upload e de download. Em Portugal, o operador de telecomunicaes Portuga l Telecom fornece aos Internet Service Providers os seguintes servios, denominados classes de servio:

    Classe Upload Download

    0 128 Kbps 512 Kbps 1 128 Kbps 256 Kbps 2 128 Kbps 768 Kbps 3 256 Kbps 1024 Kbps

    Tabela I classes de acesso ADSL

    Convm referir que as velocidades acima indicadas so as mximas e que, mais uma vez, no existe velocidade garantida de transmisso em todo o troo at entrada na Internet, dado que as condies variam em funo da quantidade de clientes ligados em simultneo. O nmero de utilizadores de servios de vdeo na Internet com ADSL tem vindo a aumentar pois esta ligao oferece velocidades interessantes com uma componente comercial acessvel.

    6. Cabo: Os operadores de redes de transmisso de televiso por cabo passaram a rentabilizar a capacidade instalada nas suas redes atravs do fornecimento de ligao Internet. Em termos de velocidade de acesso as mesmas variam desde os 128 Kbps at 1 Mbps, embora sujeitas a flutuaes em funo da utilizao da rede. Tal como o ADSL, fornece a possibilidade de acesso a contedos multimdia com velocidades razoveis e um custo interessante.

    7. Acesso dedicado: Entende-se por acesso dedicado Internet um canal que liga directamente um PC ou uma LAN a um ponto de entrada na Internet e que se caracteriza por ser exclusivamente dedicado a essa ligao com velocidades constantes e garantidas ao longo deste percurso. Pode ser feito por circuito dedicado, em que o operador de Telecomunicaes instala uma linha directa entre o cliente e a porta de acesso Internet, por Frame Relay, em que o acesso Internet feita via o acesso a uma rede IP de transmisso de pacotes que por sua vez tem conectividade Internet, em ATM (Asynchronous Transfer Mode) ou outro e tm uma gama de oferta de velocidades que variam desde os simples 64 Kbps at 155 Mbps ou mais. Ao contrrio dos servios anteriores, todo o percurso entre o

  • 18

    utilizador e a Internet exclusivo desta ligao pois no h partilha com outros utilizadores, nem a infra-estrutura de acesso ao cliente dividida para comunicaes de voz ou de televiso, por exemplo. Assim, pode-se definir uma velocidade constante at porta Internet que lhe foi dedicada. Tipicamente, este o tipo de ligao Internet de instituies ou empresas que pretendem ter um meio fivel, seguro e com garantias de largura de banda para a ligao das suas LANs rede e/ou para fornecimentos de servios a essa rede, tais como armazenamento de pginas WWW, domiciliao de servidores de e-mail ou FTP, etc..

    Para alm do tipo de ligao, temos de levar em conta os aspectos comerciais da utilizao do servio e que podem influenciar as decises dos utilizadores dos servios de vdeo. H servios cuja tarifao depende do tempo de ligao rede, como as ligaes via modem analgico ou RDIS, outras que taxam a quantidade de informao recebida independentemente do tempo da ligao, como o ADSL ou o Cabo, e outras que so do tipo flat-rate, ou seja, uma taxa fixa independente da informao recebida ou do tempo de ligao. Assim, o pagamento do servio pode influenciar a qualidade do vdeo que um determinado cliente pretende, pois este pode preferir ver um vdeo de qualidade inferior para reduzir os seus custos.

    I.5 Principais constrangimentos transmisso de vdeo em tempo real Tendo em conta os aspectos apresentados nos pontos anteriores, podemos identificar os seguintes principais problemas da transmisso de vdeo em tempo real na Internet [2]: A Internet no foi desenhada para contedos de mdia A Internet uma rede de transmisso de pacotes suportada pelo protocolo IP. A informao a enviar tem de ser fraccionada em pequenos pacotes que so transmitidos pela rede por um percurso desconhecido partida e que pode ser diferente para 2 pacotes do mesmo ficheiro. Por outro lado, no h garantia nem da entrega dos pacotes nem da manuteno da ordem aquando da chegada. Assim, a transmisso de eventos contnuos tem de se adaptar a esta realidade, criando mecanismos prprios de redundncia ou recuperao da informao perdida e algoritmos capazes da reconstruo do ficheiro inicial sem perda de continuidade e manuteno da sequncia original. A Internet no oferece QoS e regista flutuaes no seu comportamento O protocolo IP no permite, s por si, a possibilidade de garantir Qualidade de Servio para uma determinada aplicao ou utilizador. A Internet uma rede Best Effort, ou seja, os recursos disponveis so utilizados pelas aplicaes que os solicitam sem preferncias. Por outras palavras, se tivermos num rede capaz de suportar 128 Kbps e um utilizador, esse poder utilizar a totalidade dos 128 Kbps, mas quando a rede partilhada por outros utilizadores, a largura de banda vai sendo distribuda pelos utilizadores consoante os pedidos forem chegando sem ser feita qualquer cedncia de privilgios a uma aplicao mais necessitada do que outra em largura de banda. Em situaes de congestionamento, o atraso dos pacotes cresce e em casos extremos a rede descarta mesmo alguns pacotes indistintamente. O resultado uma rede em que as condies de transmisso de informao para um dado utilizador variam em funo do tipo de ligao, da partilha do meio com os outros utilizadores e do volume de trfego cursado em cada momento. No h hiptese

  • 19

    alguma de uma velocidade constante e pr-definida. Este facto determinante na transmisso de vdeo pois esta aplicao consome grandes recursos de largura de banda e muito exigente com os tempos de atraso e perda de pacotes. A Internet um meio heterogneo Foi visto atrs que o manancial de formas de ligao Internet contribuiu para o rpido crescimento e globalizao da rede. O reverso da medalha a heterogeneidade das caractersticas de ligao dos utilizadores. Cada um destes tem uma ligao que se distingue dos outros utilizadores principalmente pelo dbito que consegue atingir. Mesmo em clientes que utilizem a mesma forma de acesso, p.e. cabo, as variaes podem ser significativas devido quantidade de utilizadores em simultneo na rea de residncia. Outra forma de diferenciao o tipo de mquina que suporta a aplicao de leitura do vdeo. Cada vez mais se alarga o leque de equipamentos com capacidade de ligao Internet e onde se tentam implementar leitores de streaming de vdeo, entre eles:

    ? Computadores pessoais, com processadores que podem ter grandes diferenas de velocidades de processamento ou diferentes capacidades de memria.

    ? PDAs que implementam streaming mas muito mais limitados que os PCs. ? Telemveis, que nos dias de hoje j comeam a suportar aplicaes de vdeo e cujo

    desenvolvimento aponta para a convergncia com os computadores. Os fornecedores de contedos tm de satisfazer os vrios clientes, quer atravs da disponibilizao de diferentes verses do mesmo evento ou atravs de algoritmos de escalabilidade que possam tirar benefcio das ligaes mais rpidas e fornecer um servio mnimo aceitvel para os que esto em piores condies. Esta segunda hiptese , sem dvida, a opo onde mais intensamente esto a ser feitos desenvolvimentos na rea da transmisso de vdeo na Internet. O objectivo produzir uma nica verso do objecto com a capacidade para se adaptar s condies de transmisso e recepo. Resumindo, a Internet uma rede densamente distribuda com a capacidade de chegar a quase todas as pessoas no mundo e que pode ser um meio de distribuio de vdeo em tempo real. Contudo, como no foi desenvolvida para esse fim, sendo heterognea e sem oferta de garantias no seu comportamento, coloca obstculos sua implementao que os investigadores desta rea tm de resolver. Ao longo deste trabalho, sero identificadas as tcnicas nesta rea. O segundo captulo servir para descrever o processo da codificao e compresso de vdeo para transmisso na Internet. As principais normas de codificao de vdeo e os principais codificadores proprietrios comerciais completaro esta parte do trabalho. Ser dado relevo ao MPEG 4 e o seu desenvolvimento posterior o Advanced Video Coding (AVC). Seguidamente, no Captulo III, sero abordados os principais desenvolvimentos tcnicos pensados para a transmisso de vdeo na Internet. Ser apresentado o Streaming de vdeo como a forma mais apropriada de o fazer e tambm algumas adaptaes que foram feitas na rede para o servir. Reservmos o quarto Captulo desta dissertao para mencionar alguns caminhos de futuro que j comeam a ser explorados para o aperfeioamento da transmisso de multimdia na Internet. No captulo V descrevemos um conjunto de experincias prticas realizadas para verificar o quanto fivel e possvel a transmisso de vdeo na Internet e os seus resultados. Por fim, no Captulo VI, ser feito um resumo do trabalho e sero apresentadas algumas concluses sobre esta matria.

  • 20

  • 21

    Captulo II - Codificao de vdeo O maior problema transmisso de vdeo na Internet o tamanho do ficheiro gerado aps o registo das imagens e sons do evento que se pretende transmitir. Por exemplo, se no for feito qualquer tipo de compresso, 5 minutos de sinal de televiso com tamanho 720x576 a 25 imagens por segundo no formato 4:2:0, que necessita de 124 Mbps por segundo [28], ocupam a impressionante quantidade de 4,54 Gbytes! A transmisso deste tipo de dados pela Internet, nas condies actuais da rede, tornaria a sua implementao bastante penosa para os utilizadores. Como exemplo, o tempo de transmisso do trecho atrs referido para um cliente que utilize uma ligao ADSL a 512 Kbps, mesmo que se considerasse que todos os outros troos da rede estariam dedicados a este utilizador, seria de 20 horas! por isto que grande parte do esforo de desenvolvimento est centrado no aspecto da codificao de vdeo com o intuito de ultrapassar esta limitao. Este passo, fundamental para garantir no s um meio de entendimento entre o emissor e o receptor, mas tambm para contribuir para a eficincia da transmisso, transforma as imagens e o udio, enormes consumidoras de recursos em bruto, em trechos de informao mais compactos e mais adaptados ao canal Internet. As desvantagens so a perda de qualidade da imagem final, seja por diminuio do seu tamanho, por menor nmero de imagens por unidade de tempo ou por uma menor qualidade da mesma. A forma de compresso das imagens para posterior codificao e transmisso via Internet tem de obedecer a algumas exigncias quando comparadas com os algoritmos utilizados pela transmisso de televiso, nomeadamente uma grande escalabilidade, leveza para tratamento pelos PCs e capacidade de compensar as inevitveis perdas de pacotes e atrasos da rede. Para resolver estas situaes, temos de adaptar a transmisso s condies especficas de cada cliente. Cabe a cada um destes informar e instruir o servidor acerca dos parmetros mais importantes que lhe esto associados. A codificao tambm se deve adaptar ao facto de a transmisso ser em directo ou em diferido, dado que as duas tm diferentes caractersticas. Enquanto a primeira tem de permitir o acesso de um cliente durante a transmisso, a segunda tem de implementar as funes de fastforword, rewind, pause, etc. Finalmente temos de levar em conta a possibilidade de criar formas de codificao capazes de se adaptar aos diferentes tipos de processadores que podem receber a informao tais como PCs, PDAs, settop boxes e outros, que suportam diferentes complexidades, obrigando a codificaes escalveis. Assim, h diferentes modelos de codificao que variam entre os mais simples, em que, por exemplo, a escalabilidade se resume criao de diferentes verses cada uma optimizada para um canal especfico de transmisso, at s mais complexas em que a codificao se pode chamar de escalvel e baseada em representaes espao-temporais do sinal fonte ou na diferenciao dos degraus de quantificao.

  • 22

    Neste Captulo, iremos falar da evoluo das tcnicas de codificao de vdeo, desde o H.261 at s mais recentes evolues das normas MPEG ou dos Codecs proprietrios como o QuickTime, o Windows Media ou o Real Player.

    II.1 Codificadores Clssicos A codificao de vdeo feita a partir da anlise temporal e/ou espacial das imagens primitivas. O seu objectivo tirar proveito de algumas caractersticas do sinal vdeo que permitem subtrair informao redundante, pouco importante ou mesmo tirar partido do funcionamento do sistema de viso humana [1]. Podemos resumir estas propriedades da seguinte forma:

    ? Redundncias espaciais ou temporais : a grande maioria dos pixels de uma imagem tem um valor que no independente dos pixels vizinhos dentro da mesma imagem ou do correspondente pixel das imagens anteriores e posteriores. Por exemplo, possvel criar sistemas de predio entre imagens consecutivas por forma a que seja apenas necessrio enviar para cada uma a diferena em relao anterior, reduzindo assim a quantidade de informao a ser transportada na rede.

    ? Redundncia estatstica: A utilizao de codificao que explore o facto de que h valores mais frequentes que outros, influencia a codificao a usar. Podem-se aplicar cdigos mais curtos a estes do que aos que surgem esporadicamente tal como sucede na codificao de Huffman.

    ? Explorao do sistema visual humano[1 e 2]: A viso humana, consumidora final de todo o processo de codificao de vdeo, tem algumas particularidades que podem ser aproveitadas para reduzir a informao necessria como por exemplo:

    o Limitada resoluo espacial O ngulo de viso limitado e, consequentemente, o tamanho das imagens a apresentar ou o nvel de detalhe das mesmas pode ser adaptado pois h limites ou detalhes que o olho no detecta;

    o Nmero de imagens por segundo da viso Como o olho do ser humano no detecta variaes rpidas de imagens acima de um determinado limiar, existe um limite para a frequncia temporal das imagens a apresentar sem perda de qualidade perceptvel;

    o Noo de qualidade de imagem embora seja um critrio subjectivo e varivel para cada um de ns, existe um limite que satisfaz o receptor de uma imagem de vdeo. Na prtica, esta questo leva definio de valores mnimos da relao sinal rudo de uma transmisso de vdeo.

    o Como a nossa viso mais sensvel luminncia do que crominncia, vrias normas seguem uma estrutura em que a componente da primeira 4 vezes superior da segunda pois as amostras de luminncia so duas vezes mais na horizontal e na vertical da imagem.

    Desde os primrdios da codificao de vdeo que todos os sistemas tentam explorar as condies acima descritas para minimizar a quantidade de informao necessria a uma transmisso de vdeo eficaz.

  • 23

    Nos pontos seguintes analisamos as tcnicas fundamentais para a eliminao de redundncia em codificao de vdeo e que so a base de quase todos os sistemas actuais.

    II.1.1 Compensao de Movimento A Compensao de Movimento uma tcnica quase universal em sistemas de compresso de vdeo. Entre duas imagens consecutivas, muitos dos pixels mantm-se inalterados, ou seja, existe redundncia temporal entre as imagens consecutivas de um trecho de vdeo. Surgiu, assim, a ideia de reduzir a quantidade de informao a enviar para as imagens seguintes atravs da supresso desta informao redundante. Se, para a construo de uma nova imagem, partindo do conhecimento prvio da anterior, apenas tratarmos a informao dos pixels alterados, pode-se facilmente construir a imagem seguinte a partir de uma quantidade mais pequena de informao. Por utilizar informaes entre imagens (frames) diferentes, este mtodo pode ser classificado por Predio Interframe. Atravs de recurso a um exemplo concreto, vamos descrever o processo. O sistema codificador armazena a informao referente a uma imagem. Esta informao comparada com a imagem seguinte (Fig. II-1a):

    Fig II-1a Duas imagens consecutivas de um trecho de vdeo [29] A informao respeitante a todos os pixels que se mantiverem no ser enviada para a construo da nova imagem. Este primeiro passo j significa uma grande reduo de quantidade de informao que teria de passar pelo canal de largura de banda limitada (Fig II-1 b):

  • 24

    Fig II-1b Diferena entre as duas imagens consecutivas exibidas na fig. II-1a [29]

    A partir, apenas, do residual entre as duas imagens, para trabalhar as zonas em que os pixels no se equivalem, a imagem dividida em macroblocos, tipicamente de 16x16 [1 e 3]. A informao de cada macrobloco comparada com reas vizinhas na imagem anterior. Tenta-se encontrar a zona em que as diferenas com o macrobloco em estudo sejam menores para ser determinado um vector de movimento, ou seja, a direco e distncia percorrida pela nossa poro de imagem (Fig II-1c):

    Fig II-1c Vectores de movimento entre imagens consecutivas [29] Aps este passo, restam apenas as reas da imagem onde o processo no conseguiu determinar vectores de movimento. No caso apresentado, esta quantidade residual a seguinte (Fig. II-1 d):

  • 25

    Fig II-1d Informao residual aps o processo de Compensao de movimento [29] Para os processos seguintes, apenas enviado o conjunto dos vectores de movimento e esta informao residual. Trata-se de uma enorme reduo na quantidade de informao e um passo fundamental de todo o sistema. A reduo ser tanto maior quanto menor for o movimento da imagem. A utilizao da tcnica de Compensao de Movimento implica esforo computacional para que toda a zona vizinha possa ser pesquisada. A rea envolvida nesta procura varivel de sistema para sistema, tendo de existir um compromisso entre a capacidade de processamento dos codificadores e a qualidade que se ambiciona. A seguinte imagem (Fig II-2) mostra um exemplo para uma rea da imagem onde se faz a procura de movimento de um determinado macrobloco [27]:

  • 26

    Fig II-2 Processo de criao do vector de movimento [27]

    A implementao prtica desta ideia faz-se, ao nvel do codificador, atravs da existncia de um descodificador que constri uma imagem futura adicionando imagem prvia, guardada num buffer por exemplo, a informao relativa ao tratamento dos vectores de movimento e a compara imagem que se deveria obter. Obtm-se desta forma uma nova informao a enviar ao descodificador real que o erro de predio [1]. Um esquema de codificador com Compensao de Movimento encontra-se na seguinte figura (Fig. II-3):

  • 27

    Fig II-3 - Codificador com Compensao de Movimento

    II.1.2 Transformada Discreta de Co-seno (DCT) Outra tcnica bsica para codificao de vdeo a Transformada Discreta de Co-seno (DCT). Trata-se de um tratamento matemtico da informao relativa a uma determinada imagem do vdeo a codificar, cujo objectivo a reduo da informao por remoo da redundncia espacial da mesma. Esta transformada pretende obter a informao relativa a uma poro da imagem no domnio da frequncia para permitir um tratamento mais fcil da informao. A cada bloco de 8x8 pixels aplicada a transformada, cuja descrio matemtica mais comum a seguinte [6]:

    Cm,n = ? (m)? (n) ? i=0,7 ? j=0,7 Bi,j cos((? (2i+1)m)/16) cos ((? (2j+1)n)/16) Em que:

    ? ? (0)=?(0)=? 1/8 ? ? (m)=?(n)=? 1/4 ? m,n?1 e m.n ? 7 ? Cm,n representam os coeficientes da transformada ? Bi,j representa o pixel na linha i e coluna j do bloco de 8x8

    O resultado outro bloco de 8x8 de coeficientes. Cada um destes corresponde a uma contribuio espectral para a imagem. Por exemplo, o primeiro coeficiente diz respeito componente DC da imagem, ou seja, a sua luminosidade mdia. Esta transformada no reduz por si s a quantidade de informao. Para isso, o passo seguinte baseado na

  • 28

    anlise estatstica de imagens de vdeo, que nos diz que a aplicao da DCT a estas concentra a energia nos coeficientes de baixa frequncia [1], o que um reflexo da alta redundncia espacial que se verifica. Muitos dos 64 (8x8) coeficientes tm um valor quase nulo, podendo ser descartados. Como apenas enviamos um nmero muito inferior aos 64 originais, obtemos uma reduo significativa de dados a transmitir. Uma vantagem importante da DCT a possibilidade de facilmente se reverter o processo atravs da sua inversa, a IDCT (Inverse Discrete Cosine Transform) cuja frmula a seguinte:

    Bi,j = ? m=0,7? n=0,7 Cm,n ? (m) cos((? (2m+1)i)/16) ? (n)cos ((? (2n+1)j)/16)

    Em que:

    ? ? (0)=?(0)=? 1/8 ? ? (m)=?(n)=? 1/4 ? i,j? 0 e i,j ? 7 ? Cm,n representam os coeficientes da transformada ? Bi,j representa o pixel na linha i e coluna j do bloco de 8x8

    II.1.3 Quantificao e Codificao por VLC Para melhorar o resultado obtido aps a DCT, costuma combinar-se esta com tcnicas apropriadas para a Quantificao: os coeficientes escolhidos so quantificados, ou seja, transformados em informao digital que apenas pode ter um determinado nmero de valores, ou seja, nveis. A escolha do nmero de nveis de quantificao ser tanto maior quanto maior for a qualidade da imagem reproduzida. No entanto, deve-se dimensionar um sistema deste tipo como um compromisso entre a qualidade e a disponibilidade do canal de transmisso. A construo do bitstream final feita atravs do varrimento em Zig-zag desde o coeficiente seguinte componente DC (coeficiente 1,1 na Fig. II-4) at ao inferior direito:

    Fig. II-4 - Exemplo de Construo do bitstream por varrimento em zig-zag

    1,1 1,2 1,3 1,4 1,5 1,6

    1,2 2,2 2,3 2,4 2,5

    1,3 2,3 3,3 3,4

    1,4 2,4 3,4

    1,5 2,5

    1,6

  • 29

    O coeficiente no topo superior esquerdo corresponde componente DC, ou seja, a energia mdia ou luminncia da imagem e tratado parte. Como, aps a quantificao, muitos dos coeficientes so nulos, do-se longas cadeias de zeros. Em vez de se transmitir todos estes zeros, envia-se apenas a sua contagem, r0, antes do seguinte coeficiente no-nulo, c, atravs de pares {r0, c}, por forma a reduzir a entropia do sistema. A codificao destes pares feita com Cdigos de Comprimento Varivel (VLC). Finalmente, como este tipo de codificao gera sequncias aleatrias com taxas de bits variveis, costuma incorporar-se um buffer para que a informao a enviar ao canal de transmisso seja mais regular. Um esquema muito simplificado de um codificador clssico com as tcnicas atrs descritas o exibido na figura seguinte (Fig. II-5):

    Fig II-5 Codificador Clssico com Compensao de Movimento, DCT e Quantificao

    II.1.4 - Organizao do bitstream sada do codificador, teremos um fluxo de bits nico que inclui o vdeo e o udio e que a soma de fluxos de bits elementares. Cada um destes tem uma estrutura hierrquica composta por ordem crescente de complexidade :

    ? Bloco: a quantidade mais pequena de informao qual pode ser aplicada uma DCT e que corresponde a um conjunto de 8x8 pixels.

    ? Macro-blocos : resultantes da informao relativa compensao de movimento e quantificao de um bloco de 16x16 pixels (4 blocos).

    ? Fatias: divises dos quadros e que resultam da agregao de macro-blocos ? Quadros : so o equivalente a uma imagem. H quadros de 4 tipos:

    o I : quadros codificados apenas com a informao do prprio (intra-quadro). Por exemplo, na norma MPEG-1, em cada sequncia de 132 quadros pelo

  • 30

    menos um tem de ser deste tipo pois aqui que feito processo para acesso aleatrio.

    o P: codificados com informao dos quadros anteriores (inter-quadro) o B: codificado com informao de quadros anteriores e/ou posteriores o D: codificados unicamente com a componente DC de cada bloco

    ? Grupo de quadros : Conjunto de quadros e que permitem o acesso aleatrio a uma parte do vdeo

    ? Sequncias : conjuntos de vrios grupos de quadros e que so um trecho de vdeo independente.

    Resulta da definio de quadro tipo B, que a transmisso dos quadros pode no ser igual ordem natural dos mesmos. Por isso mesmo, o descodificador ter de interpretar as informaes que circulam associados aos fluxos e que lhes do as indicaes de localizao temporal dos mesmos. Deve referir-se que cada norma tem a sua prpria forma de implementar o bitstream e, por exemplo, pode nem sequer utilizar todos os tipos de quadros ou nem sequer ter fatias.

    II.2 Primeiras Normas de Codificao de vdeo: H.261, H.263 e MPEG-1 e MPEG-2 O desenvolvimento de qualquer tipo de tecnologia, quando h mltiplos investigadores e implementadores interessados, apenas ser eficaz se se estabelecerem regras ou normas que indiquem os caminhos a tomar em conjunto. A transmisso de vdeo e a codificao associada no foge regra e foram criadas vrias normas que acompanharam a evoluo da tecnologia. Em seguida sero apresentadas as mais importantes.

    II.2.1 H.261 Quando ainda se designava por CCITT, em 1990, a actual ITU estabeleceu uma recomendao para adaptar a transmisso de vdeo ento emergente tecnologia RDIS. A norma H.261 pertence famlia H.320 para transmisso de vdeo-telefone e vdeo-conferncia e foi definida para operar a dbitos mltiplos de 64Kbps ao que corresponde um mltiplo inteiro de canais RDIS, desde 1x64 at 30x64 (1,92 Mbps). Por isso, tambm se costuma designar o H.261 por px64. A norma combina tcnicas intraframe e interframe, por forma a eliminar as redundncias espaciais e temporais, respectivamente. Esta norma utiliza, tipicamente, os seguintes parmetros:

    ? Compensao de movimento em macroblocos 16x16, com pesquisa de movimento numa rea de at 15 pixels de distncia [2].

    ? Aplicao da DCT a blocos de 8x8 pixels. ? Quantificao dos dados combinada com um buffer para regulao da taxa de

    transmisso. ? Possibilidade de eliminar quadros de imagem em caso de congestionamento.

  • 31

    Para garantir a funcionalidade na gama mais baixa, a 64 Kbps, necessria uma grande taxa de compresso, chegando esta, por vezes, a ser de 2000:1 [4]. Com este nvel de compresso, imagens com movimentos bruscos ficam seriamente afectadas e por isso, apenas se utiliza para aplicaes mais simples como o vdeo-telefone. Por outro lado, na sua mxima capacidade (30x64 = 1,92 Mbps) a qualidade semelhante de um vdeo VHS [2]. O H.261 utiliza formatos especficos para o tamanho das imagens:

    ? Common Intermediate Format (CIF) 288x356 (linhas x colunas) [2]. ? Quarter Common Intermediate Format (QCIF) melhor adaptado para menores

    taxas de transmisso, tem um tamanho de imagem de 144x160; Para cada um destes formatos, as frequncias de varrimento possveis so 30 Hz, 15Hz, 10 Hz ou 7.5 Hz. O H.261 foi a primeira norma que se imps como um verdadeiro standard de compresso de vdeo, sendo considerada a base da tecnologia de Compresso de vdeo [5]. Foi progressivamente ultrapassada pela norma H.263 que estudaremos em seguida.

    II.2.2 H.263 Aps a bem sucedida implementao do H.261, o ITU-T tentou expandir a aplicao destas tcnicas a velocidades de transmisso mais baixas, dado o crescimento de formas de acesso com recursos limitados como os primeiros modems analgicos que operavam a velocidades inferiores a 64 Kbps, primeiro patamar do H.261. Para alcanar este objectivo foi especificada pelo ITU, em 1995, uma nova norma, denominada H.263, que se baseou nos trabalhos prvios da norma H.261. Assim, a estrutura bsica de um sistema de codificao de vdeo em H.263 muito semelhante ao do seu antecessor e tem as seguintes caractersticas gerais:

    ? Para a construo de uma imagem no so enviadas informaes sobre os pixels que se mantm da imagem anterior;

    ? Utiliza a compensao de movimento para reduzir a quantidade de informao relativa a partes da imagem que se moveram, utilizando os j descritos vectores de movimento;

    ? A busca de movimento de um macrobloco limitada a um espao de distncia em relao posio original inferior a 16 ou 31.5 pixels, consoante o modo de predio escolhido, para limitar o esforo computacional exigido [6];

    ? Permite que os vectores de movimento apontem para fora da rea da imagem, o que melhora a predio de movimentos nas fronteiras da mesma.

    ? Elimina as redundncias espaciais atravs da transformada DCT melhorada; ? A quantificao foi definida para permitir at 62 nveis de quantificao positivos e

    outros tantos negativos mais o nvel 0 que representa a componente DC [6]; Outras inovaes introduzidas foram as seguintes:

    ? Estrutura da imagem permite novos formatos [6]:

  • 32

    o Sub-QCIF o QCIF o CIF o 4CIF o 16CIF

    ? O movimento entre imagens de cada macrobloco pode ser descrito por 4 vectores de movimento em vez de um nico, o que confere maior preciso na localizao do macrobloco na nova imagem;

    ? Possibilidade de fazer a estimao do movimento em meias unidades elementares da imagem (pixels);

    ? Codificao por VLC aps a construo do bitstream quantificado; ? Permite a aplicao de codificao aritmtica, o que reduz em 5% o tamanho do

    bitstream em relao codificao por cdigos de Huffman; ? Utiliza quadros PB, ou seja blocos com predio com base na imagem anterior (P)

    intercalados com imagens com predio bidireccional (B) o que implica um duplicar da quantidade de imagens transmitidas mantendo a taxa de transmisso.

    A eficincia de codificao do H.263 superior do H.261 em cerca de 1.5 a 2 vezes [4], o que significa que o bitstream final tem, na melhor hiptese, um tamanho ligeiramente inferior a metade do que na anterior norma. Um codificador H.263 tpico o seguinte [7] (Fig. II-6):

    Fig II-6 - Codificador tpico para H.263

    Esta norma teve 2 desenvolvimentos que melhoraram as suas caractersticas e que foram denominadas H.263+ e H.263++.

  • 33

    H.263+ A norma H.263+ uma evoluo da H.263 base com 12 novos modelos opcionais [6] descritos nos anexos D, e do I ao T do documento do ITU-T. Entre eles destacam-se as seguintes novidades [6]:

    ? Implementa os denominados Reverse VLCs. Nestes, a descodificao com cdigos de comprimento varivel pode ser feita tanto na direco de leitura como na via inversa. Ou seja, se ocorrer um erro de transmisso a informao dos vectores de movimento, por exemplo, no se perde pois o descodificador pode obt- los na via inversa. Mesmo nos vectores h evoluo: agora podem apontar at uma distncia de 256 ou + 255.5 pixels.

    ? Aplica filtros na predio das imagens para proporcionar reduo de erros de reconstruo nas fronteiras dos blocos.

    ? Diviso da imagem em fatias que tm um nmero varivel de macroblocos para que partes da imagem correlacionadas possam ser tratadas como um todo.

    ? Predio de blocos a partir de informao recolhida em macroblocos vizinhos. ? Introduo de informao adicional no bitstream para mais funcionalidades de

    apresentao do vdeo; ? Possibilidade de predio da imagem seguinte a partir de outras imagens que no s

    a anterior para impedir a propagao de erros se uma imagem contiver erros; ? Possibilidade de suportar escalabilidades temporais, espaciais ou de SNR. Definido

    no anexo O, este modo especifica a sintaxe para suportar esta caracterstica fundamental para a adaptao a diferentes condies de transmisso para diferentes utilizadores como o caso da Internet. Dada a sua importncia para a transmisso de vdeo na Internet, estas tcnicas sero mais aprofundadas no ponto III.2.

    ? Modo de quantificao Modificado: permite a introduo de mtodos de controlo do tamanho do bitstream tais como a alterao do nmero de nveis de quantificao, maior preciso nos nveis de crominncia ou aumento do nmero de coeficientes da DCT.

    Cada um dos modos pode ser utilizado isoladamente ou combinado com outros, o que faz com que o H.263+ seja muito adaptvel s diferentes condies ou qualidades dos codificadores, descodificadores ou mesmo dos meios de transmisso. Para que existisse alguma standardizao, o ITU-T estabeleceu alguns nveis que no so mais que conjuntos de modos. No que diz respeito ao assunto em estudo neste trabalho, esta flexibilidade faz com que o H.263+ seja um dos primeiros mtodos de codificao e transmisso de vdeo com alguma capacidade para responder aos requisitos da transmisso na Internet. H.263++ A verso final da norma H.263 deu-se com a sua evoluo H.263++ (ou verso 3) finalizada em Julho de 2000 [5]. As suas condies esto representadas nos Anexos U, V e W e adicionam ainda mais 7 modos aos 12 j introduzidos no H.263+. As principais caractersticas adicionais so [5, 8, 9]:

    ? Possibilidade de ser identificada uma implementao especfica para a IDCT. ? Introduo de mensagens no bitstream acerca do contedo, como por exemplo,

    indicaes de direitos de autor, texto avulso, descrio do vdeo, etc..

  • 34

    ? Implementao de um sistema, denominado Enhanced Reference Picture Selection (ERPS) que permite mltiplas referncias a imagens anteriores na predio da mesma imagem. Por exemplo, na predio de uma imagem, um vector de movimento pode ser construdo com referncia a um macrobloco de uma imagem que no a referncia utilizado por outro vector da mesma imagem.

    ? Associado ao ERPS existe a possibilidade de apenas serem indicadas reas parciais das imagens anteriores para referncia na construo da seguinte de forma a reduzir a quantidade de memria necessria nos codificadores e descodificadores.

    ? Existncia de mensagens de realimentao enviadas do descodificador para o codificador para identificar imagens ou partes de imagens mal codificadas.

    ? Maior resistncia a erros atravs da partio de dados no envio do bitstream. ? Refora a resistncia a erros de propagao atravs do aperfeioamento da tcnica

    dos Reverse VLCs j explicada no H.263+.

    Em comparao ao codificador H.263 base, um codificador capaz de suportar H.263++ apresenta a seguinte configurao (Fig II-7):

    Fig II-7 Codificador tpico para H.263++ Pode-se verificar na figura a existncia de memria para vrias imagens anteriores. Podemos considerar o H.263 como a primeira norma de codificao de vdeo com objectivos de transmisso na Internet. Primeiro, porque foi desenvolvida para suportar baixas taxas de transmisso, como aquelas que maioritariamente constituam e continuam ainda a constituir a maioria dos acessos dos consumidores de vdeo na Internet. Depois,

  • 35

    porque introduziu uma srie de desenvolvimentos para melhor se comportar em situaes frequentes na rede, como por exemplo a perda de pacotes ou os erros de transmisso. E, tambm, porque incorpora conceitos bsicos de escalabilidade para poder adaptar o seu contedo s diferentes condies de cada utilizador.

    II.2.3 MPEG-1 e MPEG-2 O MPEG, desenvolvido pelo Motion Picture Experts Group, um conjunto de normas que define a codificao de imagens de udio e vdeo e a sua compresso num formato digital. Esta norma permitiu a criao de ficheiros que tinham uma melhor qualidade do que outros formatos de codificao para o mesmo grau de compresso, e tornou-se de longe o mtodo mais usado para estes fins. Ao contrrio de outros formatos como o Windows Media ou o Real Player que so proprietrios, o MPEG um cdigo aberto, permitindo contribuies de mltiplas entidades no seu desenvolvimento. A evoluo da norma ao longo dos ltimos anos tem vindo a aperfeioar as tcnicas de compresso e adaptao aos meios de transporte e tem sido dada grande importncia sua implementao em meios com baixas taxas de transmisso ou que proporcionem pouca qualidade de servio como o caso da Internet. O incio das investigaes remonta a 1988 e a primeira norma definitiva, o MPEG-1, em 1992, criou a forma de codificao que viria a ser usada nos CD-ROMs de vdeo e no MP3[2]. Permite a codificao a uma taxa de 1,5 Mbps, o que dificulta a sua utilizao na Internet pelas razes apontadas no Captulo I. A resoluo mxima da imagem aps codificao de 576 x 768 a uma frequncia de varrimento de 30 Hz. Basicamente, a codificao e compresso MPEG utiliza as tcnicas j anteriormente descritas desde a compensao de movimento at aos cdigos de comprimento varivel. Prev a utilizao de trs tipos de quadros: I, P e B. Os quadros do tipo D apenas existem quando se pretendem funes de procura rpida [2] . A norma MPEG-1 define como MPEG Stream uma sequncia de bits transmitida e que pode conter at 32 fluxos de udio e 16 de vdeo mais 2 fluxos de uso para referncias e outras aplicaes. O MPEG-1 estabelece ainda a forma como feita a sincronizao destes fluxos indicando o tipo de quadros a usar, permite o acesso aleatrio, determina o tipo de compresso e a gesto de buffers. O MPEG-2 representou uma importante evoluo em relao ao MPEG-1, muito por causa do crescimento das tecnologias de vdeo e das prprias redes de transmisso que passaram a possibilitar muitos tipos de acesso e a velocidades mais rpidas. Muitas das definies do MPEG-1 continuaram vlidas no MPEG-2. As alteraes introduzidas pretenderam suportar novas funcionalidades ou tecnologias [2]:

    ? Transmisso digital da televiso nos formatos PAL, SECAM ou NTSC ? DVD ? Aplicaes multimdia como a televiso digital de alta definio ? Taxas de transmisso at 100 Mbps ? Diferentes resolues espacio-temporais

  • 36

    Podemos fazer as seguintes comparaes entre os 2 formatos:

    ? A norma MPEG-2 no suporta os quadros tipo D, mas mantm as definies dos outros trs tipos.

    ? A norma MPEG-2 passou tambm a permitir a codificao de imagens no modo entrelaado.

    ? Evoluindo em relao ao MPEG-1, a norma MPEG-2 suporta 4 nveis: o baixa resoluo (352x240) o resoluo mdia ou Principal (720x480) o resoluo alta-144 (1440x1152) o resoluo alta (1920x1080).

    ? Alm do udio e vdeo que formavam o sinal MPEG-1, a norma MPEG-2 possibilita um nmero quase ilimitado de trechos de dados.

    Para conseguir esta evoluo utiliza-se uma diferente forma de construir as bitstreams, nomeadamente:

    ? Os macro-blocos continuam a ser conjuntos de 4 blocos no que diz respeito luminncia, mas permite 3 tipos de sub-amostragem da crominncia o que resulta em 3 tipos diferentes de macro-blocos (6, 8 ou 12 blocos);

    ? Codificao intra-quadro dos macro-blocos com cdigos diferentes e com a possibilidade de diviso da componente DC por 8,4,2 e 1 e a componente AC codificada com coeficientes de 2048 degraus de quantificao;

    ? Possibilidade de ut ilizao do modo entrelaado, em que a sequncia de bits transporta alternadamente subquadros ou linhas pares e impares, o que diminui a sensao cintilante na viso humana;

    ? Novos padres no varrimento em ziguezague dos coeficientes DCT;

    Tal como em todas as normas MPEG, apenas definido o formato do bitstream final e no a forma de codificao [28]. A sequncia binria obtida agrega vrios algoritmos de compresso adaptados a diferentes situaes mas permite que dela sejam retiradas as diferentes verses do mesmo vdeo, cada uma com diferentes nveis de qualidade. a primeira aplicao de tcnicas de compresso escalveis em que a uma camada base, capaz de apresentar uma verso do vdeo com o mnimo de qualidade, se pode adicionar outras camadas que vo melhorando a qualidade da apresentao, tal como ser descrito no Captulo III nas tcnicas de compresso adaptadas a streaming de vdeo. A norma MPEG-2 criou uma forma de permitir graus de liberdade aos utilizadores em relao quilo que se pretende obter de uma determinada sesso de streaming, com a criao dos denominados Perfis. Cada perfil define as condies necessrias ao nvel dos codificadores, descodificadores e algoritmos de compresso para uma sesso em MPEG-2 de acordo com os objectivos. Assim, se se pretender, por exemplo fazer apenas uma simples sesso de videoconferncia com qualidade reduzida, no necessrio implementar toda a complexidade necessria para um streaming de udio e vdeo para difuso de televiso digital e assim, abrimos a possibilidade de acesso a sesses com qualidade limitada de utilizadores com poucos recursos. Os perfis definidos pelo MPEG-2 so [2]:

  • 37

    ? Perfil Simples: indicado a aplicaes que exijam pequenos tempos de atraso. No so utilizados os quadros do tipo B e assim no exige reordenao das imagens e utiliza bitstreams mais leves. Apenas permite o nvel principal;

    ? Perfil Principal: Utiliza os quadros do tipo B, aumentando a qualidade mas exigindo boa capacidade de transmisso para evitar os atrasos. Utiliza os 4 nveis e permite dbitos desde 4 Mbps at 80 Mbps;

    ? Perfil Escalonvel em SNR : Suporta ajustes para diferentes SNR e quantificao de coeficientes DCT para permitir fornecimento de servio em diferentes situaes. Estamos perante um perfil escalvel, com camada base que pode comear em 3 Mbps.

    ? Perfil Escalonvel Espacial: Suporta ajustes para diferentes resolues espaciais. Utiliza somente o nvel alto 1440 e uma taxa de 60 Mbps. A camada base por si s requer 15 Mbps;

    ? Perfil Elevado : Representa o topo de qualidade do MPEG-2, exigindo a amostragem de vdeo mais qualitativa. Se for utilizado o nvel alto produz uma bitstream a 25 Mbs.

    Os codecs que funcionam para os perfis mais exigentes tm de possuir a capacidade de interpretar as bitstreams dos perfis mais baixos. Um esquema simplificado de um codificador para MPEG-2 poderia ser o seguinte (Fig II-8):

    Fig II-8 - Codificador tpico para MPEG-2 Embora o objectivo do MPEG-2 fosse aumentar os dbitos binrios do vdeo codificado, as caractersticas atrs referidas permitiram tambm a implementao desta tcnica ligada a utilizao na Internet, principalmente porque introduz caractersticas de escalabilidade, embora no muito sofisticadas, relacionadas com a qualidade de servio. Contudo, estamos

  • 38

    a lidar com dbitos binrios muito altos para a esmagadora maioria das ligaes utilizadas mesmo no caso de empresas. Para tentar expandir a tcnica de compresso a utilizadores mais limitados, o MPEG Group voltou a reunir esforos para desenvolver uma norma que possibilitasse o streaming de vdeo em dbitos mais baixos, com o objectivo de o adaptar Internet.

  • 39

    II.3 - MPEG-4 O MPEG-4 um standard desde 1999 que surgiu na sequncia dos desenvolvimentos da norma MPEG com o objectivo de ultrapassar as limitaes dos formatos anteriores, nomeadamente o MPEG-1 e MPEG-2, que estavam orientados codificao por pixel/imagem e que tinham atingido o limite de desenvolvimento. Para responder progresso das redes mveis e necessidade de expandir as tcnicas de compresso de vdeo a meios com baixas taxas de transmisso de dados foram desenvolvidas vrias investigaes que resultaram no MPEG-4. O MPEG-4 foi o responsvel por um importante avano na rea da compresso de vdeo e contribuiu para a convergncia entre tecnologias tais como a televiso e a informtica. Os principais objectivos desta norma eram [26]:

    ? Ser facilmente adaptada aos protocolos de rede dos operadores. ? Permitir o acesso tecnologia de utilizadores ligados a baixas taxas de transmisso. ? Permitir uma maior interactividade e servios mais completos aos receptores da

    informao. ? Proteger de forma mais eficaz os direitos de autor dos produtores.

    Para alm de alcanar estes objectivos, o resultado deste desenvolvimento foi a abertura de novas possibilidades para pesquisa e acesso a bases de dados, mais fcil edio e manipulao dos contedos, melhor acesso aleatrio, maior eficincia na compresso e maior escalabilidade no tipo de ligao efectuada o que lhe permite ser transparente ao tipo de rede que a suporta. As diferenas principais em relao aos seus antecessores so:

    ? No MPEG-1 e 2, as codificaes de udio e vdeo eram consideradas ao nvel do transporte como uma nica entidade, ou seja, tinham ambas o mesmo endereamento IP e a separao s podia ser feita pelo descodificador. No MPEG-4, so enviadas em diferentes portos IP, o que permite por exemplo que um receptor possa optar por apenas receber a componente visual de um ficheiro, melhorando a rapidez na transmisso [22].

    ? Com o MPEG 1 e 2, a representao da imagem feita com base na informao da imagem considerada como um todo. No MPEG-4 podem ser diferenciados os vrios elementos da cena (pessoas, objectos, etc.) quer no espao quer no tempo. Ora isto permite tratar cada um dos componentes desta imagem e, se assim for autorizado, possibilitar ao receptor obter diferentes verses da imagem transmitida quer por alterao dos parmetros de visualizao (mudar o ngulo de viso por exemplo) quer atravs da manipulao destes objectos (mudar o local de objectos, retirar outros, etc.).

    O Forum MPEG definiu para o desenvolvimento do MPEG-4 uma estrutura em partes, cada uma com reas concretas de actuao embora sujeitas a regras comuns:

  • 40

    1 Sistemas 2 Visual 3 udio 4 Teste de Conferncia 5 Software de Referncia 6 Adaptao camada de transporte - DMIF (Delivery Multimedia

    Integration Framework) 7 Software Optimizado para ferramentas MPEG-4 (codificadores) 8 MPEG4 em IP 9 Descrio de Hardware Referncia 10 Norma AVC (Advanced Video Coding )

    II.3.1 - Modo de Funcionamento O MPEG-4 estabeleceu uma ruptura com os seus antecessores na forma de tratamento de uma imagem pois a codificao de um vdeo resulta da representao individual dos elementos presentes. Esses elementos podem ser objectos fsicos, como por exemplo moblias, paredes e pessoas ou elementos de udio que faam parte da cena captada. Podem ainda surgir elementos introduzidos artificialmente como caracteres inseridos para comentrios, legendas, grficos, etc. Cada um destes elementos, denominado Media Object (no MPEG-4 Visual denominado Video Object VO) tratado individualmente sendo- lhe referenciadas condies temporais e espaciais que permitiro ao descodificador reconstruir a imagem [26]. A norma permite a associao de media objects de forma hierrquica para criar objectos compostos que so posteriormente multiplexados e sincronizados para transmisso sobre um canal que fornea os requisitos de QoS apropriados. Um exemplo de objecto composto o conjunto formado por dois objectos primitivos: um ser humano e a sua voz (Fig II-9).

  • 41

    Fig II-9 - Decomposio da imagem em Video Objects (VOs) [26] A representao codificada de um media object feita por um conjunto de dados elementares que possuem informaes teis para o descodificador reconstituir a imagem, como por exemplo, as coordenadas da sua posio original na cena. A coordenao destas sequncias de bits feita atravs do object descriptor, que indica os trechos que constituem o objecto representado e tambm as necessidades de Qualidade de Servio para a sua transmisso. A sincronizao dos trechos feita pela chamada camada de sincronizao, guiando-se atravs de marcas temporais associados a entidades de acesso de cada uma, como por exemplo os quadros de vdeo. Em conjunto com a camada de sincronizao, o MPEG-4 define a camada de transporte para estabelecer as regras de transporte dos trechos. Esta camada constituda por duas subcamadas multiplexadas, uma das quais define o agrupamento dos trechos elementares e para a qual foi dedicada a parte 6 do MPEG-