Issuu on Google+

Cadernos CPqD Tecnologia Vol. 5 • n. 2 • julho/dezembro 2009


Cadernos CPqD Tecnologia Editores-Chefes Claudio A. Violato João Marcos Travassos Romano Editores Executivos Aldionso Marques Machado Antonio Carlos Gravato Bordeaux Rego Claudio de Almeida Loural Cleida A. Queiroz Cunha

Comitê Editorial (Fórum de P&D do CPqD) João Marcos Travassos Romano (Universidade Estadual de Campinas – Unicamp) Cláudia Maria Bauzer Medeiros (Sociedade Brasileira de Computação – SBC) Hugo Luís Fragnito (Universidade Estadual de Campinas – Unicamp) Hypolito José Kalinowski (Sociedade Brasileira de Microondas e Optoeletrônica – SBMO) José Augusto Suruagy Monteiro (Sociedade Brasileira de Computação – SBC) Rege Romeu Scarabucci (Representante do Conselho Curador do CPqD) Rui Seara (Sociedade Brasileira de Telecomunicações – SBrT) Weiler Alves Finamore (Sociedade Brasileira de Telecomunicações – SBrT)

Assistentes Editoriais Adriana Maria Antonietta Bevilacqua Maria Fernanda Simonetti Ribeiro de Castilhos Preparação de Originais e Revisão Elisabete da Fonseca Juliana Cristina Fernandes Pereira Márcia Inêz de Oliveira Andrade Bozzi Maria Paula Gonzaga Duarte Rocha Sergio Ricardo Mazzolani Thaís Ribeiro Bueno Projeto Gráfico, Capa e Diagramação Gerência do Conhecimento – GECON Tiragem 1.000 exemplares Correspondência e Pedidos de Assinatura Assessoria de Comunicação e Inteligência de Mercado – ACIM Rodovia Campinas-Mogi-Mirim, km 118,5 CEP 13086-902 – Campinas, SP – Brasil DDG: 0800.7022773 e-mail: marketing@cpqd.com.br Diretoria do CPqD Presidente: Hélio Marcos M. Graciosa Vice-Presidente de Tecnologia: Claudio A. Violato Vice-Presidente Comercial: Luiz Del Fiorentino Vice-Presidente Financeiro: Cesar Cardoso

Cadernos CPqD Tecnologia. Fundação CPqD – Centro de Pesquisa e Desenvolvimento em Telecomunicações. Campinas, SP, v. 1, n. 1 (jan./dez. 2005 -) v.il.; 30 cm. v.5, n.2, jul./dez. 2009 Semestral Resumos em português e inglês ISSN 1809-1946 1. Tecnologia. 2. Telecomunicações. I. Fundação CPqD CDD 621.38 A revista Cadernos CPqD Tecnologia é uma publicação da Fundação CPqD – Centro de Pesquisa e Desenvolvimento em Telecomunicações, dedicada à divulgação das pesquisas desenvolvidas pela instituição. A revista é distribuída gratuitamente. Esta revista foi impressa pela gráfica Citygráfica Artes Gráficas e Editora Ltda. com miolo de papel Reciclado 90g/m2 e capa em papel Reciclado 240g/m2 para o CPqD em março de 2010.


ISSN 1809-1946

Cadernos CPqD Tecnologia Vol. 5, n. 2, julho/dezembro 2009

Apresentação Claudio A. Violato...............................................................................................................................3 Prefácio João Marcos Travassos Romano...................................................................................................... 5 TV móvel: a convergência da radiodifusão com a telecomunicação Daniel Moutinho Pataca, José Orfeu Carvalho Antonini, Marcus Aurélio Ribeiro Manhães, Sidney Longo.......................................................................................................................................7 Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais Ismael Mattos Andrade Ávila, Rosely Gomes Costa..........................................................................15 Equalização e identificação adaptativas de canais utilizando marca d’água Mário Uliani Neto, Leandro de Campos Teixeira Gomes, João Marcos Travassos Romano...............37 Descoberta automática da topologia física de redes Ethernet com switches heterogêneos e de múltiplos fabricantes Marcos Rogério Salvador, Vinícius Garcia de Oliveira, Giovanni Curiel dos Santos............................57 Análise do potencial de TV interativa no Brasil Esther Menezes, Alexandre Freire da Silva Osorio, José Orfeu Carvalho Antonini, Daniel Moutinho Pataca.............................................................................................................................................65 Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante Gustavo Bittencourt Figueiredo, Nelson Luís Saldanha da Fonseca, César Augusto Viana Melo, Marcos Rogério Salvador.................................................................................................................83 Propriedade intelectual do CPqD.......................................................................................................93

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 1-104, jul./dez. 2009


Apresentação É com prazer que apresentamos mais uma edição dos Cadernos CPqD Tecnologia. Tendo como objetivo ser um veículo de difusão do conhecimento tecnológico, os Cadernos publicam artigos relacionados com os projetos de P&D conduzidos pelo CPqD nos diferentes campos do conhecimento que constituem a dinâmica área das Tecnologias da Informação e Comunicação (TICs). Os resultados dos projetos do CPqD também têm sido divulgados e reconhecidos em eventos técnico-científicos. Entre as menções de destaque nos últimos meses, relacionamos: •

A 1a Conferência Sul-Americana de Design de Interação escolheu o artigo elaborado por pesquisadores do CPqD como o melhor trabalho apresentado. O artigo traz os resultados da avaliação de um protótipo para inclusão digital usando o método de avaliação de recuperabilidade. A conferência foi promovida pela Associação de Design de Interação na América do Sul, em parceria com a Universidade Anhembi Morumbi.

A Latin American Conference on Human-Computer Interaction premiou o artigo produzido em conjunto pelo CPqD e pela Universidade de São Paulo (USP) sobre técnica de avaliação de interfaces desenvolvidas no âmbito do projeto Soluções de Telecomunicações para Inclusão Digital (STID).

O XX Seminário Nacional de Produção e Transmissão de Energia Elétrica (SNPTEE) premiou, como um dos melhores trabalhos técnicos, o projeto de desenvolvimento de um sistema de comunicação em banda larga sem fio para apoio às equipes de campo, desenvolvido pelo CPqD e utilizado por Furnas Centrais Elétricas S.A. O evento foi promovido pelo Comitê Nacional Brasileiro de Produção e Transmissão de Energia Elétrica (Cigré-Brasil).

Desejamos ao leitor um bom proveito dos conhecimentos que aqui compartilhamos.

Claudio A. Violato Vice-Presidente de Tecnologia

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 3, jul./dez. 2009


Prefácio Apresentam-se, neste nono número da revista Cadernos CPqD Tecnologia, seis novos artigos envolvendo trabalhos recentes nas mais diversas áreas de atuação em pesquisa e desenvolvimento do CPqD. O primeiro artigo, de Pataca e colaboradores, discute o panorama mundial do serviço de TV móvel, descreve suas características típicas e conceitua modelos de exploração, de serviços e de negócios. Apresenta alternativas de exploração, focando as ações de operadoras de telecomunicações e radiodifusores. No segundo artigo, Ávila e Costa investigam como ícones interagem com as habilidades leitoras de usuários semialfabetizados. O estudo trata do emprego de ícones como apoio à compreensão de ideias e informações mediadas pela interface computacional, proporcionando proficiência no uso de computadores para o acesso eficaz a conteúdos digitais, tais como os disponíveis hoje na Internet. No terceiro artigo, Uliani Neto, Gomes e Romano investigam o uso de uma marca d'água digital como sinal de referência aplicado aos problemas de equalização e identificação de canais de transmissão. Aplicam técnicas de filtragem para estimar e rastrear as características do canal ao longo do tempo, propõem o uso de modelo psicoacústico e algoritmo de conformação espectral para demonstrar a viabilidade do método quando aplicado a sinais de áudio. O quarto artigo, de Salvador, Oliveira e Santos, descreve um algoritmo capaz de determinar automaticamente a topologia física de uma rede Ethernet composta de switches heterogêneos. O algoritmo calcula a topologia física da rede e a mantém atualizada mesmo no evento de alterações. Esse conhecimento se aplica a redes corporativas, metropolitanas e de núcleo, facilitando as ações de operação, administração e manutenção. No quinto artigo, Menezes e colaboradores analisam o potencial dos serviços de TV interativa no Brasil, focando populações com dificuldade de acesso a computadores e à Internet. Para tanto, conceituam os serviços de TV interativa e descrevem as plataformas de rede. Os resultados dos estudos são subsídios à concepção de serviços de TV interativa e à definição de modelos de negócios que viabilizem esses serviços no contexto brasileiro. No sexto e último artigo, Figueiredo e colaboradores investigam, em redes de comutação óptica, o impacto das rajadas de pacotes nas características do tráfego que entra na rede e analisam a suspeita de que o processo de montagem de rajadas possa suavizar a explosividade do tráfego na Internet. A partir de análises das políticas de tráfego, os autores propõem políticas de montagem de rajadas para diminuir a demanda de recursos da rede. Tem sido consensual, entre os colegas do Fórum de P&D do CPqD, a observação sobre a crescente qualidade dos trabalhos submetidos a nossa revista. Cabe destacar também sua regularidade, aspecto essencial e particularmente difícil de se atingir numa revista, pois não são poucas as iniciativas de vida curta. A revista Cadernos CPqD Tecnologia mostra assim que veio para ocupar um lugar definitivo na literatura técnica brasileira. Seu êxito se deve, sobretudo, a cada um dos autores, e também ao cuidadoso trabalho do Fórum, dos colegas do CPqD envolvidos em sua elaboração e ao leitor – autor em potencial – que nos prestigia.

João Marcos Travassos Romano Presidente do Fórum de P&D do CPqD

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 5, jul./dez. 2009


TV móvel: a convergência da radiodifusão com a telecomunicação Daniel Moutinho Pataca, José Orfeu Carvalho Antonini, Marcus Aurélio Ribeiro Manhães, Sidney Longo* Resumo Este artigo aborda aspectos importantes para a implantação do serviço de TV móvel, descrevendo as principais formas de entrega de vídeo com mobilidade e suas características típicas, bem como conceituando modelos de exploração, de serviços e de negócios. São apresentadas possíveis alternativas de exploração, considerando-se as ações de operadoras de telecomunicações e radiodifusores. Apresentam-se também os principais padrões tecnológicos que estão sendo empregados mundialmente para a disponibilização do serviço, bem como informações relativas à implantação do serviço nas principais regiões do mundo, formando um quadro do panorama mundial. Finalmente, apresenta-se uma conclusão sobre as questões abordadas. Palavras-chave: TV móvel. Broadcast. Vídeo móvel. Multicast. Unicast. Introdução Atualmente os usuários das operadoras de serviços móveis demandam serviços avançados de vídeo, áudio e dados, além do tradicional serviço de voz. Esses usuários baixam e exibem músicas e vídeos, realizam conferências com os amigos, enviam mensagens de texto e trocam imagens, vídeos e áudio. O atual modo de vida influencia e altera a forma tradicional de se assistir à televisão – os telespectadores despendem cada vez menos tempo em frente ao televisor e por isso demandam um dispositivo convergente que possibilite o acesso a vídeo, áudio e dados, em qualquer local e a qualquer momento, como um dispositivo portátil e móvel similar aos celulares. Diante da realidade atual é importante analisar os principais aspectos que impactam a oferta de um serviço de TV móvel. Neste artigo descrevem-se aspectos como: formas de entrega de vídeo, características, modelos de exploração e os principais padrões tecnológicos. Além disso, este artigo também apresenta um panorama mundial, em que são mostradas as principais experiências em curso em diferentes países. 1

Modelos de exploração

As formas de uso, ou modelos de exploração, da TV móvel são constituídas pelos modelos de serviços e de negócios, que são sustentados pelos sistemas tecnológicos (MARTINS et al., 2006). Entende-se como modelo de serviços o leque de aplicações e serviços que são disponibilizados por um sistema de TV móvel. Os serviços envolvem um conjunto de meios, recursos tecnológicos, funcionalidades e procedimentos

que habilitam seu provimento. Muitos recursos e tecnologias habilitadoras são comuns a vários serviços, tais como: a taxa de transmissão de sinais digitais, o canal de retorno, o padrão de transmissão, a tecnologia de compressão etc. As aplicações são entendidas como a configuração desses meios e recursos de serviços que, efetivamente, permitem prover valor para os usuários. As aplicações são, portanto, suportadas pelos serviços e dependem das tecnologias habilitadoras, especialmente as comprometidas com o perfil de demanda dos usuários, de toda a infraestrutura de serviços subjacentes e da estratégia e capacidade de atendimento dos provedores do serviço. O modelo de negócios diz respeito à forma de remuneração dos agentes envolvidos num dado modelo de serviços. Naturalmente, o modelo de negócios está associado ao interesse de consumo e à sensibilidade ao preço apresentada pelos usuários. Já pelo lado da oferta, o modelo depende de estratégias, alianças e capacidade de atendimento de todos os agentes que participam do processo de agregação de valor. 1.1 Modelos de serviços A demanda e o consumo dos novos serviços em multimídia são diferenciados pelas circunstâncias em que serão utilizados. Tornam-se relevantes o ambiente (se dentro ou fora de edifícios) e a mobilidade (em veículos rápidos, lentos, ou parados), além de outras variáveis, tais como: personalização, imediatismo, convergência de plataformas e de mídias. Quando comparado com o modelo de serviços da TV analógica aberta por radiodifusão, o serviço de TV móvel apresenta melhor qualidade de recepção, possibilitando o consumo de

*Autor a quem a correspondência deve ser dirigida: sidney@cpqd.com.br. Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 7-14, jul./dez. 2009


TV móvel: a convergência da radiodifusão com a telecomunicação

conteúdo de vídeo em dispositivos com antenas de pequenas dimensões, dentro ou fora de edifícios, em movimento e com imagem sem ruído e fantasmas. Além disso, a TV móvel oferece o acesso à programação de TV ao vivo ou sob demanda, em qualquer lugar e a qualquer momento, permitindo a personalização do consumo e a convergência com os serviços de voz, dados, mensagens etc. Para atender a tais requisitos são considerados a seguir dois modelos de serviços para a entrega de conteúdo de vídeo com mobilidade. 1.1.1

Vídeo móvel

O serviço de vídeo móvel caracteriza-se principalmente pela oferta de vídeos de curta duração e sob demanda, bem como pela transmissão unicast sobre a rede das operadoras celulares, e sua remuneração se faz tipicamente por evento. Na transmissão unicast, também denominada ponto a ponto, caracteriza-se a comunicação entre fonte e destinatários únicos, ou seja, o número de canais de comunicação estabelecidos entre a fonte e os destinos é igual ao número de destinos. A Figura 1 apresenta um diagrama esquemático da transmissão unicast através de uma rede celular. Na figura, pode-se notar que o consumo de banda para transmissão de conteúdo de vídeo é igual à soma da banda consumida simultaneamente por cada um dos usuários do serviço.

Figura 1 Transmissão unicast

Através de unicast stream, com envio do conteúdo de vídeo em tempo real e ponto a ponto, há a necessidade de enviar um fluxo de vídeo para cada usuário individualmente. Numa fase inicial, em que ocorre uma pequena adesão ao serviço, é possível utilizar a infraestrutura da rede celular 3G (EVDO, UMTS). Entretanto, com a massificação do serviço, ocorrerão impactos negativos na qualidade dos serviços tradicionais, que são prestados sob a mesma estrutura, pois haverá compartilhamento de recursos escassos, como, por exemplo, o espectro de

8

radiofrequência. Com tais limites impostos, a tendência é que ocorra uma distribuição de vídeos com baixa qualidade, de curta duração e menor taxa de transmissão. Todavia, para obter a maximização da disponibilização do serviço, implementa-se uma variação dessa configuração, denominada unicast download, que é caracterizada pelo envio do conteúdo de vídeo ponto a ponto, sem ser em tempo real, como no caso anterior. O conteúdo é carregado (baixado) primeiramente no dispositivo receptor para futura exibição. Esse modo diferente de transmissão do conteúdo permite a utilização da infraestrutura da rede celular 3G, tal como no unicast stream. Contudo, ele apresenta um melhor gerenciamento de banda, pois o conteúdo somente é enviado quando os recursos de rede necessários estão disponíveis. Essa alternativa não permite a visualização imediata do vídeo, pois o usuário precisará esperar o término do carregamento completo do conteúdo. 1.1.2

TV móvel

O serviço de TV móvel caracteriza-se principalmente pela oferta de vídeos de média duração, através de uma grade de programação, utilizando transmissão multicast/broadcast sobre a rede de radiodifusores ou operadoras celulares 3G, e sua remuneração se faz tipicamente por publicidade, pacotes de assinatura mensal ou ambas. As tecnologias de rede e os tipos de transmissão dos conteúdos a serem empregados na disponibilização desses serviços são peças-chave na elaboração dos modelos de exploração. Na transmissão broadcast, ou ponto-multiponto, a comunicação entre fonte e destinos dos programas terá o número de canais igual ao número de programas transmitidos simultaneamente. Na transmissão multicast, de fonte única para diversos destinatários, o programa é enviado por um único canal simultaneamente para todos os usuários, que de alguma forma se cadastraram em um grupo específico para receber o programa (usuários com interesse comum). A Figura 2 apresenta um diagrama esquemático da transmissão broadcast/multicast, através de uma rede celular. Nessa configuração, a transmissão broadcast/multicast, que é realizada dentro da célula, pode utilizar a mesma faixa de frequência da transmissão de telefonia móvel celular ou uma outra. Nessa forma de transmissão, a largura de banda utilizada na rede será igual à soma da banda necessária para a transmissão de todos os conteúdos disponibilizados simultaneamente. Uma das principais características dessa forma de transmissão é o envio do conteúdo de vídeo em tempo real e ponto-multiponto – o conteúdo é

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 7-14, jul./dez. 2009


TV móvel: a convergência da radiodifusão com a telecomunicação

enviado simultaneamente para diversos usuários. É possível, tal como na forma unicast stream, a utilização da infraestrutura da rede celular 3G, mas sem a necessidade de enviar um fluxo de vídeo para cada usuário individualmente.

Figura 2 Transmissão multicast/broadcast

Uma vantagem dessa configuração é a disponibilização de vídeos com menor comprometimento na qualidade dos serviços tradicionais. Porém, tal estratégia implica a diminuição da capacidade de oferta dos outros serviços, pela necessidade de reservar banda para a transmissão dos vídeos, quando se utiliza o mesmo canal de frequência. Uma variação possível dessa configuração é a disponibilização de uma rede broadcast exclusiva para o serviço de TV móvel, transmitindo em uma frequência diferente da utilizada pela rede do serviço de telefonia celular. Nessa configuração não há impacto nos serviços tradicionais, pois não se compartilha a mesma infraestrutura de rede. Com a adoção de uma rede dedicada, possibilita-se maior disponibilidade de programas e melhor qualidade. A rede de telefonia da operadora celular pode ser utilizada para serviços complementares, como, por exemplo, a efetivação do canal de retorno da programação de TV móvel, ou para serviços de entrega de vídeo on-demand, neste caso, em unicast stream. Essa alternativa apresenta o menor custo de transmissão por Mbit por usuário. Contudo, sua grande desvantagem é a necessidade de investimento na construção de uma nova rede dedicada, além da obtenção de uma nova alocação no espectro de radiofrequências. As várias tecnologias comerciais disponíveis para a implantação dessas redes dedicadas serão apresentadas na Seção 2. 1.2 Modelos de negócios Dois pontos importantes a serem avaliados para a exploração de serviços de entrega de vídeo

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 7-14, jul./dez. 2009

com mobilidade são: • forma de transmissão: unicast x broadcast; • faturamento dos serviços. Propõem-se análises preliminares dos pontos citados, a fim de suscitar o entendimento básico das principais variáveis envolvidas no processo. O player interessado na prestação do serviço deve empreender análises mais elaboradas em função de seus objetivos de negócio, de seus custos, da infraestrutura tecnológica e dos serviços existentes, além dos investimentos previstos. A Figura 3 apresenta uma comparação entre a alocação de espectro necessária para as transmissões unicast e broadcast, que implica custo, em função do número de usuários do serviço de vídeo (SOLOMON, 2007). Na figura, pode-se observar que existe um número de usuários a partir do qual a transmissão broadcast torna-se mais barata do que a transmissão unicast. Capacidade do espectro

Unicast

Ponto em que broadcast fica mais barato que unicast

Aumento linear teórico da capacidade do espectro

Broadcast

O aumento da capacidade do espectro deve ser anterior ao aumento do número de usuários Usuários

Figura 3 Capacidade do espectro x número de usuários

Na transmissão broadcast a alocação de espectro se mantém constante em função do crescimento do número de usuários, enquanto na transmissão unicast a alocação de espectro necessário aumenta em função do crescimento do número de usuários. No unicast a capacidade cresce em saltos, ou degraus, à medida que se obtém mais espectro, com uma maior disponibilização de banda. A Figura 4 apresenta o faturamento obtido por Mbit, para os diferentes serviços oferecidos por uma operadora celular (SOLOMON, 2007). Considerando-se uma operadora hipotética, na figura nota-se que a rentabilidade dos serviços de mensagens SMS e MMS é muito maior do que a dos serviços de voz e vídeo. Isso pode ser explicado pelo fato de que a oferta dos serviços de voz e vídeo compete com outras formas de entrega, tais como: telefonia fixa, voz sobre IP, locação de vídeos, TV por assinatura e Internet. Alguns cenários para modelos de negócios

9


TV móvel: a convergência da radiodifusão com a telecomunicação

Figura 4 Faturamento por Mbit para diferentes serviços

podem ser constituídos em função das características relevantes e da sinergia entre os principais agentes envolvidos na exploração dos serviços, conforme ilustrado na Figura 5. Esses cenários variam, conforme o envolvimento da operadora celular e do radiodifusor, de um modelo liderado pela operadora celular até um modelo liderado pelo radiodifusor.

Figura 5 Cenários de modelos de negócios do serviço de TV móvel

A seguir, detalha-se cada um dos cenários. 1.2.1

Exclusivo da operadora celular

Neste cenário, a operadora celular exerce o papel de provedora do serviço e possui ou contrata as redes de transmissão broadcast e celular. Ela compra conteúdos ou compartilha receitas com produtores independentes ou radiodifusores e é remunerada pelas agências publicitárias pela transmissão de conteúdo publicitário. A principal fonte de receita neste modelo é a cobrança dos usuários, de assinatura mensal ou por evento, pelo consumo dos conteúdos. A interação dos usuários com relação a contratação, pagamento e manutenção do serviço ocorre com a operadora celular, que mantém o relacionamento e a base de dados dos clientes. 1.2.2

Liderado pela operadora celular

Neste cenário, a operadora celular exerce o papel de provedora do serviço e possui ou contrata as redes de transmissão broadcast e

10

celular. Ela compra o conteúdo ou compartilha receitas com produtores independentes e transmite o conteúdo produzido pelos radiodifusores. A operadora é remunerada por agências publicitárias pela transmissão de conteúdo publicitário e, principalmente, pelos usuários, na forma de assinaturas mensais ou por evento, pelo consumo de conteúdos. Neste cenário, a operadora celular possui controle parcial sobre como, quando e o que vai ser transmitido para os seus clientes. A interação dos usuários com relação a contratação, pagamento e manutenção do serviço ocorre com a operadora celular, que mantém o relacionamento e a base de dados dos clientes. 1.2.3

Complementar

Neste cenário, são exploradas as principais potencialidades da operadora celular e do radiodifusor. A operadora celular compartilha com o radiodifusor o papel de provedor de serviço ao utilizar a rede celular e compartilhar com o radiodifusor a rede de transmissão broadcast. Ela compra conteúdos ou compartilha receitas com produtores independentes ou radiodifusores, transmite conteúdo publicitário através de remuneração por agências publicitárias e recebe dos usuários assinaturas mensais e pagamento por evento, pelo consumo dos conteúdos e pelo uso da rede celular como canal de retorno do conteúdo dos radiodifusores. Neste cenário, a operadora celular possui controle parcial sobre como, quando e o que vai ser transmitido para os seus clientes. A operadora celular e o radiodifusor compartilham recursos e receitas utilizando os seus recursos do modo mais eficiente. A interação dos usuários com relação a contratação, pagamento e manutenção do serviço ocorre com a operadora celular, que mantém o relacionamento e a base de dados dos clientes. 1.2.4

Liderado pelo radiodifusor

Neste cenário, o radiodifusor exerce o papel principal. O radiodifusor é detentor ou contrata a rede de transmissão broadcast, produz ou compra conteúdo de produtores independentes e é remunerado pela transmissão de conteúdo publicitário. A operadora celular é remunerada pelos usuários pelo uso da rede celular como canal de retorno do conteúdo dos radiodifusores. Neste cenário, os radiodifusores possuem o controle total sobre como, quando e o que vai ser transmitido para os seus usuários.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 7-14, jul./dez. 2009


TV móvel: a convergência da radiodifusão com a telecomunicação

2

Sistemas tecnológicos

São apresentados a seguir os principais padrões tecnológicos utilizados mundialmente para a disponibilização do serviço de TV móvel. Existem padrões de transmissão sustentados em plataformas terrestres, satélite e rede celular. De forma geral, os padrões tecnológicos objetivam características que estabeleçam: • uso eficiente do espectro; • transmissão robusta; • uso em ambientes internos e externos a prédios; • uso em movimento; • rede densa (Single Frequency Network – SFN); • baixo consumo de energia nos terminais; • terminais convergentes móveis e portáteis; • antenas integradas e eficientes; • uso de baterias; • operação em duas faixas de frequência. Para implementar a distribuição de vídeo com mobilidade, deve-se estabelecer algumas exigências que se refletem especialmente nas características dos terminais e na taxa de dados exigida. Os terminais podem ser classificados em duas categorias: 1. Os móveis portáteis, que são caracterizados principalmente pelo uso individual em qualquer local, pelas telas de pequenas dimensões, pela alimentação por baterias ou pilhas e pelas antenas de pequenas dimensões. 2. Os móveis, que se caracterizam principalmente pelo uso individual ou coletivo em casas e veículos, pelas telas de dimensões maiores, pela alimentação na rede elétrica ou grandes baterias e pelas antenas com ganho maior do que a dos portáteis. As taxas de dados típicas exigidas para a transmissão de vídeo, apresentadas na Tabela 1, são destinadas para terminais móveis/portáteis, considerando-se a resolução da imagem, o número de quadros por segundo e a taxa de compressão utilizada. Tabela 1 Taxa de dados para transmissão de vídeo Número de pixels Largura

Taxa de dados (kbit/s)

Altura

15fps-taxa comp.71,3

VGA

640

480

1551

CIF

352

288

512

QVGA

320

240

388

QCIF

176

144

128

2.1 Sistemas terrestres A

seguir,

descrevem-se

os

padrões

mais

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 7-14, jul./dez. 2009

adotados em plataformas terrestres, para a transmissão broadcast em redes independentes da rede celular (PATACA; LONGO; DALL'ANTONIA, 2005). Digital Multimedia Broadcasting – Terrestrial (DMB-T) Em 2005 teve início, na Coreia, a transmissão de TV móvel utilizando o padrão DMB-T. Este padrão foi baseado no projeto Eureka 147, conhecido como Digital Audio Broadcast (DAB), que é utilizado largamente no Reino Unido e em outros países europeus para a transmissão de rádio digital. Utiliza modulação Coded Orthogonal Frequency Division Multiplexing (COFDM) e cada programação ocupa largura de banda aproximada de 1,5 MHz com 1.536 portadoras. Digital Video Broadcasting – Handheld (DVBH) O padrão DVB-H foi desenvolvido com base no padrão DVB-T, padrão de transmissão terrestre utilizado na Europa, com a premissa de baixo consumo de energia. A variável DVB-H é facilmente implementada em redes DVB-T, pois as redes DVB-T e DVB-H compartilham parte da mesma infraestrutura. Este padrão também utiliza modulação COFDM. A faixa de frequência definida, a ser utilizada na Europa, coincide com os canais de UHF na faixa entre 470 e 862 MHz. Nos Estados Unidos há uma alocação entre 1.670 e 1.675 MHz e outra possibilidade a partir de 700 MHz. O sistema admite canais com largura de 5, 6, 7 e 8 MHz. Foi definido como padrão para a TV móvel na União Europeia. Forward Link Only (FLO) A tecnologia FLO foi desenvolvida pela Qualcomm, especificamente para transmitir serviços em multimídia para celulares. Não é derivada de qualquer outro padrão terrestre existente. Como decorrência de desenvolvimento e negócios, foi criada uma subsidiária da Qualcomm especialmente para fornecer serviços em multimídia para celulares handhelds. Nos Estados Unidos há uma rede nacional da Qualcomm operando na faixa de 720 MHz, mas a tecnologia é adaptável em outras faixas espectrais. Na implantação nos Estados Unidos e no Japão estão disponíveis entre 50 e 100 canais, sendo que 15 canais apresentam programação ao vivo. A tecnologia permite fluxo de taxa entre 0,47 e 1,87 bit/s/Hz. Utilizando 6 MHz de banda, é possível atingir a taxa líquida total de 11,2 Mbit/s. Tal como os padrões anteriores, a modulação utilizada é COFDM e admite modulação

11


TV móvel: a convergência da radiodifusão com a telecomunicação

hierárquica em redes de frequência única. A robustez em mobilidade opera com velocidades de deslocamento de até 200 km/h, tornando o deslocamento aplicável em veículos de transporte coletivo, tais como trens de alta velocidade. Integrated Services Digital Broadcasting – Terrestrial (ISDB-T) O padrão ISDB-T é o padrão de televisão digital desenvolvido no Japão, na década de 90, privilegiando a recepção móvel e portátil. A banda é segmentada em 13 sub-bandas de 429 MHz, em que apenas o segmento central é alocado para os serviços em multimídia para dispositivos móveis (one-seg). Este padrão foi adotado pelo Brasil para a TV digital aberta terrestre. 2.2 Sistemas via satélite A seguir, descrevem-se os padrões utilizados para a transmissão de TV móvel via satélite. Digital Multimedia Broadcasting – Satellite (DMB-S) O padrão DMB-S é derivado do padrão DMB-T, com o objetivo de simplificar a infraestrutura de transmissão. A transmissão por satélite exige visibilidade direta entre antenas e, por isso, apresenta dificuldades na recepção em lugares fechados, havendo a necessidade de retransmissores locais (gap fillers). Digital Video Broadcasting Handheld (DVB-SH)

Satellite

O padrão DVB-SH complementa o padrão DVB-H e caracteriza-se pela entrega via satélite de conteúdo multimídia utilizando protocolo IP. Se não existir visada direta entre o satélite e o terminal, devem ser empregados gap fillers terrestres. Projetado para frequência abaixo de 3 GHz, tipicamente na “banda S”, o padrão possui dois modos de operação: 1. SH A – COFDM nos enlaces satelital e terrestre (modo SFN); 2. SH B – TDM no enlace satelital e COFDM no terrestre. 2.3 Sistemas celulares As tecnologias disponíveis para as redes 3G são Multimedia Broadcast and Multicast Service (MBMS) e Broadcast and Multicast Service (BCMCS), endereçadas pelos fóruns 3GPP e 3GPP2, respectivamente. O padrão MBMS é o principal padrão utilizado e aplica tecnologia que permite a entrega de serviços de vídeo multicast/broadcast via redes celulares existentes, GSM e UMTS, em IP Datacast (IPDC). O MBMS estabelece o melhor

12

uso do espectro para a entrega de vídeos quando comparado com o modo unicast. Se utilizado com banda de 5 MHz, entrega entre 6 e 9 programas, com uma taxa de transmissão de 256 kbit/s para cada um. 3

Panorama mundial

Este capítulo consolida alguns dados mundiais importantes para a análise do cenário de implantação do serviço de TV móvel, tais como: os principais padrões tecnológicos utilizados, a demanda e a previsão de consumo. 3.1 América do Norte 3.1.1

Estados Unidos

Nos Estados Unidos, no Q4 de 2006, havia 6,2 milhões de assinantes de vídeo móvel, e um faturamento de US$ 148 milhões. Esse mercado representava 2,6% dos usuários de celular. Entre os usuários, 70% eram homens e 73% estavam na faixa etária de 18 a 36 anos. 3.1.2

Canadá

No Canadá, há aproximadamente 500 mil usuários de serviços de TV/vídeo móvel de um total de 4,5 milhões de celulares com capacidade de acesso. 3.2 Europa Na França e no Reino Unido, os serviços de vídeo móvel alcançaram mais de 500 mil usuários num curto período de tempo depois do lançamento. Na Itália, o único grande país europeu com serviço comercial de TV móvel, ao final de 2006 existiam mais de 400 mil usuários desse serviço. No Reino Unido, França, Alemanha, Itália e Espanha, aproximadamente um quarto dos assinantes parou de utilizar os serviços de TV/vídeo móvel, em decorrência do seu alto preço e a problemas com qualidade e confiabilidade. O DVB-H foi escolhido como o padrão de TV móvel para a Europa. Há pouca disponibilidade de espectro para o oferecimento do serviço de broadcast, porém espera-se que, quando forem desligados os canais de TV analógicos, haverá maior disponibilidade de espectro. 3.3 Ásia – Pacífico Nesta região, a previsão era de 25 milhões de usuários de TV móvel ao final do ano de 2008. Os padrões de TV móvel DVB-H, DMB-T, DMB-S, ISDB-T e MediaFLO deverão ser utilizados, concorrendo na região. 3.3.1

Japão

Entre abril de 2006 e agosto de 2008, foram

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 7-14, jul./dez. 2009


TV móvel: a convergência da radiodifusão com a telecomunicação

adquiridos pelos japoneses mais de 40 milhões de receptores com capacidade de TV móvel, com o padrão ISDB-T one-seg (ISHIHARA, 2008). A operadora NTT DoCoMo adotou o padrão ISDB-T e as operadoras KDDI e Softbank Japan adotaram o MediaFLO. 3.3.2

Coreia do Sul

O primeiro lançamento comercial de TV móvel no mundo ocorreu na Coreia do Sul. No final de 2006, havia um milhão de usuários do serviço de TV móvel via satélite, utilizando tecnologia DMBS, e 1,8 milhão de usuários de TV móvel terrestre utilizando a tecnologia DMB-T. Os provedores do serviço DMB-T estão enfrentando dificuldades financeiras. O modelo de negócios, inicialmente fundamentado em receitas de publicidade, não está sendo eficaz. 3.4 Demanda e previsão de consumo Nas Tabelas 2, 3 e 4 são mostradas, respectivamente, as estimativas mundiais de uso de diferentes aplicações, a previsão do número de assinantes para vídeo e TV móvel e a previsão de vendas de terminais para os principais padrões. Na Tabela 2 pode-se notar a alta demanda no Brasil pela oferta de TV móvel no celular. Tabela 2 Aplicações de uso mais frequente

Na Tabela 3 pode-se notar uma previsão de aumento rápido no número de assinantes do serviço de TV móvel no celular. Tabela 3 Previsão do número de assinantes

Na Tabela 4 pode-se notar que o DVB-H é a tecnologia com maior previsão de venda no mundo, no ano de 2011.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 7-14, jul./dez. 2009

Tabela 4 Previsão de vendas de terminais de TV móvel no mundo por tecnologia

Conclusão Neste artigo foram apresentados, inicialmente, os modelos de serviços de vídeo e TV móvel, mostrando que, no primeiro caso, são ofertados vídeos de curta duração, sob demanda, e, no segundo, vídeos de média duração, por uma grade de programação. Além disso, mostrou-se que a rede celular pode ser utilizada na transmissão dos serviços de vídeo e TV móvel e que também é possível utilizar, para a transmissão de TV móvel, uma rede broadcast separada. Nesse caso, a utilização da rede independente traz como principal benefício a possibilidade de transmissão simultânea de um maior número de programas, sem comprometer a qualidade da oferta de outros serviços das operadoras das redes celulares. Estudando os modelos de negócios, observou-se que, a partir de um dado número de usuários e programas, é necessário um maior espectro para a transmissão unicast do que para a broadcast. Essa necessidade aumenta os custos da transmissão do serviço de TV móvel, fazendo com que o provedor limite a duração, a qualidade de imagem e o número de programas de TV ofertados. Dependendo do modelo de negócios, da legislação, da disponibilidade de espectro e da estratégia de mercado da operadora, pode ser mais vantajoso construir uma rede broadcast independente para a transmissão do serviço de TV móvel. Também foram abordados os diferentes cenários possíveis de modelos de negócios, que podem ser utilizados pelas operadoras celulares e por radiodifusores, na oferta do serviço de TV móvel. Foram descritos quatro modelos possíveis, variando de um exclusivo da operadora celular até um liderado pelo radiodifusor, passando por um complementar, em que os dois provedores compartilham os melhores recursos que cada um pode oferecer. A viabilidade de cada um desses modelos depende fortemente da legislação e do mercado de cada país, das estratégias comerciais dos provedores de serviço, da disponibilidade e custo do espectro e das tecnologias adotadas. Por último, foram listadas as principais características que um sistema de transmissão de TV móvel deve apresentar, destacando o uso eficiente do espectro, a transmissão robusta, o uso em movimento e o baixo consumo de energia nos terminais. Apresentaram-se,

13


TV móvel: a convergência da radiodifusão com a telecomunicação

também, as diferentes tecnologias que são adotadas pelos provedores do serviço, um panorama da situação atual em diferentes países e a demanda dos usuários de diferentes países por serviços que podem ser ofertados em terminais portáteis. Outros dados mostrados foram as previsões do número de assinantes dos serviços de vídeo e TV móvel, ao longo dos anos, e das vendas de terminais no ano de 2011, por tecnologia. Esses dados mostram a alta demanda dos brasileiros pelo serviço de TV móvel, a alta taxa de crescimento do número de assinantes do serviço nos próximos anos e a previsão de que a tecnologia DVB-H será a dominante, para os terminais portáteis de TV móvel, no ano de 2011. A convergência tecnológica aponta para uma aproximação entre radiodifusor e operadora de telecomunicações, de um modo complementar. O radiodifusor domina as técnicas de produção de conteúdo e conhece o tipo de conteúdo a que os telespectadores gostam de assistir. Já as operadoras de telecomunicações possuem informações pessoais sobre cada um de seus usuários. Esses conhecimentos, do radiodifusor e da operadora de telecomunicações, permitem a oferta de conteúdos de maior aceitação e audiência e ações mais efetivas de marketing. No caso específico do Brasil, TV e celulares são

grandes paixões. A convergência desses serviços tem grande potencial para constituir uma killer application. Referências ISHIHARA, H. Overview of ISDB-T, Oct. 2008. Disponível em: <http://www.dibeg.org/seminar/0810Philippins_IS DB-T_seminar/Presentation1.pdf>. Acesso em: fev. 2009. MARTINS, B. R. et al. Modelo de Referência: Sistema Brasileiro de Televisão Digital Terrestre. PD.30.12.36A.0002A/RT-08-AB. Campinas: CPqD, 2006. (relatório técnico). PATACA, D. M.; LONGO, S.; DALL’ANTONIA, J. C. TV Digital Móvel. In: SET 2005 – CONGRESSO DE TECNOLOGIA DE RÁDIO, TELEVISÃO E COMUNICAÇÕES, 2005. São Paulo. Revista de Radiodifusão – Anais do Congresso SET. São Paulo, 2005. p. 26-34, v. 1, n. 1. SOLOMON, Y. The Economics of Mobile Broadcast. Mobile DTV Alliance, 2007. Disponível em: <http://www.mdtvalliance.org/imwp/download.asp ?ContentID=10295>. Acesso em: fev. 2009.

Abstract This paper addresses key aspects related to the deployment of the mobile TV service, describing the main ways and characteristics for delivering mobile video and conceptualizing the exploration, service and business models. Possible alternatives for exploiting the service are listed, taking into account the broadcasters’ and service providers’ actions. Yet, an overview on the main technological standards is provided in order to highlight the ones being adopted worldwide with the objective of providing the service as well as the information related to the service deployment around the main regions of the world. Finally, a brief conclusion of the addressed issues is presented. Key words: Mobile TV. Broadcast. Mobile Video. Multicast. Unicast.

14

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 7-14, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais Ismael Mattos Andrade Ávila*, Rosely Gomes Costa** O nível de alfabetização de grande parte da população brasileira é insuficiente para um uso proficiente de computadores e para um acesso eficaz a conteúdos digitais como os disponíveis hoje na Internet. Esse problema não é exclusivo do Brasil e suas características dependem de muitos fatores socioculturais e educacionais próprios de cada país. Assim, a maior parte dos estudos sobre inclusão digital de analfabetos feitos no exterior mostra-se inadequada ao contexto brasileiro, que é caracterizado por uma maior prevalência do analfabetismo funcional em relação ao analfabetismo pleno, e no qual o multilinguismo é marginal. Por isso, além do uso de ícones como facilitadores da interação desse público com os computadores, a exemplo do que tem sido relatado para países como a Índia, nós investigamos como os ícones interagem com as habilidades leitoras de usuários semialfabetizados. O analfabetismo é uma das questões mais importantes a serem tratadas no Brasil, dado o nível educacional de sua população. Assim, o estudo trata do emprego de ícones tanto como apoio à compreensão de ideias e informações mediadas pela interface computacional quanto como à compensação de habilidades leitoras limitadas. Palavras-chave: Iconicidade. Inclusão digital. Fatores humanos em IHC. Analfabetismo. Idosos. Introdução Este estudo faz parte do projeto Soluções de Telecomunicações para Inclusão Digital (STID), da Diretoria de Tecnologias de Serviços (DTS), do Centro de Pesquisa e Desenvolvimento em Telecomunicações (CPqD). O objetivo do projeto STID foi identificar, propor, integrar e adaptar novas soluções de interface humano-computador e modelos de interação a fim de facilitar o uso dos computadores por pessoas iletradas e/ou com alguma deficiência sensorial (ÁVILA et al., 2007; HOLANDA; DALL'ANTONIA, 2006). Dentro desse objetivo mais amplo, se inseriu o estudo aqui descrito, que aborda o uso de ícones como facilitadores da interação de pessoas iletradas ou semiletradas com interfaces computacionais e com serviços de governo eletrônico oferecidos via Internet. Nesse âmbito, surgiu a necessidade de um estudo que investigasse o possível uso de ícones como facilitadores dessa interação. Essa facilitação refere-se não somente ao uso de ícones para veicular ideias e informações, mas também a situações em que ocorre uma interação entre ícones e símbolos, isto é, o uso concomitante de ícones (como imagens de apoio) e textos (simplificados). Este artigo oferece uma descrição do estudo por nós realizado, que contou com três ensaios. Partindo de resultados de estudos realizados no exterior, este estudo se vale de dados colhidos de representantes do público-alvo no Brasil para testar algumas hipóteses, buscando conceber e

implementar soluções adequadas ao contexto e à população brasileira. 1

Definição do problema e suas soluções

Os perfis de usuários que delimitam o público-alvo do STID representam atualmente entre um terço e metade da população brasileira, com predominância de idosos e habitantes de zonas rurais. Esse público enfrenta inúmeras barreiras no exercício de seus direitos e grandes dificuldades no acesso às oportunidades criadas pela sociedade informacional. Embora numeroso, esse público parece ser negligenciado ou ter suas necessidades específicas subestimadas por várias iniciativas de inclusão digital existentes no Brasil. Assim, o foco no baixo letramento como fator de exclusão digital se justifica pela natureza eminentemente textual de grande parte dos conteúdos e serviços digitais hoje disponíveis. Numa comparação entre diversos países (CHINN; FAIRLIE, 2006), a “baixa escolaridade” apareceu diretamente correlacionada com a penetração menor dos computadores e da Internet, ainda que outros fatores também tenham se mostrado relevantes. Como discutido por Ávila e Holanda (2006), a iliteracia cria “círculos viciosos” em que a falta de acesso à sociedade informacional, que em grande medida resulta dessas deficiências de letramento, recrudesce as desigualdades de oportunidade já

*Autor a quem a correspondência deve ser dirigida: avila_an@cpqd.com.br. **Faculdade Latino-Americana de Ciências Sociais (FLACSO). Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

enfrentadas por essa população. Em face disso, o projeto STID buscou, desde sua concepção, enfocar e compreender esse público, suas necessidades e seus bloqueios em relação às tecnologias de informação e comunicação (TICs), para, com base nesse entendimento, direcionar recursos, soluções e ferramentas que facilitem a travessia desses cidadãos rumo à sociedade informacional. 2

Antecedentes na literatura

O estudo iniciou-se pelo levantamento de trabalhos correlatos já realizados no Brasil e no exterior, avaliando sua possível adaptação ou extensão aos propósitos do STID. Embora tenham sido identificados vários estudos voltados a deficientes visuais (BREWSTER, 1998; SCHNELLE; LYARDET, 2006; TAKAGI et al., 2004) e auditivos (AHMED; SEONG, 2006; CAVENDER et al., 2006; FAJARDO et al., 2003; KENNAWAY et al., 2007; PETRIE et al., 2004; ZAJICEK; HALL, 2000), alguns dos trabalhos disponíveis se mostraram, no que diz respeito à inclusão digital de pessoas pouco escolarizadas, mais incipientes e com poucas implementações práticas (ver, por exemplo, GOETZE; STROTHOTTE, 2001). Alguns eram voltados à interação com outros tipos de interface, como as de telefones celulares (AHMED; SEONG, 2006; EIRIKSDOTTIR et al., 2006). Apesar de já terem sido empreendidos estudos sobre o acesso de cidadãos iletrados a sítios e serviços de governo eletrônico, inclusive em países desenvolvidos como a Itália (BIASIOTTI; NANNUCCI, 2006) e os EUA (AKAN et al., 2006; PILLING; BOELTZIG, 2007), são mais recorrentes na literatura estudos de caso para a Índia, com implementações ou propostas geralmente mais voltadas ao acesso a oportunidades de emprego (MEDHI et al., 2007a), a informações de saúde (HUENERFAUTH, 2002), agrícolas (PLAUCHÉ et al., 2006), ou ainda ao letramento digital (CHAND; DEY, 2006). Entre tais abordagens do problema, observa-se a ênfase no uso de interfaces baseadas em ícones, que prescindem da linguagem escrita. Isso pode ser explicado pela realidade indiana, marcada pela particular combinação de altos níveis de analfabetismo pleno e elevado multilinguismo, o que torna demasiado complexa a tarefa de implantar, em âmbito nacional, interfaces computacionais baseadas em texto. Isso também explica por que muitos dos estudos citados buscam conceber ícones (signos com efetiva semelhança com os objetos representados) que sejam capazes não só de facilitar a comunicação entre os usuários e o computador, mas também de substituir por completo o uso da escrita. Apesar de a Índia ser um país que apresenta semelhanças com o Brasil e de ambos serem países emergentes e com altos índices de

16

analfabetismo, adotar para o Brasil as soluções especificamente concebidas para o cenário indiano parece-nos algo questionável, sobretudo em face das consideráveis diferenças do contexto brasileiro, que é muito caracterizado pelos elevados níveis de analfabetismo funcional e por um monolinguismo marcado pela desigualdade no domínio da norma culta da língua oficial – aquela de que o Estado se vale ao comunicar-se com seus cidadãos (MARTINS; FILGUEIRAS, 2007). Assim, no âmbito do projeto STID, cujo público-alvo é formado por pessoas com níveis variados de letramento e de domínio da língua do Estado, e para as quais o computador é pouco ou nada familiar, as soluções de interação tiveram de ser investigadas no devido contexto. Isso demandou estudos que investigassem não só aspectos de iconicidade isolada, mas também situações de interação entre ícones e símbolos, isto é, de uso concomitante de imagens (na forma de ícones de apoio) e textos (simplificados). Ademais, diante da carência de trabalhos semelhantes voltados para o cenário brasileiro, este estudo trilha uma linha investigativa que busca contextualizar resultados de estudos existentes no exterior e aplicá-los às circunstâncias verificadas no Brasil, a fim de conceber e implementar soluções adequadas à nossa população. 3

Ícones na promoção da inteligibilidade

Na área da Antropologia, alguns estudos já se valeram da análise de desenhos para obter informações e dados não explicitados pelos sujeitos do estudo. Esse foi, por exemplo, o caso dos trabalhos de Lévi-Strauss (1975) e Matta (1976) que, com o objetivo de atingir dados subjacentes sobre dimensões do espaço, difíceis de serem alcançados com outras metodologias, analisaram desenhos de aldeias indígenas feitos pelos próprios índios. Esse foi também o objetivo do estudo de Niemeyer (1985), conduzido com base em desenhos e mapas elaborados por moradores de favelas na cidade de São Paulo. Facchini et al. (1997) utilizaram essa metodologia para elaborar mapas de risco para uma indústria alimentícia na cidade de Pelotas (RS). Ao notarem que o uso de figuras geométricas, com graduação de tamanho para caracterizar a intensidade do risco, tinha pouco significado para os trabalhadores, propuseram uma pesquisa na qual os próprios trabalhadores sugerissem os ícones. Waichman et al. (2007) estudaram a eficácia de pictogramas autoexplicativos das embalagens de pesticidas utilizados por trabalhadores rurais na Amazônia brasileira. O estudo avaliou em que medida as ilustrações, criadas pelos fabricantes, ajudam efetivamente na compreensão, por pessoas com habilidades de leitura limitadas, dos

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

riscos do uso dos pesticidas. O estudo de caso investigou como os trabalhadores interpretavam textos e símbolos nas etiquetas das embalagens e de que modo essa leitura dependia de fatores como idade, escolaridade e tempo de uso. Os autores deram indicações sobre a importância do uso de cores, símbolos, léxico e linguagem adequados àquele público-alvo (trabalhadores rurais e pequenos agricultores). Porém, o levantamento inicial não identificou, na área das interfaces computacionais no Brasil, soluções baseadas em ícones para o baixo letramento que pudessem ser integralmente reproduzidas no STID. Muito embora, como já discutido, as experiências estrangeiras relatadas não possam ser totalmente transpostas para o cenário brasileiro, elas sustentam algumas das hipóteses iniciais deste estudo. Uma dessas hipóteses, a de que o uso de apoios icônicos é necessário em interfaces para pessoas com baixo letramento, foi descrita em Medhi et al. (2007a), na forma de implementação de interface sem textos (baseada em ícones) voltada a facilitar a busca, por parte de mulheres analfabetas da Índia rural, de empregos adequados às suas habilidades profissionais e expectativas de remuneração. Já em Medhi et al. (2007b), os autores discutiram a melhor forma de representar diferentes conceitos para usuários analfabetos ou semianalfabetos, fazendo uso de elementos audiovisuais. Esse último artigo compara a inteligibilidade de dez tipos diferentes de representações – desenho estático, texto, foto, animações feitas à mão e vídeo, cada uma também com descrição por voz. As conclusões foram de que descrições por voz em geral ajudam na compreensão e que, embora as representações com áudio tenham sido bem mais inteligíveis do que as sem áudio, pode também ocorrer de essas informações bimodais (audiovisuais) serem confusas para esse público. Por outro lado, informação visualmente mais rica não implica necessariamente melhor compreensão, e quadrinhos podem se mostrar mais efetivos que representações fotorrealistas. Finalmente, os resultados foram inconclusivos a respeito das vantagens/desvantagens das imagens dinâmicas com relação às estáticas, isto é, movimento não implica necessariamente melhor compreensão, e, numa comparação entre a compreensão produzida por informação estática e aquela produzida por informação dinâmica, vários fatores devem ser considerados. Em tese, ícones podem se tornar um recurso efetivo na redução da carga simbólica imposta aos usuários, pois não pressupõem, para sua interpretação, escolarização ou proficiência em uma linguagem (código adquirido), mas sim experiência com o mundo concreto, algo que, em grande medida, prescinde de escolarização. Todavia, nem sempre as vivências concretas

bastam para a apreensão de conceitos muito abstratos ou técnicos, bastante frequentes em serviços de governo, como os que são objeto do projeto STID. Por outro lado, nada garante que todos os usuários de uma interface compartilhem de um mesmo conjunto de experiências do mundo concreto, tais como as necessárias à interpretação dos ícones utilizados. Em outras palavras, o uso de imagens (ícones) pode elevar a inteligibilidade dos conteúdos e facilitar sua compreensão pelos usuários iletrados, mas a busca por ícones perfeitos será uma empreitada inócua, visto que a inteligibilidade dos ícones depende fundamentalmente das experiências anteriores de cada indivíduo, e o que é “perfeito” para um pode ser inadequado ou insuficiente para outro. A despeito desse caráter estritamente individual da interpretação icônica, nos pareceu válida uma busca por ícones cuja interpretação dependesse de vivências mais ordinárias e cotidianas (menos particularizadas) por parte do público-alvo. Nesse sentido, e a exemplo dos trabalhos apresentados em Medhi et al. (2007a; 2007b), a identificação das imagens mais adequadas ao contexto ou ao domínio específico de serviços de governo foi, sempre que possível, fundamentada em dados colhidos em campo, como resultado de estudos etnográficos, que embasaram o primeiro e o terceiro ensaios deste estudo (descritos nas Seções 5 e 7), e de uma dinâmica participativa com a população-alvo, que norteou o segundo ensaio (Seção 6). Por fim, tendo em vista o perfil de alfabetização atual da população brasileira, o presente estudo buscou ainda avaliar de que modo os ícones construídos ou escolhidos poderiam interagir com conteúdos textuais presentes na interface. Para isso, o estudo buscou entender como, no processo de interpretação de elementos em uma interface computacional, as habilidades de leitura e de interpretação icônica retroalimentam-se, reforçam-se e concorrem entre si. No terceiro ensaio deste estudo, descrito na Seção 7, esse tema é aprofundado. Para a realização dos ensaios e das dinâmicas de iconicidade com representantes do público-alvo, os autores contaram com o apoio de núcleos acadêmicos das áreas de computação (POLI-USP e NIED-Unicamp) e de linguística (IEL-Unicamp), todos com larga experiência em interação humano-computador e em avaliação de usabilidade e inteligibilidade de mídias digitais. Foram assim criados e realizados três ensaios de reconhecimento e de design participativo de ícones, escalonados nas três etapas acima mencionadas, e cujos objetivos e resultados são discutidos a seguir. 4

Descrição dos experimentos

A fim de entender os processos envolvidos na

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009

17


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

1

interpretação icônica, sobretudo pela população-alvo do projeto, foram realizados três ensaios com sujeitos representativos dessa população, buscando cumprir os seguintes objetivos: • comparar a efetividade de desenhos e fotografias e as implicações de cada tipo de imagem para os diversos segmentos do público-alvo; • desenhar ícones que aumentassem a inteligibilidade geral dos conteúdos de serviços de governo eletrônico mediados pela interface; • avaliar a interação entre ícones e textos, buscando encontrar os melhores arranjos para o perfil de letramento do público-alvo. Esses ensaios são, assim, parte de um estudo diacrônico, realizado em diferentes localidades brasileiras, conforme a descrição abaixo. Dada a dificuldade de recrutamento de analfabetos, por um lado em função de sua invisibilidade social e, por outro lado, em razão de uma certa aversão desse público às TICs, os recrutamentos foram feitos com o apoio de parceiros locais. Embora o total de participantes, cerca de 40 pessoas, não ofereça base para generalizações estatísticas, os ensaios tiveram um caráter exploratório, e os resultados obtidos (que aparecem tabulados em termos percentuais para facilitar comparações) trouxeram à tona aspectos relevantes para os objetivos do projeto STID. Os testes foram aplicados aos participantes que aceitaram, de antemão, as condições do Termo de Consentimento Livre e Esclarecido (TCLE), lido, quando necessário, na presença de uma testemunha de confiança. 5

Primeiro ensaio

Os experimentos foram realizados nas cidades de Bastos (SP) e João Alfredo (PE), entre julho e agosto de 2007. Os participantes selecionados eram idosos, de ambos os sexos, aposentados da área rural, com baixo nível de escolaridade, baixa renda familiar e sem qualquer familiaridade com computadores. Em Bastos, participaram doze pessoas (dez homens e duas mulheres), com idade média de 65 anos. Em João Alfredo, participaram oito pessoas (cinco homens e três mulheres), com idade média de 57 anos. Antes do primeiro ensaio, o nível de alfabetização de cada participante foi avaliado por meio da aplicação de um teste específico, que gerou a seguinte classificação: em Bastos havia quatro analfabetos plenos, sete indivíduos com nível rudimentar de alfabetização e um com nível básico. Em João Alfredo, três dos sujeitos eram analfabetos plenos, dois tinham nível rudimentar, dois tinham nível básico e um não foi

classificado. O primeiro ensaio teve o objetivo de averiguar a compreensão e a afinidade que alguns tipos de imagem produzem em indivíduos representativos da população-alvo do projeto. Nesse ensaio as imagens foram avaliadas em termos de: • grau de afinidade, isto é, o nível de empatia manifestado pelos sujeitos em relação aos diferentes tipos de imagem; • grau de iconicidade, isto é, o grau de inteligibilidade da imagem para os vários segmentos do público-alvo; • seus efeitos na facilitação da leitura entre os usuários semianalfabetos. Entre as questões a serem respondidas, a principal investigou se fatores socioculturais ou etários influenciam na preferência dos sujeitos por um tipo de imagem (fotografia ou desenho) ou na sua capacidade de inferir corretamente o significado dessas imagens. No ensaio foram utilizadas imagens de objetos ou de temas cotidianos. Visto que os primeiros serviços oferecidos pelo projeto STID cobrem as áreas de previdência social e de saúde, as imagens selecionadas para o protocolo de teste referiam-se a tais temas. Foram usadas imagens de especialidades médicas, de objetos da vida diária e de documentos. As fotos de documentos foram produzidas por nossa equipe com base em documentos reais, alterando-se, todavia, as informações pessoais presentes neles para preservar as informações dos portadores1. As fotografias da área médica e as de cenas cotidianas foram selecionadas em repositórios da Web, adotando-se os critérios de pertinência aos temas de interesse, de semelhança com a realidade brasileira e de ausência de restrições de direito autoral. Os ícones necessários ao ensaio, por sua vez, foram elaborados por nossa equipe, ou, quando necessário, adaptados de clip-arts disponíveis no pacote Office. A lista de imagens utilizadas no protocolo de testes incluiu: • CIC/CPF; • RG/carteira de identidade; • certidão de nascimento; • clínico geral; • ginecologista-obstetra; • oculista; • pediatra; • dentista; • serviços. Assim, esperava-se que essas etapas de teste permitissem avaliar implicações e possibilidades do uso de ícones na interface computacional por meio da qual esses usuários acessariam serviços de governo eletrônico e correlacionar seu efeito com os diversos perfis etários e de letramento da

1 Algumas fotos, de caráter mais pessoal, inclusive as contidas em documentos, foram retocadas neste artigo para preservar o sigilo da identidade dos retratados. Todavia, nos ensaios em ambiente controlado, elas foram usadas sem retoque para não distorcer os resultados.

18

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

população-alvo. 5.1 Procedimentos e preparativos iniciais De início, perguntava-se ao entrevistado se ele preferia fazer o teste acompanhando as telas na forma de cartões impressos ou olhando-as diretamente no monitor do computador. Foi enfatizado que, em qualquer dos casos, seria o mesmo teste, e que em nenhum dos casos o entrevistado teria que interagir diretamente com o material, função essa que caberia sempre ao condutor. Essa foi uma estratégia para tentar eliminar/amenizar possíveis influências negativas causadas pela tecnofobia desses sujeitos, pouco afeitos a computadores. Acreditamos que, ao deixarmos para os sujeitos a escolha do suporte do teste, reduziríamos eventuais resistências iniciais causadas pelo estranhamento frente ao equipamento (um computador portátil, pouco comum naquelas comunidades). Uma vez feita a escolha, prosseguia-se com o teste propriamente dito, conforme descrito abaixo. As respostas obtidas foram anotadas. 5.2 Teste de afinidade A primeira etapa do ensaio visou avaliar a afinidade criada por diferentes tipos de imagens (desenho ou foto) de objetos/temas concretos (“cachorro”, “televisor” e “casal”) que fazem parte do cotidiano da grande maioria dos brasileiros. Como fotos têm, por um lado, maior fidelidade às características físicas do objeto representado e, por outro lado, um valor indicial que pode se sobrepor a seu valor icônico, remetendo a indivíduos específicos e afastando-se em certa medida do conceito geral, nessa etapa buscou-se verificar se tais atributos facilitam ou dificultam a interpretação da ideia geral. Buscou-se verificar também se isso depende da idade dos sujeitos, visto que, em tese, os desenhos poderiam ter mais apelo para indivíduos jovens e as fotos para os mais velhos. Foram mostrados a cada sujeito um desenho e uma foto de um cachorro (conforme Figura 1) e feitas as seguintes perguntas: Pergunta 1 – Qual destas duas imagens é melhor para aparecer em um computador quando o assunto é saúde de cachorro? O condutor aguardava a escolha e anotava a resposta (foto ou desenho) em um formulário. O mesmo processo foi repetido para imagens (desenho e foto) de um televisor. Pergunta 2 – Qual destas duas imagens é melhor para aparecer em um computador quando o assunto é um programa sobre saúde na TV? O condutor aguardava a identificação e anotava a resposta (foto ou desenho) em um formulário. Por fim, o processo foi repetido para imagens (desenho e foto) de um casal. Pergunta 3 – Qual destas duas imagens é melhor para aparecer em um computador

quando o assunto é planejamento familiar? Os resultados obtidos indicaram uma preferência pelas fotos, mas essa variava conforme a localidade e o tema da imagem, conforme Tabela 1. 5.3 Teste de inteligibilidade Na segunda parte do ensaio, foi narrada aos sujeitos uma história na qual uma pessoa (Maria) precisava marcar hora em um centro de saúde. Em seguida, foi mostrada aos sujeitos uma tela com imagens (desenhos ou fotos) de cinco especialidades médicas existentes em centros de saúde (obstetra, oculista, dentista, clínico geral e pediatra). Para reduzir a possibilidade de a última escolha ser feita por mera exclusão, às cinco imagens citadas incluiu-se uma sexta (enfermeira) que, embora pertinente ao contexto, não fazia parte dos temas avaliados. Cada conjunto de seis imagens foi arranjado para formar um tipo de tela: o primeiro (tipo 1) contendo as fotos das especialidades médicas e o segundo (tipo 2) com desenhos dessas mesmas especialidades, com proporções e características semelhantes às das fotos, conforme ilustrado nas Figuras 2 e 3. A ordem de apresentação das telas tipo 1 e 2 foi alternada entre os entrevistados subsequentes, de forma que para o primeiro entrevistado a primeira tela fosse a com desenhos e para o entrevistado seguinte a primeira tela fosse a com fotografias, e assim sucessivamente. Em seguida, solicitou-se que o sujeito apontasse, uma por vez, as especialidades seguindo o roteiro: Pergunta 1 – Se Maria está com dor de dente e precisa marcar hora com um dentista, qual imagem ela deve escolher? Pergunta 2 – Se Maria está esperando um bebê e precisa marcar hora com um obstetra, qual imagem ela deve escolher? Pergunta 3 – Se Maria tem um filho pequeno e precisa marcar hora com um pediatra, qual imagem ela deve escolher? Pergunta 4 – Se Maria tem um problema nos olhos e precisa marcar hora com um oculista, qual imagem ela deve escolher? Pergunta 5 – Se Maria está com uma dor que não sabe o que é e precisa marcar hora com um clínico geral, que imagem ela deve escolher? O condutor aguardava a identificação e, para cada especialidade, anotava o resultado: identificado ou não identificado. Perguntava-se então ao sujeito qual das telas havia lhe agradado mais, e por quê: Pergunta 1 – De qual das duas telas o/a Sr./Sra. gostou mais? Pergunta 2 – Por quê? Os resultados obtidos são mostrados na Tabela 3, em contraste com a média de inteligibilidade indicada na Tabela 2.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009

19


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

Fonte: fotos 1 e 3 – Creative Commons.

Figura 1 Imagens do primeiro teste do primeiro ensaio2 Tabela 1 Percentuais de preferência por tipo de imagem e localidade

Bastos

João Alfredo

Tema

Foto

Desenho

Foto

Desenho

Cachorro

58%

42%

75%

25%

Televisor

58%

42%

75%

25%

Casal

67%

33%

75%

25%

Figura 2 Desenhos das especialidades médicas

2 As citações de autoria de fotos publicadas segundo licença de Creative Commons que tenham sido usadas nos ensaios aparecem nos documentos de condução dos testes, mas são omitidas neste artigo para preservar as identidades dos autores.

20

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

Fonte: fotos 1, 3, 4, 5 e 6 – Creative Commons, foto 2 – www.photo.com.

Figura 3 Fotos das especialidades médicas Tabela 2 Percentuais de reconhecimento por tipo de imagem e localidade

Bastos

João Alfredo

Tema

Foto

Desenho

Foto

Desenho

Dentista

50%

75%

25%

75%

Obstetra

67%

58%

25%

62%

Pediatra

64%

42%

38%

25%

Oculista

82%

42%

62%

50%

Clínico geral

55%

42%

25%

25%

Tabela 3 Percentuais de preferência e inteligibilidade por tipo de imagem e localidade

Bastos

João Alfredo

Tema

Foto

Desenho

Foto

Desenho

Preferência

92%

8%

87%

13%

Inteligibilidade

63%

52%

35%

48%

Esses resultados mostram que, embora seja predominante a preferência por fotos, isso não se reflete proporcionalmente em mais inteligibilidade desse tipo de imagem. No que se refere à inteligibilidade das imagens em geral, observou-se um melhor resultado em Bastos do que em João Alfredo, sobretudo com relação às fotos. Esse resultado pode, em princípio, ser atribuído à diferença de nível de desenvolvimento nos dois municípios, mas a dimensão da amostra não nos permite fazer esse tipo de análise. Em seguida, foi narrada uma história na qual um

conhecido (chamado José, no caso dos entrevistados homens) ou uma conhecida (chamada Maria, no caso das mulheres) precisava entrar com um pedido de aposentadoria. Explicou-se que para isso era necessário apresentar três documentos: o CIC/CPF, a carteira de identidade ou RG e a certidão (ou registro) de nascimento. Foi apresentada ao sujeito uma tela contendo imagens desses três documentos, como ilustrado nas Figuras 4 e 5. Em seguida, solicitou-se ao sujeito que identificasse cada um deles.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009

21


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

Figura 4 Desenhos de documentos

Figura 5 Fotografias de documentos Tabela 4 Inteligibilidade de documentos por tipo de imagem e localidade

Bastos

22

João Alfredo

Tema

Foto

Desenho

Foto

Desenho

CIC/CPF

92%

92%

87%

87%

Identidade/RG

92%

92%

75%

100%

Certidão de nascimento

83%

83%

100%

87%

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

A exemplo do caso anterior, as imagens foram arranjadas para configurar dois tipos de tela: uma contendo fotografias dos documentos (tipo 1), e outra contendo desenhos (tipo 2) com as mesmas proporções, características e cores das imagens fotográficas. As telas tipo 1 e tipo 2 foram alternadamente apresentadas para cada sujeito subsequente. O condutor aguardava a identificação e anotava os resultados conforme as alternativas: “identificado” ou “não identificado”, para cada um dos três documentos e, no caso de identificação incorreta, anotava o nome pelo qual foi identificado o documento em questão. Em seguida, o condutor voltava a mostrar as duas telas (com desenhos e com fotos) e perguntava ao sujeito qual era a de sua preferência, e anotava a resposta obtida. Os resultados, mostrados na Tabela 4, não apresentaram diferenças significativas em termos de inteligibilidade dos documentos em função do tipo de imagem apresentada, nem tampouco em função das localidades estudadas. 5.4 Teste de interação com a leitura A parte final do teste era dirigida especificamente aos analfabetos funcionais e tinha por objetivo verificar se ícones contribuem para a leitura de

palavras. No teste, eram exibidas quatro palavras, substantivos concretos de uso corrente, que de alguma forma pudessem se relacionar a serviços de cidadania. Na primeira tela, as palavras apareciam sem qualquer apoio icônico, conforme Figura 6. Solicitava-se ao sujeito que as lesse e anotavam-se os casos de erro ou de incapacidade de leitura. No teste de leitura sem apoio icônico, 14 dos 18 sujeitos que fizeram essa etapa do ensaio foram capazes de ler todas as palavras e 4 não conseguiram ler nenhuma, número compatível com o percentual de analfabetos plenos na amostra. O teste terminava para aqueles que haviam lido todas as palavras. Para os demais, era exibida alternadamente uma tela para cada palavra que o sujeito não conseguira ler, só que desta vez, junto à palavra em questão, aparecia o respectivo ícone. A síntese dos quatro ícones com as quatro palavras correspondentes é mostrada na Figura 7. O objetivo dessa etapa era verificar se o ícone afetaria de algum modo a capacidade de apreensão da ideia, seja pela facilitação da leitura, seja por mera interpretação icônica, contanto que o termo enunciado pelo sujeito correspondesse exatamente à palavra escrita, e não a um sinônimo ou conceito aproximado (por exemplo, medicamento em lugar de remédio).

Figura 6 Tela exibindo palavras sem apoio icônico

Figura 7 Tela exibindo palavras com apoio icônico

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009

23


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

Observou-se que, das quatro pessoas que não haviam lido nenhuma palavra, uma pessoa (69 anos, sem estudo e analfabeta) identificou uma palavra com o apoio icônico e três pessoas (62 anos, analfabeta; 68 anos, analfabeta; 58 anos, 1ª série) identificaram três palavras nessas condições. Em razão da configuração dessa última etapa do ensaio, de cunho estritamente exploratório, os resultados obtidos não permitem qualquer conclusão segura sobre os reais efeitos dos ícones sobre o processo de leitura de indivíduos com alfabetização rudimentar. No entanto, eles sugerem haver um efeito de reforço mútuo e, por isso, motivaram a realização de um ensaio específico sobre esse tema, conforme descrito na Seção 6. 5.5 Conclusões do primeiro ensaio Tanto em Bastos quanto em João Alfredo, a maioria dos participantes disse preferir fotos e alegou que elas são mais claras e “declaradas” que os desenhos. Isso se aplica tanto aos temas cotidianos quanto às especialidades médicas e aos documentos. Por outro lado, essa preferência não se correlaciona integralmente com a inteligibilidade das imagens, pois os percentuais de reconhecimento desses dois tipos de imagem em ambas as localidades foram bem mais equilibrados que os níveis de afinidade com eles. Isso pode indicar que a preferência por fotos esteja mais correlacionada com sua maior proximidade do mundo real e com o fato de elas terem um vínculo mais claro e direto com o cotidiano, o que talvez confira ao tema mais credibilidade, dando aos usuários uma sensação maior de confiança, ainda que sem implicar maior inteligibilidade. Isso não significa que o uso de desenhos precisa ser evitado, pois, do ponto de vista da implementação dos serviços, eles permitem maior flexibilidade na criação de personagens e na realização das animações necessárias à orientação do usuário na interface. Os resultados do ensaio sugerem como possibilidade o uso de fotos sempre que a intenção for mostrar o contexto dos serviços, os locais em que eles são prestados na localidade do usuário e os profissionais envolvidos, porque isso cria uma conexão com o cotidiano do usuário e reforça a sensação de que os serviços mediados pelo computador são reais. Por outro lado, uma vez que trazem maior flexibilidade de criação de conteúdos, os desenhos e as animações poderiam ser usados para passar informações mais gerais, como dicas de saúde, prevenção de doenças etc., que aparentemente não dependem de vínculos tão diretos com a realidade concreta de cada usuário em particular. Por fim, o teste sugeriu que o uso de ícones pode reforçar as habilidades de leitura das

24

pessoas com baixo letramento. Porém, essa hipótese ainda precisa ser mais estudada. Nesse sentido, foi concebido um novo teste a ser aplicado a usuários que lidam diretamente com páginas da Internet. 6

Segundo ensaio

Dando continuidade ao estudo iniciado no primeiro ensaio, o segundo ensaio teve como objetivo específico envolver representantes da população-alvo em uma dinâmica participativa de desenho de ícones para os temas de interesse do STID. Isso se insere dentro do objetivo final de reunir dados que permitam a elaboração de uma interface acessível, utilizável e inteligível para esse público-alvo. Como discutido, os ícones destacam-se como um importante recurso na orientação contextual e temática de usuários pouco letrados durante a interação com interfaces computacionais. Para cumprir essa tarefa, todavia, os ícones precisam ser inteligíveis, isto é, de fato representativos dos objetos e conceitos que se propõem a mediar (no caso do projeto STID, temas relativos a serviços de governo eletrônico). Entretanto, a iconicidade depende das experiências visuais que cada pessoa acumulou ao longo de sua vida. Por essa razão, ela varia de indivíduo para indivíduo, sobretudo em uma população muito heterogênea (parte rural, parte urbana, e com diferentes idades, condições sociais e localidades de origem). Assim, essa busca deve ser empreendida com a consciência de que não existirão ícones perfeitos nem universalmente inteligíveis, impossibilidade inerente à própria definição de ícone. Em outras palavras, o ícone, por mais bem desenhado que esteja, não será reconhecido se o observador não conhecer o objeto representado, se o objeto não fizer (ou tiver feito) parte de seu contexto, se não possuir um significado para ele ou ainda se o ícone não estiver bem contextualizado. Apesar dessas dificuldades, a inteligibilidade de cada ícone usado na interface aumentará à medida que sua representação estiver mais próxima do objeto real. Para isso, sujeitos representativos do público-alvo foram engajados na concepção de um conjunto de ícones. Embora não assegure um resultado universalmente inteligível, essa dinâmica representa ao menos um passo na direção de produzir imagens que, apoiadas nas experiências individuais dos vários envolvidos nesse design participativo, sintetizem características icônicas, cuja interpretação esteja menos sujeita e ligada às idiossincrasias de cada participante individual. 6.1 Antecedentes na literatura Várias obras de referência da área de design de interação e de interfaces dedicam espaço ao

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

problema da produção de ícones. Preece et al. (2005, p. 23), por exemplo, comentam que: “[...] ícones são culturais e específicos do contexto e que, portanto, projetar um bom ícone exige tempo”. Segundo essas autoras, os projetistas deveriam sempre lançar mão de tradições e padrões existentes, em lugar de contrariá-los. Elas salientam ainda que é mais fácil representar iconicamente objetos e coisas concretas, ao contrário da representação de ações, que, embora não seja impossível, é certamente mais difícil. Outra característica importante apontada pelas autoras é que os ícones devem ser distinguíveis uns dos outros na interface. Rocha e Baranauskas (2000), por sua vez, descrevem algumas técnicas participativas de desenho de ícones. Uma técnica de projeto de interface, chamada BrainDraw, é conduzida na forma de chuva de ideias (brainstorming) cíclica e gráfica, em que uma série de estações de desenho são arranjadas em círculo, de forma a permitir que cada participante faça um desenho inicial sobre um tema e, ao final de um intervalo de tempo, deixe seu desenho, passe �� estação seguinte e continue o desenho lá encontrado. O processo prossegue até que todos tenham colaborado na criação iniciada por um dos participantes e diferentes desenhos tenham assim sido produzidos, sendo cada um constituído pela fusão de ideias e contribuições de todos, mas sempre com um início diferente. Mais especificamente em relação ao desenho de ícones, Rocha e Baranauskas (2000) descrevem um jogo participativo em que um dos participantes atua como desenhista (sketcher), elaborando ícones enquanto os demais tentam “adivinhar” o conceito que ele tenta expressar. Um observador acompanha a interação dos envolvidos e toma nota daqueles desenhos que se mostram mais confusos e também daqueles que parecem mais efetivos, os quais são selecionados posteriormente para a produção gráfica dos ícones. Dependendo do número de pessoas envolvidas, a dinâmica pode funcionar no estilo cooperativo ou ser dividida em grupos para a produção competitiva de desenhos. 6.2 Procedimentos Em uma atividade de design participativo, como o caso aqui descrito, que envolveu um grupo heterogêneo de sujeitos, considerou-se mais adequada uma dinâmica dividida em três fases: • individual, em que cada participante propôs representações icônicas para os temas; • em grupo, em que os participantes foram agrupados por proximidade etária em três equipes distintas para consolidar as propostas icônicas individuais em uma mais sintética; • finalização dos ícones, fase em que os pesquisadores identificaram os elementos e

as ideias principais e os utilizaram para orientar um desenhista na produção dos ícones. As sequências de uma etapa individual e de uma com divisão etária dos grupos foram adotadas para que as pessoas idosas não se sentissem intimidadas e manifestassem suas preferências e opiniões sobre os temas solicitados. Além disso, considerou-se que a técnica em que um desenhista propõe ícones desde o início, como descrita em Rocha e Baranauskas (2000), poderia ter um efeito indesejável de influência ou sugestão, reduzindo ou até mesmo tolhendo a espontaneidade de algumas propostas que poderiam surgir caso cada participante fizesse seus próprios desenhos inicialmente. Assim, acreditou-se que, na forma como foi organizada, a atividade participativa preservaria as propostas individuais, para posterior síntese em uma proposta coletiva. Por essa razão, a dinâmica adotou o procedimento em três etapas, partindo do individual e convergindo gradualmente para o coletivo, preservando-se todos os passos que levaram à versão final de cada ícone. Esses resultados intermediários enriqueceriam o estudo, uma vez que permitiriam a identificação do efeito das experiências pessoais de cada sujeito na proposição dos ícones. Com isso, seria mais fácil rastrear as diversas sugestões e correlacioná-las com o perfil de cada proponente. Dessa maneira, o resultado final partiria do próprio público-alvo e não de uma ideia icônica preconcebida pelos pesquisadores. Ainda que essa metodologia não seja exaustiva nem abranja inteiramente o público-alvo, ela tem o mérito de se valer de uma amostra representativa dos usuários a serem atendidos pelos serviços. 6.3 Descrição da atividade participativa Foram recrutadas pessoas que representam o público-alvo do projeto: analfabetos plenos e funcionais, de diferentes faixas etárias, incluindo idosos. A dinâmica contou com a participação de uma deficiente auditiva e de uma intérprete da Língua Brasileira de Sinais (Libras). A atividade envolveu um grupo de 14 pessoas, parte delas oriunda da zona rural, com idades variando de 16 a 73 anos, pertencentes às classes socioeconômicas C, D e E, moradoras da periferia da cidade de Campinas. No início da dinâmica, cada participante foi orientado a fazer suas atividades sem interagir com os outros sujeitos. Na segunda etapa, os 14 participantes foram divididos por faixas etárias em três grupos: de 16 a 30 anos; de 31 a 50 anos; de 51 a 73 anos. A alocação dos sujeitos em cada um dos grupos visava, na medida do possível, produzir grupos cujas médias de idade divergissem bastante.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009

25


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

6.4 Etapas da atividade Na primeira etapa, os condutores propuseram um tema (relacionado aos serviços de e-gov) e solicitaram aos sujeitos que desenhassem ou descrevessem como deveria ser desenhado o tema, sem interagir com os demais participantes. No caso de analfabetos plenos, os condutores anotaram cada descrição verbalizada pelos sujeitos. O procedimento foi repetido para os cinco temas: “aposentadoria”, “dentista”, “pediatra”, “clínico geral” e “lugar onde se pede informação”. Na segunda etapa, reagrupados os 14 sujeitos segundo o critério etário, os membros de cada grupo interagiram discutindo os desenhos que haviam elaborado na primeira etapa, a fim de que o grupo avaliasse contribuições individuais e propusesse, para cada um dos cinco temas, um ícone-síntese que combinasse as características consideradas mais adequadas entre as diversas contribuições individuais dos membros do grupo. Ao final da segunda etapa, cada grupo havia produzido, de forma consensual, cinco ícones. Ao longo de todas as interações, os condutores anotaram as dúvidas e os comentários manifestados pelos participantes, e buscaram extrair daqueles participantes incapazes de escrever ou desenhar – sobretudo os idosos analfabetos – ideias sobre como os ícones deveriam ser, incluindo idade, aparência e sexo dos personagens desenhados. Foram também sondadas as preferências com relação às cores usadas e à presença ou ausência de elementos específicos com vista a facilitar o entendimento da imagem, como, por exemplo, uma cruz vermelha em todos os ícones referentes à área de saúde ou um estetoscópio e um medidor de pressão no ícone “clínico geral”. Alguns desenhos criados pelos participantes para temas propostos, além das anotações feitas (inclusive pelos condutores), são ilustrados nas Figuras 8, 9 e 10. Como os sujeitos tinham níveis de letramento que iam do analfabetismo pleno ao funcional, alguns deles fizeram anotações nos desenhos, sobretudo para indicar cores. Também foram necessárias, como indicado no retângulo na Figura 9a, anotações dos condutores sobre ideias verbalizadas pelos analfabetos plenos. Com base nos desenhos e nas anotações, foram identificados temas, elementos e padrões recorrentes e posteriormente propostos a um desenhista para que fossem consideradas as características que deveriam constar nos ícones. Na Figura 11 estão ilustrados alguns ícones resultantes desse processo. É importante salientar que, além da já esperada limitada capacidade de escrita, os participantes com menos escolaridade tiveram grande dificuldade de desenhar. Isso demandou maior atenção dos condutores para aquilo que eles

26

verbalizavam durante a dinâmica, mais até do que para aquilo que eles desenhavam. Foram os participantes que sugeriram, por exemplo, a presença de uma cuspideira ao lado da cadeira do dentista, como acabou sendo usado na versão final do ícone (Figura 11a). Alguns elementos, como a bengala no caso do tema “aposentado” e o estetoscópio para ícones médicos, foram sugeridos por vários sujeitos. Quando indagados a respeito, os participantes em geral afirmavam que se baseavam em suas vivências, isto é, na imagem que eles tinham de um aposentado ou de um médico clínico geral. Isso sugere, portanto, que um ícone para esses conceitos se tornaria mais inteligível (fácil de reconhecer) se contivesse esses elementos. Como o estetoscópio pode estar associado a várias especialidades médicas, outros elementos gráficos sugeridos, como o medidor de pressão, foram usados por estar mais associados à atividade do clínico geral, ou a uma visita a esse tipo de médico, ainda que a medição da pressão possa ser feita por uma enfermeira. Assim, o ícone final incluiu os dois elementos (Figura 11b). Alguns resultados obtidos no segundo ensaio possibilitaram melhorar os ícones cuja interpretação havia dado margem a equívocos no primeiro ensaio, como é o caso do ícone referente ao tema “remédio” ou “medicamento”, que, dadas suas características originais (Figura 12a), chegou a ser confundido por um dos sujeitos (uma mulher idosa) com um tanquinho de lavar roupa, possivelmente por conta das proporções do desenho e sua semelhança com aquele objeto do cotidiano da entrevistada. Uma primeira correção no ícone, em razão do primeiro ensaio, foi a modificação de suas dimensões a fim de torná-lo mais retangular (Figura 12b). A nova alteração, que decorreu do segundo ensaio, foi a inclusão de elementos sugeridos por vários participantes, tais como cartelas de comprimidos e vidro de xarope. Com base nessas sugestões, o ícone foi refeito (Figura 12c) e sua evolução concluída. Alguns elementos que surgiram na dinâmica já eram em certa medida esperados, como o uso de jaleco branco pelos profissionais médicos desenhados e a sugestão do uso de uma cruz vermelha nos ícones relacionados à saúde. Outros foram inesperados, como a sugestão de que a especialidade de pediatria tivesse como personagem uma mulher (algo talvez justificável se for essa a experiência mais frequente entre os participantes e o público que eles representam), ou ainda a sugestão de que os médicos tivessem semblantes amistosos e sorridentes, para tornar os ícones mais atraentes. Por fim, um dos participantes utilizou mímica para ilustrar a expressão de dúvida que, segundo ele, deveria aparecer no ícone “lugar onde se obtém informação”.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

Figura 8 Desenhos para o tema “aposentado” feitos por sujeitos de diferentes idades

a

b

Figura 9 Desenhos para os temas – a) “clínico geral” (com notas do condutor em destaque); b) “pediatra”

a

b

Figura 10 Desenhos para o tema “remédio” – a) sujeito jovem; b) sujeito jovem e surdo

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009

27


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

a

b

c

d

Figura 11 Exemplos de ícones produzidos com elementos capturados na dinâmica – a) dentista; b) clínico geral; c) aposentado; d) pediatra

a

b

c

Figura 12 Evolução do ícone para o tema “medicamento”

6.5 Conclusões do segundo ensaio A dinâmica de design participativo de ícones permitiu identificar com bastante clareza alguns elementos-chave para a composição de ícones adequados aos temas “previdência” e “saúde”. As observações realizadas durante a atividade deram aos pesquisadores inúmeros elementos e pistas dos processos interpretativos envolvidos na criação de ícones com os temas propostos. Foi possível observar como a vivência de cada um dos participantes é determinante dos tipos de desenhos e dos elementos neles presentes. Os pesquisadores observaram também que os participantes demonstraram satisfação em contribuir para o projeto com ideias e esboços. Além disso, a metodologia empregada permitiu distinguir tendências de interpretação icônica dos participantes, por faixa etária e por presença de deficiência auditiva. Os resultados corroboraram

28

algumas conclusões do primeiro ensaio, como, por exemplo, a importância de considerar a vivência do público-alvo a fim de criar ícones efetivamente inteligíveis, e deram uma direção para a atividade de produção de ícones para os serviços citados. 7

Terceiro ensaio

Conforme tratado nas seções anteriores, no primeiro ensaio, imagens pictóricas (desenhos) e fotográficas foram comparadas em termos de inteligibilidade e empatia dos representantes da população-alvo do projeto STID. No segundo ensaio, outros sujeitos foram engajados em uma dinâmica participativa de desenho de ícones em torno de temas relacionados aos serviços do STID. Os resultados desses dois ensaios iniciais fundamentaram a criação de um conjunto de ícones com as características e os elementos

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

identificados. Todavia, como visto na Seção 4, a questão da interação entre ícones e textos, que no primeiro ensaio foi apenas tangenciada, necessitaria de um estudo mais específico, tendo em conta o perfil de letramento da população brasileira, como discutido na introdução deste trabalho. Assim, o terceiro ensaio pretendeu dar continuidade ao estudo de ícones, avaliando a inteligibilidade específica de algumas imagens e sua interação com palavras. Cabe lembrar que a interação entre imagens e textos ocorre com frequência em interfaces computacionais, e, em função do contexto, pode criar situações de ancoragem, de revezamento ou ainda de etiquetamento. Segundo Bardin (1975, p. 111 apud SANTAELLA; NÖTH, 2005, p. 55), quando dispostos lado a lado, um texto e uma imagem permitem a interpretação holística da mensagem, não se tratando nesse caso da mera adição de duas mensagens informativas diferentes. Barthes (1964, p. 40-51 apud SANTAELLA; NÖTH, 2005, p. 55) propôs duas possibilidades no que se refere a possíveis modos de inter-relação de texto e imagem: ancoragem e revezamento. Na ancoragem, o texto orienta a interpretação da imagem, ressaltando alguns aspectos e ignorando outros. No revezamento, texto e imagem encontram-se numa relação complementar em que “a unidade da mensagem se realiza em um nível mais avançado”. Os autores acrescentam que, embora em ambos os casos haja referências indiciais entre palavra e imagem, no primeiro a referência se dá do texto para a imagem, enquanto no segundo, a atenção do observador é dirigida do texto para a imagem e vice-versa. Há ainda uma terceira modalidade de referência indicial entre palavra e imagem, chamada de “denominação” ou “etiquetamento” (GOODMAN, 1968 apud SANTAELLA; NÖTH, 2005; MUCKENHAUPT, 1986), que corresponde a situações em que a palavra designa coisa ou pessoa mostrada na imagem (SANTAELLA; NÖTH, 2005). No campo de interesse deste estudo estão as situações em que ícone e palavra justapostos referenciam um mesmo tema e criam, via revezamento, uma redundância cujo objetivo é facilitar aos usuários iletrados a compreensão de um elemento na interface e das alternativas de interação que ele oferece ou implica. Em serviços de e-gov, uma segunda combinação possível apresenta claramente uma natureza de etiquetamento, como nos casos em que os nomes de postos de saúde ou de médicos são acompanhados das respectivas fotos, de modo a facilitar sua identificação pelos usuários e trazer maior fiabilidade à informação. Desse modo, cria-se uma associação direta com o particular, e não mais com a ideia genérica, como comentado no primeiro ensaio.

Em razão de todas essas dimensões da interação entre imagens e textos, buscou-se no terceiro ensaio testar o efeito, na inteligibilidade geral de cada tema, da combinação de elementos imagéticos e textuais e, por extensão, no desempenho esperado no uso dos serviços pelo público-alvo. Com base em resultados de outros estudos realizados no âmbito do projeto STID (BRAGA et al., 2008), relacionados à inteligibilidade de diversas modalidades de registro escrito da língua, o terceiro ensaio buscou também avaliar o efeito do tipo de vocabulário sobre a compreensão dos conteúdos apresentados na interface. Em suma, o terceiro ensaio objetivou, portanto, abordar as seguintes questões: a) interpretação de ícones; b) interpretação de palavras formais isoladas (só para analfabetos funcionais); c) relação simbiótica entre ícones e símbolos menos conhecidos, isto é, como ícones podem ajudar na leitura e interpretação de palavras desconhecidas; d) relação simbiótica entre ícones e símbolos mais conhecidos, isto é, como a junção dos ícones com palavras de uso cotidiano e menos formais ajuda na leitura e interpretação dessas palavras; em que medida essa combinação produz resultados superiores aos casos anteriores (só para analfabetos funcionais). O terceiro ensaio foi realizado no município de Francisco Morato (SP), e dele participaram cinco pessoas, as quais concordaram com as condições do TCLE. O ensaio ocorreu em local frequentado pela comunidade. No início do procedimento, cada sujeito foi submetido a um teste de letramento. Verificou-se que três sujeitos eram analfabetos plenos, um havia sido alfabetizado rudimentarmente e um tinha nível básico de letramento. Todos eram provenientes da zona rural do Nordeste. 7.1 Descrição do ensaio e procedimento Na preparação do ensaio, utilizou-se um aplicativo de apresentação para encadear uma sequência de imagens e palavras, conforme descrito abaixo. Foi utilizado um computador portátil para exibir esses elementos a cada participante. Como não se tratava de um teste de letramento digital, a tarefa de interagir com o teclado ou com o mouse coube aos condutores do ensaio. Cabia a cada participante, sentado junto aos condutores, a tarefa de olhar para a tela e tentar interpretar os elementos exibidos. Cada participante foi estimulado a verbalizar sua interpretação dos elementos exibidos. As observações consideradas mais relevantes foram anotadas.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009

29


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

O ensaio teve quatro etapas: na primeira, seis ícones foram sequencialmente apresentados a cada sujeito. Os condutores perguntaram o significado de cada imagem exibida, anotaram e classificaram a resposta do sujeito (correta, parcialmente correta ou incorreta). Na segunda etapa, a cada sujeito foram sequencialmente mostradas (sem apoio icônico) palavras relacionadas aos ícones vistos anteriormente. Essas palavras estavam representadas através de um registro mais formal de linguagem, conforme a primeira coluna da Tabela 5. Para os sujeitos avaliados como analfabetos plenos, as palavras foram lidas em voz alta pelos condutores, que, em seguida, perguntaram o significado da palavra exibida ou lida. As respostas foram anotadas e classificadas como corretas, parcialmente corretas ou incorretas. Na terceira etapa, foi sequencialmente exibido cada ícone, lado a lado com a respectiva palavra formal, para verificar se a compreensão de um apoiava a do outro. Por fim, na quarta etapa, foram reapresentados os mesmos ícones, desta vez, junto a palavras ou expressões equivalentes às do segundo ensaio, mas supostamente pertencentes a um registro de linguagem menos formal, como visto na segunda coluna da Tabela 5. 7.2 Lista de palavras/ideias Como citado anteriormente, os serviços iniciais oferecidos pelo projeto STID cobrirão as áreas de previdência social e de saúde. Assim, as palavras selecionadas para o terceiro ensaio foram escolhidas por serem recorrentemente usadas em textos/conteúdos de interesse da população (inclusive nos sítios de governo eletrônico em serviço daquelas áreas), embora alguns desses vocábulos não pertençam ao léxico cotidiano do público-alvo. O critério inicial para a proposição dessas duas listas foi criar alternativas para os termos técnicos, na suposição de que esses seriam necessariamente mais difíceis de serem entendidos pela população-alvo. A interação com os sujeitos, todavia, mostrou que, independentemente do fato de a palavra pertencer à linguagem técnica, a facilidade ou dificuldade dos entrevistados em compreendê-la decorre essencialmente de suas experiências cotidianas. Assim, os termos “pré-natal”, “diabetes” e “cardiologista” foram todos facilmente entendidos, pois já eram conhecidos pelos sujeitos, enquanto algumas expressões alternativas propostas causaram dúvidas ou, ainda que entendidas, soaram estranhas. Por outro lado, alguns termos formais, como “aleitamento”, “tabagismo” e “hipertensão” mostraram-se de fato bem menos inteligíveis para os sujeitos que as alternativas propostas:

30

“amamentação”, “vício de fumar” e “pressão alta”, que foram mais facilmente entendidas por serem formadas por termos de uso corrente em registros não técnicos da língua. Na Tabela 5, as palavras ou expressões mais inteligíveis estão destacadas em negrito. Tabela 5 Lista de palavras usadas no ensaio Palavras formais Expressões informais médico de coração cardiologista exame de grávida pré-natal hipertensão pressão alta tabagismo vício de fumar aleitamento amamentação açúcar no sangue diabetes

7.3 Lista dos temas na forma icônica Os ícones selecionados para o tema “saúde” estão ilustrados na Figura 13. Eles foram criados especificamente para este ensaio, e, por não terem sido objeto dos ensaios anteriores, seus graus efetivos de iconicidade ainda não haviam sido validados. O uso de ícones “não otimizados” foi intencional na medida em que permitiria testar de que modo as deficiências de um ícone poderiam ser compensadas pelos textos a ele associados (efeito de ancoragem). Cabe ainda ressaltar que, nas etapas do ensaio referentes à exibição de ícones sem apoio textual, não foram mostrados aos sujeitos os títulos de cada ícone (Figura 13). A tabulação das respostas obtidas foi feita separando os dois sujeitos com alfabetização básica dos três sujeitos identificados como analfabetos plenos. A primeira coluna das Tabelas 6 a 9 indica a que elemento ou combinação de elementos (ícone e/ou texto) se referem os resultados. A segunda coluna soma as respostas corretas para cada tema. A terceira coluna contabiliza as respostas tidas como parcialmente corretas, enquanto a quarta coluna refere-se às respostas totalmente incorretas. Para quantificar a pontuação média obtida por grupo foi adotado o seguinte critério, em cada situação: cada resposta correta valia dois pontos, cada resposta parcialmente correta valia um ponto, e as respostas incorretas valiam zero. Para compensar o menor número de integrantes do primeiro grupo, a pontuação final de cada tabela é dividida pelo número de membros do grupo. A pontuação média obtida por participante está indicada após cada tabela. A pontuação média máxima (que corresponde à interpretação correta de todos os elementos) seria de 12 pontos. As Tabelas 6 a 9 separam as respostas dos sujeitos semianalfabetos e dos sujeitos analfabetos. É importante ressaltar que, dada a incapacidade de leitura de alguns sujeitos, em todos os testes os condutores pronunciavam cada palavra ou expressão presente na imagem.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

Figura 13 Ícones utilizados no terceiro ensaio

Tema 1o ícone 2o ícone 3o ícone 4o ícone 5o ícone 6o ícone

Tema 1a palavra 2a palavra 3a palavra 4a palavra 5a palavra 6a palavra

Tabela 6 Ícones exibidos sem apoio textual Indivíduos semianalfabetos Indivíduos analfabetos Correto Parc. Corr. Incorreto Correto Parc. Corr. Incorreto 1 1 1 2 1 1 1 2 2 2 1 1 1 1 2 2 1 2 2 1 2 Resultado médio individual: 6,5 Resultado médio individual: 5,3 Tabela 7 Palavras formais exibidas sem apoio icônico Indivíduos semianalfabetos Indivíduos analfabetos Correto Parc. Corr. Incorreto Correto Parc. Corr. Incorreto 2 3 2 1 2 1 1 2 1 1 1 1 2 1 1 3 2 3 Resultado médio individual: 5 Resultado médio individual: 5

Tabela 8 Ícones exibidos com apoio de palavras formais Indivíduos semianalfabetos Indivíduos analfabetos Tema Correto Parc. Corr. Incorreto Correto Parc. Corr. Incorreto 1o ícone + 1a palavra 2 3 2o ícone + 2a palavra 2 3 2 3 3o ícone + 3a palavra 4o ícone + 4a palavra 2 1 2 1 5o ícone + 5a palavra 1 2 1 2 3 6o ícone + 6a palavra Resultado médio individual: 11,5 Resultado médio individual: 10 Tabela 9 Ícones exibidos com apoio de palavras informais Indivíduos semianalfabetos Indivíduos analfabetos Tema Correto Parc. Corr. Incorreto Correto Parc. Corr. Incorreto 1o ícone + 1a palavra 1 1 2 1 2o ícone + 2a palavra 2 3 2 2 1 3o ícone + 3a palavra 4o ícone + 4a palavra 2 1 2 5o ícone + 5a palavra 2 2 1 1 1 2 1 6o ícone + 6a palavra Resultado médio individual: 10,5 Resultado médio individual: 8

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009

31


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

7.4 Conclusões do terceiro ensaio Os resultados indicados na Tabela 6 mostram que três dos seis ícones (1º, 4º e 6º) foram pouco efetivos (os condutores observaram que eles geraram hesitação e dúvida nos sujeitos de ambos os grupos). As razões para isso variaram de ícone para ícone: no primeiro caso, a figura do cardiologista não foi reconhecida porque, segundo os próprios entrevistados, o tipo físico e a postura diferiam daquilo que, na experiência dos sujeitos, tal especialista tem (ou costuma ter); no quarto ícone, a imagem foi confundida por alguns como sendo um aviso de não fumar, enquanto outros sujeitos sequer reconheceram o símbolo de proibição, e um sujeito (idoso) nem mesmo reconheceu a embalagem de cigarros; por fim, o sexto ícone mostrou-se complexo (em razão do tema), problema esse agravado, em certa medida, pela dificuldade que alguns sujeitos tiveram em reconhecer os desenhos de doces e também o símbolo de proibição. Entretanto, é importante ressaltar que a baixa iconicidade de parte das imagens era uma condição necessária ao ensaio, pois um dos objetivos era testar em que medida os textos de apoio poderiam favorecer a interpretação dessas imagens. Além disso, era necessário que fosse possível e desejável melhorar os três ícones citados para aumentar sua inteligibilidade na interface final do serviço. Isso não invalidaria o teste das interações entre palavras e ícones que não fossem tão adequados, pois, como já foi discutido, não é possível encontrar ícones que sejam adequados a todos os usuários, nem tampouco conceber ícones que se adaptem perfeitamente a todos os temas necessários às áreas de conhecimento envolvidas (por exemplo, não existe um ícone simples para o conceito “aposentadoria proporcional”). É necessário ter um bom entendimento de como a interação entre ícones e textos pode maximizar a eficácia da interface no atendimento do público-alvo. Por sua vez, os resultados indicados na Tabela 7 mostram que três das seis palavras propostas (1ª, 2ª e 3ª) mostram-se pouco inteligíveis para os sujeitos, e só duas (5ª e 6ª) foram total ou parcialmente entendidas por todos os sujeitos. Esse resultado também era esperado, pois foram escolhidas palavras supostamente fora do léxico conhecido pelos sujeitos testados. De modo complementar ao discutido para os ícones, o objetivo foi avaliar em que medida o apoio icônico favorece o entendimento desses termos. Assim, a principal questão a ser respondida por este ensaio era se a justaposição de ícones e textos (tratando-se de um mesmo tema) aumentaria a inteligibilidade do grupo em comparação ao uso isolado do ícone ou do texto. Como já discutido, essa pergunta é pertinente para o cenário brasileiro, dado o grande número de pessoas, em nossa população, com alguma

32

habilidade de leitura, ainda que rudimentar. A questão se estende até mesmo aos analfabetos plenos, em situações em que eles podem contar com um recurso de conversão texto-fala, a exemplo da solução adotada no projeto STID. Embora o número de sujeitos que participaram do ensaio (cinco pessoas) não tenha possibilitado uma validação dos resultados pela comparação dos dados obtidos no grupo de teste com os obtidos em um grupo de controle (com as mesmas características) − o que permitiria isolar melhor as variáveis envolvidas –, o ensaio mostrou-se rico na coleta de dados. Os resultados fortaleceram a hipótese inicial de que a interpretação conjunta dos elementos sígnicos presentes na interface eleva a inteligibilidade geral. Isso se observa, por exemplo, na pontuação média geral das tabelas referentes ao uso combinado, que foi em torno do dobro da pontuação das tabelas anteriores. Entretanto, o aspecto mais interessante aparece quando comparamos a primeira linha das Tabelas 6, 7 e 8. Esse caso mostra que, apesar de o ícone (Tabela 6) e a palavra (Tabela 7) não terem sido bem entendidos isoladamente, todos os sujeitos reconheceram com êxito a combinação dos dois (Tabela 8), o que mostra o efeito de apoio mútuo. Esses resultados parecem assim confirmar a hipótese de que o efeito combinado de ícones e textos pode ser maior do que a soma dos efeitos isolados de cada um de seus elementos. Conclusão A pesquisa sobre iconicidade aqui descrita buscou criar o conhecimento de como ícones podem facilitar ou tornar possível o acesso de pessoas com baixo letramento aos serviços de cidadania oferecidos pelo STID. O primeiro ensaio mostrou que o uso de fotografias, embora não implique necessariamente maior inteligibilidade, parece causar mais empatia entre os usuários, o que pode se dar em razão de sua conexão mais direta com o mundo real. Diante disso, no âmbito do projeto STID, o uso de fotos foi adotado nos casos em que se quis ilustrar o contexto de um serviço, os locais em que ele é prestado (na localidade do usuário) e os rostos dos profissionais envolvidos. Nesses casos, as fotos trazem um vínculo mais direto com a realidade imediata dos usuários. Já o uso de desenhos mostra um nível de inteligibilidade praticamente igual ao das fotos, porém sem criar um elo direto com o indivíduo, evento ou local específico, portanto, mais adequado à veiculação de informações gerais, como dicas de saúde, prevenção de doenças etc., que são noções mais abstratas ou gerais. Do ponto de vista de esforço necessário à implementação, desenhos dão mais flexibilidade à produção dos temas necessários para guiar a interface ou apoiar os conteúdos.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

O segundo ensaio evidenciou a importância de envolver representantes do público-alvo na busca por elementos que fortaleçam as representações icônicas de uma dada área de conhecimento. Isso enriqueceu os ícones com elementos que reduziram sua ambiguidade e aumentaram sua efetividade. As informações colhidas mostraram a importância da participação de diversas faixas etárias, pois permitiu identificar necessidades e ideias diferentes para a elaboração dos ícones. O terceiro ensaio mostrou que o uso de ícones pode reforçar e complementar as habilidades de linguagem das pessoas com baixo letramento. Viu-se que o efeito combinado de ícones e textos foi, em alguns casos, maior do que a soma dos efeitos isolados de cada um desses elementos. Em contrapartida, os casos em que a soma das partes é maior que o efeito combinado indicam a ocorrência de redundâncias, as quais, para esse público-alvo, são oportunas pois dão aos usuários mais base para hipóteses corretas. No que se refere à adoção de expressões ou palavras mais simples, ficou claro que é preciso sempre respeitar as experiências do público-alvo, pelo qual até mesmo termos técnicos podem já ser conhecidos se constantemente usados: se ao marcar hora no posto de saúde os atendentes falam de “cardiologista” e não de “médico do coração”, é a palavra “cardiologista” que passa a integrar o vocabulário dos usuários. Porém, essa questão não foi o foco principal deste estudo, e é tema para uma pesquisa específica. Por fim, é importante salientar que os ícones foram construídos e aperfeiçoados por meio dos ensaios. A participação do público foi fundamental, assim como o emprego de diferentes metodologias de pesquisa para estudar problemas distintos. Os ícones resultantes foram testados em campo, no contexto das interfaces finais dos serviços de governo eletrônico. Os ícones usados eram grandes o bastante para facilitar a identificação de seus elementos, e estavam, além disso, associados a rótulos textuais explicativos. Indicando botões de opções de navegação ou de ação (escolha de uma especialidade médica, por exemplo), eles foram compreendidos por usuários com variados níveis de escolaridade. Confirmou-se que, conforme discutido, a redundância da associação de textos e ícones produz um efeito de reforço. Do ponto de vista dos usuários com pouca habilidade de leitura, os ícones cumpriram a função de facilitar a navegação e a compreensão, sem eliminar os conteúdos textuais. Os resultados atestam a importância dos ensaios de campo com o público-alvo para compreender como criar ícones mais adequados aos usuários. O trabalho de campo permitiu extrair muitas informações para a elaboração de ícones inteligíveis para esses usuários.

Agradecimentos Este estudo foi empreendido com o apoio do Fundo para o Desenvolvimento Tecnológico das Telecomunicações (FUNTTEL), do Ministério das Comunicações. Agradecemos às professoras Cecília Baranauskas (Unicamp) e Lucia Filgueiras (USP) e a suas equipes pela ajuda na realização dos ensaios. Somos gratos também a Rafael Faria Carvalho, pela elaboração dos ícones, a Lara S. Godoy Piccolo, pela colaboração na condução dos ensaios, e a José Carlos Lima Pinto, pela ajuda na tabulação dos resultados. Referências AHMED, A. S.; SEONG, D. S. K. SignWriting on mobile phones for the deaf. In: THE ACM INTERNATIONAL CONFERENCE PROCEEDING SERIES, Bangkog. Proceedings... ACM Press, 2006. v. 270, n. 28. ISBN:1-59593-519-3. AKAN, K. D. et al. eScreening: Developing an Electronic Screening Tool for Rural Primary Care. In: SYSTEMS AND INFORMATION ENGINEERING DESIGN SYMPOSIUM, 2006. Proceedings... IEEE, 2006. p. 212-215. ÁVILA, I.; HOLANDA, G. M. Inclusão digital no Brasil: uma perspectiva sociotécnica. In: SOUTO, A. A. et al. (Org.). As cidades digitais no mapa do Brasil: uma rota para a inclusão social. 1. ed. Brasília: Ministério das Comunicações, 2006. p. 13-60. ISBN 85-60450-00-9. ÁVILA, I. et al. Interaction Models for Digital Inclusion of Low-literacy, Aged and Impaired Users in Brazil. In: LATIN AMERICAN CONFERENCE ON HUMAN-COMPUTER INTERACTION (CLIHC), 2007, Rio de Janeiro. Proceedings... 2007. BIASIOTTI, M. A.; NANNUCCI, R. Converting online public legal information into knowledge: “ABC del diritto” an italian e-government citizenoriented service. In: THE 7th ANNUAL INTERNATIONAL CONFERENCE ON DIGITAL GOVERNMENT RESEARCH (DG.O), 7., 2006, San Diego. Proceedings... New York: ACM Press, 2006. p. 62-66, v. 151. BRAGA, D.B. et al. Novas Linguagens e Modelos de Interação. Campinas: Unicamp, 2008. p. 53-54. (relatório do Instituto de Estudos da Linguagem da Unicamp para o projeto STID). BREWSTER, S. A. Using nonspeech sounds to provide navigation cues. ACM Transactions on Computer-Human Interaction, v. 5, n. 3, p. 224-259, 1998.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009

33


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

CAVENDER, A. et al. MobileASL: Intelligibility of sign language video as constrained by mobile phone technology. In: ACM SIGACCESS CONFERENCE ON COMPUTERS AND ACCESSIBILITY, 8., 2006. Proceedings... New York: ACM Press, 2006. p. 71-78. CHAND, A.; DEY, A. K. Jadoo: a paper user interface for users unfamiliar with computers. In: CONFERENCE ON HUMAN FACTORS IN COMPUTING SYSTEMS (CHI), 2006, Montréal. Proceedings... New York: ACM Press, 2006. p. 1625-1630. CHINN, M. D.; FAIRLIE, R. W. The determinants of the global digital divide: a cross-country analysis of computer and Internet penetration. Oxford Economic Papers, Oxford University Press, p. 16-44, 2006. EIRIKSDOTTIR, E. et al. User preferences for auditory device-driven menu navigation. In: HUMAN FACTORS AND ERGONOMICS SOCIETY, 50., 2006 Proceedings... San Francisco, 2006. p. 2076-2078. FACCHINI, L. A. et al. Ícones para mapas de riscos: uma proposta construída com os trabalhadores. Cadernos de Saúde Pública, v. 13, n. 3, p. 497-502, set. 1997.

on the Internet by synthesized animation. ACM Transactions on Computer-Human Interaction, v. 14, n. 3, 2007. LÉVI-STRAUSS, C. As organizações dualistas existem? In: _______. Antropologia Estrutural. 3. ed. Rio de Janeiro: Tempo Brasileiro, 1975. MARTINS, S.; FILGUEIRAS, L. Métodos de avaliação de apreensibilidade das informações textuais: uma aplicação em sítios de governo eletrônico. In: CONGRESSO LATINOAMERICANO DE INTERAÇÃO HUMANOCOMPUTADOR, 2007, Rio de Janeiro. Anais... MATTA, R. da. A morfologia da sociedade Apinayé. In: _______. Um mundo dividido: a estrutura social dos índios Apinayé. Petrópolis: Vozes, 1976. MEDHI, I. et al. Optimal audio-visual representations for illiterate users of computers. In: INTERNATIONAL WORLD WIDE WEB CONFERENCE (WWW), 16., 2007, Alberta. Proceedings... New York: ACM Press, 2007a. p. 873-882. MEDHI, I. et al. Text-free user interfaces for illiterate and semi-literate users. MIT Press Journals, v. 4, n. 1, p. 37-50, 2007b.

FAJARDO, I. et al. Towards a Cognitive Accessibility Guideline based on Empirical Evidences of Deaf Users Web Interaction. In: INTERNATIONAL CONFERENCE ON HUMANCOMPUTER INTERACTION, 10., 2003, Crete. Proceedings... p. 950-954.

MUCKENHAUPT, M. Text und Bild. Tübigen: Narr., 1986.

GOETZE, M.; STROTHOTTE, T. An Approach to Help Functionally Illiterate People with Graphical Reading Aids. In: INTERNATIONAL SYMPOSIUM, 1., 2001, Hawthorn. Proceedings... p. 129-135.

PETRIE, H. et al. Augmenting icons for deaf computer users. In: CONFERENCE ON HUMAN FACTORS IN COMPUTING SYSTEMS (CHI), 2004. Extended Abstracts on Human Factors in Computing Systems, New York: ACM Press, 2004. p. 1131-1134.

HOLANDA, G. M.; DALL'ANTONIA, J. C. An Approach for e-inclusion: Bringing illiterates and disabled people into play. Journal of Technology Management and Innovation, 3rd ed., v. 1, p. 29-37, 2006. Disponível em: <http://www.jotmi.org>. Acesso em: jun. 2007. HUENERFAUTH, M. P. Design Approaches for Developing User-Interfaces Accessible to Illiterate Users. In: AMERICAN ASSOCIATION OF ARTIFICIAL INTELLIGENCE (AAAI2002) CONFERENCE, 18., 2002, Edmonton. Intelligent and Situation-Aware Media and Presentations Workshop. Edmonton: AAAI Press, 2002. KENNAWAY, J. R. et al. Providing signed content

34

NIEMEYER, A. M. O lugar da pobreza: moradia e controle de espaço na favela. Tese (Doutorado) – apresentada à FFLCH. São Paulo: USP. 1985.

PILLING, D.; BOELTZIG, H. Moving toward egovernment: effective strategies for increasing access and use of the internet among noninternet users in the U.S. and U.K. In: THE 8th ANNUAL INTERNATIONAL CONFERENCE ON DIGITAL GOVERNMENT RESEARCH (DG.O), 8., 2007. Proceedings... Digital Government Research Center, 2007. p. 35-46. PLAUCHÉ, M. et al. Speech Recognition for Illiterate Access to Information and Technology. In: INTERNATIONAL CONFERENCE ON INFORMATION AND COMMUNICATION TECHNOLOGIES AND DEVELOPMENT (ICTD 2006). Proceedings... University of California, Berkeley, 2006.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais

PREECE, J. et al. Design de interação: além da interação homem-computador. Porto Alegre: Bookman, 2005. ROCHA, H. da; BARANAUSKAS, M. C. Design e avaliação de interfaces humano-computador. São Paulo: IME-USP, 2000. SANTAELLA, L.; NÖTH, W. Imagem: Cognição, semiótica e mídia. 4. ed. São Paulo: Iluminuras, 2005. SCHNELLE, D.; LYARDET, F. Voice User Interface Design Patterns. In: EUROPEAN CONFERENCE ON PATTERN LANGUAGES OF PROGRAMS (EUROPLOP), 11., 2006, Bavaria. Proceedings... 2006.

TAKAGI, H., et al. Accessibility designer: visualizing usability for the blind. In: ACM SIGACCESS CONFERENCE ON ASSISTIVE TECHNOLOGIES. Proceedings... New York: ACM Press, 2004. p. 177-184. WAICHMAN, A. V. et al. Do farmers understand the information displayed on pesticide product labels? A key question to reduce pesticides exposure and risk of poisoning in the Brazilian Amazon. Crop Protection, v. 26, n. 4, p. 576-583, 2007. ZAJICEK, M.; HALL, S. Solutions for elderly visually impaired people using the Internet. In: PEOPLE AND COMPUTERS XIV – USABILITY OR ELSE. Proceedings... 2000. p. 299-308.

Abstract The literacy level of a significant part of the Brazilian population is insufficient for proficiently using computers and accessing digital contents such as those available on the Web. Although the problem of digital inclusion of illiterates is not restricted to Brazil, its characteristics strongly depend on many educational and sociocultural factors of each country. Thus, most of the related research done in other countries does not adequately match the Brazilian context, which is characterized by a higher prevalence of functional illiteracy, rather than total illiteracy, and where multilingualism is marginal. Therefore, besides the use of icons as facilitators of the interaction of low-literacy users with computers, similar to what has been reported in places such as India, we investigated how icons interact with the reading skills of semiliterate users. The latter is one of the main issues that needs to be addressed in Brazil, given the educational level of its population. Thus, this research addresses the use of icons both as support in the understanding of computer interface-mediated ideas and information, and as a reinforcement of unfledged reading skills. Key words: Icons. Digital inclusion. Human factors in HCI. Low-literacy. Older users.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 15-36, jul./dez. 2009

35


Equalização e identificação adaptativas de canais utilizando marca d’água Mário Uliani Neto*, Leandro de Campos Teixeira Gomes, João Marcos Travassos Romano** O objetivo deste trabalho é investigar o uso de marca d’água digital como sinal de referência na filtragem adaptativa supervisionada aplicada a problemas de equalização e identificação de canais de transmissão. Ao contrário de métodos mais tradicionais, nos quais a comunicação é periodicamente interrompida para a transmissão de sequências de treinamento, a marca d’água é transmitida sem interrupções, juntamente com o sinal de informação. Por meio da comparação entre o sinal recebido processado pelo filtro equalizador e a marca d’água original, ou entre o sinal recebido e a marca d’água processada pelo filtro identificador, os coeficientes do filtro são continuamente adaptados para estimar e rastrear as características do canal ao longo do tempo. Nem a transmissão de informação útil nem a adaptação do filtro equalizador/identificador são interrompidas. No caso de sinais que apresentem uma interpretação sensorial (e.g. áudio, imagens, vídeo), a adição da marca d’água não deve causar distorção perceptível no sinal original. Este trabalho propõe ainda a utilização de um modelo psicoacústico em conjunto com um algoritmo de conformação espectral para demonstrar a viabilidade do método quando aplicado a sinais de áudio. Resultados de simulações computacionais são apresentados para evidenciar o desempenho das propostas em comparação a técnicas tradicionais de filtragem adaptativa supervisionada. Palavras-chave: Filtragem adaptativa. Equalização adaptativa. Identificação adaptativa. Marca d'água digital. Superimposed training. Introdução As primeiras técnicas envolvendo marca d’água digital foram propostas em meados dos anos 90 (GOMES et al., 2003) como solução potencial ao problema da pirataria de documentos multimídia, em particular áudio, imagens e vídeo. Trata-se da inserção de uma marca, a marca d’água, no sinal que se deseja proteger (dito original ou hospedeiro). A marca é um sinal adicionado a um sinal hospedeiro (e.g. um sinal de áudio, uma imagem ou um sinal de vídeo) de mesma natureza. O documento multimídia é modificado pela adição da marca d’água, mas sua qualidade sonora e/ou visual pode ser preservada por meio da exploração de fenômenos psicoacústicos (ZWICKER; FASTL, 1990) e/ou psicovisuais. O sinal de marca d’água contém dados que podem ser extraídos por um detector. Esses dados podem, por exemplo, informar a equipamentos compatíveis quais são os direitos do usuário sobre o sinal. A marca d’água pode, por sua vez, indicar, principalmente, se a duplicação do sinal hospedeiro é ou não permitida. O domínio de aplicação da marca d’água é hoje muito mais amplo do que a proposta inicial de proteção contra a pirataria, incluindo a inserção de informações complementares em uma gravação e de elementos indicativos de sua origem. Ao longo da literatura científica, o estudo das técnicas de marca d’água limitou-se essencialmente a sinais com uma interpretação perceptiva imediata (tais como sinais de áudio e

imagens) (GOMES et al., 2003), sem que houvesse uma razão fundamental para essa limitação. De fato, qualquer sinal passível de processamento pode ser marcado. Técnicas tradicionais de equalização ou identificação supervisionada baseiam-se geralmente na transmissão periódica de sinais conhecidos (sequências de treinamento) (ATTUX, 2005). Durante os períodos de treinamento, a transmissão do sinal que transporta informação útil (doravante denominado sinal de informação) é interrompida. No entanto, em aplicações em tempo real, tais interrupções podem ser inaceitáveis. Além disso, as mudanças nas características do canal de transmissão somente são levadas em conta pelo filtro de equalização ou identificação a partir do período de treinamento subsequente. Uma alternativa ao uso de sequências de treinamento são os métodos não supervisionados ou cegos, baseados somente no sinal recebido e em características estatísticas do sinal inicialmente transmitido. A inexistência da sequência de treinamento faz com que os métodos não supervisionados (HAYKIN, 2001) utilizem uma estimativa não linear do sinal transmitido como sinal de referência, introduzindo alguns problemas que não estão presentes no caso supervisionado (HAYKIN, 2001), como a existência de soluções subótimas (mínimos locais da função custo a ser minimizada). A abordagem deste trabalho propõe o uso de

*Autor a quem a correspondência deve ser dirigida: uliani@cpqd.com.br. **Coordenador do Laboratório de Processamento de Sinais para Comunicações Móveis (DSP-COM) da Universidade Estadual de Campinas (Unicamp). Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Equalização e identificação adaptativas de canais utilizando marca d’água

uma marca d’água em lugar de uma sequência de treinamento (ULIANI NETO, 2008). O sinal de marca d’água é continuamente superposto ao sinal de informação por meio da técnica de espalhamento espectral, que consiste no uso, como marca d’água, de um sinal pseudoaleatório uniformemente distribuído em frequência e de forma ortogonal em relação ao sinal de informação, ocupando uma pequena parcela da potência disponível para o sinal transmitido. O sinal resultante dessa superposição passa através de um canal de transmissão e atinge o receptor. Por meio da comparação entre o sinal recebido e a marca d’água original (conhecida no receptor), os coeficientes do filtro são continuamente atualizados. A diferença entre os sinais produz um sinal de erro que é realimentado no próprio filtro. A minimização desse sinal de erro leva à solução ótima de Wiener (HAYKIN, 2001). A principal vantagem dessa abordagem em relação a técnicas convencionais supervisionadas é o fato de que o sinal de informação nunca é interrompido. Além disso, a atualização dos coeficientes do filtro adaptativo é contínua e, portanto, as alterações nas características do sistema têm efeito imediato sobre a filtragem. Em relação às técnicas não supervisionadas, a vantagem da técnica da marca d’água é a obtenção de uma função custo unimodal e, na maioria dos casos, a menor complexidade. O artigo está estruturado como descrito a seguir: a Seção 1 apresenta uma breve revisão da marca d’água digital. Nas Seções 2 e 3, são apresentadas as técnicas de equalização e identificação adaptativas com o uso de marca d’água e os resultados que ilustram o funcionamento do método proposto. A Seção 4 analisa as técnicas de equalização e identificação adaptativas aplicadas a sinais de áudio e as técnicas perceptivas que exploram fenômenos psicoacústicos. Finalmente, a última parte, a Conclusão, apresenta algumas considerações finais e perspectivas de trabalhos futuros. 1 Marca d’água digital: breve revisão Com o crescente uso, no final do século XX, de

informação em formato digital, tornou-se simples duplicar documentos e distribuir suas cópias com agilidade (por exemplo, por meio da Internet), muitas vezes sem respeito à propriedade e aos direitos autorais. Em resposta a esse problema, surgiram, em meados da década de 1990, as primeiras propostas para inserção de marca d’água em conteúdos digitais (TIRKEL et al., 1993), a chamada marca d’água digital. Desde então, a quantidade de aplicações utilizando marca d’água digital vem crescendo de forma considerável, alavancando o desenvolvimento de novas técnicas e atraindo a atenção tanto de entidades acadêmicas quanto de empresas comerciais. Por ser uma área de estudo relativamente recente, é permeada por outras disciplinas, embora tenha como base técnicas de processamento de sinais e criptografia e esteja estreitamente relacionada com teorias da informação e da codificação. A marca d’água digital foi proposta inicialmente como uma solução potencial no combate à pirataria. Ela consiste em adicionar uma marca no sinal que se deseja proteger. Essa marca não deve degradar a qualidade perceptiva do sinal protegido (propriedade de transparência), mas precisa ser detectável e indelével. Para garantir transparência, a marca d’água pode utilizar informações perceptivas (psicoacústicas, no caso de um sinal de áudio, ou psicovisuais, no caso de uma imagem). Além disso, a marca d’água deve ser robusta, de modo que garanta sua permanência mesmo quando o sinal sofrer manipulações que, de alguma forma, o alterem. Um algoritmo de marca d’água pode ser encarado como um sistema de comunicação (GARCIA, 1999): nessa analogia, a marca d’água corresponde ao sinal transmitido, enquanto o sinal hospedeiro (juntamente com as distorções impostas ao sinal marcado) é visto como um ruído que, em geral, tem uma potência muitas vezes maior do que a da própria marca d’água. Assim, conceitos da teoria da comunicação podem ser estendidos aos sistemas de marca d’água. Essa abordagem é ilustrada na Figura 1. Nesse modelo, a mensagem a ser transmitida é convertida no sinal de marca d’água por um processo de modulação. Em seguida, a marca

Figura 1 Marca d’água como um sistema de comunicação

38

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Equalização e identificação adaptativas de canais utilizando marca d’água

d’água é adicionada ao sinal hospedeiro, gerando o sinal marcado. Esse processo pode ser modelado como uma adição de ruído ao sinal de marca d’água. O sinal marcado pode então sofrer uma distorção em razão dos efeitos do canal de transmissão, gerando o sinal marcado distorcido. Os processos de adição de ruído e distorção são considerados um canal de transmissão hostil. Por fim, o sinal marcado distorcido é entregue ao receptor, que tentará detectar a mensagem transmitida. Em um sistema convencional de comunicação, o sinal transmitido é geralmente mais potente do que o ruído, que é muitas vezes assumido como Porém, essas gaussiano e branco1. considerações não são verdadeiras em um sistema de marca d’água. Para que a marca não degrade demasiadamente o sinal hospedeiro, é essencial que ela seja muitas vezes mais fraca do que este, em termos de potência. Além disso, o sinal hospedeiro pode ser não estacionário e colorido, como no caso de sinais de áudio. Quando um sistema de marca d’água é visto como um sistema de comunicação, três fontes de ruído podem ser identificadas: • o sinal hospedeiro, bem mais potente do que a marca d’água; para aplicações de áudio, essa relação é da ordem de 20 dB (GOMES et al., 2000); • distorções introduzidas por operações lícitas, como compressão/descompressão, filtragem e ruído do canal de transmissão; • distorções introduzidas por operações ilícitas, tais como ataque de piratas (hackers) que tentam tornar a marca indetectável. O sinal hospedeiro não marcado, em geral, é conhecido apenas no transmissor. Para sinais de áudio, de forma similar à mencionada, a ideia consiste em adicionar a esse sinal de áudio uma sequência pseudoaleatória de espectro branco, formada a partir de uma mensagem que se deseja ocultar. O esquema geral da técnica encontra-se na Figura 2. Para garantir inaudibilidade e atingir o maior nível possível de potência para a marca d’água, exploram-se conceitos relativos ao sistema auditivo humano. A sequência pseudoaleatória passa por um processo de conformação espectral guiado pelo limiar de mascaramento do sinal de áudio, obtido por meio de um modelo psicoacústico. Experimentos psicoacústicos mostraram que o sistema auditivo humano não consegue perceber um tom ou sinal de banda estreita na presença de outro sinal suficientemente forte e próximo em frequência. Trata-se do chamado efeito de mascaramento (HUMMES; JESTEADT, 1989; MOORE, 1989). Quando generalizado a sinais de banda larga, o efeito de mascaramento tonal ou

de banda estreita é substituído pelo limiar de mascaramento, correspondente a uma curva análoga a uma densidade espectral de potência. Caso a densidade espectral de potência de um sinal de áudio esteja abaixo do limiar de mascaramento de outro sinal de áudio para todas as frequências, o primeiro sinal é mascarado pelo segundo, e sua presença não é detectada pelo ouvido humano quando ambos os sinais são reproduzidos simultaneamente. Os algoritmos para cálculo do limiar de mascaramento associado a um sinal de áudio são chamados de modelo psicoacústico. Em codificadores de áudio, os modelos psicoacústicos são aplicados a janelas do sinal, normalmente de algumas dezenas de milissegundos. O mesmo princípio pode ser usado para garantir a inaudibilidade da marca d’água: se, para cada janela, a densidade espectral de potência da marca d’água estiver abaixo do limiar de mascaramento do sinal de áudio, a marca não será percebida na presença desse sinal. 1.1 Inserção de marca d’água utilizando espalhamento espectral O método de marca d’água baseado em espalhamento espectral foi proposto por Cox et al. (1997). Seu uso é o mais difundido e vem sendo bastante estudado na literatura (COX et al, 1997; CVEJIC; KESKINARKAUS; SEPPIINEN, 2001; GOMES et al., 2003; KIM, 2000; LEE; HO, 2000; SWANSON et al., 1998). O método é eficiente e de implementação relativamente simples, mas apresenta a desvantagem de ser suscetível a distorções temporais. A ideia básica do método de espalhamento espectral consiste em adicionar uma sequência pseudoaleatória de banda larga ao sinal hospedeiro. Essa adição pode se dar no domínio do tempo ou no domínio de uma transformada do sinal; neste último caso, são comuns as transformadas DCT (transformada cosseno discreta), DFT (transformada de Fourier discreta) e DWT (transformada wavelet discreta). Um esquema típico de inserção de marca d’água utilizando espalhamento espectral é ilustrado na Figura 3. A mensagem binária da marca d’água b(n) = {−1,1} é modulada por uma sequência pseudoaleatória r (n ) . A marca d’água modulada w(n) = b( n) r ( n) é escalonada de acordo com a energia do sinal hospedeiro s(n ) . O fator de escala α controla a relação entre robustez e transparência da marca d’água. A marca modulada w (n ) é igual a r (n ) ou −r (n ) , dependendo se b = 1 ou b = − 1 . O sinal modulado é adicionado ao sinal hospedeiro para produzir o sinal marcado x (n ) , seguindo a relação x ( n ) = s ( n ) + αw ( n ) .

___________________________________________

1 Sinal dotado de um conteúdo uniforme e de extensão infinita em frequência.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009

39


Equalização e identificação adaptativas de canais utilizando marca d’água

Figura 2 Esquema de marca d’água digital em áudio

Figura 3 Esquema de inserção de marca d’água utilizando espalhamento espectral

A adição de uma sequência pseudoaleatória a um sinal de áudio, por exemplo, pode causar distorções perceptíveis. Apenas reduzir o fator α da sequência pseudoaleatória pode não resolver o problema de transparência, ou seja, um ruído, mesmo com pequenas amplitudes, pode ser perceptível. Além disso, baixos valores do fator α tornam o método de espalhamento espectral menos robusto, pois diminui-se o valor da autocorrelação na presença do sinal hospedeiro. Uma solução para garantir a inaudibilidade da marca d’água é conformá-la espectralmente segundo um limiar de mascaramento produzido por um modelo psicoacústico (BASSIA; PITAS; NIKOLAIDIS, 2001; BONEY; TEWFIK; HAMDY, 1996; GOMES et al., 2003), conforme marcado com uma linha tracejada na Figura 3. A conformação espectral da marca d’água possibilita aumentar a robustez do sistema e, consequentemente, maximizar o fator de escala α e aproximar do limiar de audibilidade. A detecção no método de espalhamento espectral baseia-se em correlação linear. A sequência r (n ) é conhecida ou pode ser gerada no receptor. A marca d’água é detectada através da correlação entre x (n ) e r (n ) , da seguinte forma:

40

c=

1 N

N

∑ x (i ) r (i )

(1)

i =1

onde N denota o tamanho do sinal. A equação 1 pode ser expandida na soma de duas componentes: c=

1 N

N

1

N

∑ s (i ) r (i) + N ∑ α b (i) r i =1

i =1

2

(i )

(2)

Assume-se que o primeiro termo na equação 2 tem baixas magnitudes, pois os sinais não devem apresentar correlação entre si. Outros métodos de detecção utilizam filtragem passa-alta (HARTUNG; GIROD, 1998), codificação preditiva linear (SEOK; HONG; KIM, 2002) e técnicas de branqueamento (KIM, 2000) para tornar os sinais x (n ) e r (n ) independentes entre si e aumentar a robustez do sistema. 2

Equalização supervisionada baseada em marca d'água

Esta seção apresenta um método de equalização baseado no uso de marca d’água como sinal de referência. A marca d’água é conhecida no receptor, sendo utilizada para estimar os parâmetros do equalizador. Nem a marca d’água nem o sinal de informação são interrompidos,

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Equalização e identificação adaptativas de canais utilizando marca d’água

evitando períodos sem transmissão de informação útil e permitindo que os coeficientes do equalizador sejam continuamente atualizados. Nesse esquema, parte da potência do sinal de transmissão deve ser destinada à marca d’água, o que implica uma redução da potência do sinal de informação. O sucesso dessa abordagem depende da adequada distribuição de potências, refletida na relação sinal-marca d’água (Signalto-Watermark Ratio – SWR). Uma técnica similar à que propomos é conhecida como superimposed pilot training (CHEN; ZHOU, 2004; TUGNAIT; LUO, 2003; TUGNAIT; MENG, 2004; VARMA et al., 2005). O paradigma que norteia essa técnica consiste em sobrepor ao sinal de informação, por adição aritmética, uma sequência de dados-piloto conhecida; essa sequência é detectada no receptor e usada para estimar características do canal de transmissão. A técnica superimposed training não está focada na transparência da sequência-piloto; isso significa que um receptor que não esteja preparado para reconhecer a sequência-piloto irá percebê-la como um ruído que pode afetar diretamente o desempenho do sistema. Por outro lado, o paradigma da marca d’água é focado na transparência, assegurando compatibilidade com receptores existentes que não estejam preparados para reconhecer a marca (ditos receptores legados). Embora também encarada como ruído, a marca d’água é idealizada de maneira que sua influência na detecção e percepção do sinal de informação isolado seja insignificante. Outro diferencial em relação à técnica superimposed training é a abordagem genérica do método proposto, que pode ser aplicado a sinais de qualquer natureza, incluindo sinais com interpretação sensorial (e.g. áudio e imagens). 2.1 Descrição do algoritmo Um esquema clássico de equalização supervisionada a partir de uma medida de erro utilizando sequência de treinamento é apresentado na Figura 4. Esse método tem como base a comparação da saída y (n ) do equalizador com um sinal d (n ) de referência, produzindo um sinal de erro e(n ) . O sinal de referência d (n ) é idêntico à sequência de treinamento s(n ) transmitida.

Quando o equalizador é adequadamente ajustado, o sinal de erro e(n ) é minimizado, o que implica uma saída do equalizador y (n ) mais próxima possível do sinal s(n ) transmitido, de acordo com um critério estabelecido. Essa operação é efetuada periodicamente para rastrear eventuais variações do canal. O erro quadrático médio, utilizado como função de custo, é dado por: 2 J = E  e (n)   

(3)

A equação acima expressa o critério de Wiener, cuja solução é obtida por meio da sua minimização com respeito aos coeficientes w do equalizador: 2 J min (w ) = min E  e (n)    w

(4)

Os coeficientes ótimos w 0 do equalizador são dados por:

(

2 w 0 = arg min E  e (n)    w

)

(5)

No método aqui proposto, em vez de substituir o sinal de informação pela sequência de treinamento, transmite-se continuamente uma marca d’água sobreposta ao sinal de informação, utilizando a técnica de espalhamento espectral para inserção da marca d’água: s ( n ) = t ( n ) + α m m( n )

(6)

onde t (n ) é o sinal de informação, m(n ) a marca d’água e α m um fator de escala. O sinal de marca d’água é construído a partir de uma sequência pseudoaleatória e é descorrelacionado com o sinal de informação t (n ) . A marca d’água escalonada é usada como sinal de referência: d (n ) = α m m( n )

(7)

Considerando-se um sistema linear, o sinal recebido x (n ) pode ser visto como a soma dos

% (n) , onde t% (n) e m% (n) são sinais t% ( n) e α m m versões distorcidas do sinal de informação e da marca d’água, respectivamente. De forma similar, a saída do equalizador linear y (n ) pode ser vista como a soma dos sinais tˆ( n) e

α m mˆ (n) ,

ˆ (n) são versões onde tˆ( n) e m equalizadas dos sinais de informação e marca d’água recebidos. Esse esquema é ilustrado na Figura 5. O sinal de erro e(n ) é expresso como: Figura 4 Esquema clássico de equalização supervisionada

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009

e(n) = y (n) − d (n) = tˆ(n) − α m (m(n) − mˆ (n))

(8)

41


Equalização e identificação adaptativas de canais utilizando marca d’água

do equalizador. Pode-se representar o sinal x( n) na entrada do equalizador como:

x(n) = H.s(n) s( n )

onde

H ∈ℜ

(14) é

o

sinal

transmitido

e

M x ( M + N −1)

é a matriz de convolução do canal e M é a ordem do equalizador. Consideram-se um canal de resposta impulsiva finita (FIR) de ordem N e coeficientes h = [ h0 L hN −1 ]T . A matriz de convolução, obtida a partir dos coeficientes h , é uma matriz Toeplitz:

Figura 5 Esquema de equalização utilizando marca d’água

A função custo J , definida como a esperança do erro quadrático e 2 ( n) , será2:

J = E e 2 (n)  = E (tˆ(n) − α m (m (n) − mˆ (n))) 2  (9) A equação 9 pode ser reescrita em notação matricial. Define-se m ( n) e t ( n) como3:

m (n) = [ m(n) , m(n −1),..., m(n − M + 1) ]

T

t (n) = [t (n), t (n − 1),..., t (n − M + 1) ]

T

Os vetores m ( n) e t ( n) têm comprimento 4

(10) (11) M,

onde M expressa o número de coeficientes do equalizador. Define-se s( n) como:

s( n) = t ( n) + α m m ( n)

(12)

com s( n) apresentando dimensão igual à do equalizador. Expandindo-se a função custo definida em 3, obtém-se a forma canônica da superfície de erro expressa em forma matricial:

J (w ) = σ d2 − w T p − pT w + w T Rw

(13)

onde R é a matriz de autocorrelação (dimensão M × M ) na entrada do equalizador, p é o vetor de correlação cruzada (dimensão M ×1 ) entre a entrada do equalizador e a resposta desejada do mesmo, σ d2 é a variância do sinal de referência, e w (dimensão M ×1 ) denota os coeficientes

 h0 0  H= M  0  0

L

hN −1

0

0

L

h0 0

L O

hN −1 O

0 O

O 0

O L

0 0

h0 0

L h0

hN −1 L

0  0   M  (15)  0  hN −1  

De posse da relação 14, a matriz de autocorrelação R pode ser escrita da seguinte forma:

R = E  x(n)xT (n)  = HE s(n)sT (n)  HT

(16)

Expandindo o sinal s( n) por meio da equação 12, obtém-se:

R = α m2 HE m(n)mT (n)  HT + HE t (n)tT (n)  HT (17) 2 onde α m

representa a variância da marca

d’água. O termo HE [m ( n)mT ( n)]HT expressa

% ( n) e a matriz de autocorrelação do sinal m HE [t ( n)tT ( n)]HT a matriz de autocorrelação do sinal t% ( n) , e serão representados por R m% e R t% , respectivamente. Obtém-se como resultado: R = α m2 R m% + R t% (18) O vetor p de correlação cruzada entre o sinal na entrada do equalizador e da marca d’água (sinal de referência) pode ser escrito da seguinte forma:

p = E [ x(n)α m m(n − d )] = α m HE [s(n)m(n − d )] (19) onde d é o atraso de equalização. Como t ( n) e

m (n) são independentes, obtém-se: % ( n) m ( n − d ) ] p = α m2 HE [m

(20)

______________________________________________

2 As definições contidas no texto, para simplificação, têm sempre como base sinais reais. 3 O tipo negrito é usado para denotar grandezas vetoriais e matriciais. 4 Quando se lida com sinais complexos, é necessário substituir a transposição matricial simples pelo operador hermitiano.

42

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Equalização e identificação adaptativas de canais utilizando marca d’água

% (n)m(n − d )] representa a O termo HE [m correlação cruzada entre a versão distorcida (na entrada do filtro) e original (sinal desejado de referência) da marca d’água, e será expresso por p m% . Com isso: p = α m2 p m%

(21)

Os termos R m% e R t% mostrados na equação 18 representam as matrizes de autocorrelação das versões distorcidas da marca d’água e do sinal de informação, respectivamente. O termo p m% apresentado na equação 21 é a correlação cruzada entre a versão distorcida e original da marca d’água. Substituindo 18 e 21 na equação 13, obtém-se:

w 0 = R −1p =

w 0 = R −1p = α m2 (α m2 R m% + R t% ) −1 p m%

(23)

A presença da matriz de correlação R t% nas equações 22 e 23 implica uma dependência da solução de Wiener com relação ao sinal de informação. Portanto, em geral, não basta o conhecimento prévio do sinal de marca d’água para que seja possível o ajuste dos coeficientes do equalizador. Nas próximas seções será demonstrado como o esquema de equalização utilizando marca d’água pode ser usado para obtenção da solução que inverte o canal, apesar da dependência do método com relação às características do sinal de informação. 2.2 Equalização com sinais descorrelacionados Nesta seção, o sinal de informação é considerado descorrelacionado (não há correlação entre o sinal e as versões atrasadas do mesmo) em razão das técnicas de embaralhamento, hipótese mais usual em transmissão digital. Supomos ainda o sinal de marca d’água normalizado e de espectro branco. Com isso, a esperança E[m(n)mT (n)] torna-se uma matriz identidade. O termo E[t ( n)t T ( n)] , por sua vez, é uma matriz diagonal, cujo valor é dado pela variância σ t2 do sinal t ( n) . Assim, a matriz R representada na equação 17 pode ser reescrita como:

R = α m2 HHT + σ t2 HHT = (α m2 + σ t2 )HHT (24) Portanto, os coeficientes ótimos referentes à solução de Wiener podem ser expressos como:

(25)

A equação 25 demonstra que, exceto por um fator de escala, o equalizador de Wiener tende, neste caso, a inverter a resposta impulsiva do canal. Esse fator de escala pode ser facilmente 2 compensado, pois a variância α m da marca d’água é conhecida e, para a maioria das aplicações, estima-se facilmente a variância σ t2 do sinal de informação. Quando o equalizador reverte de maneira ideal os efeitos do canal sobre o sinal transmitido, mˆ (n) = m(n) e tem-se tˆ(n) = t ( n) . Combinando este resultado com 8, obtém-se:

J (w ) = σ m2 − α m2 wT p m% − α m2 pTm% w + α m2 wT R m% w + wT R t% w

(22) O vetor de coeficientes do equalizador, que representa a solução ótima de Wiener, é:

α m2 (HHT ) −1 p m% α m2 + σ t2

eo (n) =

α m2 t ( n) α m2 + σ t2

(26)

onde eo (n ) é o sinal de erro na condição ótima. Exceto por um fator de escala, esse sinal é idêntico ao sinal de informação equalizado. Na prática, a qualidade da equalização dependerá da estrutura do equalizador. Um equalizador FIR, enquanto previne problemas de estabilidade, não é capaz de inverter exatamente o canal. Entretanto, com uma escolha apropriada da ordem do equalizador FIR, a equalização pode ser tão precisa quanto se deseja. 2.2.1

Simulações e resultados

Para avaliar o método proposto de equalização, inicialmente para sinais descorrelacionados, são apresentados a seguir alguns resultados de simulação. Foi adotado um canal de teste com fase não mínima, passível de inversão perfeita, modelado como um filtro linear com a seguinte função de transferência:

H( z ) = 1 + 1, 2 z −1 − 0,3 z −2 + 0,8 z −3

(27)

Considera-se um sinal 2-PSK (Phase Shift Keying), com amostras i.i.d. (independente e identicamente distribuído) obtidas no software de simulação MATLAB, sem ruído, supondo o sistema sincronizado, e um equalizador com cinco coeficientes inicializados na origem (i.e. todos os coeficientes inicializados com valor 0). Para avaliação do método de equalização, foi analisada a influência da relação sinal-marca d’água sobre o erro quadrático médio de equalização. A Figura 6 apresenta o erro quadrático médio (EQM) residual do sinal recuperado, após a convergência (regime permanente no qual os coeficientes se apresentam em torno dos valores ótimos), por meio do algoritmo Least Mean Square (LMS), versus a razão de potências entre sinal e marca d’água (SWR), com passo

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009

43


Equalização e identificação adaptativas de canais utilizando marca d’água

µ = 0,0005 e média de 200 realizações. Os resultados de simulações sugerem que o EQM cresce de forma aproximadamente exponencial com a SWR, pois a escala em decibéis é logarítmica. Em escala linear, o EQM cresce de forma aproximadamente linear. No exemplo apresentado na Figura 6, para SWR = 20 dB, o EQM residual é próximo do valor ótimo (0,1082 com um equalizador de quinta ordem). Para uma SWR = 23 dB, o valor do EQM residual médio é aproximadamente duas vezes o valor ótimo. Para SWR na faixa de 25-30 dB, o EQM cresce rapidamente. O valor máximo aceitável do EQM dependerá da aplicação.

tendem a infinito.

Figura 7 Convergência do erro quadrático médio do algoritmo LMS para SWR = 20 dB

Figura 6 Erro quadrático médio do algoritmo LMS em função da relação de potência sinal-marca d’água

A Figura 7 mostra o EQM em função do número de iterações para SWR = 20 dB e uma média de 200 realizações do algoritmo LMS com um passo de 0,0005. Nota-se que o algoritmo atingiu a convergência com menos de 10.000 iterações. A Figura 8 apresenta o EQM residual do sinal recuperado, após a convergência (os coeficientes apresentam-se em torno dos valores ótimos), por meio do algoritmo Recursive Least Squares (RLS), versus a razão de potências SWR, para λ = 1 e média de 200 realizações. Os resultados das simulações com esse algoritmo foram muito próximos aos obtidos com o algoritmo LMS, sugerindo que o EQM cresce de forma aproximadamente exponencial com a SWR. A Figura 9 mostra o EQM em função do número de iterações para SWR = 20 dB e uma média de 200 realizações do algoritmo RLS com fator de esquecimento λ = 1 . Nota-se que o algoritmo também atingiu a convergência com menos de 10.000 iterações. Os resultados experimentais atestam, assim, a viabilidade do uso dos algoritmos LMS e RLS na obtenção da solução ótima para o método de equalização proposto. Na análise dos algoritmos RLS e LMS em regime permanente, nota-se que os resultados de ambos são muito parecidos. Porém, vale lembrar que o RLS não apresenta desajuste para um número de iterações que

44

Figura 8 Erro quadrático do algoritmo RLS em função da relação de potência sinal-marca d’água

Figura 9 Convergência do erro quadrático médio do algoritmo RLS para SWR = 20 dB

2.3 Equalização com sinais correlacionados Conforme discutido anteriormente, o ponto ótimo de convergência do equalizador que inverte a função de transferência do canal somente é atingido quando o sinal de transmissão é descorrelacionado. Demonstramos que, para um

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Equalização e identificação adaptativas de canais utilizando marca d’água

sinal dessa natureza, a matriz de correlação na entrada do equalizador depende somente da matriz de convolução H do canal, conforme equação 24. No caso de sinais correlacionados, o termo E[t (n)tT (n)] na equação 17 não será mais uma matriz diagonal. Neste caso, obtém-se: R = α m2 HHT + HE  t (n)t T (n)  HT

(28)

Com a matriz de autocorrelação apresentada na equação 28, os coeficientes do equalizador de Wiener não correspondem ao inverso do canal de transmissão, afastando-se dele à medida que o sinal de informação é mais correlacionado. Uma alternativa para que a solução proposta opere a contento é utilizar um método de branqueamento do sinal t (n) . A Figura 10 apresenta um esquema de equalização em que um filtro de erro de predição é introduzido na saída do equalizador, antes do cálculo do sinal de erro e(n ) . Esse filtro tem como objetivo branquear o sinal y (n ) por meio da filtragem de suas componentes redundantes.

Figura 10 Esquema de equalização utilizando marca d’água para sinais correlacionados

A saída do preditor ilustrado na Figura 11 é composta apenas pela parte correlacionada do sinal y (n ) . Calculando-se a diferença entre y (n ) e o sinal na saída do preditor, obtém-se y ′(n ) , que corresponde às componentes descorrelacionadas na saída do equalizador. Essa operação pode ser expressa da seguinte forma: M

y ′ (n) = y (n) − ∑ w f , k y (n − k − ∆)

(29)

k =1

onde w f ,k são os coeficientes do preditor com M elementos de atraso. O atraso das amostras, denotado por ∆ , é chamado de atraso de descorrelação. O termo corresponde a uma estimativa de y (n ) com base em seus valores passados, ou seja, contém as componentes redundantes do sinal.

M

∑w k =1

f ,k

y (n − k − ∆)

(30)

Quando os parâmetros do equalizador tendem a valores ótimos, o sinal de erro y ′(n ) tende a componentes descorrelacionadas do sinal de informação, mais a marca d’água que, por sua natureza, é um sinal descorrelacionado. Supõe-se que o atraso de descorrelação ∆ seja suficientemente grande para que seja possível remover a autocorrelação do sinal y (n ) na saída do equalizador.

Figura 11 Filtro de erro de predição

2.3.1

Simulações e resultados

São apresentados nesta seção resultados de simulações para equalização de sinais discretos de áudio que apresentam alta correlação, com o objetivo de ilustrar a aplicação do processo de branqueamento discutido na seção anterior. No ensaio, foram escolhidos o mesmo canal expresso na equação 27 e um equalizador com cinco coeficientes inicializados na origem. Três diferentes amostras de áudio foram utilizadas como sinais de informação (guitarra, trompete e rock, todos com taxa de amostragem de 8 kHz). O filtro de erro de predição foi modelado como um filtro linear FIR com 750 coeficientes e um atraso ∆ de 800 amostras. Esse atraso foi determinado supondo-se que os sinais de áudio apresentassem correlação não desprezível entre si para atrasos de até 100 ms. O equalizador foi otimizado através do algoritmo RLS com fator de esquecimento λ = 1 , e o filtro de erro de predição otimizado através do algoritmo LMS com passo µ = 0,0001 . Essa configuração apresentou 100% de convergência nos casos analisados. O EQM versus SWR, após a convergência, é apresentado nas figuras 12, 13 e 14 para os sinais de guitarra, trompete e rock, respectivamente. Os resultados indicam que o EQM residual médio cresce de forma aproximadamente exponencial com a SWR. Para uma SWR na faixa de 20-23 dB, o EQM apresenta um valor relativamente baixo e próximo dos valores ótimos (EQM = 0,0873 para a amostra de guitarra, EQM = 0,0617 para a amostra de trompete e EQM = 0,0712 para a amostra de rock, considerando um equalizador ótimo de quinta ordem). Assim como nas simulações anteriores, o EQM cresce rapidamente para SWR na faixa de 25-30 dB. Podemos concluir, com base nos resultados apresentados, que a introdução do

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009

45


Equalização e identificação adaptativas de canais utilizando marca d’água

branqueamento viabiliza o uso do método de equalização baseado em marca d’água com sinais fortemente correlacionados.

Figura 12 Erro quadrático médio de equalização com o algoritmo RLS em função da relação sinal-marca d’água (sinal de guitarra)

identificação de canais com base no uso de uma marca d’água digital como sinal de referência. A marca d’água, conhecida no receptor, é utilizada para estimar as características do canal, tornando possível associá-lo a um modelo adequado. Assim como no caso de equalização, ambos os sinais (de marca d’água e de informação) são transmitidos de modo que não haja interrupções na comunicação e os coeficientes do modelo de identificação possam ser atualizados continuamente. O esquema que mais se assemelha a esta proposta é a técnica superimposed pilot training. Conforme já comentado, essa técnica diferencia-se da técnica aqui proposta por não estar focada na transparência da sequência de treinamento, que é um dos objetivos básicos de um algoritmo de marca d’água. 3.1 Descrição do algoritmo O esquema clássico de identificação é apresentado na Figura 15. Quando os coeficientes do modelo são adequadamente ajustados, o sinal de erro e(n ) é minimizado, implicando um sinal y (n ) na saída do modelo o mais próximo possível do sinal x (n ) na saída do canal de transmissão, de acordo com o critério estabelecido. Uma medida de erro comumente empregada para a adequação do modelo às características do canal é o erro quadrático médio, que expressa o critério de Wiener. A solução ótima para o problema de identificação é obtida por meio da minimização da função custo com respeito aos coeficientes w do filtromodelo, levando aos coeficientes ótimos w 0 do modelo.

Figura 13 Erro quadrático médio de equalização como algoritmo RLS em função da relação sinal-marca d’água (sinal de trompete)

Figura 15 Esquema clássico de identificação supervisionada

Figura 14 Erro quadrático médio de equalização com o algoritmo RLS em função da relação sinal-marca d’água (sinal de rock)

3

Identificação supervisionada baseada em marca d’água

Esta

46

seção

apresenta

um

método

de

Figura 16 Esquema de identificação utilizando marca d’água

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Equalização e identificação adaptativas de canais utilizando marca d’água

No método proposto, pretende-se identificar um canal de comunicação transmitindo continuamente uma marca d’água sobreposta ao sinal de informação, com a utilização da técnica de espalhamento espectral, conforme Seção 2. Considerando-se um canal linear, o sinal na sua saída é:

independentes entre si; em decorrência da linearidade, define-se a relação:

d (n) = x(n) = t% (n) + α m m% (n)

E  x 2 (n)  = σ x2

e(n) = y (n) − x(n) = α m (mˆ (n) − m% (n)) − t% (n) (32) A função custo J , definida como a esperança do sinal de erro quadrático e 2 (n) , é dada por:

J = E e 2 (n)  = E (α m (mˆ (n) − m% (n)) − t% (n)) 2  (33) A equação 33 pode ser reescrita em notação matricial. Definem-se m ( n) e t ( n) nas equações 10 e 11; porém, M representa agora o número de coeficientes do modelo. Os sinais x(n) e y (n ) podem ser representados como a convolução dos sinais nas entradas do canal e do modelo com as respectivas respostas impulsivas:

x(n) = hT (t (n) + α mm (n))

(34)

y ( n) = α m w T m ( n)

(35)

onde h = [ h0 L hL −1 ] expressa os coeficientes do canal, suposto do tipo FIR com função de transferência de ordem L − 1 , e w = [ w0 L wM −1 ] representa os coeficientes do modelo FIR de comprimento M , para M = L . Com essas definições, o sinal de erro pode ser representado da seguinte forma:

e(n) = y (n) − x ( n ) = α m wT m(n) − hT (t (n) + α mm(n)) do

(36) erro

J (w ) = E  x 2 (n)  − wT E α m2 m(n)hT m(n)  − E α m2 hT m(n)mT (n)  w + wT E α m2 m(n)mT (n)  w (37) Em decorrência da técnica de espalhamento espectral empregada na inserção da marca d’água, os sinais t (n ) e α m m(n ) são

(38)

Analisando os termos da equação 37 e de posse da relação expressa em 38, é possível reescrevê-los da seguinte forma:

(31)

% (n) versões distorcidas pelo sendo t% ( n) e m canal do sinal de informação e da marca d’água, respectivamente. De forma similar, após a convergência do modelo (também considerado linear), a sua saída y (n ) pode ser vista como ˆ (n) do sinal m% (n) . Esse uma estimativa m esquema é ilustrado na Figura 16. O sinal de erro e(n ) é expresso, nesse caso, por:

Ao determinarmos a esperança quadrático, chegamos à expressão:

α m m% (n) = α mhT m(n)

E α m2 m(n)hT m(n)  = E [α mm(n)m% (n) ] = p m (39) E α m2 m(n)mT (n)  = R m onde consideram-se t (n ) e m(n ) com média nula; os termos R m e p m expressam, respectivamente, a autocorrelação e a correlação cruzada do sinal da marca d’água. Substituindo essas relações na equação 37, obtém-se a superfície de erro do critério de Wiener na forma canônica para o sistema de identificação utilizando marca d’água:

J (w ) = σ x2 − w T p m − pTm w + w T R m w

(40)

Para obter o ponto de mínimo desta função custo, é necessário minimizá-la com respeito aos coeficientes w do modelo. Como J ( w ) expressa um quadrado perfeito, é possível reescrever a equação 40 da seguinte forma:

J (w ) = σ x2 − pTm R m−1p m + (w − R m−1p m )T R m( w − R m−1p m ) (41) Para atingir o ponto de mínimo na equação 41, o −1 termo ( w − R m p m ) deve igualar-se a zero. Obtém-se então:

w 0 − R −m1p m = 0

w 0 = R m−1p m

(42)

Com o ponto de mínimo expresso em 42, obtém-se o valor mínimo da função custo:

min J (w ) = σ x2 − p tm R m−1p m w

(43)

O ponto de mínimo obtido depende apenas das características do sinal da marca d’água, bastando o conhecimento prévio desse sinal para que seja possível o ajuste dos coeficientes do modelo. Isso significa que, independentemente das características do sinal de informação, o filtro utilizado como modelo converge para um ponto que representa o canal tão bem quanto possível, segundo o critério de Wiener. Essa demonstração evidencia a viabilidade do uso da marca d’água para identificação supervisionada. Nota-se em 40 e 43 que a influência do sinal de informação sobre a superfície de erro limita-se a um deslocamento no sentido do custo J , representado por σ x2 . Como demonstrado, esse deslocamento não influencia o ponto de mínimo da função.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009

47


Equalização e identificação adaptativas de canais utilizando marca d’água

3.2 Simulações e resultados Supondo a curva do algoritmo LMS aproximada por uma exponencial com constante de tempo (τ ) EQM ,me , é possível definir a seguinte constante de tempo média para o algoritmo (HAYKIN, 2001):

(τ ) EQM , me ≈

1

(44)

2 µλme

onde µ é o passo de adaptação, e λme o autovalor médio da matriz de autocorrelação R do sinal na entrada do filtro: λme =

1 M

M

∑λ

(45)

i

i =1

sendo λi (i = 1, 2,...., M ) os autovalores da matriz de autocorrelação R e M o comprimento do equalizador. No esquema de identificação apresentado, tem-se na entrada do modelo apenas o sinal da marca d’água α m m(n ) . Assim, os autovalores da matriz de autocorrelação R m dependem apenas do sinal de marca d’água. A constante de tempo (τ ) EQM , me (apresentada na equação 44) apresenta um comportamento inversamente proporcional à potência da marca d’água: à medida que diminui a potência da marca, diminui de forma proporcional o valor de λme (pois diminuem os autovalores da matriz), fazendo com que a constante de tempo aumente também de forma proporcional. Esse fato faz com que a velocidade de convergência do LMS torne a aplicação impraticável. Assim, será utilizado nas análises apenas o algoritmo RLS. Considera-se um canal de teste de fase não mínima, modelado como um filtro linear, com a seguinte função de transferência: −1

−2

Η ( z ) = 1 + 1, 2 z − 0,3 z + 0,8 z

−3

(46)

O ensaio foi dividido em duas etapas. Na primeira, foi utilizado um sinal de informação formado por amostras i.i.d. extraídas de uma constelação 2-PSK de módulo unitário. Na segunda, utilizou-se um sinal fortemente correlacionado, formado por amostras de áudio (música de rock). Em ambas as etapas, desconsiderou-se o ruído e empregou-se um modelo de identificação com o mesmo número de parâmetros que o canal de transmissão, inicializando-os na origem. Para avaliar de maneira mais precisa o desempenho do método nesse cenário, foi definida a seguinte medida de desvio em relação ao caso ideal (ARENAS-GARCÍA, 2003; ATTUX, 2005):

48

D=

h obtido − h h

sendo

h obtido

(47) a

estimativa

do

vetor

de

parâmetros obtida pelo algoritmo e h seu valor exato (coeficientes que se deseja modelar); quanto menor o valor de D , melhor é a estimativa do algoritmo (0 para o caso ideal). Na primeira etapa do ensaio, foram utilizadas amostras i.i.d. e foram obtidos os valores médios de D , após a convergência (apresentados na Tabela 1). Para os dois valores de SWR analisados, o coeficiente D revela um grau de precisão do algoritmo satisfatório para uma aplicação prática. A convergência para os dois valores de SWR ocorreu com aproximadamente 20.000 a 25.000 iterações. Tabela 1 Desvio do RLS para um sinal i.i.d. SWR

D

20 dB

0,0473

23 dB

0,0562

Na segunda etapa do ensaio, foram utilizadas amostras discretas de áudio e foram obtidos os valores médios de D apresentados na Tabela 2. Também nesse caso, o coeficiente D encontrase em um patamar que pode ser considerado satisfatório para uma aplicação prática. A velocidade de convergência para os dois valores de SWR também foi muito próxima daquela obtida no exemplo anterior (aproximadamente 20.000 a 25.000 iterações). Tabela 2 Desvio do RLS para um sinal áudio SWR

D

20 dB

0,0634

23 dB

0,0982

Em 100% dos ensaios realizados, houve convergência do algoritmo. Além dos dois exemplos apresentados, diversos outros ensaios foram realizados com sinais digitais de telecomunicações e de áudio, sempre com resultados aceitáveis para aplicações práticas. Ao comparar-se a convergência de um sistema clássico utilizando sequências de treinamento com o método utilizando marca d’água, percebemos que a convergência do primeiro é algumas dezenas de vezes mais rápida. Porém, em sistemas práticos, as sequências de treinamento são espaçadas no tempo, acarretando interrupções no ajuste do modelo. Com o uso da marca d’água, o ajuste do modelo de identificação pode ser realizado continuamente, sem interrupções, compensando a adaptação mais lenta.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Equalização e identificação adaptativas de canais utilizando marca d’água

4

Equalização e identificação para sinais de áudio utilizando marca d'água

A adição de uma marca d’água a um sinal de áudio pode causar distorções perceptíveis. Tais distorções poderiam ser minimizadas por meio do escalonamento da marca d’água, reduzindo a sua potência. No entanto, o ouvido humano é muito sensível, percebendo muitas vezes ruídos com pequenas amplitudes. Além disso, observou-se nas Seções 2 e 3 que baixos valores de SWR tornam o esquema de marca d’água menos robusto. O simples escalonamento do sinal de marca d’água não representa, portanto, uma solução adequada para sinais que possuem interpretação sensorial. Uma solução para o problema da audibilidade da marca d’água é o emprego de um modelo psicoacústico em conjunto com um algoritmo de conformação espectral. A conformação espectral da marca aumenta a robustez do sistema, uma vez que a potência da marca d’água é maximizada, aproximando-a do limiar de mascaramento do sinal de áudio.

são tocados simultaneamente, pode ocorrer o fenômeno de mascaramento: se um dos tons for suficientemente alto, ele mascarará o outro (ZWICKER; FASTL, 1990). Modelos psicoacústicos generalizam o efeito do mascaramento para sinais não tonais. Dado um sinal de áudio u(t ) , o modelo calcula uma curva M u (f ) chamada limiar de mascaramento, homogênea a uma densidade espectral de potência (Power Spectral Density – PSD) (GUIMARÃES, 1998). Se a PSD V (f ) de um sinal υ (t ) estiver abaixo de M u (f ) para todas as frequências, então υ (t ) será mascarado por u(t ) . Isso significa que o ouvinte não é capaz de perceber diferença alguma entre u(t ) e u(t ) + υ (t ) . Esse fenômeno é ilustrado na Figura 17. Tais modelos são usados em diversos algoritmos de compressão de áudio com perdas, como o MP3 e o MPEG-AAC (ISO, 1997), Dolby e DTS.

4.1 Marca d'água em áudio digital Existem diferentes métodos de inserção de marca d’água em áudio digital. Por exemplo, a marca d’água pode ser adicionada ao sinal de áudio nos domínios do tempo ou da frequência, e podem ser explorados fenômenos de mascaramento temporal e frequencial. Além disso, diferentes chaves podem ser usadas na inserção e na detecção da marca. Ainda, em aplicações de áudio, o sinal marcado pode passar por diversas operações com potencial de dessincronizar a detecção da marca, tais como: transmissão, compressão e conversão A-D/D-A. O primeiro artigo sobre marca d’água de áudio de que se tem conhecimento data de 1996 (BONEY; TEWFIK; HAMDY, 1996). O esquema de marca d’água proposto nesse artigo é basicamente uma extensão das técnicas anteriores desenvolvidas para marca d’água em imagens. A ideia consiste em adicionar uma sequência inicialmente branca ao sinal de áudio. Para garantir inaudibilidade e, ao mesmo tempo, maximizar o nível de energia da marca, a sequência passa por um processo de conformação espectral, aproximando-se do limiar de mascaramento do áudio calculado através de um modelo psicoacústico. Isso possibilita aumentar a robustez da marca d’água em comparação ao que se alcançaria com uma marca branca, cuja potência deve ser muito mais baixa para que não haja distorções perceptíveis no áudio. Por meio de experimentos psicoacústicos, concluiu-se que o ouvido humano apresenta limitações relevantes. Em particular, quando dois tons suficientemente próximos em frequência

Figura 17 Densidades espectrais de potência dos sinais mascarador (U (f ) , linha contínua) e mascarado (V (f ) , linha tracejada), e limiar de mascaramento (M u (f ))

Nas frequências altas, observa-se que o limiar de mascaramento e o sinal mascarado ultrapassam a PSD do sinal mascarador em decorrência da baixa sensibilidade do ouvido humano nessa faixa de frequência. Para tornar o ruído de quantização inaudível, esses algoritmos utilizam-se do limiar de mascaramento para distribuir os bits disponíveis para codificação entre bandas de frequência. Em sistemas de marca d’água para áudio, modelos psicoacústicos podem ser usados para estimar o limiar de mascaramento do sinal de áudio e fornecê-lo a um algoritmo de conformação espectral usado para filtrar uma sequência pseudoaleatória descorrelacionada. Essa operação resulta no sinal de marca d’água, cuja densidade espectral de potência está abaixo do limiar de mascaramento do áudio. Dessa forma, o sinal de marca d'água não pode ser ouvido na presença do áudio. Graças aos modelos psicoacústicos, a inaudibilidade da

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009

49


Equalização e identificação adaptativas de canais utilizando marca d’água

marca d’água pode ser garantida com SWR de aproximadamente 20 dB (GOMES et al., 2003). A marca d’água branca requer valores bem maiores de SWR (de 40 a 60 dB, conforme o áudio) (GOMES, 2002) para evitar distorções audíveis, tornando mais difícil a sua detecção. O limiar de mascaramento define a resposta em frequência do filtro de conformação espectral usado para filtrar a marca d’água. A PSD da marca passa a ficar abaixo, porém próxima, do limiar de mascaramento, para todas as frequências do sinal. Com isso, a energia da marca d’água é maximizada, aumentando a robustez do sistema. Caso necessário, por qualquer motivo (e.g. maior robustez ou menor distorção de uma marca d’água com potência diferente da obtida pelo processo descrito no parágrafo anterior), o sinal de marca d’água poderá ser escalonado após a conformação espectral. Se a PSD da marca resultante ultrapassar o limiar de mascaramento em uma ou mais bandas do espectro, a marca se tornará audível. No entanto, ainda assim a distorção percebida tenderá a ser significativamente menos acentuada do que a que seria obtida com uma marca de energia uniformemente distribuída em frequência (GOMES, 2002). 4.2 Descrição do algoritmo Para garantir a inaudibilidade da marca d’água, a m(n ) deve sequência pseudoaleatória submeter-se a uma conformação espectral, adequando-se a um limiar de mascaramento. Esse processo é realizado por meio de um filtro H (f ) , cuja resposta em frequência segue o limiar de mascaramento obtido com o uso do modelo psicoacústico. O sinal w (n ) resultante é simplesmente adicionado ao sinal de áudio t (n ) , produzindo o sinal marcado s(n ) . Essa abordagem é ilustrada na Figura 18.

frequência invertida com relação ao limiar de mascaramento do sinal x (n ) . O objetivo desse filtro é contrabalançar a conformação espectral H (f ) , imposta ao sinal de marca d’água, para garantir sua inaudibilidade. Como o sinal de áudio geralmente é muito mais potente do que a marca d’água, o limiar de mascaramento calculado a partir do sinal marcado tende a ser próximo do obtido para o sinal hospedeiro puro. Além disso, supõe-se que a distorção do sistema não seja forte o bastante para inutilizar o limiar de mascaramento calculado a partir do sinal recebido. Com isso, o sinal x (n) na saída do filtro G(f ) contém uma estimativa do sinal m(n ) distorcido pelo canal mais o sinal de áudio distorcido pelo canal e filtrado por G(f ) . O sinal x (n ) é, então, utilizado nos processos de equalização (Figura 19) e identificação (Figura 20), conforme Seção 2 e Seção 3, respectivamente. 4.3 Simulações e resultados Com o objetivo de analisar os métodos de equalização e identificação propostos para sinais de áudio, as simulações foram divididas em três fases distintas. A primeira busca avaliar a qualidade do método de inserção de marca d’água em áudio utilizando uma metodologia de avaliação objetiva de qualidade de áudio. Já as outras duas fases prestam-se à avaliação dos algoritmos de equalização e identificação, respectivamente, em conjunto com um modelo psicoacústico e um algoritmo de conformação espectral.

Figura 18 Esquema de inserção de marca d’água em áudio digital

Para que seja possível utilizar a informação da marca d’água como sinal de referência nos filtros equalizador ou identificador, o sinal x (n ) – sinal marcado e distorcido pelo canal – é primeiramente filtrado por G(f ) , que é um filtro de conformação espectral com resposta em

50

Figura 19 Esquema de equalização utilizando marca d’água em áudio

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Equalização e identificação adaptativas de canais utilizando marca d’água

Tabela 3 Material de áudio utilizado nas avaliações de qualidade Arq.

Figura 20 Esquema de identificação utilizando marca d’água em áudio

4.3.1 Análise do algoritmo de marca d'água para áudio Nos resultados apresentados nesta seção, foi empregado o modelo psicoacústico número 1 do padrão MPEG-1 (ISO, 1993), disponibilizado pela ISO em implementação de referência. O filtro de conformação espectral é obtido a partir do limiar de mascaramento por meio do algoritmo de Levinson, conforme descrito por Gomes (2002). Duas formas tradicionais de avaliação de qualidade de sinais de fala e áudio são a avaliação subjetiva (inspeção auditiva) e a avaliação objetiva (medida gerada por software). Uma avaliação subjetiva rigorosa deve seguir métodos padronizados para a geração de notas de avaliação de qualidade por avaliadores humanos (ITU-T, 1994; ITU-T, 1996), sendo dispendiosa em termos de tempo e requisitos de infraestrutura. A avaliação objetiva, por sua vez, substitui os avaliadores humanos por algoritmos, também padronizados (ITU-T, 1998; ITU-T, 2001), cuja função é modelar o comportamento desses avaliadores, empregando modelos psicoacústicos que estimam as características perceptivas do aparelho auditivo humano. O algoritmo mais empregado para avaliação de sinais de fala é o Perceptual Evaluation of Speech Quality (PESQ) (ITU-T, 2001); para sinais de áudio genérico, o algoritmo mais empregado é o Perceptual Evaluation of Audio Quality (PEAQ) (ITU-R, 1998). Para avaliação do algoritmo de inserção de marca d’água, foram selecionados materiais de áudio variados e potencialmente sensíveis a degradações. Quatro clipes foram escolhidos, seguindo avaliações realizadas pelo Communications Research Centre do Canadá (SOULODRE et al., 1998), incluindo fala, música, e fala com música. A Tabela 3 apresenta o material escolhido para os testes. Para a análise dos materiais de áudio selecionados, foi utilizada uma implementação do PEAQ contida no software OPERA da empresa OPTICOM (OPTICOM, 2007). Foram utilizados arquivos de áudio em formato Wave,

Descrição

Fonte

dires

Dire Straits

Warner Bros. CD 7599-25264-2 (trilha 6)

svega

Suzanne Vega (capela)

AT&T mix

trump

Solo trompete

Gravação original, Universidade de Miami

symph

Orquestra

EBU SQAM CD (trilha 17)

16 bits por amostra, mono, com taxa de amostragem de 44,1 kHz (embora a padronização do PEAQ requeira áudio amostrado a 48 kHz, a implementação utilizada oferece uma extensão proprietária para amostragem a 44,1 kHz). As diferenças entre os arquivos de áudio são analisadas por um modelo cognitivo nos domínios temporal e frequencial, extraindo-se características perceptivamente relevantes dos sinais. A norma BS.1387 (ITU-T, 1998) define um conjunto de variáveis de saída denominadas Model Output Variables (MOV). As MOV obtidas são mapeadas em um indicador único de qualidade de áudio denominado Objective Difference Grade (ODG). Esse indicador apresenta correspondência numérica direta com resultados de avaliações subjetivas de qualidade de áudio medidas com o indicador Subjective Difference Grade (SDG), podendo ser interpretado como uma estimativa do SDG. O indicador ODG é a medida normalmente apresentada nos ensaios de avaliação objetiva de qualidade de áudio. A escala dessa medida é contínua, variando de 0,0 até -4,0, com resolução limitada a uma casa decimal. Entre -4,0 e -3,1, a degradação é classificada como muito incômoda; entre -3,0 e -2,1, como incômoda; entre -2,0 e -1,1, como levemente incômoda; entre -1,0 e -0,1, como perceptível mas não incômoda; e, quando igual a 0,0, como imperceptível. Degradações na faixa de -1,0 a -0,1 podem ser consideradas imperceptíveis para ouvintes comuns (i.e. sem treinamento específico para detecção de degradações em áudio), enquanto degradações compreendidas entre -0,5 e -0,1 são em geral imperceptíveis até mesmo para especialistas em áudio, tais como músicos ou engenheiros de áudio (ARNOLD, 2002; NEUBAUER; HERRE, 1998). A Figura 21 apresenta curvas de ODG em função da SWR para o material de áudio selecionado (Tabela 3), no qual foi inserida uma marca d’água explorando características psicoacústicas por meio do algoritmo descrito nas seções precedentes. A curva referente ao sinal dires atinge um valor de ODG de aproximadamente -0,75 para SWR = 20 dB, encontrando-se na faixa que garante transparência da marca d’água para um ouvinte comum. Para SWR = 23 dB, o valor de ODG é de cerca de -0,45, sendo a

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009

51


Equalização e identificação adaptativas de canais utilizando marca d’água

marca transparente até mesmo para especialistas em áudio. Para o sinal svega, a figura mostra que, para SWR = 20 dB, é atingido o limiar de ODG = -1,0; para SWR = 23 dB, o valor de ODG encontra-se muito próximo de -0,5. Embora satisfatórios, os resultados para esse sinal são menos favoráveis do que os obtidos para o sinal dires, o que pode ser explicado pelo fato de se tratar de uma versão a capela contendo voz sem instrumentos musicais, com energia concentrada em frequências abaixo de 10 kHz. O efeito de mascaramento é, portanto, mais intenso nessa faixa de frequências, levando a energia da marca a se concentrar também nessa faixa. Como o ouvido humano apresenta maior sensibilidade em baixas frequências, tornase mais difícil evitar a percepção da marca d’água nesse caso. O sinal trump apresenta um resultado superior ao do sinal svega, com o índice ODG em torno de -0,95 para SWR = 20 dB e de -0,45 para SWR = 23 dB. O sinal de orquestra (symph) apresenta o melhor resultado entre as amostras analisadas. Como o sinal é composto por um conjunto de diversos instrumentos musicais, seu espectro contém componentes espalhadas em toda a faixa de frequências (limitada a cerca 20 kHz em razão da taxa de amostragem); assim, o limiar de mascaramento e a potência da marca d’água também se encontram distribuídos ao longo de todo o espectro. O índice ODG encontra-se acima do limiar de -0,5 para SWR = 20 dB e em torno de -0,15 para SWR = 23 dB. A Figura 21 também apresenta a curva SWR versus ODG média. Observa-se que, para SWR = 20 dB, obtém-se um valor ODG médio de -0,8, dentro da faixa de imperceptibilidade para um ouvinte comum. Para SWR = 23 dB, obtémse um valor ODG médio de -0,45, dentro da faixa de imperceptibilidade para especialistas em áudio. Sendo assim, pode-se dizer que a faixa de SWR entre 20 e 23 dB é apropriada para sistemas de áudio. O ajuste fino dessa relação depende da aplicação em questão.

Figura 21 Medida objetiva média de qualidade versus SWR usando modelo psicoacústico

52

Figura 22 Medida objetiva média de qualidade versus SWR para marca d’água branca

Com o objetivo de justificar a necessidade do modelo psicoacústico, apresenta-se na Figura 22 a curva SWR versus ODG para as amostras de áudio analisadas, nas quais foi inserida uma marca d’água branca (sem o uso do modelo psicoacústico e do filtro de conformação espectral, semelhante ao método superimposed training). Observa-se que o resultado é muito inferior ao obtido com o uso do modelo psicoacústico, conforme Figura 21. Para SWR entre 0 e 15 dB, os quatro sinais de teste não apresentam diferença significativa entre si, atingindo uma medida ODG máxima de cerca de -3,80. Para SWR = 20 dB, o ODG médio está em torno de -3,60. Esses valores encontram-se na faixa classificada como degradação muito incômoda, totalmente inaceitável em aplicações práticas de áudio. Para SWR = 23 dB, a medida ODG média está em torno de -3,25, também classificada como degradação muito incômoda. Para uma SWR = 25 dB, a medida ODG média aproxima-se de -3,60 e apenas o sinal symph atinge a faixa de degradação classificada como incômoda, o que também não é aceitável em aplicações práticas. Conclui-se que o uso do modelo perceptivo, em conjunto com um algoritmo de conformação espectral, é imprescindível em sistemas de marca d’água para áudio. Conforme mostrado nos capítulos anteriores, os algoritmos de equalização e identificação utilizando marca d’água apresentam resultados satisfatórios com SWR entre 20 e 23 dB, faixa em que a marca d’água utilizando o modelo psicoacústico atinge a medida de degradação considerada imperceptível. Essa característica evidencia a diferença entre a técnica proposta e os métodos de superimposed training, não focados na transparência do sinal de referência. 4.3.2

Sistema de equalização

Nesta seção, são apresentados resultados de

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Equalização e identificação adaptativas de canais utilizando marca d’água

simulação para a proposta de equalização de canais de áudio utilizando marca d’água. Os sinais de áudio marcados foram filtrados por um canal com quatro coeficientes e fase não mínima:

H( z ) =1 + 1, 2 z −1 − 0,3 z −2 + 0,8 z −3

(48)

Foi empregado um equalizador com cinco coeficientes inicializados na origem. O material de áudio utilizado nos testes é o mesmo apresentado na Tabela 3. Conforme discutido na Seção 3, como os sinais de áudio são correlacionados, é necessário o uso de um método de branqueamento junto ao equalizador. Empregou-se um filtro de erro de predição linear com 750 coeficientes e um atraso de 2.200 amostras; esse atraso foi ∆ determinado supondo-se uma correlação significativa dos sinais de áudio numa faixa de até 50 ms, a uma taxa de 44,1 kHz. O equalizador foi otimizado por meio do algoritmo RLS com fator de esquecimento λ = 1 ; já o filtro de erro de predição foi otimizado por meio do algoritmo LMS com passo µ = 0,0001 . Essa combinação apresentou 100% de convergência global. Tabela 4 Erro quadrático médio do sinal equalizado com uso de modelo psicoacústico Sinal

EQM (20 dB)

EQM (23 dB)

dires

0,179

0,211

svega

0,176

0,206

trump

0,161

0,192

symph

0,169

0,201

Tabela 5 Erro quadrático médio do sinal equalizado com marca d’água branca Sinal

EQM (20 dB)

EQM (23 dB)

dires

0,173

0,202

svega

0,168

0,197

trump

0,154

0,187

symph

0,165

0,192

Para avaliação do desempenho do algoritmo de equalização utilizando marca d’água, a Tabela 4 apresenta o EQM entre o sinal original e o sinal equalizado para valores de SWR de 20 e 23 dB. Para obtenção desses resultados, foram usados o modelo psicoacústico e o filtro de conformação espectral para minimização da distorção audível. A título de comparação, o equalizador ótimo de cinco coeficientes (calculados analiticamente)

fornece os seguintes valores de EQM para os sinais em questão: 0,0823 para dires, 0,0791 para svega, 0,0595 para trump e 0,0796 para symph. Para SWR = 20 dB, o EQM apresenta valores relativamente baixos e próximos dos valores ótimos (não causa degradação perceptível no áudio). Para SWR = 23 dB, o EQM apresenta um ligeiro aumento, porém continua relativamente próximo dos valores ótimos, encontrando-se em um patamar satisfatório para a maioria das aplicações. A Tabela 5 apresenta medidas similares para uma marca d’água branca, sem o uso do filtro de conformação espectral. Apesar de se observar uma ligeira redução no EQM, os resultados são praticamente equivalentes aos obtidos com o uso do modelo psicoacústico. Portanto, a conformação espectral da marca d’água não causou prejuízo notável no desempenho do sistema de equalização. 4.3.3

Sistema de identificação

Nesta seção, são apresentados resultados de simulação para a proposta de identificação de sinais de áudio utilizando marca d’água. Os sinais de áudio marcados foram filtrados pelo mesmo canal utilizado na seção anterior (equação 48). Utilizou-se um modelo de identificação com o mesmo número de parâmetros do canal (capaz, portanto, de atingir a condição ideal de identificação), inicializados na origem. O material de áudio utilizado nos testes é o mesmo apresentado na Tabela 3. O filtro-modelo foi otimizado por meio do algoritmo RLS com fator de esquecimento λ = 1 . O algoritmo de marca d’água utilizou um filtro de conformação espectral com 50 coeficientes. Para avaliação do desempenho do algoritmo de identificação utilizando marca d’água, a Tabela 6 apresenta a medida de desvio D , dos parâmetros do filtro (definida na equação 47) em relação ao caso ideal para valores de SWR de 20 e 23 dB. Para obtenção desses, foram usados o modelo psicoacústico e o filtro de conformação espectral para minimização da distorção audível. Para uma mesma SWR, os valores obtidos para o desvio D foram muito próximos entre si para todos os sinais analisados. O desvio máximo admissível depende da aplicação em questão. No entanto, os valores obtidos encontram-se dentro de um patamar geralmente considerado satisfatório. A Tabela 7 apresenta medidas similares para uma marca d’água branca, sem o uso do filtro de conformação espectral. Apesar de se observar uma ligeira redução no desvio D , os resultados são praticamente equivalentes aos obtidos com o uso do modelo psicoacústico. Portanto, a conformação espectral da marca d’água não causou prejuízo notável ao desempenho do sistema de identificação.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009

53


Equalização e identificação adaptativas de canais utilizando marca d’água

equalizador. As simulações realizadas demonstraram que o método pode trazer ganhos de desempenho em relação às técnicas tradicionais, principalmente em situações nas quais a escassez de recursos sistêmicos inviabilize o uso de treinamentos periódicos. Em aplicações em áudio, avaliações de qualidade demonstraram que o método garante a imperceptibilidade da marca d'água para uma SWR mínima entre 20 e 23 dB. Além disso, o uso do modelo perceptivo não introduz degradações significativas no desempenho dos sistemas de equalização e identificação.

Tabela 6 Desvio dos coeficientes do filtro identificador com uso de modelo psicoacústico Sinal

Medida D (20 dB)

Medida D (23 dB)

dires

0,0586

0,0779

svega

0,0464

0,0656

trump

0,0373

0,0513

symph

0,0428

0,0639

Tabela 7 Desvio dos coeficientes do filtro identificador com marca d’água branca Sinal

Valor D (20 dB)

Valor D (23 dB)

dires

0,0521

0,0703

svega

0,0394

0,0589

trump

0,0318

0,0446

symph

0,0382

0,0576

Referências ARENAS-GARCÍA, J. et al. Separate-variable adaptive combination of LMS adaptive filters for plant identification. In: WORKSHOP ON NEURAL NETWORKS FOR SIGNAL PROCESSING, 13., 2003. Proceedings... IEEE, 2003. p. 239-248.

Conclusão Neste trabalho foi proposta uma nova técnica de filtragem adaptativa, aplicada a equalização e identificação supervisionadas, utilizando uma marca d'água como sinal de referência. O método apresentado adiciona uma marca d'água ao sinal de informação (hospedeiro), que é transmitido sem interrupções, e vale-se continuamente do sinal da marca d'água para a obtenção de um modelo matemático do canal de transmissão, no caso de identificação, ou de seu inverso, no caso de equalização. O método proposto apresenta importantes vantagens em relação às técnicas tradicionais de equalização e identificação. Entre elas, pode-se destacar a ausência de interrupções periódicas do sinal de informação para transmissão de sequências de treinamento, ao mesmo tempo em que se evita a complexidade de critérios não supervisionados. Além disso, a técnica proposta pode ser estendida a aplicações em que se faz uso de sinais de áudio. No caso de aplicações em áudio, a adição da marca d'água não deve causar distorção perceptível. Assim, foi proposto o uso de um modelo psicoacústico em conjunto com um algoritmo de conformação espectral, garantindo que a marca inserida no sinal tenha sua densidade espectral de potência limitada pelo limiar de mascaramento do áudio. Resultados de simulação ilustram a viabilidade do método, quando aplicado a sinais dessa natureza. Na seção dedicada ao problema de equalização, foi demonstrado que é necessário compensar um fator de escala no equalizador, caso o sinal de informação seja branco. Em casos em que o sinal de informação é correlacionado, tal como um sinal de áudio, faz-se necessário o uso de um método de branqueamento em conjunto com o

54

ARNOLD, M. Subjective and objective quality evaluation of watermarked audio tracks. In: INTERNATIONAL CONFERENCE ON WEB DELIVERING OF MUSIC (WEDELMUSIC 2002), 2., 2002, Darmstadt. Proceedings... IEEE, 2002. p. 161-167. ATTUX, R. R. F. Novos paradigmas para equalização e identificação de canais baseados em estruturas não-lineares e algoritmos evolutivos. 2005. Dissertação (Doutorado) – Faculdade de Engenharia Elétrica e de Computação, Universidade Estadual de Campinas, Campinas. BASSIA, P.; PITAS, L.; NIKOLAIDIS, N. Robust audio watermarking in the time domain. IEEE Transactions on Multimedia, v. 3, n. 2, p. 232-241, 2001. BONEY, L.; TEWFIK, A.; HAMDY, K. Digital watermarks for audio signals. In: INTERNATIONAL CONFERENCE ON MULTIMEDIA COMPUTING AND SYSTEMS, 3., 1996, Hiroshima. Proceedings... IEEE, 1996. p. 473-480. CHEN, N.; ZHOU, G. T. What is the price paid for superimposed training in OFDM? In: INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING. 2004, Montréal. Proceedings... IEEE, 2004. p. 421-424, v. 4. COX, L. J. et al. Secure spread spectrum watermarking for multimedia. IEEE Transactions on Image Processing. v. 6, n. 12, p. 1673-1687, Dec. 1997.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Equalização e identificação adaptativas de canais utilizando marca d’água

CVEJIC, N.; KESKINARKAUS, A.; SEPPIINEN, T. Audio watermarking using m-sequences and temporal masking. In: WORKSHOP ON APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS, 2001, New York. Proceedings... IEEE, 2001. p. 227-230. GARCIA, R. A. Digital watermarking of audio signals using a psychoacoustic auditory model and spread spectrum theory. In: AUDIO ENGINEERING SOCIETY (AES) CONVENTION, 107., 1999, New York. Proceedings... New York, 1999. GOMES, L. C. T. et al. Cyclostationarity-based audio watermarking with private and public hidden data. In: AUDIO ENGINEERING SOCIETY (AES) CONVENTION, 108., 2000, Paris. Proceedings... 2000. GOMES, L. C. T. Tatouage de signaux audio. 2002. Dissertação (Doutorado) – Université Paris Descartes (Paris V), Paris. GOMES, L. C. T. et al. Audio watermarking and fingerprinting: for which applications? Journal of New Music Research, Londres, v. 32, n. 1, p. 65-81, 2003.

ITU RADIOCOMMUNICATION SECTOR (ITU-R) BS.1387-1: Method for Objective Measurements of Perceived Audio Quality. Geneve, 1998. ITU TELECOMMUNICATION STANDARDIZATION SECTOR (ITU-T). P.85: A method for subjective performance assessment of the quality of speech voice output devices. Geneve, 1994. ITU TELECOMMUNICATION STANDARDIZATION SECTOR (ITU-T). P.830: Subjective performance assessment of telephone-band and wideband digital codecs. Geneve, 1996. ITU TELECOMMUNICATION STANDARDIZATION SECTOR (ITU-T). P.861: Objective quality measurement of telephone-band (3003400 Hz) speech codecs. Geneve, 1998. ITU TELECOMMUNICATION STANDARDIZATION SECTOR (ITU-T). P.862: Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrow band telephone networks and speech codecs. Geneve, 2001.

GUIMARÃES M. P. Optimisation de l'allocation des ressources binaires et modélisation psychoacoustique pour le codage audio. 1998. Dissertação (Doutorado) – Université Paris Descartes (Paris V), Paris.

KIM, H. Stochastic model based audio watermark and whitening filter for improved detection. In: INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2000, Istanbul. Proceedings... IEEE, 2000. p. 1971-1974, v. 4.

HARTUNG, F.; GIROD, B. Watermarking of uncompressed and compressed video. Signal Processing, Amsterdam, v. 66, n. 3, p. 283-301, 1998.

LEE, S. K.; HO, Y. S. Digital audio watermarking in the cepstrum domain. IEEE Transactions on Consumer Electronics, v. 46, n. 3, p. 744-750, 2000.

HAYKIN, S. Adaptive Filter Theory. 4th ed. Prentice Hall, 2001.

MOORE, B. C. J. An Introduction to the Psychology of Hearing. New York: Academic Press, 1989.

HUMES L. E.; JESTEADT, W. Models of the additivity of masking. Journal of the Acoustical Society of America, v. 85, n. 3, p. 1285-1294, Mar. 1989. INTERNATIONAL ORGANIZATION FOR STANDARDIZATION (ISO). ISO/IEC 11172-3: Information technology – Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s. Geneve, 1993. INTERNATIONAL ORGANIZATION FOR STANDARDIZATION (ISO). ISO/IEC 13818-7: MPEG2 Advanced Audio Coding (AAC). Geneve, 1997.

NEUBAUER, C.; HERRE, J. Digital watermarking and its influence on audio quality. In: AUDIO ENGINEERING SOCIETY (AES) CONVENTION, 105., 1998, San Francisco. Proceedings... p. 1041, v. 46. Opticom. Disponível em: <http://www.opticom.de/>. Acesso em: set. 2007. SEOK, J.; HONG, J.; KIM, J. A novel audio watermarking algorithm for copyright protection of digital audio. ETRI Journal, v. 24, n. 3, p. 181189, 2002. SOULODRE, G. et al. Subjective evaluation of state-of-the-art 2-channel audio codecs. In: AUDIO ENGINEERING SOCIETY (AES)

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009

55


Equalização e identificação adaptativas de canais utilizando marca d’água

CONVENTION, 104., 1998, Amsterdam, The Netherlands. Proceedings... SWANSON, M.; et al. Robust audio watermarking using perceptual masking. Signal Processing, New Jersey, v. 66, n. 3, p. 337-355, 1998. TIRKEL, A. et al. Electric watermark. In: INTERNATIONAL CONFERENCE ON DIGITAL IMAGE COMPUTING: TECHNIQUES AND APPLICATIONS (DICTA), 7., 1993, Sidney. Proceedings... CSIRO Publishing, 1993. p. 666-672. TUGNAIT, J. K.; LUO, W. On channel estimation using superimposed training and first-order statistics. IEEE Communications Letters, v. 7, n. 9, Sep. 2003. TUGNAIT, J. K.; MENG, X. Synchronization of superimposed training for channel estimation. In:

INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2004, Montréal. Proceedings... IEEE, 2003. p. 853-856, v. 4. ULIANI NETO, M. Equalização e Identificação Adaptativas Utilizando Marca d'Água como Sinal de Supervisão. 2008. Dissertação (Mestrado) – Faculdade de Engenharia Elétrica e de Computação, Universidade Estadual de Campinas, Campinas. VARMA, A. R. et al. Iterative algorithms for channel identification using superimposed pilots. In: AUSTRALIAN COMMUNICATIONS THEORY WORKSHOP, 6., 2005, Sidney. Proceedings... IEEE, 2005. p. 195-201. ZWICKER, E.; FASTL, H. Psychoacoustics, Facts and Models. Berlin: Springer-Verlag, 1990.

Abstract The objective of this work is to investigate the use of a digital watermark as a reference signal in supervised adaptive filtering, applied to the channel equalization and identification problems. Contrary to traditional adaptive methods, in which communication is periodically interrupted for the transmission of training sequences, a watermark is transmitted uninterruptedly, along with the information signal. By comparing the received signal and the watermark processed by the identification filter, or the received signal processed by the equalization filter and the original watermark, the coefficients of this filter are continuously adapted to estimate and monitor channel characteristics through time. Both the transmission of useful information and the adaptation of the identification/equalization filter are never interrupted. The embedding of a watermark into signals with sensorial interpretation (e.g. audio, image, video) should not introduce noticeable distortion in the original signal. To achieve this when applying our method to audio signals, we propose the use of a psychoacoustic model with a spectral shaping algorithm. Simulation results are presented to illustrate the performance of the proposed method when compared to traditional supervised adaptive filtering techniques. Key words: Adaptive filter. Adaptive equalization. Adaptive identification. Digital watermark. Superimposed training

56

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 37-56, jul./dez. 2009


Descoberta automática da topologia física de redes Ethernet com switches heterogêneos e de múltiplos fabricantes Marcos Rogério Salvador*, Vinícius Garcia de Oliveira, Giovanni Curiel dos Santos O conhecimento da topologia física é fundamental em redes corporativas, metropolitanas e de núcleo, pois as ações de operação, administração e manutenção são executadas com base neste conhecimento. Contudo, não há nenhum mecanismo existente na literatura ou no mercado capaz de determinar automaticamente a topologia física completa de uma rede Ethernet composta de switches heterogêneos, incluindo os de baixo custo e de múltiplos fabricantes. Este artigo descreve um algoritmo capaz de executar tal tarefa. O algoritmo coleta informações disponíveis em qualquer switch, calcula a topologia física completa da rede e a mantém atualizada mesmo no evento de alterações. Este artigo também descreve a implementação do algoritmo em uma rede laboratorial montada para validar seu comportamento, sua robustez e seu desempenho. Palavras-chave: Descoberta de recursos. Topologia. Gerência de rede. Ethernet. Introdução A tecnologia de rede Ethernet foi concebida para uso em redes locais, cujos requisitos na época de sua criação eram muito simples se comparados aos atuais. Ao longo dos anos, os requisitos das redes locais foram aumentando em número e complexidade, exigindo constantes evoluções do Ethernet, mas sempre primando pelas principais vantagens da tecnologia: a simplicidade e os baixos custos de aquisição e de operação decorrentes dessa simplicidade. O sucesso do Ethernet é tamanho que praticamente a totalidade das redes locais e dos computadores pessoais usa essa tecnologia. A onipresença do Ethernet em redes locais e em computadores pessoais, aliada às altas taxas de transmissão, alcançando pouco mais que uma centena de km a baixos custos, elevou essa tecnologia à candidata número um na evolução das redes das corporações, das operadoras de telecomunicações e dos provedores de serviços. Apesar do grande interesse em Ethernet, ainda faltam a essa tecnologia recursos importantes que hoje estão presentes nas tecnologias em obsolência. Particularmente, faltam à Ethernet recursos de operação, administração e manutenção (OAM), primordiais nas novas redes em que a tecnologia se propõe a atuar. Este artigo descreve um algoritmo de descoberta automática de topologia física de redes baseadas em Ethernet, um recurso essencial para ações de OAM, tais como: aprovisionamento automático de serviços, engenharia de tráfego e proteção rápida. O algoritmo destaca-se dos disponíveis na literatura por operar com switches comerciais heterogêneos em termos de características e de fabricante e por não exigir qualquer mudança no software embarcado

nesses equipamentos. Resumidamente, o algoritmo usa o protocolo Packet InterNet Grouper (PING) para descobrir os elementos presentes na rede e o Simple Network Management Protocol (SNMP) para determinar as relações de vizinhança entre esses elementos. De posse dessas informações, o algoritmo calcula a topologia física completa da rede. A Seção 1 faz uma análise das propostas científicas disponíveis na literatura, bem como daquelas disponíveis comercialmente. A Seção 2 descreve o algoritmo proposto neste trabalho. A Seção 3 descreve a implementação do algoritmo e apresenta alguns resultados obtidos em uma rede laboratorial montada para validar o algoritmo. 1 Propostas existentes Alguns fabricantes oferecem o recurso de descoberta automática de topologia física de redes Ethernet, mas esse recurso é proprietário e funciona somente com seus próprios equipamentos. Por exemplo, o Cisco Discovery Protocol (CDP) funciona somente em switches da Cisco Systems, da mesma forma que o Extreme Discovery Protocol (EDP) funciona somente em switches da Extreme Networks. O Link Layer Discovery Protocol (LLDP) (IEEE, 2005), especificado recentemente pelo IEEE, pode ser uma solução ao problema. O LLDP define uma forma comum de troca de informações de configurações de interfaces, através das quais cada switch descobre como está ligado aos seus vizinhos. Cada switch roda sua instância do LLDP e armazena as informações consolidadas pelo LLDP em uma Management Information Base (MIB) SNMP- padrão. Consequentemente, essas

*Autor a quem a correspondência deve ser dirigida: marcosrs@cpqd.com.br. Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 57-64, jul./dez. 2009


Descoberta automática da topologia física de redes Ethernet com switches heterogêneos e de múltiplos fabricantes

informações tornam-se acessíveis a um sistema de gerência de rede, que, de posse das informações disponíveis em cada elemento de rede, é capaz de calcular a topologia física completa da rede. Apesar do seu potencial como solução comum de descoberta de topologia física de redes Ethernet, o LLDP é um protocolo novo e, portanto, não está presente nos switches já instalados. Além disso, atualmente os fabricantes não estão embarcando o LLDP em switches de baixo custo. Há algumas propostas científicas disponíveis na literatura visando à descoberta automática da topologia física em redes Ethernet. Um bom resumo delas está disponível em Bejerano (2006). Quase todas as propostas existentes baseiam-se no uso de mensagens SNMP para coletar informações de encaminhamento de pacotes mantidas por cada switch em sua Address Forwarding Table (AFT) (BEJERANO et al., 2003, 2006; BREITBART et al., 2004; LOWEKAMP; O’HALLARON; GROSS, 2001). Consequentemente, essas propostas conseguem determinar somente a topologia lógica, que corresponde à árvore de encaminhamento calculada pelo Spanning Tree Protocol (STP) (IEEE, 2004). Os enlaces desabilitados pelo STP não são detectados, portanto, a topologia física da rede só pode ser parcialmente determinada. Há também a descoberta de topologia baseada em monitoramento de tráfego (BLACK; DONNELLY; FOURNE, 2004; BU et al., 2002; CACERES et al., 1999; RABBAT; NOWAK; COATES, 2004). Nessa abordagem, os algoritmos baseiam-se na geração e no monitoramento de tráfego específico nos elementos de entrada e saída da rede, cuja topologia é determinada sem a necessidade de acessar as informações disponíveis em MIBs. No entanto, como nos algoritmos anteriores, esses algoritmos também determinam somente a topologia lógica, uma vez que o tráfego flui pela árvore de encaminhamento calculada pelo STP. Son et al. (2006) propõem um algoritmo capaz de descobrir a topologia física completa de uma rede Ethernet. No entanto, o algoritmo baseia-se em MIBs obrigatórias e também em MIBs opcionais, que não estão necessariamente disponíveis em todos os switches da rede (ex.: D-Link DES-3526). Como pode ser observado, nenhuma das opções existentes para a descoberta automática da topologia física de redes Ethernet é capaz de atender aos requisitos de redes Ethernet de corporações, operadoras de telecomunicações ou provedores de serviços. Esses requisitos são:

i) descoberta da topologia física completa; e ii) funcionamento em switches heterogêneos em termos de funcionalidades e fabricantes. 2

Algoritmo de descoberta de topologia física Esta seção descreve o algoritmo de descoberta automática de topologia física de redes Ethernet equipadas com switches comerciais, incluindo os de baixo custo, com características e fabricantes diversificados (FARKAS et al., 2008; SALVADOR et al., 2008)1. O algoritmo consiste nas seguintes fases: i) descoberta de nó de rede; ii) descoberta dos enlaces ativos, conforme determinação do STP; iii) descoberta de enlaces bloqueados, conforme determinação do STP e consolidação da topologia física completa; e iv) atualização dinâmica da visão topológica. a) Requisitos e premissas As seguintes premissas balizaram o projeto do algoritmo: • a rede consiste em switches de camada 2 no núcleo e switches de camada 3 nas bordas; • a rede usa sinalização na banda, embora o algoritmo também funcione com sinalização fora da banda; • os switches devem ter os seguintes protocolos e MIBs implementados: STP (IEEE, 2004), Virtual Local Area Network (VLAN) (IEEE, 2006), SNMP, Bridge MIB (IETF, 1993), MIB-II (IETF, 1991) e Interface (IF) MIB (IETF, 1997); • todo switch deve iniciar com suas portas pertencendo a uma VLAN de serviço; • o STP deve ser habilitado em todas as portas em cada switch; • o algoritmo roda em Linux PC, que é denominado Network Management System (NMS) e está diretamente conectado a um dos switches de camada 2. a) Descoberta de nó de rede Esta fase é bastante direta e seu objetivo é descobrir os nós existentes na rede, que podem ser de dois tipos: roteadores de borda ou switches de núcleo. O algoritmo emite uma mensagem PING request com endereço-destino de broadcast e aguarda por respostas. Para cada resposta inédita, o algoritmo adiciona uma nova entrada na base de dados topológica e envia uma mensagem SNMP get ao nó identificado, visando obter informações contidas na MIB-II que descrevem aquele nó, tais como: nome do fabricante, modelo do equipamento e número de portas. Uma vez que tanto as solicitações como as respostas podem ser perdidas, o algoritmo

1 FARKAS et al. apresentam a descrição parcial do algoritmo, enquanto SALVADOR et al. apresentam a descrição completa, porém resumida, do artigo.

58

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 57-64, jul./dez. 2009


Descoberta automática da topologia física de redes Ethernet com switches heterogêneos e de múltiplos fabricantes

repete essa operação por um número predefinido de vezes (K), ignorando as respostas previamente recebidas e registradas. A Figura 1 descreve esse algoritmo. Envie broadcast PING request Para cada PING reply

Endereço já detectado?

Y

N Obtenha dados da MIB-II

Temporizador expirou?

N

Y

Repetido K vezes?

N

Y Avance para a próxima fase

Figura 1 Algoritmo de descoberta de nó de rede

O tempo necessário para descobrir os nós da rede, no pior caso, é dado pela expressão:

T1 = N p * Tgbp

(1)

onde Np é o número de mensagens PING request emitidas pelo NMS e Tgbp , o intervalo de tempo entre duas emissões consecutivas de mensagens PING request. Esse intervalo de tempo considera as diferenças de tempo de propagação das mensagens PING request e PING reply. O tempo de que o NMS necessita para registrar os nós descobertos não é considerado, uma vez que ele ocorre no intervalo de tempo. b) Descoberta de enlaces ativos O objetivo desta fase é descobrir os enlaces ativos ou a topologia lógica da rede, conforme determinação do STP. Esta é a fase mais complexa do algoritmo, e exige a recuperação de informações da AFT mantida por cada nó descoberto. Para obter o conteúdo das AFTs, o algoritmo envia mensagens SNMP get à Bridge MIB mantida em cada switch. Cada entrada na AFT informa por qual porta um outro nó com um dado endereço Medium Access Control (MAC) pode ser alcançado, e o conjunto de todas as entradas mantidas pela AFT de cada nó da rede permite determinar a topologia lógica da rede, que foi calculada pelo STP. No momento inicial de uma rede Ethernet, as AFTs estão vazias. No entanto, o encaminhamento das mensagens PING request e PING reply pelos switches, durante o processo de descoberta de nós, leva ao preenchimento automático da AFT de cada switch.

O preenchimento automático da AFT é uma característica-padrão de todo switch Ethernet comercial. Toda vez que recebe um quadro Ethernet, o switch procura na sua AFT uma entrada que informe por qual porta de saída aquele quadro deve ser encaminhado, para que o destino seja alcançado. Se uma entrada não é encontrada, então o switch encaminha uma cópia do quadro sobre cada uma das portas no estado UP, isto é, operacionais, exceto sobre a porta pela qual o quadro chegou. Na sequência, o switch procura em sua AFT uma entrada cujo endereço-destino seja o mesmo endereço-origem contido no quadro. Se uma entrada for encontrada, isso significa que a porta pela qual o nó que enviou o quadro pode ser alcançado já é conhecida. Caso contrário, uma nova entrada é criada na AFT, informando que o emissor daquele quadro é alcançável pela porta pela qual o quadro chegou. Para ajudar no cálculo da topologia lógica, o algoritmo associa um peso a cada nó descoberto. O peso de um nó equivale ao número de entradas contido em sua AFT e identifica a distância daquele switch em relação ao NMS na topologia lógica. Isso porque quanto mais próximo o nó estiver do NMS, maior é o número de mensagens PING reply recebidas e encaminhadas ao NMS. Portanto, quanto mais pesado for o nó, mais próximo do NMS ele estará. Vale observar que o PC em que roda o NMS não é considerado no cálculo, embora esteja conectado à rede e contido nas AFTs. Isso ocorre porque, por definição, um nó de borda terá sempre peso 0 por não alcançar nenhum outro nó da rede de núcleo. Também é importante observar que o algoritmo descarta qualquer endereço MAC contido nas AFTs que não tenha sido descoberto na fase de descoberta de nó, evitando, dessa forma, que algum tráfego de fundo confunda o algoritmo de descoberta de topologia lógica. Na fase final, descobre-se como cada switch está conectado a outros na árvore e, eventualmente, à topologia lógica inteira. Nessa fase, o algoritmo verifica todas as portas de cada nó, sendo que a ordem em que isso ocorre é irrelevante. Entre os nós alcançáveis a partir de determinada porta de um switch, conforme a AFT correspondente, o algoritmo determina que o nó mais pesado é o nó conectado à porta em questão. Em outras palavras, o algoritmo determina o vizinho daquele switch. Para determinar à qual porta do switch vizinho a porta do switch em questão está conectada, o algoritmo procura pela porta, na AFT do switch vizinho, que permita alcançar o NMS. A execução desse processo resulta na descoberta da topologia lógica completa. A Figura 2 descreve o algoritmo.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 57-64, jul./dez. 2009

59


Descoberta automática da topologia física de redes Ethernet com switches heterogêneos e de múltiplos fabricantes

descoberta quando CS2 é analisado. Como CS1 é o nó mais pesado no exemplo, por lógica, ele está diretamente conectado ao NMS pela porta 4.

Avance para a próxima fase Obtenha AFT de cada nó

Y N

Calcule o peso de cada nó

Último nó?

Para cada nó

Y N

Para cada interface do nó

Última interface?

CS1

weight=10

N

Interface alcança algum outro nó?

Conecte a interface ao NMS

Y

CS2

weight=5

Y

NMS alcançável através desta interface?

N CS3

weight=3

Conecte esta interface à interface do nó mais pesado através do qual o NMS pode ser alcançado

A Figura 3 mostra uma topologia lógica calculada pelo STP sobre uma dada topologia física para ilustrar como o algoritmo funciona. A rede consiste em switches de núcleo (Core Switches – CS) de camada 2 e roteadores de borda (Edge Routers – ER) de camada 3. As linhas grossas representam a topologia lógica, conforme cálculo do STP. As linhas tracejadas representam os enlaces físicos que foram bloqueados pelo STP. A Figura 4 mostra a AFT de cada switch após execução da fase de descoberta de nó na topologia, exemplificada na Figura 3. Clientes IP

Clientes IP Rede de camada 2 4

3 2

1

CS1 3

2

1

1

5

6

7

2 CS6 3 1

1 ER1

ER3

CS5

4

1

4

2

3

1

2

3

1

CS4 2

2

4

CS2

NMS

3

CS3 1

4

2

CS7

2

3

2

Clientes IP

1

ER4

Clientes IP Conexão ativa Conexão bloqueada

Figura 3 Exemplo de topologia de rede

Como um exemplo, a AFT do CS3 mostra que esse nó pode alcançar CS4, CS5 e ER3 pela porta 3 e o NMS pela porta 1. CS4 está conectado à porta 3 e é o nó mais pesado na lista de nós alcançáveis pela porta 3. Verificando CS4, o algoritmo determina que o NMS pode ser alcançado pela porta 1 daquele nó, o que significa que o enlace físico entre a porta 3 do CS3 e a porta 1 do CS4 faz parte da topologia lógica, que é a árvore calculada pelo STP. Note que a conexão entre CS3 e CS2 é

60

2 3 4 Interface

MAC

1 2 3

NMS ER2 CS2, CS4, CS5, ER3

CS4

weight=2

CS5

weight=1

CS6

Interface

MAC

1 2

NMS CS4, CS5, ER3

CS7 weight=1

Interface

MAC

1 2

NM S CS5, ER3

Interface

MAC

1 2

ER3 NM S

Interface

MAC

1 2

NM S CS7, ER4

Interface

MAC

1 2

NM S ER4

Figura 4 AFTs correspondentes ao cenário topológico da Figura 3

Figura 2 Algoritmo de descoberta da topologia lógica

1

CS2, CS3,CS4, CS5, ER2, SR3 CS6, CS7, ER4 ER1 NMS

weight=2

Nó mais pesado?

2

MAC

1

Y

N

ER2

Interface

O tempo necessário para descobrir a topologia lógica, no pior caso, é dado por:  N  T2 = 2 Tpma (N − x ) + N (Tget + Tc )    x =1 

(2)

onde N é o número de nós descobertos, Tpma , o tempo necessário para interpretar o endereço MAC na AFT, Tget , o tempo necessário para obter uma resposta a uma mensagem SNMP get transmitida e Tc, o tempo necessário para descobrir o enlace entre dois nós. O tempo para receber uma resposta a uma mensagem SNMP get pode variar, dependendo das condições da rede, da distância entre o NMS e o nó-alvo e do tamanho da AFT daquele nó. Para simplificar a expressão (2), assume-se um valor-padrão que represente da melhor maneira possível o tempo médio percebido na rede. A expressão (2) considera uma topologia lógica composta por um único ramo, pois essa condição representa um cenário de pior caso. Em um cenário de múltiplos ramos ou árvore, mais de um nó tem peso 0 e, em geral, os nós são mais leves que aqueles de um cenário de um único ramo, como é de se esperar. A topologia da Figura 3 é um exemplo de topologia com quatro ramos, com todos os roteadores de borda com peso 0. c) Descoberta de enlaces bloqueados Esta fase visa descobrir os enlaces físicos inativos em função do bloqueio das portas correspondentes pelo STP. Embora não seja a mais complexa, esta fase é a mais trabalhosa. A Figura 5 descreve o algoritmo de descoberta de enlaces bloqueados. Para esta fase, o algoritmo faz uso da mensagem SNMP LINK DOWN trap. Um switch transmite uma mensagem SNMP LINK DOWN trap sempre que perceber que houve uma queda de voltagem elétrica na transmissão ou na

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 57-64, jul./dez. 2009


Descoberta automática da topologia física de redes Ethernet com switches heterogêneos e de múltiplos fabricantes

recepção em uma de suas interfaces. Queda de voltagem ocorre quando uma interface ou um cabo foi danificado ou quando ocorre uma queda de energia em um dos switches. A mensagem SNMP LINK DOWN trap contém informações úteis para a descoberta dos enlaces físicos inativos, tais como a identificação da porta que detectou a falha e o endereço IP do switch que transmitiu a mensagem. Com o cruzamento das informações recebidas nessas mensagens, o algoritmo é capaz de identificar precisamente quais enlaces foram bloqueados pelo STP. Juntando essas informações à topologia lógica descoberta na fase anterior, o algoritmo é finalmente capaz de determinar a topologia física completa da rede. Por exemplo, no cenário de rede mostrado na Figura 3, o desligamento da porta 4 do CS2 faz com que a porta 4 do CS5 perceba a queda de voltagem elétrica na recepção, resultando na transmissão de uma mensagem SNMP LINK DOWN trap pelo CS5 ao NMS. Consequentemente, o algoritmo conclui que há um enlace físico bloqueado entre a porta 4 do CS2 e a porta 4 do CS5. O algoritmo precisa forçar a geração das mensagens SNMP LINK DOWN trap e, para isso, ele precisa desligar as interfaces bloqueadas, uma após a outra, em cada switch da rede. Para desligar uma interface, o algoritmo transmite uma mensagem SNMP set ao endereço IP do nó-alvo. Essa mensagem contém o identificador do campo correspondente na IFMIB. Como as mensagens set ou trap podem ser perdidas, o algoritmo repete esse procedimento por um número K de vezes enquanto não receber a mensagem trap esperada. Se a mensagem trap esperada não for recebida, então a interface é declarada sem solução. Configure VLAN de serviço em todos os nós, reproduzindo a árvore calculada pelo STP e desabilite STP em todos os nós

Fim do processo Y N

Para cada nó

Último nó? Y

Para cada interface do nó

N

Última interface?

Se a interface N não estiver na VLAN de serviço, ela está ligada? Y Ligue a interface Desligue a interface

Trap chegou?

Y

Conecte interface ao seu par

Note que somente as interfaces desabilitadas podem ser desligadas, pois embora gerem mensagens trap, não há tráfego passante nelas. No entanto, se o STP estiver rodando, algumas interfaces habilitadas podem ser bloqueadas pelo STP durante o recálculo da topologia lógica. Isso pode causar a perda temporária ou até permanente da conectividade entre o NMS e os nós da rede por tempo prolongado. Uma solução possível e que foi adotada no algoritmo é criar uma VLAN de serviço que reflita a topologia lógica calculada pelo STP e, então, desligar o STP antes que a fase de descoberta de enlaces bloqueados comece. Note que as portas que estão fora da VLAN de serviço não encaminham tráfego de clientes, mas podem gerar mensagens trap que podem ser transmitidas por outras portas pertencentes à VLAN de serviço. No final dessa fase, o STP pode ou não ser religado, dependendo do tipo de rede em operação. Por exemplo, em redes metropolitanas, o STP pode não ser apropriado, principalmente quando há outros mecanismos de proteção rápida e topologias calculadas por algoritmos de engenharia de tráfego. Por outro lado, em uma rede local empresarial, o STP pode ser bastante interessante. Nesse caso, o STP não precisa necessariamente ser mantido desligado; no entanto, o algoritmo deve incluir todas as portas de todos os nós na VLAN de serviço. O tempo para descobrir os enlaces bloqueados, no pior caso, é dado pela expressão:  P * (T + T )  T3 =  b set wait  * (1 + R) + (N * Tt log + Pb * Ttcom ) 2  

onde Pb é o número total de enlaces bloqueados na rede, Tset, o tempo necessário para desligar e religar uma interface, Twait , o tempo decorrido até que a mensagem SNMP trap chegue ao NMS, R, a probabilidade de as mensagens trap serem perdidas, Ttlog, o tempo necessário para se conectar a um switch via Telnet e Ttcom, o tempo para executar um comando em uma conexão Telnet. O denominador no primeiro termo considera que a descoberta de um enlace bloqueado leva à descoberta de duas portas bloqueadas conectadas por aquele enlace. A partir de (1), (2) e (3), conclui-se que o tempo total para calcular a topologia física completa de uma rede Ethernet é dado por

T = T1 + T2 + T3

N Repetido N vezes?

Y

Marque interface “unsolved”

N Ligue a interface

Figura 5 Algoritmo de descoberta dos enlaces bloqueados

(3)

(4)

d) Atualização dinâmica da visão topológica Várias mudanças na topologia física podem ocorrer durante a operação de uma rede, tais como falhas em nós e enlaces e a criação de

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 57-64, jul./dez. 2009

61


Descoberta automática da topologia física de redes Ethernet com switches heterogêneos e de múltiplos fabricantes

novos enlaces. Esses eventos são casos especiais das fases do algoritmo descritas anteriormente. Muitas vezes, o NMS é notificado por mensagens SNMP trap sobre mudanças topológicas, mas tipicamente o NMS precisa executar algumas ações para conseguir determinar com precisão o que mudou. O algoritmo descrito na Figura 6 executa essas ações. Para cada nó Envie PING e aguarde N Resposta recebida?

N

Y

Y Obtenha Obtém status statusda dainterface interface

Y Última interface?

N

Para cada interface

N

N tentativas?

3

Remova nó e suas conexões Descubra enlaces bloqueados Descubra enlaces ativos

Status mudou? Y

Mude status na base de dados Remova conexão

Y

Descubra nó Cadastre interface no NMS

Interface desligada? N Desligue e religue a interface e aguarde

Adicione conexão

Y

Trap recebida? N N tentativas?

N

Y

Figura 6 Algoritmo de atualização da visão topológica

O primeiro passo nesta fase é determinar se os nós detectados continuam fazendo parte da rede. Para tal, o algoritmo envia uma mensagem PING request para cada nó detectado e aguarda uma resposta por um tempo predefinido. Se a resposta esperada não chegar após um número predefinido de tentativas, o algoritmo assume que o nó não faz mais parte da rede e o remove da base de dados, juntamente com todas as conexões que iniciam ou terminam nele. No segundo passo, o algoritmo verifica o status de cada interface de cada nó existente na sua base de dados, usando para isso mensagens SNMP get. Se o status de uma interface mudou de UP para DOWN, então aquela interface e o enlace correspondente são removidos da base de dados. Se o status de uma interface mudou de DOWN para UP, então o algoritmo adiciona aquela porta à base de dados e força a mudança de status daquela porta, que não deve estar encaminhando tráfego, para DOWN e em seguida para UP, e aguarda durante um tempo predeterminado pela chegada de mensagens SNMP trap correspondentes. A chegada de mensagens SNMP trap correspondentes, provenientes do nó em questão e também de um outro nó, indica que ambos estão conectados pela porta cuja mudança de status foi forçada. Consequentemente, o

62

algoritmo adiciona a porta de cada um dos dois switches e o respectivo enlace à base de dados. A chegada de uma mensagem SNMP trap correspondente, proveniente unicamente do nó em questão, indica que um novo nó, ou até mesmo segmento de rede, foi adicionado na rede. Nesse caso, o algoritmo adiciona então a porta que leva a este novo nó na VLAN de serviço, de forma que o NMS possa alcançá-lo. Em seguida, o algoritmo executa as fases de descoberta de nó, de descoberta de enlaces ativos e de descoberta de enlaces bloqueados, sendo que agora as ações são limitadas aos novos elementos na rede. Protótipo do algoritmo e resultados experimentais

O algoritmo foi implementado em C++ como um processo Linux – um módulo aplicativo de um NMS que roda em um PC convencional. A implementação baseia-se no Net-SNMP, biblioteca pública e aberta de funções de geração, interpretação e manipulação de dados envolvidos em interações com agentes SNMP de gerência de elemento, presentes em switches comerciais. Dois requisitos dirigiram a implementação: i) basear-se em funcionalidades obrigatórias aos switches, conforme normatizações do IEEE e do IETF, e ii) usar os mesmos métodos independentemente do fabricante do switch. No entanto, apesar dos esforços em seguir o segundo requisito, em alguns casos foi necessário relaxá-lo em função de alguns fabricantes implementarem funções obrigatórias de diferentes formas, como diagnosticado nos switches comerciais, que consideramos para efeito de validação do algoritmo. Por exemplo, embora qualquer switch possa desligar ou ligar uma interface em resposta a uma mensagem SNMP set, nem todo switch corta os sinais elétricos da interface desligada, condição necessária para a emissão de uma mensagem SNMP trap e, consequentemente, para o funcionamento correto e preciso do algoritmo. Nesse caso, é necessário abrir uma conexão Telnet e executar o comando reset port. Uma rede laboratorial foi montada para permitir a experimentação e a validação do algoritmo e de sua implementação sob vários cenários. A rede consiste em um Linux PC operando como NMS, Linux PCs operando como roteadores de borda e switches comerciais operando como switches de camada 2 no núcleo da rede. Foram usados switches de três diferentes fabricantes: D-Link DES 3526, Extreme Networks Summit 200 e Cisco Catalyst 2950. Uma aplicação de teste também foi desenvolvida para automatizar os testes e a coleta de resultados em cada um dos cenários experimentados e repetidos por um número

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 57-64, jul./dez. 2009


Descoberta automática da topologia física de redes Ethernet com switches heterogêneos e de múltiplos fabricantes

predefinido de vezes. A aplicação mede o tempo decorrido durante cada fase do algoritmo de descoberta de topologia e registra a topologia resultante. Ao final da execução de um dado cenário, a aplicação compara os resultados obtidos em cada iteração e destaca as diferenças, se existirem. Dessa forma, a confiança do algoritmo pode ser verificada. Vários cenários de topologia física em malha foram configurados e testados, tais como a topologia apresentada na Figura 3. Os resultados obtidos provam que o algoritmo proposto é capaz de determinar, de forma precisa, a topologia completa de uma rede Ethernet, incluindo enlaces habilitados e desabilitados por STP, ao contrário das alternativas propostas na Seção 1, que não conseguem determinar a topologia apresentada na Figura 3, por exemplo. Em relação ao desempenho, o algoritmo se comporta como as curvas apresentadas na Figura 7, em um cenário de pior caso. Nesse exemplo, para cada nó na rede, uma porta STP e três portas bloqueadas são adicionadas e detectadas durante a fase de atualização da visão topológica. As curvas baseiam-se nas expressões (1), (2) e (3) e nos seguintes valores de parâmetros, que foram observados nas experimentações realizadas na rede laboratorial: Tgpb = 3s, Np = 3, Tpma = 10us, Tget = 0,5s, Tset = 10 ms, T c = 1ms, Ttlog = 3s, Ttcom= 0,2s and R = 10%. Tempo (segundos) 160 140

Descoberta de nó

120

Descoberta de enlaces ativos

100

Descoberta de enlaces bloqueados

80 60 40 20 0 1

4

7

10

13

16 19

22

25

28

31

Número de nós

Figura 7 Tempo de cada fase em função do número de nós da rede

Como esperado, o tempo necessário para a descoberta de nó é constante, sendo independente do número de nós e enlaces existentes na rede. O tempo necessário para a fase de descoberta dos enlaces ativos é em função do número de nós, Tpma, T get e T c. No entanto, Tpma e Tc são muito menores que Tget e os respectivos impactos no tempo de cálculo dos enlaces ativos são irrelevantes. Portanto, o tempo para determinar os enlaces ativos é dado por Tget multiplicado pelo número de nós na rede. A descoberta dos enlaces bloqueados é a fase

mais demorada do algoritmo. Isso porque a configuração da VLAN de serviço exige a abertura de uma conexão Telnet em cada um dos switches existentes na rede. Telnet é um protocolo orientado à conexão bastante lento e que impacta severamente o desempenho do algoritmo. Por exemplo, em uma rede com 20 nós, 19 segundos são consumidos para a descoberta do nó e descoberta dos enlaces ativos e 90 segundos para a descoberta dos enlaces bloqueados. Desses 90 segundos, 73 são gastos somente na configuração das VLANs. Se os switches suportassem a configuração de VLANs via SNMP, por exemplo, o tempo necessário para a execução dessa fase diminuiria consideravelmente. O tempo médio para a detecção da topologia física completa no cenário de pior caso, apresentado na Figura 3, é da ordem de alguns minutos, mas, obviamente, em cenários não tão severos, esse tempo pode ser consideravelmente menor. O tempo médio necessário para atualizar a visão topológica não consta na Figura 7 porque as ações tomadas variam bastante, dependendo do evento ocorrido. Por exemplo, a detecção de uma mudança simples em um enlace é bastante rápida, mas a detecção da entrada de um novo segmento de rede de tamanho considerável pode ser demorada. Conclusão O presente artigo descreveu um algoritmo de descoberta automática de topologia física de redes Ethernet. Ao contrário da grande maioria das propostas existentes, o algoritmo é capaz de detectar a topologia física completa de uma rede Ethernet composta de switches comerciais heterogêneos e de múltiplos fabricantes, sem qualquer necessidade de alteração no software embarcado nesses equipamentos, incluindo os de baixo custo. Além disso, o algoritmo é capaz de manter a visão topológica atualizada à medida que a topologia física da rede se altera em função de falhas de enlaces e nós e da entrada ou saída de novos enlaces, nós ou até sub-redes na rede. O algoritmo foi implementado em C/C++ e validado em uma rede laboratorial composta de vários switches comerciais de baixo custo de três fabricantes: D-Link, Extreme Networks e Cisco Systems. Experimentos executados nessa rede sob várias configurações topológicas, muitas vezes com inúmeros laços, comprovaram que o algoritmo é bastante robusto e razoavelmente rápido. Referências BEJERANO, Y. et al. Physical Topology Discovery for Large Multi-Subnet Networks. In: INTERNATIONAL CONFERENCE ON

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 57-64, jul./dez. 2009

63


Descoberta automática da topologia física de redes Ethernet com switches heterogêneos e de múltiplos fabricantes

INFORMATION AND COMMUNICATIONS (INFOCOM), 22., 2003, San Francisco. Proceedings... San Francisco: IEEE Press, 2003. p. 342-352. BEJERANO, Y. Taking The Skeletons Out Of The Closets: A Simple And Efficient Topology Discovery Scheme For Large Ethernet LANs. In: INTERNATIONAL CONFERENCE ON INFORMATION AND COMMUNICATIONS (INFOCOM), 25., 2006, Barcelona. Proceedings... IEEE Press. BLACK, R.; DONNELLY, A.; FOURNE, C. Ethernet Topology Discovery without Network Assistance. In: INTERNATIONAL CONFERENCE ON NETWORK PROTOCOLS (ICNP), 12., 2004, Berlin. Proceedings... IEEE, 2004. p. 328-339. BREITBART, Y. et al. Topology Discovery in Heterogeneous IP Networks. IEEE/ACM Transactions on Networking, v. 12, n. 3, p. 401-414, June 2004. BU, T. et al. Network Tomography on General Topology. In: ACM INTERNATIONAL CONFERENCE ON MEASUREMENT AND MODELING OF COMPUTER SYSTEMS (SIGMETRICS), 2002, Marina del Rey. Proceedings... New York: ACM Press, 2002. p. 21-30. CACERES, R. et al. Multicast-Based Inference of Network-Internal Characteristics: Accuracy of Packet Loss Estimation. In: INTERNATIONAL CONFERENCE ON INFORMATION AND COMMUNICATIONS (INFOCOM), 18., 1999, New York. Proceedings... IEEE. FARKAS, J. et al. Automatic Discovery of Physical Topology in Ethernet Networks. In: INTERNATIONAL CONFERENCE ON ADVANCED INFORMATION NETWORKING AND APPLICATIONS (AINA), 22., 2008, Okinawa. Proceedings... IEEE. INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS (IEEE). 802.1D: Standard for local and metropolitan area

networks – Media Access Control (MAC) Bridges. 2004. INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS (IEEE). 802.1AB: Standard for local and metropolitan area networks – Station and Media Access Control Connectivity Discovery. 2005. INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS (IEEE). 802.1Q: Standard for local and metropolitan area networks – Virtual Bridged Local Area Networks. 2006. INTERNET ENGINEERING TASK FORCE (IETF). IETF RFC 1213: Management Information Base for Network Management of TCP/IP based internets: MIB-II. 1991. INTERNET ENGINEERING TASK FORCE (IETF). IETF RFC 1493: Definitions of Managed Objects for Bridges. 1993. INTERNET ENGINEERING TASK FORCE (IETF). IETF RFC 2233: The Interfaces Group MIB using SMIv2. 1997. LOWEKAMP, B.; O’HALLARON, D. R.; GROSS, T. R. Topology Discovery for Large Ethernet Networks. In: ACM SPECIAL INTEREST GROUP ON DATA COMMUNICATIONS CONFERENCE (SIGCOMM), 2001, San Diego. Proceedings... New York: ACM Press, 2001. p. 237-248. RABBAT, M.; NOWAK, R.; COATES, M. Multiple Source, Multiple Destination Network Tomography. In: INTERNATIONAL CONFERENCE ON INFORMATION AND COMMUNICATIONS (INFOCOM), 23., 2004, Hong Kong. Proceedings... IEEE, 2004. p. 1628-1639. SALVADOR, M. R. et al. Automatic Discovery of Physical Topology in Heterogeneous Multi-vendor Ethernet Networks. In: INTERNATIONAL CONFERENCE ON COMMUNICATIONS (ICC), 2008, Beijing. Proceedings... IEEE. SON, M-H. et al. Topology Discovery in Large Ethernet Mesh Networks. IEICE Transactions on Communications, v. E89-B, n. 1, p. 66-75, Jan. 2006.

Abstract Automatic discovery of physical topology in support of network management is essential for Ethernet to succeed in metropolitan networks. Nevertheless, to date, there is no mechanism capable of automatically discovering the physical topology of Ethernet networks in a heterogeneous multi-vendor environment. This paper introduces such a mechanism. The algorithm collects information available even in low-cost off-the-shelf Ethernet switches, calculates the physical topology of the entire network and keeps the topological view updated during normal network operation as changes in the topology occur. This paper describes the method and its implementation in a testbed network for assessing the performance and the robustness of the mechanism. Key words: Resources discovery. Topology. Network management. Ethernet.

64

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 57-64, jul./dez. 2009


Análise do potencial de TV interativa no Brasil Esther Menezes*, Alexandre Freire da Silva Osorio **, José Orfeu Carvalho Antonini, Daniel Moutinho Pataca O objetivo deste artigo é analisar o potencial dos serviços de TV interativa no Brasil. A premissa básica é a de que esses serviços constituem inovações com grande potencial para prosperar na população brasileira habituada com o uso do televisor, particularmente entre aqueles que se encontram em desvantagem no acesso a computadores e Internet. Na primeira parte do estudo, apresentam-se a conceituação de serviço de TV interativa, a descrição das plataformas de rede subjacentes, a classificação dos serviços e a descrição de uma cadeia de valor genérica da TV interativa. Na segunda parte, identificam-se os fatores de sucesso ou fracasso das experiências de interatividade na TV em alguns países. Essa análise é seguida do levantamento da presença e do uso das tecnologias de informação e comunicação no Brasil e de serviços que podem guardar similaridades com serviços interativos pelo televisor, tais como comércio e governo eletrônicos. Tal conjunto de informações representa insumos para o alcance dos seguintes resultados: (i) estimativa do mercado potencial dos serviços de TV interativa, que representa os limites dentro dos quais a demanda poderá ser projetada; (ii) proposição do público-alvo desses serviços; e (iii) sugestões preliminares de serviços a serem desenvolvidos. Tais resultados representam subsídios à concepção de serviços de TV interativa e à definição de modelos de negócios que viabilizem esses serviços no contexto brasileiro. Palavras-chave: TV digital. Interatividade. Cadeia de valor. Inclusão digital. Introdução O objetivo deste artigo é avaliar a demanda potencial no Brasil por serviços de TV digital interativa. Para atender a esse objetivo, será empregado o conceito de serviços multiplataforma de TV digital interativa, que apresentam as seguintes características básicas: • podem ser providos por meio de qualquer plataforma tecnológica de rede, tais como radiodifusão terrestre, cabo, satélite, telefonia fixa e celular; • utilizam receptores de TV como terminais de acesso, incluindo terminais fixos (televisores e set-top boxes) e receptores móveis e portáteis (celulares e personal digital assistants – PDAs). Uma conceituação mais detalhada dos serviços de TV digital interativa (STVI) e das plataformas de rede subjacentes é apresentada na Seção 1, na qual são descritas também as classificações dos serviços e os atores e papéis envolvidos no seu provimento, que compõem a cadeia de valor da TV interativa. Na Seção 2, com o objetivo de identificar oportunidades para os serviços interativos, são apresentados um breve panorama do uso da TV interativa em alguns países e um levantamento sobre o uso de tecnologias de informação e comunicação (TICs) no Brasil. No primeiro caso, busca-se identificar os serviços existentes mais difundidos e utilizados pela população no mercado internacional e os seus fatores de sucesso ou fracasso. No caso brasileiro, é feito o levantamento de mercado de serviços similares,

tais como o uso de comércio eletrônico e de serviços de governo eletrônico, para a verificação de dois aspectos: (i) o grau de aceitação desses serviços; e (ii) as lacunas do mercado representadas pelas necessidades não atendidas pelos serviços existentes e que poderiam ser preenchidas pela TV interativa. Tais informações são utilizadas para subsidiar a análise do potencial dos serviços de TV interativa, apresentada na Seção 3. Nessa seção, também são propostos critérios que podem nortear a definição do público-alvo desses serviços e apresentadas algumas recomendações de concepção de novos serviços interativos. Este artigo foi baseado no trabalho de Menezes et al. (2008), desenvolvido no âmbito do projeto Serviços Multiplataforma de TV Interativa (SMTVI) do Fundo para o Desenvolvimento Tecnológico das Telecomunicações (FUNTTEL). 1 Conceitos 1.1 TV digital interativa A digitalização da TV possibilita a convergência entre a TV analógica convencional e os sistemas informáticos, criando uma nova forma de interação dos usuários com os programas televisivos. A interação passiva do telespectador com a TV, característica do sistema analógico cujas ações relativamente simples restringem as possibilidades de interação (mudar o canal, alterar volume), dá lugar a uma interação ativa na qual a informação é solicitada por demanda. A TV digital interativa não é considerada uma fonte de entretenimento somente, mas também

*Secretaria de Gestão do Estado de São Paulo. **Autor a quem a correspondência deve ser dirigida: aosorio@cpqd.com.br. Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009


Análise do potencial de TV interativa no Brasil

de serviços que podem incrementar a qualidade de vida do usuário, que, por sua vez, pode ter acesso aos serviços eletrônicos em sua residência. Em termos genéricos, segundo o relatório de Screen Digest et al. (2006), interatividade pode referir-se tanto ao conteúdo em si como às formas alternativas de uso de conteúdo que permitem ao usuário escolher o quê, onde, quando e como consumi-lo. Há conteúdo intrinsecamente interativo (como os jogos online) e há conteúdo que pode ser usufruído tanto por meio de mídias tradicionais como por meio de novas plataformas digitais que suportam recursos de interatividade. Mais especificamente com respeito aos serviços interativos acessados pela TV, os elaboradores citam também a definição de TV interativa da AFDESI1: um serviço que permite ao usuário interagir com o programa televisivo, gerando um resultado na tela da TV. Os serviços de TV interativa diferenciam-se da programação televisiva tradicional, que é linear, unidirecional e recebida de maneira sequencial pelo telespectador. Meyer et al. (2002) e Rios et al. (2005) definem interatividade na TV como uma funcionalidade que habilita o acesso a serviços que permitem a participação do usuário na escolha do conteúdo a ser usufruído por meio de um receptor de TV. Para proporcionar a interação do usuário, são necessárias aplicações de software executadas no receptor de TV (set-top box ou aparelho de TV integrado) com recursos e funcionalidades que permitem interagir de maneira mais ativa através do uso do controle remoto. O meio pelo qual ocorre a interação entre o usuário e o conteúdo do serviço televisivo é o canal de interatividade, conforme Figura 1. Esse meio é constituído de duas partes: o canal de descida e o canal de retorno. O canal de descida é o caminho percorrido pelas informações destinadas ao usuário ao longo de uma rede. Já o canal de retorno é bidirecional, podendo fazer o transporte de informações também do usuário para o provedor de serviço.

Figura 1 Representação esquemática do canal de interatividade

As aplicações interativas podem apresentar dois níveis básicos de interatividade: (i) interatividade

local, que ocorre entre o usuário e o conteúdo armazenado no receptor de TV, não necessitando, por essa razão, de um canal de retorno para envio de informações do usuário; e (ii) interatividade remota, que utiliza um canal de retorno para envio e recepção de informações entre o usuário e o provedor de serviço televisivo, sendo nesse caso o receptor conectado a uma rede de telecomunicações bidirecional, com ou sem fio. Os canais de descida e de retorno podem ser fornecidos por diversas redes de comunicações. Cada rede apresenta características técnicas que atendem a determinadas necessidades: enquanto algumas se prestam a transmitir conteúdo apenas no sentido provedor-usuário, outras possibilitam a transmissão de dados em ambos os sentidos. No caso da plataforma de TV mais difundida no Brasil, a radiodifusão analógica terrestre de sinal aberto, hoje somente é possível a distribuição unidirecional. A digitalização dessa plataforma, iniciada no País em dezembro de 2007, viabilizará a oferta de serviços interativos. A interatividade remota, quando requerida por um serviço, deverá ser suprida por outras redes que façam as vezes de canais de retorno externos (linha telefônica). De modo similar, o sistema de TV por satélite, Direct to Home (DTH), normalmente não provê canal para interatividade remota, que deve ser fornecida por outra rede. Entre as vantagens dessa plataforma de transmissão de TV digital, destacam-se a cobertura nacional ou mesmo continental, o grande número de canais disponíveis e a oferta de programas interativos. O cabo coaxial digital, por sua vez, já suporta aplicações com interatividade remota. Porém, a maior parte da rede de cabo no Brasil ainda é unidirecional e, portanto, requer a utilização de outra rede como canal de retorno para aplicações com interatividade remota. Atualmente, o cabo é o sistema de distribuição de TV por assinatura mais utilizado no Brasil, contando com 62,4% dos assinantes, mas a sua penetração ainda é pequena, possuindo menos de 4 milhões de assinantes (ANATEL, 2008). Por fim, a plataforma Internet Protocol Television (IPTV) é baseada em redes dedicadas IP bidirecionais de alta capacidade, apropriadas ao provimento de programas e aplicações de TV digital interativa. O número de canais disponíveis numa plataforma de IPTV é potencialmente elevado, uma vez que o consumo de banda no acesso é igual à banda ocupada pelos canais sintonizados pelo usuário num dado momento, diferentemente do que acontece nos serviços de radiodifusão ou de cabo. Esse serviço é incipiente no Brasil e ainda está em processo de implantação.

1 Association for the Development of Enhanced TV Services and Interactivity.

66

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009


Análise do potencial de TV interativa no Brasil

As características técnicas das plataformas de distribuição de TV e do canal de retorno condicionam o potencial de mercado dos serviços de TV interativa. Um serviço que requer a distribuição de um grande volume de dados dos usuários para o provedor do serviço exige um canal de retorno de banda larga, o que limita seu público em potencial a usuários que possuem esse tipo de conexão. Por outro lado, serviços que necessitam apenas de interatividade local exigem do usuário apenas o receptor adequado. Essa discussão é retomada na Seção 3, na qual são apresentados o mercado potencial e o público-alvo de serviços de TV interativa. 1.2 Classificação dos serviços A seguir, são apresentados dois tipos de classificação de serviços interativos para a TV digital. O primeiro leva em conta a utilização ou não do canal de retorno e o vínculo com a programação de TV. O segundo baseia-se no seu propósito de uso. 1.2.1 Classificação segundo canal de retorno e vínculo com a programação de TV Rios et al. (2005) apresentam uma classificação baseada em dois aspectos: (i) o uso do canal de retorno para encaminhamento das solicitações dos usuários; e (ii) o vínculo do serviço com a programação televisiva. O primeiro aspecto está relacionado ao tipo de interatividade que o serviço demanda, se local ou remota (conforme Seção 1.1). Com respeito ao segundo aspecto, aplicações interativas relacionadas ao programa podem fornecer ao usuário informações adicionais sobre o programa televisivo em exibição e permitir a sua interferência nos rumos da programação. Aplicações interativas não relacionadas ao programa conduzem o usuário a conteúdos e serviços que não guardam relação direta com o conteúdo exibido pela emissora ou programadora de TV. Na Figura 2, extraída de Rios et al. (2005), apresentam-se a classificação dos serviços de TV interativa de acordo com o tipo de interatividade e o vínculo do serviço com programas televisivos. Em cada categoria resultante, representada por um dos quadrantes da figura, são relacionados exemplos de aplicações. Originalmente, os autores elaboraram essa classificação visando a sua adequação aos serviços a serem oferecidos via plataforma de TV digital terrestre. Entretanto, essa classificação pode ser aplicada a serviços de TV interativa, independentemente da plataforma de rede utilizada. A seguir, são relacionadas algumas aplicações interativas que podem ser implementadas sem o

canal de retorno, conforme Rios et al. (2005):

Fonte: adaptado de Rios et al. (2005)

Figura 2 Classificação de aplicações de TV interativa em função da necessidade de canal de retorno e do relacionamento com o programa •

Guia eletrônico de programação: é utilizado para a seleção, por meio do controle remoto, daquilo a que o usuário pretende assistir na tela da TV. Contém a lista de programas que estão sendo e serão exibidos dentro de um dado período, informações sobre os programas e seus respectivos horários. O guia eletrônico é utilizado também para a gravação de programas pelos usuários por meio de PVRs (gravadores digitais de vídeo). • Enhanced TV: é um serviço de TV interativa que disponibiliza conteúdo adicional vinculado ao programa em exibição, como, por exemplo, imagens com diferentes ângulos de câmera, informações sobre a produção dos programas, informações adicionais sobre os temas que estão sendo abordados etc. • Informações diversas: exibição periódica na tela do televisor de informações atualizadas, que podem ser, por exemplo, notícias locais e nacionais, resultados de jogos esportivos e de loterias, cotação diária de ações, previsão do tempo e condições do trânsito local. • Jogos eletrônicos: envio de jogos eletrônicos sob a forma de arquivos de programa executáveis ao terminal digital. • Governo eletrônico pela TV: envio de conteúdo informativo por diversos órgãos públicos para os usuários. A seguir são relacionadas algumas aplicações interativas que necessitam do canal de retorno para sua execução, conforme Rios et al. (2005): • t-commerce: serviço eletrônico de compras pela televisão. Nesse caso, o receptor de TV utiliza o canal de retorno para trocar mensagens com os servidores responsáveis pela efetivação das solicitações de aquisição de produtos. • t-banking: serviço que oferece a correntistas de um banco serviços bancários pela TV, como consulta de saldo e transferências.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009

67


Análise do potencial de TV interativa no Brasil

Jogos em rede: jogos eletrônicos em receptores de TV que utilizam o canal de retorno e podem ser jogados por mais de um competidor presentes em diferentes locais. • Participação em programas de TV: aplicações interativas relacionadas a programas de TV que permitem, através do canal de retorno, a interação em tempo real dos usuários com os programas em exibição, pelo envio de respostas a perguntas, voto em enquetes etc. • Vídeos sob demanda em redes confinadas (walled garden): oferecidos por meio de redes de TV digital, de acesso restrito a um conjunto de conteúdos audiovisuais disponibilizados pelo ofertante do serviço.

definição dos serviços a serem desenvolvidos em função das características do público-alvo, na especificação preliminar e na elaboração de modelos de negócio genéricos para serviços de TV interativa, já que incorpora aspectos técnicos básicos (que variam basicamente de acordo com as funções ou propósitos de uso do serviço). Tabela 1 Elenco de aplicações por utilidade

1.2.2 Classificação segundo funções ou propósito de uso Pataca et al. (2002) propõem uma classificação dos serviços de TV interativa de acordo com o propósito básico de uso: comunicação, transação, entretenimento e informação. Cada uma dessas categorias apresenta as seguintes características: • Comunicação: há trocas de informação bidirecionais para que os usuários possam enviar e receber informações de outros usuários (e, às vezes, de máquinas), o que requer o uso de um canal de retorno. • Transação: serviços que também efetuam trocas de informação bidirecionais, geralmente entre usuários e máquinas. Portanto, há necessidade de um canal de retorno. Essas trocas devem ser feitas por meio de um canal seguro para garantir o sigilo, a autenticidade e a aceitação das informações trocadas. • Entretenimento: serviços que têm por finalidade a diversão e podem ser tanto unidirecionais como bidirecionais, dependendo dos recursos a serem oferecidos. • Informação: serviços que consistem na busca e consulta de informações e podem ser tanto unidirecionais como bidirecionais, dependendo dos recursos a serem oferecidos. Cada serviço de TV interativa é composto de uma ou mais funções ou propósitos de uso descritos anteriormente. Na Tabela 1 são oferecidos exemplos de serviços de TV interativa e as funções que cada um pode apresentar. Combinada com a classificação segundo canal de retorno e vínculo com a programação da TV, a classificação de Pataca et al. (2002) é útil na

1.3 Cadeia de valor e fluxo de receitas dos serviços de TV interativa Conforme Figura 3, a cadeia de valor dos serviços de TV interativa comporta os seguintes papéis: produção de conteúdo, provimento de serviços ou agregação, distribuição e consumo2, descritos a seguir. • Produção de conteúdo: trata-se da concepção, elaboração, desenvolvimento e formatação de aplicativos de software e de conteúdo a ser entregue aos usuários sob as seguintes formas: programação linear (na TV tradicional); conteúdo com o qual o usuário pode interagir (jogos, propagandas interativas); ou conteúdo que pode ser solicitado pelo usuário sob demanda. São considerados produtores e formatadores de conteúdo: – desenvolvedores de aplicativos interativos (software houses); – adaptadores de conteúdo para o formato televisivo (adaptação de informações do governo para o cidadão para serem exibidas na tela do televisor); – desenvolvedores de jogos; – produtores de conteúdo (filmes, novelas, seriados, telejornais); – produtores de metaconteúdo, que geram informações sobre o conteúdo em exibição e que são fundamentais para a geração de serviços interativos vinculados à programação;

2 Há ainda o papel de fornecedor de equipamentos e software, exercido pelos fabricantes de equipamentos de estúdio, transmissores e de bens eletrônicos de consumo que produzem os mais diversos tipos de receptores de TV (televisor integrado, set-top boxes, telefones celulares), bem como pelos desenvolvedores de aplicativos embutidos nos equipamentos, como o middleware no receptor de TV, que é a base para o funcionamento dos serviços interativos. Esses atores recebem receitas com a venda de equipamentos a todos os demais atores da cadeia de valor da TV interativa. Para simplificar, esse papel não está representado na Figura 3.

68

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009


Análise do potencial de TV interativa no Brasil

Fonte: Menezes et al. (2008)

Figura 3 Fluxo de receitas e de valores entre os papéis da cadeia de valor dos serviços de TV interativa – agências de publicidade cujos anúncios

produzidos são veiculados na TV. Provedores de serviços: este papel pode ser dividido nas três categorias a seguir: – provedores de serviços em geral ou agregadores: trata-se de prestadores de serviços que passam a oferecê-los sob a forma de serviço de TV interativa. São exemplos: bancos, varejistas, instituições de ensino, governo, programadores de TV, que demonstram potencial interesse em ofertar serviços via TV, sob a forma de t-gov, t-banking, t-commerce, t-learning, conteúdo sob demanda, serviços vinculados à programação etc. Para oferecer os serviços, esses provedores podem contratar atores que desempenham outros papéis, tais como: ▪ produtores de conteúdo para a formatação do serviço de TV interativa; ▪ empacotadores de serviços de TV interativa para encaminhá-los ao público; ▪ serviços auxiliares, como provedor de captura de dados dos usuários e provedor de acesso para estabelecer a comunicação com os set-top boxes. – Empacotadores de serviços de TV interativa: esses atores são responsáveis por disponibilizar os serviços de TV interativa em seus pacotes de programação de TV, que podem advir tanto de provedores de serviços (bancos, varejistas e outros citados anteriormente) como da oferta própria de serviços vinculados à sua programação. São eles os empacotadores de programação de TV, os programadores de TV e os provedores do guia eletrônico de aplicações (GEA). Novo ator em relação à cadeia de valor

atual da TV, o provedor de GEA exibe ao usuário as aplicações interativas disponíveis, facilitando a busca e o acesso a elas, de modo similar ao guia eletrônico de programação (definido na Seção 1.2.1). – Serviços auxiliares: esta categoria refere-se a serviços de caráter complementar que podem, em alguns casos, ser contratados, tais como: ▪ provedores de acesso: oferecem um número IP aos receptores com canal de retorno; ▪ provedores de captura: são contratados pelos provedores de serviços em geral para intermediar as transações efetuadas com os usuários. Sua função é recolher os dados das transações dos usuários e repassá-los aos provedores de serviços. Seu papel é semelhante ao do provedor de captura utilizado pelos sistemas de cartão de crédito. Sua participação no provimento dos serviços é opcional; ▪ armazenamento de conteúdo: o provedor de serviço pode contratar data centers para servidores de bancos de dados e servidores das aplicações de TV interativa. • Distribuição: este papel pode ser dividido em duas funções: canal de descida (envio do conteúdo aos receptores de TV) e canal de retorno (envio tanto das solicitações dos usuários ao provedor do serviço, como do conteúdo individualizado do provedor do serviço ao usuário). Os atores são as operadoras de rede de radiodifusão terrestre, cabo, satélite, telefonia fixa e celular. Qualquer operadora de rede pode exercer ambas as funções, com exceção das operadoras de radiodifusão terrestre e satélite, cujas limitações técnicas da plataforma dificultam o oferecimento do canal de retorno. • Consumo: usuários que acessam os serviços interativos por meio de televisores integrados, set-top boxes ou terminais móveis e portáteis (telefone celular), entre outros. Os fluxos de receitas representados na Figura 3 caracterizam as relações entre os atores presentes na cadeia. Os provedores de serviços em geral remuneram vários atores: os desenvolvedores de aplicativos, pela elaboração de aplicações interativas; os adaptadores, pela adaptação de informações existentes para que possam ser acessadas pelo televisor no modo interativo; os empacotadores, pelo encaminhamento dos serviços aos usuários; e os serviços auxiliares, sob demanda. Os distribuidores dos serviços de TV interativa, por sua vez, são remunerados pelos empacotadores de serviços para transmitir a sua programação, na qual se inserem os serviços

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009

69


Análise do potencial de TV interativa no Brasil

interativos. Por fim, os usuários remuneram os distribuidores sob a forma de assinatura de serviços que englobam canal de descida (TV) e retorno (telefonia e banda larga). Dependendo do modelo de negócios adotado, o usuário pode também remunerar diretamente os provedores dos serviços em geral para usufruir dos serviços de TV interativa. O modelo de negócios é a forma de remuneração dos agentes envolvidos no fornecimento de um serviço e pode combinar várias formas de remuneração dos atores, tais como: comissões, taxas de licença, publicidade, assinatura, taxa de veiculação de serviços interativos e receitas conforme o uso. As cobranças dependem do interesse dos usuários pelo consumo, e de sua sensibilidade aos preços, bem como dos acordos entre os atores e da capacidade de atendimento do lado da oferta. 2 Panorama internacional e brasileiro Com o intuito de identificar possíveis oportunidades para os serviços de TV interativa, foi feito um levantamento sobre o uso de TICs no Brasil, em particular da Internet. Uma vez que é possível encontrar na Internet serviços com características similares a potenciais serviços de TV interativa, a investigação da penetração e do uso da Internet ajuda a identificar lacunas que poderão ser preenchidas pela TV interativa, sem, contudo, representar concorrência em relação aos serviços existentes, mas com uma abordagem complementar. 2.1 Panorama internacional da TV digital interativa A convergência das comunicações tem trazido uma nova gama de opções de serviços, como, por exemplo, receber conteúdos audiovisuais em uma série de dispositivos diferentes (TVs, celulares etc.), e opções comerciais, como o triple play. Ao mesmo tempo, há uma crescente fragmentação da audiência, o que tem obrigado os canais de TV a mudar suas estratégias comerciais e a diversificar suas ofertas, investindo no mercado de telecomunicações e de Internet quando as leis locais permitem. A TV interativa se insere nesse contexto como mais uma opção de serviço de comunicação. Nos países-membros da Organisation for Economic Co-operation and Development (OECD), a plataforma de distribuição de TV terrestre tem constantemente perdido mercado para outras redes. Em 1995, 52% dos domicílios recebiam o sinal de TV somente por essa plataforma. Em 2002, esse número caiu para 35% (OECD, 2007a). A digitalização da TV nos países da Comunidade Europeia tem ocorrido em ritmo rápido. Em média, o número de domicílios com TV digital aumentou de 17% em 2003 para 23% em 2005.

70

O Reino Unido lidera esse processo com a presença da nova tecnologia em mais de 60% dos domicílios em 2005, segundo OECD (2007a). Apesar de a maioria dos domicílios nos países da OECD receber o sinal de TV digital por satélite, outras plataformas têm demonstrado rápida expansão. Como exemplo, podemos citar o mercado de IPTV, que vem crescendo a taxas muito altas desde 2005, quando as primeiras operações comerciais se iniciaram na Europa. Nesse continente, os mercados de IPTV que se encontram em estágios mais avançados concentram-se na França, na Itália e na Espanha (OECD, 2007b). Tabela 2 Tipos de acesso à TVI por região (final de 2001) Percentual de domicílios com acesso à TVI União Europeia Estados Unidos Japão Resto do mundo Total

Fonte: Meyer et al. (2002).

Cabo Satélite Terrestre 18% 46% 55% 52% 37%

73% 54% 45% 48% 62%

8% 0% 0% 0% 3%

Os dados sobre TV interativa são escassos. As informações encontradas concentram-se entre os anos 2000 e 2002, época provável do auge das experiências com esse tipo de serviço. Segundo Meyer et al. (2002), no final de 2001, o acesso a serviços de TV interativa (TVI) era mais difundido entre os domicílios com TV via satélite (Tabela 2). Na União Europeia, o país com o maior número de usuários de TVI era o Reino Unido, que apresentava a maior base de assinantes de TV por assinatura e detinha 46% do total de usuários europeus de TVI. Em seguida, vinham França, com 15% do total de usuários europeus, e Espanha, com 13%. Entre os serviços oferecidos em 2002, grande parte era do tipo enhanced TV; em seguida, jogos interativos, com 14% dos serviços oferecidos; compras, com 9%; e pay-per-view, com 9%. Os dados sobre receitas de 2001 de Meyer et al. (2002) mostram que os serviços de TV interativa com maior geração de receita foram o pay-per-view e o near video on demand, seguidos de jogos. Os maiores detentores das receitas de TVI em 2001 foram os vendedores de serviços de TV (referente a vendas de bens e serviços, assinatura, comissão sobre tráfego, anúncios e patrocínio) e os produtores de canais (propaganda interativa e receitas relativas a serviços interativos disponibilizados pelo canal), seguidos das operadoras de telecomunicações (referentes a uso de telecomunicações como canal de retorno) e de plataformas de acesso (hospedagem, comissão sobre tráfego e vendas).

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009


Análise do potencial de TV interativa no Brasil

O Reino Unido é o país que mais dispõe de dados e estudos sobre experiências com TV interativa. De acordo com Mercier e Barwise (2004), entre os assinantes de TV via satélite do Reino Unido, 80% já haviam usado alguma vez um serviço interativo3. A Sky, fornecedora de TV via satélite, teve um aumento nas receitas com propaganda interativa, jogos e t-commerce entre 2002 e 2003. Em 2004, houve interação com propaganda na TV em 30% dos domicílios com televisor interativo. Contudo, os autores avaliam que as receitas com esses serviços permaneceram em patamares bastante baixos. Em outra pesquisa mais recente, feita pela British Market Research Bureau Limited (BMRB, 2008), foi estimado em 9% o número de usuários de TV digital que interagiram com uma propaganda nos seis meses anteriores à entrevista. Contudo, desses 9%, apenas 28% consideraram válida essa experiência de interação. Além disso, identificou-se no Reino Unido uma tendência declinante do uso de alguns desses serviços entre 2000 e 2003. Entre os assinantes de TV a cabo ou satélite, 44% acessaram jogos pela TV em 2003 contra 60% em 2000. Quanto ao t-commerce, o número de pessoas que afirmaram ter comprado alguma mercadoria pela TV via satélite diminuiu de 18% em 2002 para 9% em 2003, tendência contrária ao número de respondentes que afirmaram ter feito compras via Internet, que sofreu um aumento consistente. Tal declínio é atribuído pelos autores ao crescente uso de serviços similares na Internet, adicionando-se, no caso dos jogos, a concorrência com outras plataformas, como game consoles, computadores e telefones móveis. Por outro lado, o uso de serviços que estabelecem vínculo entre o usuário e a programação e permitem a participação dos usuários em programas de TV acionando o controle remoto (quiz e outros tipos de competições) cresceu, no Reino Unido, de 16% em 2002 para 20% em 2003. Além disso, o percentual de assinantes que interagiram alguma vez com um programa televisivo aumentou de 35% para 40% no mesmo período. Esse fato pode indicar, segundo os autores, um potencial maior de crescimento dos serviços de TV interativa vinculados à programação, já que tal vínculo lhes confere maior competitividade em face dos serviços de Internet (em oposição aos serviços que os autores designam como standalone iDTV, que são independentes da programação, como t-commerce e t-game). Um exemplo atual de serviço de TVI é o BBCi, oferecido pela British Broadcasting Corporation (BBC). Esse serviço consiste na oferta de vídeo, áudio e texto interativos referentes a notícias,

informação, educação e entretenimento. Atualmente, o maior atrativo desse serviço, segundo a BBC (2008), são os esportes. Entretanto, esse canal está sendo cada vez mais usado também para acesso à programação interativa de música e entretenimento. De acordo com a BBC (2008), o público infantil perfaz 10% da audiência do BBCi, e um programa infantil figura entre os cinco programas interativos mais populares da BBC. O serviço alcança semanalmente 11 milhões de adultos (o que corresponde a 30% dos adultos com TV digital). Em relação à avaliação dos usuários, segundo a pesquisa do Office of Communications (OFCOM, 2007) sobre a importância atribuída aos serviços de TV, 87% dos usuários de TV aberta no Reino Unido mencionam o conteúdo como o item mais importante. O guia eletrônico de programação foi avaliado como muito importante para 35% dos usuários de TV aberta e 44% dos usuários de TV paga, mas somente 12% dos primeiros e 15% dos últimos avaliaram a interatividade da mesma forma. Uma pesquisa conduzida por Deloitte (2008) mostrou que 35% mencionam o Freeview (serviço de TV digital terrestre multicanal) como a inovação de maior impacto sobre a forma de ver TV, seguido do PVR (22%) e da TV com tela grande (10%). Apenas 7% mencionaram o red button e 7%, a TV pela Internet (IPTV). Nenhum entrevistado mencionou a TV móvel como inovação de grande impacto sobre a maneira de ver TV. Como balanço geral da experiência no Reino Unido, destacam-se alguns pontos. Um deles é o fato de que os serviços de TVI mais utilizados são aqueles vinculados à programação televisiva, com destaque para o gênero esportivo. Já a redução da participação dos serviços de t-commerce e t-games pode indicar forte concorrência com a Internet. De acordo com pesquisas de opinião pública recentes, a percepção de valor dos serviços de TVI para os usuários ainda é reduzida. Esse fenômeno também pode estar relacionado a problemas de usabilidade desses serviços na TV. Por sua vez, a França é o terceiro maior mercado de TV digital na Europa em número de domicílios, atrás apenas da Alemanha e do Reino Unido. A TV digital na França tem se expandido principalmente sobre os canais via satélite e, em menor escala, em redes por cabo, onde a digitalização é mais lenta, pois demanda maiores investimentos. Segundo a AFDESI (2004), em 2004 havia cerca de 75 serviços de TV interativa na França, onde o serviço ainda é considerado uma atividade complementar para as indústrias do setor. Os serviços que mais faturam são os de jogos e apostas em corridas de cavalos. O lançamento

3 Considerando usuários de todas as plataformas de TV digital, em 2008, 38% dos usuários com 15 anos ou mais interagiram com algum programa, segundo a BMRB (2008).

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009

71


Análise do potencial de TV interativa no Brasil

da TV digital terrestre, em 2005, foi realizado sem que houvesse uma boa disponibilidade de terminais de acesso interativos no mercado e sem a padronização de um middleware, o que tem dificultado a expansão da TV interativa para essa plataforma. Como conclusão geral da observação de alguns elementos da experiência com TV interativa em outros países, observa-se que a elevada difusão de outras TICs nos países – especialmente o computador, a Internet e a banda larga, assim como os serviços de TV por assinatura – pode ser um fator de intensa concorrência com a TV interativa. Dada a concentração das informações nos anos 2000 e 2001, depreende-se que esses anos foram de grande expectativa em torno das experiências de TVI. Contudo, desde então, a participação dos serviços de TVI no mercado não tem evoluído significativamente. Hoje, eles ainda representam um percentual bastante reduzido do faturamento do setor. Para viabilizar os serviços de TVI no Brasil, é necessária a criação de serviços diferenciados das demais TICs interativas, com características que só podem ser fornecidas por meio de um receptor de TV. Isso é bem ilustrado pelo caso do Reino Unido, onde esse nicho é ocupado pelos serviços interativos vinculados à programação. No caso brasileiro, além desse tipo de serviço, outros serviços podem ter um potencial elevado, dada a baixa penetração de outras TICs, conforme será visto na próxima seção.

econômico e a programas de crédito para a aquisição de computadores.

2.2 Presença das TICs no Brasil Apesar do aumento da presença e do uso das TICs observado nos últimos anos, uma boa parte da população brasileira ainda não desfruta de todos os seus benefícios. Conforme Figura 4, a quase totalidade dos domicílios brasileiros possui pelo menos um aparelho de televisão e rádio e mais da metade pelo menos um telefone celular. Já o computador alcança atualmente pouco menos de um quarto dos domicílios. Ao verificar a penetração de algumas TICs por segmentos da população, conforme Tabela 3, observa-se que apenas 24% dos domicílios da classe C e 4% dos domicílios das classes D e E somadas (DE) possuem computador. Vale observar que os domicílios das classes C e DE representam cerca de 83% da amostra pesquisada pelo Comitê Gestor da Internet no Brasil (CGI). Tais desigualdades ocorrem apesar da rapidez com que o computador tem se difundido pelos domicílios – de 17% em 2005, para 24% em 2007, segundo o CGI (2008). Tal difusão pode ser atribuída ao crescimento

Disparidades regionais e socioeconômicas também são observadas no uso do computador e da Internet, que também varia de acordo com o grau de instrução e da faixa etária da população. Somente 4% dos idosos (pessoas acima de 60 anos) e 9% da população com escolaridade mais baixa (analfabetos/educação infantil) já usaram a Internet ao menos uma vez, contra 70% dos que possuem entre 16 e 24 anos e 64% dos que concluíram o ensino médio. Do total da população acima de 10 anos, 41% já acessaram a Internet ao menos uma vez (ver Figura 5). O número de usuários de Internet (pessoas que acessaram ao menos uma vez nos últimos três meses) é de 34% do total da população acima de 10 anos (CGI, 2008). Em relação à frequência de uso, 53% dos usuários acessam todos os dias, número equivalente a 18% do total da população acima de 10 anos4. Entre os usuários brasileiros, encontram-se 14% de pessoas pertencentes à classe econômica DE, 7% provenientes da população com escolaridade mais baixa e 3% de idosos.

Fonte: CGI (2008). Elaboração própria. *Dado de 2007 refere-se a estimativa de domicílios com TV por assinatura (cabo, satélite e MMDS) com dados de CGI (2008) e ABTA (2008).

Figura 4 Proporção de domicílios com TICs Tabela 3 Proporção de domicílios com TICs (em relação ao total de domicílios)

4 A título de comparação, no Reino Unido, 60% da população acima de 16 anos era usuária de Internet em 2006 e 60% dos usuários (36% do total da população acima de 16 anos) acessavam todos os dias, segundo o Office for National Statistics (ONS, 2008).

72

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009


Análise do potencial de TV interativa no Brasil

(17% da classe DE) (CGI, 2008). As lan houses tornaram-se as maiores promotoras de inclusão digital no Brasil. Tal crescimento, entretanto, não tem sido suficiente para incluir a população de baixa renda. Tabela 4 Local de acesso individual à Internet (percentual sobre o número de usuários de Internet, 2007)

Fonte: CGI (2008).

Fonte: CGI (2008).

Figura 5 Percentual da população total que já usou computador e Internet (2007)

A Tabela 4 mostra quais foram os locais de acesso individual preferenciais em 2007. O forte crescimento do acesso público pago (em 2006-2007, saltou de 30% para 49% de preferência e de 48% para 74%, se contabilizarmos somente a classe DE) pode explicar o fato de que, apesar de somente 17% dos domicílios possuírem acesso (2% na classe DE), 41% da população já acessou a Internet

Na pesquisa do CGI (2008), os indivíduos que nunca acessaram a Internet alegaram dois principais motivos: • a falta de interesse/necessidade, manifestada por 55% dos que nunca acessaram; • a falta de habilidade com computador/Internet, mencionada por 39% dos que nunca acessaram. O motivo econômico aparece em terceiro lugar, em 31% das respostas, uma proporção significativamente menor do que a do motivo mais alegado. Provavelmente, a forte percepção da falta de habilidade com computadores e/ou com a Internet seja um indicativo da relevância que barreiras relacionadas à acessibilidade, usabilidade e inteligibilidade adquirem na manutenção do fosso digital (HOLANDA; DALL'ANTONIA, 2006). Pesquisas experimentais5 identificam tais dificuldades de uso em segmentos específicos da população. O público idoso, por exemplo, geralmente possui maior dificuldade para usar a Internet. Uma das barreiras identificadas nessas pesquisas é a pouca destreza no manejo do teclado e do mouse. Outra conclusão é a de que a inteligibilidade da Internet é baixa para a população menos escolarizada, uma vez que os mecanismos de navegação geralmente são concebidos para e por pessoas letradas6. Vale

5 Um exemplo é o projeto Soluções de Telecomunicações para Inclusão Digital (STID), desenvolvido pelo CPqD, cujo objetivo é estabelecer o planejamento de soluções de telecomunicações para a implantação de projetos governamentais de inclusão digital no Brasil, promovendo a sinergia de ações voltadas à inclusão digital e avaliando e desenvolvendo soluções e tecnologias baseadas em serviços e plataformas de telecomunicações. Alguns relatórios referentes à execução desse projeto encontram-se disponíveis em www.cpqd.com.br. 6 Como exemplo, podemos citar o posicionamento de informações relevantes (títulos) na parte superior de páginas. Apesar de ser este um expediente comum e mesmo esperado por pessoas que possuem o hábito da leitura, os testes de campo mostram que pessoas com baixo letramento, em geral, concentram suas atenções no centro da tela, pouco atendo-se à sua periferia.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009

73


Análise do potencial de TV interativa no Brasil

observar que os recursos de Internet são frequentemente disponibilizados em formatos e linguagens que não são facilmente compreendidos por esse público. De acordo com pesquisa desenvolvida por Sardinha e Lima-Lopes (2008) e Martins e Filgueiras (2007), os textos que constam no site do SUS, do Ministério da Saúde7, exigem aproximadamente 18 anos de escolaridade para serem bem compreendidos8, isto é, pós-graduação. A falta de inteligibilidade e a baixa usabilidade e acessibilidade na Internet podem ser fatores que geram a falta de interesse demonstrada por quem não a utiliza: 26% do total da população menos escolarizada ou analfabeta alegou desinteresse, enquanto, na população com nível superior, essa proporção é de apenas 5% (Figura 6). Por fim, o desinteresse pela Internet, captado pela pesquisa do CGI, pode ser também um indício da falta de identificação do usuário com a tecnologia, que muitas vezes é desvinculada das reais necessidades e aspirações de seus possíveis usuários. Os dados levantados sobre a penetração da Internet no Brasil revelam que há fortes barreiras a serem vencidas para que o acesso a serviços eletrônicos seja universalizado. Tais barreiras são muitas vezes sutis e imunes a soluções convencionais, como, por exemplo, aquelas calcadas unicamente na oferta de acesso físico, tais como a ampliação da oferta de postos de acesso públicos e gratuitos e programas de subsídio. Nesse contexto, a introdução de serviços de TV interativa pode representar uma grande oportunidade de difundir serviços baseados em TICs para a população menos favorecida. Tal oportunidade é viabilizada, primeiramente, porque o terminal físico necessário, o set-top box interativo (que pode ser acoplado ao televisor preexistente no domicílio), apresentará um preço mais acessível do que um computador, propiciando sua difusão entre famílias com menos poder aquisitivo. Em segundo lugar, porque a TV é um equipamento com o qual a grande maioria da população já se sente familiarizada, o que facilitaria a sua aceitação no mercado. Por fim, em face da grande quantidade de pessoas dependentes do acesso público à Internet (conforme Tabela 4), os serviços de TV interativa podem representar uma alternativa atrativa de acesso, propiciando mais comodidade aos usuários em geral. Para que essa perspectiva se concretize, é essencial que a inteligibilidade, a usabilidade e a acessibilidade sejam tomadas como premissas de desenvolvimento dos serviços de TV interativa. A grande familiaridade dos brasileiros

com a TV, em todos os estratos sociais, deve ser combinada a uma formatação dos serviços adequada aos preceitos da linguagem televisiva.

Fonte: CGI (2008).

Figura 6 Principais motivos para nunca ter acessado a Internet, sobre o total da população

A construção de interfaces mais inteligíveis, ou seja, linguística e culturalmente mais próximas da realidade dos indivíduos digitalmente excluídos, é uma condição necessária para diminuir a distância que eles percebem da tecnologia. As conclusões acerca da construção de interfaces inteligíveis levadas a termo pelo projeto STID podem ser de grande utilidade para a construção de serviços de TV interativa. No próximo item, analisa-se mais detidamente o potencial de difusão dos serviços de TV interativa no Brasil, dadas as características socioeconômicas de seu mercado. 3

Potencial de mercado dos serviços de TV digital interativa no Brasil Nesta seção, são discutidas as seguintes questões: (i) o potencial brasileiro de mercado dos serviços de TV interativa (STVIs); (ii) o público-alvo desses serviços; (iii) considerações preliminares para a estimativa de demanda por serviços de TV interativa; e (iv) sugestões de serviços a serem desenvolvidos por apresentarem algum potencial para inovações

7 Foram analisadas 254 páginas do site do SUS. 8 Foi usado um índice conhecido como Flesch-Kincaid para avaliação do nível escolar necessário.

74

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009


Análise do potencial de TV interativa no Brasil

disruptivas em função da avaliação dos serviços similares que o mercado potencial faz atualmente e de suas expectativas em relação a eles (discutidos na Seção 2). O mercado potencial de um serviço qualquer engloba todos os indivíduos habilitados a consumi-lo no universo onde o serviço será oferecido. No Brasil, a estimativa de mercado potencial deve partir dos dados básicos de sua população e dos domicílios. 3.1 Mercado potencial Para que um indivíduo possa usufruir dos serviços de TV interativa, existem alguns pré-requisitos. O requisito básico para fazer parte do mercado potencial de STVI é possuir um aparelho televisor. No caso dos serviços de TV interativa que requerem canal de retorno, o indivíduo terá que contratar um serviço de telecomunicações para realizar a comunicação por esse canal (por exemplo, rede de telefonia fixa ou celular). Há ainda a possibilidade de que o serviço exija um canal de retorno de alta velocidade, dependendo do volume dos dados a serem transportados do usuário para o provedor do serviço. Nesse caso, o domicílio do usuário precisará ser dotado de conexão de alta velocidade. A Figura 7 ilustra o mercado potencial dos serviços de TV interativa, de acordo com os requisitos de tecnologias do usuário. Cabe observar que a figura é meramente ilustrativa da composição do mercado potencial e que as áreas dos círculos não estão em escala9.

Fontes: *PNAD; **CGI; ***Estimativa com números da ABTA e do CGI. Todos os dados são de 2007.

Figura 7 Diagrama de representação gráfica do mercado potencial de serviços de TV interativa

Conforme Seção 2, segundo a Pesquisa Nacional por Amostra de Domicílios – PNAD (IBGE, 2007), 94,5% dos domicílios dispunham de aparelho televisor em 2007. Esse percentual corresponde ao mercado potencial de serviços de TV interativa em geral (ignorando-se, por ora, a necessidade do receptor de TV com middleware). Nesse universo, que corresponde praticamente à totalidade dos municípios, serviços que fazem uso de um canal de retorno compatível com telefone fixo ou celular podem atender a 77% dos domicílios. Entretanto, poucos domicílios estariam atualmente habilitados a receber serviços de TV interativa que exigem uma conexão de alta velocidade como canal de retorno, pois apenas 9% deles possuem banda larga. Com base nessas informações, deduz-se que os serviços de maior alcance seriam os de interatividade local e aqueles que não necessitam de uma conexão de alta velocidade como canal de retorno. Os dados da Figura 7 correspondem ao mercado potencial dos serviços de STVI atualmente. A opção por estimar o mercado potencial com base em domicílios está vinculada a razões práticas e à necessidade futura de cálculo da estimativa de demanda por serviços de TV interativa concomitantemente à projeção de vendas de receptores com middleware10, que deve ser feita por domicílio. A estimativa de utilização dos serviços deverá levar em conta o público-alvo adotado. A seção seguinte apresenta a definição do público-alvo, baseada no conceito de inovação disruptiva e na realidade socioeconômica brasileira. 3.2 Definição do público-alvo dos serviços de TV interativa Para a definição do público-alvo dos serviços de TV interativa, foram empregados como critérios norteadores aqueles em que se baseia o conceito de inovações disruptivas. Gilbert (2003) identifica as principais características das inovações disruptivas, definidas como novos produtos e serviços que atendem a necessidades que não são supridas por nenhum produto ou serviço existente, resultando, assim, na criação de um novo mercado. Inicialmente, essas inovações não disputam mercado com os atores já estabelecidos. Com o tempo, porém, essas inovações se sobrepõem aos mercados já estabelecidos, passando a ocupar o espaço antes dominado por outros atores. Um exemplo mencionado pelo autor é o computador pessoal, que acabou por substituir o mainframe.

9

Na Figura 7 estão representadas somente as intersecções entre os grupos de domicílios que possuem ambos os tipos de telefone (fixo e celular). As demais intersecções não estão representadas na figura. 10 Atualmente, alguns domicílios já possuem receptor apto a receber e executar aplicações interativas. São eles os que recebem TV a cabo digital ou satélite digital. Toda a rede via satélite já se encontra digitalizada – em torno de 1,75 milhão de assinantes em 2007, segundo a Associação Brasileira de TV por Assinatura (ABTA, 2008), ao passo que a TV a cabo encontra-se parcialmente digitalizada, com alguns assinantes com receptor de TV a cabo digital.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009

75


Análise do potencial de TV interativa no Brasil

A inovação disruptiva apresenta três fases. A primeira é de criação de um mercado novo que não compete com o já estabelecido. A segunda fase é de expansão desse novo mercado a ponto de afetar o crescimento do mercado como um todo. A terceira e última fase, a inovação, que foi aperfeiçoada com o tempo, reduz significativamente o tamanho do mercado estabelecido pelos concorrentes antes da introdução da inovação disruptiva. Desse modo, uma inovação disruptiva pode ser identificada segundo três características: 1. no início, a inovação disruptiva é subestimada pelos usuários que já consomem outros produtos e serviços; 2. a inovação disruptiva habilita o seu consumo por pessoas que antes não consumiam por falta de habilidade ou em decorrência do baixo poder aquisitivo; 3. a inovação disruptiva auxilia na execução de tarefas que o usuário não conseguia executar plenamente com os produtos e serviços disponíveis. Dadas as características das inovações disruptivas, considera-se que a grande quantidade de excluídos da Internet representa uma oportunidade para a difusão de serviços de TV interativa no Brasil, conforme Seção 2. Tomando como base os critérios definidores das inovações disruptivas, podemos definir o público-alvo dos serviços de TV interativa como os segmentos da população brasileira que menos se beneficiam hoje das TICs. Os segmentos sociais com menos oportunidades de acesso à Internet são: • idosos; • indivíduos pertencentes às classes econômicas C, D e E; • indivíduos com baixo letramento (analfabetos ou que possuem nível educacional equivalente ao infantil). Uma vez definido o público-alvo, o próximo passo é quantificá-lo. Na Tabela 5, encontram-se os dados sobre esse público, por segmento, estimados com base em números de 2007 fornecidos pelo CGI e pela PNAD. Cabem duas observações sobre os critérios da definição do público-alvo apresentada nesta seção. Primeiro, o fato de termos dado preferência a um público com acesso dificultado ou nenhum acesso a computador e Internet não quer dizer que os serviços serão exclusividade desse público. Outros segmentos poderão utilizar os serviços de TV interativa como complemento ou até mesmo em substituição aos demais serviços. Com efeito, inovações disruptivas têm o poder de criar um novo mercado no qual substituem, em boa parte, os produtos que até então dominavam o mercado (isto é,

considerados mainstream). A questão é que o desenvolvimento de serviços com potencial disruptivo deve estar voltado não ao público mainstream, que geralmente tem mais dificuldade de ver o valor e a utilidade de um novo produto, e sim ao público que não está sendo satisfatoriamente atendido pelos produtos existentes (e, por isso mesmo, podem estar mais atentos ao valor de novos produtos). Além disso, a TV interativa apresenta mais diferenças do que semelhanças com o computador. Por isso, essa nova tecnologia não deve ser encarada como um completo substituto das TICs existentes. Tabela 5 Número de indivíduos do público-alvo, por segmento11 Não acessaram Internet* Segmentos da população Pop. Pop. % % (milhões) (milhões) 10 a 15 anos 13 24,7 47 11,6 16 a 24 anos 20 38,0 40 15,2 25 a 34 anos 19 36,0 55 19,8 Faixa 35 a 44 anos 17 32,3 77 24,8 etária 45 a 59 anos 18 34,2 88 30,1 60 anos ou mais 12 22,8 97 22,1 A 1 1,9 11 0,2 Classe B 16 30,4 34 10,3 socioec. C, D e E 83 157,6 72 113,4 Superior 12 22,8 22 5,1 Grau de Médio 29 55,0 49 27,0 28 53,1 72 38,3 instrução Fundamental Analfab./ed. infantil 32 60,7 93 56,5 Total da população

Fontes: CGI e PNAD. * Nos últimos 3 meses.

Apesar da intersecção que certamente ocorrerá entre os usuários de ambas as tecnologias, com base nas considerações expostas, a posição assumida neste artigo é a de que a TV interativa possui potencial para prover o acesso a serviços digitais que hoje não são acessíveis a uma boa parte da população, podendo até mesmo tornar-se uma inovação disruptiva. 3.3 Considerações sobre a estimativa de demanda O mercado potencial e o público-alvo oferecem as primeiras informações a serem consideradas na estimativa de demanda por um serviço. O mercado potencial define o teto, ou o limite máximo, que a demanda pelos serviços pode alcançar. Por sua vez, o público-alvo, contido no mercado potencial, pode ser tomado como referência para o estabelecimento de uma meta factível de participação de mercado. Uma vez estabelecidos os limites e as metas de mercado, parte-se para a análise das principais condicionantes da demanda pelos serviços. No caso dos serviços de TV interativa, além das condicionantes que definem as fronteiras do mercado potencial, podemos mencionar a necessidade de aquisição de um receptor com

11 Os dados da Tabela 5 são uma aproximação obtida com base na distribuição da amostra em segmentos da população da pesquisa do CGI de 2007, aplicada ao total da população fornecido pela PNAD de 2007.

76

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009


Análise do potencial de TV interativa no Brasil

middleware capaz de receber e executar aplicações interativas. Com base em pesquisa primária realizada para o levantamento do interesse em TV digital, Gerolamo et al. (2004) projetaram possíveis curvas de demanda por set-top boxes interativos em função do preço e do interesse por interatividade. Segundo essa projeção, os set-top boxes interativos interessariam a 70% dos entrevistados a um preço de R$ 200,00. Embora essa projeção tenha sido feita para a tecnologia de TV digital terrestre, consideramos que o interesse em interatividade pode ser estendido a outras plataformas. Cruzando essa projeção com os dados do mercado potencial (Figura 7), poderíamos obter como projeção simplificada da demanda por serviços de TV interativa (multiplataforma) os números apresentados na Tabela 6. Tabela 6 Estimativa do mercado potencial de serviços de TV interativa Interatividade Local Local + canal de interatividade Local + canal de interat. banda larga

Domicílios com

Sobre Com set-top total box interativo

Televisor Celular Telefone fixo

93% 74% 45%

65% 52% 32%

Banda larga

9%

6%

Os resultados da Tabela 6 poderiam, assim, representar a demanda potencial acumulada por serviços interativos ao final de um período, dado o preço do receptor interativo de R$ 200,00. Cabe, porém, mencionar outros fatores limitantes dessa demanda: • O preço de R$ 200,00 para um set-top box interativo pode não se viabilizar no curto prazo. Esse comportamento das vendas de receptores interativos deve condicionar o ritmo de crescimento do mercado de serviços de TV interativa, especialmente para um público-alvo composto por indivíduos com poder aquisitivo mais baixo. • Ainda que não haja a limitação dada pela ausência do receptor interativo no domicílio, a difusão dos serviços de TV interativa não ocorrerá de uma só vez. A hipótese mais plausível é de que a curva de difusão desses serviços siga o padrão de uma curva em S, que pode ser simulada por meio de modelos de difusão de inovações (ÁVILA et al., 2006). Um dos modelos mais utilizados é o de Bass12, que tem, como parâmetros de entrada, variáveis relacionadas à influência da propaganda e dos amigos na decisão de adquirir o produto ou serviço. • O mercado potencial e o público-alvo estimados são baseados em fotografias do momento, que podem mudar com o tempo. A

tendência observada atualmente, conforme Seção 2, é a de crescimento do número de usuários de Internet e de domicílios com computador e Internet. Além disso, o uso de outras plataformas de comunicação, como a TV a cabo e satélite, também pode crescer, modificando o perfil de demanda pelos serviços. O acesso à Internet banda larga, por exemplo, pode ser favorecido pelo crescimento econômico e por programas governamentais de incentivo à difusão. Essa tendência é relevante se considerarmos plausível a hipótese de que a Internet pode concorrer com o uso dos serviços de TV interativa no Brasil (tal como ocorreu no Reino Unido, conforme Seção 2). Por outro lado, os usuários de Internet estão mais familiarizados com aplicações interativas, o que pode estimular o uso de serviços de TV interativa, seja como complemento ou em substituição a alguns serviços oferecidos pela Internet. Dadas as incertezas inerentes às inovações (que são intensificadas no caso de inovações disruptivas), qualquer estimativa de demanda está fadada a imprecisões, que podem resultar em erros de grande magnitude. Contudo, ainda que pouco precisa, ao menos uma estimativa do potencial de demanda é necessária para avaliar a viabilidade de novos produtos e serviços. Com base no mercado potencial e no público-alvo, é possível definir ao menos o intervalo desejado para a demanda, ou seja, aquele entre a demanda mínima necessária e o provável mercado potencial. As chances de viabilização do serviço tornam-se maiores quanto maior for a distância entre a demanda mínima e o mercado potencial. Ou seja, quanto maior a área dentro da qual a demanda pode sofrer variações sem comprometer a viabilidade do serviço, maior a robustez do serviço em relação a variações não previstas na demanda. A Figura 8 ilustra esse ponto: dois serviços diferentes, com os mesmos níveis de variabilidade da demanda (demonstrada em uma análise de sensibilidade da demanda). O serviço de maior risco é aquele em que a distância entre mercado potencial e demanda mínima necessária é menor. O primeiro caso ilustrado na figura, o de menor risco, não requer mais investigações sobre a demanda. Já no segundo caso, o risco de a demanda não chegar a um nível mínimo é maior. Nesse caso, recomenda-se reduzir as incertezas com pesquisas de levantamento de interesse junto ao público para confirmar o grau mais aproximado de risco. Adicionalmente, é possível empregar modelos de simulação da demanda baseados em modelos de difusão de inovações (como o de Bass, citado

12 Para obter mais detalhes sobre os modelos de difusão de inovação com formato em “S”, consulte Bonadia et al. (2006), que aplicam o modelo de Bass para projetar a demanda por receptores de TV digital terrestre.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009

77


Análise do potencial de TV interativa no Brasil

anteriormente). Assim, a estimativa de demanda deverá considerar a calibração adequada dos parâmetros de entrada desse modelo e das condicionantes da demanda, as quais dependerão de uma especificação mais detalhada dos serviços a serem desenvolvidos.

Figura 8 Grau de risco de um serviço em função do mercado potencial, da demanda mínima necessária e da sensibilidade da demanda

3.4 Recomendações para a concepção de novos serviços de TV interativa A concretização de melhores cenários de demanda por serviços de TV interativa deve observar algumas recomendações. Primeiro, os usuários devem perceber claramente a utilidade e o valor dos serviços. Segundo, os serviços devem atender a uma ou mais necessidades dos usuários não supridas pelos serviços de Internet existentes, o que também caracteriza as inovações disruptivas. A seguir, são feitas recomendações para alguns serviços: • t-gov: serviços de governo eletrônico via televisor devem ter usabilidade aperfeiçoada em relação ao e-gov para encorajar o usuário a utilizá-lo. Um serviço de t-gov cuja interface seja baseada na linguagem televisiva, muito familiar ao brasileiro, pode demonstrar elevada atratividade e, assim, atender ao público-alvo de modo mais efetivo do que os serviços de e-gov existentes, além de amenizar a preferência pelo contato pessoal

no uso do serviço de governo, sendo esse o motivo mais frequentemente apontado pelos usuários que não usam o e-gov (conforme Seção 2). t-commerce: segundo os dados apresentados na Seção 2, a pesquisa de preços pela Internet é um serviço mais popular do que a própria compra pela Internet, em virtude da grande utilidade percebida da primeira e das razões da não utilização do e-commerce, entre os quais se destacam: a preferência por conferir pessoalmente o produto, a falta de necessidade ou interesse e a preocupação com a segurança dos dados pessoais do usuário, necessários para a efetivação da compra. Com base nessas observações, um serviço de t-commerce deve estimular a compra, minimizando a questão da necessidade de manipular o produto e oferecendo uma opção de manipulação virtual que permita ao usuário visualizar, com imagens na tela da TV, detalhes do produto em diferentes ângulos e em movimento. Dependendo da natureza do produto, pode haver demonstrações interativas. t-CoD: este serviço pode ser semelhante ao oferecido pelos sites de Internet de emissoras de TV aberta. Esses sites disponibilizam, em formato streaming, trechos de programas que foram exibidos na TV. A diferença residiria no uso de interfaces mais simples, inspiradas na linguagem televisiva, para facilitar o uso de um serviço com o qual o usuário interage unicamente por meio do controle remoto. O serviço poderia oferecer streamings de vídeo de curta-metragens, comerciais, charges, animações, trechos de filmes e vídeos com vínculo com a programação televisiva (por exemplo, ver erros de gravação da cena da novela exibida no momento) e gols da rodada. Outra possibilidade é a oferta de conteúdo de caráter regional, produzido localmente. t-games: por ser o televisor tradicionalmente utilizado de modo coletivo em uma família, um jogo oferecido pela TV que envolva mais de um participante por receptor é uma proposta factível, que explora essa característica da TV. Para que mais de uma pessoa possa participar de um jogo por meio do mesmo receptor interativo, pode ser necessário o uso de dispositivos auxiliares, que podem ser dispositivos específicos a jogos (como o joystick) ou dispositivos portáteis que sejam amplamente difundidos, como o terminal celular, para facilitar o acesso ao t-game. t-learning: com base no perfil médio dos estudantes de cursos de graduação a distância traçado pelo Inep13, podemos supor

13 "Mais velho, mais pobre, majoritariamente casado, tem filhos, é originário da escola pública, tem pais com escolaridade básica, trabalha e sustenta a família, tem menos acesso à Internet, usa menos o computador e tem menos conhecimento de espanhol e inglês" (FOLHA DIRIGIDA, 2008).

78

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009


Análise do potencial de TV interativa no Brasil

que uma considerável parcela da população apresenta dificuldades para frequentar cursos presenciais, seja por limitações de tempo, distância ou por dificuldade de locomoção. Para esses, os serviços de t-learning podem servir de complemento escolar. Em virtude das limitações de interação da TVI, é pouco provável que venham a existir cursos completos a distância. No entanto, poderiam existir módulos de cursos, diminuindo a necessidade de presença dos alunos com tais dificuldades. Portanto, um possível serviço poderia ser construído em conjunto com escolas, de forma que parte da formação do aluno seja realizada em casa, usando o terminal de TV. De modo geral, as diretrizes básicas para o desenvolvimento dos serviços de TV interativa podem ser resumidas conforme segue: • Os serviços devem ser simples, de fácil compreensão, com textos curtos e que exigem poucas operações do usuário. Seria uma forma de atender ao público-alvo, que dificilmente apresenta recursos mais sofisticados de TICs em sua residência (computador e Internet). Seria também uma maneira de empregar bem os recursos da linguagem televisiva e, ao mesmo tempo, diferenciar os serviços de TV interativa dos serviços hoje oferecidos via Internet (à qual seriam reservados os serviços mais complexos, que exigem recursos de hardware, software e de rede com capacidade maior do que a de um set-top box). • Exploração da linguagem televisiva para a criação de interfaces simples e amigáveis (que está relacionada com a necessidade de oferecer serviços simples, descrita acima). • Possibilidade de utilização dos serviços por mais de um usuário ao mesmo tempo, por meio do mesmo receptor de TV interativa: sugere-se a criação de soluções que permitam a um usuário assistir normalmente a uma programação pelo televisor e, ao mesmo tempo, utilizar um serviço de TV interativa, seja por meio de uma “janela” adicional aberta na tela do televisor, seja por meio de um dispositivo alternativo, como um celular ou um PDA. Nesses casos, seria possível a mais de um usuário usufruir de diferentes serviços de TV interativa, ou do mesmo STVI, desde que o dispositivo adicional oferecesse um mecanismo de comunicação com o receptor de TV interativa (bluetooth ou Wi-Fi). Conclusão São amplas a diversidade de serviços de TV interativa que podem ser desenvolvidos e as possibilidades de modelos de negócios para viabilizá-los.

Contudo, a análise do panorama mundial revelou que apenas uma parcela reduzida da população dos países analisados utiliza esses serviços. Alguns estudos concluem que os serviços mais difundidos são aqueles vinculados à programação televisiva e que houve perda em participação de serviços com similares na Internet, como t-commerce e t-games. Vale a pena mencionar a dificuldade de obter dados mais atuais sobre o mercado de TV interativa, o que pode significar, entre outros aspectos, que esse mercado ainda é incipiente nos países observados e que as expectativas já foram maiores. Apesar da baixa penetração desses serviços no panorama internacional, o Brasil apresenta particularidades que podem diferenciar a demanda nacional. O Brasil possui um grande contingente de pessoas que não têm acesso à Internet nem ao computador. Embora o número de usuários tenha aumentado com os anos, a maioria da população ainda utiliza pouco a Internet. A falta de habilidade e a falta de interesse são as duas principais razões apontadas para o não uso da Internet. A falta de habilidade com computadores e/ou Internet, principal motivo declarado para o não uso da Internet no Brasil, deve ser considerada quando se especificam os serviços de TV interativa. A construção de interfaces acessíveis, inteligíveis e de alta usabilidade é crucial para o sucesso desses serviços. Já a utilidade percebida pode ser melhorada à medida que as especificações dos serviços forem feitas com articulação social, envolvendo os futuros usuários no processo. Considerando-se que os televisores se encontram em praticamente todos os domicílios brasileiros e que a população brasileira experimenta uma relação de grande familiaridade com a linguagem televisiva, aposta-se que os serviços de TV interativa podem vir a suprir especialmente aquela parte da população brasileira que hoje não acessa o computador ou a Internet pelos mais diversos motivos. Outro dado relevante é a alta penetração de telefones celulares, que são possíveis candidatos a canais de retorno para os serviços de TV interativa. Por tudo isso, o Brasil apresenta condições diferenciadas para que a TV interativa se revele uma solução inovadora e até mesmo uma inovação disruptiva. Com base nessa avaliação, apresentou-se o público-alvo para o qual os serviços de TV interativa devem ser desenvolvidos: os grupos menos atendidos pelas TICs. De modo geral, são os residentes em domicílios sem computador ou Internet, das classes socioeconômicas mais baixas (C, D e E), idosos e pessoas com baixo letramento. Essa é uma possível abordagem, que parte do pressuposto de que o potencial da TVI pode residir entre aqueles que têm menos oportunidade de acesso às TICs. Cabe lembrar,

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009

79


Análise do potencial de TV interativa no Brasil

porém, que nada impede que mesmo os grupos com maior acesso às TICs possam também se interessar pelos novos serviços e utilizá-los de forma complementar. A definição do público-alvo dos serviços foi precedida pela estimativa do mercado potencial, que estabelece o limite superior da demanda. Juntamente com a demanda mínima necessária por serviço, que deve ser definida em função das especificações técnicas e dos custos, considera-se a faixa de variação em que a demanda deve se situar. Referências

DELOITTE. Loves Me, Loves Me Not... Perspectives on the UK Television Sector. MediaGuardian Edinburgh International Television Festival, 2008. Disponível em: <http:// www.deloitte.com/assets/DcomUnitedKingdom/Local %20Assets/Documents/UK_TMT_LovesMe_Love sMeNot.pdf>. Acesso em: 22 fev. 2010. ENSINO A DISTÂNCIA: um segmento em expansão, mas com longo caminho a percorrer. Folha Dirigida, ago. 2008. Disponível em: <http://www2.abed.org.br/visualizaDocumento.as p?Documento_ID=274>. Acesso em: 25 set. 2008.

AGÊNCIA NACIONAL DE TELECOMUNICAÇÕES (ANATEL). Relatório anual 2008. Disponível em: <http://www.anatel.gov.br/hotsites/relatorio_anual _2008/Mensagem.htm>. Acesso em: 24 nov. 2008.

GEROLAMO, G. et al. Mapeamento da demanda: Pesquisa de mercado e análise de tendências. Projeto Sistema Brasileiro de Televisão Digital – Modelo de Implantação. PD.30.12.36A.0002A/RT-03-AA. Campinas: CPqD-FUNTTEL, 2004 (relatório técnico).

ASSOCIAÇÃO BRASILEIRA DE TV POR ASSINATURA (ABTA). Mídia Fatos: TV por Assinatura, São Paulo, v. 9, 2008.

GILBERT, C. The Disruption opportunity. MIT Sloan Management Review, v. 44, n. 4, Summer 2003. Disponível em: <http://sloanreview.mit.edu/themagazine/files/saleable-pdfs/4443.pdf>. Acesso em: 23 fev. 2010.

ASSOCIATION FOR THE DEVELOPMENT OF ENHANCED TV SERVICES AND INTERACTIVITY (AFDESI). Le marché et les acteurs de la TVI en France, Sèvres, 2004. ÁVILA, I. M. et al. Redes sociais e disseminação de inovações tecnológicas: uma modelagem por agentes aplicada ao caso da TV digital brasileira. Cadernos CPqD Tecnologia, Campinas, v. 2, n. 2, p. 27-38, jul./dez. 2006. BONADIA, G. C. et al. A system dynamics analysis of ICTs' diffusion in Brazilian market. In: INTERNATIONAL CONGRESS OF BUSINESS DYNAMICS, 1., 2006, Brasília. Proceedings... SBDS, UPIS. BRITISH BROADCASTING CORPORATION (BBC). Annual Report and Accounts 2007/08 – Part Two: BBC Executive’s review and assessment for 2008/2009. Disponível em: <http://www.bbc.co.uk/annualreport/download_tru st.shtml>. Acesso em: 22 fev. 2010. BRITISH MARKET RESEARCH BUREAU LIMITED (BMRB). Media Update, n. 27, June 2008. COMITÊ GESTOR DA INTERNET NO BRASIL (CGI). Pesquisa sobre o Uso das Tecnologias da Informação e Comunicação no Brasil 2007, 2. ed. São Paulo: Núcleo de Informação e Coordenação do Ponto BR, 2008. Disponível em: <http://www.cetic.br/tic/2007/indicadorescgibr-2007.pdf>. Acesso em: 22 abr. 2008.

80

HOLANDA, G.; DALL'ANTONIA, J. C. An Approach for e-inclusion: Bringing illiterates and disabled people into play. Journal of Technology Management & Innovation, v. 1, n. 3, 2006. Disponível em: <http://www.jotmi.org/index.php/GT/issue/view/jot mi3>. Acesso em: 22 fev. 2010. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Pesquisa Nacional por Amostra de Domicílios 2007. Disponível em: <http://www.ibge.gov.br/home/estatistica/populac ao/trabalhoerendimento/pnad2008/default.shtm>. Acesso em: 20 nov. 2008. MARTINS, S.; FILGUEIRAS, L. Métodos de avaliação de apreensibilidade das informações textuais: uma aplicação em sítios de governo eletrônico. In: CONGRESSO LATINO-AMERICANO DE INTERAÇÃO HUMANO-COMPUTADOR, 2007, Rio de Janeiro. Anais... MENEZES, E. et al. Análise da demanda para a TV digital interativa. Projeto Serviços Multiplataforma de TV Interativa. PD.30.12.34A.0008A/RT-01-AB. Campinas: CPqD-FUNTTEL, 2008 (relatório técnico). MERCIER, P.; BARWISE, P. Digital Television in the UK: Consumer Responses to Interactivity. London Business School, 2004.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009


Análise do potencial de TV interativa no Brasil

MEYER, L. et al. ITV Services: Prospects for growth and profitability. Montpellier: IDATE, 2002. OFFICE FOR NATIONAL STATISTICS (ONS). Use of the Internet. United Kingdom, 2008. Disponível em: <http://www.statistics.gov.uk/cci/nugget.asp? id=1711>. Acesso em: 24 nov. 2008. OFFICE OF COMMUNICATIONS (OFCOM). Pay TV market investigation consultation, 2007. Disponível em: <http://www.ofcom.org.uk/consult/ condocs/market_invest_paytv/pay_tv.pdf>. Acesso em: 22 fev. 2010. ORGANISATION FOR ECONOMIC COOPERATION AND DEVELOPMENT (OECD). Communications Outlook 2007. OECD, 2007a. Disponível em: <http://www.oecd.org/document/17/0,3343,en_26 49_33703_38876369_1_1_1_1,00.html>. Acesso em: 22 fev. 2010. ORGANISATION FOR ECONOMIC COOPERATION AND DEVELOPMENT (OECD). IPTV: Market developments and regulatory treatment. OECD Working Party on Communication Infrastructures and Services

Policy. OECD, 2007b. Disponível em: <http://www.oecd.org/dataoecd/11/23/39869088. pdf>. Acesso em: 10 jul. 2008. PATACA, D. M. et al. Elenco de serviços e aplicações. TV Digital Interativa. Projeto TV Digital Interativa. PD.30.11.67A.0011A/RT-04AB. Campinas: CPqD-FUNTTEL, 2002 (relatório técnico). RIOS, J. et al. Panorama Mundial de modelos de exploração e implantação. Projeto Sistema Brasileiro de Televisão Digital – Modelo de Implantação. PD.30.12.36A.0002A/RT-04-AC. Campinas: CPqD-FUNTTEL, 2005 (relatório técnico). SARDINHA, T. B.; LIMA-LOPES, R. E. Análise lingüística dos sítios de Internet. Campinas: CPqD-FUNTTEL, 2008 (relatório de circulação interna). SCREEN DIGEST et al. Interactive Content and Convergence: Implications for the information society – Final report to the European Commission, DG INFSO. Brussels: European Commission, Oct. 2006.

Abstract The aim of this paper is to analyze the potential of interactive TV services in Brazil. The basic premise is that such services are innovations with great potential of diffusion among the Brazilian population which has the habit of using television, particularly among the ones with disadvantage in the access to a computer and Internet. In the first part of the study, the concept of interactive TV service is presented as well as the description of the underlying network platforms, the classifications of services and the description of the value chain of generic interactive TV services. In the second part, the factors of success or failure of the experiences of interactivity on TV in some countries are identified. Such an analysis is followed by the survey of the presence and use of information and communication technologies in Brazil and of those services which present similarities with the interactive TV services such as electronic commerce and government. Such a set of information is obtained to achieve the following results: (i) to estimate the potential market for interactive TV services, which represents the limits within which the demand is expected, (ii) the election of the target audience of such services, (iii) preliminary suggestions of services to be developed. These results represent subsidies to the design of interactive TV services and the definition of feasible business models which assure the provision of such services in the Brazilian market. Key words: Digital TV. Interactivity. Value chain. Digital inclusion.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 65-82, jul./dez. 2009

81


Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante Gustavo Bittencourt Figueiredo*, Nelson Luís Saldanha da Fonseca*, César Augusto Viana Melo *, Marcos Rogério Salvador** Este artigo investiga o impacto das políticas de montagem de rajadas em redes de comutação óptica de pacotes nas características do tráfego que entra na rede. Mostra-se que as propriedades estatísticas do tráfego são influenciadas pela escala de tempo de montagem das rajadas bem como pela escala de corte do tráfego que entra na rede. Palavras-chave: Montagem de rajada. Tráfego Internet. Comutação de pacotes. Multifractalidade. Introdução Redes de comutação óptica de pacotes, ou simplesmente redes OPS (do inglês Optical Packet Switching), exploram os benefícios da transparência da comutação óptica com a flexibilidade e a robustez da técnica de comutação de pacotes. No entanto, a predominância de pacotes pequenos na Internet e a tendência de aumento crescente das taxas de transmissão, bem como do tempo de existência dos fluxos, levantam suspeitas sobre o futuro desta tecnologia. Isso porque a comutação óptica e individual de pacotes a altas taxas requer chaves ópticas de pacotes e processamento de cabeçalhos ultrarrápidos e de sincronização com precisão de nanossegundos. Atualmente, é difícil atender a tais requisitos com uma relação custo-benefício aceitável. Salvador et al. (2006) apresentam uma arquitetura inovadora de anel de rede com comutação óptica de pacotes, que adota a montagem de rajadas para resolver esse problema. Essa arquitetura emprega o acesso estatístico organizado em momentos discretos, tradicionalmente conhecido por slotted ring. No nó de entrada da rede, pacotes que rumam ao mesmo nó de saída são armazenados em uma mesma fila, onde aguardam até que uma rajada possa ser montada. Para cada rajada montada, é gerado um pacote de controle ou cabeçalho, com identificação da origem e do destino da rajada, que será transmitido à frente da rajada, em um canal separado, processado em cada nó subsequente. A transmissão de uma rajada ocorre mediante a chegada de um slot vazio, o que significa dizer que o meio estava ocioso em um dos momentos discretos de acesso. Os nós

subsequentes comutam a rajada opticamente com base no cabeçalho da rajada. O nó de saída da rede remove e desmonta a rajada do meio físico e, finalmente, comuta os pacotes individualmente para fora da rede. Resultados de desempenho obtidos em experimentos de simulação computacional (SALVADOR et al., 2006) comprovaram que a comutação de rajadas na arquitetura não só reduz as demandas sobre as chaves ópticas e os processadores de cabeçalhos de pacotes, como também contribui para o uso mais eficiente dos slots, o que, nos momentos mais críticos (condições de distribuição não uniforme de tráfego a altas cargas), resulta em melhor vazão. Este artigo analisa o impacto da montagem de rajadas em maior profundidade. Em particular, o artigo analisa a suspeita de que o processo de montagem de rajadas possa suavizar a explosividade (alta variabilidade) do tráfego na Internet. A comprovação dessa suspeita poderia levar ao melhor dimensionamento dos equipamentos e sistemas de rede, resultando em benefícios relevantes. Por exemplo, o melhor dimensionamento do sistema levaria a uma redução dos altos custos de aquisição e do consumo de recursos naturais, por usar menos silício. Também reduziria os custos recorrentes e crescentes de operação e as emissões de gás carbônico, por conta do menor consumo de energia para alimentar e resfriar os sistemas. Um dos aspectos fundamentais para o dimensionamento é a caracterização das estatísticas do tráfego a ser transportado e, em especial, a caracterização da explosividade do tráfego em diferentes escalas de tempo. A explosividade do tráfego pode ser considerada

*Instituto de Computação da Universidade Estadual de Campinas (Unicamp). **Autor a quem a correspondência deve ser dirigida: marcosrs@cpqd.com.br. Este artigo contém pequenas alterações sobre o artigo “Transformação de Tráfego em Redes Ópticas de Rajadas”, dos mesmos autores, publicado nos Anais do 25º Simpósio Brasileiro de Redes de Computadores (SBRC), realizado em Belém do Pará, em 2007. Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 83-92, jul./dez. 2009


Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante 1

um indicador da quantidade de recursos necessários para dar suporte ao tráfego. Quando o tráfego é encaminhado através de um nó da rede, suas propriedades estatísticas são modificadas, o que pode impactar no escalonamento de rajadas durante períodos de contenção. Adicionalmente, dependências de longa duração (do inglês Long Range Dependence – LRD) influenciam na duração dos períodos de contenção. Fluxos IP podem ser modelados tanto por processos monofractais quanto por processos multifractais, dependendo de cenários específicos de rede. Em outras palavras, alguns fluxos IP podem ser caracterizados por processos monofractais, enquanto outros necessitam de uma modelagem mais complexa, proporcionada pelos processos multifractais. Entretanto, não existe, até então, conhecimento sobre qual processo deve ser usado em função do cenário de rede apresentado. Consequentemente, a natureza do tráfego só pode ser determinada através de medição e caracterização de um fluxo específico. Trabalhos anteriores (GE; CALLEGATI; TAMIL, 2000; HU; DOLZER; GAUGER, 2003; IZAL; ARACIL, 2002) investigaram a relação entre o tráfego monofractal e os mecanismos de montagem de rajadas. Este artigo investiga as transformações em fluxos multifractais causadas pelas políticas de montagem de rajadas usadas pelos nós de borda das redes OPS. Políticas baseadas em janelas de tempo e em volume de tráfego são utilizadas neste estudo. Simulações com traços de tráfego real foram realizadas e os resultados indicam que as características de um fluxo depois da montagem das rajadas dependem da escala de corte1 (do inglês cutoff scale) do tráfego original, bem como da escala de tempo usada na montagem das rajadas. Os resultados apresentados no presente artigo podem ser usados para o ajuste dinâmico das políticas de montagem de rajadas mediante o tráfego de ingresso oferecido. Este artigo se difere dos artigos anteriores dos mesmos autores (FIGUEIREDO et al., 2005, 2006) por incluir resultados relativos à política de agregação por volume e por avaliar o impacto das transformações de escala nos nós do núcleo da rede, bem como por revisar resultados anteriores mediante sugestões recebidas. O restante deste artigo está organizado da seguinte forma: a Seção 1 apresenta o processo de montagem de rajadas em redes OPS. A Seção 2 descreve a natureza multifractal do tráfego IP. A Seção 3 apresenta as mudanças de escala ocorridas no tráfego de ingresso em um domínio OPS. A Seção 4 apresenta os resultados.

1

Montagem de rajadas

Nos nós de borda em redes OPS, existe um conjunto de filas para armazenar os pacotes a serem montados em rajadas. O número de filas depende dos critérios adotados para a montagem de rajadas. O montador de rajadas, localizado no nó de borda, monitora cada fila. Quando o critério de montagem adotado é satisfeito, o montador dispõe e transmite a rajada correspondente. Cada rajada é associada a um pacote de controle, que especifica o nó de origem e o nó de destino. Uma vez que a rajada é selecionada para transmissão, o pacote de controle é transmitido e, após certo intervalo de tempo, a rajada também é transmitida. A Figura 1 ilustra a arquitetura de um nó de borda OPS com duas filas de montagem. Domínio OPS/OBS

Montador de rajadas

Canal de dados

Nó de núcleo

Canal de controle Nó de entrada Pacote IP Cabeçalho da rajada Payload da rajada

Figura 1 Exemplo de arquitetura de nó de borda de redes OPS

Diferentes critérios podem ser utilizados para a montagem de rajadas. No entanto, a maioria é baseada em janelas de tempo (GE; CALLEGATI; TAMIL, 2000) ou no volume de tráfego (YU; CHEN; QIAO, 2002). Nos algoritmos baseados em janelas de tempo, quando o primeiro pacote chega à fila de montagem, um temporizador é ligado. Se o temporizador alcança um limiar predefinido (δ), uma rajada é criada, contendo todos os pacotes residentes na fila de montagem. Os algoritmos baseados em volume de tráfego controlam o volume de dados através de um contador de bytes (ou pacotes) em cada fila de entrada. O contador é atualizado à medida que novos pacotes vão sendo adicionados à fila, e quando alcança o valor limiar predeterminado, a rajada é montada e transmitida. Em redes operacionais, os limiares adotados dependem dos requisitos temporais das classes de serviço. Quanto mais estritos os requisitos, menores são os limiares utilizados pelos montadores. Valores típicos podem variar de 1 ms (GOWDA et al., 2003) a 600 ms (LONG; TUCKER; WANG, 2003). A Tabela 1 sugere valores tanto para temporizadores quanto para os contadores de bytes. Por exemplo, se a rajada contiver pacotes pertencentes à classe de serviço Expedited Forwarding (EF), o volume de dados necessário para sua montagem será de

1 Escala de corte ou de tempo limite do tráfego é a escala de tempo em que o tráfego deixa de apresentar características multifractais e passa a apresentar características monofractais.

84

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 83-92, jul./dez. 2009


Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante 2

5 kB e o tempo necessário para a montagem (δ) será de 4,8 ms. Se os pacotes pertencerem à classe Assured Forwarding (AF), o volume de dados poderá variar entre 30 e 50 kB e o tempo de montagem será de 55 ms. Finalmente, se os pacotes pertencerem à classe Best Effort (BE), o volume de dados será de 125 kB e o tempo de montagem será de 600 ms. Tabela 1 Valores sugeridos para limiares de montagem de rajadas CoS

Volume mínimo

Volume máximo

δ

EF

5 kB

5 kB

4,8 ms

AF

30 kB

50 kB

55 ms

BE

125 kB

125 kB

600 ms

Fonte: Long; Tucker; Wang, (2003).

2

Em Abry et al. (2002), descreve-se um método chamado diagrama multiescala (do inglês Multiscale Diagram – MD), com o objetivo de determinar a ocorrência de multifractalidade em um processo. Este método consiste em verificar o comportamento da função ζ(q) em relação aos momentos estatísticos q. Caso a função ζ(q) apresente um comportamento não linear, verifica-se a ocorrência de multifractalidade no processo avaliado. A estimativa dos valores da função ζ(q) requer a determinação do expoente de cascateamento αq. A estimativa de αq é realizada através do método diagrama logescala (do inglês Logscale Diagram – LD) do q-ésimo momento. Nesse método, αq é definido pela inclinação de uma reta que se aproxima da curva gerada pela relação entre µj e 2j em uma escala logarítmica. O valor de µj é dado por:

Natureza multifractal do tráfego IP

Nesta seção, são apresentados alguns conceitos sobre cascateamento2 (do inglês traffic scaling), fenômeno que caracteriza a ausência de uma escala de tempo específica, na qual a explosividade do tráfego pode ser caracterizada. Um processo autossimilar (monofractal) X(t) de ordem q apresenta momentos estatísticos definidos por Abry et al. (2002): E|X(t)|q = E|X(1)| H q .|t|q , onde H é o parâmetro de Hurst, responsável por estimar o nível de autossimilaridade da série de tempo que exibe LRD. Essa definição dos momentos estatísticos de um processo monofractal X(t) impõe a restrição de uniformidade nas variações (explosividade) de X(t) em diferentes instantes de tempo, ou seja, assume-se que o processo possui explosividade uniforme, medida por H, em diferentes instantes de tempo. Um processo multifractal não apresenta a restrição de uniformidade nas suas variações e tem seus momentos estatísticos definidos por Abry et al. (2002): E|X(t)|q = E|X(1)|q.|t|ζ(q), onde ζ(q) é a função de cascateamento. Esta função apresenta um comportamento não linear para os diferentes momentos q, o que caracteriza a ocorrência de multifractalidade. No domínio wavelet, os momentos são expressos da seguinte forma: E|dX(j, k)|q ≈ 2jζ(q) j → -∞, onde dX(j, k) é a série de incrementos (detalhes) obtidos pela decomposição do processo X(t) usando a transformada wavelet discreta. A função de cascateamento ζ(q) é definida por ζ(q) = αq – q/2, onde αq é o expoente de cascateamento (do inglês scaling exponent). Este expoente tem o seu valor relacionado à explosividade do tráfego, que, no caso de processos multifractais, varia para os diferentes momentos estatísticos q.

onde, nj é o número de detalhes dX(j, .), na escala de tempo j, gerados pela decomposição de X(t), usando-se uma transformada wavelet discreta. Além do diagrama multiescala, o diagrama multiescala linear (do inglês Linear Multiscale Diagram – LMD) também pode ser usado para detectar multifractalidade. Ele traça hq = ζq/q versus q. Neste diagrama, a monofractalidade é revelada por uma curva horizontal, ao passo que a multifractalidade pode ser detectada por uma curva não horizontal. 3

Análise de mudança de escala

Para avaliar as mudanças das propriedades estatísticas do tráfego, experimentos de simulação foram realizados usando o simulador NS-2. Os experimentos foram conduzidos de forma a avaliar as mudanças das propriedades estatísticas do tráfego decorrente do processo de montagem de rajadas. Nos experimentos, um nó OPS de borda é alimentado com tráfego IP multifractal. O tráfego de saída do montador é então coletado e analisado. Os traços de tráfego real, usados nos experimentos de simulação relatados neste artigo, tiveram a ocorrência de multifractalidade verificada através dos métodos diagrama multiescala e diagrama multiescala linear. Os traços usados nessa avaliação são de domínio público e contêm o registro do tráfego de redes operacionais no período de 2003 a 2005. Esses traços registraram o tráfego em pontos de agregação das redes vBNS e Internet2 ABILENE e foram obtidos no sítio do National Laboratory for Applied Network Research (www.nlanr.net).

2 O termo traffic scaling foi traduzido como cascateamento pelos autores por ser o mais usado na literatura nacional sobre o assunto.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 83-92, jul./dez. 2009

85


Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante

A Tabela 2 mostra as características desses traços, sendo que o registro do tráfego tem uma precisão de microssegundos. Tabela 2 Características dos traços usados no artigo Bytes

Ponto de Agregação

Traço

Data

MEM-1053844177

05/24/2003 23:54

1220904

U. of Memphis

MEM-1054459191

06/01/2003 2:54

1266708

U. of Memphis

MEM-1111247410

03/19/2005 07:56

1677721,6 U. of Memphis

MEM-1111679715

03/22/2005 14:10

2306867,2 U. of Memphis

MEM-1112013766

03/28/2005 04:49

1572864

U. of Memphis

ANL-1111548257

03/22/2005 20:11

928768

Argone Lab

TXS-1113503155

04/14/2005 2:54

360448

U. of Texas

a) Diagrama multiescala

Nac.

O expoente de cascateamento em pequenas escalas de tempo, denominado “expoente de Holder”, para os traços foram calculados de acordo com o procedimento apresentado em (CAVANAUGH; WANG; DAVIS, 2003). A Tabela 3 mostra a média e a variância do expoente de Holder, bem como o intervalo de confiança usado para o cálculo da média. Esses valores serão usados como referência na comparação com os valores do expoente de Holder encontrados no tráfego de saída do montador. Tabela 3 Expoente de Holder do tráfego multifractal Traço

Média

Var

I.C.

MEM-1111247410

0,695

0,0085

0,01

MEM-1111679715

0,758

0,008

0,031

MEM-1112013766

0,72

0,009

0,005

ANL-1111548257

0,726

0,03

0,007

TXS-1113503155

0,89

0,0408

0,03

A Tabela 4 mostra a escala de tempo usada para agregar os traços (γ), a escala de corte (∆) e o valor máximo do temporizador usado na montagem das rajadas (δ). A escala de tempo usada para agregar os traços de tráfego foi de um décimo do valor do temporizador.

b) Diagrama multiescala linear

Figura 2 Diagramas multiescala e multiescala linear do traço MEM-1111679715

a) Diagrama multiescala

Tabela 4 Escalas de agregação e de corte dos traços usados nas simulações Traço

γ

δ>∆

δ<∆

MEM-1111247410

0,1 ms

3,3 ms

4 ms

1 ms

MEM-1111679715

0,1 ms

5,4 ms

6 ms

3 ms

MEM-1112013766

0,1 ms

3,0 ms

4 ms

1 ms

ANL-1111548257

0,1 ms

2,7 ms

3 ms

1 ms

TXS-1113503155

0,02 ms

1,3 ms

2 ms

1 ms

As Figuras 2 e 3 mostram o diagrama multiescala e o diagrama multiescala linear do tráfego que alimenta o nó de borda da rede OPS. É importante observar que o fenômeno da multifractalidade pode ser observado em ambos os diagramas.

86

b) Diagrama multiescala linear

Figura 3 Diagramas multiescala e multiescala linear do traço TXS-1113503155

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 83-92, jul./dez. 2009


Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante

A próxima seção apresenta os resultados obtidos, avaliando a influência das políticas de montagem baseadas em janelas de tempo e em volume de tráfego nas propriedades do tráfego resultante do processo de montagem de rajadas. Em decorrência das limitações de espaço, os resultados são apresentados apenas para os traços MEM-1111679715 e TXS-1113503155. 4

Resultados

Nesta seção, analisa-se o impacto dos limiares de tempo e de volume de dados na escala do tráfego de saída. Em cada análise foram considerados dois cenários: um cujo limiar implica em escalas de montagem acima da escala de corte do tráfego de entrada e outro cujo limiar implica em escalas de montagem abaixo da escala de corte do tráfego de entrada.

saída do montador de rajadas. Esse tráfego é resultante das transformações do tráfego de entrada dos traços MEM-1111679715 e TXS - 1113503155, respectivamente. O comportamento linear das curvas no diagrama multiescala indica a monofractalidade do tráfego de saída, uma vez que a função de cascateamento ζ(q) apresenta comportamento linear nos vários momentos estatísticos q. Isso pode ser confirmado pelo diagrama multiescala linear, que apresenta alinhamento horizontal para os dois traços. Assim, o processo de montagem de rajadas em escalas de tempo maiores que a escala de corte de um tráfego multifractal transforma as características do tráfego de entrada de multifractais em monofractais.

4.1 O impacto dos limiares de tempo na escala do tráfego de saída No primeiro cenário, o limite do temporizador (δ) é maior que o valor da escala de corte (∆) do tráfego de entrada. No segundo cenário, δ é menor que ∆. Com base nesses cenários, pretende-se verificar o relacionamento entre o valor do limiar usado e as propriedades estatísticas do tráfego resultante.

a) Diagrama multiescala

a) Diagrama multiescala

b) Diagrama multiescala linear

Figura 5 Análise do traço TXS-1113503155 para δ > ∆

b) Cenário 2: δ < ∆

b) Diagrama multiescala linear

Figura 4 Análise do traço MEM-1111679715 para δ > ∆

a) Cenário 1: δ > ∆ As Figuras 4 e 5 mostram os diagramas multiescala e multiescala linear do tráfego de

As Figuras 6 e 7 mostram os resultados para δ < ∆. As curvas do diagrama multiescala têm um comportamento não linear que indica a multifractalidade. O padrão multiescala pode ser percebido pela ausência de alinhamento horizontal nas curvas do diagrama multiescala linear. Assim, o processo de montagem de rajadas em escalas de tempo menores que a escala de corte do tráfego de entrada mantém as propriedades multifractais do tráfego.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 83-92, jul./dez. 2009

87


Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante

4.2 O impacto do limiar do volume de tráfego na escala do tráfego de saída

a) Diagrama multiescala

b) Diagrama multiescala linear

Figura 6 Análise do traço MEM-1111679715 para δ < ∆

a) Diagrama multiescala

Como ilustrado na seção anterior, a natureza das propriedades estatísticas do tráfego resultante do processo de montagem de rajadas depende do relacionamento entre o valor limite do temporizador (δ), usado na política de montagem, e o valor da escala de corte (∆) do tráfego de entrada. Para investigar o relacionamento entre a escala de tempo do processo de montagem baseado em volume de tráfego e a escala de corte do tráfego de entrada, o volume de tráfego de entrada (ß) foi dividido pela taxa média de chegadas (λ). Essa escala de tempo é então comparada à escala de corte do tráfego de entrada. Os experimentos foram conduzidos usando-se limiares para o contador de bytes que implicassem em escalas de montagem abaixo da escala de corte do tráfego de entrada ou em escalas de montagem acima da escala de corte do tráfego de entrada. Os valores escolhidos foram, respectivamente, 1 e 125 kB. Esses valores foram obtidos em trabalhos publicados anteriormente (GOWDA et al., 2003; LONG; TUCKER; WANG, 2003). Os traços MEM-1111679715 e TXS-1113503155 têm taxa média de chegadas (λ) de 4,4 e 6,8 Mbit/s, respectivamente. O contador de bytes de 1 kB produz uma escala de tempo de montagem (δ) de 1,8 e 1,2 ms para os traços MEM-1111679715 e TXS-1113503155. Esses valores são menores que a escala de corte limite (∆) do tráfego de entrada. Por outro lado, o contador de bytes de 125 kB corresponde à escala do tempo de 0,22 e 0,15 segundos para os traços MEM-1111679715 e TXS-1113503155. Essas escalas são maiores que a escala de corte do tráfego de entrada. a) Cenário 1: ß/λ > ∆

b) Diagrama multiescala linear

Figura 7 Análise do traço TXS-1113503155 para δ < ∆

88

As Figuras 8 e 9 mostram os resultados da análise do tráfego resultante do processo de montagem de rajadas com ß/λ > ∆. Os diagramas multiescala mostram comportamentos similares. A função de cascateamento ζ(q) apresenta comportamento linear. O comportamento monofractal é confirmado pelo alinhamento horizontal apresentado no diagrama LMD. Tal comportamento da função de cascateamento caracteriza a ocorrência de monofractalidade.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 83-92, jul./dez. 2009


Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante

b) Cenário 2: ß/λ < ∆ As Figuras 10 e 11 mostram a análise do tráfego resultante do processo de montagem de rajadas com ß/λ < ∆. No diagrama multiescala, as curvas apresentam comportamento não linear, o que indica a presença de multifractalidade no tráfego. Além disso, o diagrama multiescala linear mostra alinhamento não horizontal.

a) Diagrama multiescala

a) Diagrama multiescala

b) Diagrama multiescala linear

Figura 8 Análise do traço MEM-1111679715 para ß/λ > ∆

b) Diagrama multiescala linear

Figura 10 Análise do traço MEM-1111679715 para ß/λ < ∆

a) Diagrama multiescala

a) Diagrama multiescala

b) Diagrama multiescala linear

Figura 9 Análise do traço TXS-1113503155 para ß/λ > ∆

Assim, o processo de montagem de rajadas, usando limiares maiores que o produto entre a taxa média de chegadas e o valor da sua escala de corte, transforma um tráfego com características multifractais em um tráfego com características monofractais.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 83-92, jul./dez. 2009

b) Diagrama multiescala linear

Figura 11 Análise do traço TXS-1113503155 para ß/λ < ∆

89


Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante

4.3 O efeito suavizador das políticas de montagem de rajadas Para avaliar a suavização do tráfego causada por diferentes processos de montagem de rajadas, as propriedades estatísticas do tráfego produzido por essas políticas foram comparadas. A Tabela 5 apresenta a média e a variância dos valores assumidos pelo expoente de Holder do tráfego multifractal resultante do processo de montagem, bem como o intervalo de confiança do valor médio. Os subíndices t e v denotam, respectivamente, as políticas baseadas em janelas de tempo e em volume de tráfego. Tabela 5 Expoente de Holder do tráfego multifractal de saída Traço

Médiat

Vart

I.C.t

Médi Var v av

I.C.v

MEM-1111247410

0,601

0,006 0,009

0,653

0,002 0,001

MEM-1111679715

0,598

0,008 0,011

0,632

0,004 0,002

MEM-1112013766

0,601

0,009 0,003

0,622

0,004 0,002

ANL-1111548257

0,546

0,008 0,002

0,603

0,016 0,020

TXS-1113503155

0,655

0,010 0,013

0,732

0,008 0,015

A Figura 12 apresenta os resultados das Tabelas 3 e 5 para comparação visual.

Figura 12 Média do expoente de Holder dos tráfegos de entrada e saída do montador de rajadas

Comparando-se a média e a variância do tráfego na entrada e na saída, fica claro que o processo de montagem suaviza o tráfego na entrada. Isso é evidenciado pela redução da média e da variância do expoente de Holder. A redução da média do expoente de Holder indica que a explosividade do tráfego em escalas de tempo menores foi reduzida. Além disso, a redução da variância indica que a variabilidade da explosividade do tráfego nessas escalas de tempo também foi reduzida. Comparando as duas políticas, pode-se notar que a média do expoente de Holder, produzida pela política de montagem de rajadas baseada em janelas de tempo, é menor que o valor produzido pela política baseada em volume de tráfego, o que indica uma suavização do tráfego em pequenas escalas de tempo. A Tabela 6 apresenta o parâmetro de Hurst do tráfego resultante do processo de montagem,

90

usando as políticas baseadas em janelas de tempo (Ht) e em volume de tráfego (Hv). O parâmetro de Hurst foi calculado usando o estimador A-V, disponível em Veitch (2007). Tabela 6 Parâmetro de Hurst do tráfego monofractal de saída Traço

Ht

Hv

MEM-1111247410

0,669

0,682

MEM-1111679715

0,595

0,687

MEM-1112013766

0,629

0,675

ANL-1111548257

0,598

0,639

TXS-1113503155

0,672

0,797

Pode-se notar que as políticas baseadas em volume de tráfego produzem tráfego monofractal com parâmetro de Hurst mais alto que o parâmetro de Hurst produzido pela política baseada em janelas de tempo. Uma explicação para esse fenômeno é que a política baseada em volume de tráfego produz rajadas maiores que a política baseada em janelas de tempo, como será apresentado na Tabela 7. Na política baseada em janelas de tempo, alguns pacotes pertencentes ao mesmo fluxo são transmitidos em rajadas diferentes, ao passo que, na política baseada em volume de tráfego, esses mesmos pacotes são transmitidos em uma única rajada. Consequentemente, períodos maiores de atividade e de silêncio são produzidos nas políticas baseadas em volume de tráfego, gerando maiores dependências de longa duração. 4.4 O impacto das mudanças do tráfego no dimensionamento da rede Para avaliar o impacto causado pelas transformações das propriedades estatísticas do tráfego no dimensionamento da rede OPS, o cenário descrito na Figura 13 foi utilizado nas simulações. A figura apresenta uma rede composta por três nós de borda (dois de ingresso e um de egresso) e um nó de núcleo. Os nós de borda de ingresso são alimentados com tráfego multifractal, gerado a partir dos traços de tráfego citados na Tabela 2. Cada enlace possui uma única fibra com 16 canais de dados e dois canais de controle.

Figura 13 Cenário utilizado na avaliação do impacto do tráfego no dimensionamento da rede

A ideia é avaliar se as transformações ocorridas

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 83-92, jul./dez. 2009


Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante

no tráfego têm impacto significativo no dimensionamento da rede. Para tal, foram medidas: a probabilidade de bloqueio (PB), a quantidade de canais adicionais (em relação ao dimensionamento usado para medir a probabilidade de bloqueio) para que a rede experimente probabilidade de bloqueio igual a zero (C) e o número médio de pacotes em cada rajada (NP). As Tabelas 7 e 8 apresentam os resultados da avaliação. Pode-se perceber que, tanto na política de montagem baseada em volume de tráfego quanto na política baseada em janelas de tempo, a rede OPS experimenta maior probabilidade de bloqueio quando o tráfego resultante do processo de montagem de rajadas possui características multifractais. Isso acontece como resultado da alta frequência de rajadas e dos pacotes de controle gerados. Tabela 7 Probabilidade de bloqueio e demanda de canais adicionais – Política de volume de tráfego Tráfego

Multifractal

Monofractal

Traço

PB

C

NP

PB

C

NP

ANL57

4%

1

3,1

0%

0

255

MEM10

2%

1

4,7

0%

0

351,8

MEM15

1%

1

5,6

0%

0

289,1

MEM66

3%

1

2,8

0%

0

711,4

TXS55

0%

0

7,4

0%

0

451,2

Média

2%

1

4,7

0%

0

411,7

Tabela 8 Probabilidade de bloqueio e demanda de canais adicionais – Política de janela de tempo Tráfego

Multifractal

Monofractal

Traço

PB

C

NP

PB

C

NP

ANL57

2%

1

3,0

0%

0

258

MEM10

1%

1

2,4

0%

0

351,5

MEM15

2%

1

1,8

0%

0

267,2

MEM66

1,3%

1

2,7

0%

0

451,2

TXS55

0,1%

1

1,4

0%

0

306,5

Média

1,3%

1

2,0

0%

0

326,9

Como é possível verificar nas Tabelas 7 e 8, a quantidade de pacotes por rajadas (NP) é de 4,7 – quando a política de montagem baseada em volume de tráfego é utilizada, e de 2,0 – quando a política baseada em janelas de tempo é utilizada. Isso gera um número elevado de pacotes de controle na rede (no caso da política baseada em janelas de tempo, a razão é de um pacote de controle para dois pacotes IP), que, consequentemente, requer uma quantidade maior de canais para realizar o escalonamento de todas as rajadas e pacotes de controle. Obviamente, a ausência temporária desses recursos faz com que a probabilidade de bloqueio seja maior. Comparando as políticas de montagem, percebe- se que a política baseada em volume

de tráfego produz probabilidades de bloqueios mais altas que a política baseada em janelas de tempo. Isso acontece porque, como explicado na Seção 4, a política baseada em volume de tráfego produz tráfego com maior explosividade e maior demanda de recursos que a política baseada em janelas de tempo. Conclusão Investigou-se o efeito de políticas de montagem de rajadas nas características de escala de tempo do tráfego IP que adentra um domínio OPS. Resultados obtidos via simulações revelaram que os mecanismos de montagem de rajadas causam o efeito de suavização da explosividade do tráfego de entrada da rede. A média e a variância do expoente de Holder do tráfego multifractal resultante do processo de montagem de rajadas são menores do que aquelas encontradas no tráfego que adentra o domínio OPS. Além disso, resultados mostraram também que a escolha dos valores usados no temporizador (em caso de políticas baseadas em janelas de tempo) ou no contador de bytes (no caso de políticas baseadas em volume de tráfego) tem impacto significativo nas propriedades estatísticas do tráfego. Mostrou-se que, se o limite de tempo de montagem de rajadas (no caso de política de volume de tráfego resultante de um limiar equivalente em bytes) for maior que o valor da escala de corte do tráfego original, a montagem de rajadas produz tráfego com características monofractais, enquanto o uso de valores menores que o valor da referida escala produz tráfego com características multifractais. As políticas baseadas em volume de tráfego produzem tráfego monofractais com parâmetro de Hurst mais alto que as políticas baseadas em janelas de tempo. Além disso, políticas baseadas em volume de tráfego produzem tráfego multifractal cujo expoente de Holder possui valores mais altos que os produzidos por políticas baseadas em janelas de tempo. Indica-se, portanto, o uso de políticas de montagem de rajadas baseadas em janelas de tempo. Além disso, para diminuir a demanda de recursos da rede, recomenda-se que os valores dos limiares usados nas políticas de montagem de rajadas sejam escolhidos de forma a produzir tráfego com características monofractais. Recomenda-se, portanto, que limiares para políticas de montagem sejam adotados em função da escala de corte do tráfego que adentra um domínio OPS. Referências ABRY, P. et al. The multiscale nature of network traffic discovery. IEEE Signal Processing Magazine, v. 19, n. 3, p. 28-46, 2002.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 83-92, jul./dez. 2009

91


Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante

CAVANAUGH, J. E.; WANG, Y.; DAVIS, J. W. Locally self-similar processes and their wavelet analysis. Handbook of Statistics – Stochastic Processes: Modeling and Simulation, Amsterdan, v. 21, p. 93-135, 2003. FIGUEIREDO, G. B. et al. O impacto do algoritmo de montagem de rajadas baseado em janelas de tempo no tráfego multifractal. In: SIMPÓSIO BRASILEIRO DE TELECOMUNICAÇÕES – SBrT, 12., 2005, Recife. Anais... Recife: SBrT. p. 47-52. FIGUEIREDO, G. B. et al. On the transformation of multifractal traffic at ingress optical burst switches. In: IEEE INTERNATIONAL CONFERENCE ON COMMUNICATIONS (ICC), 9., 2006, Istambul. Proceedings... Istambul: IEEE, 2006. p. 1040-1045. GE, A.; CALLEGATI, F.; TAMIL, L. S. On optical burst switching and self-similar traffic. IEEE Communications Letters, v. 4, n. 3, p. 98-100, 2000. GOWDA, S. et al. Performance Evaluation of TCP over Optical Burst-switched (OBS) WDM Networks. In: INTERNATIONAL CONFERENCE ON COMMUNICATIONS (ICC), 2., 2003. Proceedings... IEEE, 2003. p. 1433-1437. HU, G.; DOLZER, K.; GAUGER, C. Does burst assembly really reduce the self-similarity?

In: OPTICAL FIBERS COMMUNICATIONS (OFC), 2003. Proceedings... IEEE, 2003. p. 124-126, v. 1. IZAL, M.; ARACIL, J. On the influence of selfsimilarity on optical burst switching traffic. In: GLOBAL TELECOMMUNICATIONS CONFERENCE (GLOBECOM), 3., 2002. Proceedings... IEEE, 2002. p. 2308-2312. LONG, K.; TUCKER, R. S.; WANG, C. A new framework and burst assembly for IP DiffServ over optical burst switching networks. In: GLOBAL TELECOMMUNICATIONS CONFERENCE (GLOBECOM), 6., 2003. Proceedings... IEEE, 2003. p. 3159-3164. SALVADOR, M. R. et al. Arquitetura e protótipo de rede de pacotes em anel com transmissão e comutação no domínio óptico. In: SIMPÓSIO BRASILEIRO DE REDES DE COMPUTADORES (SBRC), 24., 2006, Curitiba. Anais... Curitiba: SBRC. VEITCH, D. 2007. Software disponível em <http:// www.cubinlab.ee.unimelb.edu.au/~darryl/researc h.html#Downloads>. Acesso em: set. 2009. YU, X.; CHEN, Y.; QIAO, C. Study of traffic statistics of assembled burst traffic in optical burst switched networks. In: OPTICAL NETWORKING AND COMMUNICATION CONFERENCE (OPTICOM), 2002, Boston. Proceedings... Boston: OPTICOM, 2002. p. 149-159.

Abstract This paper evaluates the impact of burst assembly policies on the statistical properties of network traffic. It shows that the statistical properties of traffic after assembly depend on the burst assembly time scale as well as on the cutoff scale of the original traffic. Key words: Burst Assembly. Internet Traffic. Packet Switching. Multifractality.

92

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 83-92, jul./dez. 2009


Propriedade intelectual do CPqD Nesta seção, são apresentados os resumos dos pedidos de patentes depositados pelo CPqD no Instituto Nacional da Propriedade Industrial (INPI), no primeiro e segundo semestre de 2009, e de duas patentes concedidas pelo INPI.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009


Propriedade intelectual do CPqD

1. Resumos dos pedidos de patentes concedidos em 2008 pelo INPI (54) APERFEIÇOAMENTO INTRODUZIDO EM AMPLIFICADOR DE TRANSIMPEDÂNCIA. Dados da concessão: (21) PI 9703233-6 (22) 30/05/1997 (45) 20/05/2008 (51) H03F 3/193 (57) "Trata-se de melhoramento aplicado a amplificadores em forma de circuito monolítico, independente de tecnologia utilizada em sua manufatura -- bipolar ou unipolar -compreendendo um estágio em configuração amplificador inversor cascode provido de pelo menos um indutor de ênfase -- "peaking" -- (64, 68, 114, 118, 152, 172, 177) seguido por um ou mais estágios amplificadores, no qual o ganho é ajustado mediante o controle da transcondutância do primeiro transistor (65, 115, 153, 173) do estágio cascode mediante a injeção ou retirada da parte corrente contínua que flui através desse transistor. Esta injeção ou retirada se faz por meio de um resistor ligado entre um ponto de tensão fixa (72, 122, 159,181) e o terminal (65a) do dito primeiro transistor que se encontra ligado à entrada do segundo transistor (66) do estágio cascode". (72) Valentino Corso / Ezio Bastida

94

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009


Propriedade intelectual do CPqD

(54) MÉTODO E ARRANJO PARA MEDIÇÃO DA DISPERSÃO NULA EM FIBRAS ÓPTICAS. Dados da concessão: (21) PI 9800731-9 (22) 19/02/1998 (45) 18/11/2008 (51) G01M 11/00; H04B 10/08 (57) "A invenção utiliza o efeito denominado mistura de quatro ondas - mqo -- e compreende o lançamento, na extremidade próxima do lance (15) de fibra óptica, de dois sinais ópticos (21, 22) de comprimentos de onda diferentes <sym>~ 1~ e <sym>~ 2~, sendo feita a varredura simultânea de ambos os sinais mantendo constante a diferença <30><sym> entre eles, ao mesmo tempo que se vai monitorando continuamente, na mesma extremidade de lançamento, as intensidades retroespalhadas dos sinais injetados bem como dos dois canais (23, 24) gerados pelo efeito mqo. O valor de comprimento de onda de dispersão nula <sym>~ 0~ corresponde ao comprimento de onda do sinal injetado que produz a máxima intensidade do canal gerado. O arranjo de medição, que dispensa a necessidade de acesso à extremidade remota do lance de fibra óptica, emprega um circulador óptico de 3 portas (14) intercalado entre o acoplador (13) que mistura os sinais provenientes de dois lasers ajustáveis (11, 12) e a extremidade do lance de fibra óptica (15), sendo o sinal retroespalhado extraído da porta 3 do dito circulador e encaminhado a um analisador de espectro óptico (16)". (72) Roberto Arradi / João Batista Rosolem / Jorge Salomão Pereira / Julio Cesar Said / Antonio Amauri Juriollo / Miriam Regina Xavier de Barros.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009

95


Propriedade intelectual do CPqD

2. Resumos dos pedidos de patentes depositados no primeiro semestre de 2009 (54) MÉTODO E SISTEMA PARA IDENTIFICAÇÃO DE INFRAESTRUTURAS CRÍTICAS. Dados do pedido: (21) PI 0903455-2 (22) 11/05/2009 (57) "Método e Sistema para identificação de infraestruturas críticas que provêm um conjunto sistemático de regras e procedimentos para a identificação e classificação dos elementos mais importantes de infraestruturas críticas como as de telecomunicações, transportes, energia, água e finanças, dentre outras, com base na avaliação de criticidade dos serviços prestados com relação a aspectos sócio-político-econômicos e critérios tecnológicos, possibilitando uma alocação mais eficiente de recursos humanos, materiais e financeiros para a proteção de tais infraestruturas. A presente invenção provê ainda um sistema de apoio que facilita o emprego do referido método para cadastramento de objetos, definição de parâmetros, configuração de critérios, cálculo de índices e classificação de elementos de infraestruturas críticas, possibilitando a criação de cenários e a realização de simulações para fins de planejamento, implantação e gerência com o propósito de garantir a continuidade dos serviços prestados por essas infraestruturas mesmo em situações de crise". (72) Sérgio Luis Ribeiro / João Henrique de Augustinis Franco / Marcos Baracho Trindade / Elaine Laranja Dias / Emilio Tissato Nakamura / Edson Kowask Bezerra

96

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009


Propriedade intelectual do CPqD

(54) DISPOSITIVO, MÉTODO E SISTEMA PARA DETECÇÃO E LOCALIZAÇÃO DE DESCARGAS ATMOSFÉRICAS. Dados do pedido: (21) PI 0902174-4 (22) 09/06/2009 (57) "Dispositivo, Método e Sistema para detecção e localização de descargas atmosféricas, capaz de realizar a detecção de forma eletro-óptica e passiva, ou seja, sem precisar de alimentação elétrica, isenta de influências da temperatura ambiente e protegida contra eventuais danificações causadas pela dita descarga atmosférica, e capaz de localizar geograficamente a ocorrência dessas descargas atmosféricas através da análise de sinais de luz com comprimentos de onda distintos, gerados por dispositivos eletro-ópticos a partir da influência do campo eletromagnético causado pelas descargas atmosféricas”. (72) João Batista Rosolem / Célio Fonseca Barbosa / Claudio Floridia / Edson Wilson Bezerra

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009

97


Propriedade intelectual do CPqD

(54) PLATAFORMA COMPACTA GERENCIAMENTO INTEGRADO.

DE

TV

DIGITAL

E

RESPECTIVO

SISTEMA

DE

Dados do pedido: (21) PI 0903488-9 (22) 19/06/2009 (57) "A invenção contempla uma Plataforma Compacta de TV Digital única, integrada e flexível de hardware e software em ambiente PC, permitindo sua adaptação através da inserção e retirada de módulos e submódulos conforme a necessidade, composta pelos módulos de Codificação de sinais fonte (101), Codificação de dados (102), Multiplexação (103) e Núcleo de transmissão (200). Compreende também um Sistema de Gerenciamento Integrado (300) que compreende e integra os módulos Gerência do subsistema de codificação de sinais fonte (301), Gerência do subsistema de multiplexação (302), Gerência do Núcleo de transmissão (303), Gerência do subsistema de codificação de dados (304), Editor de tabelas SI/PSI (305), Editor de EPG (306), Gerência da grade de programação (307), Transmissor cíclico (308), Gerência de conteúdos (309), Supervisão de falhas (310) e Gerência de segurança (311), e que interage com um banco de dados (500) e um banco de conteúdos (600) para operar, monitorar, manter e administrar uma plataforma de TV digital, através de interfaces gráficas de usuário (400) e recursos de ajuda contextuais que permitem a configuração de serviços, programas e parâmetros do dito sistema e automaticamente efetua as devidas atualizações correlacionadas”. (72) Renato de Mendonça Maroja / Dagberto de Proença Magalhães / Marcus Aurélio Ribeiro Manhães / Patrícia Oyhenard dos Santos / Rafael Faria Carvalho / Claudia Povoas Schmidt

98

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009


Propriedade intelectual do CPqD

3. Resumos dos pedidos de patentes depositados no segundo semestre de 2009 (54) METODOLOGIA PARA DIMENSIONAMENTO DE CAPACIDADE DE REDES ADHOC-MESH SEM FIO. Dados do pedido: (21) PI 0902442-5 (22) 13/07/2009 (57) "A presente Metodologia para Dimensionamento de Capacidade de Redes Adhoc Mesh Sem Fio (1000) utiliza informações de múltiplas camadas da arquitetura de protocolos destas redes, tal como a camada física, de enlace de dados, de roteamento e de tráfego, além de usar aproximações estatísticas, e compreende cinco etapas executadas seqüencialmente. Inicialmente é realizado um levantamento topológico (1100), com a determinação dos nós fixos da rede e da área total a ser coberta. A seguir, é realizado um levantamento dos parâmetros sistêmicos (1200), tais como modelo de propagação, sensibilidade do receptor, raio de cobertura, freqüência de transmissão, potência, ganhos de antenas, etc. A fase seguinte é um levantamento da demanda de tráfego (1300), para a qual são levados em conta os serviços a serem suportados, os requisitos de banda, parâmetros do modelo de tráfego, e o perfil de usuários. Então é realizado um dimensionamento da quantidade e posicionamento dos gateways (1400), e finalmente um dimensionamento da vazão requerida por cada um dos ditos gateways (1500)". (72) Fabrício Lira Figueiredo / Álvaro Augusto Machado de Medeiros

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009

99


Propriedade intelectual do CPqD

(54) MÉTODO E SISTEMA HEURÍSTICOS E INTERATIVOS DE HIGIENIZAÇÃO DE DADOS SEMIESTRUTURADOS. Dados do pedido: (21) INPI/SP 018090039672 (22) 18/08/2009 (57) "Método e Sistema heurísticos e interativos de higienização de dados semiestruturados para aplicações em que os dados a serem corrigidos não seguem uma padronização rígida quanto à estrutura e ao conteúdo, apresentando erros aleatórios oriundos de procedimentos humanos. Independentemente de seus formatos, os Dados do Cliente (13) passam por análises (1) que utilizam regras heurísticas, separam os dados que devem ser preservados e identificam a Base de Referência (11) e a Base de Conhecimento (12) apropriadas à higienização em questão. Em seguida, após passarem por limpezas léxicas, sintáticas e semânticas, os dados são higienizados (2) com o auxílio da Base de Conhecimento (12), sendo os dados remanescentes confrontados com a Base de Referência (11) por meio de buscas aproximadas parametrizadas de padrões textuais; os casos de dúvida são apresentados a um Operador para escolha da correção mais adequada. As correções são aplicadas (3), obtendo-se os dados higienizados (32) que, antes de serem entregues ao cliente, são convertidos para o formato inicial, facilitando a reincorporação dos mesmos ao ambiente de origem”. (72) José Pedro Junior

100

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009


Propriedade intelectual do CPqD

(54) ESTAÇÃO TERMINAL AD HOC DE BAIXA FREQUÊNCIA. Dados do pedido: (21) PI 0903629-6 (22) 03/09/2009 (57) "Estação terminal ad hoc de baixa frequência (100), composta por um módulo de alimentação (110), um módulo de interfaces (120), um módulo de controle (130), e um módulo de rádio frequência (140) que compreende um submódulo de padrão IEEE 802.11 MAC (141), um submódulo de banda-base OFDM (142) e um submódulo de transmissão em baixas freqüências (143), através dos quais é possível implementar a camada física da rede ad hoc a partir de padrões de redes sem fio, e adaptar a faixa de frequência e largura de banda definidas por estes padrões". (72) Iran Lima Gonçalves / Douglas Gameiro Diniz / Ricardo Takaki / José Antonio Martins / João Luis Coelho.

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009

101


Propriedade intelectual do CPqD

(54) MÉTODO E SISTEMA PARA IDENTIFICAÇÃO E ANÁLISE DE AMEAÇAS EM INFRAESTRUTURAS CRÍTICAS. Dados do pedido: (21) INPI/SP 018090051628 (22) 16/11/2009 (57) "Método e Sistema para identificação e análise de ameaças em infraestruturas críticas para identificação e análise de ameaças potencialmente existentes sobre ativos que compõem infraestruturas críticas de qualquer setor organizacional como, por exemplo, telecomunicações, transportes, energia, água, esgoto, finanças, entre muitos outros. Inicialmente, a infraestrutura em questão é identificada (1) a partir dos seus ativos que dão suporte a serviços críticos, e as informações geradas são disponibilizadas na Base de Ativos (11). Em seguida, são identificadas e caracterizadas (2) todas as possíveis ameaças que possam existir sobre a infraestrutura armazenada na Base de Ativos (11). São identificadas as vulnerabilidades e os agentes de cada ameaça, além de ser realizado um mapeamento dos impactos causados por cada ameaça em cada ativo. Por fim, as ameaças são analisadas (3), sendo geradas classificações segundo visões de interesse, a partir do levantamento de suas ocorrências anteriores, da estimativa de suas ocorrências futuras e da identificação do tempo médio de recuperação de cada ativo associado, e as informações geradas são disponibilizadas na Base de Ameaças Analisadas (31)". (72) Sérgio Luis Ribeiro / João Henrique de Augustinis Franco / Christiane Maria da Silva Cuculo / Sandra Maria Campanholi Tome / Marcos Baracho Trindade / Leonardo Moreira Lage / Danilo Yoshio Suiama / Emilio Tissato Nakamura.

102

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009


Propriedade intelectual do CPqD

4.

Códigos do INPI para Identificação de Dados Bibliográficos (INID) contidos nos documentos de patentes

(11) Número da patente (21) Número do pedido (22) Data do depósito (30) Dados da prioridade unionista (data de depósito, país, número) (45) Data da concessão da patente (51) Classificação internacional (54) Título (57) Resumo (72) Nome do inventor (81) Países designados

Cad. CPqD Tecnologia, Campinas, v. 5, n. 2, p. 93-104, jul./dez. 2009

103


Ícones como facilitadores da interação de usuários iletrados com interfaces computacionais Ismael Mattos Andrade Ávila, Rosely Gomes Costa Equalização e identificação adaptativas de canais utilizando marca d’água Mário Uliani Neto, Leandro de Campos Teixeira Gomes, João Marcos Travassos Romano Descoberta automática da topologia física de redes Ethernet com switches heterogêneos e de múltiplos fabricantes Marcos Rogério Salvador, Vinícius Garcia de Oliveira, Giovanni Curiel dos Santos Análise do potencial de TV interativa no Brasil Esther Menezes, Alexandre Freire da Silva Osorio, José Orfeu Carvalho Antonini, Daniel Moutinho Pataca Uso da montagem de rajadas em redes de comutação óptica de pacotes e o impacto no tráfego Internet passante Gustavo Bittencourt Figueiredo, Nelson Luís Saldanha da Fonseca, César Augusto Viana Melo, Marcos Rogério Salvador Propriedade intelectual do CPqD

www.cpqd.com.br Rodovia Campinas-Mogi-Mirim (SP-340) – km 118,5 – CEP 13086-902 Campinas – SP – Brasil

ISSN 1809-1946

TV móvel: a convergência da radiodifusão com a telecomunicação Daniel Moutinho Pataca, José Orfeu Carvalho Antonini, Marcus Aurélio Ribeiro Manhães, Sidney Longo


Cadernos CPqD Tecnologia V5 Nº 2