Anais do 1º Congresso Regional de Design de Interação
usability expert
Anais do 1º Congresso Regional de Design de Interação Realizado em 26, 27 e 28 de Novembro, 2009 Local: Universidade Anhembi-Morumbi, Campi Morumbi Realização: IxDA South America composto por: Coordenadores do evento: • IxDA São Paulo: Amyris Fernandez, Fabio Palamedi, Ricardo Seiji • IxDA Belo Horizonte: Karine Drumond, Leandro Alves, Fabricio Marchezini • IxDA Curitiba:Érico Fileno • IxDA Manaus: Rodrigo Corrêia • IxDA Rio de Janeiro: Edson Rufino, Gustavo Gawry • IxDA Recife: Ricardo Couto • IxDA Santa Maria: Ricardo Fleck • IxDA Florianópolis: João Costa • IxDA Salvador: Mauricio Lelis • IxDA Buenos Aires: Santiago Bustelo, Mariano Goren • IxDA Bogotá: Leonardo Parra Agudelo • IxDA Sangtiago de Chile: Nelson Rodrigues-Peña
usability expert
usability expert
crédito dos chairs Amyris Fernandez (FGV-SP) Rachel Zuanon (Anhembi-Morumbi) contato@ixdasp.org IXDA - SP Rua Américo Brasiliense, 2171 conjunto 501 CEP: 04170-002 - São Paulo - SP - Brasil
ISBN: 978-85-63115-00-3 Título: Anais do Congresso de Design de Interação Edição: 1 Ano de edição: 2009 Tipo de suporte: Publicação digitalizada Páginas: Não informado Editora: IXDA - SP
prefácio
A Interaction Design Association (IxDA) tem o prazer de apresentar os Anais do Interaction South America | 09 (1º Congresso Regional Design de Interação – América do Sul). A proposta de um Congresso Latino Americano tem como objetivo proporcionar uma primeira oportunidade para que as pessoas de toda a América do Sul possam conhecer e discutir o tema. Design de Interação é uma disciplina nova, cunhada em 1997 por Winograd. Desde então, a disciplina cresceu e diversas universidades e empresas passaram a reconhecê-la e legitimála. Entretanto, apesar de ser uma disciplina de grande interesse, somente um evento de caráter não acadêmico, realizado anualmente nos Estados Unidos, dedica atenção especificamente a este tema. Por sua vez, a área de pesquisa é desafiadora, por seu caráter abrangente e interdisciplinar. Abrangente, pois se pode estudar interação com ambientes digitais e não digitais. Interdisciplinar porque, para entender como instigar pessoas a agir desta ou daquela forma, como melhorar suas experiências, e como prever suas reações, exige o conhecimento proveniente de áreas como usabilidade, ergonomia e ciências cognitivas. Já as decisões estéticas e de comunicação vêm de áreas como artes, design e marketing, o que torna o campo de atuação muito rico para pessoas interessadas, profissionais e acadêmicos, e confere a possibilidade de criação coletiva de um mercado de atuação profissional muito promissor. Afinal, design, comunicação,
arte, tecnologia, entretenimento, e consumo são desafiados por interfaces que podem e devem melhorar significativamente, para enfim propiciar resultados eficazes, com conforto, alegria e prazer, a todos que as tocam. É com esta perspectiva que os capítulos do Interaction Design, existentes na América do Sul, se uniram para criar e promover essa 1ª edição do Congresso, com 2 dias de duração, precedido por um dia totalmente dedicado a workshops. Procuramos trazer para colaborar neste evento um corpo acadêmico representativo da área de Design, Arte e Interação HumanoComputador e empresas que incentivam a disciplina. A Interaction Design Association é uma organização sem fins lucrativos, que tem por objetivos: Evangelismo – Promover o conhecimento sobre a disciplina, ofício e valor do design de interação entre negócios, academia e consumidores, bem como profissionais da área. Inovação – Colaborar com o avanço da disciplina de design de interação. Profissionalismo – Encorajar standards de qualidade dentro da prática da disciplina de design de interação. Educação – Estabelecer padrões para programas acadêmicos em design de interação. Criação de Comunidade – Desenvolver uma rede forte de profissionais de design de interação. Considerando estes objetivos e diante do resultado do Congresso, acreditamos ter cumprido com nosso papel neste momento: demos o primeiro passo!
4
Nossos sinceros agradecimentos a todos os representantes dos capítulos do IxDA na América Latina, por sua contribuição para a realização do Congresso:
Bogotá, Colômbia Leonardo Parra Agudelo
São Paulo,SP Amyris Fernandez, Fabio Palamedi, Rachel Zuanon, Ricardo Seiji
Santiago de Chile, Chile Nelson Rodrigues-Peña
Rio de Janeiro, RJ Gustavo Gawryzewsky, Edson Rufino
Á Universidade Anhembi-Morumbi por ter cedido o espaço e toda sua infra-estrutura para a realização do evento, a Alexandre Gracioso, Ana Lúcia Lupinnacci e Cláudio Bueno (ESPM), Bruna Casalle e todos os alunos voluntários da Universidade Anhembi Morumbi que participaram da organização do evento, Lucio Cavalcanti e Beto Campainha (InDT), à equipe de marketing do UOL (UOLHost e PagSeguro), Abel Reis e equipe de marketing da AgênciaClick, por acreditarem no projeto quando nós mais precisávamos. Adilson Batista e equipe de criação e tecnologia da Y&R pelos Banners no UOL, Fábio Rowinski e equipe de Mídia da AgênciaClick pelo Plano de Mídia, à SBC (Sociedade Brasileira de Computação) pelo apoio, e a todos que acreditaram no evento, incluindo a comunidade científica, em especial aos autores que submeteram trabalhos e aos doutores que compuseram o comitê científico. Sem esses abnegados pesquisadores não avançaríamos com solidez.
Brasília, DF Milena Lopes Belo Horizonte, MG Fabrício Marchezini, Leandro Alves, Karine Drummond Curitiba, Paraná Érico Fileno Recife, Pernabuco Ricardo Couto Florianópolis, SC João Costa Manaus, AM Rodrigo Correia Salvador, Bahia Marcelo Lelis
Buenos Aires, Argentina Santiago Bustelo
Santa Maria, RGS Ricardo Fleck
Novembro 2009.
Porto Alegre, RGS André Rabelo
Amyris Fernandez, Profa.Dra. Rachel Zuanon, Profa.Dra.
5
organização do congresso Coordenação do Comitê Científico : Amyris Fernandez (FGV-SP) Rachel Zuanon (Anhembi-Morumbi) Romero Torii (POLI-USP) Comitê Científico : Adriana Betiol (Interfacil.br, Brazil) Ana Lúcia G. Ribeiro Lupinacci (ESPM, Brazil) Claudio Bueno (ESPM, Brazil) Daniela Kutschat (SENAC SP, Brazil) Eduardo Ariel (SENAC RJ, Brazil) Giselle Beiguelman (PUC-SP, Brazil) Hugo de Paula (PUC-MG, Brazil) Jeremy Yuille (RMIT University, Austrália) João Luis Garcia Rosa(ICMC / USP, Brazil) Karla Schuch Brunet (UFBA, Brazil) Leonardo Parra Agudelo (UNIANDES, Colombia) Luisa Paraguai (UNISO – Sorocaba, Brazil) Luiz Agner (Univercidade, Brazil) Luiz Ernesto Merkle (UTFPR, Brazil) Rejane Cantoni (PUC-SP, Brazil) Renata Vieira (PUC-RS, Brazil) Ricardo Nakamura (POLI-USP, Brazil) Roberto Cezar Bianchini (POLI-USP, Brazil) Robson Santos (Nokia Institute of technology, Brazil) Rogerio Da Costa (PUC-SP, Brazil) Wilson Bekesas (ESPM, Brazil) Vince Vader (ESPM, Brazil)
6
sumário
interface Desenho Participativo de Ícones paWra 10 Interfaces Computacionais Voltadas a Usuários Analfabetos Design Emergente via Tela Multi-Toque 18 Desenvolvendo Interfaces de Usuário 26 Multiplataformas utilizando MDA A percepção das tecnologias 36 Levantamento de Heurísticas para 41 Avaliação de Interfaces do Usuário Baseadas em Voz
governo/web Interfaces para Aplicações de 53 Governo Eletrônico Construção de um modelo de interação 66 para serviços de governo eletrônico promovendo inclusão digital Museus na Web: A Espiral Evolutiva das 72 Formas de Presença Online Inspeção semiótica do Wiki-STOA: uma 86 análise a partir da teoria da complexidade Método para Aplicações Web Focado em 97 Usabilidade Aderente a um Processo de Software Convencional
games Web Browser Game para Meninas 113 A Influência de Interfaces Gráficas na 125 Narrativa e Imersão de Jogos Digitais Compreendendo dinâmicas de jogo: as 133 esferas de interação dentro do framework Componentes-Dinâmicas-Experiências Violent Video Games: Changes in non- 141 verbal behavior and short-term effects on valence and arousal
7
educação Some Issues on Instructional Design and 149 Development for E-Learning Systems Modelo de transcrição da Língua de Sinais 156 Brasileira voltado a implementação de agentes virtuais sinalizadores Iniciativa de Design Instrucional em uma 170 Instituição de Ensino Superior New scenarios in the design education 185 with dynamic of interaction
interação por gesto
metodologia Programação voltada ao usuário 240 final baseada em formatação visual de texto Representação de Casos 248 sobre a Implicação da Usabilidade para o Sucesso de um Produto Utilizando a Técnica de Storytelling Usos e significados do sofá: uma 257 sondagem de usuários
usabilidade
Reconhecimento de Gestos da LIBRAS 190 com Classificadores Neurais a partir dos Momentos Invariantes de Hu
M-Cube: A Visualization Tool for 268 Multi-dimensional Multimedia Databases
Correction of high lighting using histogram 196 matching for skin segmentation on white background images
Resultados da avaliação de um protótipo 278 para inclusão digital usando Avaliação de Recuperabilidade
Design de Interação para um Atlas 202 Virtual de Anatomia Usando Realidade Aumentada e Gestos
Efeitos dos Alarmes Automáticos na 288 Consciência Situacional de Operadores de Sistemas de Monitoramento
Gestures: Pushing the boundaries of 214 touch-based interfaces
tv / dispositivos móveis TV Digital: Usuário ou 219 Telespctador Televisivo? A personalização como estratégia para 224 o gerenciamento da obsolescência de artefatos
cases de mercado Desenvolvimento de uma estratégia de 298 inovação em Design de Interação Design de interface para questionário 302 on-line do Censo Demográfico 2010 Linguagem visual como facilitador de 307 interação com arquitetura da informação em empresa do ramo de Gás LP Avaliação do site Cocoricó com crianças 313 em idade pré-escolar
Interação em Players de Música para 229 Dispositivos Móveis Uma casa no controle da TV: 233 Desenvolvimento de um Programa para TV Digital para Controle de Dispositivos Domésticos
8
interface conexĂľes entre usuĂĄrios e sistemas
9
10
11
12
13
14
15
16
17
Design Emergente via Tela Multi-Toque Luis Carli Faculdade de Arquitetura e Urbanismo da Universidade de São Paulo Rua do Lago, 876 CEP 05508.080 São Paulo SP Brasil info@luiscarli.com +55 11 7326.2652
RESUMO
Em busca de um processo de produção de imagens menos determinista e mais complexo, desenvolveu-se um sistema baseado em fenômenos emergentes naturais que trocasse informações entre suas partes constituintes, levando a emergência de imagens gráficas. O sistema é composto por centenas de partículas com comportamento gráfico que podem ser interagidas por várias pessoas simultaneamente, através de uma interface multi-toque – também desenvolvida para essa pesquisa. A partir da cooperação e competição entre as partes do sistema, o mesmo tende a auto-organização, gerando imagens que são coesas e sempre inesperadas, fruto indireto da relação das unidades do software e das pessoas que interagem sobre o mesmo. Palavras-Chave
Design generativo, design emergente, complexidade, sistemas digitais, algoritmos não-lineares, auto-organização, multitoque, interfaces naturais, design de interação.
18
COMPlExiDaDE, EMERgênCia E algORiTMOS
Edgar Morin diz que o conhecimento científico clássico opera através da disjunção, isolando objetos, encaixando-os em raciocínios lógicos. “Vivemos sob o império dos princípios de disjunção, de redução e de abstração cujo conjunto constitui o que chamo de paradigma de simplificação” [6]. Essa disjunção causa segundo Morin uma hiper-especialização, que além de despedaçar e fragmentar o tecido complexo das realidades, faz crer que o recorte arbitrário operado no real é o próprio real. O processo de disjuntar, de reduzir o mais complexo ao menos complexo leva a situações como essa que Morin descreve: “Vamos, pois, estudar o homem biológico no departamento de biologia, como um ser anatômico, fisiológico, etc. e vamos estudar o homem cultural nos departamentos das ciências humanas e sociais. Vamos estudar o cérebro como órgão biológico e vamos estudar a mente, the mind, como função ou realidade psicológica. Esquecemos que um não existe sem a outra, ainda mais que um é a outra ao mesmo tempo, embora sejam tratados por termos e conceitos diferentes” [6]. Morin coloca que é preciso ter consciência de que “a racionalização consiste em querer prender a realidade em um sistema coerente. E tudo o que, na realidade, contradiz esse sistema coerente é afastado, esquecido, posto de lado, visto como ilusão ou aparência” [6], ou seja, precisamos ter consciência que parte do real não é racionalizável, não tendo a pretensão de esgotar num sistema lógico a totalidade do mesmo, mas sim a vontade de dialogar com o que lhe resiste. “O universo é muito mais rico do que o podem conceber as estruturas de nosso cérebro” [6]. Logo, se torna importante buscar meios e sistemas em que seja possível relacionar e entrelaçar mais matérias e mais informação, sofrendo menos a mutilação do paradigma simplificador. Para um sistema lidar com mais matérias, informações e considerações é preciso fazer uso de métodos diferentes de inter-relacionar e entrelaçar informação, para não sofrer diretamente as limitações das aplicações de uma racionalização lógica. Muitos fenômenos naturais vêm sendo redescobertos e re-estudados a partir de novos pontos de vista. Situações e sistemas naturais de grande complexidade parecem fugir à lógica e à racionalização por causa da grande quantidade de informação entrelaçada que eles contém, o que causa um aspecto confuso e caótico. Steven Strogatz [7] diz que estamos acostumados a pensar em termos de um controle centralizado, claras cadeias de comando, a lógica linear da causa e consequência. Mas em grandes sistemas interconectados nossas maneiras costumeiras de pensar desmoronam. Devido a isso vêm surgindo novas maneiras de abordar fenômenos complexos. O conceito da emergência discorre sobre sistemas que fogem à segunda lei da termodinâmica, ou seja, que tendem
a auto-organização de suas partes e a um comportamento diferenciado do todo. Sistemas em que as características e comportamentos do todo não decorrem e não possuem proporção direta com as características e comportamentos de suas partes. Steven Johnson diz que “o movimento de regras de baixo nível para um alto nível de sofisticação é o que chamamos de emergência, (...) um padrão de alto nível surgindo de complexas interações paralelas entre agentes locais” [4]. John Holland sobre emergência coloca que “nós somos em todos lugares confrontados com emergências em sistemas complexos adaptativos – colônias de formigas, redes de neurônios, o sistema imunológico, a internet, a economia global, para citar alguns – onde o comportamento do todo é muito mais complexo que o comportamento das partes” [3]. Design de Sistemas Digitais
O ser humano faz uso de métodos de simplificação, de disjunção e de redução ao encarar a produção, pois temos dificuldade de lidar com quantidades muito vastas de informação em curtos espaços de tempo. Portanto para conseguir simular situações mais complexas precisamos fazer uso de extensões humanas, extensões que lidem com dados de uma maneira mais totalizante quanto possível. Os meios digitais permitem exatamente isso. Vilém Flusser diz que: ”Tudo é quantizável. Eis porquê os números convêm ao mundo, mas as letras não. O mundo é calculável, mas indescritível” [2]. O ato de calcular, de computar, transforma a informação absorvida em algo novo, algo que não existia antes. Através da decodificação dos dígitos é possível transcodificar os números calculados dentro do computador novamente em cores, formas e tons. “Graças aos computadores, a beleza e a profundidade do cálculo tornaram-se perceptíveis aos sentidos. Pode-se ver nas telas dos computadores sua potência criativa, pode-se ouvi-la em forma de música sintetizada” [2]. Os cálculos resultam em imagens inesperadas, informativas e belas, e com elas podese brincar quase infinitamente, isso porque novos impulsos nas interfaces levam a novas respostas. Flusser continua, dizendo: “O fascinante no cálculo não é o fato de que ele constrói o mundo (o que a escrita também pode fazer) mas a sua capacidade de projetar, a partir de si mesmo, mundos perceptíveis aos sentidos” [2]. Na busca por respostas mais abrangentes em situações mais complexas, começasse a desenvolver o design do sistema ao invés do design do objeto. Sobre isso Ellen Lupton diz: “Projetar o sistema faz parte do processo criativo. Os resultados visuais possuem uma qualidade orgânica que vem da alimentação aleatória de dados no sistema. O designer controla e manipula o próprio sistema, em vez dos resultados finais” [5]. Isso configura um campo chamado de ‘design generativo’, no qual o processo de design se utiliza de sistemas de algoritmos
19
para gerar sua produção imagética. Esses sistemas partem principalmente de conceitos e equações científicas, como atração e repulsão, oscilações, colisões, fractais, algoritmos genéticos e equações não lineares. Através da iteração e interação das unidades desses sistemas se gera informações matemáticas, que são codificadas em imagens gráficas a partir de regras e algoritmos desenvolvidos pelo designer do sistema. Potência não linear dos algoritmos
Em seu livro ‘Expressive Form’, uma aproximação conceitual para o design computacional, Kostas Terzidis fala sobre a diferença entre o computador usado como ferramenta e como meio de processar algoritmos de caráter emergente: “The word ‘tool’ is often used to describe the synergistic interaction of designers with computers. A tool is defined as an instrument used in the performance of an operation. The connotative notion of a tool implies control, power, dominance, skill, and artistry. (...) The capabilities, potency, and limitations of a tool are known or estimated in advance. This is not the case with computers performing inductive algorithmic computations. Neither is their capacity or potency understood, nor can their limitations be preestimated. Indeed, designers are frequently amazed by processes performed by algorithmic procedures, over wich they have no control and of wich they often have no prior knowledge.” [8] Um algoritmo é uma seqüência finita de regras, raciocínios ou operações que, aplicadas a um número finito de dados, permite solucionar classes semelhantes de problemas (por exemplo um algoritmo para a extração de uma raiz cúbica), eles são um processo de cálculo, um encadeamento de ações necessárias para o cumprimento de uma tarefa, visto dessa forma um algoritmo produz uma solução para um problema em um número finito de etapas. Mas seu uso pode ser expandido, sobre isso Kostas fala: “While most algorithms are tailored to automate tedious manual methods, there is a certain category of algorithms that are not aimed at predictable results. Their inductive strategy is to explore generative process or to simulate complex phenomena. Such inductive algorithms can be regarded as extensions to human thinking and there may allow one to leap into areas of unpredictable, unimaginable, and often inconceivable potential. (...) their behaviour is often non-predictable and that frequently they produce patterns of thought and results that amaze even their own creators”. [8] Um algoritmo sempre será um procedimento que pega qualquer instância de entrada possível e a transforma em uma desejada saída, mas a forma e o número de conexões entre os algoritmos pode mudar drasticamente esse cenário de mera automatização, caminhando para o que Kostas chamou de ‘resultados imprevisíveis que maravilham até mesmo seus criadores’. A idéia mais comum de algoritmo, é a de uma equação linear,
como a esquematizada na figura 1. Na qual se tem uma entrada de dados, sua manipulação linear e o consequente resultado. A função de ajuste de contraste do programa ‘Photoshop’ pode ser entendida dessa forma, temos duas entradas: a imagem a ser manipulada e uma variável que diz com qual intensidade seu contraste será ajustado. A função do programa manipula os pixels da imagem através de seu algoritmo de contraste, sendo que uma das variáveis das equações que compõe esse algoritmo foi inserida pelo usuário, o valor de contraste, o resultado é a imagem modificada. A função de contraste do programa possui um papel automatizador de uma tarefa ferramental, esse é o modo mais comum e mais usual de se abordar problemas via computação e manipulação de dados. Essa ferramenta, por ser digital, permite a manipulação de uma quantidade muito maior de dados em um espaço muito menor de tempo, e por isso consegue realizar funções mais complexas, mas isso não muda seu caráter ferramental, em que os resultados de seus usos são previsíveis e diretamente relacionáveis as ações (nesse caso o ‘input’ de dados). Como então desenvolver sistemas gráficos que possuam características emergentes, sistemas que tenham uma relação indireta entre ação e resposta e com isso possibilitem o aparecimento de resultados novos e imprevistos? Uma primeira tentativa seria da inserção de aleatoriedade no sistema, através de uma variável randômica que a cada cálculo do algoritmo possui-se um valor diferente, e com isso adiciona-se ruído e um resultado estético que pode ser encarado como orgânico. O ruído é de extrema importância, como coloca Morin: “a ordem auto-organizada só pode se complexificar através da desordem, ou melhor, já que estamos em numa ordem informacional, a partir do ‘ruído’” [6], mas o ruído sozinho – principalmente em um sistema digital – causa somente o caos, e não traz a emergência de nenhuma formação diferenciada e organizada. É aqui que entram dois processos que são importantes e diferenciais, a iteração e a interação. Iteração é o processo de resolução de uma equação mediante operações em que sucessivamente o objeto de cada uma é o resultado da que a precede, enquanto que interação é a ação recíproca de dois ou mais corpos. Ao pegarmos o modelo anterior (figura 1), adicionarmos variáveis aleatórias, e um processo de iteração em que o resultado do sistema alimenta o próprio sistema novamente teremos o esquema mostrado pela figura 2, em que começa-se a criar tendências organizacionais dependendo de como o sistema é estruturado. Vários artistas, como por exemplo Marius Watz, Joshua Davis, Erik Natzke, que se utilizam de códigos para gerar suas imagens, desenvolvem sistemas que tem como base esses processos. O conhecido fractal de Mandelbrot também pode ser analizado dessa maneira, desenvolvido por Benoit Mandelbrot, o conjunto de Mandelbrot é um grupo de pontos
20
Figura 1. Gráfico mostrando a linearidade de manipulação por um algoritmo padrão
Figura 2. Relação de retro-alimentação em algoritmos com variáveis aleatórias
uma retro-alimentação, para passarmos de uma iteração para uma interação, uma troca de informação em uma malha de conexões. Ou seja, o resultado dos algoritmos que eram utilizados novamente como ‘input’ para os algoritmos, passam a alimentar e ser alimentados por diversos outros algoritmos próximos a esse, em uma troca constante de informação. O resultado, a imagem que se forma, é o conjunto da saída de todos os algoritmos dessa malha que compõe o sistema (figura 3). Essa troca constante de informação, somada ao ruído das variáveis aleatórias é o que permite o sistema tender a organização, enquanto consegue apresentar resultados novos, inesperados, ainda que coesos. Steven Strogatz, a partir do estudo de fenômenos naturais, diz que a sincronização, a organização, é plenamente factível através de uma densa conexão entre unidades, “nature uses every channel to allow its oscillators to talk to one another. And the result of those converstion is often synchrony, in wich all the oscillators begin to move as one” [7]. Ele coloca que a emergência de consciência a partir da inter-relação de trilhões de neurônios no cérebro, a origem da vida de uma mistura de reações químicas na sopa primordial, todos esses envolvem um enorme número de jogadores ligados em uma rede complexa. Características aproximativas de um Sistema Emergente
Figura 3. Relação em rede de algoritmos com variáveis aleatórias
no plano complexo no qual seus limites formam fractais. Eles são resultado da iteração continua de uma equação com uma variável externa, se o resultado dessa iteração tender ao infinito o número inserido, a variável externa, está fora do conjunto de Mandelbrot. As famosas imagens dos fractais de Mandelbrot vem da aplicação de valores de pontos cartesianos nas iterações da equação, esses pontos cartesianos são pintados de uma cor que equivale a quanto eles divergem para o infinito. Quanto mais nos aproximamos de um ponto da imagem, e consequentemente mais cálculos sequenciais são resolvidos para dar resolução a imagem, novas formações gráficas vão aparecendo. Esse processo mostra uma retro-alimentação, um ‘feedback’, pois os resultados das equações formam parte da equação seguinte, Isso traz resultados impressionantes que podem ser chamados de generativos, pois eles se alimentam da situação anterior para causar uma nova, para continuar se construindo. O próximo passo é intensificar e aumentar essa passagem de informação, até aqui estruturada como um ‘feedback’,
Para que um sistema digital tenda a auto-organização e não somente gere entropia e desordem, para que ele apresente soluções novas que não foram explicitamente pré-codificadas, é necessário desenvolve-lo tendo como base características aproximativas de sistemas emergentes naturais, fazendo com que o mesmo seja mais do que a automatização de um processo linear. O sistema precisa ser um processo de inter-relação de unidades, que funcionam aqui como uma população de algoritmos, se conectando entre si e trocando informação. Por conexão entende-se um caminho de duas vias, que começa com a sensibilidade e abstração de um ambiente próximo imediato a unidade, a acumulação e interpretação da informação adquirida, que transforma as relações da própria unidade e é expressada na forma de comportamento que modificará o ambiente. No caso das unidades simuladas dentro do sistema digital proposto, seu comportamento será principalmente gráfico, de maneira a gerar imagens. As unidades não podem agir diretamente sobre o sistema inteiro, seu comportamento tem que ser uma reação que não se imponha ou sobre-determine o sistema, Johnson fala que “ter agentes individuais capazes de estimar diretamente o estado global do sistema pode ser uma real deficiência na lógica do enxame; pela mesma razão ninguém deseja que um neurônio de seu cérebro de repente se torne consciente” [4]. Dessa forma, a conexão entre as unidades algoritmicas do sistema precisa ser feira por proximidade, por contato, e não automaticamente entre todas as unidades do sistema simultanêamente.
21
Sendo assim, a partir do momento em que a unidade escolhe um comportamento gráfico, ela não o realiza imediatamente, seria como dizer que a partir do momento que eu decido vestir uma camiseta vermelha, eu não a coloco imediatamente, mas pergunto às pessoas perto de mim o que elas estão pensando em vestir. As unidades do software trocam informação entre si sobre que ações elas pretendem tomar, e com bases nessas conversas elas podem trocar de opinião ou não e então tomar a ação gráfica. Entre os comportamentos gráficos que as unidades podem tomar estão variedades de tons, que são vistos pelas unidades como conceitos de cores: amarelo, azul, vermelho... Variedades de saturação, e de claro-escuro, essas três classificações levam a possibilidades quase infinitas de cores. Além disso as unidades podem mudar também o seu tamanho e a sua opacidade. interação
Figura 4. Duas composições gráficas que emergiram através do software ‘Unidades’ O SOFTWaRE UniDaDES E a TEla MUlTi-TOQUE
Em cima dessas considerações foi desenvolvido o software ‘Unidades’, no qual centenas de unidades no formato de pequenos círculos interagem entre si e com o ambiente, uma população de algoritmos com comportamentos gráficos que interagem intermitantemente entre si. Devido a essas interações e cooperações o sistema tende a se auto-organizar em composições gráficas coesas e inesperadas, como os duas imagens apresentadas na figura 4. Cada unidade do software, cada bolinha, vê o que está acontecendo a sua volta em um curto raio de distância, e armazena essa informação em uma memória interna, a partir do que a unidade experienciou ela poderá tomar atitudes gráficas diferentes. Ou seja, o resultado dos algoritmos das unidades ao seu redor, que depois são decodificados em informação gráfica, são armazenados na memória interna da unidade, dependendo do padrão que essas variáveis armazenadas formam há uma diferente gama de comportamentos e possibilidades para a unidade tomar, as possibilidade possuem pesos diferentes em relação aos padrões armazenados na memória da unidade. Aqui entra o ruído, a variável aleatória, que escolhe um dos comportamentos gráficos para a unidade querer realizar. Os experimentos feitos com o software, mostraram que era necessário mais uma camada de trocas de informação, algo que colaborasse para a formação de grupos com gostos parecidos.
Além das trocas de informações entre as unidades, se tentou tornar o sistema mais aberto, de forma que ele pudesse ser influenciado e interagido por ações externas. Para que o sistema capte informações do ambiente é necessário uma interface, um equipamento, ‘hardware’, que seja sensibilizado por ações e condições externas, codificando-as em impulsos digitais que alimentem as variáveis dos algoritmos das unidades. Ao conectar, por exemplo, teclas de um teclado ao software, que tipo de relação podemos ter? Uma tecla possui dois estágios, apertada e solta, tecnicamente ela está passando corrente ou não, é possível então mapear ações diferentes à esses dois estágios, fazendo com que ao apertar a tecla se modifique uma variável de velocidade das unidades, tornando-as mais rápidas, e ao soltar a tecla a variável volte ao normal. Essa é uma interação bem direta, que determina pontualmente uma mudança e tem uma consequência linear no sistema, consequentemente não condizendo com o que vem se discutindo aqui. Poderíamos adicionar mais teclas a interface, fazendo com que sequências diferentes de teclas levassem a ações diferentes, aumentando então a quantidade de possibilidades de ações, mas para isso precisariamos de uma grande gama de sub-menus que explicassem quais ações poderiam acontecer a cada nova sequência de teclas, ou então precisariamos de um técnico altamente treinado especificamente nesse software. As duas opções são contra intuitivas. Buscou-se então uma forma de captar movimentos manuais, de posição e velocidade da mão e dos dedos, esse movimentos são mais naturais e intuitivos do que uma grande série de menus e sub-menus, ou de teclas enfileiradas. Essa captação deveria permitir a relação de não apenas uma única pessoa com a máquina, que é o mais comum de se encontrar encontrar hoje nos aparelhos eletrônicos, como computador, celular e televisão, nesse último várias pessoas assistem ao mesmo tempo, mas só uma aperta os botões do controle remoto. A possibilidade de várias pessoas interagirem simultaneamente no software, permite não só que mais informações adentrem
22
Figura 5. Sobre o funcionamento da tela multi-toque de baixo custo.
23
e sensibilizem o sistema, como também que o ambiente de interação e troca aconteça não só na escala do software, mas também entre as pessoas que o estão usando. Além disso era necessário que a solução fosse de baixo custo, para poder viabilizar o experimento e sua construção. Para a interface com o software ‘Unidades’, foi desenvolvido uma tela sensível a multi-toques, permitindo que várias pessoas interajam ao mesmo no software através do toque direto sobre as unidades. Sobre o Funcionamento da Tela Multi-Toque
A tela multi-toques desenvolvida possui um alto nível de sensibilidade e bastante precisão, podendo captar pequenas variações de movimento e captando com pequena margem de erro a posição real dos toques dos usuários. Tendo sido refinada em experimentos e protótipos sucessivos ela permite também uma resposta extremamente ágil, devido a uma estrutura de hardware e software específicos que conseguem manter uma taxa de atualização de sessenta quadros por segundo, enquanto se mantém como uma configuração de baixo custo. Ela se utiliza de um princípio ótico chamado refração total interna frustada, que foi utilizado pela primeira vez em uma tela multi-toques pelo pesquisador do MIT Jeff Han. A minha montagem foi desenvolvida com o auxílio da informação disponibilizada pelo grupo NUI (Natural User Interface), que mantém um fórum especializado em interfaces de toque onde pessoas do mundo todo postam seus avanços e descobertas. A montagem constitui de um acrílico espesso com LEDs infravermelhos a sua volta, um vegetal como superfície difusora para a projeção da imagem, uma câmera sensível somente a radiação infravermelha e um projetor. Os raios infravermelhos dos LEDs ficam presos dentro do acrílico, a câmera filmando por debaixo da montagem vê apenas uma imagem preta. Ao se tocar o vidro, por causa do princípio ótico da refração total interna frustada (FTIR), os raios infravermelhos saem para baixo, a câmera vê então um ponto branco no formato do dedo. A análise da imagem transforma os pontos brancos em coordenadas cartesianas que alimentam o meu software gráfico ‘Unidades’. O resultado é projetado de volta em tempo real na superfície que está sendo tocada, a projeção e o infravermelho não se atrapalham mutuamente pois trabalham em espectros de luz diferentes. Uma camada especial de silicone é aplicada entre o vegetal e o acrílico para melhorar a sensibilidade ao toque. Sobre a interface e o Descobrimento intuitivo
Através do toque é possível empurrar, puxar e mover as unidades e partículas do software, pois as informações de posição e velocidade do movimento são passadas para as unidades que estão em uma área próxima ao toque. Ao movimentar-se as partículas, força-se outras relações de proximidade e de concentração entre as unidades, o que levaas a se reorganizarem a partir dessas novas concentrações,
em uma alusão, é como oportunar uma colônia de formigas e assistir como elas reagem e respondem. Ao deixar um dos dedos parados surgem dois símbolos orbitando sobre o mesmo, um de igual e outro de diferente. Ao se pressionar um desses símbolos com outro dedo, a distância entre o primeiro e o segundo toque vira o raio de uma circunferência, todas as unidades que estiverem dentro dessa circunferência são forçadas a ficarem iguais ou completamente caóticas e aleatórias, dependendo do símbolo que foi pressionado. Com os dedos ainda pressionando a tela é possível mexer esse circulo de ação, aumentar e diminuir seu raio, influenciando diferentes áreas e porções da tela. A possibilidade de tocar e manipular o software com ambas as mão, através de uma sensação tátil de pressão, leva a um processo de descobrimento intuitivo da interface, que é reforçado pelo fato da mesma não possuir informação textual, apenas informação gráfica pontuada por dois símbolos. Isso torna agradável a relação entre o usuário e o software, mesmo que ele nunca tenha interagido antes com essa interface, o aprendizado da mesma não se configura como uma barreira, mas sim um jogo de tentativa e erro, de ver como o software reage a diferentes manipulações. Além do multi-toque permitir que uma pessoa utilize vários dedos e suas duas mãos ao interagir com o software, ele abre a possibilidade de várias pessoas interagirem ao mesmo tempo com o software. Assim as trocas de informação e relações propostas acabam se realizando em vários níveis diferentes, entre as unidades do software, entre o usuário e algumas unidades do software e entre os usuários do sistema, que trocam suas impressões entre si, competem e colaboram. Levando a situações em que duas ou mais pessoas se ajudam mutuamente para tentar colocar todas bolinhas to sistema em um mesmo lugar, ou brigam tentando colocar ordem ou caos em certa parte da tela. Influência Indireta
Villém Flusser bem coloca: “E aí se pode perguntar o que acontece, em termos existenciais, quando pressiono uma tecla. (...) As pontas dos dedos são órgãos de uma escolha, de uma decisão. O homem emancipa-se do trabalho para poder escolher, decidir. A situação em que se encontra, sem trabalho e sem coisas, lhe permite a liberdade de escolha e decisão” [2]. Ele continua dizendo: “A liberdade de decisão de pressionar uma tecla com a ponta do dedo mostra-se como uma liberdade programada, com uma escolha de possibilidades prescritas. O que escolho, o faço de acordo com as prescrições” [2]. Acontece que em sistemas mais complexos, sistemas emergentes, qualquer interação de um usuário ou ação de uma partícula do sistema só irá influenciar indiretamente as imagens que surgem do mesmo. Sistemas emergentes tendem a auto-organização, logo as ações realizadas não são proporcionais aos resultados que se desdobram, forçar as
24
Figura 6. Interações sobre o software ‘Unidades’ através da tela sensível a multi-toques
unidades de uma área a ficarem iguais pode gerar as mais diversas consequências nas outras partículas em volta delas, assim como as unidades dentro de uma área forçada a coesão por um usuário externo podem se reorganizar de diversos meios diferentes, ainda que esses sejam uma consequência indireta das ações realizadas pelos usuários e pelas partículas do sistema. O que se forma pode ser visto também como um jogo entre as pessoas que interferem no sistema, e como esse reage, se reorganiza e se adapta. É impossível prever exatamente o que pode acontecer, e dessas trocas e conversas surge uma situação muito agradável que prende a atenção das pessoas que utilizaram a instalação, essas tendem a ficar um tempo considerável interagindo com o software e vendo as composições gráficas que emergem, as figuras 6 e 7 mostram dois exemplos de pessoas interagindo com a mesa e as imagens que surgiram desse processo. Um vídeo do trabalho pode ser visto em http://vimeo.com/6290833
Figura 7. Close, interações através da tela sensível a multi-toques BiBliOgRaFia
1. Deleuze, Gilles; Guattari, Félix. Mil Platôs. São Paulo: Ed.34, 1995. 2. Flusser, Vilém. O Mundo Codificado. São Paulo: Cosac Naify, 2008. 3. Holland, John. Emergence from Chaos to Order. In Architectural Design. Emergence: Morphogenetic Design Strategies. (Periódico) 4. Johnson, Steven. Emergência. A dinâmica de redes em formigas, cérebros, cidades e softwares. Rio de Janeiro: Jorge Zahar Ed., 2003. 5. Lupton, Ellen; Phillips, Jennifer Cole. Novos fundamentos do design. São Paulo: Cosac Naify, 2008. 6. Morin, Edgar. Introdução ao Pensamento Complexo. Porto Alegre: Sulina, 2007. 7. Strogatz, Steven. Sync, how order emerges from chaos in the universe, nature and daily life. New York: Hyperion, 2003. 8. Terzidis, Kostas. Expressive Form. A conceptual approach to computational design. New York: Spon Press, 2003.
25
Desenvolvendo Interfaces de Usuário Multiplataformas utilizando MDA Macilon Costa Neto1,2 macilon@ufac.br
Alessandro Souza1,3 ajdsouza@cefetrn.br
1
Universidade Federal do Rio Grande do Norte Campus Universitário, Natal, RN, Brasil
2
Renato Lavor1
renato@ppgsc.ufrn.br
Universidade Federal do Acre Campus Universitário Rio Branco, AC, Brasil
RESUMO
As atuais necessidades do mercado estão exigindo cada vez mais das equipes de desenvolvimento de sistemas interativos. Frequentemente precisamos de uma mesma aplicação sendo executada sobre diversas plataformas (Desktop, Web, celular, etc.). A solução para esse problema pode estar no desenvolvimento de interfaces baseado em modelos abstratos (independente de plataforma). Neste trabalho mostramos como o problema de desenvolvimento de sistemas para múltiplas plataformas pode ser resolvido com uma solução baseada em MDA (Model-Driven Architecture). Os modelos abstratos sugeridos neste trabalho são baseados na IMML (Interactive Message Modeling Language) que é uma abordagem da Engenharia Semiótica para o desenvolvimento de sistemas interativos. Palavras-chave do autor
Interfaces de usuário multiplataformas, MDA, IMML, Desenvolvimento de sistemas interativos ACM Classification Keywords
H5.m. Information interfaces and presentation (e.g., HCI): Miscellaneous. INTRODUÇÃO
Nos últimos anos presenciamos o surgimento de diversos dispositivos tecnológicos. Afim de executar suas tarefas ou para seu entretenimento, as pessoas, agora, têm uma ampla variedade de dispositivos dos mais diversos tipos (celulares, smartphones, PDAs, laptops ou notebooks, desktops, etc.). Devido a isto, existe uma demanda de desenvolvimento de uma mesma aplicação para essas múltiplas plataformas. Desenvolver sistemas interativos para múltiplas plataformas (SIMP) é um grande desafio devido à variedade dos elementos de hardware e de software que estão envolvidos. Exemplos comuns nos dias atuais são as versões dos sistemas bancários para terminal de auto-atendimento (usando PC), para a Web, e para um dispositivo móvel Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. Interaction 09 South America. Copyright 2009...$5.00.
Carlos Silva1
brenokcc@yahoo.com.br
Jair Leite1
jair@dimap.ufrn.br
3
Instituto Federal do Rio Grande do Norte Campus Central, Natal, RN, Brasil
(celular ou Iphone). Outros exemplos são os serviços das empresas Yahoo e Google que oferecem conteúdos (notícias, email, mapas e outros) que podem ser acessados em diferentes dispositivos. Um dos aspectos mais afetados quando um sistema precisa executar em diferentes plataformas é a interface de usuário (IU). Os elementos de hardware da IU tais como a tela, o teclado e o apontador, por exemplo, podem variar bastante de um tipo de computador para outro, especialmente em dispositivos móveis. Além disso, o software necessário para construir os elementos visuais da IU, tais como botões, menus, caixas de texto e vários outros, utilizam pacotes (API e frameworks) que são específicos de cada plataforma. Durante a década de 1990, diversos ambientes foram criados para auxiliar os designers no desenvolvimento de IUs. Conhecidos como Ambientes de Desenvolvimento de Interfaces de Usuário Baseado em Modelos (MBUIDE – Model-based User Interface Development Environments) permitiam que os designers produzissem suas interfaces através do uso de modelos declarativos [25]. Estes modelos descrevem aspectos relacionados com a interação do usuário com o sistema; modelos de tarefas, modelos de diálogo, modelos de apresentação são exemplos utilizados nestes ambientes. Alguns desses ambientes permitiam a geração automática do código fonte da IU tendo como base os modelos gerados, transformando-os em protótipos de IU com código para alguma linguagem, como JAVA [11] e C++ [29], por exemplo. Com a demanda de desenvolvimento de aplicações para múltiplas plataformas, o MBUIDE passou a ser utilizado na geração de interfaces para diferentes plataformas a partir de modelos definidos em linguagens de descrição de interface de usuário (LDIU). Um problema encontrado com o uso destas estratégias é que o foco estava apenas na geração da IU, ou seja, as estratégias resolviam o problema de como gerar diferentes interfaces de usuário para diferentes aplicações, mas não mostravam como elas poderiam ser integradas com o restante da aplicação (a lógica de negócio ou núcleo da aplicação). Além disso, não existia uma padronização no uso de modelos e linguagens utilizadas, ou seja, as ferramentas utilizavam metodologias proprietárias.
26
No início dos anos 2000, a OMG estabeleceu o padrão MDA (Model-Driven Architecture), onde especificações das aplicações são descritas na forma de modelos independentes de plataforma e são mapeadas ou transformadas em outros modelos (até mesmo código) específicos de plataforma [14]. Essa abordagem permite especificar um sistema independentemente da plataforma de execução; especificar e escolher uma plataforma específica para a sua execução e transformar a anterior nesta última utilizando modelos e ferramentas padronizadas [21]. No entanto, esta estratégia tem sido pouco aplicada no desenvolvimento de interfaces de usuário para diferentes plataformas. Este artigo descreve um trabalho exploratório para verificar a viabilidade de utilizar a estratégia de desenvolvimento baseado em modelos de IU com os métodos e tecnologias da MDA. Mais especificamente, vamos utilizar as tecnologias de MDA com os modelos da linguagem IMML (Interactive Message Modeling Language). Este estudo foi motivado por diversos aspectos, entre eles, verificar se os modelos existentes da IMML, já utilizados no desenvolvimento de algumas aplicações [5, 6, 7] poderiam ser utilizados com as tecnologias MDA para a geração automática de interfaces de usuário. Como MDA já é uma estratégia amplamente aceita e por existir várias tecnologias bem sucedidas para a sua implementação, queríamos verificar se os modelos da IMML poderiam ser construídos com as ferramentas existentes. Com isto, posteriormente, poderemos desenvolver um SIMP completo, integrando a interface de usuário com o núcleo da aplicação. Para atingir o objetivo proposto neste trabalho realizamos um experimento de geração de interfaces de usuário para duas diferentes plataformas a partir da especificação de modelos abstratos. Neste experimento, utilizamos ferramentas baseadas em MDA para implementar os metamodelos definidos para a IMML e definir regras de transformações para a geração das interfaces em diferentes plataformas de software. Um estudo de caso com a construção de uma aplicação simples é apresentado e os resultados mostram que é possível especificar abstratamente uma interface de usuário seguindo os modelos da IMML e gerar uma interface de usuário gráfica (GUI) com Java Swing e uma interface de usuário Web (WUI) em HTML. Algumas limitações foram identificadas e permitirão ajustes nos projetos que darão continuidade a este trabalho. Este artigo está estruturado da seguinte forma: a seção seguinte caracteriza com mais detalhes o problema do desenvolvimento de sistemas interativos para múltiplas plataformas. A seção 3 apresenta as duas correntes de trabalhos que apresentaram propostas para o desenvolvimento baseado em modelos. Na seção 4 descrevemos como é feita a integração dos modelos da IMML com as tecnologias MDA e apresentamos um exemplo de desenvolvimento de uma pequena aplicação. Ao final apresentamos as conclusões do trabalho e indicamos os próximos passos de nosso projeto.
SISTEMAS INTERATIVOS PLATAFORMAS
PARA
MÚLTIPLAS
O contexto operacional de um sistema interativo pode ser caracterizado por três elementos [3]: usuário, que representa o estereótipo dos usuários do sistema; plataforma, que é o dispositivo computacional (hardware e software) usado pelos usuários para interagir com o sistema; ambiente, que é local físico onde as interações ocorrem, envolvendo qualquer fator que possa influenciar o comportamento do sistema e/ou dos usuários. Neste trabalho, o nosso foco está nos sistemas que podem funcionar em múltiplas plataformas. A plataforma operacional de um sistema deve levar em consideração os elementos de hardware e de software. O conceito de sistema multiplataforma é bastante abrangente e, por isso, difícil de ser caracterizado. Normalmente consideramos que um sistema é multiplataforma quando ocorrem variações nas situações em que o sistema deve funcionar, por exemplo, a variação pode ser no hardware - diferentes modelos de processadores, diferentes elementos de interface de usuário (tamanho de tela, tipo do teclado, modelo do apontador, etc.), diferentes tipos de computadores (desktop, notebook, tablet, smartphones, telefones móveis, etc.), ou no software, como em diferentes sistemas operacionais, diferentes linguagens de programação, APIs e bibliotecas dinâmicas. Várias soluções para o desenvolvimento de sistemas interativos para múltiplas plataformas já vêm sendo colocadas em prática pela indústria. Uma solução utilizada é desenvolver diferentes versões do mesmo sistema para as diferentes plataformas, contudo, esta solução apresenta alto custo, pois requer o conhecimento de cada uma das plataformas e maior tempo de desenvolvimento. Em muitos casos os diferentes sistemas são desenvolvidos por equipes distintas o que aumenta os custos e os problemas de compartilhamento de conhecimentos específicos entre elas. As combinações de variações de plataformas podem ser muitas e não é objetivo deste trabalho considerar todas elas, algumas possíveis combinações são: construir o software numa mesma linguagem que possa rodar em várias plataformas. Por exemplo, Java se propõe a permitir que você construa um sistema “uma vez e rode em qualquer lugar” [16], no entanto, esta solução garante apenas a portabilidade, ou seja, a capacidade da aplicação ser executada em diferentes sistemas operacionais e/ou processadores, bastando apenas a existência de uma máquina virtual capaz de executar os bytecodes Java. Esta solução não garante a adaptabilidade, ou seja, não considera as variações dos elementos de IU a serem executados em diferentes tamanhos de telas e/ou o uso de diferentes tipos de apontadores. Outra estratégia que viabiliza a portabilidade de um sistema para múltiplas plataformas é o uso de tecnologias Web que permitem que os sistemas possam ser utilizados por diferentes usuários a partir de seus próprios computadores desde que estejam ligados à Web e possuam um navegador. Nesta estratégia, apenas a interface de usuário do sistema precisa ter portabilidade
27
para os diferentes computadores clientes, enquanto que a funcionalidade do sistema roda em um mesmo servidor (ou conjuntos de servidores integrados). Para que a interface de usuário rode em diferentes plataformas ela precisa ser desenvolvida para rodar em um navegador (Web-based-UI ou WUI). Esta solução é bastante versátil, uma vez que o modelo das WUI é bastante simples e fácil de adaptar, mesmo assim, muitas vezes é importante adaptar a interface para os diferentes tipos de tamanho de tela, teclado e apontador. Os desafios para o desenvolvimento de sistema, como o caso das agências bancárias que precisam rodar, necessariamente, num terminal de auto-atendimento, na Internet, Iphone e celular, requerem um esforço de desenvolvimento bastante alto. Para esta situação, as soluções acima (com tecnologias Java ou Web) não resolvem o problema por completo, pois para cada plataforma de hardware deve existir um modelo de design de interface diferente. Desta forma, uma estratégia de desenvolvimento mais interessante precisa ser aplicada. Estratégias utilizando modelos abstratos que são refinados até a geração de sistemas em suas tecnologias e propriedades específicas de plataformas têm sido propostas e adotadas na indústria. Nas próximas seções, vamos discutir as limitações das abordagens tradicionais de desenvolvimento de IU baseado em modelos e das abordagens de MDA para os problemas descritos acima.
modelo de tarefas, modelo de domínio, modelo de usuário, modelo de apresentação e modelo de diálogo. O desenvolvimento de interfaces baseado em modelos é classificado em duas gerações [25]: A primeira geração de MBUIDEs apareceu como uma evolução dos Sistemas de Gerenciamento de Interfaces Usuário (UIMS – User Interface Management Systems), propostos nos anos 1980. Estes sistemas foram desenvolvidos visando automatizar a construção da interface a partir de modelos representando-as de uma forma declarativa. Como exemplos da primeira geração de MBUIDEs [25] cita COUSIN, HUMANOID, MIKE, UIA e UOFA*, no entanto, essa primeira geração de MBUIDEs não fornecia um alto nível de abstração para a descrição da IU, por exemplo, os aspectos da IU, como layouts e widgets não eram definidos nos modelos. A segunda geração de MBUIDEs surgiu com a necessidade de fornecer novos mecanismos para descrever interfaces de usuário em um nível superior de abstração [25]. Exemplos citados desta segunda geração do MBUIDEs são ADEPT, AME, DIANE+, FUSE, ITS, GENIUS, JANUS, MASTERMIND, MECANO, TADEUS, TEALLACH, TRIDENT e UIDE. Com os MBUIDEs da segunda geração, os desenvolvedores eram capazes de especificar, gerar e executar interfaces de usuário para plataformas específicas. No trabalho de [25] foram apontadas três principais vantagens na utilização desses MBUIDEs:
Eles podem fornecer uma descrição mais abstrata da IU do que as descrições de IU fornecidas por outras ferramentas de desenvolvimento de IU;
Eles facilitam a criação de métodos para projetar e implementar IU de uma forma sistemática, uma vez que oferecem as possibilidades: (1) modelar IU utilizando diferentes níveis de abstração; (2) aperfeiçoar os modelos de forma incremental; e (3) re-utilizar as especificações de IU;
Eles fornecem a infra-estrutura necessária para automatizar tarefas relacionadas com o processo de concepção e implementação da IU.
TRABALHOS CORRELATOS
O problema de desenvolvimento para múltiplas plataformas vem sendo tratado por duas correntes de investigação independentes. A primeira delas é o desenvolvimento de interfaces de usuário baseado em modelos (MBUID) que utiliza linguagens e ferramentas criadas para apoiar efetivamente o desenvolvimento de interfaces de usuário multiplataformas. A segunda corrente compreende a aplicação da MDA com fundamentos e tecnologias padronizadas que dão suporte ao desenvolvimento baseado em modelos que permite gerar código para diferentes plataformas. Nas subseções, a seguir, relacionamos e descrevemos alguns trabalhos que fazem uso da abordagem MBUID e MDA para desenvolvimento de interface para múltiplas plataformas; conforme descrito a seguir, a MBUID limita-se ao desenvolvimento da interface de usuário, enquanto que a maioria dos trabalhos utilizando MDA não considera adequadamente a geração da interface de usuário. Desenvolvimento de UI Baseadas em Modelos
MBUIDE é definido como um ambiente de software que suporta o desenvolvimento de interfaces utilizando-se de vários modelos que guiam o processo [23]. Os modelos representam os aspectos relevantes associados a um sistema interativo em diferentes níveis de abstração, tais como os propostos no framework [24]. Neste framework estão previstos modelos de IU em cinco categorias:
Segundo [25], uma grande desvantagem dos MBUIDEs é a complexidade dos seus modelos e notações, que muitas vezes são difíceis de aprender e usar. Mesmo sendo apontada por Myers e outros [20] como uma proposta que não alcançou as expectativas geradas no seu surgimento, os autores reconhecem que o emergente paradigma da computação ubíqua produz novos desafios no desenvolvimento de interfaces multiplataformas e que estes podem ser resolvidos com abordagem utilizada pelos MBUIDEs e/ou técnicas correlatas. Isto tem se caracterizado cada vez mais nas pesquisas de soluções para o desenvolvimento de aplicações para este novo paradigma [22, 24, 3]. A aplicação das abordagens de MBUID para sistemas multiplataformas evoluiu com as linguagens de descrição
28
de interface de usuário (LDIU) em XML. As LDIUs, são linguagens de alto nível que possibilitam especificar as características de uma IU. Porém, tais linguagens enfrentam alguns problemas que já existiam antes com outras abordagens como os MBUIDEs. Apesar de descreverem IUs para múltiplas plataformas, trabalham com metodologias e ferramentas específicas, tendo somente algumas semelhanças quanto aos tipos de modelos que podem ser descritos, além disso, um dos principais problemas é que as ferramentas não são apenas difíceis de usar, como também geram, muitas vezes, IUs de baixa qualidade visual [27]. Como exemplos de LDIU pode-se destacar a UsiXML (USer Interface eXtensible Markup Language) [32] e a IMML (Interactive Message Modeling Languange) [15]. A UsiXML é uma linguagem de descrição de interfaces de usuário que utiliza vários níveis de abstrações, que permitem especificar múltiplos modelos envolvidos no projeto de uma interface de usuário como: tarefa, domínio, apresentação, diálogo e contexto de uso, o qual é decomposto em usuário, plataforma e ambiente. A IMML é uma LDIU fundamentada nas bases teóricas da Engenharia Semiótica [8], que possibilita descrever de forma abstrata a interface do usuário além de possibilitar o desenvolvimento da IU baseado em modelos. Um trabalho mais completo de análise de comparação de diversas LDIUs pode ser obtido em [27]. Abordagens MDA
A arquitetura dirigida por modelos (MDA) tem sido uma abordagem de desenvolvimento para sistemas multiplataformas utilizando um processo baseado em modelos. A abordagem MDA requer a construção de modelos mais abstratos e independentes de plataformas que são mapeados em modelos mais concretos, dependentes de plataformas e que possibilitam a geração do código do sistema. Para que o processo de transformação de modelos e geração de código possa ocorrer, cada modelo construído deve seguir um metamodelo correspondente. A transformação de um modelo mais abstrato em um mais concreto ocorre com base em regras de mapeamento definidas entre os metamodelos. Um processo MDA típico requer a definição de um modelo independente de computação (CIM – Computation Independent Model) que pode ser transformado em um modelo computacional independente de plataforma (PIM – Platform Independent Model), este último, por sua vez, é transformado em modelos específicos de plataformas (PSM – Platform Specific Model). Para cada plataforma alvo, um modelo precisa ser elaborado. Por fim, partir de cada PSM, regras de transformação permitem a geração de código para cada plataforma especifica. Apesar de MDA ter nascido para tratar de desenvolvimento de arquiteturas de múltiplas plataformas de middleware como EJB, CORBA e .Net, não está restrita apenas a este contexto. O nível de abstração do seu modelo independente de plataforma possibilita o uso de MDA em outros contextos/arquiteturas, como por exemplos: desenvolvimento de software para dispositivos
da indústria médica [18] e o desenvolvimento de sistemas de tempo real [13, 17]. No campo de IHC, é possível observar algumas propostas de desenvolvimento de interface para múltiplas plataformas utilizando a abordagem de MDA Em [30], é apresentado um modelo de interação em dois níveis: um nível abstrato que descreve a interação independentemente de aspectos de plataforma; e um nível concreto que define os detalhes de interação específicos de plataforma. Dois modelos são propostos para nível abstrato: o Modelo de Usuário e o Modelo de Interface Abstrato. O Modelo de Usuário é responsável por armazenar o conjunto de regras que especificam a forma de acesso de cada usuário ao sistema e cada usuário possui um mapa de interação que pode ser herdado de outro; já o Modelo de Interface Abstrata permite especificar um conjunto de componentes de interação que definem a interface do usuário; este modelo é composto de dois grupos: componentes básicos de interação (BICs Basic Interaction Components) e padrões de interação (IP - Interaction Patterns). Os BICs representam um conjunto mínimo de componentes (input, output, navigation, action e groups) necessários para uma interação, além de estarem associados com um elemento da especificação conceitual da aplicação (atributo, classe, serviço, etc.). Os IPs são responsáveis por representar/modelar uma solução genérica para interações complexas encontradas habitualmente. Os autores propõem dez padrões de interação: population, service, feedback, order, validation rule, enumeration, filter, object navigation, relationship navigation e service navigation. Apesar dos autores descreverem as necessidades e os desafios para a geração de interfaces multipltaforma, os resultados do trabalho em questão leva em consideração apenas interfaces para a plataforma PCDesktop usando GUI e Web. Em [12], é proposto um ambiente baseado em MDA para geração de uma aplicação completa JEE. O processo de geração da aplicação tem como PIM uma linguagem específica de domínio que a partir de transformações desse modelo são gerados os artefatos (interfaces, EJBs) PSM. Este trabalho não apresenta nenhum detalhe dos modelos abstratos nem um processo para geração dos códigos da aplicação. Os autores enfatizam que, embora seja trivial modelar componentes comuns de UI (janelas, ícones, menus) essa facilidade não se aplica quando da necessidade de modelar um design visual, tratamento de erros, entre outros aspectos. Os modelos devem comportar os objetos de estrutura e o comportamento de uma interface. Apesar de alguns trabalhos apresentarem MDA como forma de construir e manter sistemas de forma automática e com baixo custo, seus modelos requerem um considerável esforço para alcançar formas maduras de representar interfaces de usuário. Neste trabalho a geração de interfaces é realizada apenas para a plataforma PC-Desktop usando GUI (Swing). Outro trabalho baseado em MDA é o MANTRA [2] que tem como objetivo apoiar o desenvolvimento de múltiplas interfaces para uma aplicação e possui seus níveis de abstração similar ao CAMELEON framework [3]. O
29
fluxo de geração de interface do MANTRA parte de um modelo abstrato de interface (AUI) que após adaptadas às estruturas de diálogo e apresentação impostas pelos frontends das plataformas são transformados em modelos concretos de interface (CUI) para cada plataforma alvo. O MANTRA apresenta-se como uma das abordagens MBUID que procura apoiar-se nos padrões de tecnologia MDA para dar suporte ao desenvolvimento de interfaces para múltiplas plataformas. Entre os trabalhos citados nesta subseção o MANTRA é o único que leva em consideração três tipos diferentes de plataforma (GUI, Web e Mobile).
Para construir o sistema com MDA, os modelos CIM, PIM e PSM são construídos a partir de metamodelos que foram desenvolvidos a partir dos modelos existentes na IMML. Os metamodelos nos níveis CIM e PIM são elaborados baseados nos modelos de domínio e de interação da IMML e serão detalhados nas seções a seguir. Estes metamodelos são implementados utilizando no Ecore, subconjunto do MOF (Meta-Object Facility) que é implementado no EMF (Eclipse Modeling Framework) [28].
Limitações das abordagens
MBUID e MDA são abordagens de desenvolvimento baseadas em modelos. Os trabalhos que seguem MBIUD têm como uma de suas limitações o fato de estarem focados apenas no desenvolvimento da interface de usuário, sem determinar como ela pode ser integrada ao núcleo funcional da aplicação. Outra limitação é a falta de padronização e a diversidade de linguagens e modelos. Os trabalhos que utilizam as ferramentas e tecnologias padronizadas da MDA nem sempre oferecem um tratamento adequado ao desenvolvimento da interface de usuário. Modelos específicos de tarefas, interação e apresentação, comuns em processos centrados no usuário, e necessários ao desenvolvimento da interface de usuário não são utilizados na maioria dos trabalhos. APLICANDO MDA PARA SISTEMAS INTERATIVOS MULTIPLATAFORMAS
Nosso trabalho explora a introdução de modelos utilizados em processo centrados no usuário para o desenvolvimento de interfaces de usuário utilizando a abordagem MDA. Para estar em conformidade com a MDA, a nossa solução para o desenvolvimento de sistemas multiplataformas requer a construção de modelos abstratos (CIM e PIM) que possam ser transformados em modelos específicos de cada plataforma. Neste artigo, nossa investigação está limitada à geração de modelos específicos da interface de usuário em duas plataformas distintas para interfaces de usuário gráficas (GUI) e interfaces de usuário Web (WUI).
Para verificar a possibilidade de desenvolvimento de sistemas interativos multiplataforma com MDA, nós realizamos um estudo exploratório para a geração das interfaces gráficas nas duas plataformas, a partir de descrições com a IMML. A IMML é uma linguagem para a especificação de sistemas interativos que foi desenvolvida para o desenvolvimento baseado em modelos. Ela descreve o sistema utilizando 3 modelos: o modelo de domínio, o modelo de interação e o modelo de comunicação. Uma visão geral da arquitetura, incluindo as atividades e tecnologias empregadas neste trabalho, pode ser observada na figura 1. Nela podemos observar que, conforme abordagem MDA, cada modelo deve ser construído (ou gerado) com base em um metamodelo.
Figura 1: Arquitetura para geração de UI. Modelo de Domínio
Este modelo é responsável por representar a funcionalidade da aplicação, isto é, os requisitos funcionais. Por estar no nível mais abstrato, este modelo descreve quais as informações que serão manipuladas e quais os processos que as manipulam, através da interface. Assim, em conformidade com a abordagem MDA, o modelo de domínio da IMML é um modelo independente de computação (CIM). A figura 2 apresenta os elementos conceituais do modelo de domínio, bem como o relacionamento entre eles, caracterizando, portanto, seu metamodelo. Dentre os elementos do modelo de domínio, podemos descrever [15, 4]: domainObject: abstração para elementos do domínio como registro de bases de dados, arquivos, mensagens, ou qualquer outro tipo de informação manipulado pela aplicação. Um objeto de domínio possui no mínimo um nome e um tipo; domainFunction: abstração para os processos executados pela aplicação capazes de manipular os objetos de domínios, as propriedades essenciais são: operandos de entrada, operandos de saída, controles, estados inicial, de transição e final. Este modelo descreve a interatividade com a aplicação, ou seja, como os usuários deverão interagir com a interface para realizar suas tarefas utilizando a aplicação. As principais abstrações do modelo de interação descrevem as ações do usuário ao utilizar a interface para executar funções de domínios sobre objetos de domínio. Assim, em conformidade com a abordagem MDA, o modelo de interação da IMML equivale ao PIM. A figura 3 representa os elementos do modelo de interação, ou seja, seu metamodelo. A seguir, destacamos alguns dos conceitos-chaves deste modelo [15, 4]:
30
Figura 2: Metamodelo do modelo de domínio. Modelo de Interação
basicInteraction: este conceito representa as ações básicas do usuário sobre a interface.. No metamodelo estão definidas as seguintes interações básicas, enterInformation, activeControl, selectInformation, perceiveInformation; (digitar um texto ou número, selecionar um item de seleção ou ,clicar num botão e ler ou ouvir um item de informação. functionInteraction: define as interações básicas para comandar uma função de domínio, ou seja, as interações básicas necessárias para passar os parâmetros de entrada, ativar os controles e perceber os resultados de função associada;
structureInteraction: são operadores de agrupamento/organização temporal das interações básicas, para organizar as ações executadas pelo usuário. Os operadores definidos no metamodelo sao: select, para indicar interações exclusivas, onde somente uma pode ser executada; sequence, para indicar ordem seqüencial, devendo ser executadas na ordem estabelecida; combine, para indicar uma combinação das interações, por alguma dependência entre elas; repeat, para indicar a iteratividade das interações; e join, para indicar apenas uma associação espacial entre as interações. Transformações
Em MDA, as transformações são classificas em dois tipos: transformações de modelo para modelo (M2M) e transformações de modelo para texto (M2T). Nas transformações de modelo para modelo, tanto entrada quanto saída são modelos, devendo ambos estar conforme seus respectivos metamodelos. Já nas transformações de M2T, apenas a entrada é modelo, portanto, somente este deve ser conforme seu metamodelo. Este fato especializa o mecanismo de transformação, simplificando seu processo de validação de entrada e saída, apesar de não poder validar a saída, para fins de efetiva produção de código, deverá ser conforme a sintaxe da linguagem empregada.
Figura 3: Metamodelo de modelo de interação.
Em nossa proposta, as transformações M2M são realizadas pela ferramenta QVT Operational. Foram definidas regras de transformações entre os seguintes modelos: Modelo de domínio para modelo de interação: estas regras de transformação são capazes de, a partir de elementos do modelo de domínio gerar elementos do modelo de interação; Modelo de interação para modelo Java Swing: com as regras de transformação capazes de, a partir de elementos do modelo de interação gerar elementos do modelo de uma GUI em Java swing; Modelo de interação para modelo HTML: com as regras de transformação capazes de, a partir de elementos do modelo de interação gerar elementos do modelo de uma WUI em HTML; Depois de produzidos todos os modelos (manualmente ou usando transformações M2M) do nível PSM, são executas as transformações M2T para geração do código correspondente para Swing e HTML, que permitirão a execução das interfaces. Para isso, nossa proposta utilizou-se da ferramenta Acceleo [19], onde as regras de transformações são baseadas em templates. Foram construídos dois template; um para a produção do código final da interface utilizando o toolkit Swing, da linguagem Java; e outro para produção do código final da interface utilizando a linguagem HTML; Tecnologias utilizadas
Este trabalho foi desenvolvido com completo suporte computacional, através de ferramentas para modelagem e automatização dos processos de transformações. Todo esse suporte ferramental foi desenvolvido através do uso de outras ferramentas voltadas ao desenvolvimento dirigido por modelos. Estas tecnologias são, resumidamente, descritas a seguir:
31
Eclipse Galileo1: A plataforma Eclipse fornece serviços sobre os quais é possível criar, por exemplo, plugins. Tais plugins podem ser carregados, integrados e executados dentro do próprio ambiente, sendo o principal objetivo da plataforma, permitir que desenvolvedores possam criar e fornecer, facilmente, ferramentas integradas. Eclipse Modeling Framework2: Utilizado para criação dos metamodelos, através do Ecore, implementação de um subconjunto do MOF (Meta-Object Facility), com ferramentas de edição dos metamodelos e criação automática de plugins para editação de modelos a partir dos metamodelos criados.
Figura 4: Domain Model.
QVT (Query/View/Transformation): Linguagem padrão da OMG para expressar consultas, visões e transformações sobre modelos baseados no MOF. O Query determina a seleção de elementos específicos de um modelo já existente; a View realiza a projeção de um metamodelo a partir de consultas a um modelo já existente; e a Transformation recebe um modelo como entrada e atualiza ou gera um novo modelo como saída [9]. Acceleo3: O Projeto Acceleo é um componente open source completamente integrado ao Eclipse Modeling Framework, originado no projeto Eclipse M2T (Model to Text), destinado às transformações de modelo para texto, definidas pelo padrão OMG para modelos MOF. Estudo de Caso
Como forma de validar a proposta de desenvolvimento dirigido a modelos apresentada, foi realizada a modelagem de uma aplicação interativa de um tradutor de palavras. A aplicação tem como função traduzir um termo escrito numa linguagem de origem, para um termo escrito numa linguagem alvo. Conforme arquitetura (figura 1) desta proposta, o desenvolvimento da aplicação começa pela modelagem do domínio da aplicação. Este modelo é composto pelos objetos de domínio sourceLanguage, sourceTerm, targetLanguage e targetTerm que serão manipulados pela função de domínio Translate. Onde sourceLanguage, sourceTerm, targetLanguage são operandos de entrada e sourceTerm é operando de saída (figura 4). A aplicação do modelo de transformação (domain2interaction) produz o modelo de interação (figura 5). Esse modelo descreve como o usuário interage com o sistema para realizar a tarefa de tradução de termos. Baseados no modelo de transformação são gerados um conjunto de componentes para o modelo de interação. 1
http://www.eclipse.org/galileo
2
http://www.eclipse.org/modeling/emf
3
http://www.acceleo.org
Figura 5: Interaction Model.
A passagem do modelo independente de plataforma (Interaction Model) para modelos específicos (HTML e SWING) é realizada pela aplicação das regras de transformação. As figuras 6 e 7 representam respectivamente os modelos SWING e HTML gerados a partir do modelo de interação.. Após a realização das transformações do modelo de interação (PIM) para os modelos das interfaces em HTML e Java Swing (modelos PSM), o próximo passo é a transformação para o código correspondente a cada plataforma. A partir da aplicação das regras de transformação M2T, são produzidas as interfaces concretas como pode ser visto nas figuras 8 e 9. A abordagem MDA, juntamente com as ferramentas da plataforma Eclipse possibilitaram que, a partir dos modelos abstratos baseados na IMML, fossem produzidas interfaces concretas para o protótipo do tradutor de palavras. CONCLUSÃO
Este trabalho apresentou uma proposta para desenvolvimento de interface para múltiplas plataformas baseada em modelos. Mostramos que nosso processo de desenvolvimento está em consonância com os padrões MDA. Alem disso, nosso trabalho segue uma tendência da comunidade de pesquisadores em migrar antigas soluções de MBUID para essa abordagem [31, 2]. A linguagem IMML mostrou-se adequada pois possui os elementos abstratos de um interação que puderam ser
32
mapeados nos modelos concretos. Especificamente nesta proposta, foram empregados apenas dois dos três modelos da IMML: modelo de domínio e modelo de interação, usados para representar respectivamente os níveis CIM e PIM. Para a adequação dos modelos da IMML à abordagem MDA foram necessários alguns ajustes. Um deles foi a separação entre modelo de domínio e modelo de interação, pois originalmente, estes modelos eram interligados relacionando diretamente comandos de função e de interação funcional. A interação funcional foi, também, resultado da fusão dos conceitos de comando de função e resultado de função [15] criando o conceito de função de interação que é um conjunto de interações básicas executadas pelo usuário para realizar uma função de domínio.
Figura 8 – Interface Swing.
Figura 9 – Interface HTML.
Figura 6: Modelo Swing.
Como contribuições deste trabalho podemos citar a definição dos metamodelos para Java Swing e HTML que podem ser reutilizados no desenvolvimento de GUI e WUI para várias aplicações. Os metamodelos abstratos de domínio e de interação baseados na IMML, bem como as regras de transformação, foram definidos e puderam ser utilizados para experimentos onde verificamos os potenciais e limitações. O trabalho também propiciou, para os envolvidos, uma reflexão sobre o processo que poderá ser aperfeiçoada em etapas seguintes. Como trabalhos futuros, estão previstos o amadurecimento do processo de desenvolvimento de interfaces para múltiplas plataformas acrescentando os conceitos do modelo de comunicação da IMML, bem como o desenvolvimento de uma ferramenta visual para oferecer suporte ao designer no processo de modelagem e geração de UI. Outro trabalho será avaliar de forma qualitativa se o desenvolvimento de interfaces dirigido a modelos usando MDA traz a diminuição do esforço de desenvolvimento e problemas de inconsistência entre design e código.
Figura 7: Modelo HTML.
REFERÊNCIAS
1.
Azevedo, P., Merrick, R. e Roberts, D. “OVID to AUIML - User-Oriented Interface Modelling”.
33
TUPIS'2000, Towards a UML Profile for Interactive Systems Development. York, UK, 2000. 2.
3.
4.
Botterweck, G. A Model-Driven Approach to the Engineering of Multiple User Interfaces.MoDELS 2006 Workshops, LNCS 4364, pp. 106-115. Springer-Verlag Berlin Heidelberg, 2007. Calvary, G., Coutaz, J., Thevenin, D., Limbourg, Q., Bouillon, L. and Vanderdonckt, J. A unifying reference framework for multi-target user interfaces. Interacting with Computers, 15(1):289–308, 2003. Costa Neto, M. A. e Leite, J.C. Usando a IMML no Desenvolvimento de Interfaces de Usuário para Múltiplas Plataformas. Em Anais do Simpósio Brasileiro sobre Fatores Humanos em Sistemas Computacionais (IHC’2006), Natal, RN, 2006.
5.
Costa Neto, M. A. Uma extensão da IMML para apoiar o desing de interfaces de usuário multiplataforma. Dissertação (Mestrado em Sistemas e Computação) - Universidade Federal do Rio Grande do Norte, 2005.
6.
de Sousa e Silva, S. F. BRIDGE: Uma Ferramenta para Design de Interfaces de Usuário Baseada em Especificações IMML. Dissertação (Mestrado em Sistemas e Computação) - Universidade Federal do Rio Grande do Norte, 2007.
7.
8. 9.
de Sousa, L. G. Geração de Interfaces de Usuário de Sistemas Web para Múltiplos Dispositivos com o Uso de Componentes de IU. Dissertação (Mestrado em Sistemas e Computação) - Universidade Federal do Rio Grande do Norte, 2007. de Souza, C. S. The semiotic engineering of user interface languages. International Journal of Manmachine Studies, 39(5):753–773, 1993. Dvorak, R. Model transformation with operational qvt. In EclipseCon(2008), Borland Software Corporation, 2008.
10. Eisenstein, J., Vanderdonckt, J., and Puerta, A. R. Applying model-based techniques to the development of uis for mobile computers. In Proceedings of the 6th international conference on Intelligent user interfaces, pages 69–76. ACM Press, 2001. 11. Griffiths, T., Barclay, P., McKirdy, J., Paton, N., Gray, P., Kennedy, J., Cooper, R., Goble, C., West, A. e Smyth, M. Teallach: A Model-Based User Interface Development Environment for Object Databases. In Proceedings of UIDIS'99, pages 86-96, Edinburgh, UK. IEEE Press, 1999. 12. Jespersen, J. W, and Linvald, J. Investigating User Interface Engineering in the Model Driven ICSE'03. Architecture. http://www.sehci.org/bridging/interact/Jespersen.pdf, 2003. 13. Khan, M.U., Geihs, K., Gutbrodt, F., Gohner, P., and Trauter, Roland. Model-Driven Development of Real-Time Systems with UML 2.0 and C. Proceedings of the Fourth Workshop on ModelBased Development of Computer-Based Systems
and Third International Workshop on Model-Based Methodologies for Pervasive and Embedded Software (MBD-MOMPES '06). pages 33–42. IEEE Computer Society, 2006. 14. Kleppe, A., Warmer, J., and Bast, W. MDA Explained: The Model Driven Architecture: Practice and Promise. Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA, 2003. 15. Leite, J. C. Specifying the user interface as an interactive message. In Proceedings of HumanComputer Interaction International (HCII’2003), volume 2, pages 716–720, Heraklion, Creta. Lawrence Erlbaum Associates, 2003. 16. Lindholm, T. and Yellin, F. The Java (TM) Virtual Machine Specification. Sun Microsystems Inc., 1996 17. Lu, S.,Halang, Wolfgang A., and Zhang, L. A Component-Based UML Profile to Model Embedded Real-Time Systems Designed by the MDA Approach. Proceedings of the 11th IEEE International Conference on Embedded and RealTime Computing Systems and Applications (TCSA '05). pages 563–566. IEEE Computer Society, 2005. 18. Mashariki, A.R., Bronner, L.R., and Kazanzides, P. Designing and Developing Medical Device Software Systems Using the Model Driven Architecture (MDA). High Confidence Medical Devices, Software, and Systems and Medical Device Plugand-Play Interoperability. pages 156-159. IEEE 2007. 19. Musset, J., Juliot, E., and Lacrampe, S. Acceleo User Guide. http://www.acceleo.org/doc/obeo/en/acceleo2.6-user-guide.pdf, 2008. 20. Myers, B., Hudson, S. E. and Pausch, R.. Past, present, and future of user interface software tools. ACM Trans. Comput.-Hum. Interact., 7(1):3–28, 2000. 21. Object Management Group http://www.omg.org/mda/, July,2009.
-
OMG.
22. Paterno, F. and Santoro, C. One model, many interfaces. In C. Kolski and J. Vanderdonckt, editors, Proceedings of the 4th International Conference on Computer-Aided Design of User Interfaces (CADUI’2002), volume 3. Kluwer Academic, 2002. 23. Puerta, A. R. A model-based interface development environment. IEEE Software, 14(4):40–47, July 1997. 24. Puerta, A. R. and Eisenstein, J. Towards a general computational framework for model-based interface development systems. In Proceedings of the 4th international conference on Intelligent user interfaces, pages 171–178. ACM Press, 1999. 25. Silva, P.P. User Interface Declarative Models and Development Environments: A Survey. Departament of computer Science, Universaty of Manchester, UK, 2000.
34
26. Soley, R., and THE OMG STAFF STRATEGY GROUP. Model driven architecture. DisponĂvel em: ftp://ftp.omg.org/pub/docs/omg/00-11-05.pdf, 2000. 27. Souchon , N. and Vanderdonckt, J. A review of XML-compliant user interface description languages. In Proceedings of DSV-IS 2003, pages 377--391. Springer-Verlag, 2003. 28. Steinberg, D., Budinsky, F., Paternostro, M., and Merks, E. EMF: Eclipse Modeling Framework, 2nd ed. Eclipse S eries. Addison-Wesley Professional, December 2008. 29. Szekely, P., Sukaviriya, P., Castells, P., Muthukumarasamy, J. e Salcher, E. Declarative Interface Models for User Interface Construction Tools: the MASTERMIND Approach. In Engineering for Human-Computer Interaction, pages 120{150, London, UK. Chapman & Hall, 1996. 30. Valverde, F., Panach, I., and Pastor, O. An abstract interaction model for a MDA software production
method. In Tutorials, Posters, Panels and industrial Contributions At the 26th international Conference on Conceptual Modeling - Volume 83 (Auckland, New Zealand, November 01 - 01, 2007). J. Grundy, S. Hartmann, A. H. Laender, L. Maciaszek, and J. F. Roddick, Eds. ACM International Conference Proceeding Series, vol. 334. Australian Computer Society, Darlinghurst, Australia, 109-114. 31. Vanderdonckt, J. A. MDA-Compliant Environment for Developing User Interfaces of Information Systems. In Proc. of 17th Conf. on Advanced Information Systems Engineering CAiSE'05 (Porto, 13-17 June 2005). LNCS, Vol. 3520, SpringerVerlag, Berlin, 16–31, 2005. 32. Vanderdonckt, J., Limbourg, Q., Michotte, B., Bouillon, L., Trevisan, D., Florins, M. "USIXML: a User Interface Description Language for Specifying Multimodal User Interfaces." W3C Workshop on Multimodal Interaction. Sophia Antipolis, 19-20 July 2004.
The columns on the last page should be of approximately equal length.
35
A percepção das tecnologias Érico Fernandes Fileno Designer de Interação, Mestre em Cultura Digital C.E.S.A.R. – efileno@gmail.com RESUMO
Este artigo apresenta a conceituação do homo faber e mostra como ocorre a mediação dos artefatos interativos no mundo contemporâneo, através de uma abordagem do design de interação, pela ótica do design emocional de Donald Norman, estudado em seus três níveis de processamento do cérebro: visceral, comportamental e reflexivo. Palavras Chave
Design de Interação, Design Emocional, Mediação, IHC. ABSTRACT
This article presents the concept of homo faber and shows like the mediation of interactive artifacts in the contemporary world, through an approach to the interaction design, by the point of view of emotional design by Donald Norman, studied in its three levels of the human brain processing: visceral , behavioral and reflective. Keywords
Interaction Design, Emocional Design, Mediation ACM Classification Keywords
H5.m. Information interfaces and presentation (e.g., HCI): Miscellaneous. INTRODUÇÃO O período conhecido como Revolução Industrial, trouxe novas máquinas (tecnologias) e com elas a produção em massa, que exigia o desenvolvimento de tarefas antes executadas manualmente, agora mecanicamente. Além disso, nesse novo contexto econômico surgem as fábricas, locais onde vários e diferentes trabalhadores se agrupavam para desenvolver um mesmo produto. Para maior controle desses trabalhadores institui-se um acompanhamento das atividades por meio de relógios-pontos que vieram otimizar o tempo de produção, na tentativa de baratear o custo dos produtos (TOFFLER, 2001).
Paralelo a divisão dos modos de produção, pode-se trazer as questões sociais. A relação de comportamento social que se desenvolve a partir de cada modo de produção, cria uma característica para cada sistema produtivo. A relação de comportamento social e desenvolvimento do sistema produtivo estão interligados, na medida em que eles interagem entre si e se modificam mutuamente. CASTELLS (1999) afirma que os “modos de desenvolvimento modelam toda a esfera de comportamento social, inclusive a comunicação simbólica” (CASTELLS, 1999, p. 35). Para esse autor comunicação simbólica consiste em processos culturais de comunicação e que, uma vez sendo a comunicação baseada em sinais, não há separação entre realidade e representação simbólica da escrita ou fala. Nesse ponto é importante listar os três modos de desenvolvimento citados pelo autor: a) Agrário: relacionado à quantidade de mão-de-obra e de recursos naturais disponíveis; pode ser percebido na história das sociedades humanas desde alguns séculos antes da era cristã. b) Industrialismo: referente ao estreitamento da relação entre geração de energia (vapor, óleo, etc.), produção e distribuição de mercadorias; modo de desenvolvimento típico do mundo pós-revolução industrial. c) Informacionalismo: vinculado ao processo de geração de conhecimentos, processamento de informações e à comunicação de símbolos, presente nas sociedades de forma mais intensa e cotidiana desde o último quarto do século XX. Todas as mudanças ocorridas nos modos de produção e de desenvolvimento, afetaram profundamente a sociedade. Mudando a forma de interagir socialmente com os bens e serviços ofertados. A própria educação, que faz parte do contexto social se adequa às concepções paradigmáticas criadas por cada modo de desenvolvimento. A sociedade como um todo também vem sofrendo sérias transformações, inclusive no campo tecnológico (CASTELLS, 1999). Para CASTELLS (1999, p.34) tecnologia é o “uso de conhecimentos científicos para especificar as vias de se fazerem as coisas de uma maneira que possa ser reproduzido”. BRITO e PURIFICAÇÃO (2006, p.18) continuam na mesma linha de CASTELLS (1999) e conceituam tecnologia como “um conjunto de conhecimentos especializados, com princípios científicos que se aplicam a um determinado ramo de atividade, modificando, melhorando, aprimorando os produtos oriundos do processo de interação dos seres humanos com a
36
natureza e destes entre si”. Para TAJRA (2001, p. 47) “o termo tecnologia vai muito além de meros equipamentos. Ela permeia em toda a nossa vida, inclusive em questões não tangíveis”. As tecnologias podem ser classificadas em três grupos, segundo SANCHO (2001), TARJA (2001) e BRITO; PURIFICAÇÃO (2006): a) tecnologias físicas: são as inovações de instrumentos físicos, tais como: caneta esferográfica, livro, telefone, aparelho celular, satélites, computadores; b) tecnologias organizadoras: são as formas de como nos relacionamos com o mundo e como os diversos sistemas produtivos estão organizados, tais como: sistema de produção enxuto, just-in-time. c) tecnologias simbólicas: estão relacionadas com a forma de comunicação entre as pessoas, desde o modo como estão estruturados os idiomas escritos e falados até como as pessoas se comunicam. O desenvolvimento tecnológico avança em progressão geométrica; temos à disposição técnicas jamais pensadas há 10 ou 20 anos atrás; a tecnologia tornou-se o eixo da economia. Entretanto, ela tem contribuído pouco para o desenvolvimento social, provocando, em alguns casos, retrocessos. Isso acontece porque a tecnologia, freqüentemente, é implementada sem considerar a situação política, cultural e econômica na qual será inserida. O objetivo é maximizar a adoção e não a apropriação simples das tecnologias. A tecnologia contribui para o desenvolvimento social quando esta se torna um meio para estender a capacidade de ação dos sujeitos, ou seja, para ampliar sua liberdade. Domínio, na visão de compreensão, sobre a tecnologia é precondição para usufruir de seus benefícios. E para utilizála, o ser humano precisa saber do seu funcionamento e de sua construção. Segundo ARENDT (1995), “o homo faber o ser humano que maneja a técnica - nasce com o homo sapiens - o ser humano dotado de inteligência”. HOMO FABER Hannah Arendt em seu livro “A condição humana” reflete principalmente sobre “pensar o que fazemos”. E sobre esse fazer humano ela designa com a expressão vita activa as atividades: trabalho (labor), obra (work) e ação (action). Pode-se compreender a expressão vita activa como a atividade política de interação social entre os seres humanos, em contraposição a atividade contemplativa. A intenção da autora em seu livro foi esclarecer as estruturas que condicionam a experiência humana ou as constantes desta experiência real. O caminho escolhido foi o de investigar o sentido e os modos de atividades humanas e suas respectivas dignidades.
Para ARENDT (1995), o homo laber, “o fabricador de objetos rompe com o anonimato onde estava imerso como simples ‘animal trabalhador’ (animal laborans)”. Enquanto o trabalho humano é uma atividade sem fim, repetitivo e que corresponde ao próprio processo biológico do corpo humano, a obra ou fabricação tem um começo e um final determinado, termina com um resultado tangível, durável: o objeto de uso. A autora prossegue dizendo que “este objeto fabricado pelo ser humano resultou da intervenção do mesmo na natureza e conseqüente violência sobre ela; assim, ele produziu ‘artificialmente’ um artefato”. A fabricação (a obra) é a própria transformação da natureza pelo homem e sua condição é a mundanidade. Ao agir de forma violenta perante a natureza o ser humano constrói um mundo de objetos. Pela obra o ser humano fabrica objetos de uso e não de simples consumo. O domínio da obra é o domínio da artificialidade. Segundo ARENDT (1995, p.152), o ser humano “inaugura sua identidade humana ao construir um mundo humano, resultado do ato de fabricar objetos de uso dotados de certa durabilidade”. A durabilidade das coisas do mundo define a objetividade dos artefatos. ARENDT (1995, p.166), continua em seu texto tratando dos artefatos, dos utensílios "e instrumentos do homo faber, dos quais advém a experiência fundamental da noção de instrumentalidade, determinam toda obra e toda fabricação". Enquanto homo faber, o ser humano instrumentaliza e constrói um mundo de coisas-utensílios. Ele emprega todas as coisas como instrumentos mediadores; isso acarreta um rebaixamento das coisas à categoria de meios e perdem seu valor em si (seu significado); ou então, seu significado é definido pela serventia ou utilidade. É pela atividade da obra ou da fabricação que o ser humano tece o mundo nãonatural dando formas às coisas, e quando feitas ou prontas essas coisas fabricadas tornam-se novos condicionantes para ele próprio. Na fabricação, atividade que já caracteriza a humanização, intervém o projeto onde se revelam as articulações dos meios para os fins almejados, podendo ser entendido como um processo mediado no conceito segundo VYGOTSKY (1998). Para VYGOTSKY (1998), mediação “é o processo de intervenção de um elemento intermediário em uma relação; a relação deixa, então de ser direta e passa a ser mediada por esse elemento. A mediação é um processo essencial para tornar possível, atividades psicológicas voluntárias, intencionais, controladas pelo próprio indivíduo”. É através do processo de mediação que o indivíduo se relaciona com o seu meio social e, é relevante observar que, através da mediação é que os seres humanos têm possibilidades de desenvolverem suas funções biopsicossociais.
37
R
S X
Figura 1 – Processo de Estímulo e Resposta, onde: S = Estímulo, R = Resposta e X = elo mediado. (VYGOTSKY, 1998)
No processo apresentado na imagem anterior, o impulso direto para reagir é inibido, e é incorporado um estímulo auxiliar que facilita a complementação da operação por meios indiretos. VYGOTSKY (1998) trabalha com a noção de que a relação do ser humano com o meio não é uma relação direta, mas uma relação mediada simbolicamente. Aqui pode-se fazer uma correlação com o conceito visto de artificialidade de ARENDT (1995). Prossegue VYGOTSKY (1998) escrevendo que “há dois tipos de elementos mediadores: os instrumentos (ou ferramentas) e os signos (ou linguagens)”. E ambos estão presentes no processo cultural de intervenção do ser humano e transformação da natureza, na busca em produzir artificialmente um artefato. TRANSFORMAR ARTEFATOS EM OBJETOS
quer sejam conscientes ou inconscientes”. Da mesma forma que as emoções são básicas para o comportamento humano e para o processo cognitivo, também são fundamentais para máquinas inteligentes, como um artefato robotizado, que pode ser utilizado para mediar alguma ação humana, por exemplo. Segundo NORMAN (2008, p.38), as emoções “mudam a maneira como a mente humana soluciona problemas”, ou seja, “o sistema emocional muda a maneira como o sistema cognitivo opera”. Esse estudo serve para justificar porque objetos atraentes funcionam melhor e porque nos sentimos atraídos por certos objetos. Forma, função e usabilidade causam grande impacto sobre nós. Conforme NORMAN (2008) “é uma relação direta entre estética e facilidade de uso do objeto”. A explicação segundo o pesquisador é que o sistema afetivo e emocional também controla os músculos do corpo e através de neurotransmissores químicos, muda a maneira como o cérebro funciona, alterando as configurações de conexões cerebrais. Essa pesquisa foi importante, pois com a publicação de seu livro Design Emocional, NORMAN (2008) apresentou os três níveis de estrutura do cérebro (ou processamento cerebral) e os relacionou ao estudo do design.
Os artefatos, construídos artificialmente, se transformam em objetos apropriados ao uso do ser humano, quando damos valores a eles.
TRÊS NÍVEIS DE ESTRUTURA DO CÉREBRO E O DESIGN (DE INTERAÇÃO)
Segundo NORMAN (2008), “além de forma física e funções mecânicas, os objetos assumem forma social e funções simbólicas. Os designers voltam sua atenção para as pessoas e o modo como elas interpretam e interagem com o meio físico e social. E passam a projetar com foco na emoção e com intenção de proporcionar experiências agradáveis”.
Os três níveis obtidos - resultado de tal pesquisa, refletem as origens biológicas do cérebro humano. A classificação de NORMAN (2008, p.41) é: • Nível visceral: camada automática e pré-programada. É o nível mais primitivo.
Donald Norman, um cientista cognitivo, atribuiu dois novos aspectos ao estudo dos atributos do design. Além de forma e função, encontra-se a usabilidade e a emoção.
• Nível comportamental: parte que contém os processos cerebrais que controlam o comportamento quotidiano. • Nível reflexivo: parte contemplativa do cérebro.
Conforme NORMAN (2008), usabilidade “descreve a facilidade com que o usuário do produto pode compreender como ele funciona e como fazê-lo funcionar”. E ainda especifica as metas decorrentes da experiência do usuário na utilização de tal artefato. Já emoção segundo ele, “é inseparável da cognição e modifica a percepção, o comportamento, os parâmetros de pensamento e a forma de interagirmos uns com os outros”. A emoção é elemento de análise quando amplia nossa atenção para o que sentimos quando usamos um produto. “É a experiência consciente do afeto, completa com a atribuição de sua causa e identificação do objeto” (NORMAN, 2008, p.31). Por afeto pode-se compreender, segundo o autor, como “um termo genérico que se aplica ao sistema de julgamentos,
Figura 2 – Três níveis de processamento (redesenhado de NORMAN, 2008, p.42)
cerebral.
38
Conforme o esquema acima pode-se perceber que apenas os níveis visceral e comportamental atuam e sofrem influências dos sistemas: sensorial (sentidos humanos) e motor. E percebe-se ainda que o nível reflexivo exerce controle sobre os outros dois níveis, gerando um fluxo de pensamento, contrário ao fluxo das percepções humanas. E como o design se interliga a tudo isso? A resposta vem quando se analisa o design pela ótica do estudo frente ao comportamento humano, quando contribui para a qualidade de vida, aumentando o bem-estar, a facilidade de uso e o desempenho dos artefatos criados pelo homo faber. O termo design, difundido das mais variadas formas, também é empregado para definir um novo campo de atuação para os profissionais que trabalham com novas tecnologias. Partindo do conceito que design é projeto, e não estilo ou decoração, o termo design de interação pode ser melhor compreendido como o desenvolvimento de projetos interativos. Segundo SAFFER (2007), “design de interação é a arte de facilitar ou fomentar interações entre humanos (ou seus agentes), mediadas por artefatos (produtos) e serviços”. Por interações ele quer dizer comunicação, tanto um-a-um (Ex: uma ligação telefônica comum), um-a-muitos (Ex: como os weblogs), quanto muitos-a-muitos (Ex: bolsa de valores). Os artefatos criados por designers de interação podem ser digitais ou analógicos, físicos ou abstratos, ou ainda uma combinação entre essas características. O design de interação se preocupa com o comportamento desses produtos, ou seja , como eles funcionam. Muito do tempo do designer de interação será usado na definição desses comportamentos, mas o designer não deve esquecer que o objetivo é facilitar a interação entre humanos. Para SAFFER (2007), “não é a interação com o artefato que importa - isso é assunto para projeto de produto -, ou ainda a interação com um computador - pois isso é interação serhumano-computador”. Para o autor, estamos tratando de conexões entre seres humanos.
Seguindo na análise de NORMAN (2008) a respeito dos três níveis de design emocional encontra-se: • Design visceral: traduz o que o ser humano sente e diz respeito ao impacto inicial de um produto, à sua aparência, toque e sensação. Por aspectos físicos entende-se bom desenho, limpeza, clareza nas formas e beleza estética. • Design comportamental: Traduz a funcionalidade e diz respeito ao uso e experiência com o produto em seus aspectos de estudo da função, usabilidade e desempenho de uso. • Design reflexivo: Traduz a significância do artefato e diz respeito a consciência e aos mais altos níveis de sentimento, emoções e cognição. É o mais vulnerável à mudança cultural, experiência do usuário, grau de instrução e diferenças individuais (biopsicossociais).
Figura 4 – Três níveis do design emocional. (adaptado de NORMAN, 2008, p.59)
Desta forma, pode-se utilizar dos três níveis apresentados como subsídio teórico para o desenvolvimento e a construção de experiências mais significativas para os usuários de produtos interativos; traduzidos na aparência, no prazer, na efetividade de uso e na satisfação pessoal na relação com os objetos – nos quais fazem parte do campo de estudo e atuação do design de interação. CONSIDERAÇÕES FINAIS Quando de forma violenta (ou não-natural), modificamos a natureza e construímos um artefato, estamos de alguma forma mediada nos relacionando com as tecnologias, seja por uma linguagem emocional, seja por uma instrumentação própria do design.
Figura 3 – Interação entre seres-humanos. (adaptado de SOUZA, 1995)
Este artigo procurou apresentar o design emocional, na visão de NORMAN (2008) como um possível ferramental teórico para o desenvolvimento de artefatos interativos para uso da humanidade. É o design de interação caminhando junto com o design emocional em uma relação direta com o IHC – Interação-Humano-Computador.
39
REFERÊNCIAS BIBLIOGRÁFICAS 1. BONSIEPE, Gui. Design: do material ao digital. Florianópolis: FIESC/IEL, 1997. 2. BRITO, Gláucia da Silva; PURIFICAÇÃO Ivonélia da. Educação, Professor e Novas Tecnologias: Em busca de uma conexão real. Curitiba: Editora Protexto, 2006. 3. CASTELLS, Manuel. A sociedade em rede (A era da informação: economia, sociedade e cultura, v.1). São Paulo, SP: Editora Paz e Terra, 1999. 4. __________. A galáxia da internet: reflexões sobre a internet, os negócios e a sociedade. Rio de Janeiro, RJ: Jorge Zahar Editor, 2003. 5. ARENDT, Hannah. A condição humana. Rio de Janeiro: Editora Forense Universitária, 1995. 6. JOHNSON, Steven. Cultura da interface: como o computador transforma nossa maneira de criar e comunicar. Rio de Janeiro: Jorge Zahar Ed., 2001. 7. LARAIA, Roque de Barros. Cultura: um conceito antropológico. Rio de Janeiro: Jorge Zahar Ed., 2004. 8. LEVY, Pierre. O que é o virtual? Paulo Neves (trad). São Paulo: Editora 34, 1996. 9. ___. Cibercultura. Carlos Irineu da Costa (trad.) São Paulo: Editora 34, 1999. 10. MOGGRIDGE, Bill. Designing interactions. Cambrige: MIT Press, 2007.
12. NORMAN, Donald. Design emocional: por que adoramos (ou detestamos) os objetos do dia-a-dia. São Paulo: Rocco, 2008. 13. PREECE, Jennifer. Design de interação: além da interação homem-computador. Tradução Viviane Possamai. Porto Alegre: Bookman, 2005. 14. SAFFER, Dan. Designing for interactions: creating smart applications and clever devices. Berkeley: New Riders, 2007. 15. SANCHO, Juana M. Para uma Tecnologia Educacional. Porto Alegre, RS: Artes Médicas, 2001. 16. SANTAELLA, Lucia. Cultura e artes do pós-humano: da cultura das mídias à cibercultura. São Paulo, SP: Editora Paulus, 2003. 17. ____________. Navegar no ciberespaço:o perfil cognitivo do leitor imersivo. São Paulo, SP: Editora Paulus, 2004. 18. SOUZA, Clarisse S. de. The semiotic engineering of human-computer interaction. Cambrige: MIT Press, 2005. 19. TARJA, Sanmya Feitosa. Informática na Educação: novas ferramentas pedagógicas para o professor na atualidade. São Paulo, SP: Editora Erica, 2001. 20. TOFFLER, Alvin. A terceira onda. Rio de Janeiro: Editora Record, 2001. 21. VYGOTSKY, L. S. A Formação Social da Mente. São Paulo: Martins Fontes, 1998.
11. MONT’ALVÃO, Claudia; DAMAZIO, Vera (orgs.). Design, ergonomia e emoção. Rio de Janeiro, Mauad X:FAPERJ, 2008.
40
Levantamento de Heurísticas para Avaliação de Interfaces do Usuário Baseadas em Voz Valéria Farinazzo Martins Salvador Universidade Presbiteriana Mackenzie Rua da Consolação, 930 - Cep 01302-907 Consolação - São Paulo - SP valeria.farinazzo@mackenzie.br
João Soares de Oliveira Neto Universidade Presbiteriana Mackenzie Rua da Consolação, 930 - Cep 01302-907 Consolação - São Paulo - SP jneto@mackenzie.br
Marcelo de Paiva Guimarães Faculdade Campo Limpo Paulista/Centro Universitário Adventista de São Paulo Rua Guatemala,167 - Campo Limpo Paulista - São Paulo - CEP 13231-230 marcelodepaiva@gmail.com ABSTRACT
This paper describes a study about heuristics evaluation of Voice User Interface (VUI), based on Nielsen’s heuristics. These heuristics were created for Graphic Interfaces, then, they were re-interpreted to support VUIs. This study disclosed the need of more specific heuristics to cover peculiar issues about human-computer interaction through voice. These heuristics were used to evaluate a VUI case study and their results are presented. RESUMO
Este artigo descreve um estudo sobre avaliação heurística para Interface do usuário baseada em voz (VUI), a partir das heurísticas de Nielsen. Visto que estas heurísticas foram criadas para Interfaces gráficas, uma reinterpretação foi necessária para suportar VUI. Este trabalho descreve a necessidade de heurísticas mais específicas para considerar os aspectos peculiares da interação homem-máquina por voz. Estas heurísticas foram usadas para avaliar um estudo de caso e seus resultados são apresentados Keywords
Voice User Interface, Heuristic Evaluate, Human-Computer Interface. Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA. Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
ACM Classification Keywords
H5.m. Information interfaces and presentation: User Interfaces - Evaluation/methodology. INTRODUÇÃO
Interfaces do usuário baseadas em voz (Voice User Interface - VUI) usam tecnologia de voz para fornecer a seus usuários acesso à informação, permitindo-os executar transações e oferecendo suporte à comunicação. Assim, são capazes de reconhecer a voz do usuário, e também compreender o que ele diz e responder a estas entradas, geralmente, em tempo real. Empresas como a Philips [28], Nuance [23] e IBM [12] têm investido no desenvolvimento de sistemas de voz para domínio restrito [6,16,19,29]. O conhecimento atual sobre avaliação de VUI advém de pequenas contribuições de avaliações que foram desenvolvidas para avaliar projetos específicos, e que tentam generalizar e propor recomendações para tais aplicações, como PARADISE [36], EAGLES [9] e DISC [8]. Embora a tendência do uso de VUI esteja migrando de aplicações unimodais para aplicações multimodais1, há que se levar em consideração que ainda existem muitas questões que devem ser resolvidas no contexto unimodal, sobretudo na avaliação destas aplicações. Torna-se, portanto,
1
De acordo com Suhm, Myers e Waibel [34], o termo “multimodal” deveria se referir ao uso de mais de uma modalidade, indiferente da natureza das modalidades. Entretanto, muitos pesquisadores têm usado o termo “multimodal” referindo-se especificamente às modalidades que são comumente utilizadas na comunicação entre pessoas, tais como fala, gestos e escrita a mão.
41
fundamental que trabalhos e expertise sejam desenvolvidos numa modalidade de comunicação humana tão natural. A avaliação heurística, proposta por Nielsen [21] e revista por ele [22], é um dos métodos mais conhecidos de inspeção de usabilidade. É um método relativamente barato, já que não envolve os potenciais usuários, e pode ser realizado quando o software já está implementado. Estas heurísticas foram criadas para avaliar um software que siga o paradigma WIMP – windows, icons, menus, pointers (aplicações bidimensionais). Porém, para aplicações de VUI, que levam em consideração fatores como entradas e saídas por voz e tamanho do vocabulário utilizado, estas heurísticas não são suficientes. O objetivo deste artigo é, portanto, fazer uma reinterpretação das heurísticas propostas por Nielsen [21,22], além da definição de novas heurísticas que atendam de maneira eficiente às peculiaridades de aplicações VUI. Este artigo está organizado da seguinte maneira. A próxima sessão é a denominada Fundamentos Conceituais, que trata dos fundamentos sobre: VUI, avaliação de usabilidade e avaliação heurística de usabilidade. A sessão seguinte, a denominada Heurística para VUI traz uma re-interpretação das heurísticas propostas por Nielsen [22], assim como a definição de novas heurísticas para VUI. Logo após, a sessão Estudo de Caso mostra uma aplicação de VUI, assim como a sua avaliação, seguindo as heurísticas da sessão anterior. Em continuação, a sessão Avaliação dos Resultados explora os resultados obtidos através desta avaliação. Por fim, na última sessão são feitas as considerações finais deste trabalho. FUNDAMENTOS CONCEITUAIS Voice User Interface
As aplicações do tipo VUI têm como característica principal a interação de um usuário com um sistema através de voz. Este tipo de interface inclui elementos tais como: prompts ou mensagens do sistema, gramáticas e lógica de diálogo ou fluxo de chamada (call flow). Os prompts são todas as mensagens de voz pré-gravadas ou sintetizadas que devem ser executadas durante o diálogo com o usuário. Gramáticas definem todas as palavras, sentenças ou frases que podem ser ditas pelo usuário em resposta a um prompt. A lógica de diálogo (direto ou iniciativa mista) define todas as ações a serem tomadas pelo sistema em determinado ponto da interação, tais como um acesso à base de dados [6,16]. Nos sistemas com lógica de diálogo direto são feitas perguntas específicas ou são apresentas opções na forma de menu aos usuários e respostas simples e objetivas são esperadas. Nos sistemas com iniciativa mista espera-se uma maior flexibilidade nas respostas. Então, conforme a resposta, o sistema tem uma iniciativa diferente para continuar o diálogo, e necessita, portanto, de recursos para capturar partes de informações importantes não fornecidas. Conforme a natureza da informação e do modelo de coleta de dados, é possível projetar o sistema com diálogo direto ou com iniciativa mista ou com ambos [20].
Principais Diferenças entre VUI e GUI
Já que num projeto de Interface Gráfica com o Usuário (GUI) há uma separação clara da lógica da aplicação e o modelo de apresentação da aplicação então é possível estender a aplicação, ou seja, alterar o modelo de apresentação para um baseado em VUI. Porém, percebe-se que a natureza dos projetos baseados em componentes para aplicações gráficas e de voz podem ser bastante diferentes. Isto se deve aos seguintes fatos [11]: • Visibilidade: Interfaces gráficas são visíveis para o usuário. Em contraste, voz é invisível. Assim, o usuário deste tipo de aplicação pode apresentar maior dificuldade para determinar as ações que ele pode realizar e como invocá-las. Também, uma entrada de voz com erro no reconhecimento pode levar a ações não desejadas no sistema, se estas falhas não forem previstas no projeto; • Transiência: entradas e saídas de voz são transientes. Uma vez que se disse ou se ouviu algo, esta informação não está mais disponível. Já as interfaces gráficas podem ser persistentes e boas práticas de projeto permitem que as informações visuais estejam disponíveis ao usuário no momento que ele delas necessite; • Assimetria de Banda-Larga: entradas de voz são tipicamente mais rápidas do que entradas digitadas, entretanto saídas de voz podem ser mais lentas do que saídas gráficas de leitura, particularmente quando permitam uma varredura visual; • Temporalidade: eventos de teclado e mouse são discretos, quase eventos instantâneos. Entradas de voz não são nem instantâneos nem discretos desde que a elocução pode gastar muitos segundos para serem ditas e consiste de dados contínuos que são transformados em uma seqüência de palavras através do reconhecedor de voz. • Concorrência: comunicação apenas por voz tende a ser serial e com canal único. A maioria das pessoas encontra dificuldade para ouvir e falar simultaneamente ou ouvir mais de uma voz, de maneira eficiente, ao mesmo tempo. Por outro lado, saídas visuais permitem concorrência de múltiplos canais de dados que podem ser processados juntos pelo usuário. Considerando as diferenças supracitadas entre o uso de VUI e GUI, é necessário também ponderar que haverá modificações consideráveis em todo o ciclo de vida de desenvolvimento de aplicações VUI, essencialmente na forma como estas aplicações deverão ser avaliadas, visto que as metodologias tradicionais são baseadas numa abordagem GUI. Arquitetura de um Sistema Baseado em Interface de Voz
De acordo com Zukerman e Litman [37], é possível construir sistemas baseados em comandos de voz interativos e em tempo-real, em que as entradas do usuário sejam capturadas por um reconhecedor automático de voz e
42
as saídas do sistema sejam enviadas através de um sintetizador de voz ou através de mensagens previamente gravadas. Assim, para atender as necessidades do usuário, a máquina necessita “entender” o que o usuário diz, desempenhar um processo de computação/transação, e responder ao usuário de tal forma que dê prosseguimento à conversação e cumprimento dos objetivos do usuário. Um sistema VUI típico é definido por seis aspectos [6, 16, 17, 19, 29]: • Compreensão e geração da linguagem: uso de gramáticas com o vocabulário que deve ser considerado para a aplicação. É responsável por extrair o significado da entrada do usuário. Há uma variedade de formas de se representar significados. Uma forma comum é um conjunto de blocos de valores. Um bloco é definido para cada item de informação que é relevante para a aplicação. Por exemplo, dentre as informações relevantes para uma aplicação de viagens aéreas poderiam aparecer “cidade de origem”, “cidade de destino”, “data da viagem”, e “período de partida preferido”. O sistema de entendimento de linguagem natural analisa a seqüência de palavras repassadas pelo módulo reconhecedor e atribui valores apropriados para os blocos. Se o usuário diz “Quero ir a São Paulo”, dizendo que pretende ir a São Paulo, o módulo de compreensão de linguagem natural define o bloco <destino> como “São Paulo”; • Gerenciamento de diálogo: é o principal componente dentro do sistema com interface do usuário baseada em voz. Ele é o elo entre o sistema e o usuário, utilizando voz, sendo responsável por gerenciar os demais módulos do sistema. Determina o que o sistema deve fazer dentre as várias possibilidades. Por exemplo, este módulo é responsável por gerenciar o módulo de reconhecimento, quando o usuário entrar, por voz, com uma informação, gerenciar o acesso à base de dados e gerenciar a sintetização de voz, a fim de fornecer a saída ao usuário. Atualmente, o gerenciamento do diálogo é o resultado de um programa escrito para controlar o fluxo da aplicação (geralmente utilizando ferramentas especiais fornecidas por fabricantes, ou linguagens de propósito específico – como VoiceXML); • Síntese de voz: é o processo que converte texto em voz. O sintetizador recebe um texto na forma digital e faz sua vocalização. Um programa de síntese de voz é útil para vocalizar informações resultantes de consultas à base de dados e em situações em que o usuário não pode desviar a atenção para ler algo ou não tem acesso ao texto escrito; um sistema com interface do usuário baseada em voz pode usar um módulo para sintetização de voz ou utilizar mensagens pré-gravadas quando não houver variação da informação a ser prestada ao usuário. Vale a pena destacar que, até o momento, os sintetizadores de voz não conseguem representar entonação; • Fatores humanos: o sistema deve levar em conta as características do usuário e se adaptar a ele. Fatores como
habilidades, objetivos, conhecimentos e preferências devem ser considerados, essencialmente, no desenvolvimento deste tipo de sistema, sendo responsável por seu sucesso ou fracasso; • Integração do sistema: faz a integração de todos os módulos que compõe o sistema, incluindo a base de dados com as informações solicitadas pelo usuário. Se o sistema utilizar módulos de telefonia, então deverá haver também esta integração. • Tecnologia de reconhecimento de voz: processo pelo qual o computador pode converter um sinal acústico em um texto, livrando o usuário da limitação da interface WIMP. Este processo envolve os seguintes passos: - Endpointing: deve capturar o sinal acústico de forma a detectar o início e o final da fala determinado através do silêncio do usuário em um tempo significativamente longo que possa caracterizar que o usuário concluiu sua fala. Este sinal acústico é, então, empacotado e enviado ao próximo módulo do sistema; - Extração das características: converter o sinal em componentes digitais que são, então, fracionados em sons distintos, ou seja, transforma a demarcação do que foi ditado (utterance endponted) numa seqüência de vetores de características (ou vetores de padrões). Um vetor de características é uma lista de números que representa características mensuráveis da fala que serão úteis no momento do reconhecimento. Os números representam tipicamente padrões de fala relacionados à quantidade de energia em várias freqüências. Geralmente, os sistemas dividem as demarcações ditadas em períodos pequenos de tempo, gerando um vetor de características para cara período (por exemplo, um vetor de características para cada 10 milissegundos consecutivos); - Reconhecedor de voz: usa a seqüência de vetores de características para determinar as palavras que foram ditas pelo usuário, ou seja, classifica o som, determinando-se possíveis combinações entre os segmentos de som e as representações fonéticas, buscando a palavra, dentro do vocabulário, que mais combine com esta composição de sons. Vantagens
Atualmente, é possível usar sistemas que interagem através da fala em aplicações que permitem verificar informações de vôos, passagens e companhias aéreas, realizar consultas em instituições financeiras (como bancos e cartões de crédito), alugar carros, e verificar as condições do tráfego e de tempo, localizar endereços, acessar o horário de trens e ônibus, encontrar os locais e horários de sessões de cinemas, e fazer reservas em restaurantes. A esta lista, em constante crescimento, podem ser adicionados muitos
43
outros serviços, como o acesso à secretária de voz do telefone celular [22].
obviamente, não deve utilizar a fala como entrada para realizar a operação.
Para as empresas, os principais benefícios em utilizar esses sistemas são [6]:
Segundo Deng e Huang [7], para que os sistemas baseados em comandos de voz tenham uma aceitabilidade maciça pela sociedade, há alguns desafios a serem vencidos:
• Economia: o custo de sistemas baseados em interfaces de voz usualmente é compensado em questão de meses. Além disso, a diminuição do tempo de duração das ligações é outro fator financeiro importante; • Disponibilidade: as empresas querem estar disponíveis para os seus clientes em todo lugar a qualquer hora (24x7). Em certos casos, o sistema é o complemento de um serviço já desenvolvido para a Web; portanto, a empresa pode alcançar os usuários que não possuam acesso à Web (ou que momentaneamente não podem acessar a Rede); • Ampliar uma marca: através da pronúncia e tom de voz, várias sensações podem ser passadas ao usuário, como polidez, firmeza e emoção. Isso pode ser usado a favor da construção da imagem da empresa ou marca de um produto; • Satisfação do cliente: vários estudos mostram um alto grau de satisfação dos clientes que usam bons sistemas baseados em voz. Para os usuários, existem várias outras vantagens em se usar bons sistemas baseados em voz sobre outras formas de interação [6]: • Intuição e eficiência: os sistemas de boa qualidade que interagem com voz utilizam as habilidades natas dos usuários. As tarefas podem ser feitas de maneira mais simples e mais eficiente do que, por exemplo, em aplicações touchtone. Numa aplicação bancária, por exemplo, o usuário pode falar algo como “Eu quero meu extrato bancário dos últimos 15 dias”, que é muito mais simples do que navegar numa série de menus; • Onipresente: o telefone é onipresente, além do fato de muitos usuários já possuirem um celular. Dessa forma, os estes sistemas acessados por voz se tornam disponíveis em todo lugar, mesmo quando o usuário esteja longe de um computador; • Experiência agradável: ao ser eficiente, o sistema baseado em comandos de voz bem projetado possibilita uma experiência agradável ao usuário, aumentando sua usabilidade; • Rapidez: falar é muito mais rápido do que digitar; • Liberdade para as mãos e olhos: algumas atividades, como dirigir, ocupam as mãos e os olhos do usuário. As aplicações baseadas em comandos de voz se tornam uma solução ideal para esse tipo de situação, até mesmo porque a interface dos telefones celulares ainda é bastante pobre. Dificuldades
Os sistemas baseados em comandos de voz não são indicados para todos os tipos de aplicações. Por exemplo, uma aplicação que necessite mover uma janela pela tela,
• Diminuir a diferença entre o que a tecnologia atualmente oferece em termos de interface e o que os usuários desejam de um sistema de reconhecimento de voz. • Construir sistemas robustos em todos os possíveis ambientes acústicos: os sistemas de reconhecimento de voz trabalham bem em ambientes silenciosos, mas quando o usuário está inserido num ambiente em que haja barulho – um restaurante, uma rua ou um shopping center, geralmente não pode usar este sistema de maneira eficaz, elevando, imensamente, a taxa de erros de reconhecimento. Este foi por muitos anos, o principal problema estudado por pesquisadores de reconhecimento de voz, tanto das universidades quanto das empresas; • Capacidade de se trabalhar com linguagem natural nos sistemas, com estilo livre: até o momento, quando usuários interagem com sistemas baseados em comandos de voz, eles estão cientes de que seu partner é uma máquina. Esta máquina falha no reconhecimento de voz se o usuário tenta introduzir um estilo natural e casual na conversação. Assim, é possível concluir que o uso de sistemas com VUI tem uma grande utilidade para melhorar a interface entre o homem e o computador; porém, assim como em qualquer tecnologia, há restrições no seu uso que devem ser consideradas. Questões Técnicas
De acordo com Alapetite, Boje e Morten [1], quando se desenvolve uma aplicação com interface do usuário baseada em voz, há algumas questões que não devem ser esquecidas ou menosprezadas para o sucesso da aplicação: • O vocabulário afeta o reconhecimento de voz pelo seu tamanho e pela cobertura do seu domínio. Assim, vocabulários extensos com uma boa cobertura do domínio são atrativos, exatamente porque são capazes de reconhecer mais palavras. Porém, vocabulários menores proporcionam um aumento de exatidão no reconhecimento. Além disto, sistemas que fazem a transcrição funcionam melhor para domínios restritos, tais como domínio radiológico. • Os usuários influenciam o reconhecimento de voz por sua clareza e sua consistência na pronúncia das palavras. Sistemas dependentes do usuário possuem uma taxa de reconhecimento da voz mais alta do que os sistemas que são independentes do usuário, porém, necessitam de sessões de treinamento – baseadas no fato de que o sistema adapta o modelo acústico ao usuário – e pode ser mais sensível às variações de barulho, microfones e voz (por exemplo, se o usuário estiver com um resfriado). Além disto, haveria a necessidade de treinamento para pessoas não-nativas na
44
língua do sistema, assim como considerar as taxas de reconhecimento de voz de crianças e idosos. • Barulho (ruído) afeta o reconhecimento da voz de duas formas: a) distorções no sinal da voz causam maior dificuldade para distinguir as palavras ditas; b) na presença de barulho, usuários tendem a alterar sua voz e, assim, causar distorção no sinal da fala. • Todos os sistemas de reconhecimento de voz estão baseados em princípios de padrões estatísticos. Entretanto, apesar de suas semelhanças, sistemas diferem entre si na sua parametrização do sinal de voz, o modelo acústico de cada fonema e o modelo de linguagem utilizado na escolha de palavras mais de acordo com as palavras ditas anteriormente. Assim, muitos sistemas causam diferenças em relação aos erros de reconhecimento, mesmo quando eles têm taxas de reconhecimento similares. Avaliação de Usabilidade
A avaliação de usabilidade consiste de uma das três avaliações possíveis para um sistema. É possível pensar em avaliar:
Tecnicamente, os componentes do sistema;
A usabilidade do sistema; e
O sistema e seus componentes sobre o ponto-devista dos clientes.
Obviamente estas três formas não estão completamente desassociadas; por exemplo, um sistema com uma boa integração de componentes considerados excelentes pode ter uma usabilidade baixa, assim como um cliente pode preferir um sistema com componentes não considerados tão eficientes por questões de custo e compatibilidade de plataformas [3]. Usabilidade é um requisito de qualidade de software que compreende aspectos relacionados à eficiência e eficácia no uso de software; é o processo de assegurar a usabilidade de uma interface e garantir que os requisitos de usuários sejam atendidos [22, 32] A fase de avaliação de um sistema deve ocorrer durante todo o processo de desenvolvimento, utilizando seus resultados como melhorias a serem aplicadas gradativamente na interface. Assim, a avaliação de usabilidade é cada vez mais usada no desenvolvimento de software, especialmente para avaliar os projetos de interação do usuário. Há também um crescimento dos resultados vindos da avaliação de usabilidade de sistemas já existentes [32]. Várias definições sobre usabilidade são propostas, na literatura, incluindo a dada pela ISO (ISO 9241-11) [13]: usabilidade é a capacidade que um sistema interativo oferece a seu usuário, em um determinado contexto de operação, para a realização de tarefas, de maneira eficaz (que é a precisão e a completude com que usuários conseguem atingir seus objetivos), eficiente (que é a relação
entre a precisão e a inteireza com que usuários atingem certos objetivos e os recursos gastos para atingi-los) e satisfatória (que é o conforto e as atitudes positivas dos usuários concernentes ao uso do sistema). Já para Lauesen [18], Avouris [2], Sommerville [34] e Nielsen [22], a usabilidade consiste de fatores como: • Funcionalidade: o sistema pode dar suporte às tarefas que o usuário tem na vida real; • Fácil aprendizado: quão fácil é o aprendizado sobre o sistema para vários grupos de usuários; • Eficiente: quão eficiente é o sistema para um usuário freqüente; • Satisfação subjetiva: o quanto o usuário está satisfeito com aquele determinado sistema; • Compreensão: quão fácil é entender o que o sistema executa. Este fator é particularmente importante para situações não usuais que podem ocorrer quando há falhas ou erros no sistema; • Adequação a padrões específicos: o quanto o sistema consegue estar de acordo com um padrão de projeto de interfaces; • Adaptação ao nível de experiência dos usuários: o quanto o sistema é adaptativo às necessidades de usuários com níveis diferentes de conhecimento sobre o sistema, que podem variar entre iniciante, intermediário e avançado. Enquanto a ISO [13] e outros autores [2, 18, 32] Nielsen [22], são conceitualmente claros, é difícil usar estas definições na prática. Quando a avaliação é realizada através de estudos empíricos, os pesquisadores necessitam decidir sobre indicadores (métricas) para cada fator. Por exemplo, uma métrica de memorização pode determinar que um operador que estivesse familiarizado com o trabalho deveria estar habilitado a usar 80 por cento das funcionalidades do sistema depois de uma sessão de três horas de treinamento. Porém, é complexo decidir como estes fatores contribuirão para uma conclusão sobre a usabilidade de um sistema. Uma alternativa é definir usabilidade de um sistema como a ausência de obstáculos que impedem os usuários de completar suas tarefas Com base nesta abordagem, usabilidade pode ser medida em termos dos problemas de usabilidade que são identificados quando os usuários estão usando um sistema em seu trabalho. Um alto número de problemas de usabilidade identificados geralmente indica um baixo grau de usabilidade [33]. A avaliação de usabilidade envolve um conjunto de atividades. Segundo [3], uma avaliação de usabilidade pode ser realizada em termos de cinco atividades: (1) determinações básicas, (2) planejamento do processo, (3) criação de situações de teste, (4) condução dos testes e (5) interpretação dos dados.
45
A usabilidade é importante por diversos fatores, tais como: economia de tempo na manipulação do sistema, maior número de pessoas podem usar o sistema, pessoas podem usar diversos sistemas computacionais, sem ter que se especializar em um único sistema. Avaliação Heurística
explicadas algumas das heurísticas que não foram consideradas válidas para sistemas de VUI. Por fim, foram definidas novas heurísticas de acordo com as peculiaridades desta classe de aplicações. As heurísticas de Nielsen utilizadas e re-interpretadas foram:
A avaliação sistemática de um projeto de interface do usuário pode ser um processo caro envolvendo cientistas cognitivos e projetistas gráficos, principalmente quando envolvem usuários num laboratório designado para este fim. A inspeção de usabilidade, um dos principais métodos de avaliação de interfaces, é uma técnica de avaliação que visa, entre outros fatores, o barateamento da atividade de mensurar a qualidade de uma interface. A avaliação heurística, proposta por Nielsen, é uma das técnicas mais conhecidas de inspeção de usabilidade. Ela envolve um pequeno conjunto de avaliadores (geralmente entre 3 e 5) examinando a interface e julgando suas características em face de reconhecidos princípios de usabilidade, denominados heurísticas [21, 22, 26, 32]. A avaliação heurística é realizada, primeiramente, de maneira individual. Cada avaliador, durante a sessão de avaliação, percorre a interface diversas vezes, inspecionando os diferentes componentes de diálogo; ao verificar problemas, estes são relacionados às heurísticas violadas. Estas heurísticas são, na verdade, regras gerais que objetivam descrever propriedades comuns de interfaces usáveis. Ao final desta etapa inicial, a lista das violações de usabilidade preparada pelos avaliadores é consolidada em uma única lista. Tipicamente, uma sessão de avaliação dura cerca de 2 horas, mas, dependendo do tamanho ou complexidade da interface, é recomendável dividi-la em várias sessões abordando cenários específicos. Adicionalmente, o avaliador também pode considerar heurísticas específicas da categoria do produto que está sendo analisado.
1.
Diálogo simples e natural: a interface do usuário baseada em voz deve fornecer apenas as informações requeridas pelo usuário, não o sobrecarregando com informações adicionais, a menos que requisitadas a prover mais informações.
2.
Falar a linguagem do usuário: é importante que a estrutura fixada pelo desenvolvedor no diálogo seja natural para o usuário, refletindo as expectativas esperadas por ele, especialmente no diálogo direcionado pelo sistema em que o usuário não deva interferir na estrutura do diálogo. Estruturas de diálogo não naturais freqüentemente levam os usuários a tentar tomar a iniciativa de maneira que o sistema não está preparado para atender.
3.
Minimização do esforço para lembrar: a interface deve minimizar o esforço cognitivo do usuário para executar suas tarefas. Diálogos de iniciativa mista e sentenças adicionais no final de diálogo podem ser fornecidos para guiar o usuário a utilizar o sistema de VUI de maneira adequada.
4.
Feedback: Um feedback adequado significa que o usuário possa se sentir no controle durante a interação. O usuário deve se sentir confiante de que o sistema compreendeu e que está atendendo aos seus objetivos. Há feedback em três níveis: nível de hardware – indica se as entradas do usuário tiveram sucesso (para entrada de voz, indica que o sistema entendeu o que o usuário está dizendo); nível de seqüência – indica que uma unidade de linguagem de comando foi aceita (em interface do usuário baseada em voz significa que o sistema entendeu a ação solicitada pelo usuário); nível funcional - indica que o sistema está trabalhando no problema (mensagens como “por favor, aguarde um momento”) ditas ao usuário.
5.
Shortcuts: a interface deve dar suporte a todas as classes de usuários, identificando cada usuário e se adaptando a ele, executando adaptações de conteúdo e de apresentação através do Modelo do Usuário2. Algumas estratégias podem ser usadas
Uma limitação apresentada por método é que ele é subjetivo, além de ter que ser realizado por profissionais especializados. HEURÍSTICAS PARA VUI
As heurísticas criadas por Nielsen [22] foram criadas para avaliar um software que siga o paradigma WIMP. Porém, para aplicações de VUI, que levam em consideração fatores como entradas e saídas por voz e tamanho do vocabulário utilizado, estas heurísticas não são suficientes. Assim, baseadas em Nielsen [22] e também nos requisitos não-funcionais e boas práticas de desenvolvimento apontados por Dybkjaer e Bersen [8], Salvador et al [31] e Komatani et al [15], foram realizadas re-interpretações das heurísticas propostas por Nielsen [21, 22], válidas para aplicações de VUI. Também foram apresentadas e
2
Modelo de Usuário: modelo onde devem estar contidas todas as suposições do sistema sobre os aspectos relevantes para a realização de personalizações [14].
46
para isto: por exemplo, fornecendo aos usuários mais experientes informações mais detalhadas e barge-in3; e proporcionando aos usuários novatos, informações mais concisas e superficiais e sentenças no final de diálogos. A estratégia que disponibiliza informações detalhadas e/ou exemplos do que o usuário quer dizer é conhecida como progressive prompt. Nela, mais detalhes são fornecidos ao usuário conforme a quantidade de erros aumenta. Outra estratégia é conhecida como rapid reprompt. Nela, o sistema reage como uma rápida fala, como, por exemplo, “o que você disse?”, ao invés de fornecer informações mais detalhadas [19]. 6.
Tratamento e Prevenção de erros: VUIs devem ser hábeis a manipular erros usando: diálogo de iniciativa mista, dizer ao usuário o que o sistema entendeu e pedir confirmação ou correção ou transferir a chamada para um atendente humano (em sistemas de telefonia).
7.
Help: a interface deve fornecer ajuda quando requisitada ou quando perceber que o usuário se encontra em dificuldades. Para interface do usuário baseada em voz, um diálogo deve prover a lista de possíveis opções que o usuário pode realizar na aplicação quando ele perceber que o usuário não tomará a iniciativa do diálogo. Estratégias de confirmação de diálogo também podem ser utilizadas, assim como breves explicações e exemplos ao final do diálogo.
Algumas heurísticas foram propostas pelos autores deste artigo, a fim de atender de maneira eficiente às peculiaridades de aplicações VUI. Estas heurísticas foram identificadas a partir de estudos bibliográficos (Dybkjaer e Bersen [8], Salvador et al [31] e Komatani et al [13]; Walker [36]; Passnneau [27]; Möller [24]; Möller [25]; Hartikanen et al [10]), a partir de avaliação informal dos avaliadores e também utilizando a técnica do percurso cognitivo em diversos sistemas VUI, e na observação de usuários finais quanto às dificuldades em cumprir seus objetivos, quantidade de ajudas solicitada, frustrações, entre outras:
8.
Frases de saída adequadas: o conteúdo das saídas do sistema deve ser correto, relevante e suficientemente informativo, sem prover sobrecarga de informação ao usuário. A forma de expressão do sistema deve ser clara e não-ambígua e a linguagem deve fornecer uma terminologia apropriada e familiar ao usuário.
9.
Qualidade da saída de voz: sob o ponto-de-vista de usuários, a qualidade da saída de voz de um sistema está ligada a questões de clareza e inteligibilidade (entonação correta, emoção, ritmo da fala apropriado e prazer de se ouvir). Há três classes de saída de voz num sistema: a) as que gravam as frases inteiras do sistema (quando as informações não são dinâmicas); b) as que concatenam palavras e frases gravadas, ou; c) as que utilizam text-to-speech (TTS), ou seja, um módulo do sistema sintetiza o som (voz) em tempo real.
10. Reconhecimento adequado da entrada: sob o ponto-de-vista de usuários, um reconhecimento adequado de voz significa que o sistema raramente compreende erroneamente uma entrada do usuário. Porém, isto está ligado a muitos fatores do ambiente (se o ambiente é ruidoso ou não) e também a fatores do usuário: sexo, idade, sotaque, voz grave ou aguda, e qualidade da voz recebida pelo sistema. 11. Iniciativa adequada de diálogo: para dar suporte a uma interação natural, é necessário que o sistema escolha, de forma razoável, a iniciativa do diálogo estabelecido entre ele e o usuário. Isto está ligado ao nível de conhecimento do usuário sobre o sistema. Diálogos direcionados ao sistema podem funcionar de maneira apropriada para tarefas em que o sistema simplesmente requer uma série de pedaços específicos de informação do usuário, especialmente se o usuário é novo no sistema. A fim de satisfazer usuários experientes, o sistema terá que ser hábil ao lidar com grandes pacotes de informação que são naturais para estes usuários. As seguintes heurísticas propostas por Nielsen [21] não foram consideradas essenciais ou não puderam ser utilizadas para aplicações VUI: 1.
3
Barge-in: quando o usuário, para começar a falar, necessita esperar o sistema realizar o processamento completo de uma ação. Por exemplo, o usuário só pode falar a opção escolhida de um menu após ouvir todas as opções. Algumas aplicações evitam este problema possibilitando que o usuário fale a qualquer momento a opção desejada [19].
Documentação: sistemas com interface do usuário baseada em voz não são apropriados para a consulta à documentação, exatamente porque a voz é transiente e o sistema está esperando uma entrada do usuário (por voz) para dar prosseguimento às ações;
47
2.
Consistência: o sistema pode necessitar, por exemplo, confirmar a entrada do usuário antes de fornecer uma informação, caso não tenha identificado, com uma porcentagem alta de afirmação, o que o usuário disse; isto pode ser interpretado pelo usuário, como uma nãoconsistência do sistema.
ESTUDOS DE CASO Dicionário Ativado por Voz
Utilizando a engine para reconhecimento de comandos de voz denominada Microsoft Speech Recognition Sample Engine for Portuguese (Brazil), construiu-se um dicionário eletrônico do tipo VUI [5]. Os principais recursos do dicionário desenvolvido é o reconhecimento das palavras ditas pelo o usuário e a conversão do texto (definição da palavra) para voz. A engine utilizada usa os modelos de Hidden Markov, que são modelos estatísticos baseados em probabilidades para o reconhecimento e, a técnica Concatenative Synthesis para conversão de texto-para-voz [4]. Nesta aplicação o usuário diz a palavra, o sistema a reconhece e faz a leitura da definição (voz sintetizada). A Figura 1 mostra o Diagrama de Caso de Uso do comportamento da aplicação. Esse Caso de Uso ocorre quando o usuário solicita o significado de uma palavra. Após identificar a palavra, o sistema sintetiza o significado da palavra.
Figura 2. – Interface GUI da aplicação VUI
A Figura 3 mostra o Diagrama de Seqüência do serviço de busca de significado. Inicialmente ocorre a captura do áudio do usuário (capturaAudio), logo após, é chamado o reconhecedor de significado (ReconhecedorAudio). Após encontrar o significado da palavra, o significado e a probabilidade de acerto são apresentados na GUI (MostrarSignificado) e, por fim, o significado é sintetizado (SintetizarSignificado).
Figura 1. – Diagrama de Caso de Uso da aplicação VUI
A fim de facilitar o processo de desenvolvimento e testes da aplicação VUI, também foi desenvolvida uma interface GUI, mostrada na Figura 2. Nessa interface é possível observar a palavra que foi reconhecida, no caso “carro”, o significado “veículo de rodas pra transportar pessoas ou carga” e a confiança (probabilidade de acerto) que é de 97,48898%.
Figura 3 – Diagrama de Seqüência da aplicação VUI
Metodologia Utilizada
Esta metodologia é composta por duas fases, descritas a seguir:
A fase 1 consistiu na preparação de um formulário de avaliação. A elaboração deste formulário baseouse numa inspeção de usabilidade, utilizando a técnica de avaliação heurística e considerando as reinterpretações de Nielsen [22], no estudo nos requisitos não-funcionais para VUIs e também nas boas práticas de desenvolvimento apontados por Dybkjaer e Bersen [8], Salvador et al [31] e Komatani et al [15], conforme explicado anteriormente. A versão final do formulário possui
48
três campos: Heurística, Severidade e Comentários, conforme mostrado na Tabela 1. Os graus de severidade foram definidos em conformidade a Nielsen [22]: 1 – não concordo que seja um problema de usabilidade; 2 – apenas “perfumaria”; 3 – problema não grave; 4 – problema maior de usabilidade, importante corrigi-lo; 5 – erro catastrófico de usabilidade e deve que ser corrigido;
Na segunda fase, o objetivo foi aplicar o formulário para avaliar o estudo de caso a fim de verificar se os princípios da abordagem foram cumpridos, relatando as falhas quanto ao cumprimento dos princípios de usabilidade. Para que esta fase pudesse ser realizada de maneira satisfatória, três avaliadores foram convidados para avaliar os critérios de usabilidade conforme as heurísticas apontadas na Tabela 1. Estes avaliadores são pesquisadores da área de IHC, tendo experiência nas fases do ciclo de vida de desenvolvimento de aplicações VUI e também experientes em Avaliação Heurística.
Heurísticas
Severidade
Comentários
1.Diálogo simples e natural 2.Falar a linguagem do usuário 3.Minimização do esforço para lembrar 4.Feedback: 5.Shortcuts 6.Tratamento e Prevenção de erros 7.Help 8. Frases de saída adequadas 9.Qualidade da saída de voz 10.Reconhecimento adequado da entrada 11.Iniciativa adequada de diálogo Tabela 1. Lista de Heurísticas e graus de severidade correspondente para avaliação.
O tempo para a realização desta avaliação foi, em média, de 20 minutos por se tratar de uma aplicação bastante simples
AVALIAÇÃO DOS RESULTADOS
Ao final da avaliação, as três listas de problemas identificados sobre as heurísticas para RA foram condensadas em uma, cuja análise se encontra a seguir (Tabela 2). Assim, nesta tabela estão os resultados – graus de severidade e comentários – referentes aos três avaliadores.
Heurísticas
Sev.
Comentários
1.Diálogo simples e 3 natural
A aplicação poderia, através de voz, solicitar o começo do ditado do usuário
2.Falar a linguagem 4 do usuário
A aplicação poderia, através de voz, solicitar o começo do ditado do usuário
3.Minimização do esforço para lembrar 4.Feedback:
2
5.Shortcuts
N/A
6.Tratamento e Prevenção de erros
5
Palavras que não são reconhecidas não são tratadas
7.Help
5
A aplicação não apresenta Ajuda
8. Frases de saída adequadas
5
Algumas palavras faladas não são compreendidas. Utilização de um TTS ruim
9.Qualidade da saída de voz
1; 2
A voz parece sintetizada. Por se tratar de frases fixas, elas poderiam ser gravadas por um locutor, garantindo melhor qualidade
4
10.Reconhecimento 3 adequado da entrada 11.Iniciativa 5 adequada de diálogo
Na parte inferior é mostrado o processamento da aplicação na tentativa de encontrar a palavra correspondente à palavra ditada pelo usuário
Palavras como “casarão” reconhecidas como “casa”
são
O sistema não tem iniciativa de diálogo. O usuário não é instruído como deve iniciar o uso do sistema
Tabela 2. Agrupamento das três Listas de Heurísticas violadas, graus de severidade e comentários CONCLUSÕES
Este artigo está focado na avaliação de aplicações de VUI utilizando heurísticas. Foi verificada a necessidade de se reinterpretar as heurísticas estabelecidas por Nielsen [22]. Foi considerada fundamental a definição de mais quatro heurísticas para VUI, que atendessem às peculiaridades desta classe de aplicações: frases de saída adequadas; qualidade da saída de voz; reconhecimento adequado da entrada e; iniciativa de diálogo adequado. Algumas heurísticas definidas por Nielsen [22] foram desconsideradas para aplicações de VUI, tais como: documentação e consistência. O estudo de caso demonstrou que as 11 heurísticas utilizadas forneceram uma ferramenta útil que proporcionou eficiência e significado para a avaliação de aplicações VUI. Com base nestas heurísticas, foi aplicada uma avaliação em um protótipo de um dicionário por voz, realizada por três
49
avaliadores, que, segundo estudos de Nielsen [21], é considerado um bom número.
Language Systems. Mouton de Gruyter, Berlin, New York, (1997)
Os resultados da avaliação demonstraram que os maiores problemas encontrados nesta aplicação equivalem à violação das heurísticas 6 (prevenção e tratamento de erros), 7 (help), 8 (frases de saída adequadas) e 11 (iniciativa adequada do diálogo).
10. Hartikainen, M.; Salonen, E.; Turunen, M. "Subjective evaluation of spoken dialogue systems using SER VQUAL method", In: INTERSPEECH2004, 2273-2276, (2004).
Como trabalho futuro, espera-se que a avaliação possa ser realizada não somente através de métodos de inspeção, mas também através de testes de usabilidade. Os resultados desta avaliação podem ser investigados, de maneira que se perceba qual(is) método(s) tem (têm) um melhor custo/ beneficio para ser considerado eficiente a esta classe de aplicações. REFERÊNCIAS
1.
Alapetite, A., Boje, A. H, Moren, H,, Acceptance of speech recognition by physicians : A survey of expectations, experiences, and social influence, International journal of human-computer studies, ISSN 1071-5819, vol. 67, no1, pp. 36-49, (2009).
2.
Avouris, N.M., An introduction to software usability. In Workshop on Software Usability – Proceedings of the 8 th Panhellenic Conference on Informatics. v. 2, p. 514-522, (2001).
3.
Berseb, N. O.; Dybkjaer, L.: Usability evaluation in spoken language dialogue systems and their components. In Proceedings of the workshop on Evaluation for Language and Dialogue Systems Volume 9, Toulouse, France, (2001).
4.
Braga, Daniela. Algoritmos de Processamento da Linguagem Natural para Sistemas de Conversão Texto Fala em Português. PhD Thesis. University of A Coruña, A Coruña, Spain. (2008).
5.
Calado, A.; Freitas, J.; Braga, D.; Dias, M. 2008. Multi-Language Telephony Speech Data Collection and Annotation, Propor 2008 Special Session: Applications of Portuguese Speech and Language Technologies, September 10, Curia, Portugal.(2008).
6.
Cohen, M. H., Giangola, J. P., Balogh, J.: Voice User Interface Design, Addison Wesley, ISBN 0321-18576-5, (2004).
7.
Deng, L., Huang, X. 2004. Challenges in adopting speech recognition. Commun. ACM 47, 1, pp 69-75, (2004)
8.
Dybkjaer, L., Bernsen N.O.: Usability Issues in Spoken Language Dialogue Systems. Natural Language Engineering, Special Issue on Best Practice in Spoken Language Dialogue System Engineering, Vol. 6 Parts 3 & 4, 243-272, (2000).
9.
Gibbon, D., Moore, R., WINSKI, R. (Eds.): Handbook of Standards and Resources for Spoken
11. Hunt, A.; Walker, W.: A fine Grained Component Architecture for Speech Application Development, SUN Research, Project: SMLI TR-. 2000-86, June (2000). 12. IBM, http://www.ibm.com/us/en/ 13. ISO 9241-11. Ergonomic Requirements for Office Work with Visual Display Terminals (VDTs) Part 11: Guidance on usability. ISO 1997. 14. Kobsa, A. User Modeling: Recent Work, Prospects and Hazards, In: M.Schneider-Hufschmidt, T. Kühme, U. Malinowski, (eds), Adaptive User Interfaces: Principles and Practise, North Holland Elsevier, Amsterdam, (1993) 15. Komatani, K.; Ueno S.; Kawaharat,T.; Okuno, H. G. Flexible Guidance Generation using User Model in Spoken Dialogue Systems, Proceedings of the 4lst Annual Meeting of the Association for Computational Linguistics, july 2003, pp. 256263. (2003) 16. Lai, J.: Conversational Interfaces, Communications of the ACM Vol. 43, No 9, pp 24-- 27, (2000). 17. Lamel, L.; Minker, W.; Paroubek, P. Towards Best Practice in the Development and Evaluation of Speech Recognition Components of a Spoken Language Dialog System, Natural Language Engineering 6 (3-4), United Kingdom Cambridge University Press, (2000). 18. Lausen, S. User Interface Design – A Software Engineering Perspective, Pearson Education Limited, Great Britain, ISBN 032118143 3 (2005). 19. Mctear, M. F.: Spoken Dialogue Technology: Enabling the Conversational User Interface, ACM Computing Surveys, Vol. 34, No. 1, pp. 90–169, (2002). 20. Neto,A.T & Bittar,T.J. & Pontin,R. & Fortes,M. & Felizardo,K.. Abordagem para o desenvolvimento e avaliação de interfaces multimodais Web pautada em princípios de usabilidade. Proceedings of the VIII Brazilian Symposium on Human Factors in Computing Systems.Pages 21-30.Porto Alegre, RS, Brazil.(2008). 21. Nielsen, J.. Usability engineering at a discount. In: G. Salvendy & M.J. Smith (Eds.), Designing and using human-computer interfaces and knowledge based systems, pp 394-401, Amsterdam, The
50
Publishers,
Transactions on Computer-Human Interaction, 8, 1 pp 60--98, (2001).
22. Nielsen, J.: Usability Engineering. Academic Press, Cambridge, MA (1993).
36. Walker, M., Litman, D., Kamm, C., Abella, A.: PARADISE: A Framework for Evaluating Spoken Dialogue Agents. Proc. of the Association of Computational Linguistics (ACL), pp 271—280, (1997).
Netherlands: B.V.(1989).
Elsevier
Science
23. Nuance Dragon Naturally Speaking Solutions, http://www.nuance.com/naturallyspeaking/ 24. Möller, S. A new taxonomy for the quality of telephone services based on spoken dialogue systems. In: Proc. 3rd SIGdial Worksh. on Discourse and Dialogue, US-Philadelphia, 142153,(2002). 25. Möller, S., Quality of Telephone-based Spoken Dialogue Systems, Springer, New York NY, (2005).
37. Zukerman, I.; Litman, D. Natural Languege Processing and User Modeling: Synergies and Limitations, User Modeling and User-Adpated Interaction, Khuwer Academic Publishers, Netherlands, (2001).
26. Oliveira Neto, J. S.; Salvador, V. F. M. Projeto de Interfaces baseadas em comandos de voz: conceitos, ferramentas de desenvolvimento e aplicações, 2007. 27. Parasuraman, A., Zeithaml, V.A.; Berry, L.L., SERVQUAL: A multiple-item scale for measuring consumer perceptions of service quality, Journal of Retailing, 64, 1, (1988). 28. Philips, http://www.dictation.philips.com/ 29. Rocha, H. V., Baranauskas, M.C.C.: Design e Avaliação de Interfaces Humano-Computador, NIED, Instituto de Computação, Universidade Estadual Paulista, Campinas (2003). 30. Rubin, J. Handbook of Usability Testing: How to plan, design and conduct effective tests. John Wiley & Sons, Inc., New York, (1994). 31. Salvador, V. F. M.; Oliveira Neto, J. S.; Kawamoto, A. L. S.: Requirement Engineering Contributions to Voice User Interface, Proceedings of First International Conference on Advances in Computer-Human Interaction, ACHI 2008: pp. 309-314. (2008). 32. San-Segundo, R.; Montero, J. M.; MacíasGuarasa, J.; Ferreiros, J.; Pardo, J.M.: KnowledgeCombining Methodology for Dialogue Design in Spoken Language Systems, International Journal of Speech Technology 8, 45-66, Springer Science + Business Media (2005). 33. Skov, M.B.; Stage, J., Supporting problem identification in usability evaluations, Proceedings of the 17th Australia conference on ComputerHuman Interaction: Citizens Online: Considerations for Today and the Future, November 21-25, Canberra, Australia (2005). 34. Sommerville, I.: Software Engineering – 6th Edition, Addison Wesley, (2001). 35. Suhm, B., Myers, B., Waibel, A.: Multimodal Error Correction for Speech User Interfaces. ACM
51
governo/web formas de presença on-line: da inclusão à interação
52
Interfaces para Aplicações de Governo Eletrônico Giovanni Bogéa Viana Instituto de Computação UNICAMP, SP gbviana@ic.unicamp.br
Maria Beatriz F. de Toledo Instituto de Computação UNICAMP, SP beatriz@ic.unicamp.br
Marcelo Fantinato EACH USP, SP m.fantinato@usp.br
RESUMO
ACM Classification Keywords
Este artigo apresenta uma visão geral de um dos principais sítios de governo eletrônico no Brasil, o Portal da Transparência, e faz uma comparação de governos eletrônicos de alguns países, com o objetivo de avaliar o grau de acessibilidade de cada um deles. Para obtenção dos resultados, as ferramentas de validação ASES, DaSilva e TotalValidator foram utilizadas e avaliaram os sítios com base no eMAG, WCAG v1 e WCAG v2. Uma pesquisa com entidades e ONGs é também apresentada, e tem como objetivo avaliar o Portal da Transparência de acordo com critérios de usabilidade como a navegação e facilidade de uso. Essas avaliações serão utilizadas como sugestão para melhorar o sítio e tornálo mais fácil de usar e acessível para um número maior de cidadãos independentemente de nível educacional e das necessidades específicas de cada um.
H.5.2. Information interfaces and presentation (e.g., HCI): User InterfacesEvaluation/methodology.
ABSTRACT
This article presents an overview about one of the most important sites of electronic government in Brazil, the Portal da Transparência, and compares some electronic government web sites around the world with the objective of evaluating their degree of accessibility. The results have been found using ASES, DaSilva and TotalValidator validation tools and having eMAG, WCAG v1 and WCAG v2 as parameters. A research with entities and NGOs has been carried out to evaluate the portal with respect to usability criteria such as navigation and facility of use. These evaluations will be used as suggestions to improve the web site and make it easier and more accessible for a larger public of any education level or with special needs. Palavras Chaves
Governo eletrônico, acessibilidade, usabilidade, interfaces.
Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA. Copyright 2009 ACM 9781605582467/09/04...$5.00.
INTRODUÇÃO
O Governo Eletrônico (ou egov) trata do acesso às bases de informações governamentais e ao oferecimento de serviços para todos os cidadãos. O governo deve, portanto, tranformarse para oferecer serviços transparentes, eficientes e convenientes para os cidadãos e empresários por meio das novas tecnologias de informação e comunicação (TICs) [19]. Os objetivos principais dessas tecnologias é alcançar o maior número de pessoas. Quaisquer restrições de grupos da população (como, por exemplo, idosos, jovens, portadores de deficiência) também devem ser consideradas para a adaptação das aplicações de egov. Os idosos, em geral, precisam de atenção especial por não terem facilidade com as novas tecnologias e terem maior dificuldade de visão, audição e mobilidade. Os serviços oferecidos devem ser adaptados para letras maiores e com linguagem simplificada. Jovens têm maior facilidade de lidar com TICs, mas precisam ser incentivados a participar. Portadores de deficiência também podem ter restrições de visão, audição e mobilidade. Crianças também são valiosas, nem sempre por necessitarem dos serviços, mas por adquirirem a cultura do meio eletrônico. Projetos como o Portalzinho da CGU1 2, voltado para a criança, tentam incentiválas na participação do controle de gastos públicos. A Internet não pode ser tratada como a única forma de comunicação do governo pois ainda há lugares remotos sem sua abrangência. Outros mecanismos como fax, telefones, SMS3, redes sem fio e até mesmo a televisão são meios de comunicação válidos. Eles podem ser utilizados para atingir os objetivos do governo eletrônico. Esses objetivos, por sua vez, englobam a inclusão social, melhora no serviço público, melhora na qualidade de vida, oferecimento de lógicas administrativas modernas e ainda acesso aos 1
Acrônimo para ControladoriaGeral da União
2
http://www.portalzinho.cgu.gov.br
3
Do inglês, Short Message Service.
53
serviços levando em consideração necessidades especiais, condições sociais, econômicas e éticas. Além disso, quiosques do governo com acesso aos serviços e funcionários para prover ajuda devem existir para quando os TICs não puderem ser utilizados. As aplicações de egov podem ser divididas em cinco categorias [17]: • eArquivos corresponde aos serviços de apoio a cartórios como auxílios na busca de empregos, registros de propriedades e bibliotecas. • eDemocracia trata da efetiva participação da população nas decisões governamentais, incluindo votações pela internet e fóruns de discussão. • eNegócios trata do uso da tecnologia da informação na efetivação de negócios. • eCidadãos está relacionado com o oferecimento de serviços ao cidadão como os de saúde (marcação de consultas), notificações de mudança de endereço e registros de crimes. • eAcessibilidade trata da personalização das aplicações para portadores de necessidades especiais. O governo eletrônico pode ser visto segundo cinco pontos de vistas diferentes [18,20]: organização 4, informação5, computacional6, engenharia7 e tecnológico8. O ponto de vista da organização trata do objetivo da aplicação, da interação entre governo e cidadãos, governo com governo e ainda governo e empresários. O ponto de vista da informação está relacionado com as características dos dados, englobando a necessidade de determinar o significado (semântica) dos dados envolvidos. Já o ponto de vista computacional representa a estrutura lógica da aplicação, dividindoa nas camadas cliente (representam os diferentes usuários), intermediária (regras de negócios) e backend (dados a serem processados). A engenharia trata do mapeamento entre os elementos do sistema e os recursos físicos, sustentando um ambiente único e integrado de oferecimento dos serviços. O ponto de vista tecnológico foca na implementação, definindo regras de acesso aos serviços, layouts, protocolos de comunicação, segurança e integração dos dados. Deve haver comprometimento por parte dos governantes e 4
Do inglês, Enterprise Viewpoint.
5
Do inglês, Information Viewpoint.
6
Do inglês, Computational Viewpoint.
7
Do inglês, Engineering Viewpoint.
8
Do inglês, Technology Viewpoint.
participação popular para implementação do governo eletrônico [18]. Medidas para acabar com barreiras de acesso aos meios de comunicação devem ser não só previstas, mas implementadas. A sociedade civil deve ser tratada como uma parceira do governo na busca de transparência. Portanto, o sucesso do governo eletrônico depende da definição objetiva de responsabilidade dos participantes juntamente com metas claras e realistas, para que as mesmas possam ser acompanhadas de maneira transparente por todos. Existem três personagens principais do governo eletrônico: o próprio governo, o empresário e o cidadão. Do lado do governo, as vantagens principais são a facilidade na disseminação das leis e decisões, melhor forma de expor as medidas de regulamentação e ainda oferecimento de serviços mais eficientes. O empresário ganha ao poder ter acesso de maneira mais rápida aos serviços, ter facilitada a maneira de fazer negócios com o governo e transparência nas ações. O cidadão também ganha com o acesso mais rápido aos serviços, de maneira conveniente, barata e fácil. O governo eletrônico deve ser reconhecido como uma nova forma de administração, voltada para o cidadão, os empresários e o próprio governo, capaz de transformar e não apenas traduzir processos [19]. Outros benefícios para o próprio governo são a facilidade de comunicação entre os governos internos (municipais, estaduais e federal) e até mesmo entre os governos de diferentes países. Entre os governos de diferentes hierarquias, a implementação do governo eletrônico pode permitir, por exemplo, a simplificação na cobrança de impostos, a troca de dados entre polícias para investigações de crimes e o melhor controle e distribuição das políticas sociais. Entre os governos de diferentes países (mesma hierarquia), um objetivo poderia ser controlar empresas internacionais quanto a, por exemplo, eventuais desvios de dinheiro. O governo eletrônico traz como vantagem o fato de os governantes poderem saber com maior exatidão, e ao longo de todo o governo, das necessidades da população sob sua administração. Maiores prioridades podem ser identificadas, ainda mais quando se sabe que uma equipe do governo não tem como descobrir e tratar de todos os problemas. A participação do povo deve ser vantajosa a ponto de permitir não só a identificação dos problemas, mas a melhor maneira de resolvêlos. Respostas sobre as políticas adotadas são igualmente relevantes. A disponibilização de dados públicos facilita também o combate à corrupção. O cidadão, ao participar do governo, sente cada vez mais vontade de interagir com os governantes. Igualmente vantajoso é para o cidadão poder ter acesso aos
54
serviços disponibilizados sem enfrentar, por exemplo, o desgaste de percorrer diversos órgãos públicos para obter certidões, buscar seus direitos, informações locais ou mesmo se deslocar para longe de sua casa. Esses mesmos serviços podem ser oferecidos para os habitantes mais distantes dos centros de governo, de maneira mais simples e barata com o uso da tecnologia da informação. A disponibilização de serviços espalhados por diversos sítios é apenas uma solução parcial (a Receita Federal do Brasil oferece alguns serviços em seu sítio, a Previdência Social também). Portais de governos de países mais avançados na área, como o Canadá9, oferecem sítios específicos com uma variedade de serviços que não possui relação entre si e nem áreas específicas. Esses sítios são considerados como um “único ponto de parada” para o cidadão, que pode ter acesso às suas necessidades sempre sabendo de imediato onde buscar ajuda. O Brasil possui o seu portal de governo eletrônico10 e nele estão especificadas as ações que estão sendo tomadas para a implementação dessa nova forma de governo. Padrões como o eMAG11 [4] e ePING12 [3] foram criados para, respectivamente, garantir a acessibilidade dos sítios da Administração Pública e definir padrões de interoperabilidade entre sistemas eletrônicos. Para a infra estrutura de comunicação entre todos os órgãos da Administração Pública há o projeto Infovia. No próprio portal do governo brasileiro13 há atalhos para acesso a alguns serviços disponibilizados por órgãos integrantes da Administração. Para a transparência dos gastos públicos, há o Portal da Transparência14 de interpretação difícil para o cidadão comum. Como se vê, falta uma coordenação mais global e efetiva para a implantação do governo eletrônico. O objetivo deste artigo é comparar diversos sítios de governo eletrônico de acordo com a acessibilidade, tendo como referência as recomendações do W3C15 e as adaptações pelo governo brasileiro, e avaliar o Portal da Transparência, um dos principais sítios de governo eletrônico no Brasil, de acordo com critérios de usabilidade. O artigo está assim dividido: na seção “Desafios do 9
http://www.servicecanada.gc.ca
10
http://www.governoeletronico.gov.br
11
Acrônimo para Modelo de Acessibilidade de Governo Eletrônico
12
Acrônimo para Padrões de Interoperabilidade de Governo Eletrônico
13
http://www.brasil.gov.br
14
http://www.portaldatransparencia.gov.br
15
Do inglês, World Wide Web Consortium
Governo Eletrônico” as principais dificuldades do governo eletrônico são apresentadas. A seguir, a seção “O Portal da Transparência no Brasil” faz uma apresentação de um dos principais sítios de governo eletrônico no Brasil. Na seção “Comparação com Outros Portais”, o sítio brasileiro é comparado com outros sítios de governo eletrônico no mundo. Por último, apresentamos as “Conclusões”. DESAFIOS DO GOVERNO ELETRÔNICO
Não basta o oferecimento de serviços por meio de novas tecnologias, deve haver também treinamento para que todos saibam utilizar esse modo de governo. A qualidade dos serviços (QoS)16 também não pode ser esquecida. Contratos de QoS podem ser exigidos dos provedores da infraestrutura no caso de contratos terceirizados para, por exemplo, garantir tempos de respostas e disponibilidade aceitáveis. Por outro lado não é fácil desenvolver por completo o governo eletrônico. As dificuldades envolvem inúmeras bases de dados heterogêneas que devem ser integradas, restrições de políticas de segurança entre domínios, conhecimento elevado sobre as várias áreas de atuação do governo, burocracia, grande volume de informações envolvido, dificuldades de acesso por parte dos usuários, dificuldade de entendimento dos governantes sobre a importância do tema e até mesmo maneiras de despertar o interesse da população para a efetiva participação no governo. Os órgãos dentro de um mesmo governo também podem não ter interesse em compartilhar suas informações, ou ainda, na maioria deles, há subordinação direta a autoridades que se preocupam exclusivamente com a finalidade do seu órgão e ignoram as vantagens para a população de uma maior integração. No caso de políticas de segurança, elas são especialmente delicadas por envolver possivelmente dados sigilosos que precisam ser acessados somente por pessoas responsáveis pela segurança da sociedade. A partir do momento em que os órgãos públicos permitem acesso aos seus sistemas, vazamentos de dados prejudiciais podem acontecer como, por exemplo, o detalhamento dos gastos de armamento das forças armadas. Em outro exemplo, investigações federais poderiam ser comprometidas. Falhas de software e hardware podem ser exploradas. De maneira geral há um risco a ser aceito, pois não há como garantir segurança completa. Cada um desses sítios é geralmente mantido por administradores independentes, justificando em parte a falta de interesse em compartilhar dados pela preocupação com a segurança dos seus dados. O poder das TICs põe em risco a segurança do próprio Estado. Assim como as novas tecnologias facilitam a 16
Do inglês, Quality of Service.
55
participação de milhões de pessoas antes não participantes, com o aumento do transparência, grupos minoritários podem se organizar com os mesmos meios para forçar o governo a priorizar as suas demandas. Um possível controle total sobre a Internet, por exemplo, para monitorar comunicações, não é viável e muito menos adequado por violar a privacidade das pessoas. Deixar que cidadãos imponham suas vontades também não. Deve haver um equilíbrio que promova a efetiva participação de todos e consolide a democracia na destinação dos recursos. O governo eletrônico requer o suporte financeiro adequado e a capacidade de o governo se manter online [5]. Por trás das várias agências que devem ser integradas, tem que haver um papel coordenador para evitar trabalhos duplicados e assegurar o funcionamento dos serviços de maneira a atender às necessidades dos cidadãos. Restrições legais devem ainda ser observadas como, por exemplo, autenticidade de documentos17. Os próprios servidores públicos precisam saber lidar com as tecnologias (e estarem dispostos a aprender) e se sentirem motivados com a nova abordagem. O armazenamento em meio digital de documentos do governo eletrônico, aliado à integração de sistemas, permite que uma visão global das atividades desenvolvidas possa ser armazenada e até mesmo que um datawarehouse possa ser utilizado para identificar padrões de comportamento, necessidades não reveladas de cidadãos ou até mesmo indícios de fraudes e corrupção. Outra vantagem para o governo é interna, ao permitir, por exemplo, economia na expedição de Avisos18 e Ofícios19. Órgãos governamentais, graças aos meios de comunicação implementados, ganham em agilidade, segurança, custo e simplicidade. Alguns dos desafios do governo eletrônico podem ser enfrentados com o uso de grades computacionais [8]. A diversidade de fontes e formas de disponibilização da informação são tratadas adotando OGSA20 [7], padrão da Arquitetura Aberta para Serviços de Grade. O engajamento de cidadãos é incentivado pelo acesso amplo às bases de dados (permitindo encontrar as informações que desejam) e grades permitem consultas em bases de dados distribuídas com maior quantidade de dados. As grades oferecem a possilidade de independência e autonomia entre os vários 17
No Brasil, segundo a segunda edição do Manual de Redação da Presidência da República, até mesmo um e mail precisa ter certificação digital para que seja válido.
18
Modalidade de comunicação oficial expedida por Ministros de Estado para autoridades de mesma hierarquia. 19
Modalidade de comunicação oficial expedida por e para outras autoridades (não ministros).
20
Do inglês, Open Grid Services Architecture
domínios de informação sob administração e restrições de segurança dos proprietários originais. Com o oferecimento de serviços por meio de TICs, podese concluir que os servidores públicos anteriormente envolvidos nesses serviços podem se tornar desnecessários. Mesmo havendo uma política de contingência, apenas uma pequena parte precisaria ser mantida para caso de falha nos serviços eletrônicos [2]. No entanto, essa idéia só é correta se o governo não tiver a capacidade de remanejar esses funcionários para outras áreas de atuação com deficiência de pessoal e se esses funcionários não tiverem a capacidade de se adaptar às novas áreas. O sucesso do governo eletrônico ainda passa por requisitos como a necessidade de saber medir para gerir, definindo métricas para a avaliação dos serviços prestados, identificando melhorias que podem ser implementadas pelos sistemas eletrônicos e os valores mais importantes do ponto de vista do cidadão. Uma nova forma de serviço deve ser oferecida, focada em eventos para o cidadão (por exemplo, participar em licitações), de maneira que os serviços que estarão integrados executem todos os processos intermediários necessários ao evento (por exemplo, expedição de certidões e habilitações em cadastros) [2]. Vale salientar que a tendência de integração de serviços em um único ponto de “parada” para o cidadão não é uma tendência exclusiva do governo eletrônico. O próprio comércio eletrônico adota estratégia semelhante ao integrar o serviço de entrega no próprio sítio da compra (entrega terceirizada). Fora do mundo eletrônico temos ainda o exemplo de hospitais, em que num mesmo espaço há laboratórios, clínicas de consulta, leitos, psicólogos e espaços de fisioterapia. Um doente pode, em um único lugar, saber o diagnóstico da sua doença e obter o tratamento necessário para sua cura. É importante que no começo haja uma maior atenção e facilidade para que os usuários possam interagir com pessoas em caso de dificuldades. Por melhor que sejam projetados os serviços, algumas pessoas simplesmente não conseguirão acessálos. Será necessário criar uma certa “cultura” de serviços eletrônicos. Aliado a isso, a partir da interação com os usuários iniciais, o sistema poderá ser adaptado de maneira mais rápida evitando que seja criada uma resistência por parte da população. A necessidade de uma fonte gerencial para a coordenação de todos os órgãos garante ainda que órgãos individuais, que não queriam compartilhar dados e nem perder prestígio das suas informações, adotem a política. O governo brasileiro tem iniciativa de sucesso na redução de custos obtida pela utilização das TICs. O pregão eletrônico é um bom exemplo pois, ao facilitar o acesso dos
56
competidores, as TICS permitiram maior competição. É também um exemplo em que leis precisaram ser adequadas ao modelo tecnológico pois em outras modalidades existe a necessidade de expedição prévia de documentos de habilitação dos concorrentes, o que prejudica a agilidade obtida pelas TICs. Melhor ainda seria se as certidões emitidas pelos próprios governos não fossem solicitadas (por exemplo, negativa de débito) e sim automaticamente verificadas (mesmo em governos de diferentes hierarquias). O fato de as informações serem disponibilizadas pelo próprio governo abre uma brecha para que sempre que seja conveniente dados possam ser retirados do acesso público. Em alguns casos, como o citado para forças armadas, eles nem devem ser publicados. Porém deve haver o comprometimento por parte dos governos em aceitar as suas fragilidades e, em caso de possíveis irregularidades, não retirar os dados do público com o objetivo de preservar a imagem. Por parte dos cidadãos, essas fragilidades não devem ser generalizadas para todo o governo e sim vistas com uma tentativa válida de acabar com desvios de conduta. A retirada de informações levaria a uma sensação de falsa transparência, como aconteceu com os dados excluídos de vários órgãos do governo americano após os atentados de 11 de setembro de 2001. A interface das aplicações é um problema especial a ser enfrentado. Como as aplicações egov são destinadas a toda uma população, com necessidades diferentes que incluem desde limitações físicas a fatores culturais, interfaces precisam seguir padrões de acessibilidade e ainda serem compreendidas por cada um dos públicos envolvidos. As opções para essa garantia de acessibilidade envolvem a utilização de os princípios de “Design Universal” [21] ou interfaces personalizadas. A última opção deve ser utilizada com cuidado, sendo apenas um passo em direção às interfaces padrão, a fim de que os usuários não fiquem dependentes das adaptações e logo excluídos de outros serviços (não adaptados) [9]. O desafio da acessibilidade é palavrachave para a W3C, que em sua especificação para o HTML21 5 [23] registra a criação de páginas acessíveis como parte de seu escopo. Além desse desafio, a utilização pela população dos meios de TIC faz com que as autoridades sejam mais facilmente comunicadas a respeito de problemas locais, dificultando omissões. Um exemplo é o sítio “FixMyStreet” [14], em que cidadãos da GrãBretanha podem informar problemas de limpeza e iluminação pública, entre outros. Desafios de Governo Eletrônico voltados para a população também existem: o sítio “Apps for Democracy” [11] estimula uma disputa com prêmios para identificação e resolução de os principais tipos de problemas que podem ser tratados pelas 21
Do inglês, HyperText Markup Language
Figura 1. Interface atual do Portal da Transparência
TICs. O PORTAL DA TRANSPARÊNCIA NO BRASIL
Governos de diversos países têm mostrado interesse em disponibilizar os serviços de governo eletrônico. No entanto, esse interesse nem sempre é permanente e, após alguns passos iniciais, a tendência é abandonada, como se a disponibilização de poucos serviços fosse o suficiente para evoluir o governo tradicional. Como reflexo dessa falta de interesse do governo, e até da própria população, os poucos serviços chegam a deixar de funcionar sem que uma atitude seja tomada. Na teoria os serviços continuam no ar, porém na prática, o cidadão deve mais uma vez enfrentar processos burocráticos para obter o que deseja e os gestores chegam a considerar que a tecnologia é incapaz de atender às necessidades das pessoas, dos empresários e do próprio governo. No Brasil, a ControladoriaGeral da União disponibilizou, em novembro de 2004, um sítio na Internet com o objetivo de reunir os gastos do Governo Federal em um único lugar. A iniciativa foi criada com a intenção de fortalecer a defesa do patrimônio público e incrementar a transparência da gestão, papéis exercidos pela Controladoria, através do chamado “Controle Popular” dos gastos federais. Esse controle é visto pelo órgão como um dos mais eficientes, por permitir que qualquer cidadão com acesso a Internet possa fiscalizar os recursos que foram repassados ou aplicados pelo governo nas diversas localidades do país. Por maior que seja o quadro de auditores do órgão não há a possibilidade de fiscalizar tudo, e o cidadão, simplesmente com o uso da Internet e na localidade onde o recurso foi aplicado, é capaz de verificar se a destinação do dinheiro foi correta. O Portal foi lançado contendo um total de gastos no valor de 70 bilhões de reais, o que corresponde a cerca de pouco menos de 10 por cento do valor total gasto no período pelo
57
Governo Federal. Apesar do pouco valor relativo, os principais gastos que poderiam ser fiscalizados pelo cidadão, como os programas Bolsa Família e Bolsa Alimentação, foram incluídos inicialmente. Hoje em dia o Portal foi complementado, e há um total de gastos para aquele ano (2004) no valor aproximado de 840 bilhões de reais. Desde então o Portal vem sendo atualizado mensalmente e já conta com uma exposição de valores superior a 5 trilhões de reais, dividida em Gastos Diretos do governo e Transferências de Recursos. Uma visão da interface atual do portal pode ser vista na figura 1.
dado procurado. A pesquisa por Estado/Município, por exemplo, pode ser utilizada por organizações da sociedade civil para saber de maneira facilitada se os cidadãos mais necessitados da localidade são os atendidos pelo governo. A pesquisa por Ação de Governo envolve um certo conhecimento de orçamento, para entender o significado técnico das várias ações. A consulta por Favorecido é a consulta mais direta na intenção de fiscalizar se um determinado cidadão está recebendo recurso federal e permite que aqueles que participam de programas sociais verifiquem se seus repasses foram creditados.
Divisão das Consultas
Consulta de Gastos Diretos
A divisão das consultas em Gastos Diretos e Transferências de Recursos é uma dificuldade enfrentada no início pelo cidadão. Essas divisões refletem a maneira como o governo gasta o dinheiro. Os Gastos Diretos representam os gastos efetuados com compras, contratação de obras e serviços, e Cartões de Pagamento (Cartões Corporativos). As Transferências de Recursos correspondem aos gastos com repasses de verbas para os cidadãos (Programas Sociais) ou para os Estados e os Municípios. Os gastos, em sua maior parte, são bem detalhados incluindo até o nome do favorecido. No entanto, apesar de haver dicas e instruções de como acessar os dados, para o cidadão comum é difícil saber por onde iniciar a pesquisa ou até mesmo entender a classificação dos gastos (função, subfunção, programa, ação, entre outros aspectos). Dificuldades Encontradas pelos Cidadãos
A dificuldade em encontrar dados tem origem principal na falta de conhecimento técnico dos cidadãos sobre os termos da execução orçamentária. No entanto, o cidadão quer ter acesso rápido aos dados sem gastar tempo com pesquisas e aprendizagens de termos técnicos. O interesse do cidadão, difícil de ser obtido, passa a ser desperdiçado quando a falta de conhecimento e habilidade para obtenção dos dados o faz desistir da pesquisa. Por outro lado, alguns segmentos com maior conhecimento técnico, como os órgãos de controle, têm maior facilidade e precisam da divisão dos gastos na maneira como eles são detalhados no orçamento. A abordagem atual não pode ser descartada, porém deve haver uma complementação para permitir que os gastos sejam demonstrados de maneira simplificada. Consulta de Transferências de Recursos
A consulta de Transferências de Recursos pode ser feita por Estado/Município, por Ação de Governo22 e por Favorecido. Em qualquer caso as informações obtidas são as mesmas, diferindo somente na maneira de encontrar o 22
Conjunto de operações cujos produtos contribuem para os objetivos do programa governamental (fonte: Câmara dos Deputados)
Os Gastos Diretos do governo podem ser consultados por Ação Governamental, por Tipo de Despesa, por Órgão Executor e por Favorecido. A pesquisa por de Tipo de Despesa23 permite uma visão mais global dos gastos devido a um maior agrupamento das informações, embora, assim como a pesquisa por Ação de Governo, também precise de um maior conhecimento técnico. A consulta por Órgão Executor permite saber, com um menor conhecimento técnico, em quais áreas (ministérios) está havendo a maior aplicação de dinheiro. Adicionalmente, consultas específicas que despertam maior atenção do público, como gastos com Diárias e Cartões de Pagamento, estão disponíveis, permitindo a melhor fiscalização dos gastos realizados por Servidores Públicos. Os gastos sigilosos não são detalhados, para segurança da sociedade. Uma parcela significativa, de até trinta por cento dos gastos de cartão, são sigilosos. A consulta por gastos com Cartões de Pagamento do Governo Federal, nome oficial dos Cartões Corporativos, foi responsável por uma crise política no governo brasileiro. Algumas autoridades foram acusadas pelo seu uso irregular para pagamento de despesas pessoais e até mesmo uma ministra foi exonerada. As consultas mais elaboradas, como Ação Governamental, permitiram que casos semelhantes fossem identificados. Os escândalos mostram uma correta posição do governo brasileiro em relação ao que fazer nesses momentos: os dados até hoje estão disponíveis para consulta e investigações foram feitas para avaliar as irregularidades. Novos meios de pesquisa foram implantados no Portal, como a consulta de gastos de cartão por portador, para tornar mais simples a identificação de abusos e buscar uma maior transparência. Outras Consultas
Outra possibilidade de consulta são os convênios firmados 23
Desdobramento da despesa com pessoal, material, serviços, obras e outras meios de que se serve a administração pública para a consecução dos seus fins (fonte: Tesouro Nacional)
58
com o governo, nos quais há repasses de valores para entidades não integrantes da Administração Pública Federal. Com ela, o cidadão sabe exatamente quando e qual valor é repassado para os convênios de sua localidade e pode cobrar pertinentemente a atuação do convenente. Há também a possibilidade de recebimento de email sempre que houver algum repasse de verba para o município. Essa é uma técnica utilizada para facilitar o acesso aos dados e manter o cidadão informado sobre os repasses (técnica semelhante, porém com a utilização do rádio, é adotada em países como o Sri Lanka [12] para a divulgação de informações em locais com acesso restrito à Internet). É possível denunciar diretamente à CGU suspeitas de irregularidade, para que o órgão realize os procedimentos cabíveis. Facilidades Oferecidas pelo Portal
Para incentivar o acesso de qualquer pessoa e evitar que os usuários esbarrem em dificuldades na busca dos dados, não há solicitação de cadastro para as consultas. Em reconhecimento pela sua importância, o sítio também já recebeu diversos prêmios, como o Prêmio TI & Governo, Inovação na Gestão Pública Federal e Desburocratização Eletrônica. Alguns desses prêmios são específicos para governo eletrônico, como o Prêmio TI & Governo, e a facilidade de acesso contribuiu para que a categoria e Democracia fosse a vencida. Em outras categorias, como o eServiços Públicos, não houve premiação para o Portal, reforçando o escopo do sítio ao domínio de atuação da própria ControladoriaGeral. Limitações e Outras Dificuldades
A autonomia dos poderes do governo (Executivo, Legislativo e Judiciário) faz com que o Portal exiba somente os gastos do poder Executivo Federal, contrariando o sentido de um único ponto de parada para o cidadão. Uma possível solução seria a criação de um pacto ou uma lei com a formação de um grupo de representantes de cada um dos poderes, com capacidade para tomar e implantar decisões. Como desvantagem haveria a maior dificuldade em conseguir um envolvimento nesse nível, maior demora na tomada de decisões e a consequente demora para a implementação e a manutenção dos serviços. Há uma lei24 que obriga a divulgação dos dados de execução orçamentária de todas as esferas do governo pelo Tribunal de Contas da União (TCU), porém o sítio de divulgação muitas vezes está desatualizado e não possui o detalhamento desejado pelo cidadão. Para uma única subdivisão do governo eletrônico, e democracia, objetivo principal do Portal da Transparência,
24
Lei nº 9.755, de 16 de dezembro de 1998
há a necessidade de integrar quatro órgãos diferentes: FNS25, STN26, CEF27 e BB28. Esses órgãos não são subordinados à ControladoriaGeral da União e mostram que mesmo as entidades de direito privado, como o BB, precisam colaborar para a implantação do governo eletrônico. O caso específico do BB trata dos gastos com os cartões de pagamento. O FNS, a STN e a CEF são responsáveis por fornecer os dados de Transferências de Recursos. A STN fornece os gastos com Gastos Diretos. A obrigação legal de os órgãos fornecerem os dados decorre de um decreto do Presidente da República29 que engloba somente os gastos do poder Executivo. O decreto especifica também que Páginas de Transparência Pública, que contêm, entre outros, os gastos com licitações, contratos e convênios, devem estar presentes em todos os sítios de órgãos e entidades da administração pública federal, direta e indireta. Programas Relacionados
O Portal faz a divulgação de outros programas do governo com o objetivo de obter o apoio da população em outras formas de controle social. Um deles é o programa Olho Vivo, em que conselheiros municipais, lideranças locais, agentes públicos municipais, professores e alunos são orientados para promover a transparência e cumprimento dos dispositivos legais. Com as facilidades da Internet, o programa utiliza em uma das suas ações a educação a distância. As páginas de Transparência Pública também são divulgadas. Outra fonte valiosa de informação, principalmente para os gestores públicos, trata da relação consolidada de empresas consideradas inidôneas para contratação com a Administração Pública. Essas empresas cometeram sanções previstas em leis federais e a lista serve de orientação para os processos de compras. Avaliação de ONGs
Com o objetivo de obter diferentes visões sobre o Portal da Transparência, foi feita uma pesquisa com entidades/ONGs30 internacionais e locais que atuam nas áreas de transparência e combate à corrupção buscando o engajamento do cidadão nas ações do governo. O objetivo da pesquisa foi avaliar a adequação da interface do Portal e sua utilização por tais entidades. O resultado mostrou que, se para o cidadão comum há dificuldades de navegação, as 25
Acrônimo para Fundo Nacional de Saúde
26
Acrônimo para Secretaria do Tesouro Nacional
27
Acrônimo para Caixa Econômica Federal
28
Acrônimo para Banco do Brasil
29
Decreto nº 5.482, de 30 de junho de 2005
30
Acrônimo para Organizações não governamentais
59
entidades não encontram os mesmos problemas e inclusive sentem falta de detalhes mais técnicos. As perguntas estão listadas abaixo: I A entidade utiliza o sítio Portal da Transparência de alguma forma no incentivo ao Combate à Corrupção? Poderia dizer como? Todas as entidades pesquisadas responderam que utilizam o sítio, em proporções que vão desde unicamente a consulta aos gastos com cartão de pagamento até elogios pela completude do sítio. Quando utilizado parcialmente, outros sítios como o Siga Brasil31 (com informações dos gastos dos três poderes), são utilizados para complementação das informações. II Por o Portal da Transparência ser uma ferramenta oficial de divulgação dos gastos públicos, a entidade sente falta de algum dado ou facilidade não disponível? Houve ponderações sobre a ausência de gastos das empresas estatais/sociedades de economia mista, os meios de aquisição utilizados nas compras e (mais especificamente com relação aos cartões) sobre a descrição dos bens comprados. Um fator levantado mais de uma vez foi a dificuldade em se fazer cruzamentos dos gastos realizados. Esse motivo, inclusive, foi uma das causas para utilização de outros sítios. III Há dificuldade em utilizar/encontrar os dados no Portal da Transparência? Há Lentidão? A navegação amigável? A usabilidade do sítio foi elogiada, sendo a navegação classificada até como muito fácil. Tal facilidade foi complementada por avaliações de acessibilidade feitas com ferramentas específicas para esse fim e discutidas na seção a seguir (seção “Comparação com Outros Portais”). Encontrar os dados foi considerado uma tarefa simples e a navegação do portal rápida. Essa visão contrasta com as dificuldades encontradas pelo cidadão e, a princípio, pode ser justificada pela maior familiaridade dos avaliadores com termos técnicos. Uma avaliação mais profunda é necessária para confirmação. COMPARAÇÃO COM OUTROS PORTAIS
O Portal da Transparência pode ser considerado o principal sítio do Governo Federal para a divulgação dos seus gastos. Porém, por sua própria característica, não há concentração de todas as funcionalidades de governo eletrônico. O portal de Governo Eletrônico do Brasil, o sítio do Governo Brasileiro e ainda os sítios dos diversos órgãos que compõem a Administração Federal contam com outros 31
http://www9.senado.gov.br/portal/page/portal/orcamento\ _senado/SigaBrasil
Figura 2. Interface do Portal da Singapura
serviços, como citado na seção “Introdução”. Para comparar o estado da evolução do governo eletrônico brasileiro, será feita a seguir uma revisão de outros sítios de governo eletrônico no Brasil e no mundo, levandose em consideração a oferta de serviços, nível de detalhamento dos gastos e meios de acesso. O portal de governo eletrônico de Singapura32 é visto na figura 2 e se destaca por oferecer uma grande quantidade de serviços para o diaadia do cidadão. Serviços como emissão de boletins de ocorrências e passaportes, marcação de consultas médicas e pagamento de tributos estão disponíveis online. O pagamento é simplificado, podendo ser utilizado até mesmo o cartão de crédito. Adicionalmente, há informações para os serviços que não podem ser efetuados eletronicamente e a opção para dispositivos móveis. O Brasil possui alguns dos serviços oferecidos (por exemplo, boletim de ocorrência), porém não há a mesma facilidade para transações que envolvam pagamentos. Por outro lado, há um detalhamento de gastos maior no sítio brasileiro. O sítio da África do Sul33 (figura 3) provê a integração de serviços para os cidadãos, organizações e estrangeiros, constituindo um meio de comunicação oficial sobre documentos, eventos, leis e informações em geral (é possível, por exemplo, consultar a constituição do País, entender sua estrutura organizacional ou obter um estudo sobre o sistema prisional). A parte de serviços permite consultas com o uso do SMS, porém a maioria dos serviços não permite a resolução online dos problemas e sim presta orientações de como o cidadão deve proceder para obter o que deseja, geralmente incluindo uma ida a um posto físico do governo. Não há detalhamento dos gastos realizados e a 32
http://www.ecitizen.gov.sg
33
http://www.gov.za
60
Figura 3. Interface do Portal da África do Sul Figura 5. Interface do Portal do Estado de São Paulo
de 2 milhões [10], para uma população estimada de 1,5 milhão. Em comparação, o Portal da Transparência brasileiro registrou em sua época de lançamento 1,8 milhão de consultas às suas páginas, para a população estimada de 180 milhões de habitantes. Igualmente a Singapura e África do Sul, não há maiores preocupações com a divulgação dos gastos públicos.
Figura 4. Interface do Portal de Dubai
página do governo Brasileiro oferece um meio oficial de comunicação mais atualizado. Os documentos africanos parecem mais simples de serem compreendidos, facilitando o envolvimento da população.
O governo do Estado de São Paulo35 oferece serviços tradicionais como consultas de veículos, certidões criminais e ainda notas fiscais eletrônicas. Os dados abrangem tanto a receita como a despesa e são exibidos de forma semelhante às despesas no Portal da Transparência (função, subfunção, programa, entre outros). Sua interface é vista na figura 5. Não há o mesmo detalhamento do sítio do Governo Federal, não sendo possível, por exemplo, identificar os responsáveis (pessoas físicas) pelos gastos com Cartões de Pagamento. Um exemplo de serviço que pode ser replicado por diversos governos e é disponibilizado pelo estado é o WebTransplante, em que os profissionais de saúde do estado informam transplantes realizados e atualizam a lista dos pacientes em espera por órgãos. Além de promover a redução de custos na manutenção dos cadastros, o serviço permite principalmente a melhora na saúde da população pela agilidade na atualização das informações e diminuição de erros e perdas de documentos.
O governo de Dubai provê um sítio34 com quase quatrocentos serviços online para o público e empresários, que incluem desde permissões para visitar santuários até serviços de recrutamento. O sítio, visto na figura 4, tem em seus objetivos o fortalecimento da economia local (provendo melhores serviços para as organizações) e a diminuição dos custos da máquina pública (reduzindo a necessidade de pessoal e instalações físicas). Meios alternativos de acesso como SMS e correio eletrônico são oferecidos e as facilidades de pagamento incluem o cartão de crédito. O número de transações online executadas passa
Um sítio que merece destaque como iniciativa governamental é o sítio do Chile. O governo do Chile tem como princípio que é ele mesmo quem deve criar a necessidade dos serviços egov [6]. Tramitação online de documentos, pagamento de taxas e um portal de compras são algumas das facilidades oferecidas. Infelizmente, carece de traduções para outras línguas.
34
35
http://dubai.ae/en.portal
http://www.cidadao.sp.gov.br/
61
Comparação de acessibilidade pelo ASES e DaSilva
O ASES, Avaliador e Simulador de Acessibilidade de Sítios, é uma ferramenta oficial disponibilizada pelo Governo Federal em sua página de governo eletrônico 36 para verificação de conformidade com o padrão eMAG. O padrão é baseado no WCAG37 v1 do W3C [24] e especifica as recomendações e obrigações a serem observadas pela Administração Pública no que tange à acessibilidade. Três níveis de prioridade são definidos: no nível 1, a não implementação de uma obrigação impede a acessibilidade do sítio de pelo menos um grupo de usuários; no nível 2, obrigações não cumpridas criam grandes obstáculos de acessibilidade; no nível 3, obrigações não implementadas podem gerar dificuldades [4]. As recomendações em geral precisam de certo julgamento subjetivo por parte do desenvolvedor e não serão avaliadas nesse artigo. O Portal da Transparência foi o sítio do Governo Federal escolhido, por sua maior visibilidade, para comparação de acessibilidade e apresentou boa compatibilidade com os requisitos avaliados pelo ASES. Para as páginas avaliadas, na prioridade 1 apenas uma falha (de fácil resolução) foi encontrada. Tratouse de uma imagem que não apresentou descrição textual equivalente (Recomendação 1.11 e MAG). Para prioridade 3, houve o uso de tags ultrapassadas (Recomendação 3.1 eMAG). Não houve falhas de prioridade 2. O portal do estado de São Paulo apresentou bom desempenho, assim como o sítio de Transparência do Governo Federal. Por serem portais brasileiros, podese concluir que os desenvolvedores tiveram o cuidado de adequálos às recomendações oficiais, demonstrando eficiência e efetividade. O sítio de Singapura, por sua vez, apresentou uma série de problemas quanto aos requisitos definidos pelo eMAG. Além de várias figuras sem descrição correspondente, havia dimensões especificadas com valores absolutos (violando a Recomendação 2.2 eMAG), frames inacessíveis (Recomendação 1.16 eMAG), falta de definição de idioma (Recomendação 1.1 eMAG), entre muitos outros. Os portais da África do Sul e de Dubai demonstraram problemas semelhantes ao de Singapura, mostrandose pouco acessíveis pela visão do eMAG. Por serem sítios de outros países, logo não regidos pela legislação brasileira, a não conformidade com o padrão era esperada. Uma consideração a ser feita é que alguns dos erros encontrados pela ferramenta ASES não foram efetivamente erros (falsos erros). Como exemplo, a ferramenta teve dificuldades em identificar corretamente as unidades em que estão dimensionadas as figuras. Outro erro comum foi a não identificação de labels para determinadas tags do código
Sítio
Prioridade 1 Prioridade 2 Prioridade3
Portal da Transparência
1
0
1
Portal da Singapura
6
4
2
Portal da África do Sul
3
4
2
Portal de Dubai
5
4
2
Portal do Governo de São Paulo
2
3
0
Tabela 1. Erros distintos de acessibilidade segundo o eMAG/ ASES (Avaliação de cinco páginas para cada sítio).
HTML. Tais erros não foram levados em consideração. O sítio DaSilva é uma versão atualizada do ASES disponível para uso na Web e, assim como esse, identificou os mesmos tipos de erros. Funcionalidades adicionais como simuladores para baixa visão e cegos não foram objetos de avaliação. A tabela 1 mostra o total de erros distintos por sítio avaliado, para uma média de 5 consultas diferentes por sítio. Comparação de Acessibilidade pelo TotalValidator
A ferramenta online TotalValidator38 foi utilizada para verificação de conformidade dos sítios com o padrão WCAG v2 AAA [22] e identificou uma quantidade maior de erros em todas as avaliações. Tal diferença se deu tanto na quantidade de erros diferentes identificados quanto na diminuição de falsos erros levantados pelo ASES. No lugar de uma avaliação de nível de prioridades, o TotalValidator, seguindo as regras do W3C, apresenta três níveis de “Critérios de Sucesso”. Para o nível A, ferramentas de acessibilidade tornam o sítio acessível. No nível AA, há um maior suporte à tecnologia assistiva e também facilidades para aqueles que não dispõem de tal tecnologia. O nível AAA aperfeiçoa o suporte às tecnologias assistivas e também o acesso comum.
36
O Portal da Transparência obteve um desempenho um pouco inferior nessa nova análise, embora devase levar em consideração que o WCAG v2 possui regras mais atualizadas que o eMAG (dezembro/2008, enquanto que a última versão do eMAG é de dezembro de 2005). Como exemplos de problemas não anteriormente considerados
37
38
http://www.governoeletronico.gov.br Do inglês, Web Content Accessibility Guidelines
http://www.totalvalidator.com
62
Sítio
Critério A Critério AA Critério AAA
Sítio
Critério A Critério AA Critério AAA
Portal da Transparência
7
0
0
Portal da Transparência
37
0
0
Portal da Singapura
9
1
1
Portal da Singapura
168
136
1
Portal da África do Sul
8
1
0
Portal da África do Sul
160
43
0
Portal de Dubai
17
2
1
Portal de Dubai
455
109
2
Portal do Governo de São Paulo
10
1
0
Portal do Governo de São Paulo
259
28
0
Tabela 2. Erros distintos de acessibilidade segundo o TotalValidator (Avaliação de cinco páginas para cada sítio).
Tabela 3. Erros totais de acessibilidade segundo o TotalValidator (Avaliação de cinco páginas para cada sítio).
citamos identificadores duplicados e não possibilidade de mudança explícita de contexto (botão submit). Erro repetido, como a falta de descrição textual de figura, foi novamente identificado. Um total de seis erros distintos foram encontrados, todos no nível de “Critério de Sucesso” A. O Portal da Transparência não está obrigado a cumprir o WCAG v2, e uma atualização dos normativos legais poderia forçar a compatibilidade com esse padrão. O sítio do Governo de São Paulo também apresentou maior quantidade de erros.
merecem uma futura avaliação para que os sítios não sejam somente acessíveis por quem tem domínio de tecnologia e conhecimento.
Os sítios internacionais mais uma vez apresentaram desempenho inferior ao Portal da Transparência. Houve casos em que a quantidade de erros chegou a mais de quatrocentos, em quantidade absoluta, e a vinte, em tipos diferentes. Além disso, erros para os três “Critérios de Sucesso” foram identificados. Levandose em conta que os vários países avaliados não exigem cumprimento legal das recomendações, a ferramenta pode ser considerada a mais justa e completa para a avaliação dos sítios citados (entre as ferramentas consideradas). As tabelas 2 e 3 trazem, respectivamente, a quantidade total de erros encontrada para cada sítio avaliado e a quantidade de erros distintos.
CONCLUSÕES
O artigo apresentou uma comparação de acessibilidade entre sítios nacionais e internacionais de governo eletrônico. Sítios de países diversificados foram escolhidos, para que houvesse uma comparação mais justa com o Brasil. Para uma avaliação ainda mais imparcial, três ferramentas de validação foram utilizadas. Os resultados mostraram que, dentre os sítios avaliados, os brasileiros apresentaram maior conformidade com os padrões W3C, o que não significa que os mesmos podem ser considerados maduros nas questões de acessibilidade no governo eletrônico. Além de não haver um modelo de adequação entre os sítios analisados, os fatores relacionados à terceira onda de IHC não foram considerados.
Apesar de as páginas terem sido avaliadas sob diversas regras de acessibilidade, alguns aspectos limitadores, como dificuldades para analfabetos funcionais, pessoas de baixa instrução e pouca familiaridade com a tecnologia, entre outros, não foram considerados. Tais aspectos estão relacionados à terceira onda de IHC39 [1,9,13,15,16] e
Apesar da ponderação no parágrafo anterior, o Portal da Transparência se destacou por cumprir praticamente todos os requisitos do eMAG, enquanto que os sítios internacionais, avaliados nesse trabalho, apresentaram indíces de erro até seis vezes maior. Mesmo quando considerase que o eMAG é um padrão brasileiro, tal discrepância não pode ser totalmente justificada uma vez que o padrão tem sua base no WCAG v1. A comparação com base no WCAG v2, por sua vez, foi ainda mais vantajosa para o Portal da Transparência, chegando alguns sítios a apresentarem uma média de mais de cinquenta problemas de acessibilidade por página.
39
Foi apresentado ainda um questionário com as respostas
Outros fatores de comparação
Acrônimo para Interação homemcomputador
63
obtidas de entidades/ONGs a respeito da utilização do Portal da Transparência. O objetivo da pesquisa era saber se estava havendo reconhecimento por parte dos cidadãos a respeito do esforço de governo eletrônico feito pelo governo brasileiro, eventuais dificuldades não identificadas, e, principalmente, obter respostas de formadores de opinião a respeito da acessibilidade e facilidade/navegação do sítio. Além disso, iniciativas como “Apps for Democracy” e “FixMyStreet” foram apontadas para acompanhamento da evolução do governo eletrônico pelo mundo. Essas avaliações serão utilizadas como sugestão para melhorar o sítio e tornálo mais fácil de usar e acessível para um número maior de cidadãos independentemente de nível educacional e das necessidades específicas de cada um. AGRADECIMENTOS
Os autores gostariam de agradecer ao sítio Contas Abertas, a Transparency International, ao Instituto de Fiscalização e Controle e ao Escritório das Nações Unidas sobre Drogas e Crime pela participação na avaliação do Portal da Transparência. REFERÊNCIAS
1. Bertelsen, O. W., Tertiary artefactness at the interface, P. Fishwick, ed., Aesthetic Computing (MIT Press, Cambridge, MA, USA), 2006, p.357368. 2. Camilo Lourenço e Luís Campos Henriques, E Government: Um Novo Modelo de Administracao Pública, Emotion 10 (2003). 3. Comitê Executivo de Governo Eletrônico, ePING, Padrões de Interoperabilidade de Governo Eletrônico, Documento de referência, Governo Brasileiro, Dezembro 2008. 4. Departamento de Governo Eletrônico, eMAG, Acessibilidade de Governo Eletrônico, Documento de referência, Secretaria de Logística e Tecnologia da Informação, Ministério do Planejamento, Orçamento e Gestão, Dezembro 2005. 5. DPADM/UNDESA, Guiding Principles For Successful EGovernment, http://unpan1.un.org/intradoc/groups/public/documents/ un/unpan008627.pdf, Acessado em 09 de março de 2009. 6. Eduardo Contreras Budge, Chile EGov Experiences and Lessons, Digital Opportunities for Development (2003). 7. Globus Alliance e Grid community, The Open Grid Services Architecture, http://www.globus.org/ogsa/, Acessado em 9 de agosto de 2009.
C. R. G. de Farias, Grid Platforms for eDemocracy Applications, Proc. 11º IEEE Symposium on Computers and Communications (2006), 334339. 9. Hornung, Heiko Horst, Design de interação em serviços inclusivos de governo eletrônico, Tese de Mestrado, Universidade Estadual de Campinas, Instituto de Computação, 2008. 10. Hussain Nasser Lootah, Dubai Municipality’s e Government Initiative, www.dm.gov.ae (2006). 11. iStrategyLabs, AppsForDemocracy, http://www.appsfordemocracy.org/ , Acessado em 11 de agosto de 2009. 12. Jeremy Grace, Charles Kenny e Christine Quiang, Information and Communications Technologies and BroadBased Development: A Partial Review of the Evidence, World Bank DECRA Research Project (2001). 13. McCarthy, J. e Wright, P., Technology as experience, MIT Press, Cambridge, MA, USA. (2004). 14. MySociety.Org, FixMyStreet, http://www.fixmystreet.com/, Acessado em 11 de agosto de 2009. 15. Norman, D. A., Emotion & design: attractive things work better, Interactions 9 (2002), 3642. 16. Norman, D. A., Emotional Design: Why We Love (Or Hate) Everyday Things, Basic Books (2004). 17. Peristeras Vassilios, eGovernment Applications, Capacity Building programme for Diplomats: Strengthening Capacity on e Government and ICT Policy, Módulo 9 (2003). 18. SAGA, Standards and Architectures for egovernment Applications, KBSt Publication Series 59 (2003). 19. Satyanarayana, eGovernment Principles, http://siteresources.worldbank.org/ INTEGOVERNMENT/Resources/eGovPrinciplesJS5N ov06.ppt, Acessado em 10 de março de 2009. 20. Soha Maad, Brian Coghlan, John Ryan, Eamonn Kenny, Ronan Watson e Gabriele Pierantoni, The Horizon of the Grid for Egovernment, eGovernment Workshop (2005). 21. Story, M. F., Maximising Usability: The Principles of Universal Design, Assistive Technology 10 (1998), 4 12. 22. W3C World Wide Web Consortium Recommendation 11 Dezembro 2008 (http://www.w3.org/TR/2008/REC WCAG2020081211/, Latest version at http://www.w3.org/TR/WCAG20/, Web Content Accessibility Guidelines 2.0.
8. H. Senger, F. A. B. Silva, M. de J. Mendes, R. Rondini e
64
23. W3C World Wide Web Consortium Recommendation 23 Abril 2009 (http://www.w3.org/TR/2009/WDhtml5 20090423/, Latest version at http://www.w3.org/TR/html5/, HTML 5.
24.W3C World Wide Web Consortium Recommendation 5 Maio 1999 (http://www.w3.org/TR/1999/WAI WEBCONTENT19990505/, Latest version at http://www.w3.org/TR/WAIWEBCONTENT/, Web Content Accessibility Guidelines 1.0.
65
Construção de um modelo de interação para serviços de governo eletrônico promovendo inclusão digital Blind Review Blind Review Blind Review ABSTRACT
As digital divide has been pointed out as a significant weight in social issues, a Brazilian telecommunications research found – Funttel – has sponsored a project in order to promote digital inclusion of illiterate and/or impaired people. Illiterate people have not yet enough solutions to overcome the barriers for their access as countries that are recognized as important developers in the world have no longer this kind of reality. A multidisciplinary work was done to understand these users’ needs and mental models to get an attractive and friendly interface for e-gov services. This research concluded the importance of keeping proximity with users’ daily reality in order to overcome the barriers for digital inclusion. Navigation, iconic and linguistic resources were incorporated in order to achieve this goal. Accessibility resources were embedded to make the navigation process easier. The interface layout was conceived to minimize elements in the screen and at the same time to show clearly each page functionality and tasks, reducing the navigation steps needed to conclude any task. This paper brings some details of this project besides the motivation and challengers found while the work was being developed. Author Keywords
O uso cada vez mais extensivo das tecnologias de informação e comunicação (TICs) em várias instâncias da vida cotidiana e nos processos oficiais tem aumentado a correlação que há entre exclusão social e exclusão digital, evidenciando a urgência de soluções para este problema. O projeto STID (Soluções de Telecomunicações para Inclusão Digital), financiado com recursos do Fundo para o Desenvolvimento Tecnológico das Comunicações (FUNTTEL), tem por objetivo o planejamento de alternativas para a implantação de projetos governamentais de inclusão digital no Brasil, avaliando e desenvolvendo soluções e tecnologias baseadas em serviços e plataformas de telecomunicações. A noção mais comumente empregada para o termo inclusão digital remete à disponibilidade de meios físicos necessários para a conexão à Internet: computadores, provedores de acesso e serviços de telecomunicações (Silveira, 2001). No entanto, a oferta de conectividade por si é insuficiente para transpor o fosso digital. Há barreiras mais sutis a serem vencidas. A análise dos motivos pelos quais as pessoas nunca utilizaram a Internet revela a existência dessas outras barreiras. A Figura 1 mostra o resultado desse levantamento no Brasil. 70
Digital inclusion, multidisciplinary interface, interface usability, interface accessibility
60
ACM Classification Keywords
40
H5.m. Information interfaces and presentation (e.g., HCI): Miscellaneous. INTRODUÇÃO
50 Falta de habilidade com o computador/internet Não tem necessidade/ interesse Não tem condições de pagar o acesso Não tem de onde acessar NS/NR
30 20 10
Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA. Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
0 Analf abeto/ Educação infantil TOTAL BRASIL Fundamental
Médio/Superior
Fonte: CGI (2009) Figura 1: Motivos pelos quais nunca utilizou a Internet. Percentual sobre o total de pessoas que nunca acessaram a Internet, mas usaram um computador, por grau de escolaridade.
66
O motivo econômico aparece em terceiro lugar em importância, com apenas um terço da incidência do motivo mais alegado. A tipologia adotada no projeto STID classifica as barreiras ao acesso em três categorias hierárquicas (Holanda e Dall'Antonia, 2006): •
Conectividade: provimento terminais e redes de acesso.
de
recursos
físicos:
•
Usabilidade e Acessibilidade: barreiras associadas às limitações físicas, cognitivas e sensoriais do usuário.
•
Inteligibilidade: adequação de conteúdos e interfaces às características culturais e lingüísticas dos usuários.
A alta incidência dos que alegam falta de habilidade, principalmente nos estratos de baixo letramento, como motivo para nunca terem acessado a Internet é um provável revelador da falta de inteligibilidade e usabilidade/ acessibilidade das interfaces. Contribui para esse resultado o fato da Internet ter sido concebida para pessoas com bom nível de letramento, em grande medida. De acordo com Sardinha (2008), os textos que constam no sítio do SUS1 (Sistema Único de Saúde), do Ministério da Saúde, por exemplo, exigem por volta de 18 anos de escolaridade para serem bem compreendidos, isto é, nível de pós-graduação2. A escolaridade média dos brasileiros de mais de 15 anos em 2006, segundo dados da PNAD, era de 7,2 anos. Devido ao fato dos países que mais investem em pesquisa terem pouca incidência de pessoas com baixo letramento, há uma grande escassez de soluções para esse segmento do público-alvo. Além de adultos com baixo letramento, o público-alvo do projeto STID é formado também por deficientes visuais e auditivos. As pesquisas que resultaram no modelo de interação apresentado neste artigo iniciaram-se em uma parceria firmada entre a Fundação CPqD e três grupos de pesquisa ligados à Unicamp e à USP (Osorio et. al, 2009). As pesquisas realizadas nessa fase investigaram as particularidades e necessidades do público-alvo na interação com as TICs, resultando em novas linguagens e modelos de interação para interfaces de governo eletrônico voltadas para o público-alvo. Os resultados dessa investigação balizaram a elaboração dos requisitos do modelo de interação. Como exemplo, concluiu-se sobre a importância de se manter uma proximidade com o imaginário cotidiano do público-alvo, o que se dá, num ambiente hipertextual, mediante a reiteração de estruturas. Outro resultado também determinante para o 1 2
Foram analisadas 254 páginas do sítio do SUS.
Foi usado um índice conhecido como Flesch-Kincaid para avaliação do nível escolar necessário (Martins & Filgueiras, 2007).
modelo de interação é o fato de os processos cognitivos do público-alvo se aproximarem mais da oralidade e da orientação visual do que de estratégias de comunicação escrita. Os modelos de interação propostos foram elaborados em oficinas participativas e posteriormente implementados em protótipos que foram submetidos a testes com representantes do público-alvo. Dois serviços de governo eletrônico, um de marcação de consultas em postos de saúde (Inclua Saúde) e um de informações sobre aposentadoria (Previdência Fácil), foram implantados em dois telecentros localizados nas cidades paulistas de Santo Antônio de Posse e Bastos. Nesses locais a inteligibilidade das soluções de interface propostas foi testada junto a representantes do público-alvo, resultando em aperfeiçoamentos dos modelos propostos. Este artigo apresenta, sob forma de recomendações, as linhas gerais do modelo de interação proposto, contendo as realimentações dos testes de campo realizados até aqui. Intenta-se que uma interface produzida com base no modelo de interação proposto contribua para a redução das barreiras à plena fruição de serviços eletrônicos por usuários do público-alvo. A primeira seção expõe o conceito de inteligibilidade usado no projeto STID. Em seguida são descritos de forma sucinta os resultados da investigação a respeito das habilidades e necessidades do público-alvo. A seção seguinte apresenta o modelo de interação sob a forma de recomendações e diretivas de implementação da interface. O artigo finaliza com a apresentação das conclusões e sugestões de trabalhos futuros. CONCEITO DE INTELIGIBILIDADE
Segundo Ávila, Ogushi & Bonadia (2006), garantir a usabilidade e a acessibilidade de uma TIC ainda não garante a apropriação da tecnologia pelo indivíduo. É necessário também garantir a inteligibilidade, que é a adequação dos conteúdos e das interfaces aos perfis culturais e lingüísticos, associado ao nível de letramento de cada usuário. Nesse contexto, nível de letramento se refere aos níveis de letramento formal na língua materna (português em suas diversas variantes regionais), e o letramento na língua do Estado, também conhecida como norma culta da língua, na qual são produzidos quase todos os conteúdos referentes a serviços de governo e cidadania. A isso se devem juntar os níveis de letramento em Braile e Libras, nos casos dos deficientes visuais e dos auditivos, respectivamente, e também destes últimos em relação à língua portuguesa, quando se tratam de surdos oralizados. Nesta adequação de conteúdo são considerados, também, aspectos de ergonomia cognitiva, que correspondem aos modelos mentais e às estratégias de memorização e abstração empregadas pelo público-alvo da interface para
67
vencer a barreira que sua condição impõe à interação com os conteúdos digitais disponíveis na Internet.
não sendo o foco principal do projeto não podem ser excluídas por ele.
Esse entendimento dos conceitos de usabilidade, acessibilidade e inteligibilidade, aplicados de forma a superar as barreiras inerentes ao público-alvo, foram transpostos para o modelo de interação, resultando em algumas diretrizes, descritas a seguir.
DIRETIVAS E IMPLEMENTAÇÃO
HABILIDADES E NECESSIDADES DO PÚBLICO-ALVO
•
Para este levantamento, a Fundação CPqD contou com a participação de especialistas do Departamento de Engenharia de Computação e Sistemas Digitais da Escola Politécnica da USP, que desenvolveram um trabalho baseado em coletas de dados em campo com a finalidade de mapear habilidades e dificuldades do público alvo no tocante ao uso das TICs.
A autonomia incremental do usuário. A inclusão digital do público-alvo em questão deve ocorrer de forma gradual, com a paulatina superação das barreiras psicológicas e sociais frente as TICs em seu contexto de uso, seguida pela gradativa aquisição de habilidades e modelos mentais necessários à sua utilização (de início com recurso a guias virtuais, apoio de usuários mais experientes ou monitores), para que, por fim, cada novo usuário se torne proficiente no uso dos serviços. No entanto, é importante que o usuário sempre conclua a tarefa na sua primeira utilização, de forma a se sentir satisfeito e autoconfiante;
•
O design universal como meta, a fim de buscar a concepção de uma mesma interface para todos os usuários, incluindo analfabetos e pessoas com deficiência;
Em Filgueiras et al. (2007) foram reunidos os dados coletados que visaram identificar:
•
Uso de interfaces ajustáveis onde, dentro da abordagem do design universal, a interface deverá poder ser ajustada de acordo com cada um dos perfis de usuário parte do público-alvo definido, sempre que necessário para aprimorar a usabilidade de cada um;
•
Incorporação de modelos mentais conhecidos. O estudo contempla identificar e incorporar os modelos mentais de uso de outras tecnologias mais comuns entre o público-alvo, tais como rádio, TV, urna eletrônica, telefone fixo ou celular;
•
Extrapolação do modelo mental desenvolvido. O modelo mental criado na interação deve poder ser extrapolado para outros serviços e contextos, servindo como porta de entrada para o cidadão na sociedade informacional;
•
Adequação das normas de acessibilidade em vigor, de tal forma que seja possível incorporar novas tecnologias assistivas na interação;
•
Envolvimento do público-alvo durante todo o processo de desenvolvimento de forma a identificar suas habilidades e necessidades e avaliar a transposição desse conhecimento para o modelo de interação.
Sempre com as personas desenvolvidas em mente, foram consideradas algumas premissas na definição no modelo de interação que resultaram em diretivas ou guias para o processo de pesquisa e identificação de soluções:
O levantamento das particularidades do público-alvo foi fundamental para nortear a escolha e avaliar a aplicabilidade dos diversos recursos de usabilidade, acessibilidade e inteligibilidade, bem como sua disposição na interface para uma integração inerente ao modelo de interação, inclusive propondo novos recursos nos casos em que os recursos existentes não atendam as particularidades do público-alvo que foram identificadas.
•
•
•
as barreiras que dificultam ou impedem a utilização de computadores por parte do público-alvo, mostrando como essas barreiras se manifestam, quais suas interrelações e quais delas podem ser atenuadas com uso de ferramentas assistivas ou por meio da reformulação das interações e interfaces computacionais e dos conteúdos por elas mediados; os mecanismos e atividades realizadas por profissionais da iniciativa para identificação das necessidades dos analfabetos, idosos e pessoas com deficiências sensoriais. os modelos mentais (de uso de TICs) mais comuns entre o público-alvo (caixa eletrônico, TV, telefone, etc.) e avaliar como eles podem influir na proposição dos modelos de interação necessários ao uso de e-gov pelo público-alvo deste projeto.
As entrevistas, focadas nas questões descritas acima, foram realizadas com pessoas dos diversos segmentos do público alvo – idosos, trabalhadores rurais, pessoas com baixo letramento, deficientes visuais e auditivos. A partir dos depoimentos, o público-alvo pôde ser caracterizado e foi construído um modelo de personas representativas do mesmo. Foram desenvolvidas 5 personas, das quais 3 são personas primárias, para quem o projetista deve direcionar os seus esforços e 2 são personas secundárias, que mesmo
Com as diretivas estabelecidas, foi possível determinar a forma como cada uma delas seria tratada e implementada na solução proposta. Nesta fase também são considerados os elementos presentes na interface dos serviços
68
Previdência Fácil e Inclua Saúde e as funcionalidades e procedimentos que cada um oferece. Perfis da Interface Universal
No desenvolvimento do STID, optou-se pela criação de três perfis de interface: padrão, interface para deficiente auditivo e para deficiente visual, de forma que, uma vez identificado o usuário, automaticamente a interface adequada a seu perfil seria apresentada. Para todos os perfis, foi mantida a mesma apresentação da interface, no que diz respeito a layout, ícones, botões e funcionalidades. Para a identificação do usuário e escolha da interface adequada ao seu perfil, foi utilizado um sistema de reconhecimento facial onde, em sua primeira visita ao telecentro, o usuário é cadastrado e sua imagem facial é armazenada para posterior reconhecimento. É importante salientar que a interface considerada padrão é a que atende principalmente os analfabetos plenos e funcionais, mas que também pode ser utilizada perfeitamente por usuários que não tenham qualquer tipo de deficiência.
Figura 2: Portal do STID, onde são oferecidos os dois serviços, Inclua Saúde e Previdência Fácil
Para essa interface, toda informação textual possui sua equivalente em formato de áudio, permitindo assim que usuários que não saibam ler possam interagir com o sistema. A exceção fica a cargo da interface para o perfil de deficiente auditivo, que não contém áudio e apresenta o equivalente à informação textual em Libras. Para a interface do deficiente visual, optou-se por não usar a mesma verbalização automática dos textos da interface padrão para permitir que o usuário aprenda a interagir com o uso de um software leitor de telas e que, dessa forma, possa utilizar esse mesmo conceito em outras interfaces. Tanto o deficiente visual parcial (baixa visão) quanto o deficiente auditivo parcial, podem fazer uso da interface padrão, seja com ampliação da fonte e aumento do contraste de cores, quanto ajustes no volume do áudio no caso do deficiente auditivo.
Figura 3: Exemplo de conteúdo exibido pelo serviço Previdência Fácil
Estes critérios levaram em consideração: •
Aspectos relacionados ao foco ou ponto de atenção do usuário na área central da tela, ilustrado na Figura 4;
•
Aspectos de acessibilidade aplicáveis a links e rótulos;
•
Aspectos de inteligibilidade relacionados com a apresentação de informação (tanto de conteúdo como de ajuda contextualizada);
Aspectos relacionados ao Layout
Para a definição do layout a ser considerado na interface, foram estabelecidos alguns critérios iniciais, essenciais para as decisões posteriores relacionadas a elementos de interação à apropriação de recursos de acessibilidade, que resultaram na disposição apresentada na Figura 3:
69
•
Aspectos relacionados à tela sem rolagem versus quantidade de passos de navegação;
•
Minimização das barras de ferramentas do navegador;
•
Modelo de Navegação aplicável a todos os perfis sem alteração na lógica dos serviços
•
Aspectos relacionados ao uso de metáforas do mundo real, apresentados na Figura 4.
Figura 4: Elementos de uso no cotidiano do público-alvo •
Aspectos relacionados à introdução ao mundo Web;
•
Aspectos relacionados ao uso de cores, ilustrado na Figura 5 para o serviço Inclua Saúde e Figura 6 para o serviço Previdência Fácil;
Figura 6: Cores empregadas no âmbito do serviço Previdência Fácil •
Compromisso de viabilizar no layout e no modelo de interação diversos Recursos de Acessibilidade para cada perfil, conforme ilustrado na Figura 7:
Figura 7: Elementos que representam recursos de verbalização e sinalização dos textos da interface CONCLUSÃO
Os recursos de acessibilidade para esse projeto tiveram que ser tratados de forma cuidadosa, uma vez que o perfil dos usuários exigia ferramentas específicas para possibilitar a interação. Figura 5: Cores empregadas no escopo do serviço Inclua Saúde
Para os usuários com baixa visão foram disponibilizados recursos de redimensionamento da fonte utilizada e alteração no contraste da tela. No caso dos usuários deficientes visuais, foi utilizado um leitor de telas específico para permitir a interação. Para os usuários deficientes auditivos, foi necessário o desenvolvimento de um avatar, que oferece aos usuários as informações textuais da interface em língua de sinais. Para os analfabetos, foram utilizados ícones e recursos de reprodução de áudio associado às informações textuais apresentadas na interface.
70
É importante salientar que o uso adequado e eficiente das ferramentas assistivas aqui propostas só foi possível devido à adequada elaboração dos textos apresentados. REFERÊNCIAS ÁVILA, I., Ogushi, C., Bonadia, G. (2006) Modelagem de Uso. Relatório do Projeto Soluções de Telecomunicações para a Inclusão Digital – STID. CPqD-Funttel, disponível em www.cpqd.com.br/site/ContentView.php?cd=2945 ÁVILA, Ismael M. A. ; GUDWIN, Ricardo R. Icons as Helpers in the Interaction of Illiterate Users with Computers. In: IADIS International Conference Interfaces and Human Computer Interaction 2009. Proceedings of the IADIS Multi-Conference on Computer Science and Information System, Carvoeiro, Portugal, 2009. BRAGA, D, Vóvio, C., Gomes L., et al. (2008) Novas Linguagens e Modelos de Interação. Relatório do Instituto de Estudos da Linguagem da Unicamp para o Projeto STID. Relatório interno. FILGUEIRAS, L., Boletta, J. P., Martins, S., Correa, D., Aquino Jr, P. (2007) Modelo de usuários Público-alvo do projeto STID - Relatório Técnico LTS027.RT.002.01 FILGUEIRAS L., Martins, S., Correa, D., Osório, A. (2009) Personas para caracterização da experiência de uso de tecnologia pela população digitalmente excluía. In: Usabilidade, Acessibilidade e Inteligibilidade. Resultados do Workshop. Campinas: CPqD, 71p. Disponível em: <http://www.cpqd.com.br/file.upload/1749021822/resultad os_workshop_uai.pdf>. Acesso em: 18 mai. 2009.
HOLANDA, G.; Dall'antonia, J. C. An Approach for einclusion: Bringing illiterates and disabled people into play. Journal of Technology Management & Innovation, v. 1, n. 3, 2006. MARTINS, S.; Filgueiras, L. Métodos de Avaliação de Apreensibilidade das Informações Textuais: uma Aplicação em Sítios de Governo Eletrônico. Congresso Latinoamericano de Interação Humano-Computador, Rio de Janeiro, 2007. MELO, A., Piccolo, L., Ávila, I., Tambascia, C. (Org.). Usabilidade, Acessibilidade e Inteligibilidade Aplicadas em Interfaces para Analfabetos, Idosos e Pessoas com Deficiência: Resultados do Workshop. Campinas: CPqD, 2009. 71p. Disponível em: <http://www.cpqd.com.br/file.upload/1749021822/resultad os_workshop_uai.pdf>. Acesso em: 18 mai. 2009. OSORIO, A. F. S., Schmidt, C. P., Duarte, R. E. . “Parceria Universidade-Empresa para Inclusão Digital” Anais Estendidos do VIII Simpósio sobre Fatores Humanos em Sistemas Computacionais IHC 2008. SBC, Campinas, 2009. SARDINHA, T. B.; Lima-Lopes, R. E. Análise Lingüística dos Sítios de Internet, Projeto Soluções de Telecomunicações para Inclusão Digital, Relatório de circulação interna, Campinas: CPqD-FUNTTEL, 2008. SILVEIRA, Sérgio Amadeu. Exclusão digital: a miséria na era da informação. São Paulo: Perseu Abramo, 2001.
HAYASHI, E., Neris V., Baranauskas, C., Martins, M. C., Piccolo, L., Costa, R. Avaliando a qualidade afetiva de sistemas computacionais interativos no cenário brasileiro. In: Usabilidade, Acessibilidade e Inteligibilidade. Resultados do Workshop. Campinas: CPqD, 71p. Disponível em: <http://www.cpqd.com.br/file.upload/1749021822/resultad os_workshop_uai.pdf>. Acesso em: 18 mai. 2009.
71
Museus na Web: A Espiral Evolutiva das Formas de Presença Online First Author Name (Blank if Blind Review) Affiliation (Blank if Blind Review) Address (Blank if Blind Review) e-mail address (Blank if Blind Review) Optional phone number (Blank if Blind Review) RESUMO
Este estudo mapeia e descreve o fenômeno das formas de presença dos museus de ciências brasileiros na web, dada a importância das tecnologias digitais e da rede mundial de computadores na renovação das práticas museológicas em países desenvolvidos. Os resultados encontrados revelaram quatro níveis evolutivos de presença, visualizados em um instrumento de análise teórica intitulado “Espiral Evolutiva das Formas de Presença Online”. ABSTRACT
This research emerges from the need of identifying and understanding the online presence modes of the brazilian science museums, given the importance of the digital technologies and the World Wide Web in creating new museum practices in developed countries. The four levels of presence founded were visualized in a theoretical model called “Evolution Spiral of the Online Presence Modes”. Author Keywords
Interaction, museum, web, design
maiores esclarecimentos do que seja, por exemplo, um sítio interativo. Com o objetivo de melhor entender o processo de apropriação do ambiente online pelos museus de ciências brasileiros, foi construído para esta pesquisa um Modelo de Análise das Formas de Presença Online – Categoria Museus, que contempla seis itens: tipo de experiência proposta pelo museu, perfil interacionista das relações, perfil tecnológico e informacional, peculiaridade da estratégia e tipo de relação com o museu físico. Foram considerados tantos os relatos de experiência dos artigos da Conferência Museum and Web de 2007 (museus de diversas tipologias), quanto as formas de presença online dos museus de ciências brasileiros. A partir da categorização dos atributos, foi possível perceber quatro estágios de desenvolvimento de presença online, delimitados pelas peculiaridades de suas estratégias intrínsecas, a saber: divulgação do museu físico, ofertas de serviços complementares ao museu físico, apropriação da web pelo museu e apropriação do museu online pelo público.
ACM Classification Keywords
H5.m. Information interfaces and presentation (e.g., HCI): Miscellaneous. INTRODUÇÃO
A crise de legitimidades, acentuada na década de 1960, afetou diversas instituições estabelecidas, nas quais se situam os museus de ciências. Em uma revisão de seu papel social, estas instituições vêm passando por contínuas reestruturações de ordem teórico-práticas, adotando o modelo interacionista em oposição ao contemplativo, no que se refere às relações público/acervos. Dentre as transformações em curso nos museus está a adoção de novas tecnologias comunicacionais, onde se destaca a internet. Desde o seu surgimento da www, as formas de presença online dos museus e centros de ciências diversificaram-se e tornaram-se complexas, exigindo Permitida reprodução, sem fins lucrativos, desde que citada a autora.
O CONCEITO DE INTERAÇÃO
O fenômeno da interação online tem sido tratado com superficialidade ou reducionismo pela maioria dos autores. Tanto o enfoque transmissionista que trabalha com os pólos emissor-receptor (webdesigner-usuário), quanto o enfoque informacional, para o qual a interatividade resume-se à possibilidade de escolhas em um sistema, não ajudam a entender o que acontece em termos de interação entre humanos. São visões tecnicistas do fenômeno. Para maior compreensão das formas de presença online, recorreremos à abordagem sistêmico-relacional de Primo [1] cujo foco de interesse está no que acontece entre os interagentes em um sistema de comunicação mediado por computadores. Para o autor, interação refere-se a qualquer “ação entre” participantes, sejam eles humanos ou não. Portanto, as especificidades dos tipos de interação mediados por computador, humano-humano e humano-máquina / máquina-máquina são tratadas na adjetivação do termo, a saber interação mútua e interação reativa.
72
Segundo Primo, na interação mútua, cada ação expressa tem um impacto recursivo sobre a relação e sobre o comportamento dos interagentes. A forma do relacionamento é dada à medida que os participantes interagem entre si, em um processo de negociação contínua das diferenças, ou seja, a ocorrência de um conflito modifica o relacionamento. Por sua vez, as interações reativas são marcadas e limitadas por predeterminações que condicionam as trocas. Um operador de telemarketing treinado para seguir roteiros e evitar conflitos estabelece uma interação reativa com o cliente, da mesma forma que em um jogo de computador, as ações do usuário são limitadas (mesmo que possam parecer infinitas em alguns casos) pela programação do software. Esta questão é importante porque deixa claro que o meio não determina, por si, a interação mútua. Ainda que certas tecnologias sejam persuasivas na configuração de ambientes de negociação, formas dialógicas de comunicação são condicionadas pela postura do interagentes. Embora o autor esclareça o uso do adjetivo ‘mútuo’ para descrever uma ação bidirecional entre os agentes (p. 57) , em oposição à resposta reativa, penso que o termo interação negociada define melhor o tipo de comportamento que se estabelece neste caso, onde as trocas são contextualizadas e não condicionadas por predeterminações, mas, como o próprio Primo define, se desenvolvem em virtude da negociação relacional durante o processo comunicacional. Por esta razão, neste estudo, serão utilizadas as terminologias interação reativa e interação negociada para definir os tipos de ações que se estabelecem entre os interagentes. Estes conceitos de interação foram a base de análise das práticas museológicas na internet, acrescidos dos parâmetros perfis tecnológico e informacional, tipo de experiência proposta ao público e relação da atividade com a forma de presença física (Tabelas 1, 2, 3 e 4). AS TRÊS GERAÇÕES WEB
Dos artigos analisados, 33% são relatos de experiência sobre a criação ou redesign dos sítios e sobre a apropriação do ambiente online, extra-sítio, em especial, sítios de socialização - vídeos no Youtube, entradas na Wikipedia, exposições temporárias no Second LIFE e publicação de blogs. Para melhor compreensão do fenômeno, as ocorrências foram classificadas segundo as três filosofias evolutivas web 1.0, 2.0 e 3.0. Na filosofia web 1.0, foram agrupados o redesign de sítios orientados a manter uma presença online básica, ou seja, ter um endereço na internet, com informações sobre o museu físico, tratadas ou não de forma multimidiática. A geração de conteúdo é exclusiva do pessoal do museu, cabendo ao usuário, acessar as informações disponíveis, caracterizando uma estrutura “top down” (de cima para baixo), hierarquicamente fechada. Não há nenhuma preocupação com a formação de comunidades virtuais ou outro tipo de interação social. São sítios orientados a transmitir
informação aos usuários. Dentre as justificativas para atualização destes sítios, foram citados: ampliar o público, fortalecer o marketing, oferecer recursos de educação [2] melhorar a arquitetura da informação, facilitar a atualização do sítio por pessoal não-especializado, oferecer maiores atrativos para os usuários e adequar o visual à estética do museu ou exposição [3]. Na filosofia web 2.0, foram enquadrados os sítios que procuraram se apropriar do ambiente virtual, e não apenas utilizar a internet como mais uma mídia para divulgação de informações institucionais. São sítios que já passaram pelo primeiro nível descrito, e começam a aplicar a filosofia Web 2.0 para realizar a missão do museu. Estes sítios, pela forma como são projetados, procuram não só ampliar a experiência do visitante do museu físico, como oferecer uma experiência per si ao usuário da internet. São ambientes orientados à interação dos usuários entre si e com o pessoal do museu. Uma preocupação comum no redesign destes sítios tem sido a acessibilidade ao seu conteúdo [2, 4, 5, e 6]. A acessibilidade é uma prerrogativa para sítios de uso público, pois, segundo o Serviço Federal de Processamento de Dados - Serpro (2005), assegura que qualquer usuário, independente de sua condição física, tipo de navegador, qualidade de banda ou tipo de computador, tenha acesso aos serviços da web. Para Gray [7] iniciar a presença online com um sítio 1.0 e apropriar-se de serviços e sítios 2.0 pode ser uma boa escolha para instituições com orçamentos limitados, devido à gratuidade dos serviços. Extrapolar o próprio domínio surge como uma prática inovadora em 33% dos artigos sobre presença online, destacando-se os sítios Blogger, Flickr , Second Life, YouTube, Itunes, MySpace e Facebook, 1. No entanto, beneficiar-se da Web 2.0 pressupõe compreender e aceitar valores que lhe são inerentes como o compartilhamento de autoridade. A mudança de paradigma em curso exige que os museus desloquem-se da postura de disseminadores de informação para o papel de agências de diálogo [8] Este processo exige uma mudança de cultura nas instituições, o que é apontado por Ellis [9] como uma das barreiras para a transformação na forma como os museus têm explorado a internet. A disposição ao risco e o aprimoramento contínuo, no entanto, caracterizam as empresas pioneiras na nova geração web e seus serviços eternamente em versão beta. Dentre as formas de presença online extra sítio, encontramse os blogs. Considerado o software social mais fácil de ser 1
Serviços prestados: provedor de blogs, compartilhamento de imagens, jogo de simulação em 3D, compartilhamento de vídeos, download automático de MP3 eMP4 e redes sociais.
73
iniciado, tem sido utilizado pelos museus de duas formas: como acesso público aos seus bastidores através de postagens dos curadores e pessoal que trabalha nas instituições ou como comunidade aberta à publicação de qualquer usuário registrado. O estudo de SPADACCINI e SEBASTIAN [10] sobre o estado da bloguesfera museal, revelou que a maioria dos blogs de museus está hospedada no Blogger.com utilizam serviços complementares como o Technorati, o Feedburner e Google Blog Search, todos gratuitos. Segundo os autores, a pesquisa aponta o blog como uma plataforma de comunicação emergente que tem catalisado a formação de uma comunidade museal na internet. Os blogs de maior acesso são o que incentivam a participação de seus usuários, substituindo o modelo broadcast de comunicação por um modo conversacional, incentivando o diálogo no lugar de disseminar a informação [8]. Dentre outras vantagens dos blogs de museus estão: a possibilidade de atualização dinâmica de conteúdo, sem custo adicional para a instituição, a quebra da estrutura autoritária de comunicação predominante, a possibilidade do conteúdo das postagens serem usadas como indicadores de interesse, preferência e conhecimento dos usuários sobre determinado assunto [11] a possibilidade de fortalecer a conexão com o público jovem e de integrar as duas instâncias do museu [8]. Os autores advertem, no entanto, da necessidade de divulgar o blog na internet, em sítios afins como o Flickr e da persistência necessária para que uma comunidade participativa se forme. Por último, a filosofia Web 3.0 pode ser notada em sítios que levam em consideração a estruturação semântica da informação e a interoperabilidade, nome dado à habilidade de troca de serviços e dados entre sistemas distintos. Estes projetos prevêem a reutilização da informação em várias mídias e formatos, realizando a visão do museu ubíquo, onde o que é produzido no domínio físico pode ser reutilizado na internet e vice-versa, reduzindo custos e facilitando a gestão da informação [12, 13, 14]. São sítios orientados ao reaproveitamento e recuperação dos dados e à personalização da experiência. OS NÍVEIS DE PRESENÇA ONLINE O primeiro nível de presença online
O primeiro nível (Tabela 1) agrega os sítios cujo conteúdo limita-se à divulgação de informações institucionais do museu físico. A internet é considerada mais um canal de veiculação de informações reaproveitadas de outras mídias, normalmente, a impressa. Ainda não se pode falar em apropriação do ambiente online, mas de subutilização da web, seja por desconhecimento do seu potencial ou por idéias pré-concebidas de competição entre os domínios físico e virtual. O ambiente online é explorado como ferramenta de marketing passivo, ou seja, o usuário deve saber o endereço do sítio ou encontrá-lo por meio de algum mecanismo de busca ou citação em sítios afins. O modelo
de interação é predominantemente reativo, onde o museu posiciona-se como elemento transmissor de informações, numa relação monológica e polarizada. MODELO DE ANÁLISE DAS FORMAS DE PRESENÇA ONLINE – CATEGORIA MUSEUS
NÍVEL DE DESENVOLVIMENTO
PECULIARIDADE
EXPERIÊNCIA PROPOSTA
1º NÍVEL DE PRESENÇA ONLINE
DIVULGAÇÃO DO MUSEU FÍSICO TIPO A
TIPO B
Acesso a informações básicas institucionais.
Acesso a informações institucionais, notícias e avisos, e outras informações dinâmicas.
INTERACIONISTA REATIVO PERFIL INTERACIONISTA
PERFIL TECNOLÓGICO E INFORMACIONAL
(P M) (Público acessa informações sobre o Museu físico) WEB 1.0 - Sítios de estrutura estática, composto por, geralmente, uma única tela com rolagem. Mesmo que haja possibilidade de atualização do conteúdo, esta é muito rara ou inexistente. Predomínio de textos. MÍDIA PARA DIVULGAÇÃO DO MUSEU PRESENCIAL
RELAÇÃO COM O MUSEU FÍSÍCO
Ainda não há apropriação do ambiente online pelo museu.Pode haver receios de competição entre os domínios físico e virtual.
Tabela 1. Primeiro Nível de Presença Online
A interação proposta limita-se ao acesso, excluindo possibilidades de consulta ou de intervenção, temporária ou permanente, no sistema. No Tipo 1A, estão os sítios cujo conteúdo apresenta-se inteiramente no formato textual, geralmente ocupando apenas uma tela e de conteúdo estático (sem atualizações periódicas). No subgrupo 1B, há maior exploração de recursos persuasivos como fotografias, simulacros do museu físico, mapas de localização, além de uma atualização constante de parte do conteúdo.
74
Tecnologicamente, são utilizados recursos elementares, típicos da web de primeira geração. O segundo nível de presença online
Os sítios de segundo nível (Tabela 2) oferecem serviços online complementares à experiência presencial, mas não necessariamente condicionados a esta. Estão focados em ampliar as relações do sujeito com os artefatos, seja disponibilizando o acervo para consulta remota (Tipo 2A) ou através de representações interativas dos mesmos, como simuladores e games (Tipo 2B). O segundo caso, em que há produção de material específico para a web, marca o início da apropriação do ambiente online pelos museus. Este nível configura-se como interacionista reativo, dada a natureza fechada das trocas. Ainda que haja um canal de contato, como é de praxe em qualquer sítio, estes sistemas não são orientados ao diálogo com os usuários, mas à oferta de interação com os artefatos representados. E mesmo que possam ser empregadas tecnologias de segunda e terceira gerações web na construção de modelos mais interativos, predomina a abordagem 1.0. No Tipo 2B, há atualização constante do conteúdo e as ações de comunicação começam a inserir a internet como meio de atingir o público-alvo e potencial dos museus, em especial, o público escolar. O terceiro nível de presença online
No terceiro nível (Tabela 3 ) estão os sítios típicos da Web 2.0, em que o museu abre diversos canais de diálogo com seu público, incentivando-o a participar ativamente da construção do sítio, seja no registro de comentários para exibição pública, no cadastro para acesso a serviços personalizados e compartilháveis, na produção de conteúdo em formatos diversos, como áudio e vídeo. Estes indicadores caracterizam o início de apropriação da web pelos museus. Se estas iniciativas limitam-se ao sítio oficial do museu são agrupadas no Tipo 3A, mas se extrapolam o domínio do sítio, e representam, portanto, um avanço em termos de estratégia de marketing online, os sítios são caracterizados como do Tipo 3B. Neste caso, os usuários da internet podem ter acesso ao conteúdo do museu em canais diversificados, como o Second Life, o Flickr e o iTunes, mesmo sem nunca terem estado no sítio do museu ou em uma visita presencial. Esta prática revela uma ampliação na visão do que seja “presença online“ e “público”. A relação com o museu físico é mutualista, onde esforços conjuntos são empregados para integrar as duas instâncias reconhecendo suas potencialidades. Estas ações, viabilizadas pelas tecnologias digitais, em especial as de terceira geração, tornam possível a concretização de um museu ubíquo, onde os conteúdos produzidos por pessoal especializado ou leigo, em qualquer das instâncias museais, são disponibilizados em formatos diversos e acessíveis por vários dispositivos: computador pessoal, celular, aparelhos de MP3, quiosques etc, online ou/e in loco. Do ponto de vista do perfil interacionista, ambos os tipos (3A e 3B) são potencialmente de interação negociada
porque, embora tecnologicamente aptos ao estabelecimento de diálogos, estes dependem da predisposição dos interagentes - tanto de os usuários sentirem-se engajados no processo quanto no pessoal do museu realmente incentivar o diálogo e dialogar com seus interlocutores. Neste nível, pode se dar o estreitamento com a comunidade escolar, como apoio à educação formal. MODELO DE ANÁLISE DAS FORMAS DE PRESENÇA ONLINE – CATEGORIA MUSEUS NÍVEL DE DESENVOLVIMENTO
PECULIARIDADE
2º NÍVEL DE PRESENÇA ONLINE
OFERTA DE SERVIÇOS COMPLEMENTARES AO MUSEU FÍSICO TIPO A
EXPERIÊNCIA PROPOSTA
PERFIL INTERACIONISTA
PERFIL TECNOLÓGICO E INFORMACIONAL
RELAÇÃO COM O MUSEU FÍSÍCO
TIPO B
Acesso ao acervo e/ou conteúdos complementares à visita, porém sem tratamento multimidiático.
O acervo e/ou materiais complementares recebem tratamento multimidiático como games, testes e simuladores.
INTERACIONIST A REATIVO
INTERACIONIST A REATIVO
(P A) (Público acessa Artefatos)
(P A) (Público interage com Artefatos)
Web 1.0 - Sítios de estrutura estática, composto por, geralmente, uma única tela com rolagem.Mesmo que haja possibilidade de atualização do conteúdo, esta não é realizada com freqüência. Predomínio de textos.
Web 1.0 – Sítios mais persuasivos, com uso defotografias,simula cros do ambiente museal, mapas do museu físico, etc. Há atualização constante de conteúdo.
FORMA DE PREPARAR O PÚBLICO PARA VISITA AO MUSEU FÍSICO E/OU DE AMPLIAR A EXPERIÊNCIA MUSEAL As ações de comunicação começam a inserir a internet como meio de atingir o públicoalvo e potencial dos museus, em especial, o público escolar.
Tabela 2. Segundo Nível de Presença Online
75
O quarto nível de presença online – O Museu-Fórum
MODELO DE ANÁLISE DAS FORMAS DE PRESENÇA ONLINE – CATEGORIA MUSEUS NÍVEL DE DESENVOLVIMENTO
PECULIARIDADE
3º NÍVEL DE PRESENÇA ONLINE
APROPRIAÇÃO DA WEB PELO MUSEU TIPO A
EXPERIÊNCIA PROPOSTA
TIPO B
Ampliação dos Abertura de canais de diálogo com o público canais de diálogo e entre público no sítio. em outros sítios. POTENCIALMENTE INTERATIVO NEGOCIADO
PERFIL INTERACIONISTA
PERFIL TECNOLÓGICO E INFORMACIONAL
RELAÇÃO COM O MUSEU FÍSÍCO
(P M) (Público interage com o Museu)
Web 2.0 e 3.0 Sítios permitem a inserção de comentários de usuários, assim como envio e carregamento de arquivos produzidos pelo museu e/ou outros usuários. O conteúdo do sítio é parcialmente produzido por usuários do sítio ou visitantes do museu físico. Preocupa-se com a interoperabilidade dos bancos de dados.
(M) (P) Museu interage com seu Público potencial fora de seu sítio institucional Web 2.0 e 3.0 – O museu desenvolve ações específicas para sítios de socialização, como o Second Life, o Flickr e o iTunes, ampliando as formas de acesso ao sítio do museu a partir da descentralização do conteúdo e do aumento da visibilidade online. Preocupase com a interoperabilidade dos bancos de dados.
PERVASIVIDADE - O conteúdo do museu físico é disponibilizado em vários formatos e acessível por vários dispositivos: computador pessoal, celular, aparelhos de MP3, quiosques etc (interoperabilidade). O conteúdo produzido por visitantes pode ser publicado no sítio, integrando os domínios físico e virtual. MUTUALISMO - Integração cooperativa e conceitual dos domínios físico e virtual.
Tabela 3. Terceiro Nível de Presença Online
Finalmente, tem-se o quarto nível de desenvolvimento (Tabela 4), onde se dá o início do fenômeno de apropriação do museu pelo público online e presencial. Neste estágio, o museu online configura-se como um assentamento virtual (virtual settlement), definido por JONES [15] como um ciberlugar que é simbolicamente delineado por um tópico de interesse, e onde uma proporção significante de interatividade ocorre. Jones diferencia a comunidade virtual do local onde esta se reúne, porque embora o assentamento virtual seja uma condição para a existência de uma comunidade virtual, ele não é suficiente para que ela se forme. Ele é seu suporte tecnológico. Segundo o autor, são quatro as características de uma comunidade virtual: um nível mínimo de interatividade, definido pela extensão da relação em uma seqüência de mensagens entre si; uma variedade de comunicadores; a manutenção de número mínimo de membros e um espaço público virtual comum. Se no nível três os museus começam a abrir canais de diálogos com seu público, neste nível, estes canais são apropriados por estas pessoas. Para que não haja perda de identidade institucional, todas estas ações devem estar alinhadas à missão do museu e orientadas pela sua área de concentração, considerando as possibilidades de exploração de seu acervo no propósito de promover debates públicos e de facilitar a compreensão do mundo em que vivem. Do ponto de vista operacional, temos as tecnologias 2.0 otimizando a interação social, e as 3.0 conectando as instâncias física e virtual, criando um único museu, acessível 24 horas por qualquer pessoa conectada à rede. Neste nível, o ambiente é projetado com interesse na formação de comunidades virtuais, cuja manifestação presencial torna-se desejável, mas não imprescindível. Cabe a esta vertente do museu físico viabilizar a formação e desenvolvimento destas comunidades em torno de questões contemporâneas controversas e de interesse público que estejam alinhadas à sua missão. Podemos entender que o papel do museu neste processo é o de moderar as interações, divulgar o assentamento, engajar as pessoas e agenciar encontros, como, por exemplo, entre público especialista, líderes comunitários e a comunidade no geral. Trata-se, portanto, de um perfil interacionista negociado, onde abrir-se ao diálogo significa estar sujeito a situações conflitantes, e incentivar a produção de conteúdo pelos usuários, pressupõe o compartilhamento de autoridade [16]. CARUTH [17] adverte que a voz da comunidade virtual pode se tornar mais alta que a do museu, e os comentários deixados pelos usuários podem não ser sempre favoráveis ou elogiosos. No caso da pesquisa de opinião com os usuários do novo sítio do Young Tate (Museu de Arte de Londres), os jovens, de 13 a 25 anos, apesar de aprovarem o novo visual, criticaram a falta “do que fazer no sítio”. O museu oferece a oportunidade de os usuários entrevistarem celebridades, uma demanda detectada na pesquisa, porém, a interação não é instantânea. As questões são enviadas e recebidas por e-mail – algo pouco atraente
76
MODELO DE ANÁLISE DAS FORMAS DE PRESENÇA ONLINE – CATEGORIA MUSEUS NÍVEL DE DESENVOLVIMENTO PECULIARIDADE
4º ESTÁGIO DE PRESENÇA ONLINE APROPRIAÇÃO DO MUSEU PELO PÚBLICO MUSEU-FÓRUM
EXPERIÊNCIA PROPOSTA
O público se apropria do museu como um espaço público, onde as práticas democráticas são exercitadas, constituindo verdadeiros assentamentos virtuais.
INTERATIVO NEGOCIADO
PERFIL INTERACIONISTA
PERFIL TECNOLÓGICO E INFORMACIONAL
RELAÇÃO COM O MUSEU FÍSÍCO
(PPM) e/ou PPM
(Público interage entre si e com o Museu, no sítio do museu e/ou em outros sítios da internet)
Web 2.0 e 3.0 – MUSEU UBÍQUO: As tecnologias 2.0 otimizam a interação social, enquanto as 3.0 conectam as instâncias física e virtual, criando um único museu, acessível 24 horas por qualquer pessoa conectada à rede.
ASSENTAMENTOS VIRTUAIS - O ambiente virtual é tido como uma vertente do museu físico, viabilizando a formação e desenvolvimento de comunidades em torno de questões contemporâneas controversas e de interesse público.
Tabela 4. Quarto Nível de Presença Online
para uma geração acostumada a se comunicar pelo MSN. A iniciativa de receber conteúdo produzido por usuários é vista como uma oportunidade para conhecer melhor o público-alvo, a fim de estreitar o relacionamento da instituição com seu público, no entanto, o Museu teme pelo uso indevido do espaço ou que o uso seja desconectado dos propósitos de seus programas para jovens.
Para que as experiências participativas sejam significativas e orientadas aos propósitos de cada instituição, é importante oferecer atividades criativas em torno de seu conteúdo. Para Hein [18] o principal poder e responsabilidade dos museus são inspirar a experiência transformativa que os visitantes têm quando confrontados com um objeto. Desta forma, a autora defende a transformação dos museus em fóruns orientados à criação de novos objetos culturais e conhecimentos através de um processo transformativo envolvendo o engajamento do público com suas coleções e exibições. A “experiência estética” promoveria o visitante à integrante da equipe museal, no sentido de que o significado não estaria dado, mas prestes a ser construído pessoalmente, inspirando conexões mais duradouras com os artefatos dos museus, independente de sua tipologia. Para Hein, a internet tem um grande potencial para diluir a voz autoritária dos museus. O conceito de Museu-Fórum, em oposição a MuseuTemplo2 foi introduzido por Cameron [19]em 1971, mas, ao contrário do que seria esperado, em mais de trinta anos decorridos de sua publicação, as questões abordadas pelo autor continuam pertinentes. A despeito da crise de identidade que acometeu os museus após a Segunda Guerra Mundial, Cameron destaca o surgimento dos Centros de Ciências e sua abordagem interativa dos objetos, sem, contudo, armazenarem uma coleção ou realizarem pesquisas originais, e, ainda, o grande número de atratividades oferecido por muitas instituições, atestando a indefinição do que seria a função social dos museus. Para o autor, os protestos contra museus e galeria de arte ocorridos na década de setenta, refletiam a necessidade de restabelecer os fóruns na sociedade, onde debates, experimentações e confrontos pudessem ocorrer livremente. No entanto, não bastaria reformar o Museu Templo, mas criar um novo estabelecimento dedicado às atividades do Museu Fórum, afim de que o primeiro não roubasse a vitalidade e autonomia do segundo. Embora separados física e administrativamente, os museus deveriam compartilhar os serviços comuns e o público. Embora separados física e administrativamente, os museus deveriam compartilhar os serviços comuns e o público. Quando obrigados a coexistir na mesma estrutura, Cameron recomendava que fossem criadas separações visuais e distinções psicológicas entre os dois, usando modificações na arquitetura e na sinalização. As funções dos dois lugares deveriam estar muito claro na mente dos visitantes, curadores, diretores, sustentadores e agências financiadoras da instituição. Os eventos do Fórum deveriam ser divulgados para a grande massa e se integrar aos circuitos de comunicação eletrônica, criando igualdade de oportunidades culturais, pois, “a sociedade não toleraria mais instituições que, fosse na aparência ou na atuação, servissem a uma audiência minoritária da elite” [19].A
77
pluralização do museu era, para Cameron, uma resposta às necessidades da sociedade, onde a instância Fórum asseguraria que novas e desafiantes percepções da realidade pudessem ser vistas e ouvidas por todos, renovando, por conseqüência, a instância Templo, numa relação processoproduto. Decorridas três década após a publicação deste artigo emblemático, o ambiente virtual parece reunir as condições ideais para o florescimento do Museu-Fórum. O sistema de tagging possibilitou o fenômeno da folksonomia [20], democratizando o sistema de classificação de conteúdo. Blogs despontam como formas viáveis de estabelecer o diálogo com as instituições e entre pares. O ambiente online em rede volta-se para a promoção da interação social, inaugurando uma cultura de produção e compartilhamento de conteúdo, diluindo as polaridades emissor-receptor. No entanto, como enfatizou Cameron, não basta criar lugares de encontros. Os museus, sejam eles de arte, história ou ciências, têm o conhecimento e os recursos para interpretar questões de importância pública, não importando o quão controversas estas possam ser. Por esta razão, podemos considerar o Museu-Fórum como o quarto nível de presença online dos museus, onde o espaço virtual configura-se como um local efervescente para a expressão da opinião pública; um local para o debate de questões contundentes, um laboratório da prática democrática. Podemos dizer que neste estágio, o público apropria-se do museu como um espaço cívico. O museu não adiciona um blog ao sítio, mas torna-se um grande blog, com todos os recursos disponíveis para engajar o público na interação, a exemplo do que fez o Museu de Ciências de Minnesota, nos EUA. O Museu criou um ambiente com identidade visual própria para sua comunidade, a Science Buzz, destacada em um banner lateral na home do sítio do museu. O projeto foi premiado por sua inovação e design gráfico, ocupando o terceiro lugar, na categoria blogs de ciências, em números mensais de comentários; quinto como mais indicado por outros sítios e o segundo em número de acesso entre os blogs de ciências [8]. As postagens mais comentadas podem ser traduzidas em exibições no museu físico, ou servir de parâmetro para medir o interesse ou o conhecimento prévio do público a respeito de um assunto. O objetivo do sítio, segundo o responsável pelas exibições, é o de abrir a estrutura autoritária de comunicação vigente até então. A Espiral Evolutiva das Formas de Presença Online
Analisando as formas como os museus têm se apropriado da internet, percebe-se um movimento evolutivo, em que um estágio de desenvolvimento mais avançado contém as características dos estágios que o precedem, ainda que possam ocorrer saltos evolutivos. Isto significa que projetos de museus online, no séc. XXI, tendem a ser orientados à interação interpessoal, sem, contudo, deixar de suprir as demandas mais básicas dos estágios primários, como a
divulgação de informações institucionais ou a ampliação das formas de interação com os artefatos. O fenômeno progressivo, de ocupação a apropriação da internet, pode ser melhor percebido quando visualizado pela Espiral Evolutiva das Formas de Presença Online (Figura 1). As extremidades do diagrama apontam para um grau crescente de interatividade, enquanto as subcategorias auxiliam na identificação das características intermediárias de cada tipo de uso da www. Este instrumento de análise teórica mostrou-se particularmente útil na representação qualitativa das formas de presença online de museus de ciências brasileiros, como veremos mais à frente.
Figura 1. A Espiral dos Estágios Evolutivos da Formas de Presença Online CONVERGÊNCIA DO MUSEU FÍSICO E ONLINE E TECNOLOGIAS EMERGENTES NO MUSEU FÍSICO
A vocação para a conectividade inerente às tecnologias digitais tem catalisado a integração dos domínios físico e virtual dos museus que as adotam, embora, esta relação não seja determinista. Esta rede potencial tem sido viabilizada por uma séria de dispositivos, dentre os quais se destacam aparelhos celulares [21] tocadores de MP3 e MP4 e os PDA´s [22 e 23 ] (Figura 2). A introdução destes aparelhos tem sido motivada pela crença de que visitantes preferem utilizar uma tecnologia familiar GOLDMAN [24] pelo objetivo de prolongar experiência museal, uma vez que vídeos, áudio, imagens e textos podem ser armazenados, acessados e compartilhados posteriormente; pelo desejo de ajudar os visitantes a lidar com o excesso de informação e pela esperança de que estes esforços convertam-se numa maior freqüência dos visitantes [25] A obsolescência dos aparelhos PDA´s pode ser uma restrição ao uso da tecnologia [26] que compartilha com o demais dispositivos móveis, outras desvantagens, como a resistência do público à mudança cultural (mais indicado para públicos específicos), a redução da interação social e o desvio da atenção do visitante. Em centros de ciências onde as atividades são guiadas pela filosofia hands-on (mãos na massa) forçar o visitante a carregar um aparelho pode
78
parecer uma incoerência, ou mesmo em visitas longas, parecerpela umaqual incoerência, ou mesmo longas, razão se tem sugerido o em uso visitas de handhelds razão pela qual se tem uso de handhelds (computadores de mão) em sugerido exposiçõeso temporárias. (computadores de mão) em exposições temporárias. Um dos usos dos handhelds tem sido na prática do Um dos usos- nome dos handhelds na prática que do bookmarking dado a umatem sériesido de tecnologias bookmarking - nomededado série deselecionada tecnologias pelo que permitem o acesso umaa uma informação permitem opara acesso uma informação visitante usode posterior, seja selecionada por meio pelo do visitante para emuso seja por meio do armazenamento umaposterior, página específica do sítio, em um armazenamento em uma específica do sítio, um aparelho de MP3 ou página pelo recebimento por em e-mail. aparelho de MP3 ouE BOWEN pelo recebimento por que e-mail. FILIPPINI-FANTONI [27] acreditam em FILIPPINI-FANTONI E BOWEN [27] acreditam que em uma cultura de “informação sob demanda”, o bookmarking uma ocultura de “informação sob demanda”, bookmarking tem potencial para tornar-se a principal oponte entre a tem o“real” potencial para tornar-se a porém principal entre asa visita e “virtual” ao museu, ao ponte analisarem visita “real”dee uso “virtual” ao museu, porémmuseus ao analisarem as estatísticas do serviço em diversos europeus, estatísticas deque uso há do serviço diversos museus europeus, concluíram diversasemrazões impedindo que as concluíram há alcançadas. diversas razões impedindo que de as expectativas que sejam Dentre elas: falta expectativas sejam alcançadas. Dentre para elas:acessar falta de interesse e de tempo dos visitantes as interesse e de tempo dos desconhecimento visitantes para acessar as informações posteriormente, do serviço informações posteriormente, desconhecimento serviço no museu físico, falta de visibilidade e clareza dedo como usar no museu físico, falta de visibilidade e clarezaindicou de como usar o serviço no museu virtual. A pesquisa que o o serviço virtual.para A públicos pesquisaespecíficos, indicou que serviço temno ummuseu apelo maior como serviço temdefinidos, um apelocomo maiornopara específicos, com interesses casopúblicos da comunidade escolar. interesses definidos, como no caso da comunidade Por ser uma prática inovadora, é necessário que o escolar. público Por uma prática necessário que eo que público seja ser instruído sobre ainovadora, tecnologia ée seus benefícios seja seja instruído sobre a tecnologia e seus benefícios e que seja igualmente fácil encontrar o conteúdo selecionado no sítio igualmente do museu. fácil encontrar o conteúdo selecionado no sítio do museu. Uma segunda forma de oferecer o serviço de bookmarking Umavisitantes, segunda forma de oferecer o serviço de bookmarking aos tem sido viabilizado pela tecnologia RFID aos visitantes, por temRadiofreqüência), sido viabilizado que pelausa tecnologia (Identificação ondas de RFID rádio (Identificação Radiofreqüência), que usaNos ondas de rádioo para identificarporobjetos automaticamente. museus, para identificar automaticamente. museus,queo sistema é usado objetos para identificar visitantes Nos individuais sistema uma é usado para identificar que portam etiqueta RFID no visitantes pulso e aindividuais utilizam para portam uma etiqueta RFID no pulso enosa utilizam marcar as informações disponíveis quiosquesparae marcar as posteriormente informações disponíveis consulta-las [27] . Umanos vez quiosques informado oe consulta-las [27] a. visita, Uma vez informado código RFIDposteriormente recebido durante o usuário podeo código durante a segundo visita, oseus usuário pode usufrui RFID de um recebido sítio customizado interesses usufrui de um sítio customizado segundo seus interesses pessoais. pessoais. A distribuição automática de conteúdo (RSS) está inserida A conteúdodo (RSS) está fora inserida na distribuição filosofia deautomática acesso aodeconteúdo museu, do na filosofia de acesso ao ao conteúdo do permite museu, fora museu, porém, associada Podcast, que do os museu, porém, ao Podcast, os arquivos de áudioassociada e vídeo produzidos pelospermite museus que (visitas arquivos ou de por áudio e vídeodoproduzidos pelos (visitas guiadas) usuários sítio possam ser museus usados durante guiadas) usuários do sítio possam ser usados durante a visita, ou emporseus próprios aparelhos. Além da questão a visita, em para seus ambas própriosasaparelhos. da questão econômica partes, Além os museus têm econômica esta paraprática ambas partes, o conhecimento os museus têm incentivado paraas aproveitar que incentivado esta prática para aproveitar o conhecimento cada visitante tem de seu próprio aparelho, poupando-oque do cada visitante tem de seu poupando-o trabalho de aprender a próprio operar aparelho, um artefato que lhe doé trabalho de aprender operar um artefato que lhe estranho. Além disso, aoa publicar podcasts em sítios comoé disso,está ao publicar podcasts em sítiosonline, como oestranho. iTunes, Além o museu ampliando sua presença o iTunes, oum museu estámuitas ampliando online, alcançando público vezes sua não presença freqüentador do alcançando vezes nãodos freqüentador do museu ou doum seupúblico sítio. Osmuitas inconvenientes Podcasts [26] museuem ou do sítio. Os inconvenientes dos Podcasts [26] estão seuseu formato linear e no pré-requisito de que o estão embaixe seu formato no pré-requisito de que oà visitante ao áudio linear em seue aparelho antecipadamente visitante baixe ao áudio em seu aparelho antecipadamente à ida ao museu. ida ao museu.
Novamente a questão do público é importante. Uma Novamente a questão do público pesquisa realizada por SAMIS [28] énoimportante. Museu de Uma Arte pesquisa realizada por SAMISsobre [28] as no preferências Museu de Arte moderna de São Francisco, dos moderna quanto de Sãoàs Francisco, sobre as dos usuários mídias utilizadas empreferências uma exposição, usuários os quanto mídias utilizadas em uma exposição, apontou mais àsjovens como entusiastas do Ipod e dos apontou osdemais comoaos entusiastas do Ipod dos tocadores MP3 jovens para acesso áudios e vídeos. Osemais tocadores de MP3 paraseacesso aosainda áudiospreferem e vídeos.alugar Os mais velhos, como era de esperar, os velhos, como de do se esperar, os aparelhos de era áudio próprio ainda museu,preferem emboraalugar também aparelhos de áudio do do próprio museu, embora também sejam receptivos ao uso aparelho celular. Uma segunda sejam receptivos uso GOODMAN do aparelho celular. Umaosegunda pesquisa realizadaaopor [24] sobre uso de pesquisa realizada por Science GOODMAN [24]Estados sobre o Unidos, uso de celulares no Liberty Center, celularespara no aLiberty Center,noEstados Unidos, apontou hesitaçãoScience dos visitantes uso de celulares apontou para adohesitação no uso deprovocado celulares no ambiente museu, dos um visitantes condicionamento no ambiente um condicionamento pelas normas dode museu, comportamento estabelecido provocado por estas pelas normas comportamento estabelecido por social estas instituições em de séculos de existência. O isolamento instituições séculos existência. O isolamento social foi apontadoem como umadecaracterística negativa na adoção foi aparelho apontado celular como uma negativa enanos adoção do comocaracterística mídia interpretativa altos do aparelho celular como mídia interpretativa e nos altos custos do serviço, fora dos EUA. custos do serviço, fora dos EUA. Outro indicador de integração entre o museu online e físico indicador de integração o museu online com e físico éOutro a realização testes dos entre projetos de sítios os é a realização de das testes dos projetos de sítiosinstalados com os próprios visitantes exposições, em quiosques próprios visitantes instalados nos museus, [29]das. exposições, Guardadas em a quiosques peculiaridades dos nos museus,as [29] . Guardadas peculiaridades dos– ambientes, distintas naturezasa comportamentais ambientes,emas grupos distintas comportamentais – interação no naturezas museu físico e individual na interação–, em grupos no museu dofísico e individual internet e a representatividade público presencial, na os internet enfatizam –, e a representatividade do público presencial, os autores o valor do método para coleta de dados autores enfatizam valor do para método para coleta de dados das interações doso usuários avaliação do protótipo, das interações dos usuários para avaliaçãonasdotecnologias protótipo, durante seu desenvolvimento. Inspirados durante eseu nas tecnologias digitais na desenvolvimento. cultura da internet,Inspirados museus ingleses testaram digitais na cultura da internet, museus ingleses testaram por setee meses um sistema dinâmico digital de legendas por sete mesesbaseado um sistema dinâmicoweb. digital legendas para artefatos, numa interface ParadeParry et al. para artefatos, baseado numa interface web.tenha Para Parry et al. [30] consideram uma ironia que “talvez chegado o [30] consideram ironia aqueaprender “talvez tenha o tempo da galeriauma começar com achegado web, do tempo da finalmente, galeria começar aprender com a web, do presencial, para o aonline”. presencial, finalmente, para o online”. Finalmente, para os que se preocupam ainda com a questão Finalmente, que se preocupam ainda com questão da tatilidade,para daosaura perdida do artefato no aambiente da tatilidade, da aura perdida do artefato virtual, as interfaces hápticas parecem apontar no um ambiente caminho. virtual, as interfaces apontartem um caminho. O Museu da Purahápticas Forma,parecem na Itália, realizado O Museu dacomPura Forma, hápticas na Itália, realizado experiências interfaces que tem permitem ao experiências interfaces hápticas que permitem ao usuário tocarcom e sentir as representações virtuais dos usuário tocar e sentir as representações artefatos do museu. Por meio de um pluggin,virtuais usuáriosdos do artefatos do museu. de simplificada um pluggin, da usuários do sítio podem acessar Por umameio versão exibição sítio podem acessar físico. uma versão da exista exibição instalada no museu Emborasimplificada tecnologia já há instalada no década, museu físico. Embora já custos exista ehá mais de uma só agora, com atecnologia redução dos o mais de de uma década, só agora, com a redução eo avanço alguns softwares e hardwares, temdos sidocustos possível avanço deasalguns softwaresque e hardwares, temabre sidonopossível explorar oportunidades o senso tátil campo explorar as oportunidades que o senso tátil abre no campo da interação [31]. da interação [31]. VISUALIZAÇÃO DAS FORMAS DE PRESENÇA ONLINE DOS MUSEUS DEDAS CIÊNCIAS BRASILEIROS VISUALIZAÇÃO FORMAS DE PRESENÇA ONLINE DOS MUSEUS CIÊNCIAS BRASILEIROS A amostra destaDE pesquisa foi composta pelo cruzamento dos
A amostra desta compostaBrasileira pelo cruzamento dos dados obtidos nopesquisa Guia dafoi Associação de Centros obtidos Guia da Associação Brasileira de Centros edados Museus de no Ciência [32], do Catálogo de Centros de e Museus deCientífica Ciência [32], do Catálogo Centros do de Divulgação Brasileiros [33], dade listagem Divulgação Científica Brasileiros [33], da listagem do
79
Estudo Sobre Centros e Museus de Ciências da Fundação Vitae [34], e de pesquisas livres na internet, compondo um conjunto de 138 instituições. Não foi feita distinção entre Museus e Centros uma vez que ambos se ocupam da divulgação científica e cujas diferenças não são significativas para os propósitos desta pesquisa. A região sudeste concentra 58% das instituições, que, quando somadas às da região Sul, somam 80% dos museus e centros de ciências brasileiros. Da amostra inicial, 33 não possuem (ou não foi encontrada) nenhuma forma de presença online. Este número somado aos sítios inacessíveis na época da coleta de dados, resultou em uma redução da amostra inicial para 94 instituições. Os respectivos sítios foram então analisados segundo os critérios da Espiral Evolutiva, que permite, ao mesmo tempo, visualizar a relação hierárquica dos quatro níveis de (Figura 2) presença e comparar os quatro níveis em um único gráfico.
Figura 2. Visualização das formas de presença online dos museus de ciência brasileiros
Como pode ser visto na Figura 02, a grande maioria dos sítios de museus de ciências brasileiros ainda limita-se ao papel primário de divulgação do museu físico na internet (Nível 1). Dos que se encontram nesta situação, 47% estão na categoria 1B, ou seja, além de fornecer as informações básicas sobre o museu, como endereço e horários de funcionamento, ainda mantêm o sítio atualizado com informações sobre eventos, notícias, avisos etc. São sítios dinâmicos, de atualização constante. A grande maioria sítios deste nível possui endereços (urls) de difícil memorização pelo usuário, como é o caso do sítio do Parque Botânico do Ceará (<http://www.sfiec.org.br/meioambiente/parque_botanico.a sp>), em oposição ao Parque da Ciência de Ipatinga,de Minas Gerais (<http://www.parquedaciencia.com.br>). Da lista de endereços encontrados (incluindo os sítios que não estavam acessíveis), apenas 45 apresentam url´s em que o
nome da instituição aparece como a informação primária do endereço, como no caso Museu de Arqueologia e Etnologia – MAE, da UFBA (<http://www.mae.ufba.br/>). Este fator compromete a encontrabilidade da maioria dos sítios de museus de ciências brasileiros na internet, uma vez que demanda esforços cognitivos que poderiam ser evitados, como a memorização das siglas de instituições aos quais os museus estão vinculados, como universidades (22 sítios). Apenas 55 sítios apresentaram uma preocupação em manter uma identidade visual própria, a exemplo da Exibição Nanoaventura (http://www.mc.unicamp.br/nanoaventura). Quatro instituições hospedaram seus sítios na Associação Brasileira de Centros e Museus de Ciência (ABCMC) utilizando um modelo padrão de leiaute, a exemplo do Museu de História Natural de Alagoas (<http://www.abcmc.org.br/mhn/>). O segundo nível evolutivo é ocupado por 20% dos sítios aqueles que oferecem serviços complementares à visita presencial. Na maioria dos casos, o formato dos documentos é textual ou imagético estático. Apenas quatro instituições deste grupo disponibilizaram arquivos em outros formatos, sonoros, audiovisuais e/ou interativos. Embora o acesso ao acervo possa ser um serviço importante à popularização da ciência e democratização do conhecimento científico, é necessário adequar os termos à população não especialista. Termos técnicos como os encontrados no acervo da Fundação Casa de Rui Barbosa (<http://www.casaruibarbosa.gov.br>) comprometem a compreensão das informações, a começar pelo nome do Canal - “Acesso às bases”. O nível três reúne as instituições que intermediam algum tipo de interação social em seus sítios ou em outros sítios na internet. Neste estudo, correspondem a apenas 5% da amostra de 94 museus. No sítio do Laboratório Didático do Instituto de Física - LADIF (Rio de Janeiro), alunos e professores podem enviar vídeos didáticos que são disponibilizados para acesso público. Dois vídeos estão disponíveis para download no sítio da instituição. O Museu do Universo aproveita a visita dos alunos em seu sítio para realizar uma pequena pesquisa de opinião com seu público. Além disso, as crianças podem enviar estórias e desenhos que são selecionados e publicados online. Os usuários do sítio do Museu da República recebem incentivos semelhantes. Fotografias do acervo servem de inspiração para que o usuário crie uma estória que pode ser selecionada para publicação em uma sessão do sítio. O uso de fóruns foi detectado nos sítios do LECT (Laboratório de Ensino de Ciências e Tecnologia - Escola do Futuro da USP), do Santuário Ecológico do Pipa (RN) e no Bioespaço (Centro Universitário da Fundação de Ensino Octávio Bastos). Nos dois primeiros, os participantes restringiam-se a alunos envolvidos em projetos de parceria entre estas instituições e escolas, e no último, um sítio recentemente reformulado, o fórum estava em construção.
80
Por último, como era de se esperar pelos resultados anteriores, não foi encontrada nenhuma manifestação de presença online característica do quarto estágio evolutivo – Apropriação do Museu pelo Público ou Museu-Fórum. Apenas cinco instituições, do total de 94, apresentaram práticas embrionárias que podem ser desenvolvidas para o nível seguinte, como a abertura de canais de diálogos descritos no parágrafo anterior. Mesmo os cinco sítios que apresentaram indicadores de interesse na intermediação de interações humanas, não estavam estruturados tecnologicamente para tanto, no sentido de facilitar a tarefa. O uso de blogs nos próprios sítios não foi adotado por nenhuma das instituições pesquisadas; e caso tenham sido mantidos extra-sítio, não foram referenciados nos sítios oficiais. Dentre os demais problemas gerais encontrados no cenário brasileiro, está a desatualização de grande parte das informações, o comprometimento da credibilidade da instituição pelo uso de leiautes e arquitetura de informação amadores, a restrição da acessibilidade quando alternados os navegadores Windows Explorer e Mozilla Firefox, a quantidade excessiva de textos em detrimento de imagens, refletindo uma cultura de mídia impressa e subaproveitamento da mídia digital e, finalmente, a ausência de uma metodologia de criação de sítios centrada no usuário. Diante destes dados, pode-se afirmar que os museus de ciências brasileiros encontram-se em um estágio defasado de desenvolvimento na internet, apoiando-se, ainda, em tecnologias web de primeira geração. Mesmo as iniciativas de diálogos restringem-se ao público escolar infantojuvenil, o que reflete a visão que estas instituições têm de seu papel social e de seu público. CONCLUSÃO
Historicamente, os museus têm sido flexíveis na adoção de posturas e configurações favoráveis ao desenvolvimento social e humano, refletindo os contextos socioculturais em que estão inseridos. Este estudo nasceu da necessidade de se mapear e compreender o fenômeno das formas de presença dos museus de ciências brasileiros na web, dada a importância das tecnologias digitais e da rede internacional de computadores na renovação das práticas museológicas em países desenvolvidos e do perfil brasileiro de uso da internet. A análise dos dados desta pesquisa revelou um desenvolvimento evolutivo que se inicia na simples ocupação de um endereço virtual com informações básicas sobre o funcionamento do museu físico, segue para a oferta de serviços e informações complementares à visita presencial, passa a também intermediar certa interação social e publicação de conteúdo pelo público, seja no sítio do museu ou em outros sítios de socialização, até chegar ao nível de se configurar como um assentamento de comunidades virtuais (que podem ou não se encontrar presencialmente no próprio museu físico).
A pesquisa revelou, ainda, que, independente da tipologia a que pertençam, os museus estrangeiros estão se apropriando do ambiente online como uma unidade identitária complementar ao ambiente físico, sendo mais apropriado chamar esta presença de “museu online” a museu virtual. A adoção desta terminologia parece ser útil para uma mudança de percepção das práticas museológicas na internet, na medida em que reconhece a existência de um único museu, um mesmo museu, presente e acessível em duas instâncias – uma territorial e outra desterritorializada. Talvez, estejamos diante de um processo de reterritorialização dos museus, onde a noção de lugar deva ser repensada. Percebeu-se que o quarto nível de presença online, apresenta todas as características do Museu-Fórum, razão pela qual, foi identificado por este nome. Embora tenham sido encontradas poucas manifestações desta tipologia nos documentos estudados, a forma mais evidente, preconizada pelo Museu de Ciências de Minnesota (EUA), mantém a diferenciação conceitual e psicológica aconselhada por Cameron (idem) no contexto do museu físico. Na internet, as prerrogativas de bom funcionamento das unidades Templo e Fórum foram atendidas criando-se dois sítios para o museu físico, cada um com sua identidade própria, mas interconectados por hiperlinks persuasivos. O fenômeno progressivo, de ocupação a apropriação da internet, foi melhor percebido quando visualizado pela Espiral Evolutiva das Formas de Presença Online. O instrumento de análise teórica proposto mostrou-se também útil na representação qualitativa das formas de presença online de museus de ciências brasileiros, onde é possível perceber tanto a relação conceitual hierárquica dos quatro níveis de presença representados pelas diferentes dimensões das sessões da espiral, quanto comparar os quatro níveis em um único gráfico. O uso do modelo como gráfico estatístico está condicionado a questões técnico-operacionais de fidedignidade de preenchimento das áreas de cada sessão da espiral de acordo com o valor atribuído - um procedimento alheio ao escopo deste trabalho. Do ponto de vista tecnológico, os dados desta pesquisa revelaram uma relação direta entre o uso de tecnologias web de 2ª e 3ª gerações e os estágios de desenvolvimento online. Há uma tendência crescente do uso de blogs, tagging s e podcasts pelos museus online analisados nos relatos de experiência da Conferência Museum and the Web 2007, assim como a inserção de tecnologias de uso pessoal na visita presencial e a integração dos dados gerados nas duas vertentes - física e online Em paralelo, a ocupação do ambiente virtual pelos museus de ciências brasileiros limita-se, quase que em sua totalidade, ao modelo transmissionista de divulgação do museu físico e de fornecimento de conteúdo complementar às visitas, em um comportamento típico da web de primeira geração. O estágio de desenvolvimento primário de ocupação da internet por nossos museus, torna-se também evidente por
81
outros indicadores, como a aparência amadora dos sítios, o uso exaustivo de texto, a desatualização das informações, os erros de carregamento das telas, os endereços longos e complexos que comprometem a encontrabilidade dos sítios e a ausência aparente de presença online extra-sítio. Embora não tenha sido objetivo desta pesquisa identificar as causas do fenômeno brasileiro, acredita-se que as razões de tal atraso na adoção de uma presença online mais interacionista sejam reflexos de três fatores principais: falta de cultura tecnológica (cibercultura, em especial) por parte dos dirigentes destes museus, falta de clareza em como a internet pode viabilizar a missão de cada instituição e a adoção de práticas museológicas orientadas pelo modelo de déficit de conhecimento. Talvez cause espanto os fatores escassez de recursos humanos e financeiros não figurarem na lista de justificativas. Acredita-se que, embora sejam condicionantes das formas possíveis de presença online, estas necessidades, mesmo quando supridas, não determinam o sucesso de uma ação museológica. Somente uma boa visão estratégica dos dirigentes, aliada a uma assessoria técnica qualificada e a uma missão claramente compreendida por todos os envolvidos no processo de divulgação científica pode promover a apropriação da internet pelos museus e centros de ciências brasileiros. Somente uma liderança informada e convencida dos benefícios da apropriação do ambiente virtual poderá influenciar os rumos dos museus de ciências em nosso País, seja através da elaboração de projetos amplos de expansão da presença online e integração das instâncias física e virtual, seja na contratação de pessoal qualificado para implementar uma visão condizente com as demandas de uma sociedade tecnocientífica, seja vislumbrando formas estratégicas para viabilizar tais objetivos, como no caso da parceria entre Petrobras e Museu da República. Como foi visto, muitas tecnologias de socialização são gratuitamente distribuídas na rede, o que pode ser utilizado experimentalmente antes de se decidir que tipo de prática online melhor pode responder às necessidades de cada instituição.
REFERÊNCIAS
1.
PRIMO, A. Interação mediada por computador: comunicação, cibercultura, cognição. Porto Alegre: Sulina, 2007. 240 p.
2.
BERTHLING, J. e ENGQUIST, A . Transcending The Boundaries Of The Museum! Managing Organisational Change In The Museum And On The Web. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: <http://www.archimuse.com/mw2007/papers/berth ling/berthling.html> Acessado em: 06/04/2007
3.
KNOBEL, M. ; FARES, D. ; MURRIELO, S. ; NUNES, C. ; PRADO, R.A. Design of an Interactive Web Sítio for the NanoAventura Exhibition. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: <http://www.archimuse.com/mw2007/papers/knob el/knobel.html> Acessado em 12/05/2007
4.
IWABUCHI, J. Taking a Museum Experience to Your Real World with VOLUMEONE: Introducing a Museum and User Friendly Video Distribution Platform on the Web. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em <http://www.archimuse.com/mw2007/papers/iwab uchi/iwabuchi.html> Acessado em 12/05/2007
5.
PEACOCK, D. e BROWNBILL, J. Audiences, Visitors, Users: Reconceptualising Users Of Museum On-line Content and Services. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/peaco ck/peacock.html Acessado em 13/05/2007
6.
KELLY, B., et al. Addressing The Limitations of Open Standards. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em <http://www.archimuse.com/mw2007/papers/kelly /kelly.html> Acessado em 12/05/2007
São consideradas limitações deste estudo, a falta de dados quantitativos atualizados sobre os museus brasileiros e a ausência de pesquisas anteriores sobre os museus de ciência brasileiros na internet. Infelizmente, as pesquisas sobre internet no Brasil ignoram os usuários menores de 16 anos, que constitui o público-alvo destas instituições. ACKNOWLEDGMENTS
We thank Interaction ´09 South America, CPF and volunteers, and all publications support and staff, who wrote and provided helpful comments on previous versions of this document.
82
7.
GRAY, P. Who are you calling cheap? In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em http://www.archimuse.com/mw2007/papers/gray/g ray.html Acessado em: 10/04/2007
8.
GATES, J. Case Study: New World Blogging within a Traditional Museum Setting . In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em http://www.archimuse.com/mw2007/papers/gates/ gates.html Acessado em: 10/04/2007
9.
ELLIS, M. e KELLY, B. Web 2.0: How to Stop Thinking and Start Doing: Addressing Organisational Barriers. . In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/ellis/el lis.html Acessado em: 07/04/2007
10. SPADACCINI, J. e SEBASTIAN, C. Radical Trust: The State of the Museum Blogosphere. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em http://www.archimuse.com/mw2007/papers/spada ccini/spadaccini.html Acessado em 13/05/2007 11. WITSCHEY, W. R. T.; PARRY, H. J.; MAURAKIS, E.; HAGAN, D.; WERNERAVIDON, M.; HOWARTH, C.; POHLMAN, D.; DODSWORTH, C. Museums in transition : emerging technologies as tools for free-choice learning. Informal Learning Review, The, No.81, Nov. Dez. 2006 Disponível em <http://www.archimuse.com/mw2006/papers/semp er/semper.html> Acessado em: 20/03/07 12. GUTIERREZ, H. e HEIMBERG, J. Dallas Museum of Art Presents The ARts Network. . In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em <http://www.archimuse.com/mw2007/papers/gutie rrez/gutierrez.html> Acessado em: 10/04/2007
13. BUCKLAND, M., et al., Access to Heritage Resources Using What, Where, When, and Who. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/buckla nd/buckland.html. Acessado em: 07/04/2007 14. OSSENBRUGGEN, J., et al. Searching and Annotating Virtual Heritage Collections with Semantic-Web Techniques. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/ossen bruggen/ossenbruggen.html Acessado em 13/05/2007 15. JONES, Q. Virtual-communities, virtual settlements & cyber-archaeology: A theorethical outline. Journal of Computer Supported Cooperative, 1997 16. ROBINSON, L., et al. My Evidence: Who’s the Authority Here. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/robins on/robinson.html Acessado em 13/05/2007 17. CARUTH, N. e Bernstein, S. Building an On-line Community at the Brooklyn Museum: A Timeline. . In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/caruth /caruth.html. Acessado em: 07/04/2007 18. FISHER, M. e TWISS-GARRITY, B.A. Remixing Exhibits: Constructing Participatory Narratives With On-Line Tools To Augment Museum Experiences. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/fisher/ fisher.html Acessado em: 07/04/2007 19. CAMERON, D. F. Museum, a Temple or the Forum. In Reinventing the Museum, Historical
83
and Contemporary Perspectives on the Paradigm Shift. Altamira Press, p. 61-73, 2004 20. CHAN, S. Tagging and Searching – Serendipity and museum collection databases. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/chan/c han.html. Acessado em: 07/04/2007 21. HALEY G., K. Cell Phones and Exhibitions 2.O: Moving beyond the Pilot Stage. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: <http://www.archimuse.com/mw2007/papers/hale yGoldman/haleyGoldman.html> Acessado em: 10/04/2007 22. KLÜTSCH, C., et al. MORITZ: A European Mobile Media Project For Historical Textile Industry Museums. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: <http://www.archimuse.com/mw2007/papers/kluet sch/kluetsch.html> Acessado em 12/05/2007 23. VAN LOON, et al. Supporting Social Interaction: A Collaborative Trading Game On PDA. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em 2007 http://www.archimuse.com/mw2007/papers/vanLo on/vanLoon.html Acessado em 12/05/2007 24. GOODMAN, C., et al. OpenCollection WebBased Collection Cataloguing and Access Software. . In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em http://www.archimuse.com/mw2007/papers/good man/goodman.html Acessado em: 10/04/2007 25. AROYO, L. et al. Personalized Museum Experience: The Rijksmuseum Use Case In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives &
Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/aroyo/ aroyo.html. Acessado em: 06/04/2007 26. WITSCHEY, W. R. T.; PARRY, H. J.; MAURAKIS, E.; HAGAN, D.; WERNERAVIDON, M.; HOWARTH, C.; POHLMAN, D.; DODSWORTH, C. Museums in transition : emerging technologies as tools for free-choice learning. Informal Learning Review, The, No.81, Nov. Dez. 2006 Disponível em <http://www.archimuse.com/mw2006/papers/semp er/semper.html> Acessado em: 20/03/07 27. FILIPPINI-FANTONI, S. e BOWEN, J. Bookmarking In Museums: Extending The Museum Experience Beyond the Visit? In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/filippi ni-fantoni/filippini-fantoni.html Acessado em: 10/04/2007 28. SAMIS, P. Gaining Traction in the Vaseline: Visitor Response to a Multi-Track Interpretation Design for Matthew Barney: Drawing Restraint. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em http://www.archimuse.com/mw2007/papers/samis/ samis.html Acessado em 13/05/2007 29. HSI, S., et al. From 'Guerrilla' Methods to Structured Evaluations: Examples of Formative Web Design from the Exploratorium's Evidence and Mind Projects. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em http://www.archimuse.com/mw2007/papers/hsi/hsi .html Acessado em: 10/04/2007 30. PARRY, R. et al. How Shall We Label Our Exhibit Today? Applying the Principles of OnLine Publishing to an On-Sítio Exhibition. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em: http://www.archimuse.com/mw2007/papers/parry/ parry.html Acessado em 13/05/2007
84
31. TECCHIA, F. et al. Multimodal Interaction For The Web. In: Museums and the Web 2007, 2007, San Francisco, California. Museums and the Web 2007: Proceedings. Toronto: Archives & Museum Informatics. Toronto, Canadá : Archives & Museum Informatics, 2007. Disponível em at http://www.archimuse.com/mw2007/papers/tecchi a/tecchia.html Acessado em 13/05/2007
32. Disponível em <http://www.abcmc.org.br/publique1/cgi/cgilua.ex e/sys/start.htm?sid=26 33. Disponível em http://www.casadaciencia.ufrj.br/Publicacoes/publi cacoes_centros.htm 34. Disponível em http://www.abcmc.org.br/publique1/media/13093marilia-final.pdf
85
Inspeção semiótica do Wiki-STOA: uma análise a partir da teoria da complexidade Ecivaldo de Souza Matos
Universidade de São Paulo Faculdade de Educação Av. da Universidade, 308, Sala 59-B – CEP: 05508040 São Paulo/SP – Brasil ecivaldomatos@usp.br
ABSTRACT
Collaboration tools are features added to the set of computer technologies in order to make the processes of learning and human-computer interaction easier. Last year, the University of São Paulo (USP) launched a platform for social interaction for its academic community, this platform is the STOA. This platform enables social, learning, teaching and research interactions by the academic community located on all campuses of USP. In this paper, I present an evaluation of the interaction of wiki-STOA component. This evaluation is based on complexity theory and semiotic engineering. RESUMO
As ferramentas de colaboração são recursos agregados ao conjunto de tecnologias computacionais com o objetivo de facilitar o processo de interação humana e de aprendizado. No último ano, foi lançada uma plataforma de interação social para a comunidade da Universidade de São Paulo (USP) intitulada STOA. Esta plataforma possibilita interações sociais, de ensino, de aprendizagem e de pesquisa pela comunidade acadêmica espalhada por todos os campi da USP. Neste trabalho, será apresentada uma avaliação da interação do componente WIKI desta plataforma. Esta avaliação toma por base teórica e metodológica a teoria da complexidade e a engenharia semiótica, respectivamente. Palavras-chave
Avaliação de interface, pensamento complexo, inspeção semiótica. ACM Classification Keywords
H.5.2 User Interfaces.
INTRODUÇÃO
Todo conhecimento opera por seleção de dados significativos e rejeição de dados não signitificativos. Disto podemos inferir, conjuntamente com as necessidades operacionais da vida social cotidiana, as funções cognitivas que devem ser resultantes de uma aprendizagem eficaz (lista não exaustiva):
capacidade de associação;
capacidade de síntese;
capacidade de identificação de problemas;
capacidade de modelagem de problemas;
capacidade de hierarquização;
capacidade de seleção; dentre outras.
Tais capacidades ou competências tem sido cobradas de nós sem que, muitas vezes, tenhamos consciência disso. Mas a Escola tem o papel de atentar e dar conta da formação adequada para cada realidade, não somente visando atender “as realidades locais/regionais”, mas uma realidade complexa, temporal e dialógica, quando não polilógica, ou seja, uma realidade que não pode ser explicada por uma só visão, mas por um conjunto de lógicas entrelaçadas, que juntas podem dar conta da constituição complexa da realidade. Portanto, os Ambientes de Colaboração, dentre eles os Ambientes virtuais de aprendizagem – AVA, não devem ser projetados para trabalhar no “paradigma da simplificação” (Edgar Morin). Pois o input necessário para a aprendizagem, especialmente nesta era, é o de organizar cognitivamente a complexa rede de informações, incertezas, ambiguidades e desordem que são impostas pelos fenômenos sociais do nosso dia-a-dia, inclusive do nosso dia-a-dia acadêmico. Vale a pena salientar que "[...] quando se fala em educação, o primeiro e mais importante item a ser avaliado é o critério didático-pedagógico do software, pois todo e qualquer desenvolvimento de um produto para educação é permeado por uma concepção epistemológica" [14].
86
Para que o AVA possibilite o aprendizado é necessário que contribua para afastar as incertezas desse complexo, atual e inquietante conjunto de informações e tarefas de aprendizagem. Portanto, deve proporcionar ao estudante selecionar os elementos de ordem e de certeza, ajudando a retirar ambiguidades, a clarificar, a hierarquizar e a distinguir, ou seja, ajudar a efetivamente aprender. Essa facilitação não significa infantilizar o processo de ensino, muito menos de aprendizagem, mas torná-los dirigente e dirigível, possibilitando a compreensão, sem supersimplificações. Para tanto, no momento de concepção (visual, técnica e pedagógica), deve-se atentar para com os signos de interação utilizados. Sejam eles icônicos, indiciais ou simbólicos1; sejam estáticos ou dinâmicos; palavras, áudios, imagens ou multimídias. Um olhar complementar, mais abrangente e sistêmico pode ser proposto para análise desses ambientes, incluindo a concepção epistemológica sobre a qual foi desenvolvida, a funcionalidade, a usabilidade e a avaliação do sistema, sobretudo no contexto humano ou em sistemas organizacionais nos quais ele está inserido. [14]
Do ponto de vista do pensamento complexo, que integra os modos simplificadores do pensar, sem simplificar o real, jamais teremos um AVA completo. Pois, para Edgar Morin, assim como para Charles Peirce e vários outros filósofos (da ciência), o completo não existe. E, além disso, essa incompletude nos move. Os AVA devem possibilitar a construção e a manutenção de milhares de mundos, porém a limitação quando não é só tecnologicamente, por conta dos bits do conjunto hardware/software (conjunto de signos computacionais codificados e fechados numa linguagem formal), pode ser ideologicamente. Nesse trabalho, será apresentada uma avaliação semiótica de um componente de colaboração, portanto, também de ensino e de aprendizagem, de um ambiente virtual sob a ótica do pensamento complexo. Este ambiente virtual é o STOA. O STOA é um ambiente que congrega, em um só “espaço virtual”, um ambiente de interação social (comunidade virtuais – colaboração e prática), um ambiente de ensino-aprendizagem (AVA informação, interação, ensino-aprendizagem) e um ambiente de construção coletiva de texto (Wiki - edição) com a finalidade de reunir virtualmente as pessoas e suas 1
O signo, segundo a semiótica periceana, pode ser classificado como ícone, índice ou símbolo, além de dezenas de outras classes.
interações nos mais distintos e distantes campi da Universidade de São Paulo. Este ambiente ora concebido, ainda em fases de testes e adaptações, necessita ser usado, avaliado e criticado pela comunidade científica. O que ora cabe neste texto é avaliar a capacidade interacionista de um dos seus componentes: o wiki. PENSAMENTO COMPLEXO E EDUCAÇÃO
De certa forma, antagônico ao pensamento complexo está o pensamento simplificador. O paradigma simplificador vê a unidade e vê a multiplicidade, porém não vê que a unidade pode se unir à multiplicidade. Segundo Morin [11], o princípio da simplicidade separa o que está ligado (princípio da disjunção) e une o que está diverso (princípio da redução). A teoria da complexidade (pensamento complexo), enunciada pelo Edgar Morin, nos diz que não adianta estudar um ser ou um fenômeno simplificando-o, ou seja, observando apenas um de seus aspectos. Porque todos os seus aspectos estão interligados em um sistema. Não é possível estudar o professor sem estudar as suas condições de ensino, a sua instituição, seus alunos, seus conhecimentos, suas subjetividades. Assim como não é possível estudar o aprendizado dos alunos sem levar em conta as suas condições cognitivas, sociais, de ensino, a instituição. Enfim, há uma rede semiótica e simbiótica que, num primeiro momento, parece dificultar a análise, mas o que dificulta mesmo é não reconhecer a existência dessa complexidade. A complexidade não é uma visão mais complicada das coisas, porém mais realista, com a visão do todo e das partes, ambas interdependentes. A totalidade é o conjunto do estado de todas as coisas não isoladamente, mas interelacionadas e indissociáveis. Para efetuar a análise sob a ótica do pensamento complexo, precisamos articular o objeto de estudo com as necessidades e objetivos dele esperados, não compartimentá-lo para estudar as suas partes, simplificando e, depois, juntá-las numa análise “completa”. Nem sempre as partes configuram-se no todo. No contexto tradicional da educação, o dualismo receptor/transmissor está muito presente; porém com as tecnologias de informação e comunicação (TIC) as fragilidades dessa dualidade ficam claras, óbvias e visíveis a todos, inclusive aos alunos. Eis um dos motivos de medo (por parte de alguns) ao inevitável, a tecnologia na educação. O pensamento complexo, fundamento desta análise, se apóia na transdisciplinaridade, dentre outros princípios, como:
princípio holográfico [2];
princípio da complementaridade [3];
87
princípio da incerteza [9] apud [13]; e
princípio da autopoiése [10] apud [13].
Desses quatro princípios, dois merecem destaque. O primeiro é o princípio holográfico que entende que a parte só pode ser entendida em função do todo e vice-versa. O segundo é o princípio da autopoiése que entende que o aprendizado provoca mudanças, tais mudanças mexem com todo um conjunto sígnico do sujeito, por conseguinte com as suas relações com todo o meio (inclusive com os outros sujeitos e consigo próprio). Deve-se entender a aprendizagem como um processo vital: “trata-se de uma rede ou teia de interações neuronais extremamente complexas e dinâmicas, que vão criando estados gerais qualitativamente novos no cérebro” [1].
Figura 1 – Tela inicial do STOA
Segundo os desenvolvedores do STOA [15]: Stoa é uma rede social dos estudantes, professores, funcionários e exmembros da Universidade de São Paulo (USP). Os objetivos do Stoa são promover uma maior interação entre os membros da comunidade USP, criar um espaço onde cada pessoa dentro da Universidade tenha uma identidade digital de fácil acesso, tanto para quem está dentro da USP, quanto para a comunidade externa, e fornecer um sistema de softwares que facilite aos professores a administração de seus cursos para os estudantes.
STOA – AMBIENTE DE COLABORAÇÃO, ENSINO, APRENDIZAGEM E DE PRÁTICA
O STOA é um ambiente que congrega em um só “espaço virtual” um ambiente de interação social (comunidade virtuais – colaboração e prática), um ambiente de ensinoaprendizagem (AVA - informação, interação, ensinoaprendizagem) e um ambiente de construção coletiva de texto (Wiki - edição), além de blogs, calendários e repositório de arquivos. O “próprio ambiente” apresenta-se como o lugar onde você tem o seu blog, espaço de arquivos, perfil. Onde você pode encontrar seus contatos e juntar-se às comunidades de seu interesse. Apresentando o STOA
O STOA surgiu a partir da congregação de várias ferramentas virtuais isoladas de colaboração e de ensinoaprendizagem espalhadas pelos campi da Universidade de São Paulo – USP. Considerando que a aprendizagem é uma atividade cognitiva do sujeito, mas também um processo social, especialmente nos dias atuais, em que a socialização via meios virtuais tem se intensificado, o STOA, atualmente sob a tutela da Coordenadoria de Tecnologia da Informação da USP (CTI), usa a infra-estrutura tecnológica da USP para facilitar essa interação e formação de redes sociais e de aprendizagem pelos membros da sua comunidade, sejam alunos, funcionários docentes, funcionários não-docentes, ex-alunos, ex-funcionários, de mesmo campus, de campi diferentes, de áreas iguais ou distintas. Enfim, o STOA foi pensado para promover a agregação e, também, a facilitação do uso das TIC pelos professores em suas disciplinas, num espaço único e integrado, vide Figura 1.
Novamente, segundo os desenvolvedores do STOA, todos os softwares utilizados são livres e de código aberto, ou seja, não precisam ser pagos e podem ser modificados à vontade, isto não gera ônus de aquisição de software. Os principais softwares utilizados são [15]:
Elgg: uma plataforma para redes sociais;
MediaWiki: um wiki integrado ao banco de dados do Elgg (apenas para membros da comunidade universitária da USP);
Moodle: AVA para gerenciamento de disciplinas pelos docentes USP; por ser uma plataforma de ensino-aprendizagem, dentro do Moodle do STOA há alguns recursos de informação, colaboração e edição, como os fóruns, chats, ambientes de apresentação de informações, questionários, e, até mesmo, wiki.
Cada membro cadastrado no STOA possui um espaço disponível para blog, repositório de arquivos e a possibilidade de criar comunidades virtuais sobre temas quaisquer, na forma de blog coletivo ou de fóruns para discussão. O AVA (Moodle) acoplado ao STOA já possui interlocução com os sistemas administrativos de graduação e de pós-graduação da USP, Júpiter e Fênix, respectivamente. Mas, segundo a equipe de desenvolvimento do STOA, ainda há interesse em integrálo a outras plataformas para fins educacionais ou ferramentas de interesse para a comunidade USP [15].
88
Há, também, interesse em interagir com outras redes sociais e utilizar outras tecnologias como o OpenID, um identificador universal (na Internet) com o qual o usuário pode entrar nos mais diferentes ambientes virtuais sem precisar utilizar senhas, nem logins diferentes. O objetivo é descentralizar, segundo os mentores do STOA [15]: “[...] Nosso objetivo não é servir como uma plataforma de rede social centralizada”. Interessados em contribuir para o desenvolvimento desta plataforma podem ser aliar ao time de desenvolvedores, pois o desenvolvimento do STOA segue o paradigma de desenvolvimento global de software. A ENGENHARIA SEMIÓTICA
A Engenharia Semiótica é uma teoria de Interação Humano-Computador (IHC) dedicada a estudos do processo de significação e comunicação na IHC, sob aspectos da semiótica peirceana, considerando que a interface de software é uma ferramenta auxiliar para a mediação entre sujeitos quaisquer [6]. Vale salientar que a semiótica estuda os signos e suas influências nos processos de significação e comunicação, sendo este um processo intelectual [4,7]. A perspectiva semiótica interessa à IHC porque ela (semiótica) delineia o fato de que um produto computacional pode introduzir novos signos ou sistemas de signos no “universo” dos usuários, modificando os seus “mundos”, logo, servindo como arcabouço teórico complementar para a aprendizagem. Todavia, a comunicação entre os sujeitos mediados pela tecnologia não é um novo tipo de comunicação, porém possui características próprias da tecnologia empregada. No caso das TIC, a potencialidade comunicativa, por conseguinte interacionista, é restringida pelos aspectos formais da computação, uma vez que os artefatos computacionais são limitados. Tal limite é imposto, por exemplo, pela teoria da computação baseada em estados finitos e bem definidos, o que nem sempre é verdade nos processos de significação, comunicação e interações humanas. Esse processo de comunicação é iniciado no momento de concepção do software, pois há neste artefato uma codificação sígnica “imposta” pelos desenvolvedores. Aqueles que consigam compreender esse sistema lingüístico codificado conseguirão obter uma interpretação bem próxima à ideia original, logo, poderão usufruir melhor do ambiente. Eis um aspecto que, ao invés de simplificar o produto intelectual ora criado, complexaliza o processo interacionista. Isto porque em produtos de software, especialmente os AVA, os processos cognitivos e semióticos são indissociáveis, portanto, complexos. A Engenharia Semiótica estuda e aplica as teorias semióticas (especialmente a semiótica peirceana), sob aspectos de significação e comunicação aos diversos signos e novos sistemas de signos que compõem o design de
interfaces de softwares, de forma a contribuir adicionando novas visões (ou mudando a perspectiva) e possibilidades em IHC, inclusive observando e analisando como esses signos interferem no mundo mental e comportamental dos usuários de sistemas computacionais. Isto ao considerar novos signos ou sistemas de signos interacionistas, gerando novas significações na mente do usuário. No entanto, significado é algo fugaz, pode mudar rapidamente. Sendo assim, um mesmo usuário em momentos distintos pode perceber significados diferentes para o mesmo “representamen”. E esse processo de significação (humana) pode ser infinito, é a chamada semiose ilimitada A semiose ilimitada é um processo complexo e que não pode ser modelada através de algoritmos ou grafos, uma vez que ela não tem condições de definir precisamente condições de parada. Conseqüentemente, dentro do escopo de uma teoria semiótica não pode haver um modelo computacional de interpretação e significação humana. Entretanto, o design de produtos de software é composto por metassignos, considerando que eles representam o que os designers tem em mente quando finalizam o processo de design. Portanto eles podem fazer “semiose limitada”, induzindo ao usuário o processo natural de semiose ilimitada, impondo aspectos subjetivos. Diferente do que defende Umberto Eco para a narrativa textual, onde ele diz que "um narrador não tem que fornecer interpretação da sua obra, ou não valeria a pena escrever romances, uma vez que eles são, por excelência, máquinas de gerar interpretação" [7], na IHC os desenvolvedores devem fornecer caminhos para uma conjunção interpretativa entre atores mediados, para que a linha de interpretação seja única, ou próxima disso. Fazendo um paralelo entre a semiose limitada e ilimitada e aquilo que Eco chamou de tradição "hermetista”, onde ele afirma que todo texto (leia-se “objeto de interpretação”) possui uma intenção própria, ou seja, haveria um sentido singular que proibiria algumas interpretações sem, todavia, indicar uma em particular [8]. Isso faz pensar que em IHC o designer, durante o processo de concepção de interfaces, pode provocar a existência de um “subuniverso” interpretativo sobre o qual o usuário pode inferir sobre os objetos de interação, mas dentro de um conjunto de possíveis interpretações. Para alguns objetos isso pode ser possível, talvez não para todos. Essa reflexão retrata a semiose limitada, mas precisa ser profundamente investigada. Considerando a teoria da engenharia semiótica, a concepção de interfaces não encerra descrições objetivas de significado, o conjunto linguístico usado no processo de design é por si só subjetivo. E o conjunto linguistico utilizado na interação com esses softwares também são subjetivos, porém circunscritos num conjunto sígnico prédeterminado.
89
Por conta desses aspectos, os componentes de um AVA tendem a ser mais efetivos quanto mais próximo estiverem dos conjuntos de significação dos sujeitos que utilizam o ambiente. Por isso, avaliações baseadas em teorias de fundo semiótico são relevantes. Inspeção Semiótica
A inspeção semiótica é um dos métodos de avaliação de interfaces da Engenharia Semiótica. A inspeção semiótica é o método da engenharia semiótica que examina um diverso conjunto de signos aos quais os sujeitos estão expostos ao interagir com quaisquer sistemas computacionais interativos [5], como os AVA. Haja vista a definição acima, percebe-se a centralidade que o conceito de signo tem nesse método, assim como em toda a engenharia semiótica. Vale a pena, portanto, conceituar signo. Segundo Santaella e Vieira [12], “signo é qualquer coisa, de qualquer espécie, que esteja presente à mente – imagem ou quase imagem, relações claras ou vagas entre idéias, palavras soltas ou articuladas, memórias, som, afecções, emoções. [...] O signo verbal, linguístico, discursivo, as palavras são apenas um dos subtipos dos tipos de signos.” O principal propósito do método de inspeção semiótica (MIS) é avaliar as possibilidades de comunicação sugeridas pelo software que é avaliado, ou seja, quais as potencialidades e limites impostos pela interface à comunicação humana. Com isso podemos antecipar os tipos de consequências que haverão durante a real interação dos sujeitos utilizando a tecnologia escolhida. O MIS é dividido em cinco etapas: 1.
análise dos signos metalinguísticos;
2.
análise dos signos estáticos;
3.
análise dos signos dinâmicos;
4.
comparação entre a mensagem de metacomunicação gerada nas etapas anteriores; e
5.
avaliação qualitativa final das possibilidades e limites interpretativos e, consequentemente, comunicativos do sistema inspecionado.
Na primeira etapa, são analisados os signos metalinguisticos existentes na documentação e quaisquer outras metamensagens expressas no próprio ambiente virtual ou software (sistema). Na próxima etapa, são analisados os signos que são, a priori, interpretados independentemente das relações temporais, causais e consecutivas, se valendo apenas os elementos sígnicos
presentes na interface (estáticos) em determinado momento. Já na terceira etapa, avaliação dos signos dinâmicos, são analisados os signos resultantes da interação do sujeito com os signos estáticos, ou seja, a transição semiótica presente na interface, como, por exemplo, as mensagens de erro ao clicar em um botão presente na interface. A partir dessas três primeiras etapas, será possível construir a mensagem de metacomunicação, etapa 4: “Aqui está o meu entendimento de quem você é, o que eu aprendi que você quer ou precisa fazer, de qual jeito você prefere fazer e por que. Este é o sistema que eu projetei para você e este é o jeito que você pode ou deve usá-lo para satisfazer seus propósitos”. Na última etapa do MIS, avalia-se a(s) condição(ões) de interpretabilidade do sistema, reconstruindo uma mensagem de metacomunicação unificada, com base nas etapas anteriores. Todavia, com influência do avaliador, que determina, segundo seus critérios, as possibilidades e os limites semióticos, ou seja, de significação, dessa porção de software. Na próxima seção será apresentada uma aplicação do MIS à um dos componentes do STOA, o WIKI. Este componente é uma ferramenta de edição e colaboração que possui uma forte vertente pedagógica, pois permite que vários sujeitos possam elaborar conjuntamente uma atividade editorial, como um texto. Inspeção Semiótica do Wiki-STOA
Vale a pena citar que a cognição humana envolve pensamento abstrato e linguagem, ou seja, manipulação de signos. Portanto, nada mais interessante que a semiótica para avaliar uma ferramenta “epistêmica”, pois nos trará informações/novos conhecimentos sobre possibilidades interpretativas diante de signos que estarão à disposição, em um determinado AVA, dos sujeitos que aprendem e dos sujeitos que ensinam. O wiki é uma ferramenta que permite a edição coletiva de documentos. Uma das características da tecnologia wiki é a facilidade com que as páginas são criadas e alteradas geralmente não existe qualquer revisão antes de as modificações serem aceitas, e a maioria dos wikis são abertos a todo o público ou pelo menos a todas as pessoas que têm acesso ao servidor wiki. Maiores detalhes sobre o componente wiki do STOA serão apresentadas durante a inspeção semiótica, mais adiante. Para uma visão global da tela do componente wiki do STOA, vide Figura 2.
90
Figura 2 – Tela do componente wiki
Elaborando a inspeção semiótica
1ª. Etapa: Análise dos signos metalinguísticos Neste momento do MIS são analisados todos os discursos disponíveis sobre o artefato de software, cujo enunciante sejam os desenvolvedores do produto. Nesse caso, vamos analisar metainformações sobre o wiki do STOA apresentados na documentação do STOA presente no próprio ambiente e acessível a partir dos itens sobre (about), ajuda e wiki. A partir de partes do discurso enunciado pelos desenvolvedores, poderemos escrever a mensagem de metacomunicação. Eis, portanto, excertos retirados do próprio STOA. Excerto dos itens sobre (about) e ajuda: Stoa é uma rede social dos estudantes, professores, funcionários e exmembros da Universidade de São Paulo (USP). Os objetivos do Stoa são promover uma maior interação entre os membros da comunidade USP, criar um espaço onde cada pessoa dentro da Universidade tenha uma identidade digital de fácil acesso, tanto para quem está dentro da USP, quanto para a comunidade externa, e fornecer um sistema de softwares que facilite aos professores a administração de seus cursos para os estudantes. Na plataforma de rede social cada membro e ex-membro da universidade possui um blog, um espaço para guardar seus arquivos e a possibilidade da criação de comunidades, que pode ser usada como um fórum de discussão ou um blog coletivo. Além da plataforma de rede social, já estamos usando o Moodle
integrado aos sistemas Júpiter (graduação) e Fênix (prós-graduação), facilitando assim o processo de criação, pelos docentes, dos cursos com material online, além de inserir automaticamente os alunos em cada curso. Visamos integrar o sistema Stoa com outras plataformas para fins educacionais ou ferramentas de interesse para a comunidade USP. [15]
Atentemos para os itens grifados, tais palavras nos ajudarão a traçar a mensagem de metacomunicação. Excerto do item wiki: O Wiki do Stoa é o nosso serviço menos utilizado, mas com potencial enorme. O nosso wiki foi idealizado pelo Everton, foi usado bem no início pelo Prof. Luli e os seus alunos, é usado para a documentação do Stoa, é usado para catalogar os equipamentos de video-conferência a USP e mais. Mas dá para fazer muito mais. Atualizei o software (MediaWiki, o software que o wikipedia usa) um mês atrás para a sua última versão. Aproveitei e re-escrevi a integração com o base de usuários do Stoa: antes o sistema tentava descobrir se estava logado no Stoa e caso sim, logava você automaticamente. Mas não era um sistema robusto e fiz agora um esquema igual ao que temos no Moodle do Stoa. Temos agora somente "senha única": para se logar no wiki.stoa.usp.br vai usar o sistema de autenticação do MediaWiki, mas pode usar o seu usuário (não o seu número USP, ainda) e a sua senha do Stoa.
91
exportação/importação de páginas. Pode exportar as suas páginas e importar em qualquer outra instância de MediaWiki. (Isto é verdade para o nosso Moodle também.)
A atualização do software possibilitou outras melhorias: 1. Agora visitantes (pessoas não logados, talvez porque não tem número USP) podem contribuir. Atendendo a sugestão do Abdo, instalei o plugin "Flagged Revisions" e configurei o sistema para funcionar assim: se um visitante deixar uma contribuição, não será visível na página titular (ou "aprovada"). As próximas edições serão feitas numa página "rascunho", até um usuário logado aprova o rascunho que então virá a página titular. Este usuário do Stoa será então o responsável pela página. Os mecanismos normais de MediaWiki funcionam normalmente no caso de contribuições não-apropriadas (spam, etc.): qualquer um pode, com 2 cliques do mouse, reverter qualquer edição. Estas mudanças serão somente visível na página "rascunho", até um usuário aprova a revisão atual do rascunho. 2. Temos a última versão do plugin para "Google Maps", permitindo inserir mapas com referências a páginas neste wiki.[...] Casos de uso: De uma maneira geral a tecnologia Wiki é especialmente apropriado para a confecção de documentos colaborativos. Mas pode ser usado também como uma maneira simples de colocar conteúdo na Web. Algumas possibilidades: 1. O Abdo quer usar o wiki para colaborar num projeto de pesquisa com os seus colaboradores. Agora pode mandar o link do projeto para os seus colegas e entrar de vez em quando para dar o aval à última versão da página. Repare também que pode ir no seu perfil e ligar notificações, permitindo assim acompanhar via email qualquer mudança em páginas de seu escolha 2. Um professor pode criar a página de planejamento do seu curso. É uma maneira muito simples e ágil de disponibilizar e centralizar informações. Um uso mais interessante é deixar os seus alunos construir algo de útil colaborativamente, relatórios, por exemplo. 3. Mas e se algo acontecer com o servidor do Stoa? Todo este trabalho será perdido? Não! O MediaWiki tem um sistema bem desenvolvido de
[...] 5. O caso de uso mais revolucionário seria como ferramenta de planejamento e tomada de decisões, implementando o que vocês jovens chamam de "transparência radical". Convido todos os grupo de trabalho, de qualquer natureza, usar este wiki para os seus atos de reuniões, relatórios e outros documentos.
A partir desses excertos podemos inferir uma mensagem de metacomunicação que contam com os seguintes itens:
Quem é você (que utiliza o ambiente virtual)?
O que você quer?
O que você precisa fazer?
De qual jeito você prefere? E por quê?
Isto é o que projetei para você.
Esse é o jeito que você pode/deve utilizá-lo.
Vamos verificar, nesse ponto, se as informações selecionadas, no próprio ambiente STOA sobre si e sobre o seu componente wiki nos responde:
Quem é você (que utiliza o software)? o
estudantes matriculados na USP;
o
professores da USP (em exercício);
o
visitantes (sem número de matrícula na USP).
O que você quer? o
catalogar equipamentos videoconferência;
o
compartilhar e colaborar arquivos/textos de um projeto de pesquisa com outros pesquisadores/colaboradores.
de
O que você precisa fazer? o
criar usuário (login);
o
logar com usuário précadastradados.
e
senha
De qual jeito você prefere? E por quê? o
logar com número de matrícula USP (mais conhecido como número USP);
o
usar uma senha única para todos os serviços.
92
Isto é o que projetei para você o
plugin para GoogleMaps®;
o
Confecção de documentos colaborativos – WIKI;
o
acompanhar via e-mail qualquer mudança de páginas;
o
forma simples de colocar documentos na WEB;
o
criar página de planejamento de cursos (professores).
Esse é o jeito que você pode/deve utilizá-lo. o
usar rascunhos no WIKI até que este seja finalizado;
o
sendo finalizado, uma pessoa responsável pelo seu conteúdo;
o
permitir (professor) que seus alunos possam construir relatórios (ou outros textos) colaborativamente;
o
usar o wiki para guardar atos de reunião, relatórios e outros documentos.
Figura 3 – Alguns signos estáticos do componente wiki
Dentre os itens destacados temos (ipis litteris como descrito na interface):
página de usuário: pode indicar que esta página é somente do usuário autenticado no sistema;
discussão: pode indicar que em um texto construído colaborativamente nesta ferramenta, possa haver um espaço para discussão sobre o mesmo;
editar: indica que há a possibilidade de edição do texto uma vez escrito;
história: para quem já conhece uma ferramenta wiki, pode inferir que este signo indicie a possibilidade de reaver o histórico de alterações realizadas no texto coletivo;
mover: indicia, muito levemente, a possibilidade de mover trechos de texto para outra composição textual;
vigiar: indica que as alterações no texto podem ser observadas por um (ou mais) sujeitos, com o objetivo de “vigiar” o que está sendo escrito, mas não fica claro quem seria esse sujeito; e
análise (OK): indica que o texto deve passar por uma análise (antes de ser publicado), podendo haver um comentário do analista.
será
Construindo a metamensagem ficaria assim: “Você é um estudante ou professor da USP, ou, ainda, um visitante externo à universidade. Você quer compartilhar equipamentos de videoconferência e arquivos ou textos de projetos de pesquisa com outros colaboradores. Para isso será necessário criar login e senha para entrar no sistema. Todavia, você prefere usar seu número USP e uma senha única para todos os serviços. Está a sua disposição um plugin para GoogleMaps®, uma ferramenta wiki, acompanhamento por e-mail para qualquer mudança de páginas, uma forma simples de colocar documentos na WEB, além de criar páginas para acompanhamento de cursos. Mas você poderá utilizar o ambiente de wiki para guardar atos de reuniões, relatórios e outros documentos, além de elaborar rascunhos até que seja finalizado e uma pessoa fique responsável pelo seu conteúdo, ou, ainda, o professor de determinada disciplina pode permitir que seus alunos construam relatórios colaborativamente”. 2ª. Etapa: Análise dos signos estáticos Para esta análise, consideramos apenas os signos estáticos da(s) tela(s) do componente wiki do STOA, vide Figura 3; desconsiderando, no entanto, a ferramenta wiki agregada à instância do Moodle que está acoplada ao STOA. Os itens assinalados são signos que chamam a atenção porque indiciam um discurso implícito na interface do ambiente virtual.
Ao navegar pelas abas destacadas (discussão, editar, história, mover, vigiar) percebemos alterações no layout dos componentes apresentados, ou seja, outros signos aparecem na tela. Todavia, neste texto não vamos tratar de todos signos, somente daqueles que influenciem diretamente na edição do texto coletivo enquanto um ambiente complexo e potencialmente pedagógico. Pois, alguns desses signos, por serem de cunho dinâmico, serão tratados na próxima etapa; outros serão sumariamente descartados. Com os itens e as inferências então postas podemos tentar escrever a metamensagem do sistema, que ficaria assim: “Você é um usuário cujo texto será compartilhado com outros usuários, você quer discutir esse texto durante o seu desenvolvimento, editar o texto, verificar o histórico de alterações realizadas pelos seus pares, além de mover trechos do texto para outras composições. Este é o sistema projetado para você e com o qual você (ou outra pessoa)
93
vigiará o que está sendo escrito, bem como analisará o texto antes de publicá-lo podendo, inclusive, oferecer um parecer (comentário). Para fazer essas atividades você deve clicar em abas, pois cada aba contém um conjunto específico de funcionalidades a partir das suas necessidades.” 3ª. Etapa: Análise dos signos dinâmicos
Os signos dinâmicos são aqueles que não conseguimos visualizar sem manipular os signos estáticos, sejam esses “ícones”, botões, caixas de texto, dentre outros. Nesta etapa, considerou-se a manipulação de alguns dos signos explícitos na Figura 3. Ao abrir a aba “editar” e digitar um texto, o conjunto de signos alterou-se, veja as Figuras 4 e 5, aparecendo o signo verbal escrito “rascunho” e “editar rascunho”.
Figura 4 – Tela de rascunho do wiki
Figura 5 – Tela de edição do wiki
Nesta etapa considerou-se a manipulação de alguns dos signos explícitos na Figura 3. A partir da manipulação do signo de edição, surgiu um novo conceito/signo chamado rascunho. O rascunho seria o texto editado, porém ainda não finalizado, ou seja, aprovado, que pode ser visto ou editado a partir do signo destacado na Figura 4. Vejamos na tela circulada em linha cheia (à esquerda da Figura 5) que uma chamada “página confiável” ainda está em branco, enquanto o rascunho, antagonicamente “não confiável” está preenchido com o texto. Isto mostra o rigor com a supervisão de conteúdo, impossibilitando talvez a geração espontânea de textos, talvez por isso o wiki seja uma das ferramentas menos utilizadas do STOA, como diz os seus desenvolvedores.
Na região indicada pela linha cheia, estão descritos qual a última revisão aprovada (e quando) e o que ainda está pendente de aprovação. Analisando apenas esses signos, podemos compor uma versão da metamensagem do sistema. É preciso que fique claro que diversas metamensagens podem ser compostas, a depender do feeling do avaliador e do conjunto de signos avaliados. Nesta etapa, não foram encontradas mensagens de erro ou explicativas, o que dificulta a avaliação semiótica, uma vez que o “sistema” não explicita as direções a serem tomadas pelos usuários. A metamensagem do sistema ficaria assim: “Você é um usuário que pode escrever o que desejar, sendo que seus textos serão considerados rascunhos até que alguém revise e/ou corrija seu rascunho e transforme-o
94
num texto revisado. Esse texto revisado será considerado confiável somente após aval desse revisor. Para que você saiba o que já foi revisado e o que ainda está pendente de revisão, o sistema envia uma mensagem estática na página de edição do rascunho”. 4ª. Etapa: comparação entre a mensagem metacomunicação gerada nas etapas anteriores
de
Nesta etapa, verificou-se se havia incoerências entre as metamensagens e, em seguida, uma metamensagem única para avaliação na próxima e última etapa da inspeção semiótica foi gerada: “Você é um estudante ou professor da USP, ou, ainda, um visitante externo à universidade. Você quer compartilhar textos de projetos de pesquisa com outros colaboradores, podendo discutir esse texto durante o seu desenvolvimento, além de editá-lo, verificar o seu histórico de alterações realizadas pelos seus pares, além de mover trechos do texto para outras composições. Para isso é necessário criar login e senha para entrar no sistema. Todavia, você prefere usar seu número USP (número de matrícula único na universidade) e uma senha única para todos os serviços. Para as atividades colaborativas textuais supracitadas está à sua disposição uma ferramenta wiki que você poderá utilizar para elaborar rascunhos. Esses rascunhos ficarão nesta condição até que seja finalizado e uma pessoa responsável revise-o e/ou corrija-o, transformando-o em um texto revisado, sendo considerado confiável a partir de então. Ou, ainda, o professor de determinada disciplina pode permitir que seus alunos construam relatórios colaborativamente. Este é o sistema projetado para você e com o qual você (ou outra pessoa) vigiará o que está sendo escrito, bem como analisará o texto antes de publicá-lo podendo, inclusive, oferecer um parecer (comentário). Para que você saiba o que já foi revisado e o que ainda está pendente de revisão, o sistema envia uma mensagem estática na página de edição do rascunho”. 5ª. Etapa: avaliação qualitativa final das possibilidades e limites interpretativos Essa etapa tende a ser muito técnica, que não é o objetivo deste texto. Por isso, optou-se por apenas descrever uma análise interpretativa dos signos ora destacados nas etapas anteriores e o que esses signos podem significar num contexto pedagógico. O que podemos perceber, somente com a inspeção semiótica dos signos selecionados, é que apesar do sistema ter sido desenvolvido para elaboração colaborativa de textos, e ele permite isso, o que é mais claro em sua interface é o controle pelo qual o texto passará. Isso nos mostra um pouco do controle institucionalizado na academia tradicionalista que vê as TIC ou os recursos tecnológicos para apoio à aprendizagem com receio e medo do novo. Todavia, permite que a comunidade acadêmica possa interagir com ganho de tempo e, nas disciplinas,
possibilitar a integração dos alunos sob a forte supervisão do professor. Nesta perspectiva, o professor mantém um papel “vigilante da aprendizagem”, restringindo a autonomia dos alunos. Sendo, portanto, uma ferramenta potencialmente pedagógica, porém apresenta características específicas de uma pedagogia tradicionalista do oprimido e tecnicista, em que o professor é o centro do conhecimento e vigilante das atividades dos seus alunos. CONCLUSÃO
A escola pode transformar a abordagem instrumental do conhecimento, porém há de assumir uma concepção do saber subjetivado, ou seja, o saber torna-se o modo de ser da pessoa [13]. Os AVA devem oferecer suporte a isso, uma vez que numa única instância dessa ferramenta há milhares de pessoas “plugadas” e cada uma com a sua necessidade de aprendizado e o professor com a difícil missão de organizar todo esse processo ou todos esses processos (individuais), mas não dá para vigiar, apenas acompanhar a uma certa distância cabível. Pois, além da impossibilidade física de dar conta de tantas mentes, em suas mais variadas complexidades de conhecimento, há, com o advento das TIC e dos AVA, um movimento dinâmico do todo com as partes, do micro ao macro, do macro ao micro, ou seja, várias direções e diversos sentidos, como pode ser percebido na inspeção semiótica do wiki do STOA; pode haver movimentos de textos rascunhados, “apaga – escreve”, outra pessoa “reescreve – apaga”, um terceiro vigia, outro analisa, dar parecer e “escreve ou apaga”. Enfim, há um movimento dinâmico que fica difícil conceber numa visão tradicionalista de educação. Com o wiki, noutros formatos, podemos trabalhar esse movimento dinâmico como parte do processo de aprendizado e, mais ainda, incorporar uma visão interdisciplinar a um contexto disciplinar. Varela [16 apud 13] declara que a realidade é uma construção do sujeito. Com tudo, como construir realidades autônomas num ambiente não-autônomo e unilateral? Mesmo em uma ferramenta desse porte tecnológico, o conservadorismo pedagógico tornado senso comum ainda é muito forte. Alguns dirão que é preciso, outros que nem tanto. Como saber os limites e encontrar o equilíbrio? Já dissera, anteriormente, que do ponto de vista do pensamento complexo, jamais teremos um ambiente virtual completo. Ademais, para que esses ambientes promovam autonomia na interação é preciso atenuar os aspectos ideológicos infiltrados na interface e nos mecanismos de interação. Fortalecer a autonomia no sujeito significa retirá-lo de uma situação passiva de percepção da realidade para uma situação crítica diante do mundo, eis um dos desafios da
95
educação e de todos que desenvolvem tecnologias interativas com fins educacionais e colaborativos. AGRADECIMENTOS
O autor agradece à Fundação Ford pelo suporte oferecido por meio do Programa Internacional de Bolsas de Pósgraduação da Fundação Ford. REFERÊNCIAS
1. Assmann, H. Alguns toques na questão “O que significa aprender?”. Revista Impulso, n. 21. UNIMEP, Piracicaba-SP (1997). 2. Bohm, D. A Totalidade e a Ordem Implicada: uma nova percepção da realidade. Cultrix, São Paulo (1992). 3. Bohr, N. Atomic Physics and Human Knowledge. Science Editions Inc, New York (1961). 4. Deely, J. Semiótica Básica. Ática, São Paulo (1990). 5. De Souza, C S; Leitão, C F; Prates, R O; Silva, E J. The Semiotic Inspection Method. Anais do IHC 2006. SBC, Porto Alegre (2006), 148-157. 6. De Souza, C.S. Semiotic Engineering of HumanComputer Interaction. MIT Press, Cambridge (2005). 7. Eco, U. Tratado Geral de Semiótica. 4ª ed., Perspectiva, São Paulo (1976). 8. ______. Os Limites da Interpretação. Perspectiva, São Paulo (1990).
9. Heisenberg, W. Teoria, Crítica e uma Filosofia. In: Salan, A.; Heisenberg, W.; Dirac, P. A Unificação das Forças Fundamentais: o desafio da física contemporânea. Zahar, Rio de Janeiro (1993). 10. Maturana, H. e Varela, F. A Árvore do Conhecimento. Psy II Editora, Campinas (1995). 11. Morin, E. Introdução ao Pensamento Complexo. Tradução de Eliana Lisboa. 3ª ed. Sulina, Porto Alegre (2007). 12. Santaella, L; Vieira, J. A. Metaciência: como guia de pesquisa: uma proposta semiótica e sistêmica. Editora Mérito, São Paulo (2008). 13. Santos, A. Didática sob a Ótica do Pensamento Complexo. Sulina, Porto Alegre (2003). 14. Schlemmer, E. Ambiente virtual de aprendizagem (AVA): uma proposta para a sociedade em rede na cultura da aprendizagem. In: Valentini, C B, Soares, E M S. (orgs.) Aprendizagem em Ambientes Virtuais: compartilhando ideias e construindo cenários. EDUCS, Caxias do Sul-RS (2005), 135-159. 15. Sítio do STOA (item sobre). http://wiki.stoa.usp.br/Stoa:Sobre. 16. Varela, F. Nós Criamos a Realidade. Entrevista de Angela Roethe, colaboradora da Revista Esotera, s/d.
96
Método para Aplicações Web Focado em Usabilidade Aderente a um Processo de Software Convencional Ricardo Hisao Watanabe
Centro Estadual de Educação Tecnológica Paula Souza Rua dos Bandeirantes, 169 - CEP 01124-010 - São Paulo - Brasil ricawat@hotmail.com ABSTRACT
The adoption of free software and the Web platform for computer systems in the Federal Government has made many changes in the model processes software development of subordinated organizations. Some of them have still conventional processes software development and they are not focused on usability questions. This paper discusses about a proposal method for Web applications with focus on usability for one public software development organization. Author Keywords
Web application, usability, Software process, Software engineering. ACM Classification Keywords
H5. Information interfaces and presentation (e.g., HCI): H.5.2 User Interfaces, User-centered design. INTRODUÇÃO
Oferecer sistemas computacionais que possam interagir de forma mais simples e atraente com os usuários sem, no entanto, comprometer suas funcionalidades, aumenta as chances de sucesso do sistema. Com este objetivo, as empresas desenvolvedoras de software têm incluído os conceitos, as metodologias e as técnicas de usabilidade que buscam melhorar a qualidade das interfaces de seus sistemas. No setor público, além das preocupações com as questões de usabilidade, a publicação pelo Governo Federal das diretrizes para implantação do software livre [1] e a recomendação para adoção das soluções Web multiplataforma no desenvolvimento de sistemas, impactou diretamente em algumas organizações voltadas para o desenvolvimento de sistemas convencionais. Segundo Winckler e Pimenta [2], as aplicações Web podem Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. Interaction South America '09, November 27-29, 2009, São Paulo, SP, BR.
Marcelo Duduchi
Centro Estadual de Educação Tecnológica Paula Souza Rua dos Bandeirantes, 169 - CEP 01124-010 - São Paulo - Brasil mduduchi@terra.com.br ser definidas como sistemas de software que utilizam a Web como ambiente de execução. Conallen [3] complementa ao citar que tais tipos de aplicações, além da utilização do ambiente Web, implementam lógicas de negócio, conexão com banco de dados e seu uso altera o estado do negócio. Os softwares convencionais, por sua vez, normalmente se destinam a uma plataforma computacional específica, conectam-se com bancos de dados, com outros sistemas e são desenvolvidos a partir de linguagens de programação, como por exemplo, o Delphi, o Visual Basic e o C++ [4]. Quanto ao desenvolvimento, os processos de aplicações Web e de softwares convencionais diferem em muitos pontos, dentre os quais, destacam-se os aspectos que englobam as pessoas envolvidas no desenvolvimento, as características específicas das aplicações Web e os usuários para os quais são desenvolvidos [4]. A organização pública estudada, apesar de possuir um Processo de Desenvolvimento de Software (PDS) que orienta o seu processo de desenvolvimento de software, este é voltado para sistemas convencionais e não contempla as particularidades das aplicações Web e nem tampouco as questões de usabilidade. Diante deste contexto, o objetivo principal desta pesquisa foi propor um método para o desenvolvimento de aplicações Web que contemplasse a participação do usuário, as inspeções das interfaces durante o processo e que fosse aderente ao Processo de Desenvolvimento de Software da organização pública estudada. O presente artigo está organizado da seguinte forma: primeiramente é feita uma revisão bibliográfica da usabilidade e da engenharia de usabilidade, aborda-se o desenvolvimento de protótipos e as avaliações de interfaces. Em seguida, define-se de maneira geral, as características de um processo de desenvolvimento de software, descrevese alguns métodos para aplicação Web existentes, para então analisar o PDS da organização em estudo. Finalmente, apresenta-se o método para aplicações Web proposto pelo presente estudo, seguido pelas conclusões. USABILIDADE
A usabilidade pode ser considerada como um sinônimo de facilidade de uso de um produto qualquer, como por
97
exemplo: dirigir um automóvel, operar uma máquina, tirar uma foto ou ainda, mais especificamente para este trabalho, interagir com um sistema computacional. Substituta da vaga expressão “amigável”, muito utilizada pelos fabricantes de software para qualificar seus sistemas computacionais como “fáceis de usar”, a usabilidade se mostra mais abrangente, mensurável e com abordagens voltadas não somente para o produto, mas também para o ambiente, usuários e interação. A abrangência da usabilidade foi especificada pela norma NBR 9241-11 [5] e pode ser verificada pela identificação de seus componentes: os usuários, as tarefas, os equipamentos, o ambiente e os valores reais ou desejados de eficácia, eficiência e satisfação dos usuários por ocasião da interação. Nielsen [6] acrescenta outros seis atributos que denotam a amplitude da usabilidade: a facilidade de aprender, a eficiência de uso, a facilidade de relembrar, poucos erros, a satisfação objetiva e a utilidade. Os componentes e os atributos de usabilidade constituem-se de pontos que devem ser observados por ocasião da concepção dos sistemas computacionais. Além desses, ainda são necessárias especificações de usabilidade mais pontuais, que direcionem e possibilitem o projeto e o desenvolvimento de interfaces mais usáveis. Oliveira Netto [7] ressalta que a aplicabilidade da usabilidade dos sistemas computacionais está voltada para as interfaces e interações, pois sua preocupação é a de projetar interfaces fáceis de usar, que forneçam seqüências simples, consistentes e que mostrem claramente as alternativas disponíveis em cada passo da interação. Interfaces e Interações Moran [8] define a interface de usuário como sendo a porção de um sistema computacional com a qual uma pessoa entra em contato de forma física, perceptiva ou conceitual. Pressupõe-se, ainda, a existência de um componente físico que o usuário manipula, um componente que engloba as percepções do usuário durante a interação e o componente conceitual que é resultante dos processos de interpretação e raciocínio do usuário [9]. A interação, por sua vez, é um processo que compreende as ações do usuário sobre a interface do sistema e suas interpretações a partir das respostas reveladas pela interface [10]. Identificam-se quatro tipos de atividades (interações) que os usuários executam quando utilizam um sistema: a instrução, que é a atividade na qual o usuário instrui o sistema quanto à realização das tarefas; a conversação, onde o usuário digita ou fala as perguntas e o sistema responde; a manipulação e navegação que disponibiliza ao usuário um ambiente virtual para este tipo de atividade; e a exploração e pesquisa que é disponibilização de informações de forma estruturadas a fim de facilitar as buscas [11]. Cabe observar que os tipos de interação não excluem uns
aos outros, pois um usuário pode realizar mais de um tipo de interação ao mesmo tempo. Princípios e Diretrizes de Usabilidade Os atributos de usabilidade como: a facilidade de aprender, a eficiência de uso, a facilidade de relembrar, poucos erros, a satisfação objetiva e a utilidade, propostos por Nielsen [6], têm por objetivo a concepção de produtos mais usáveis, porém, estes se constituem em colocações genéricas e não são específicos quanto à sua aplicação. Nesse sentido, os princípios e as diretrizes de usabilidade procuram atender aos atributos de usabilidade e são mais específicos quanto à sua aplicação na concepção de interfaces. Os princípios de usabilidade são aconselhamentos sobre as características de usabilidade de uma determinada interface de usuário e dependendo do projeto, diferentes princípios podem ser utilizados: princípios gerais, para todas as interfaces de usuários e princípios específicos para um tipo específico de sistema, como por exemplo, os destinados às crianças e às pessoas com deficiências físicas [6]. Por serem mais abstratos, os princípios de usabilidade exigem uma interpretação antes de sua aplicação. Por exemplo, o princípio: “Limite o número de estilos fontes e cores no seu site e aplique-os consistentemente” [11], apesar de relevante, é bastante genérico, devendo ser interpretado antes de ser aplicado ao contexto do sistema. As diretrizes, por serem versões mais específicas do que os princípios de usabilidade, não exigem interpretação para sua aplicação, proporcionam uma orientação mais detalhada e são normalmente acompanhadas de notas explicativas, exemplos e comentários [12]. Vários autores propuseram princípios e diretrizes de usabilidade, como exemplo, Bastien e Scapin [13] sugerem a seguinte diretriz: “O sistema deve indicar o tamanho do campo quando ele é limitado”. Os princípios propostos por Bastien e Scapin [13] compõem-se de oito critérios principais subdivididos em sub-critérios e critérios elementares. Mais voltados para as aplicações Web, Nielsen e Loranger [14] propuseram um conjunto de diretrizes de usabilidade baseadas em evidências empíricas, provenientes de testes de 716 Websites com 2.163 usuários espalhados pelo mundo e de uma fonte foi mais específica que contou com 69 usuários que testaram 25 Websites de vários gêneros (indústria, serviços, entretenimento, medicina e culturais). As diretrizes propostas por Nielsen e Loranger [14] abrangem os sites e as aplicações Web e estão relacionadas à navegação, arquitetura da informação, textos, apresentação dos elementos das páginas e página principal. ENGENHARIA DE USABILIDADE Por ocasião da concepção de uma página Web, o projetista deve atentar para os princípios e as diretrizes de usabilidade, porém, a construção de aplicações Web
98
também exige a adoção de métodos estruturados, participação do usuário, planejamento e atividades que são disciplinadas pela Engenharia de Usabilidade. A engenharia de usabilidade é uma disciplina que fornece métodos estruturados para alcançar a usabilidade em projetos de interface de usuário durante o desenvolvimento de um produto. Trata-se de uma disciplina com raízes em outras disciplinas básicas, tais como: a psicologia, a etnografia, a ciência cognitiva e a engenharia de software [15]. Segundo Nielsen [6], a razão básica para a existência da engenharia de usabilidade é a impossibilidade de se conceber uma ótima interface de usuário a partir apenas, da melhor opinião de um projetista, pois os usuários têm um potencial infinito para entender de forma inesperada os elementos da interface e realizarem suas tarefas de forma diferente do que era esperado pelo desenvolvedor. Cybis, Betiol e Faust [17] sugerem que, para o entendimento da proposta da engenharia de usabilidade, esta deve ser vista em relação à outra proposta de engenharia similar, como engenharia de software. A engenharia de software se ocupa do desenvolvimento núcleo funcional do sistema que é formado por estruturas de dados, algoritmos e recursos computacionais. As possibilidades de sucesso no desenvolvimento do núcleo funcional são maiores, pois engenheiro possui o conhecimento, a competência e o ferramental de engenharia de software que o auxiliam na elaboração de códigos eficazes. A engenharia de usabilidade ocupa-se da interface do usuário, que é o componente do sistema interativo, constituído de apresentações, estruturas de diálogo, painéis com informações, dados, controles, comandos e mensagens. Para o entendimento de quais atividades de engenharia estão envolvidas e como elas se relacionam, autoras como Preece, Rogers e Sharp [12] ressaltam a importância da utilização de modelos de ciclos de vida. Ciclos de Vida da Engenharia de Usabilidade Os ciclos de vida se tornaram muito populares por permitir que os desenvolvedores, e particularmente os gerentes, tenham uma visão geral do esforço global de desenvolvimento; do progresso alcançado; das metas estabelecidas; dos recursos alocados e dos resultados especificados [12]. Segundo Pressman [17], a utilização de modelos prescritivos de processo que definam um conjunto distinto de atividades, ações, tarefas, marcos e produtos de trabalho, não garante a perfeição, mas fornece um roteiro útil para o trabalho de engenharia. Os modelos de ciclo de vida existentes apresentam diferentes graus de sofisticação e complexidade. Para projetos menores com poucos desenvolvedores, a utilização
de um modelo mais simples provavelmente seria o mais adequado. Porém, para grandes projetos, com centenas de desenvolvedores e milhares de usuários, a utilização de um modelo simples não forneceria a estrutura e a disciplina de gerência necessária para a construção de um sistema usável [16]. Um ciclo de engenharia de usabilidade deve descrever as atividades, as relações, ter foco no usuário e permitir a realização de sucessivos ciclos de análise, concepção e testes (Fig. 1), com o necessário feedback dos resultados, identificando e refinando continuamente o conhecimento sobre o contexto de uso e as exigência em termos de usabilidade [16].
Figura 1. Ciclo de desenvolvimento centrado no usuário Fonte: Adaptado de Cybis, Betiol e Faust [16]
Dentro dos processos de engenharia de usabilidade identificam-se três características-chave [12]: • •
•
O foco no usuário, que é a base central do processo; A identificação e a documentação dos objetivos específicos dos usuários, por auxiliarem os desenvolvedores a escolherem entre as diferentes opções de design e verificarem seu progresso durante o desenvolvimento; e, A iteração, por permitir refinar o design com base no feedback.
Desenvolvimento Centrado nos Usuários A abordagem tendo como foco o usuário é especialmente indicada no desenvolvimento de sistemas com transações onde os usuários tenham expectativas de eficácia, eficiência e proporciona benefícios como: o desenvolvimento de sistemas mais intuitivos, fáceis de aprender e de utilizar, causam menos fadiga, proporcionam mais conforto ao usuário e garantem maior qualidade para o resultado final [16]. O envolvimento dos usuários durante o desenvolvimento do sistema é a melhor maneira de assegurar que se esteja levando em conta as atividades dos usuários, pois dessa forma os desenvolvedores têm um melhor entendimento das necessidades e dos objetivos desses usuários. Outros benefícios são: o gerenciamento da expectativa e o sentimento de apropriação [12]. O gerenciamento da expectativa consiste em garantir que as expectativas do usuário quanto ao sistema sejam realistas, evitando surpresas quando da entrega do produto. Com a participação do usuário no desenvolvimento, o gerenciamento da expectativa fica mais fácil, pois eles
99
estarão aptos a verificar desde os estágios iniciais do projeto quais são as capacidades do produto. O sentimento de apropriação fica evidenciado quando o usuário participa do desenvolvimento, pois este se sente mais envolvido ao perceber que contribuiu para o desenvolvimento do software (sente-se como “o dono do sistema”), mostrando-se mais receptivo quando da entrega do software pronto. A participação do usuário no desenvolvimento deve ser gerenciada de forma a estabelecer diferentes graus de envolvimento, onde a cooperação em meio turno ou em tempo integral, durante uma parte ou por todo o projeto, pode trazer vantagens e desvantagens [12]. Cybis, Betiol e Faust [16] descrevem três formas de envolvimento do usuário no desenvolvimento de um sistema ou produto: envolvimento informativo, envolvimento consultivo e envolvimento participativo. No envolvimento informativo o usuário é visto como uma fonte de informações, que são coletadas por meio de entrevistas, questionários ou de observações do seu trabalho. O envolvimento consultivo é aquele em que o usuário é chamado para opinar sobre soluções de projeto, elaboradas a partir de informações coletadas do próprio usuário ou não. Da mesma forma que no envolvimento informativo, este envolvimento pode ser feito por meio de entrevistas ou questionários. O envolvimento participativo constitui-se no nível mais elevado de envolvimento, onde o usuário tem poder decisório sobre o projeto, necessitando um esforço maior de planejamento, organização e execução do que os outros tipos de envolvimento. É desejável que o envolvimento dos usuários ocorra em uma combinação dos três níveis anteriormente citados, e que para isso é necessário conscientização, mudanças organizacionais e culturais, na empresa e na equipe de desenvolvimento. Atividades da Engenharia de Usabilidade O design de interfaces de usuário compreende atividades iterativas que implicam em passar por várias fases em níveis diferentes de detalhes. O processo consiste em: entender as necessidades dos usuários a partir da coleta de requisitos, elaborar os modelos conceituais com base nos requisitos coletados, construir protótipos, avaliá-los quanto às questões de usabilidade e objetivos da experiência do usuário, decidir sobre as implicações observadas a partir das avaliações, realizar as alterações nos protótipos e avaliar os protótipos novamente [12]. Preece, Rogers e Sharp [12] propõem quatro atividades básicas, que por serem genéricas, podem ser encontradas em outras áreas de design como, por exemplo, no design arquitetônico. As atividades compreendem:
• • •
•
A identificação e estabelecimento dos requisitos, que busca conhecer quem são os usuários-alvo e o tipo de suporte que o novo sistema pode oferecer; O estudo das opções alternativas de design; A construção de versões interativas com a elaboração de protótipos a fim de fornecer aos usuários uma melhor indicação do design que está sendo construído; e, A execução de avaliações, a fim de determinar a usabilidade e a aceitação do produto.
Identificação e Estabelecimento dos Requisitos O objetivo desta atividade é entender ao máximo possível os usuários, seu trabalho e o contexto deste trabalho, de forma que o sistema a ser construído ofereça o suporte necessário para atingir seus objetivos. A partir da identificação das necessidades, produz-se um conjunto de requisitos estáveis a fim de formar uma base para elaboração dos designs [12]. Segundo Pressman [17], a busca por requisitos estáveis deve-se ao fato de que os requisitos para sistemas computacionais mudam e que o desejo de mudá-los persiste ao longo da vida do sistema. Preece, Rogers e Sharp [12] definem que: “Um requisito consiste em uma declaração sobre um produto pretendido que especifica o que ele deveria fazer ou como deveria operar”. As autoras acrescentam que a atividade de estabelecimento de requisitos tem como objetivo torná-los mais específicos, não-ambíguos e mais claros. Em síntese, as atividades iniciais de um processo de engenharia de usabilidade consistem em apoiar os projetistas de interfaces na busca de informações sobre o contexto de uso e sobre a usabilidade do sistema a ser construído [16]. A identificação das necessidades e o estabelecimento de requisitos têm importância fundamental no processo, pois caso não seja executada corretamente e os requisitos estejam errados, o produto poderá ser ignorado ou pior, desprezado pelos usuários, ocasionando, tanto para o desenvolvedor como para o cliente, frustações, retorno de investimento perdido, perda da confiança do cliente e assim por diante [12]. Em uma pesquisa realizada no ano de 2000, que envolveu entrevistas com 38 profissionais de Tecnologia da Informação (TI) a fim de se investigar as causas da falha de projetos de TI, verificou-se que as questões sobre requisitos figuraram com alto índice nas respostas. Segundo a pesquisa, o item “definição de requisitos” foi apontado como o estágio de projeto que mais causou falhas; os “objetivos e requisitos pouco claros” foram apontados como a maior causa de falhas em geral e a “clareza e o detalhamento dos requisitos” foram indicados como um fator crítico de sucesso [18].
100
Conforme foi mostrado, os requisitos constituem-se nos itens de maior causa em falhas de projetos, por esta razão, a equipe de desenvolvimento deve atentar para a escolha e uso das técnicas de coleta de requisitos mais apropriadas, tais como: as entrevistas, as entrevistas em grupos de foco, os questionários, a observação do usuário e o estudo de documentação. Técnicas de Coleta de Requisitos A entrevista é uma técnica de coleta de requisitos, utilizada para descobrir fatos e opiniões dos potenciais usuários do sistema a ser concebido e é, geralmente, conduzida por um entrevistador (integrante da equipe de desenvolvimento) falando com um usuário ou um grupo de usuários [12]. Os resultados das entrevistas geram relatórios que serão cuidadosamente analisados pela equipe de desenvolvimento para assegurar seu impacto na concepção das interfaces do sistema. A técnica de grupos de foco consiste em uma reunião com uma amostra representativa de usuários que manifestam suas opiniões sobre determinado assunto. A reunião é conduzida por um moderador que, a partir de um roteiro previamente preparado, desenvolve os assuntos a serem tratados. Os usuários, cujo número normalmente varia de seis a doze participantes, devem ser convidados individualmente e informados sobre o que é uma reunião desse tipo, como se processa e qual os objetivos [16]. Os questionários são compostos de uma série de perguntas projetadas com o objetivo de se obter informações específicas dos usuários. Sua elaboração pode exigir diferentes formas de respostas, tais como: “sim ou não”, escolha entre opções pré-estabelecidas, justificativas, comentários ou uma resposta mais longa [12]. Cybis, Betiol e Faust [16] citam que a elaboração dos questionários deve sempre apresentar questões objetivas, amigáveis, fáceis de responder e tratar. O foco do questionário deve estar direcionado para a identificação de quais são as principais decisões e dúvidas da equipe de projeto. A observação do usuário é uma técnica de coleta de requisitos onde um membro da equipe de design observa o usuário em suas tarefas diárias, procurando entender como o trabalho realmente acontece em seu ambiente natural [16]. A técnica de observação é muito útil devido à dificuldade que as pessoas têm em explicar o que fazem ou mesmo descrever precisamente como realizam suas atividades. Isto significa que é pouco provável que se obtenha uma história completa e verdadeira dos usuários utilizando-se apenas de entrevistas ou questionários [12]. O estudo da documentação existente é uma boa fonte de dados sobre os passos envolvidos em uma atividade e sobre as regulamentações que governam determinadas tarefas. A documentação é normalmente composta por manuais com
procedimentos e regras, documentos do trato diário de tarefas, formulários, fichas entre outros [12]. A vantagem desta técnica é a de não comprometer o tempo do usuário, como as entrevistas e os questionários, e é indicada para conhecer as legislações ou as normas internas a fim de se obter informações sobre o embasamento do trabalho. A atividade descrita ao longo desta etapa tem como objetivo conhecer as necessidades dos usuários e o tipo de suporte o sistema poderia oferecer de maneira útil. Para possibilitar este conhecimento devem ser identificadas as técnicas utilizadas para a coleta, registradas e analisados os requisitos que vão sustentar o design e o desenvolvimento subseqüentes. Estudo das Opções Alternativas de Design Esta atividade compreende a busca de alternativas para o processo de concepção de interfaces do usuário, a partir da observação de outros designs semelhantes. Para Preece, Rogers e Sharp [12], a consideração dos designs alternativos é uma atividade valiosa dentro de qualquer processo de design e as fontes alternativas podem estar muito próximas do design desejado, tais como os concorrentes, versões anteriores de sistemas similares ou ainda algo completamente diferente. O processo de desenvolver a partir de outras aplicações parte do pressuposto de que muito pouco neste mundo é completamente novo e que normalmente, as inovações surgem a partir de idéias de diferentes aplicações, da evolução de um produto a partir da observação de outros ou da simples cópia de produtos semelhantes [12]. Nielsen [6] sugere nesta etapa a análise competitiva, que consiste em buscar e utilizar produtos de terceiros que tenham funcionalidades semelhantes às do software em desenvolvimento para realizar testes empíricos. Dessa forma é possível analisar as reações do usuário ao interagir com um sistema real na realização de tarefas com as quais ele se deparará durante a utilização do sistema. A análise competitiva não implica em apropriar-se de interfaces cujo direito autoral pertence a outros desenvolvedores, mas sim de projetar sistemas melhores do que os analisados, como um resultado da análise de seus pontos fortes e fracos [6]. A escolha entre as alternativas de design depende, basicamente, de dois fatores: o primeiro, da observação da interação e da experiência dos usuários com as alternativas, as preferências e sugestões para melhoria e o segundo fator de decisão é apoiado por questões de qualidade, levantadas a partir de avaliações de usabilidade [12]. As fases de identificação das necessidades, identificação dos requisitos e de análise de designs alternativos, compreendem atividades investigativas e fundamentais para a elaboração de versões interativas dos designs.
101
Construção de Versões Interativas Após a coleta e o estabelecimento do conjunto de requisitos, iniciam-se as atividades de design, que devem evoluir de forma iterativa, em ciclos de design-avaliaçãoredesign (Figura 1) envolvendo os usuários. Nos primeiros estágios do desenvolvimento, os protótipos são as primeiras versões interativas do sistema e podem ser feitas de papel e cartolina; com o progresso dos designs e o detalhamento das idéias, os protótipos vão se tornando partes do software, pois passam a se parecer com o produto final. Os protótipos são definidos como artefatos que possibilitam visualizações do futuro sistema e podem se constituir em um esboço de uma tela ou um conjunto de telas desenhado em uma folha de papel, num conjunto de imagens de telas em um vídeo, enfim, qualquer representação que possibilite aos usuários, desenvolvedores e interessados interagirem com o produto desejado [12]. A utilização de protótipos é muito útil nas discussões entre os interessados no sistema, facilita a comunicação pela demonstração de idéias e são eficazes para o teste de soluções. Preece Rogers e Sharp [12] citam que os protótipos esclarecem requisitos vagos, possibilitam a realização de testes com usuários e verificam se o design é compatível com o restante do sistema. Além da utilidade e dos benefícios, Nielsen [6] complementa que o uso de protótipos pode economizar tempo e dinheiro no desenvolvimento de algo, pois a longa experiência em engenharia de software indica que é muito mais barato mudar alguma coisa no início do projeto do que no final. A prototipação, que é o ato de elaborar protótipos, pode ser classificada em baixa ou de alta fidelidade. Os protótipos de baixa fidelidade não se assemelham muito ao produto final, são simples, baratos e de rápida produção. Por serem facilmente modificáveis, oferecem excelente suporte à exploração de designs e idéias alternativas e são particularmente indicados nos primeiros estágios do desenvolvimento [12]. Segundo Cybis, Betiol e Faust [16], a construção dos protótipos de papel (maquetes) deve ser organizada em quatro etapas: •
•
Definição do conceito: o objetivo dessa etapa inicial é transformar requisitos ou especificações do sistema em modelos conceituais de interface. A partir de uma reunião, buscando a geração de idéias, são definidas as telas com os componentes essenciais e o mapa de navegação com o fluxo principal do sistema. Projeto da interação: em reunião com usuários e projetistas, definem-se os nomes de cada tela sugerida, criam-se cartões com os nomes de cada tela. Os cartões são dispostos em uma parede, o
•
•
grupo de usuários e projetistas verifica a seqüência em que as telas são acessadas durante a realização da tarefa. A seqüência pode ser reorganizada, cartões de telas podem ser suprimidos ou adicionados. Projeto das telas: nesta etapa, as telas identificadas na etapa anterior são criadas e para o teste, o projetista deve organizar uma reunião com os usuários. Teste das telas: para o teste as maquetes deverão ser coladas na parede, dispostas na mesma seqüência que foi verificada nas etapas anteriores, os usuários deverão interagir com as telas de modo a simular a tarefa. A cada interação do usuário, o projetista explicará a reação da interface e indicará a próxima tela, se for o caso.
Avaliações de Usabilidade A conscientização quanto às questões de usabilidade ampliou-se muito nos últimos anos devido à presença da Web, porém, existe ainda muita resistência por parte dos projetistas, que insistem em achar que suas próprias impressões sobre a atratividade de uma interface são suficientes [12]. Algumas empresas têm a crença errônea quanto ao estudo e aplicação da usabilidade, por acreditarem que as atividades de avaliações de usabilidade vão retardar seus projetos [11]. As avaliações de interfaces são as atividades pelas quais os projetistas podem se certificar de que o sistema é usável e que está de acordo com o que os usuários desejam [12]. Interfaces de baixa qualidade, sem a preocupação com as questões de usabilidade e de avaliações, requerem treinamento excessivo dos usuários, desmotivam a exploração dos recursos disponibilizados, confundem e induzem os usuários ao erro, geram insatisfações devido às dificuldades de uso, diminuem a produtividade e não trazem o retorno de investimento esperado [12]. No processo de concepção de interfaces, as avaliações têm um papel fundamental e devem ser executadas durante todo o ciclo de desenvolvimento, a fim de que seus resultados sejam utilizados para a melhoria gradual da interface. Isso significa que as avaliações não se constituem em uma fase única no desenvolvimento e muito menos como uma atividade a ser executada apenas no final do processo [19]. Considerando que as avaliações podem ser realizadas em qualquer momento do processo de desenvolvimento, ou mesmo ao final do projeto, estas podem ser classificadas em Avaliações Formativas ou Avaliações Somativas [12]. As Avaliações Formativas (ou Construtivas) são realizadas ao longo de todo o processo de design, sempre que os projetistas precisarem compreender melhor o que os usuários desejam e precisam, ou quando precisam verificar se suas idéias atendem as necessidades conhecidas dos
102
usuários. Para este tipo de avaliação são utilizados artefatos como os protótipos do sistema.
usuários, a fim de se buscar um maior entendimento do que os usuários realmente executam.
As Avaliações Somativas (ou Conclusivas) são realizadas nas etapas finais de cada ciclo do desenvolvimento ou quando o produto está pronto. Nesta fase são avaliados os protótipos intermediários ou finais da aplicação.
Observar como as pessoas utilizam e se relacionam com artefatos tecnológicos, sem interferir ou propor tarefas, possibilita ampliar o conhecimento sobre suas atividades e a influência da tecnologia sobre elas.
Avaliações formativas e avaliações somativas são classificações baseadas em etapas do projeto, porém, as avaliações também podem ser agrupadas em padrões de avaliação, que podem ser distinguidas conforme a forma em que são realizadas ou quanto às pessoas que realizam a avaliação.
Estudos de campo são indicados para: prospectar a introdução de novas tecnologias; determinar requisitos para o design; decidir sobre estratégias de promoção e adoção de tecnologias; e, para descobrir como uma tecnologia é de fato utilizada.
Para Preece, Rogers e Sharp [12], as avaliações compreendem juízos de valor emitidos por usuários, interessados, especialistas ou desenvolvedores, baseados em crenças e expectativas originadas da teoria e/ou de experiências empíricas. Técnicas de Avaliação de Interfaces As crenças e as expectativas, associadas aos métodos ou técnicas de avaliação, podem ser aplicadas conforme os seguintes padrões de avaliação: Avaliação Rápida, Testes de Usabilidade, Estudos de Campo e Avaliação Preditiva As avaliações rápidas constituem-se em uma prática muito comum durante a concepção de interfaces. São avaliações realizadas por meio de reuniões informais entre usuários e desenvolvedores, com o objetivo de se obter apreciações sobre as interfaces e confirmar se as idéias dos desenvolvedores vão ao encontro das necessidades dos usuários. Os dados coletados das avaliações rápidas são geralmente descrições informais, que são canalizadas para o processo de design no formato de desenhos, relatos ou bilhetes. Os testes de usabilidade pressupõem o envolvimento de usuários finais ou representativos do público-alvo, realizando tarefas específicas em um contexto, real ou simulado, pelas quais, buscam-se constatar a existência de problemas, os impactos negativos e identificar suas causas na interface [16]. A realização de testes com usuários gera um amplo conjunto de dados que podem ser capturados por meio de recursos de monitoração, como por exemplo: vídeo do usuário realizando a tarefa, arquivos de log da interação na interface (por exemplo, movimentos de mouse, cursores ou teclas apertadas), áudio de comentários ou interjeições do usuário, e até mesmo certos sinais sensório-motores, como por exemplo, a direção do olhar ou a tensão muscular.
As avaliações preditivas são realizadas por especialistas que aplicam seus conhecimentos acerca dos usuários e de situações típicas de uso para prever problemas de usabilidade. Para realização da avaliação, os especialistas são geralmente guiados por listas de heurísticas e não é necessária a presença de usuários, razão pela qual o método é considerado relativamente barato, rápido e, conseqüentemente, atrativo para as empresas, apesar de suas limitações. As avaliações preditivas devem ocorrer a qualquer momento do projeto e podem ser avaliados protótipos, versões finais de interfaces ou modelos de aspectos específicos de uma interface. Os dados gerados são consolidados em uma lista com os problemas observados, que podem ser quantificados quanto ao grau de severidade do problema, adicionada de sugestões para aplicação no redesenho da interface. A filosofia das avaliações preditivas baseia-se na utilização das heurísticas e na experiência dos avaliadores e dos desenvolvedores que sustentam as revisões sugeridas pelos avaliadores. Finalizada a identificação das atividades da Engenharia de Usabilidade, serão apresentadas as características e alguns métodos para aplicações Web. DESENVOLVIMENTO DE APLICAÇÕES WEB Um processo de desenvolvimento de software compreende um conjunto de documentos que definem o fluxo de trabalho, as atividades, os artefatos e as funções dos envolvidos no processo. Como principais funções, um processo de desenvolvimento de software deve [3]: • •
Os dados coletados, após análise, podem ser utilizados para prever e explicar certas ocorrências de desempenho, bem como para ajudar a corrigir e prevenir erros de interação.
•
O estudo de campo caracteriza-se por englobar técnicas de avaliação que são realizadas em ambiente “natural” dos
•
Guiar o time de desenvolvimento quanto à ordem das atividades; Especificar quais os artefatos que devem ser desenvolvidos; Dirigir as tarefas dos desenvolvedores de forma individual e o time de desenvolvimento como um todo; e, Oferecer critérios de monitoração do projeto e das atividades.
103
No caso das aplicações Web, o processo de desenvolvimento pode aproveitar os princípios, os conceitos e os métodos da engenharia de software, porém, as características específicas desse tipo de software exigem abordagens diferentes, novas metodologias e ferramentas para seu desenvolvimento, implantação e avaliação [17].
concorrência, que se constitui nos acessos simultâneos, pode ser imprevisível. Independentemente da concorrência, o desempenho no atendimento das requisições do usuário e a disponibilidade da aplicação devem ser mantidos, pois os usuários podem abandonar a aplicação e irem para o concorrente [17].
Gonçalves et al. [20] corroboram com Pressman ao afirmar que os trabalhos publicados sobre desenvolvimentos de aplicações Web encontram-se fortemente baseados nos paradigmas da Engenharia de Software, mas, que apesar dessa forte ligação, a engenharia de aplicações Web apresenta novas preocupações, tais como a multidisciplinaridade, a abordagem de aspectos estéticos, funcionais e de usabilidade.
Quanto ao processo de desenvolvimento, as aplicações Web freqüentemente exigem um curto prazo para o projeto, construção e colocação no mercado. Após a disponibilização da aplicação, o processo de evolução é rápido e constante, diferentemente dos demais softwares de aplicação convencional que evoluem ao longo de uma série de versões programadas.
A diferente abordagem das aplicações Web quanto ao aproveitamento dos processos de desenvolvimento da Engenharia de Software está diretamente relacionada com as características específica desses tipos de aplicações, tais como seus componentes, arquitetura, aspectos de segurança, disponibilização e concorrência de acessos Aplicações Web Para Conallen [3], aplicações Web englobam sites Web e sistemas Web. Os sites Web compreendem a forma original de sistemas hipermídia distribuídos, que são compostos por documentos, imagens, sons, vídeos, com o propósito de permitir a pesquisa e o acesso a esses elementos e informações, publicados nos vários outros computadores que formam a Internet. Por outro lado, as aplicações Web ampliam o conceito de sites Web no momento em que são adicionadas funcionalidades que permitem aos usuários executarem lógicas de negócio a partir de um browser. Diferentemente dos sites Web, nos quais a busca constitui-se de documentos pré-formatados, nas aplicações Web, o conteúdo é construído dinamicamente, em função da interação dos usuários com as páginas Web [3].
Figura 2 - Arquitetura de uma Aplicação Web Fonte: Adaptado de Martins [21]
A arquitetura das aplicações Web inclui um servidor de aplicações, que é responsável pela execução da lógica de negócios, além dos componentes básicos de um site Web. Nas aplicações Web, é possível, ainda, adicionar um repositório de dados (banco de dados) ao servidor de aplicações (Figura 2). As aplicações Web são intensamente voltadas para redes, guiadas por conteúdo e evoluem continuamente. Podem atender uma comunidade diversificada de usuários, onde a
A forma de disponibilização das aplicações Web torna difícil, senão impossível a limitação da população final que pode ter acesso ao sistema. A proteção do seu conteúdo reservado e da transmissão de dados exigem a implementação de fortes medidas de segurança na aplicação e em toda a infra-estrutura que a apóia. No contexto de ambiente Web (sejam sites ou aplicações Web) a facilidade de como o usuário navega e interage com esses sistemas é possibilitada, entre outras atividades, pela adoção e atendimento das diretrizes e dos critérios de usabilidade, que atualmente, tornaram-se uma preocupação evidente para as empresas, para os desenvolvedores e também para os usuários, que passaram a ser mais exigentes e a não tolerar sistemas difíceis de usar. A identificação das características dos processos de desenvolvimento de software e da abordagem das aplicações Web que diferem das aplicações convencionais (não Web), constituem-se na fundamentação necessária para o estudo de alguns métodos de desenvolvimento de aplicações Web existente tendo em vista o caráter exploratório da metodologia de pesquisa utilizada. O Método OOHDM O método de projeto de hipermídia orientado a objetos (Object-Oriented Hypermedia Design Method - OOHDM) foi proposto por Schwabe e Rossi [22], e é composto de quatro diferentes etapas, por meio das quais o modelo é construído ou enriquecido: o projeto conceitual, o projeto navegacional, o projeto de interfaces abstratas e a implementação. O projeto conceitual do OOHDM gera uma representação a partir das classes, relacionamentos e subsistemas que definem o domínio da aplicação, utilizando-se dos princípios de modelos da orientação a objetos. Nesse processo, são utilizados mecanismos de agregação, generalização e especialização para aumentar o poder de abstração. Durante este passo, o principal objetivo é capturar a semântica do domínio sem se preocupar com os usuários e as tarefas envolvidas. O projeto de navegação do OOHDM é concebido a partir dos objetos e relacionamentos abstraídos no modelo
104
conceitual (passo anterior). Neste momento são definidos quais objetos serão navegados, quais os relacionamentos e quais as estruturas de elo existentes. O projeto de interfaces abstratas tem como objetivo definir os objetos da interface do usuário. Para representação das características comportamentais da interface e do relacionamento entre os objetos de interface e os objetos de navegação, utiliza-se um modelo formal chamado de visão abstrata de dados (Abstract Data View - ADV). Um modelo ADV representa uma metáfora de interface, inclui representação de objetos de navegação da interface (por exemplo: botões, menus e ícones) e a definição do leiaute estático da interface. A implementação, que é a quarta fase do OOHDM, contempla a elaboração das interfaces, que pode ser feita com base na especificação fornecida pelos ADV, desenvolvida na fase anterior. A estrutura dos ADVs oferece uma indicação sobre quais os objetos de interface precisam ser definidos.
que importa o nome dos cantores, dos estilos das músicas e da produtora. O Modelo de Apresentação descreve o leiaute e a aparência gráfica das páginas, independentemente da linguagem final que representará as páginas. Processo de Desenvolvimento Simultâneo O processo de desenvolvimento proposto Gonçalves et al. [20] foi elaborado com base em um estudo de caso, pelo qual os autores tinham como objetivo entender como era feito o desenvolvimento multidisciplinar de aplicações Web, com a participação do usuário e funcionalidade complexa. O processo de desenvolvimento simultâneo (Figura 3) é composto de quatro fases: levantamento de requisitos preliminar, protótipo não-funcional, implementação e refinamento.
O método WebML A Linguagem de Modelagem Web (Web Modeling Language - WebML) é um processo de modelagem para aplicações Web proposto por Ceri [23], que permite que os desenvolvedores modelem as funcionalidades de um site em um alto nível de abstração, sem se comprometerem com detalhes de alguma arquitetura específica. A WebML é atualmente suportada por uma ferramenta de software denominada WebRatio, disponível na Internet (http://www.webratio.com), com licença livre para uso não comercial. Segundo as especificações do próprio fabricante, a ferramenta gera aplicações completas a partir dos diagramas especificados na WebML. A especificação de um site em WebML consiste de quatro perspectivas: O Modelo Estrutural (Structural Model) expressa a organização conceitual dos dados do site, ou seja, suas entidades e relacionamentos, compatível com notações clássicas como diagramas de Entidades e Relacionamentos ou diagrama de classes da UML (Unified Modeling Language). O Modelo de Hipertexto descreve os documentos hipertexto que podem ser publicados no site. Cada hipertexto define uma visão do site, que é dividida em dois submodelos: o de composição (que define as páginas e sua organização interna em termos de elementos) e de navegação (que especifica os links entre as páginas). O Modelo de Derivação é um processo de adição de informações à estrutura do esquema, visando aumentar o detalhamento da informação, oferecendo diferentes formas de visualização dos mesmos dados. Como exemplo de derivação, pode-se citar a importação de atributos de uma entidade para outra, como no caso de um álbum de músicas
Figura 3 - Processo de Desenvolvimento Simultâneo Fonte: Adaptado de Gonçalves et al. [20]
Na proposta é adotado um processo que separa as atividades relacionadas com aspectos de autoria (processo responsável pelo trabalho criativo de produção e organização do conteúdo estético e informativo) dos aspectos de infra-estrutura (processo responsável pelas atividades tipicamente encontradas nos processos de desenvolvimento de software). O estudo de caso foi elaborado a partir de cinco aplicações Web, desenvolvidas em uma instituição de pesquisa em tecnologia de grande porte, onde foram adotados os seguintes papéis e qualificações: o projetista Web, o Web designer e o analista de banco de dados. O Projetista Web é responsável pelo planejamento da aplicação como um todo e gerenciamento do trabalho da equipe, e faz ainda, a ponte entre os aspectos funcionais e os estéticos da aplicação. O projetista também é
105
responsável pela programação das páginas dinâmicas bem como a integração com o banco de dados.
atividades, divididas em três fases globais: estudos preliminares, análise e implantação.
O Web designer é responsável pela concepção visual da aplicação, planejamento e criação das mídias, definição de cores, tipografia e aplicação de logomarcas.
Pressman [17] menciona a necessidade de cinco atividades genéricas para o processo de desenvolvimento de software:
O analista de banco de dados é responsável pela criação lógica e física da estrutura de dados do sistema, implementação do banco de dados, definição e implementação dos procedimentos armazenados em banco de dados. A fase 1 compreende o levantamento de requisitos com o usuário e com a participação ativa dos interessados e usuários-chave, documentação das entrevistas e montagem por etapas de storyboards e protótipos em papel do protótipo não-funcional, contendo as interfaces e a estrutura inicial de navegação. Nessa fase também é elaborada uma visão inicial do modelo de dados da aplicação. A fase 2 compreende as iterações/interações da equipe de desenvolvimento com os usuários e interessados, para refinamento do protótipo não-funcional desenvolvido na fase anterior. A adequação da estrutura visual com a estrutura funcional é feita pelo Web designer em conjunto com o projetista Web, que se baseiam no protótipo de interface pretendida, para guiar o trabalho de interação com os participantes das sessões. Ao final desta fase, o Web designer terá criado as páginas HTML, sem códigos de programação, mas validadas pela equipe de desenvolvimento e pelos usuários, usuários-chave e interessados pelo sistema. A fase 3 compreende a geração dos procedimentos de armazenamento pelo analista de banco de dados. O projetista Web gera o protótipo funcional a partir das páginas HTML elaboradas pelo Web designer e da integração com a base de dados elaborada pelo analista de banco de dados.
• •
•
• •
A comunicação, que envolve a colaboração com o cliente e o levantamento de requisitos; O planejamento, que estabelece o plano de trabalho de engenharia, as tarefas técnicas, os riscos, os recursos, os produtos de trabalho a ser produzidos e o cronograma; A modelagem, que inclui a criação de modelos que permitam ao desenvolvedor e cliente o melhor entendimento dos requisitos, bem como o projeto que satisfará esses requisitos; A construção, que compreende a geração de código e os testes necessários para revelar erros nestes; e, A implantação, que compreende a entrega do software completo ao cliente, que avalia e fornece feedbacks com base na avaliação.
Ao se fazer uma analogia entre as fases globais definidas pelo PDS e o modelo proposto por Pressman, verifica-se que a fase de estudos preliminares do PDS engloba as atividades de comunicação e planejamento; a fase de análise engloba as atividades de modelagem e construção; e por fim, a fase de implantação é tal como apresentada no modelo de Pressman. Apesar de não citar claramente qual o modelo prescritivo adotado, a abordagem do PDS é sistemática e seqüencial, sugerindo que o modelo utilizado é o “em cascata”, pois as atividades de engenharia de software descritas estão englobadas nas três fases globais estudadas. ESCOLHA DO MÉTODO BASE Após análise dos processos para aplicações Web e do PDS da organização estuda, concluiu-se que:
Na fase 4 realiza-se o refinamento final do protótipo funcional, que é feito com a participação ativa de todos os usuários e da equipe de desenvolvimento, com a operação efetiva do sistema no ambiente de trabalho. A fase é considerada como um ajuste fino da aplicação, pois, considera-se que as principais funcionalidades já foram implementadas nas fases anteriores.
O método de projeto de hipermídia orientado a objetos (OOHDM) proposto por Schwabe e Rossi (1998) é composto de etapas pelas quais os modelos são construídos ou enriquecidos. Os modelos são concebidos a partir de classes e objetos, fazendo uma alusão à orientação a objetos, apesar de não exigir que a implementação seja orientada a objetos.
Após a identificação das características das aplicações Web e dos métodos OOHDM, WebML e do Processo de Desenvolvimento Simulntâneo, analisou-se o PDS da organização pública estudada a fim de propor um método que fosse aderente ao seu processo.
Nesse sentido, o método difere parcialmente da organização estudada, que em sua construção permite que o desenvolvimento tenha dois caminhos de codificação, a modelagem orientada a objetos e a modelagem estruturada.
PROCESSO DE SOFTWARE (PDS)
DESENVOLVIMENTO
DE
O Processo de Desenvolvimento de Software da organização estudada apresenta-se como um roteiro de
Na Linguagem de Modelagem Web (WebML), proposta por Ceri et al. [23] a modelagem de aplicações é realizada em alto nível de abstração, porém, como ocorre também como o método OOHDM, ela não trata de protótipos, sejam funcionais ou não, nem dos papéis dos envolvidos no desenvolvimento.
106
O Processo de Desenvolvimento Simultâneo proposto por Gonçalves et al. [20], sugere que o desenvolvimento das aplicações Web possa ser realizado, em processos de autoria e de infra-estrutura.
O grau de participação do usuário varia de acordo com a fase do projeto e é representada pela coluna “Participação dos usuários”, onde as cores mais escuras representam um grau maior de participação.
Observam-se algumas similaridades do processo proposto com por Gonçalves et al. (2005) em relação ao PDS do 3º CTA:
As atividades das fases do projeto geram os artefatos (documentos, arquivos, scripts, códigos ou páginas) que são apresentados na sua respectiva coluna “Artefatos”. Os artefatos representados por linhas tracejadas representam itens cuja construção é opcional, pois vai depender do sistema a ser desenvolvido.
• •
As atividades de infra-estrutura coincidem com as atividades de infra-estrutura já previstas no PDS (Figura 27). Apesar da definição explícita dos papéis dos desenvolvedores, o Processo de Desenvolvimento Simultâneo permite que estes variem, havendo espaço para inclusão e exclusão de funções. O PDS, por sua vez, prevê a seguinte equipe: Coordenador-geral, o Gerente de projeto, o Administrador de dados e banco de dados, o Programador visual e o Analista programador. Analisando-se as funções previstas entre os dois processos, tem-se o Administrador de banco de dados nos dois processos, o Analista programador e o Programador visual previstos no PDS têm função semelhante ao do projetista Web e o Web designer, respectivamente, no Processo de Desenvolvimento Simultâneo. O coordenador geral constitui-se em uma função mais administrativa, não técnica e o Gerente de Projeto tem conhecimento técnico e pode exercer o papel de projetista Web.
Em relação aos métodos OOHDM e WebML estudados anteriormente, verifica-se que a estrutura de atividades são bem específicas e exigiriam mudanças significativas no PDS da organização e nos processos de trabalho do desenvolvedores. O Processo de Desenvolvimento Simultâneo, por sua vez, encontra maior aderência por apresentar similaridades com as atividades do PDS, sendo por esta razão, escolhido como base para o método de desenvolvimento de aplicações Web a ser construído por este estudo. MÉTODO PARA APLICAÇÕES WEB PROPOSTO O Método para Aplicações Web (Fig. 2) proposto por este trabalho consiste de três fases: os Estudos Preliminares, cuja atividade principal é a coleta de requisitos para elaboração dos primeiros protótipos, do mapa de navegação e do modelo de análise inicial (Orientado a Objetos ou Estruturado); a Análise e Implementação, que compreende atividades baseadas nos requisitos e artefatos produzidos na fase anterior, deve possibilitar ciclos de refinamento dos protótipos, elaboração da codificação lógica do sistema, integração com as páginas em HTML e, finalmente, a concepção da versão final do sistema; e, a Implantação, que compreende as atividades de homologação da versão final, aceite formal do sistema pelo cliente, preparação do material de treinamento e treinamento dos usuários.
Fig. 4. Método de Desenvolvimento de Aplicações Web Fonte: o autor.
As atividades de desenvolvimento são divididas em duas linhas de produção: a Autoria, que é o processo responsável pelo trabalho criativo de produção das interfaces e pela organização do seu conteúdo estético e informativo; e, a Infra-estrutura, que é o processo responsável pela de criação do modelo lógico e do banco de dados da aplicação, atividades tipicamente encontradas nos processos da engenharia de software. O método prevê que os integrantes da equipe de desenvolvimento possam desempenhar três papéis distintos dentro das linhas de produção (Autoria e Infra-estrutura): o Programador Visual, que atua especificamente na linha de Autoria; o Analista Programador, que atua e deve ter conhecimento técnico nas duas linhas de produção; e, o Analista de Banco de Dados, que atua somente na linha de Infra-estrutura. As atividades são distribuídas ao longo das colunas dos papéis dos desenvolvedores, a sobreposição das atividades sobre as colunas indica quem é ou, quem são os responsáveis pela execução. As atividades também sobrepõem as linhas de produção, indicando se a atividade é de Autoria, Infra-estrutura ou de ambas.
107
Algumas atividades são dinâmicas, envolvem ciclos sucessivos de análise, concepção e teste, por essa razão são representadas no método com a adição de um ícone ( ). A coluna “Técnicas e Orientações” relaciona o conteúdo técnico e informacional necessário à execução das atividades durante as fases de desenvolvimento. As setas indicam especificamente a atividade relacionada. As avaliações são recomendadas (itens com linha contínua) ou sugeridas (itens com linha pontilhada) dependendo da fase e constam da última coluna do método. As avaliações não se constituem em atividade única em cada fase e podem ser realizadas quantas vezes forem necessárias. 1.
Estudos Preliminares
A primeira fase do Método compreende as atividades de levantamento de requisitos com o objetivo de entender ao máximo possível os usuários, suas tarefas, o contexto do trabalho e iniciar as primeiras diagramações e modelagens de telas, para possibilitar que o sistema a ser construído ofereça o suporte necessário para atingir seus objetivos. Com a intensa participação dos usuários e de toda equipe de desenvolvimento,a fase prevê a geração de seis artefatos: o Estudo de Viabilidade de Aplicativo, as Fichas de Requisitos, os Storyboards, os Protótipos de Papel, o Mapa de Navegação e os Diagramas (os diagramas dependem da modelagem escolhida: orientado a objetos ou estruturado). a.
O Estudo de Viabilidade de Aplicativo (EVA)
O EVA é o primeiro artefato elaborado pela equipe de desenvolvimento, com os requisitos coletados a partir dos primeiros contatos com os usuários. O EVA constitui-se em um anteprojeto e também um acordo de serviço com o cliente e deve descrever sobre a situação atual e a proposta de solução. b.
Fichas de Registro de Requisitos
As fichas de registro devem relacionar todos os requisitos coletados. Para organização e controle, as fichas podem ser agrupadas por tipo de requisitos funcionais e não funcionais: Os requisitos relacionados com a lógica de operação são em geral direcionados para a linha Autoria e os requisitos relacionados com a lógica de funcionamento, são por sua vez, direcionados para linha de Infra-estrutura. O direcionamento sugerido tem por objetivo a organização dos requisitos, porém, deve-se atentar que os requisitos direcionados para a linha de Autoria, por exemplo, certamente refletirão na lógica da linha de Infra-estrutura e vice-versa. c.
Storyboards (artefato opcional)
Os storyboards compreendem uma seqüência de desenhos que devem representar as interações entre os usuários e o sistema. Os storyboards devem ser feitos em folhas grandes e coladas em uma parede ou um quadro, para que sejam
validados pelos usuários e pela equipe de desenvolvimento com base nos requisitos de usabilidade. O recurso de construção de storyboards pode ser utilizado quando for necessária a elucidação de requisitos relacionados com as interações entre o usuário e o sistema. d.
Protótipos de Papel
Os protótipos são esboços de telas, desenhados em folhas de papel, que possibilitem aos usuários, desenvolvedores e interessados interagirem com o produto desejado. Elaborados a partir da coleta dos requisitos funcionais e referentes à lógica de operação do sistema, os protótipos de papel são as primeiras versões interativas do sistema. Para a atividade de modelagem de protótipos, o Programador Visual e o Analista Programador devem: verificar a existência de designs semelhantes (Designs Alternativos) de forma concorrente ou de versões anteriores, para facilitar a escolha entre as diversas formas de interação e atentar para os princípios e recomendações de usabilidade. e.
Mapa de Navegação
O Mapa de Navegação deve mostrar como os usuários navegarão pelas páginas da aplicação Web por meio de uma representação em árvore das páginas e dos links entre elas. Para a atividade de definição do Mapa de Navegação, o Programador Visual deve: atentar para os princípios e recomendações de usabilidade e atentar para o fato de que os Mapas de Navegação são passíveis de avaliações “Rápidas”. f.
Diagramas
Os Diagramas dependem do padrão de análise desenvolvimento escolhido pelo time de desenvolvimento. O PDS permite duas linhas possíveis para a modelagem e codificação lógica do sistema: a orientada a objetos ou a estruturada. Nos dois casos, os diagramas nesta fase, por serem iniciais, provavelmente não contemplam todas as necessidades do sistema, mas procuram atender os requisitos funcionais voltados para a lógica de funcionamento do sistema. 2.
Análise e Implementação
O objetivo da fase de Análise e Implementação é a construção da versão final do sistema. Para este objetivo, as atividades da linha de Autoria refinam os protótipos até a versão final do sistema, e paralelamente, as atividades da linha de Infra-estrutura geram os artefatos necessários para darem suporte para as funcionalidades necessárias. A fase de análise pressupõe um grau menor de participação dos usuários, principalmente pelo volume de trabalho exigido pelas atividades de Infra-estrutura (criação do banco de dados, refinamento do modelo lógico, codificação do modelo lógico e integração com as páginas), onde não
108
há a necessidade de participação direta do usuário, porém, o contato com os usuários sempre deverá ser feito, a fim de elucidação de lacunas ou de requisitos não claros. A execução desta fase produz seis artefatos: os Protótipos de baixa fidelidade, o Banco de Dados, os Diagramas, as Páginas com elementos de HTML, a Versão Evolutiva do Sistema, a Documentação do Sistema para ao usuário e a Versão Final do Sistema. a.
Protótipos de Baixa Fidelidade
Os protótipos de baixa fidelidade desta fase devem ser construídos em HTML, com base nos protótipos de papel e na consulta dos designs alternativos, elaborados na fase de Estudos Preliminares. Normalmente, os protótipos de baixa fidelidade não se assemelham muito ao produto final, pois devem ser simples e de rápida produção. Para execução da atividade o Programador Visual deve atentar para os princípios e recomendações de usabilidade e, também, para o fato de que os protótipos de baixa fidelidade são passíveis de avaliações “Rápidas”. b.
Banco de Dados
O artefato de Banco de Dados compreende: o Diagrama de Entidade Relacionamento (DER), os scripts com a estruturação do banco e o banco de dados propriamente dito (arquivo do banco instalado em computador e em condições de ser utilizado). O DER é composto por um conjunto de itens gráficos que visa representar todos os objetos (entidades, atributos, relacionamentos, domínios, visualizações e procedimentos) de um modelo de entidade relacionamento. c.
Diagramas
Nesta fase, os Diagramas são um refinamento da atividade de modelagem (estruturada ou OO) que foi iniciada na fase de Estudos Preliminares e vão depender do padrão de análise escolhido pelo time de desenvolvimento. Para a análise estruturada devem ser aprimorados os diagramas hierárquicos de funções, o de Fluxo de Dados (DFD) e os diagramas de Contexto. Para a análise orientada a objetos devem ser aprimorados os diagramas de casos de uso, os de classe e os de seqüência. d.
Páginas com elementos de HTML
As páginas com elementos de HTML constituem-se em refinamentos dos protótipos de baixa fidelidade, formatadas com os componentes de página já construídos. Além da definição dos elementos das páginas, a estrutura definida pelo Mapa de Navegação também deverá ser contemplada. e.
Versão Evolutiva do Sistema
A Versão Evolutiva do Sistema é totalmente interativa, define claramente o esquema de navegação e tem a mesma
aparência do sistema final. A construção da Versão Evolutiva compreende as seguintes atividades as atividades de codificação do modelo lógico com base nos diagramas oferecidos pelo padrão de análise (estruturado ou orientado a objetos) e nas integração das páginas com elementos de HTML, produzidas pela linha de Autoria com os códigos do modelo lógico produzido pela linha de Infra-estrutura. A concepção da primeira Versão Evolutiva pode ser feita por módulos (por exemplo: módulo de cadastro, módulo de consulta etc.), deve ser refinada por atividades de testes de funcionalidade, avaliações (“rápidas”, heurísticas e também com usuários) e verificada quanto aos princípios e recomendações de usabilidade. f.
Documentação do Sistema (para o usuário)
A documentação do sistema orienta o usuário quanto à operação do sistema e deve contemplar os seguintes itens como: título e versão; índice; objetivo do sistema; histórico; características técnicas (necessidades em software e hardware); características operacionais; funcionamento do sistema; instruções de instalação; detalhamento dos módulos do sistema; segurança (senhas e níveis de acesso) e anexos. g.
Versão Final
Na Versão Final tem-se o sistema pronto com todas as funcionalidades implementadas conforme os requisitos coletados na fase de Estudos Preliminares, testado e pronto para ser entregue para o cliente. As atividades para a concepção da Versão Final são executadas por todo o time de desenvolvimento: •
•
3.
O Programador Visual e o Analista Programador devem atentar para os princípios e recomendações de usabilidade, realizar avaliações das interfaces do sistema (Rápidas, Heurística e se possível Testes com Usuários) e testes de funcionalidade; O Analista de Banco de dados deve executar testes de funcionalidade, atentar principalmente quanto ao registro, alteração, recuperação e seleção dos dados. Implantação
A fase de Implantação compreende a homologação da Versão Final do Sistema pelo cliente e a confecção do material de treinamento. A participação do usuário nesta fase está voltada às atividades de homologação, onde será verificado se o sistema contempla todos os requisitos coletados durante a fase de Estudos Preliminares e os treinamentos. Nesta fase são construídos dois artefatos: o Documento de Aceite do sistema pelo cliente (pode ser a Ata de Reunião de homologação) e o Material de Treinamento
109
(documentação do sistema, apresentações de slides e atividades de exercício). a.
Documento de Aceite
O Documento de Aceite do Sistema constitui-se na formalização do recebimento do sistema pelo solicitante do sistema (cliente). O aceite do sistema pelo cliente é realizado com base na homologação que é realizada pelo cliente ou quem este designar, com a assistência dos desenvolvedores. O aceite também pode ser formalizado por uma Ata de Reunião de Homologação, onde se discriminará o atendimento dos requisitos pelo sistema. b.
Material de Treinamento dos Usuários
O material de treinamento constitui-se em apresentações e documentações do sistema. O material pode ser elaborado pela equipe de desenvolvimento ou por outros integrantes da Seção de Sistema, assessorados pelos desenvolvedores. CONSIDERAÇÕES DO MÉTODO PROPOSTO O Método proposto para aplicações Web define o fluxo de trabalho, as atividades, os artefatos, as funções dos envolvidos no processo e procura atender aos requisitos necessários de um processo de desenvolvimento de sistemas para uso em ambiente Web. Oferece mecanismos para guiar o time de desenvolvimento quanto à ordem das atividades, especifica quais os artefatos devem ser desenvolvidos, dirige as tarefas dos desenvolvedores de forma individual e o time de desenvolvimento como um todo. O foco nos usuários durante o desenvolvimento de aplicações Web é uma característica básica da engenharia de usabilidade e é indicada no Método por um ícone ( ) em atividades que podem ser consideradas cíclicas. Ao contemplar a participação dos usuários no processo, o Método possibilita que os desenvolvedores tenham um melhor entendimento das atividades, das necessidades e dos objetivos desses usuários; permite que as expectativas dos usuários quanto ao sistema sejam realistas, evitando surpresas quando da entrega; e, favorece o sentimento de apropriação do sistema pelos usuários, o que é desejável, pois estes ficam mais receptivos para a aceitação do sistema. A participação do usuário contemplada pelo Método pressupõe a existência de proximidade com o usuário, porém, sabe-se que em alguns projetos o universo de usuários pode ser amplo e de difícil determinação. A divisão da equipe de desenvolvimento em linhas de produção (autoria e infra-estrutura) impõe algumas condições que devem ser observadas quando do uso do Método. Conforme a estrutura e seqüenciamento das atividades, os artefatos produzidos pela linha de autoria e de infra-estrutura devem ser integrados para formarem uma
versão evolutiva do sistema. Cabe observar que as atividades e os artefatos podem ser realizados por módulos ou partes do sistema, que vão sendo parcialmente integrados para formarem a versão evolutiva do sistema. Desta forma, e também dependendo do sistema e usuários, podem ser distribuídos módulos do sistema aos usuários. O sucesso da integração desses artefatos, proposta pelo Método, está principalmente relacionado com a capacidade e o conhecimento técnico do Analista Programador, que por atuar nas duas linhas de produção, deve coordenar os desenvolvedores das outras linhas, de forma a evitar o desenvolvimento conflitante que pode dificultar a integração. Outro fator necessário é a existência de uma estreita comunicação entre os desenvolvedores, pois a falta ou a deficiência deste requisito pode restringir ou mesmo inviabilizar a utilização do Método, principalmente por grandes equipes de desenvolvimento que estejam distribuídas por localidades diferentes. A aderência do Método ao PDS destaca-se pela sua subdivisão em três fases, que são semelhantes ao PDS: os Estudos Preliminares, a Análise e Implementação e a Implantação. As fases, além de compreenderem as atividades de engenharia de software convencional previstas no PDS, contemplam também as atividades, os artefatos e as técnicas e orientações voltadas para aplicações Web, com foco no usuário e em usabilidade. CONCLUSÃO O Processo de Desenvolvimento de Software organização pública estudada, apesar de disciplinar o desenvolvimento de sistemas, não trata das questões usabilidade e não contempla as particularidades desenvolvimento de aplicações Web.
da de de do
A presente pesquisa, baseada nas lacunas mencionadas, apresentou a proposta de um Método de desenvolvimento de aplicações Web focado em usabilidade e suplementar ao PDS. Para isto, foram analisados os princípios e as diretrizes de usabilidade que influenciam na concepção de interfaces, as atividades do processo da engenharia de usabilidade, alguns processos de desenvolvimento de sistemas e o próprio PDS. Os elementos que buscam levar o Método proposto a reduzir os problemas das interfaces das aplicações Web durante o desenvolvimento e o tornam aderente ao PDS são: • • •
Desenvolvimento com foco no usuário; Atividades que considerem os princípios, as diretrizes de usabilidade e as avaliações de interfaces Web; Previsão de atividades cíclicas de análise, concepção e avaliações a fim de identificar e
110
•
refinar continuamente as interfaces das aplicações Web e atender as exigências de usabilidade; Similaridade das atividades, dos artefatos e das fases do Método com as existentes no PDS.
REFERÊNCIAS
1. Brasil. Software Livre no Governo Federal, http://www.softwarelivre.gov.br/planejamento-cisl-2009 2. Winckler, M., Pimenta, M. S. Avaliação de Usabilidade de Sites Web. In: IHC2001 - IV Workshop de Fatores Humanos em Sistemas Computacionais, Florianópolis. Porto Alegre: Sociedade Brasileira de Computação (2001). 3. Conallen, J.: Building Web Applications With UML. Addison-Wesley Professional, Massachusetts (2000) 4. Mendes, E., Mosley, N., Counsell. S. The Need for Web Engineering: an Introduction. Web Engineering. Berlin, Germany: Springer-Verlag, pp. 1-27 (2006) 5. Associação Brasileira de Normas Técnicas. NBR 924111: Requisitos Ergonômicos para Trabalho de Escritórios com Computadores: Orientações sobre Usabilidade. Rio de Janeiro, 2002. 21 p. 6. Nielsen, J. Usability Engineering. 13. ed. San Francisco: Morgan Kaufmann,1994. 376 p. 7. Oliveira Netto, A. A. IHC Interação Humano Computador - Modelagem e Gerência de Interfaces com o Usuário. 2. ed. Florianópolis: Editora Visual Alta Books, 2006. 120 p. 8. Moran, T. The Command Language Grammars: a representation for the user interface of interactive computer systems. In International Journal of ManMachine Studies 15:3-50, Academic Press, 1981. 9. Prates, R. O., Barbosa, S. D. J. Avaliação de Interfaces de Usuário – Conceitos e Métodos. In: IHC2003, 2003, Rio de Janeiro. Anais da Jornada de Atualização em Informática, Rio de Janeiro, 2003. 10.De Souza, C. S., et al. Projeto de Interfaces de Usuário: perspectivas cognitivas e semióticas. In: Jornadas de Atualização em Informática, 1999, Rio de Janeiro. Anais... Rio de Janeiro: Edições EntreLugar, 1999, v. 2, 425-476 p. 11.Nielsen, J., Loranger, H. Usabilidade na Web Projetando Websites com Qualidade. Rio de Janeiro: Elsevier - Editora Campus, 2007. 430 p. 12.Preece, J.; Rogers, Y.; Sharp, H.: Design de Interação Além da interação homem-computador. 1. Ed. Tradução de Viviane Possamai. Bookman, Porto Alegre, RS, 2005.
13. Bastien, J. M. C.; Scapin, D. L. Ergonomic Criteria for the Evaluation of Human-Computer Interfaces, RT nº 156. INRIA, junho de 1993. Disponível em: <http://www.inria.fr/rrrt/rt-0156.html>. Acesso em 16 de maio de 2009. 14. Nielsen, J., Loranger, H. Usabilidade na Web Projetando Websites com Qualidade. Rio de Janeiro: Elsevier - Editora Campus, 2007. 430 p. 15. Mayhew, D. J. The Usability Engineering Lifecycle. A practitioners’s handbook for user interface design. San Francisco: Morgan Kaufman, 1999. 560p. 16. Cybis, W., Betiol, A. H., Faust, R. Ergonomia e Usabilidade - Conhecimentos, Métodos e Aplicações. São Paulo: Novatec Editora, 2007. 344p. 17. Pressman, R. S. Engenharia de Software. 6. ed. Trad. PENTEADO, Rosângela Delloso. São Paulo: McGrawHill, 2006. 751 p. 18. Taylor, A. (Janeiro de 2000). IT projects: sink or swin?, The British Computer Society Bulletin, janeiro de 2000. 24-26p. Disponível em: <http://archive.bcs.org/bulletin/jan00/article1.htm> Acessado em: 16 de maio de 2008. 19. Rocha, H. V., Baranauskas, M. C. C. Design e Avaliação de Interfaces Humano-Computador. Campinas: NIED/UNICAMP, 2003. 244 p. 20. Gonçalvez, R. F., et al: Fundamentos de Engenharia Simultânea na Produção de Aplicações Web. In: XXVII Encontro Nacional de Engenharia de Produção, 2007. Foz do Iguaçu, PR. A energia que move a produção: um diálogo sobre integração, projeto e sustentabilidade. 21. Martins, C. R. L. Estratégia de Migração de Aplicações Legadas Visuais (tipo WIMP) para o Ambiente Web. 2003. 104 f. Dissertação (Mestrado em Ciência da Computação) - UFRS, Porto Alegre, 2003. 22. SCHWABE, Daniel; ROSSI, Gustavo. Developing Hypermedia Applications using OOHDM. In: HYPERTEXT 98, Pittsburgh, 1998, Proceedings of the Ninth ACM Conference on Hypertext and Hypermedia, Pittsburgh, PA, USA, June 20-24, 1998. 307 p. 23. Ceri, S., Fraternali, P., Bongio, A. Web Modeling Language (WebML): a Modeling Language for Designing Web Sites. In: 9th INTERNATIONAL WWW CONFERENCE, Amsterdam, 15-19 de maio de 2000, The Web: The Next Generation. Disponível em: <http://www9.org/w9cdrom/177/177.html>. Acesso em 16 de maio de 2009.
111
games interaçþes em jogo
112
Web Browser Game para Meninas Bibiana De Carli UNOESC Videira/SC bibiana.decarli@gmail.com RESUMO
Este projeto apresenta uma solução para a criação de web browser game para meninas entre 8 e 12 anos. Através de diversas pesquisas foram aplicadas soluções atuais de tecnologia web como AJAX e CSS e usabilidade direcionada ao público de interesse. A metodologia usada para desenvolvimento do web site foi User-Centered Design de Jesse James Garret. Foram desenvolvidos diversos elementos gráficos, como personagens, ícones e marca bem como estruturada a usabilidade de diversos sistemas internos do jogo. O game design, que apresenta temáticas confirmadas de apreciação e interesse do público feminino como cooperação, individualização, gerenciamento e responsabilidade, foi desenvolvido utilizando diretrizes de autores especializados e análise de similares. O game busca atrair meninas para o meio online, habituar sua experiência com internet e jogos, criar um ambiente seguro para as jogadoras se socializarem e trocarem experiências e apresenta atividades divertidas que podem ser aplicadas pelas jogadoras no mundo real. Author Keywords
User experience, games for girls, flow. ACM Classification Keywords
H5.2. User interfaces: User-centered design INTRODUÇÃO
Este trabalho apresenta o desenvolvimento de um web browser game, designado para meninas entre 8 a 12 anos, com a temática de uma sociedade moderna e divertida, com personagens femininos e joviais. O interesse em criar um jogo que pudesse divertir e indiretamente ensinar, sem torná-lo entediante, levou a uma temática intimamente feminina com cooperação, comunicação e respeito. O projeto do game foi desenvolvido utilizando tecnologias leves e acessíveis de navegadores atuais. Essas tecnologias permitem um bom desenvolvimento de usabilidade e Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA. Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Luciane Maria Fadel UFPR Curitiba/PR luciane_fadel@hotmail.com interação sem a necessidade de grandes animações para download. Dado a importância de trabalhar em conjunto com outras jogadoras, este trabalho mostra às meninas através do jogo que, a diversidade e a responsabilidade são essenciais para o bom crescimento tanto da sociedade in-game como na própria vida. DESENVOLVIMENTO As Mulheres e os Games
Em 1998 foi publicado o livro From Barbie to Mortal Kombat de Justine Cassell e Henry Jenkis. O livro explicava e exemplificava os problemas que aconteciam na época com relação aos jogos direcionados a meninas. Por exemplo, como os jogos apresentavam estereótipos de atividades femininas, como poucos eram realmente de interesse feminino e como as meninas ansiavam por novas experiências em games. Acreditava-se então, que tecnologias não surgiam efeito ao mundo feminino e que era um mercado pouco lucrável, até Barbie Fashion Designer se tornar o game do ano em 1996 [9]. O movimento de games para meninas que começou na década de 90 alavancou a utilização de conceitos totalmente novos. Uma grande inovação ocorreu nos modelos de jogabilidade, interatividade, visual gráfico e trilha sonora. As metas eram criar jogos totalmente diferentes daqueles presentes no mercado para que pudessem atrair novos consumidores. A psicologia dos personagens, paletas de cores suaves, ricas trilhas sonoras e um novo design de interface que foram criados nessa época, fez com que os games se tornassem mais complexos e psicológicos [9]. Uma pesquisa realizada em 2006 pela Entertainment Software Association (ESA) mostrou que 38% dos jogadores de vídeo-games são mulheres (para jogos online o número sobe para 42%). Além disto, essas jogadoras gastariam em média 7,4 horas por semana com games. Dados de venda mostram que sua tendência é jogar jogos casuais e sociais em consoles portáteis, como Nintendo DS [4]. Apesar da presença cada vez maior do público feminino no mundo dos jogos, muitos destes jogos ainda continuam replicando e perpetuando os estereótipos dos jogos para mulheres [9]. Segundo Torrie Dorell e Courtney Simmons, ambos da Sony Online Entertainment, há uma falta de compreensão em relação a como as mulheres jogam [12].
113
Pink e Purple Games
Um empecilho encontrado no início da produção de jogos femininos nos anos 90, era a falta de direcionamento de mercado exclusivo para mulheres, fazendo com que elas não se sentissem encorajadas em tentar títulos diferentes. Os produtos desenvolvidos diretamente para mulheres eram aqueles que miravam a produtividade e organização, fazendo com que a imagem do computador se tornasse uma ferramenta de produção, e não de entretenimento [16]. Em reconhecimento á falta de atenção ao mercado feminino, foram desenvolvidos jogos específicos para meninas brancas Norte-Americanas. O sucesso dessa categoria mostrou que havia mercado disponível para este público [9]. Pink Games
Os Pink Games (Jogos Rosa) demonstram valores femininos tradicionais. Games desse gênero apresentam uma ênfase estereotipada na preferência de brinquedos, atividades e interesses. O título mais famoso da categoria dos anos 90, Barbie Fashion Designer, permitia as meninas criarem e imprimirem suas próprias roupas para suas bonecas Barbie. Ainda há um alto retorno com jogos desse gênero atualmente [16]. Purple Games
Em contrapartida aos Pink Games, desenvolveu-se jogos que apresentavam maior profundidade social e empresarial, sem sair da área de interesses femininos. Os Jogos Lilás receberam esse nome em tributo a empresa Purple Moon, de Brenda Laurel [16]. Purple Games dominam o mercado feminino nos dias atuais, expandindo sua audiência até mesmo para adultos. Esses jogos miram um público feminino, com menos ênfase em aspectos ultra-femininos que os Pink Games possuem, e apresentam um foco em problemas da vida-real de interesse de meninas [16]. A abordagem desses estilos de jogos se aplica a meninas, e não a mulheres adultas. Elas que, por sua variedade de interesses e por estarem expostas à diversos ambientes, possuem gostos mais abrangentes em jogos [17]. Imagem Feminina
Ao estudar a história dos games pode-se notar (com exceção dos Pink e Purple Games) duas formas com que os produtores lidaram com a representação feminina. A primeira mostrava a mulher como um objeto sexual com características sexuais exageradas e enfadonhas. Mesmo que a personagem demonstrasse habilidades de força ou coragem, ainda havia uma exageração desnecessária á suas características femininas. A segunda forma colocava a mulher como um prêmio a ser ganho. Esse papel de “donzela em apuros” não foi imposto apenas na indústria dos games, mas neste caso, essa temática afastava as mulheres dos jogos [16].
Diferente de 20 anos atrás, vemos diversas personagens femininas demonstrando força física. Essa nova forma de demonstrar o papel feminino, influencia nas brincadeiras das meninas, onde em suas histórias, suas bonecas podem ser tão fortes e interessantes quanto qualquer super-herói [8]. Nota-se também que as meninas se identificam com personagens femininos bem como com personagens masculinos que apresentem um alto nível de relacionamentos sociais. Além disto, elas demonstram em suas fantasias maior flexibilidade para se associar simultaneamente com vários personagens. Assim, o novo conceito que surgiu na década de 90, apresentando personagens leais que trabalhavam em conjunto, como os Power Rangers ou Pokémon; criou uma fantasia poderosa tanto para meninos quanto para meninas [8]. A Diferença entre Gêneros O Empecilho da Tecnologia
Muitos pesquisadores acreditam que o conceito de que computadores são um objeto masculino é percebido desde a infância, quando meninos comumente recebem brinquedos mais mecânicos. Eles são encorajados a utilizar essas máquinas e desenvolvem um pensamento mais lógico da utilização desses objetos. Enquanto as meninas por outro lado, raramente recebem incentivos para utilização desses mecanismos. Então, quando utilizam softwares normalmente é de forma passiva, sem direcionamento para desenvolvimento lógico do funcionamento. Esse tipo de desenvolvimento acaba tornando as mulheres desinteressadas por sistemas computacionais e games [16]. Em um estudo feito em 1987 por Huff e Cooper, vários designers foram instruídos a desenvolver softwares educativos para crianças da sétima série. Alguns deveriam direcionar para meninos, outros para meninas e outros para crianças em geral. Os softwares desenvolvidos para meninos e crianças possuíam um tema e jogabilidade similares: eram divertidos e requeriam coordenação motora, reflexos rápidos e atenção. Entretanto os softwares feitos para meninas apresentavam apenas fatores de aprendizado sem nenhum divertimento [16]. E, apesar de tanto meninos e meninas aprenderem mais facilmente de forma divertida, os jogos para meninas presumiam que elas não se interessariam por essa forma de aprendizado; e os jogos feitos para crianças em geral eram diretamente focados para meninos [16]. Um dos maiores problemas de contextualização dos jogos entre meninos e meninas, é que as produtoras assumem que meninas têm os mesmos gostos e desgostos [9]. Meninas possuem interesses muitos mais fragmentados do que os meninos, suas mudanças são mais rápidas e seu emocional e intelectual se desenvolvem de formas diferentes [17]. Identidades de Gêneros
Pesquisas recentes mostram os gêneros como uma identidade social e em como a sociedade imprime ações especificadas para cada gênero, causando impacto na
114
formação de identidade. Nos últimos anos vemos a possibilidade do jogador escolher o sexo do seu personagem, permitindo que ele experimente sua identidade. Estima-se que metade dos personagens femininos em World of Warcraft sejam jogados na verdade por homens [16]. Percebe-se que há aspectos nos jogos que parecem estar além do estereótipo sexual padrão. Nos vídeo-games, quase todos os jogos de esportes, RPGs e simulação, apresentam diversas opções da aparência do seu personagem. Essa interatividade nos jogos introduz uma flexibilidade nos papéis de cada sexo [2]. Foi quando a utilização de um personagem feminino no papel principal de um game, primeiramente com Lara Croft em Tomb Raider, em que mesmo lutando e matando inimigos, ela ainda possuía sua feminilidade, coloram-se de lado as limitações dos gêneros, sendo que ele se torna interessante tanto para homens com a jogabilidade, como para mulheres que se caracterizam com a personagem [16]. Design Baseado na Atividade
Uma das formas de expandir a audiência de um título é utilizar técnicas de design baseadas na atividade do jogador. O jogo apresenta uma história principal, mas dá a opção de praticar outras atividades que não estão necessariamente ligadas á salvação do mundo. Atividades que envolvem produção, como fazer pão do MMO-RPG Ultima Online é uma das atividades mais populares e se tornou uma das bases econômicas do mundo do jogo [16]. Padrões de Jogo
Um padrão de jogo é uma forma tradicional e quase instintiva que a criança irá interagir com uma atividade ou objeto. Meninas comumente possuem padrões que exercitam sua imaginação (moda, beleza, colecionáveis, aventura, sociais) e gostam de representar atividades cotidianas. Brincar de boneca é uma forma de representar atividades adultas brincando [17]. Personalização
O sucesso de jogos recentes como Second Life e The Sims, mostra que tanto homens como mulheres demonstram interesse em criar uma identidade única para seus personagens. Essa utilização de modificadores nos jogos, tanto para personagens como cenários e níveis, faz com que além da personalização, se crie um interesse em criação de jogos de ambas as partes [9]. Processo de Aprendizagem
A necessidade de desafio dos homens faz com que eles aprendam a utilização através da experimentação e sem medo de arriscar o erro. Já as mulheres preferem observar e saber como funciona antes de jogar. Para obter a motivação necessária em mulheres, a interface precisa ser intuitiva e confortável. Elas se sentem mais motivadas trabalhando junto com a máquina e não contra ela. Muitos jogos apresentam comandos escondidos que não podem ser
descobertos no gameplay, isso acaba gerando uma batalha contra o hardware (apertar vários botões) sem nenhum conteúdo lógico. A mecânica do game deve ser fácil de aprender, e conquistar novos movimentos deve ser uma recompensa aos esforços do jogador [16]. Estilos de Comunicação Eletrônica
A forma de comunicação usada por homens e mulheres pode ter um grande efeito no seu aprendizado. Segundo uma pesquisa desenvolvida pela divisão online da University of Phoenix nos Estados Unidos, as mulheres apresentam um grau de empatia muito maior que os homens quando se comunicam. Elas são também 87% mais inclinadas a usar emoticons para demonstrar tons nãoofensivos de fala. Para manter as mulheres interessadas no jogo, a comunicação deve ser diretamente direcionada a ela como pessoa e de forma empática, que pode ser feito através de tutoriais, diálogos ou até mesmo pelo manual [16]. Esforço e Recompensa
Para os meninos a melhor forma de recompensa aos seus esforços é o ganho de pontos. Eles são altamente motivados a alcançar a maior pontuação, mas isso não acontece diretamente com as meninas e vencer para elas não é a parte mais importante do jogo. As meninas gostam de planejar e trabalhar unidas, ouvindo as idéias das outras. Os meninos por outro lado possuem um líder que controla as atividades do grupo impondo sua própria estratégia [16]. Outras formas de recompensas devem ser pensadas para atingir esse público, em vez de uma lista de pontos ou ganhar e perder. Acrescentar atividades interessantes que podem ser divertidas por si só, como: explorar, colecionar, buscas, e, a possibilidade de escolha do jogador escolher sua meta final; aumentará enormemente a possibilidade de ganho diferenciado [16]. O interesse feminino em colecionar, exibir e obter coisas é um ponto importante que possui um sentimento de realização, substituindo o ganho abstrato de pontos normalmente preferido pelos garotos [17]. Respostas a Estímulos
O estimulo é uma forma de resposta á excitação por uma ação. Para os homens, estímulos visuais causam reações fisiológicas: há um aumento na pulsação, respiração e transpiração. Todas essas condições são biológicas e remetem aos tempos das cavernas. Por essa razão, estímulos visuais criam uma resposta automática de adrenalina no corpo dos homens [16]. O mercado de games está saturado com títulos que enfatizam esse estímulo visual. Isso levou a evolução da tecnologia gráfica, muitas vezes sendo responsável pela melhoria do realismo dos jogos (mais sangue jorrando e peças que se movem), mas não necessariamente da arte em si. Isso acontece, pois é dessa forma que a maioria dos jogadores (homens entre 13-25 anos) se estimulam [16].
115
Apesar das mulheres possuírem a mesma anatomia visual, seu papel nas sociedades antigas não necessitava que ela respondesse a estímulos com efeitos fisiológicos de adrenalina. Isso não quer dizer que elas não sejam aptas a aproveitar dessa mesma forma os games, mas que apenas não respondem fisiologicamente aos estímulos visuais. Assim, para conseguir esse mesmo efeito nas mulheres, deve-se trabalhar em estímulos emocionais e táteis. A forma tradicional de desenvolver estímulos emocionais é utilizando a história e personagens. Para criar um laço emocional com personagens não-jogadores (NPCs), devem haver benefícios mútuos de ambos os lados, que podem ser pequenos problemas significativos para os personagens [16]. Estímulos táteis estão em alta nos principais consoles atualmente. Seu início deu-se em máquinas de fliperama que começaram a adaptar seu controles dependendo do gênero do game: o jogador poderia montar realmente numa moto e dirigir, ou fazer os passos de uma dança. O crescimento desta área deu-se principalmente porque as mulheres que antes apenas acompanhavam os namorados ao vídeo-game começaram realmente a jogá-los. Estes estímulos emocionais e táteis resultam nas mulheres a mesma resposta fisiológica que ocorre nos homens com estímulos visuais. Criando estes estímulos em um gameplay será fácil atingir ambos os mercados [16]. Relação Espacial
Em seus estudos, Ray [16] verificou que enquanto os homens se sentem mais a vontade utilizando diretrizes matemáticas de localização, as mulheres utilizam melhor pontos visuais. Acrescentando detalhes ao design, as mulheres se sentirão mais confortáveis enquanto caminham e utilizam um cenário. A preferência de encontrar pontos específicos no cenário também é grande entre as mulheres, algo que pode impulsionar o mercado através dos jogos tradicionais. Além disso, esse recurso torna o jogo mais desafiador para os homens para completar desafios. Implementar outros tipos de atividades no gameplay não só facilita o aprendizado espacial das mulheres, como pode ser muito benéfico para a experiência do jogo. Punições e Perdão
Uma pesquisa feita em 1993 por Kafi mostra que os próprios meninos e meninas possuem formas diferentes de projetar soluções. Meninos criaram um jogo em que as metas eram explícitas e envolviam a perda ou ganho de itens, e quando havia a falha do jogador ele era “morto” e deveria começar de novo. Já as meninas focavam o divertimento em atividades sem perda ou ganho, mas em quão bem poderiam fazer essa atividade, e apresentavam uma punição mais leve quando o jogador falhava. Em vez de começar o jogo novamente, ele era punido com bloqueio de ações, dando a chance de uma nova tentativa. É importante considerar outras formas de punições, pois a utilização de um recomeço no jogo não é o mais confortável e aceito pelas mulheres. Deve haver conseqüências aos atos
errados do jogador, mas que não o faça perder todo seu progresso. O conceito de perdão ao jogador faz com que ele sofra as conseqüências pelos erros, mas estes irão apenas atrasar o progresso no jogo, e não fazê-lo perder tudo o que conquistou [16]. Resolução de Conflitos
Como um padrão social humano, homens tendem a preferir uma competição direta e simples. Já as mulheres quando apresentadas á algum conflito tendem a preferir a negociação, diplomacia e compromisso ao conflito direto. Observando sociedades antigas em que as mulheres estavam freqüentemente grávidas, conflitos físicos poderiam levar á sua morte e das crianças que lhe dependiam. Esse conceito é herdado nos dias de hoje, em que as mulheres ainda preferem evitar o conflito, dividir recursos e trabalhar em conjunto [16]. Atualmente, podemos notar algumas mudanças nesse padrão estrutural de comportamento. Certa proporção de meninas está usando violência de faz-de-conta para as mesmas finalidades de desenvolvimento que os meninos. Antes dos 6 anos, as crianças demonstram os mesmos tipos de brincadeiras, independe do sexo. Aos 6 anos, a cultura social é amplamente imposta ás crianças, tornando as brincadeiras próprias ou não para seu gênero [8]. Apesar deste afastamento das meninas de brincadeiras agressivas e uma tendência a criar fantasias com estruturas sociais e sentimentais; o desejo feminino de brincar com poder e conflito não desaparece, mas assume outras formas. Enquanto os meninos utilizam de brincadeiras físicas e agressivas, as meninas partem para jogos sociais de conspiração, manipulação e resistência emocional [8]. Competição
Evitar conflitos físicos não quer dizer que as mulheres não gostem de competir, mas a forma da competição se dá de forma diferente. O jogador não estaria agindo diretamente no jogo de seu oponente, mas melhorando o seu desempenho. Novas técnicas de design para competição indireta, solução de conflitos sem confrontos e nãoviolência gratuita, podem garantir que game se torne mais interessante para todos [16]. Qualidades de Games para Mulheres
Alguns traços desenvolvidos por Ray [16] e Kafai [9] mostram ótimos resultados e de grande interesse ao público feminino, como a seguir: •
A exploração de ambientes cria outro conceito de jogabilidade. Em vez de metas fixas e pré-definidas, o jogador tem livre arbítrio para decidir sua atividade.
•
A história e os personagens envolvem e emocionam o jogador, no lugar de tópicos de ação e sem profundidade.
•
Apresentar problemas simples que fazem diferença na vida do personagem-jogador e não apenas para
116
salvação do mundo ou problemas quase inalcançáveis. As narrativas femininas são pequenas mas profundas, envolvendo temas pessoais e intimidação. •
A vitória vem de interação social e diplomacia e vez de combates e competições. As meninas preferem resolver complexos problemas interpessoais em grupo do que acumular conquistas em batalhas.
•
Histórias femininas incluem personagens que trabalham em equipe; diferente das histórias dos meninos onde á um único herói ou líder.
•
Para as meninas, o desafio é descobrir como utilizar uma ferramenta para resolver os problemas. Enquanto para os meninos, as ferramentas devem ser poderosas para destruir o inimigo.
•
Sucesso num jogo feminino é restaurar a ordem e a justiça, e não a vitória ou conquistas. A recompensa deve ser prazerosa em melhorar a vida de alguém ou de alguma situação.
Online
Nos primórdios, games eram uma diversão individual. Com o desenvolvimento tecnológico foram gradualmente expandidos para utilização em duplas, quartetos e nos dias atuais com número ilimitado de jogadores através da internet. O gênero de MMO (Massive-Multiplayer Online) abriu novas experiências de participação e interação entre os jogadores. Essas comunidades online atraem inúmeros jogadores, especialmente adolescentes; e como apresentam alto grau de interação e socialização, além da personalização dos personagens, é um dos gêneros que mais atraem também as garotas [16]. Mulheres em Games Online
Apesar disso, muitas das pesquisas feitas até agora envolvem as adolescentes, e não mulheres (que apresentam interesse em outros gêneros). As mulheres são os maiores jogadores de Jogos Casuais que incluem puzzles (quebracabeças) e cartas. Distribuidores desse gênero afirmam que esse público chega em 70 a 80% do mercado, com a maior concentração em mulheres com mais de 30 anos. Provavelmente esta apelação se dá, pois os jogos destes gêneros podem ser completados em curtos períodos de tempo ou serem jogados por horas a fio, dependendo do gosto do jogador [16]. Meninas na Web
A geração atual está tão confortável com a utilização de novas mídias, como seus pais estavam com a televisão e o telefone. O Center of Media Education nos Estados Unidos, apresentou em sua pesquisa de 2001, que três quartos dos adolescentes entre 12 e 17 anos estão conectados a internet. Sendo a internet um dos maiores meios de comunicação atualmente, as adolescentes estão sempre buscando sua própria identidade e precisam de espaços adequados para essa comunicação, sem sentirem-se repelidas por adultos ou
até mesmo garotos. Mazzarela [MAZZARELA, p. 5] cita ainda que, “Meninas precisam de um espaço adequado para desenvolver sua identidade sem julgamentos. Sem espaços seguros, elas não terão a capacidade completa de descobrir quem são e quem gostariam de se tornar”. Algumas adolescentes utilizam seus conhecimentos para criar espaços seguros para elas e outras garotas, normalmente voltados á atividades culturais. A importância de se comunicar em sua própria linguagem, as ajuda a desenvolver não apenas seu senso próprio e identidade, mas a construir sua realidade social como membro de um grupo [12]. Preferências
Em pesquisas realizadas pelo Center of Children and Technology (CCT) na última década nos Estados Unidos, pode-se notar uma grande diferença entre gêneros na utilização da internet e de outras tecnologias. Enquanto os meninos buscam transcender os limites de tempo, espaço e corpo físico, as meninas desejam objetos multifuncionais e flexíveis, onde podem se comunicar e dividir experiências [9]. Na mesma pesquisa, um espaço online de desenvolvimento chamado KAHooTZ foi utilizado para observar o comportamento de criação e de atividades das meninas. Um dos problemas que puderam ser observados era que a ferramenta em questão não permitia a animação de um objeto por um caminho específico, apenas permitia que eles passassem pela tela de forma aleatória. Essa função parecia funcionar bem para os jogos criados pelos meninos que envolviam atirar em objetos; mas não era suficiente para o desenvolvimento das meninas, onde focavam em um processo de início, meio e fim [9]. Outro problema foi a falta de comunicação e conectividade entre os utilizadores do sistema. Notou-se que as meninas preferiam colher opiniões de pessoas específicas sobre suas invenções antes de lançá-las abertamente ao público. Assim, um sistema de chat era o mais adequado para a comunicação dentro do sistema [9]. Proteção
Um estudo feito em agosto de 2000, mostrou que meninas entre 12 e 17 anos eram o público que mais crescia na utilização da internet. Esse estudo causou preocupação por parte dos pais que temiam que as meninas fossem vítimas da tecnologia ou de mensagens prejudiciais. Quando se trata de internet, Henry Jenkins argumenta que os pais estão tão preocupados em proteger seus filhos do que eles acham ser potencialmente perigoso, que esquecem de entender o que exatamente seus filhos estão fazendo online [12]. Comunidades
Há um crescimento nos estudos de meninas na internet, mas estes estudos são focados em sites criados para meninas ou sobre meninas, em vez de sites criados por meninas. Um estudo de Susanna Stern mostrou que as meninas utilizam
117
páginas criadas por elas como uma forma de “uma apresentação própria construtiva”, e conclui: É claro que meninas adolescentes estão falando na web – falando de formas e palavras que não são freqüentemente ouvidas. As páginas fornecem á elas uma grande oportunidade de expressar seus pensamentos e interesses abertamente, e criar uma identidade pública [10, p. 143]. Outro ponto a se considerar é o interesse em criar comunidades através das diversas páginas. Com base nestes estudos é tentador desmistificar que o conteúdo dos web sites desenvolvidos por meninas não é reproduzir completamente uma revista de adolescentes. Uma inspeção mais cuidadosa demonstra que elas estão criando um espaço apropriado para elas mesmas, onde possam discutir suas atividades, muitas vezes consideradas supérfluas ou ridicularizadas na cultura adulta. Assim, as meninas não estão apenas tomando cyber espaços, mas criando espaços onde elas e outras meninas possam sentirem-se seguras. Elas estão desenvolvendo ambientes que querem e precisam, e que todos que os visitem não sejam ofendidos pela linguagem ou imagens inadequadas [12]. Identidades
A adolescência é um tempo onde se desenvolve e se constrói uma identidade. Esse senso de confusão de identidade sugere aos adolescentes que é um tempo de experimentação com diferentes formas de comunicação e articulações. Cerca de 40% dos adolescentes utilizadores de programas de mensagens instantâneas admitem ter dito algo online que não falariam pessoalmente [12]. Na última década o mundo adulto mostra diversas cobranças para as meninas. Elas devem futuramente ser boas profissionais, enquanto a sociedade lhes cobra autoestima, beleza e sucesso. A estimulação e experimentação através de uma distância segura, como jogos de simulação e softwares de conversa, permite tanto a crianças como jovens um desenvolvimento adequado, brincando. Encontrando diversão que as ajude a brincar com essa futura realidade, elas participam de um desenvolvimento seguro em um ambiente controlado [8]. Gee [6] considera três identidades para cada jogador. Sua identidade real, seu personagem no mundo do jogo, e a identidade projetada. A identidade projetada é uma mescla dos desejos do jogador e as limitações impostas pelas habilidades do personagem e pelo mundo. Ao projetar motivações e desejos ao personagem, o jogador passa pelas definições do jogo e cria seu próprio mundo através do personagem. Os jogadores projetam uma identidade que envolve tanto seus valores pessoais, como a identidade do personagem definida pelo jogo. Desta forma, a escolha da identidade do personagem pelo jogador esta intimamente ligada á sua vivência, e cada identidade apresenta uma percepção do mundo diferente. O sucesso de jogos recentes como Second Life e The Sims, mostra que tanto homens
como mulheres demonstram interesse em criar uma identidade única [12]. FASE ANALÍTICA
Várias técnicas de design e usabilidade foram empregadas para melhorar a eficiência e eficácia do web game. O desenvolvimento web foi centrado na experiência do usuário, utilizando as diretrizes de Jesse James Garret [5]. Plano de Estratégia Briefing
Nome do Produto: Pony Life Categoria: Jogos Eletrônicos / Web Preço: Grátis Formas de Retorno: Propagandas e produtos relacionados. Descrição: Pony Life é um web game que apresenta um mundo divertido e colorido com personagens antropomórficos e inúmeras atividades focadas ao público feminino. Diferenças aos Concorrentes: Apresenta princípios de sociabilidade e interação acentuada, métodos de economia e aprendizado de manufaturas, progresso, responsabilidade e individualização. Pontos Positivos: Possui um grande feedback da semelhança de seus personagens (pôneis) que já foram apresentados por outras empresas como uma gama de sucesso entre meninas, mas utiliza uma anatomia antropomórfica para melhor utilização dos artigos do jogo e personalização dos personagens. Seu sistema de evolução e progresso busca atrair o público feminino, principalmente as que têm interesse em jogos de gerenciamento, responsabilidade e colecionáveis. Pontos Negativos: Para melhor aproveitamento, aconselhase o uso de internet de alta transferência de dados (banda larga, rádio, etc), mas não é um requisito. Tamanho do Mercado: Mundial Consumidor: Meninas de 8 a 12 anos, meninas em geral, interessados em: pôneis, animais, mundos de fantasia e bichinhos virtuais, colecionadores de My Little Pony. Objetivos do Site
Atrair meninas entre 8 a 12 anos para o meio online e lhes proporcionar diversão, sociabilidade e conhecimento por meio de atividades casuais e focadas em seu gênero. O próximo passo quando se obtiver um número de jogadores satisfatórios, será desenvolver merchandisings e produtos relacionados para venda. Requisitos e Restrições
A partir da revisão bibliográfica e considerando o perfil do público de interesse foram determinados alguns requisitos e restrições os quais são listados a seguir.
118
Requisitos 1. Deve apresentar um sistema simples de cadastro de novos usuários, apenas com dados básicos de: apelido, email, nome, data de nascimento, sexo e país. 2. A criação de personagens deve ser feita de forma dinâmica por meio de animação, acrescentando assim individualidade avançada ao personagem. 3. A interação social entre os jogadores deve ser incentivada, através de chats apresentados durante o jogo. Moderadores serão designados para monitoramento de salas de bate-papo, mantendo assim um conteúdo seguro para crianças. 4. A personalização de personagens deve poder ser feita posteriormente de forma dinâmica e animada, com a obtenção de novos recursos in-game. 5. A jogadora deve ser instruída a criar seus próprios itens que podem ser utilizados por ela ou vendidos. 6. O sistema deve apresentar um meio de comunicação fácil entre o site e os jogadores cadastrados; como envio de Newsletters, para apresentação de novidades acrescentadas freqüentemente ao jogo.
Necessidades dos Usuários
O público de interesse remete a meninas da faixa etária de 8 a 12 anos, estudantes, classe média para alta, que possuam acesso á internet regularmente e estejam familiarizadas com a utilização de jogos online. Estudo Cultural e Histórico Geográfico
Com o intuito de atingir um público maior, ‘Pony Life’ será desenvolvido primeiramente em Inglês, e posterior ao seu lançamento, traduzido ao Português do Brasil. Segmentação do Usuário
Meninas Entre 8 a 12 anos: O público de interesse em que o web game é direcionado. Estudantes, classe média-alta, língua-mãe inglesa, habilidade tecnológica média, utilização freqüente de internet, nenhuma experiência em sistemas semelhantes, motivação de diversão. Meninas Entre 12 a 16 anos: Estudantes, adolescentes, classe média, língua inglesa fluente ou com facilidade de leitura, habilidade tecnológica média para alta, utilização freqüente de internet, nenhuma experiência em sistemas semelhantes, motivação de diversão.
7. Um sistema de horário e clima in-game deve ser implementado, mostrando diferenças conforme o horário apresentado e a época do ano.
Pais: Responsáveis interessados em conhecer o conteúdo do web game, suas funcionalidades e medidas de segurança, habilidade tecnológica básica, experiência básica em sistemas semelhantes, motivação de informação.
Restrições
Usabilidade e Pesquisa de Usuário
1. A página não deve exceder a resolução de 950 pixels por largura, mas podendo exceder o limite de 768 pixels de altura. 2. O conteúdo deve ser mostrado de forma clara e objetiva, com uma ampla gama de cores que for designada. 3. É proibida a utilização de fotografias. O layout e qualquer outra forma de arte devem ser baseados em ilustrações. Tempo de Desgaste
Atualizações freqüentes. Notícias, novidades, novas implementações semanais. Pequenas mudanças semanais ou mensais, e grandes atualizações a cada 6 meses. Identidade Visual
Sentimentos de clareza, diversidade, simplicidade, meiguice, alegria, feminilidade, conjunto, diversão. Apresentar formas curvilíneas que remetem ao feminino, uma vasta gama de cores focadas no público de interesse para demonstrar categorização de conteúdo e assimilação ao mundo alegre e moderno do jogo. Métrica
A métrica será apresentada pela análise dos usuários utilizando seus dados cadastrais, seu tempo utilizando o site, análise de pageviews e análise do número de cadastros.
Utilizando as concepções de Garret [5], realizou-se uma enquete no dia 05 de novembro de 2008 no site My Little Pony Arena, no endereço de um fórum internacional, http://www.mlparena.com/Forums/viewtopic/t=179464.htm l, em que participam colecionadores e interessados em pôneis de brinquedo da marca My Little Pony e outros brinquedos femininos. A pergunta foi: O que você gostaria de ver/fazer em um jogo de pôneis? As respostas a seguir foram coletadas, em tradução livre: “Eu prefiro jogos como Neopets e Webkinz, onde tenho um pônei que pode ser vestido, posso comprar uma casa, jogar mini-jogos, participar em eventos e colecionar itens raros. Eu acho que um jogo de pônei como Neopets seria maravilhoso. (...) Casas são minha parte favorita em qualquer RPG. Eu adoro colecionar decorações e criar cômodos.” (Sweetcakes) “Um game online como Animal Crossing seria perfeito!” (Vettefromm) “Eu tentei jogar Pony Island, mas me pareceu muito confuso então nunca fiz nada no jogo.” (RavenclawPrefect) “Gosto de poder customizar meu pônei e explorar... algo como Gaia Online com pôneis seria demais!” (AeraCura) “Eu pessoalmente gosto de Pony Island porque cada pônei é único!” (Everlyn)
119
“Eu gosto de jogos com metas (...), mas eu nem precisaria de metas se pudesse cuidar do meu pônei”. (StarFaerie) “Eu acho que ter vários artigos customizáveis, como Gaia Online, seria o máximo! Fazer uma casinha para o pônei, jogar e participar de concursos para ganhar pontos para comprar móveis novos, coisas desse tipo.” (Snapdragon) Funcionalidade e Conteúdo
O Sistema de Gerenciamento de Conteúdo é desenvolvido exclusivamente para o gerenciamento do web game. Seu layout acompanha a identidade do site e possui todas as funcionalidades de atualizações de conteúdos (artigos, npcs, novidades), propagandas e usuários. Segurança
Por sua Classificação Livre ou Everyone, moderadores maiores de idade serão selecionados para a vigência das comunicações (bate-papo e fórum) entre jogadores. Nenhum tipo de conteúdo como: preconceito, violência, sexo e/ou qualquer outro impróprio para a faixa etária será tolerado, e os responsáveis serão punidos com banimento. Os jogadores serão incentivados á não informarem informações pessoais, e-mail ou endereços. Privacidade
Todos os dados coletados pelo sistema de cadastro como: nome, e-mail, data de nascimento e país, serão utilizados apenas para fins de desenvolvimento do jogo. Em momento algum os dados dos usuários serão vendidos ou repassados á outras companhias, incluindo aqueles que forem transmitidos para os moderadores ou suporte. Requerimentos Tecnológicos
Um navegador atualizado é essencial para uma correta visualização e interação funcional. O site deve ser testado nos dois principais navegadores atualmente, Explorer 7 e Firefox 3, que suportam as tecnologias necessárias para o funcionamento ideal da interface. CSS (Cascading Styling Sheets)
O CSS é uma linguagem de estilos que busca separar o conteúdo do formato do documento. Sua facilitação faz com que o desenvolvedor precise apenas modificar um arquivo para mudar o visual inteiro de um web site, sem a necessidade de formatar todas as páginas. O tempo de leitura das páginas comparado á utilização de tabelas ou arquivos em flash cai consideravelmente, gerando menos tráfego para o servidor e menos tempo de espera para o usuário. Os robôs de buscas também interpretam melhor o conteúdo da página, melhorando a posição do site em seus resultados [13]. AJAX
O AJAX (acrônimo da língua inglesa Asynchronous Javascript And XML) é a utilização de métodos de várias tecnologias, incluindo Javascript e XML (eXtensible Markup Language), em web sites para tornar as páginas
mais interativas, dinâmicas e criativas. Essa linguagem permite criar aplicativos velozes com interação parecida dos aplicativos de desktop [7]. Banco de Dados SQL
Structured Query Language, ou Linguagem de Consulta Estruturada, é uma linguagem de pesquisa declarativa para banco de dados relacionais. Muito utilizada em banco de dados pela sua facilidade de uso e simplicidade. É uma linguagem utilizada para definir, pesquisar, modificar e controlar registros em um banco de dados relacional [3]. Linguagem PHP
Hypertext PreProcessor é uma linguagem de programação muito utilizada para gerar conteúdos dinâmicos para web sites. Caracteriza-se pela velocidade e robustez, estruturação e orientação a objetos, independência da plataforma e sintaxe similar á C/C++ e Perl [14]. Linguagem XTML
A eXtensible Markup Language é recomendada pela W3C na utilização de linguagens de marcação. Seu propósito principal é a facilidade no compartilhamento em páginas web e outros dispositivos. Suas características são: separar o conteúdo da formatação, simplicidade de legibilidade, possibilita a criação de tags, interliga-se com banco de dados, estrutura melhor a informação [15]. Especificações Funcionais Acessibilidade e Usabilidade
O web game deve apresentar um sistema de fácil entendimento, com um feedback rápido e eficiente para as jogadoras. A interatividade deve ser acentuada, sem desprezar o tempo de leitura da página e de resposta do servidor. Para isso a melhor opção pesquisada é a utilização de sistemas Ajax, ferramentas JavaScript e estruturação tableless (CSS). Requisitos de Conteúdo
A freqüência de atualizações deve ser de no mínimo 4 vezes por semana para acréscimo de novos itens, mensais para novas localidades e semestrais para grandes contextos e atualizações. Requisitos Prioritários
A prioridade dos requisitos segue a ordem crescente a seguir: Registro de Usuário, Criação de Personagem, Fórum, Atividades, Respostas à Eventos, Mensagens, Amigos, Gerenciamento de Itens, Salas de Bate-Papo, Sistemas de Ações, Colecionáveis, Presentes, Diário, Agenda. Proporção de Proeminência Facial
Como visto em Lidwell [11], a proeminência facial em uma imagem referencia a determinados atributos. Utilizando estas diretrizes utilizou-se uma imagem focada no rosto do personagem para demonstrar suas falas e atributos
120
psicológicos (avatar); e uma imagem de corpo inteiro quando se quer demonstrar atributos visuais de cores e adereços. Superioridade da Imagem
Como visto em Lidwell [11], a utilização de imagens ajuda o usuário a lembrar de diretrizes específicas que precisem ser guardadas por mais de 30 segundos. Essa técnica foi implementada nas páginas de Guia, que ajudam ao usuário a entender melhor o funcionamento do jogo. Design de Interação Gerenciamento de Itens
Etapa 1: Nome, Sobrenome, Data de Nascimento, Sexo, País. Etapa 2: E-mail, Re-digitação do E-mail, Recebimento de Newsletter. Etapa 3: Nome do Personagem, Senha, Re-digitação de Senha. Etapa 4: Local de Nascimento do Personagem, Cores. Etapa 5: Apresentação do personagem criado: seu nome, aparência e data e local de nascimento. Design de Navegação
No sistema de Gerenciamento de Itens utiliza-se a metáfora de trocar objetos de lugar para o manuseio dos artigos entre os locais de utilização dos itens. Para trocar o objeto de uma localização para outra, o usuário deve manter pressionado o botão esquerdo do mouse sobre ele, arrastá-lo até o novo local e soltar o botão. Esse procedimento irá retirar o item do local atual (ele sumirá da lista) e colocá-lo no novo local.
Dois menus foram desenhados para facilitar a navegação pelo site. O menu principal que fica no topo demonstra objetivamente as principais sessões do site, enquanto o menu da esquerda apresenta os sub-menus para cada categoria de elementos. Utilizou-se também mini-ícones para exemplificar e cores diversas para categorizar a natureza dos links do menu.
Lidando com Erros
Contraste e Uniformidade
A abordagem para a prevenção de erros em links é utilizar mensagens explicativas. Quando o mouse estiver sobre um link que pode não ser auto-explicativo, uma caixa se abrirá na posição do mouse, e mostrará informações adicionais ao usuário. Ações Permanentes
Quando a ação praticada é permanente, ou seja, não poderá ser desfeita, uma mensagem aparecerá avisando ao usuário da impossibilidade de mudá-la depois, antes de confirmar a ação. Convenções e Metáforas
Abas são muito bem empregadas em dispositivos de interface. Elas são auto-explicativas, mais evidentes do que links de textos, criam uma divisão óbvia do conteúdo e sugerem um espaço físico. Para que as abas do site funcionem corretamente, empregamos a utilização de saturação nula para abas inferiores e saturação normal para abas ativas, criando assim uma ilusão visual óbvia. Formulários
Para facilitar o preenchimento de informações em formulários necessários, utilizou-se tecnologias que respondem imediatamente as ações do usuário. A tecnologia AJAX permite mostrar respostas instantâneas para as ações do usuário, facilitam a utilização da interface. Seguindo o conceito de Design de Informação, o formulário de registro de Usuários foi dividido em 5 etapas. Cada etapa apresenta pequenos formulários com informações que foram agrupadas adequadamente umas com as outras. O usuário deve preencher os seguintes campos em cada etapa:
Concepção Visual
Mensagens de erros e outras informações importantes são destacadas do layout através da utilização de contrastes diferenciados dos outros elementos. A principal utilização é da cor vermelha para chamar a atenção do usuário quando for necessária. Desenvolveu-se uma grade padrão para o site, que possibilita a realocação de elementos pelo layout (ver Figura 4), mantendo a mesma estrutura principal. A estrutura do conteúdo principal é a que mais se adapta ao conteúdo de cada página, reformulando sua estruturação sem interferir no cabeçalho e nos menus laterais e aumentando a velocidade de leitura. Consistência Interna e Externa
Para consistência interna manteve-se o padrão de usabilidade em diversos layouts diferentes. A funcionalidade de ‘arrastar e soltar’ está presente em todas as páginas que possibilitem a utilização e o reconhecimento de funcionamento natural desta metáfora. As abas e subcategorias da categoria mais importante do site, onde acontece todo o gameplay, são estruturadas de forma idêntica, de modo que a jogadora apenas precise aprender como utilizá-las uma única vez. Paletas de Cores
Pela quantia de imagens representadas no site, utilizou-se apenas uma pequena quantia de cor nos detalhes de layout. O sistema de cores será amplamente utilizado para diferenciar as variadas funções e categorizar o conteúdo. Por esta opção tem-se a abertura de utilizar cores em uma variada gama de saturação e que remetem ao público de interesse. A utilização de cores mais saturadas remetem a excitação, divertimento e dinamismo. Para evitar a fatiga
121
das cores com as imagens, utilizou-se apenas detalhes coloridos em elementos gráficos. Marca
A marca é o principal representante de informação de um conceito. Para o desenvolvimento da marca foi estabelecido alguns requisitos como: deve apresentar formas arredondadas, características marcantes de suavidade, delicadeza e maciez, e estar ligada a fatores de boa continuidade. Através da análise de similares pode-se notar cores comumentes femininas como rosa e roxo. Através de pesquisas e análises de marcas similares, obteve-se os seguintes resultados (ver Figura 1): A tipografia desenvolvida apresenta curvas que remetem ao feminino, e uma denotação de redemoinhos que lembram doces. Sua constância em todas as letras denota á conjuntos e grupos, que devem possuir algo semelhante para se formarem. A tipografia apresenta uma elevação para lembrar o formato de um doce. Para a paleta de cores utilizou-se uma paleta monocromática. O rosa mais claro escolhido denota aos doces, ao feminino e ao sentimentalismo. O rosa forte foi escolhido por denotar energia, juventude, diversão e excitação. O tom púrpura rosado denota à magia. O contorno em branco denota a idéia de cuidado, pois esta envolvendo as letras; ele também dá destaque ao cor-derosa. A linha rosa mais escura serve como proteção ao conjunto branco, delimitando ao avanço de outras imagens a área da logo. Esta área de proteção remete á exclusividade da mesma forma que o jogo é exclusivo para meninas, onde há um espaço adequado para seu desenvolvimento sem a inclusão de objetos fora de seu grupo de conforto.
Figura 2 - Variação da Marca Personagem
Os personagens (ver Figura 3) foram criados utilizando o estilo mangá e o estilizado, além da técnica de Condição Clássica - onde demonstram sentimentos de felicidade, meiguice e beleza. Sua anatomia demonstra uma miscigenação entre humanos e pôneis. Eles possuem corpos humanóides, mas cabeças e rabos de cavalos, cascos e mãos com quatro dedos para melhor caracterização. O estilo de desenho é uma identidade principal, pois denota os aspectos dos personagens e demonstra os gráficos do jogo. A anatomia antropomórfica do personagem utiliza detalhes anatômicos de pôneis para ligar a jogadora á um mundo de fantasia e magia, sua forma humanóide denota ás bonecas e facilita na utilização de artigos do jogo. As diversas cores que podem ser aplicadas ao personagem geram inúmeras possibilidades de individualização, criando assim personagens únicos para cada jogadora.
Figura 1 – Marca Variação da Marca
Uma variação da marca principal (ver Figura 2) é a inclusão de um personagem do jogo. Este personagem acrescenta outros significados buscados para a identidade da marca. As cores do personagem aplicadas a esta variação denotam há vários fatores. A cor púrpura denota as crianças e ao mundo mágico; o rosa á feminilidade e á diversão; o verde ao natural e desenvolvimento; o amarelo á alegria e ao aprendizado.
Figura 3 – Personagem Design de Interface Layout
Uma disposição bem organizada e proporcional leva á uma definição harmoniosa do conteúdo. A ordem e a regularidade visual facilitam a legibilidade e a navegação, permitindo uma leitura clara e simples. A integração dos elementos e coerência das unidades formam o conjunto de toda a arte. O layout deve ser limpo, mas ao mesmo tempo
122
variável para apresentar todos os componentes necessários. Utilizando os princípios de Hierarquia Visual vistos em Krug [10], estruturou-se o conteúdo no layout. A ênfase em neste layout (ver Figura 4) se dá em direção do topo para a base. O topo mostra o cabeçalho e menu principal, seguido pelo formulário de login e campo de busca em cada uma das colunas. No meio ficam as apresentações principais do conteúdo do jogo e para registro de novos usuários. Quando logado, o usuário pode ver ao topo informações sobre o mundo. Seguindo a hierarquia temos o menu secundário a esquerda, e barras de necessidades e outras informações sobre o personagem a direita. O centro mostra novos conteúdos. Á esquerda ficam os anunciantes e a direita informações de usuários registrados, e quando logado a lista de amigos. O rodapé apresenta informações adicionais sobre o jogo e links para informações de termos de utilização, ajuda e propagandas.
Para diferenciação dos links nas páginas utilizou-se variadas formas dependendo de sua utilização (ver Figura 5). Para links de frases e palavras acrescentou-se o sublinhado e cor. Para botões mais específicos de ações no jogo foram criados botões exclusivos com ícones. No submenu os links apresentam uma cor de fundo diferenciada quando o mouse estiver sobre eles, e uma seta quando estiverem ativos.
Figura 5 – Links
Para representar melhor conteúdos dentro de sub-categorias criou-se abas para englobar visualmente a estrutura filha. As cores também ajudam á discernir entre o conteúdo selecionado e ativo (ver Figura 6).
Figura 6 – Estruturação Menu
Um elemento importante no layout é o menu. Ele será responsável pela navegação do usuário pelas páginas do site. No menu aplica-se a Regra 80/20 [11] para focar nas principais páginas de acesso do web game (ver Figura 7).
Figura 4 - Layout
Conteúdos semelhantes foram agrupados através de divisórias e podem ser percebidos pelos seus elementos gráficos semelhantes. O cabeçalho apresenta uma vasta gama de cores e mantém a unidade do menu principal. Elementos em destaque estão no topo da coluna do meio e apresentam a mesma forma e contexto gráfico. Seguiu-se este padrão para delimitar todos os elementos da página, mantendo a consistência e a unificação.
Como resultado, optou-se por um menu principal mais compacto de 949x30 pixels com mini-signos que facilitam o reconhecimento do conteúdo e cores atrativas. Um submenu lateral de apoio mostra as sub-páginas e utiliza-se uma seta colorida para indicar a posição do usuário no site. Um guia de localização chamado por Krug [10] de migalhas, também foi implementado para ajudar na localização do usuário.
123
Figura 7 - Menu Principal Ícones
Para o design dos ícones, utilizou-se como base objetos cotidianos e temáticas simples presentes na vida da faixaetária correspondente. Os ícones são utilizados para identificar sessões do site e possuem a medida padrão de 65x65 pixels com fundo branco. Os mini ícones foram desenvolvidos em pixel art. A utilização de mini ícones é uma técnica muito utilizada para ajudar no reconhecimento de links. As cores devem acompanhar as paletas designadas para o público de interesse. Sua medida padrão deve ser de até 16x16 pixels. Em ícones para representação de páginas optou-se pela utilização de objetos cotidianos que pudessem remeter à uma representação. Utilizaram-se ícones (signos visualmente análogos á ação) para indicar as opções de conteúdo. E símbolos (signos que representam mensagens altamente abstratas) para exemplificar as regiões do mundo e outros conteúdos mais complexos do jogo.
Cada jogadora poderá criar um personagem, que através de uma variada gama de cores possibilitará uma criação única e personalizada. Além das cores, o personagem poderá usar roupas e acessórios para mostrar sua personalidade, e ainda escolher interesses que lhe agradam e que podem ser comparados com outras jogadoras. Avatar
Para suprir esse sentimento de individualização e identidade na comunicação entre as jogadoras, cada uma possuirá um avatar (uma pequena imagem de reconhecimento de 50x50 pixels) que será definido pela aparência do seu personagem. Esta imagem estará presente em toda a comunicação que a jogadora fizer com outras jogadoras, sendo por meio de fóruns, salas de bate-papo ou mensagens privadas; ela ajuda a manter um feedback de identificação das jogadoras (ver Figura 8).
Game Design Mundo
O mundo do jogo possui um contexto de um lugar bonito, alegre, com muita cor e diversidade. Através dele queremos levar a jogadora a um lugar mágico onde ela possa ser quem ela quer ser, em um mundo vivo, cheio de personagens e amigos prontos á ajudá-la. Esse mundo apresentará atividades de uma vida simples, onde através de várias profissões ela pode progredir e evoluir. Tipos de Jogo
O jogo apresenta possibilidades para três estilos diferentes de jogadoras: Exploradoras, Práticas e Socializadoras, baseados nas definições de Bartle [1]. Para Exploradoras apresentam-se várias opções de descobrimentos tanto de locais e geografias como personagens, lojas e itens exclusivos. Para jogadoras Práticas criou-se um sistema de evolução e coleção de diversos itens diferentes onde a jogadora pode ganhar troféus e reconhecimentos pelos seus esforços, como participar de Clubes exclusivos e ganhar prêmios. Para os Socializadoras, implementou-se diversos meios de comunicação, desde mensagens pessoais, á salas de bate-papo e fóruns que facilitam sua integração e interação com outras jogadoras. Identidade e Personagem
Através da pesquisa de similares, notou-se grande interesse feminino em jogos com animais, com destaque para cavalos e pôneis. Esta estrutura biológica foi adaptada para uma forma humanóide que pudesse suprir os interesses por atividades diversificadas e utilização de artigos. Essa nova anatomia remete também à anatomia de bonecas.
Figura 8 - Utilização de Avatar Responsabilidade
Através da análise dos jogos similares nota-se o interesse feminino no cuidado dos personagens. Desenvolveu-se então barras de necessidades do personagem (ver Figura 9), em que ela precisará mantê-las em um nível aceitável para fazer determinadas atividades. Além do tempo, o clima ingame também pode influenciar na alteração dessas barras, criando um mundo que interage com o jogador. Para suprir estas necessidades a jogadora deve executar atividades ou utilizar itens.
Figura 9 - Barras de Necessidades Gerenciamento
Como visto anteriormente, os Purple Games apresentam o maior mercado atualmente de jogos femininos. Esse estilo de jogo apresenta atividades triviais de socialização e gerenciamento de negócios. Aplicando esse princípio em Pony Life, foram desenvolvidos vários sistemas de atividades casuais de gerenciamento de atividades, que influenciam diretamente a vida do personagem, como: cozinhar, plantar, criar animais, gerenciar uma loja, etc.
124
Manufaturas
A personagem pode ainda aprender inúmeras habilidades e se especializar nelas. Quanto melhor for seu nível, melhor e mais valiosos serão os produtos produzidos. A jogadora tem autonomia de não precisar comprar comida, poder plantar em seu jardim e prepará-las em sua cozinha através das receitas. A jogadora também pode se tornar criadora de animais e receber seus sub-produtos; pode criar peças exclusivas de roupas e acessórios através de projetos de moda; pode abrir sua própria loja e vender seus produtos ou produtos de outras jogadoras e muitas outras atividades. Comunicação Direta
Segundo Ray [16] para manter as mulheres interessadas no jogo, a comunicação deve ser diretamente direcionada a ela como pessoa e de forma empática, que pode ser feito através de tutoriais, diálogos ou até mesmo pelo manual. Para isso desenvolveu-se uma comunicação entre o sistema e o jogo utilizando os NPCs (personagens não-jogadores). Eles repassam informações através de balões de fala e guiam a jogadora (ver Figura 10).
outros. O progresso de cada coleção é mostrado no perfil do personagem, onde eles podem fazer comparações com outros jogadores. Com a adição de novos artigos nas Coleções em determinados períodos de tempo, a atividade torna-se um desafio permanente, mas que ao mesmo tempo pode ser completada e que recompensa as jogadoras com troféus em diversas etapas. Troféus e Clubes
Segundo Ray [16], a melhor forma de recompensa para meninos é através do ganho de pontos, eles são altamente motivados em alcançar a maior pontuação em um placar. Mas isso não acontece diretamente com as meninas, que preferem trabalhar unidas e planejar estratégias. Uma forma desenvolvida para atingir esse público é acrescentar atividades que possibilitem ao jogador escolher sua meta final. Um sistema de Troféus recompensa a jogadora quando ela completar determinados desafios, e o sistema de Clubes permite que ela se destaque quando for boa em alguma atividade e interaja com outras jogadoras semelhantes. Estas duas funcionalidades aparecem no perfil da personagem mostrando seu progresso. Buscas e NPCs
Figura 10 - Comunicação Empática Comércio
Utilizando os conceitos de Ray [16], do padrão social humano de competição direta e negociação de cada sexo, desenvolveu-se um sistema de comércio para que as jogadoras possam dividir recursos e trabalhar em conjunto, evitando conflitos violentos e trabalhando com a diplomacia e negociação. Exploração
Uma das qualidades de jogos femininos é a exploração de ambientes, onde o jogador tem livre arbítrio para decidir suas atividades; por isso um mundo complexo e rico do jogo está em constante expansão para ser explorado. Através de mapas a jogadora pode descobrir localidades, novos amigos e lojas exclusivas de diversos produtos. Conversando com NPCs ela pode aprender novas habilidades e ganhar itens. Colecionáveis
Colecionar artigos é um ponto que pode ser visto em diversos jogos com temáticas femininas; é uma forma de completar desafios sem interferir na vida de outros jogadores. O sistema de coleções desenvolvido abrange vários tipos de artigos, desde Receitas e Projetos de Moda; até artigos palpáveis como figurinhas, pelúcias, livros e
Ray [16] explica que o estímulo é uma resposta excitante de uma ação. Como visto anteriormente em jogos para mulheres, deve-se trabalhar com estímulos emocionais e táteis. A forma tradicional de desenvolver estímulos emocionais é utilizando a história e os personagens. Para criar um laço emocional com personagens não-jogadores (NPCs), deve haver benefícios mútuos de ambos os lados, que podem ser pequenos problemas significativos para os personagens. Como visto em Ray [16] e Kafai [9], o público feminino é mais interessado em resolver problemas menores, de cunho social e diplomático, ou ainda como recompensa melhorar a vida de algum personagem ou alguma situação. Mantendo essa linha de pensamento, desenvolveu-se um sistema de Buscas que podem ser completadas pela jogadora. Estas buscas são dadas por NPCs e envolvem encontrar um item ou personagem, e como recompensa ela receberá uma menção em seu perfil de ter completado a tarefa, itens raros e/ou PonyCoins (moedas). Clima, Horário, Ambientes
Como visto anteriormente que mulheres preferem utilizar pontos visuais em vez de conceitos matemáticos, desenvolveu-se um sistema de mudanças nos cenários do jogo que possibilitam a busca e pesquisa por novas funcionalidades. Os mapas menores sofrem alteração do clima in-game, horários e ambientes em diversas regiões, mostrando diferenças gráficas entre eles. Estas diferenças influenciam no gameplay e mostram diferentes atividades conforme especificações.
125
Socialização
O principal foco dos jogos atuais é a integração e sociabilidade entre os jogadores e é muito mais importante em jogos online. A comunicação dentro do game é um ponto essencial em jogos online com público feminino, e ainda, ensinam aos jogadores como se portarem socialmente em uma comunidade. Para enfatizar os meios de comunicação dentro do jogo, foram criados quatro sistemas de comunicação e expressão mostrados na próxima sessão. Lista de Amigos
A jogadora poderá adicionar outros jogadores em sua lista de amigos e poderá enviar presentes, cartas e ver seu status no jogo (online/offline). Estes facilitadores ajudam as jogadoras a manterem contato com suas amigas e a trocar diversos tipos de mensagens. Para facilitar e encorajar a comunicação, uma caixa especial a direita do site mostrará os amigos online e link para acessar diretamente seu perfil. Cartas (Mensagens Privadas) e Presentes
As Cartas são sistemas privados que possibilitam a comunicação privada entre as jogadoras. Esse sistema estreita laços de amizade entre elas. A jogadora também pode enviar itens de presente para presentear suas amigas. Salas de Bate-Papo
As salas de bate-papo estão disponíveis em algumas localidades dentro do mundo do jogo. Este sistema permite que as jogadoras se comuniquem em tempo real e interajam diretamente umas com as outras. Fórum
Um fórum será empregado para comunicação nãoautomática das jogadoras. Nele elas poderão criar tópicos sobre diversos assuntos do jogo e receber respostas de outras jogadoras, assim como tirar dúvidas e fazer novos amigos. Diário
Um Diário é um mini sistema de blog, em que a jogadora pode escrever pequenos acontecimentos, habilitando assim no mundo do jogo a possibilidade de expressão de sua identidade. Agenda
A agenda da jogadora permite que ela grave eventos importantes como encontros, aniversários ou atividades programadas, que podem ser anotadas. Ela poderá compartilhar eventos com seus amigos, marcar encontros e atividades. Os aniversários de seus amigos são automaticamente gravados na agenda, facilitando a integração entre elas para estes eventos. Decoração de Interiores
Um ponto muito citado na Enquete feita no site My Little Pony Arena foi a posse e decoração de uma casa exclusiva para o personagem. Esse outro tipo de atividade trivial
parece despertar grande interesse no público feminino, que costuma ser mais ligado á criatividade. Para suprir essa necessidade, desenvolveu-se um sistema onde a jogadora poderá construir e decorar sua própria casa. Através de Reformas, ela poderá mudar o piso e paredes da casa padrão, e ainda comprar móveis para decorar seus cômodos. Esse sistema apresenta uma visualização isométrica. CONCLUSÃO
Este trabalho descreve o design de um web browser game acessível para meninas de 8 a 12 anos. Através de pesquisas nas áreas de jogos, design, web design e cores, delimitou-se uma solução eficiente e inovadora no conceito de web browser games para meninas. Foram utilizadas técnicas leves e atuais de interação online. Desta forma propõe-se um game design interessante e divertido ao público de interesse com uma arte original que representa a identidade visual do jogo. Este artigo descreve o design do jogo Pony Life através do desenvolvimento de gráficos e aplicação de requisitos de usabilidade direcionada ao público de interesse, que pode ser realizada através de cenários, personagens, ícones, itens e layout. O desenvolvimento gráfico e a usabilidade foram focados ao público de interesse através de uma vasta gama de cores e uma arte exclusiva estilizada e jovial. O design do jogo também propôs integralizar o site mostrando uma interação entre o layout e o conteúdo, onde através das tecnologias de AJAX e PHP pode-se integralizar o layout e seu conteúdo, com interações animadas e dinâmicas. A interação de jogabilidade pode ser aplicada de forma consistente e unificada em todo o jogo. Além disto, o design do Pony Life deveria ser um projeto em plataforma web que utilize tecnologias leves e tendências atuais. Para tanto foi proposta a utilização de tendências atuais de estruturação e adaptação de conteúdo, como CSS e outras tecnologias citadas anteriormente. Estas tecnologias possuem baixa taxa de transferência de arquivos do servidor e maior velocidade no download das páginas.O design do jogo também envolveu a criação de uma interface exclusiva com ícones temáticos. Estes ícones temáticos foram desenvolvidos para ajudar na identificação e feedback do conteúdo do web game, facilitando assim a usabilidade e assimilação das jogadoras. Além disto, o jogo Pony Life apresenta atividades divertidas e direcionadas ao público de interesse. Estas atividades foram construídas a partir de pesquisas e jogos similares, abrangendo assim o nível de exploração do conteúdo do web game e as formas de jogabilidade. Por fim, o design do jogo para meninas buscou focar na diversão direta e aprendizado indireto das meninas. O jogo clama pela diversão para mostrar algumas atividades reais que podem ser aprendidas pelas jogadoras, como cozinhar, plantar, criar animais, gerenciar empresas e outras. Estas atividades podem ser aplicadas diretamente na vida da jogadora com a supervisão de um adulto.
126
Para continuação deste trabalho pode-se citar a fabricação de personagens em toy-art e produtos relacionados ao mundo do jogo. Também os testes de usabilidade necessários serão aplicados a partir do momento em que um protótipo do jogo for desenvolvido.
8. Jones, G. Brincando de Matar Monstros: Porque as Crianças Precisam de Fantasia, Videogames e Violência de Faz-de-Conta. Conrad, São Paulo, 2004.
REFERÊNCIAS
9. Kafai, Y., Heeter, C., Denner, J., and Sun, J. Beyond Barbie and Mortal Kombat. Massachusetts Institute of Technology, USA, 2009.
1. Bartle, R. A. Designing Virtual Worlds. New Riders, USA, 2004.
10. Krug, S. Não Me Faça Pensar. Alta Books, Rio de Janeiro, 2006.
2. Beck, J. C., Wade, M. The Kids Are Alright: How the Gamer Generation is Changing the Workplace. Harvard Business School, Boston, 2006. 3. Bowman, J. S., Emerson S. L., and Darnovsky, M. The Practical SQL Handbook: Using SQL Variants. Addison-Wesley, 2001. 4. Entertainment Software http://www.theesa.com/facts/index.asp
Association
11. Lidwell, W., Holden, K., and Butler, J. Universal Principles of Design. Rockport Publishers, Gloucester, 2003. 12. Mazzarella, S. Girl Wide Web: Girls, the Internet, and the Negotiation of Identity. Peter Lang Publishing, New York, 2005. 13. Meyer, E. A. CSS: The Definitive Guide. O'Reilly Media, USA, 2006.
5. Garret, J. J. The Elements of User Experience: UserCentered Design for the Web. New Riders, USA, 2003.
14. Moraz, E. Treinamento Prático em PHP. Universo dos Livros, Brasil, 2005.
6. Gee, J. P. What Video Games Have to Teach Us About Learning and Literacy. Palgrave Macmillan, USA, 2007.
15. Ray, E. T. Learning XML. O'Reilly Media, USA, 2003. 16. Ray, S. G. Gender Inclusive Game Design. Charles River Media, Massachusetts, 2004.
7. Holdener, A. T. Ajax: The Definitive Guide. O'Reilly Media, USA, 2008.
17. Rolling, A., Adams, E. Andrew Rollings and Ernest Adams On Game Design. New Riders, USA, 2003.
127
A Influência de Interfaces Gráficas na Narrativa e Imersão de Jogos Digitais Gabriel Cerino Paulino (UFPR) orig_arcanjo@yahoo.com.br
Leonardo Mendes Moroni (UFPR) lmmoroni@uol.com.br
Luendey Maciel de Aguiar (UFPR) luendey@gmail.com
Nuno Akira M. Sugano (UFPR) nunoakira@hotmail.com
Rafael Pereira Dubiela (UFPR) rafaeldubiela@yahoo.com.br
Rua General Carneiro, 460 – Centro Curitiba – PR - Brasil
RESUMO:
Jogos eletrônicos atualmente possuem esquemas de controle e de interface cada vez mais complexos e vastos. Alguns podem confundir o jogador a ponto de atrapalhar a experiência de jogo, assim como ter o efeito exatamente oposto, aumentando a diversão ou imersão que o jogador tem ao jogar. Com esse trabalho, tentou-se analisar formas de interface e aspectos em que ela se encaixa, para relacioná-las com a narrativa dos jogos e como esta é influenciada pela interface. ABSTRACT:
Nowadays, electronic games possess growingly complex control and interface systems. Some may hinder the player to the point of disturbing his experience with the game, while others can greatly enhance the experience, making the game world more immersive and fun. This article tries to analyze graphical interface modes and the aspect which makes them, and establish a relationship with the game narrative, showing how it can be influenced by the graphical interface. Palavras-chave: Interface, Imersão, Game Design, Narrativa INTRODUÇÃO
Atualmente, os jogos digitais já ultrapassaram a condição de simples nicho de uma pequena parcela da população e aos poucos estão sendo cada vez mais difundidos nas atividades da sociedade, em especial de jovens. Um exemplo é de que só a indústria norte-americana de jogos digitais obtém números recordes em lucros a cada ano que passa, gerando 9,5 bilhões de dólares apenas no ano de 2007. Halo 3, foi o título mais vendido de 2007 e obteve maior retorno no seu primeiro dia de vendas do que a maior bilheteria cinematográfica de todos os tempos, Homem-Aranha 3 [6].
Mesmo assim, os jogos digitais ainda não estão completamente difundidos entre a população geral no mesmo patamar que outras mídias, como o cinema, embora estejam simulando a maioria dos elementos presentes neste, como narrativa, trabalho de câmera, produção sonora, etc. Isso acontece porque o maior diferencial dos jogos digitais é também o seu maior bloqueio: A existência da interatividade, representada em uma interface de controle, comum a todo sistema informatizado. O artigo então, tenta verificar a influência que os aspectos e estruturas de interface gráfica durante o jogo causam na narrativa e no desenrolar da atmosfera de um jogo eletrônico. REVISÃO BIBLIOGRÁFICA
Afim de que possamos compreender cada um dos aspectos envolvidos no ato de jogar um jogo digital, assim como no próprio jogo em si, é importante definirmos inicialmente o que eles representam e como eles estão inseridos na atividade pesquisada. Definição de Jogos
Os jogos são uma das atividades mais antigas existentes entre a humanidade, representando o ser humano em várias condições e situações. É uma categoria primária na vida, tão essencial como o raciocínio e a criação de objetos. Ela pode ser definida como:- Uma atividade voluntária exercida dentro de certos e determinados limites de tempo e espaço, segundo regras livremente consentidas, mas absolutamente obrigatórias. Dotado de um fim em si mesmo, acompanhado de um sentimento de tensão e alegria e de uma consciência de ser diferente da vida humana [9], uma simulação que pode ou não ultrapassar os limites da realidade presente na vida de cada um.
128
No ato de jogar é definida uma ocupação separada e cuidadosamente isolada do resto da vida, restringida a certos limites de tempo e espaço, possuindo locais próprios para tal atividade (como por exemplo, um tabuleiro de xadrez, um estádio de esportes, uma pista de corrida etc.) [2], além de servirem como uma forma de autodesenvolvimento e aplicação de capacidades individuais [15]. Os jogos também estão presentes em múltiplos aspectos da vida atual, assim como em vários tipos de mídia da sociedade, incluindo máquinas e simulações virtuais, é o caso dos computadores e videogames em geral [5]. Dessa forma, é possível organizar uma série de características que definem os jogos e como eles podem ser identificados como tal [10]: 1 – Regras. 2 – Resultado variável e quantificável. 3 – Valorização dos resultados. 4 – Esforço do jogador. 5 – Vínculo do jogador ao resultado. 6 – Consequências negociáveis. Essas características, embora definam os elementos que compõem os jogos, não necessitam estarem todas inclusas em um mesmo jogo, com algumas delas ausentes dos seus elementos. Definição de Jogos Digitais
Ao jogar um jogo digital acessado em algum tipo de máquina, o computador age como oponente e como referencial na maioria deles, assim como providencia elementos gráficos animados (uma necessidade ao jogar esse tipo de jogo). A forma mais comum de jogos digitais são os que contêm algum grau de ação e necessitam da habilidade mental e coordenação motora do jogador, embora existam vários outros gêneros, como jogos de aventura, RPG (role playing game), puzzle, etc.[4]. O primeiro jogo digital de que se tem conhecimento surgiu nos computadores do Instituto de Tecnologia de Massachusetts (MIT), na década de 60, se utilizando de um dos poucos computadores dotados de elementos gráficos existentes na época [12]. Com o passar do tempo, houve a ascensão desse tipo de atividade, em que ela se consolidou como um lazer despreocupado, gerando as conhecidas máquinas de arcade, para sofrer um declínio na década de 80 e emergir de volta na década 90, com o surgimento das empresas japonesas no mercado de jogos digitais, com
uma aparência mais refinada e um foco maior em aparelhos domésticos, até chegar aos dias de hoje, em que eles se consolidaram como uma área do entretenimento com investimentos e retornos sólidos [11]. Definição de Narrativa
São comunicações, em que um autor se comunica com uma audiência, de forma implícita, através de uma História, considerada o conteúdo formal de uma narrativa. Elas são facilmente vistas de forma linear, de um autor em direção a uma audiência [3]. A narrativa é uma forma de a sociedade construir comunidades em que os seres humanos contam histórias uns aos outros e compreendem-se melhor dessa forma, colocando a narrativa como uma das formas principais de cognição para que o homem possa compreender a sua realidade em volta [13]. Essas histórias, portanto, são uma coleção de fatos ordenados de forma seqüencial para que sugiram uma relação de causa e efeito. Para toda ação na história há uma consequência. Esses fatos são, em sua maioria, fictícios e desimportantes, pois não são os fatos em si que constituem uma história, e sim, a relação entre esses fatos, o desenrolar dos eventos que forma uma estrutura coerente. Nós não nos importamos com a veracidade e realidade das histórias que vemos, mas sim, com as mensagens e valores que elas tentam transmitir, através da interação entre os fatos da história [4]. Nessas histórias, há sempre um elemento central relacionado à narrativa, um tipo de mediador entre a narrativa e a audiência, chamado de personagem. É com ele que a história acontece, por meio de ações, que representam o que acontece, e ambiente, que são os locais onde algo acontece [7]. Definição de Interface
De acordo com Rouse [16], Interface, no caso de jogos digitais, são os controles ou inputs, as respostas ou outputs, e as mensagens de ajuda. É todo tipo de auxílio visual ou sonoro que sirva como elemento de jogabilidade e imersão. Eles servem como principal elemento de comunicação entra o usuário e o sistema, utilizando abordagens variadas que permitem que esse usuário se localize e tenha liberdade dentro do mundo do jogo. Já para Schuytema [18], a interface é o meio por onde o jogador e o jogo se comunicam numa linha bilateral e sendo assim ela poderia influenciar a experiência de jogo tanto para melhor quanto para pior, acarretando a desistência do jogador a continuidade do jogo.
129
Uma dessas principais abordagens observadas em uma interface gráfica é a não-linearidade. O que a torna tão diferente do ato de ler um livro ou alguma outra atividade passiva é a possibilidade de um acesso direto e preciso, utilizando-se dos seus vários aspectos, como ler, ver e ouvir [8]. Mesmo seguindo uma abordagem mais linear composta de múltiplos caminhos com poucos desfechos, os jogos digitais ainda permitem inúmeras possibilidades de interação. As interfaces gráficas, barras, pontuações e opções de comando, permitem que o jogador selecione as ações que prosseguirão com o jogo. TEORIA DE PESQUISA
Visto que os jogos digitais atuam como uma mídia que emprega vários tipos de mídias, como imagem, som, texto e interatividade, elas devem atuar influenciando umas as outras para criar uma experiência coerente. O artigo tenta comprovar uma influência que o aspecto das interfaces gráficas pode ter no andamento da narrativa, podendo ser parte da experiência total. DESENVOLVIMENTO Jogos Analisados:
Os jogos analisados foram escolhidos com base em suas diferentes estruturas de interface, presença de elementos narrativos, e formas diferentes de integração entre esses dois elementos. Todos os jogos escolhidos são as versões finais que se encontram no mercado, sendo todos de língua inglesa, portanto, um pré-requisito da avaliação era a capacidade do avaliador em compreendê-la. - ICO (Sony, 2001); sua escolha foi o fato de conter uma ausência quase que completa de menus, barras, sistemas de auxílio e sinalizadores de situação, assim como não possuir pistas de progressão do jogo, tendo apenas o feedback atmosférico e o que é causado pelas ações da inteligência artificial presentes nos outros personagens do jogo.
1
-
Metal Gear Solid 3 (Konami, 2004); foi escolhido por possuir uma interface sucinta, mostrando apenas o necessário na tela, servindo também como componente que auxilia na imersão do jogador, além de possuir muitas cutscenes 1 que fazem parte da narrativa e que explicam, como um tutorial, o jogo em si.
-
Devil May Cry 3 (Capcom, 2005); escolhido por possuir uma interface mais carregada
Cutscenes : -animações entre ações de jogo onde o jogador não tem controle algum.
visualmente do que os outros jogos escolhidos, informando desde hits 2 , passando por pontos de vida e chegando a mostrar a moeda corrente em jogo, além de cortes em jogo pra mostrar telas de explicação, tutoriais. MÉTODOS DE AVALIAÇÃO:
Para avaliar as interfaces escolhidas, foram utilizados como conceitos de avaliação a classificação utilizada por Breyer [1], que analisa jogos eletrônicos divididos nos aspectos de interface, mecânica, jogabilidade e experiência de jogo, porém só foram utilizadas as questões sobre interface, jogabilidade e experiência de jogo, já que assim poderíamos através dos resultados entender o que cada avaliador achou sobre a essas respectivas partes de um jogo e o que pode influenciar no aspecto emocional dos mesmos. Para avaliar o aspecto emocional das pessoas ao jogarem os jogos selecionados, foi utilizado o sistema de Watson [19] que classifica as emoções em espectros de “Ativação Positiva e Ativação Negativa”, como definidos pelo autor, onde assim pôde ser avaliado as sensações sentidas e os seus respectivos motivos. Para servir de diretriz na avaliação e compilação dos dados, foram utilizados os critérios de Nielsen [14] quanto à interface em sistemas computadorizados, especificando o foco e o objetivo do trabalho. Todos esses parâmetros foram mesclados ao método TAE.Web.u de PIRAUÁ [17], criando assim, um método híbrido, que pudesse avaliar tanto a qualidade estética da interface quanto sua influência na percepção da narrativa e assim a qualidade da imersão. A escolha dos métodos de avaliação foi feita por conhecimento prévio dos métodos, facilitando a aplicação, assim como por ter participação direta do público alvo e por ser considerado um método rápido e eficiente para a avaliação proposta. PERFIL DOS USUÁRIOS:
Os usuários que fizeram parte dos testes encontram-se na casa dos 20 anos, mais precisamente dos aos 25. A razão disso é que, jogos eletrônicos em sua maior parte estão disponíveis apenas em línguas estrangeiras, sendo o inglês a principal delas. Como este trabalho visa a compreensão da interface como artíficio que influencie a narrativa, um bom conhecimento da língua inglesa era um pré-requisito para a análise, já que a língua inglesa é a língua original tanto do jogo, como dos jogadores onde ele foi lançado, e a faixa etária escolhida apresentou um 2
Hits:- quantidade de ataques efetuados em um espaço curto de tempo e em seqüência.
130
tipo de público que conhecia a língua suficientemente bem para que isso não fosse um empecilho. Outra razão para a faixa etária é que, pessoas dessa idade, embora já tenham passado da fase adolescente, fizeram parte da geração que jogou jogos eletrônicos quando mais novos, o que economizou tempo ao não ser necessário ensinar as convenções básicas relacionadas ao uso de controles de videogame, pois o objeto de análise do artigo é a interface gráfica, ou seja, a que está inserida na tela da TV, o mundo de jogo, por assim dizer. Caso o usuário tivesse que lidar com o aprendizado dos controles ao mesmo tempo, isso poderia atrapalhar o seu desempenho quanto a sua análise da interface gráfica e da narrativa. Fizeram parte do teste, 5 pessoas. Dentre os 5 participantes, 3 eram homens e 2 eram mulheres. Procurou-se estabelecer um equilíbrio nesse aspecto, embora a quantidade maior de pessoas do gênero masculino que jogam jogos eletrônicos tenha facilitado para a chamada de usuários que auxiliassem no teste. Embora 5 pessoas sejam uma quantidade pequena para uma pesquisa com esse tema, este trabalho não tem como objetivo postular uma afirmação de que a interface influencie na narrativa, e sim, apenas tenta demonstrar indícios de que isso acontece, abrindo caminho para futuras pesquisas. APLICAÇÃO DO MÉTODO:
Foram elaborados três questionários específicos para cada um dos jogos seguindo os padrões já esclarecidos acima, em que foram avaliadas, a qualidade gráfica da interface, a qualidade de percepção da narrativa e a influência da interface na narrativa. Estes questionários foram impressos e entregues, esclarecendo que, para poderem avaliar, deveriam jogar no mínimo uma hora de cada jogo, não necessariamente um tempo contínuo já que assim simulariam uma ação real, de no mínimo de uma hora para poder ter um mínimo conhecimento da narrativa e da curva de aprendizado do jogo. Preferiu-se entregar o questionário, pois assim a pessoa jogaria em um local comum a ele - sua casa - e o resultado poderia ser mais próximo ao real. Logo após o término de cada jogo, foi pedido para que preenchessem o questionário, respondendo as suas opiniões e sensações com relação a cada jogo, para fornecer informações mais concretas sobre suas experiências e posteriormente uma entrevista com os avaliadores para adicionar comentários a pesquisa em si. O questionário se dividiu em 5 partes: 1) A primeira parte era referente as condições do espaço onde a pessoa jogou, para que pudesse
2)
3)
4)
5)
ser medido a influência do ambiente na experiência de jogo. A segunda parte estabeleceu sensações de atração ou repulsão em vários aspectos (clareza ou confusão, diversão ou tédio, etc.) e pediu para que o usuário respondesse em que ponto dos espectros se encaixavam as interfaces dos jogos testados. A terceira parte tentou definir características subjetivas para que o jogador escolhesse quais se encaixassem com a interface analisada. Elas foram dipostas em espectros da mesma forma que a parte anterior (masculino ou feminino infantil ou maduro, modesto ou extrevagante, etc.). A quarta analisava os espectros de emoção pelas quais o usuário passou durante o teste. Emoções como alegria ou tristeza, tranquilidade ou tensão e calma ou raiva foram medidos de acordo com as áreas do jogo e a sua linguagem visual. A última e quinta parte do jogo referiu-se a questões subjetivas de cada jogo, possuindo questões diferentes, que se encaixavam com ocasiões específicas de cada um deles. Nessa parte, foram feitas perguntas relevantes ao envolvimento do jogador com o jogo, a sua primeira impressão da interface e ao interesse dele em continuar a jogar.
Terminada essa parte, foram feitas tabelas onde foi estipulada uma quantidade de pontos para determinadas questões, enquanto outras foram utilizadas para tomar consciência do que o avaliador achou da interface. RESULTADOS OBTIDOS Metal Gear Solid 3 (MGS):-
Este foi o jogo com a menor pontuação dentre os três, tendo um total de 72 pontos dos 195 pontos originais. Com os questionários preenchidos e já na seção de entrevista com os avaliadores, foi constatado que o jogo era um pouco maçante, pois era composto por muitas cutscenes sem interação, porém os avaliadores gostaram de jogar e sua interface foi considerada por muitos como simples, mas mesmo assim confusa. O jogo também gerou uma quantidade de imersão satisfatória nos avaliadores, mas por ter muitas cutscenes e tutoriais acabava por ocasionar uma perda de atenção e imersão influenciando dessa forma na sua compreensão da narrativa. A interface do jogo gerou uma grande porcentagem de atração, similar ao jogo ICO, e pouca repulsão, assim como uma alta porcentagem no quesito inspiração e pouca porcentagem no quesito desestímulo. Isso foi observado pelo complexibilidade de alguns comandos.
131
A sua interface também foi considerada um tanto divergente, pois recebeu uma quantidade alta na questão quão entediante e a mesma quantidade na questão quanto a ser um pouco divertida. A conclusão foi tomada pelo alto índice de avaliadores que votaram em “pouco tédio”, classificando o jogo como entediante, mas mesmo assim teve um alto índice de marcações no quesito admirado e poucos em desprezo. Isso foi observado pelo fato dela também ter recebido bons pontos na questão quanto à inspiração.
Ela também foi considerada voltada para o público masculino, sendo considerada ativa, madura, extravagante (não-séria), modesta e original. A tristeza foi o sentimento considerado predominante nos jogadores ao olharem e classificarem a interface.
Em MGS, curiosamente os avaliadores sentiram-se no papel do personagem, semelhantemente ao jogo ICO, ao contrário do que se esperava (maior proximidade com Devil May Cry). Porém foi o jogo campeão em desinteresse pelo final da história, somente dois avaliadores gostariam de sabê-lo. Devil May Cry 3 (DMC):-
Este foi o segundo jogo com maior pontuação, chegando em 87 pontos dos 195 totais. (sendo o primeiro com 88). Após os preenchimentos houve uma entrevista com os avaliadores, que constataram que gostaram do jogo, porém, não pela interface ou pela história, mas sim pela velocidade da ação. Este jogo gerou uma imersão considerada “pequena” e tinha um alto índice de perda de atenção na atividade. Isso foi comentado pelos nas entrevistas. Recebeu notas altas na questão quanto à insatisfação, entendeu-se por isso o fato de ela ser confusa.
Quanto à atração e a repulsão, elas foram consideradas nulas, pois cada um dos cinco avaliados marcou um dos pontos da escala entre atração e repulsão, considerando isso um pouco do gosto de cada avaliador.
132
O fato de a interface gráfica ser carregada de informação, e o fato de interferir com o gosto pessoal de cada avaliador, gerou um alto índice de desestímulo nos jogadores.
A interface de DMC foi considerada masculina e ativa, entre neutra e madura, entre pouco extravagante e sofisticada, e mesmo assim comum. Os sentimentos causados ao explorar a interface ficaram entre sentimentos negativos como tristeza e raiva passando por tranqüilidade, mas parando em nulo, sendo esse o maior índice.
A percepção da interface quanto ao divertimento foi neutra, sendo que a maioria não se sentiu influenciada nesse aspecto. A admiração quanto a interface e desprezo também foi nula.
Outro fato curioso é que, em DMC a maioria das pessoas se sentiu “muito pouco” no papel do personagem, sendo que apenas uma se sentiu “muito”. Porém, a maioria dos avaliadores marcou “muito” na questão que indicava se gostaria de continuar jogando para saber o final da história. ICO :-
Já quanto a satisfação ao olhar, a interface ficou entre nulo e satisfeito. Considerou-se que pode ter sido pelo mesmo motivo anteriormente citado, gosto pessoal dos avaliadores.
Foi o jogo com maior pontuação, chegando em 88 pontos dos 195 totais. Foi percebido que este jogo foi o que gerou maior imersão nos avaliadores e também uma imersão mais rápida quando ocorrida a perda de imersão contínua. Foi um dos jogos com a maior pontuação em atratividade na interface, sendo que dois avaliadores não se sentiram atraídos ou repelidos pela interface, dois se sentiram atraídos e um sofreu pouca repulsão.
Quanto a entendimento e confusão na interface, o jogo gerou uma porcentagem alta de reconhecimento e pouca confusão.
Teve um senso maior de inspiração e admiração, talvez devido à natureza exótica do jogo e também por ser o jogo com o menor conteúdo informativo em tela, sendo somente os personagens e o cenário.
133
Também foi o jogo que gerou menos divertimento quanto a interface, ocasionando um alto índice de tédio nos jogadores, entendeu-se que isso pode ter ocorrido pelo fato de o jogo não informar muitas opções ao jogador, fazendo com que ele fique por conta própria, causando assim, o tédio.
Foi o jogo com maior admiração na interface, pois se entendeu que foi pela pouca informação em tela, que acabou por gerar um diferencial dos jogos de mesmo estilo, ocasionando essa curiosidade/admiração pela interface.
A interface de ICO foi considerada unissex e pouco ativa, não sendo nem infantil nem madura, nem séria nem extravagante, mas sim, modesta e original. As escolhas mais freqüentes ao explorar as áreas do jogo, foram Nulo, Calma e Tranqüilidade. Com isso, pode-se entender que o fato dos avaliadores marcarem essas 3 opções que possuem significados parecidos, é devido ao fato de o jogo apresentar características similares.
Outro fato curioso foi que, de cinco avaliados, dois não sentiram falta de menus ou barras de ajuda, guias, um sentiu “muito pouca” e os outros dois restantes sentiram uma necessidade “extrema”, e outro “muita”, respectivamente. ICO também gerou alta intensidade de envolvimento dos jogadores, se sentindo estimulados pela história, sendo que dos cinco avaliados, dois marcaram “extremo” e um “muito”, podendo ser isso um dos motivos de alto índice de identificação com o personagem e com a história. CONCLUSÃO
ICO é um jogo de extremos e por sua interface ser tão simples gerou um alto índice de satisfação para algumas pessoas enquanto que para outras gerou uma insatisfação. Por ter a interface simples gerou certo tipo de confusão, mas o curioso foi que a maioria das pessoas conseguia entender plenamente sem o uso de menus e informações.
O método híbrido se mostrou eficaz e acabou por se mostrar a melhor alternativa para esta avaliação, já que reunia quesitos de outros três métodos conhecidos e funcionais, alem de que tornou a avaliação mais pertinente, porém algumas dificuldades foram encontradas dentre elas encontrar avaliadores que pudessem disponibilizar três horas disponíveis para jogarem, como também uma forma exata e compacta de calcular a contabilização dos dados das avaliações. Com os resultados em mão concluiu-se que através de uma pesquisa, da aplicação dos questionários e de uma
134
pós-entrevista com os avaliadores, que os jogos com uma maior quantidade de informação em tela e com um alto índice de menus acabam por não influenciar demasiadamente a percepção da narrativa, porém, quando questionados sobre a imersão disseram que a quantidade de informação às vezes desviava a atenção um pouco no jogo o que acarretou a numa perda de imersão. Uma prova de que isso ocorreu é o fato de ICO ter recebido um alto índice de comentários quanto a imersão além de receber altas notas nesse quesito, além de quando entrevistados dizerem que quando perdiam a atenção do jogo, por algum motivo externo, em MGS e em DMC, ao voltarem ao jogo, se perdiam em telas tentando lembrar o que estavam fazendo, quanto estava a pontuação e o que tinham que fazer. Já em ICO, esse retorno era imediato. SUGESTÕES PARA TRABALHOS FUTUROS:
Este trabalho, embora tente demonstrar a influência das interfaces gráficas como fator que influencie o progresso e a imersão presentes na narrativa, não é capaz de demonstrar resultados conclusivos devido ao tamanho de sua pesquisa, mas consegue demonstrar que essa conexão existe, dependendo de pesquisas futuras nesse aspecto para que uma teoria mais sólida seja formada. REFERÊNCIAS BIBLIOGRÁFICAS [1] - BREYER, F., 2006. Avaliação de Usabilidade em Jogos: Desenvolvimento e Validação de Heurísticas de Usabilidade para Jogos, Universidade Federal de Pernambuco. [2] - CAILLOIS, R., 1958. Play and games. Illinois: Free Press of Glencoe. [3] - CHATMAN, S. B., 1978. Story and Discourse: Narrative Structure in Fiction and Film. Cornell University Press Ithaca, New York.
[6] - ENTERTAINMENT SOFTWARE ASSOCIATION, 2008. Industry Facts. [online] http://www.theesa.com/facts/index.asp [Acesso em junho de 2009]. [7] - FIELD, S., 2001. Manual do roteiro: os fundamentos do texto cinematográfico. Rio de Janeiro: Objetiva. [8] - GOSCIOLA, V., 2003. Roteiro para as novas mídias do game à TV interativa. São Paulo, SENAC São Paulo. [9] - HUIZINGA, J., 2000. Homo Ludens: o jogo como elemento da cultura. 4. ed. São Paulo: Perspectiva. [10] - JUUL. J.; The game, the player, the world: looking for a heart of gameness. In: Level up: digital games research conference proceedings. Utrecht University, 2003. http://www.jesperjuul.net/text/gameplayerworld/. Acessado em 28 de maio de 2009. [11] - LEITE, L., C., L. Jogos eletrônicos multi – plataforma. 2006. 253 f. Dissertação (Mestrado) – Programa de Pós-Graduação em Artes da PUC-Rio, PUC – Rio, Rio de Janeiro. [12] - MORRISON, M., 1994. Becoming a Computer Animator, Indianapolis, Howard W Sams. [13] - MURRAY, J. H., 2003. Hamlet no Holodeck: o futuro da narrativa no ciberespaço. São Paulo: Itaú Cultural: UNesp. [14] - NIELSEN, J., 2005. Heuristics for Use Interface Design, [online] http://www.useit.com/papers/heuristic/heuristic_list.html [Acesso em junho de 2009]. [15] - PIAGET, J., 1973. A formação do símbolo na criança. Rio de Janeiro: Zahar. [16] - ROUSE, R., 2001. Game Design: Theory & Practice. Wordware Publishing, Inc., Texas. [17] - PIRAUA, J., 2007. Por uma Estética Aplicada ao Design, 3o Congresso Internacional de Design da Informação, Curitiba
[4] - CRAWFORD, C., 1984. “The Art of Computer Game Design”, Osborne/McGraw-Hill, Berkeley, CA.
[18] - SCHUYTEMA, P., 2008. Design de games uma abordagem prática, São Paulo: Cengage Learning.
[5] - DUBIELA, R., 2008. Diretrizes Para Utilização de Narrativas Embutidas no Auxílio da Narrativa da História em Jogos Eletrônicos Informatizados , Universidade Federal do Paraná, Curitiba.
[19] - WATSON, D., 2004. Emotional Response Patterns and Sense of Presence during Video Games: Potential Criterion Variables for Game Design, ACM, New York.
135
Compreendendo dinâmicas de jogo: as esferas de interação dentro do framework Componentes-DinâmicasExperiências Bruno William Carvalho Bulhões Universidade Federal do Paraná - DeDesign Ed. Dom Pedro I, R. General Carneiro 460, Curitiba, PR brunobulhoes@adugestudio.com +55 41 9653 3274
Thiago de Souza Rodrigues Alves Universidade Federal do Paraná - DeDesign Ed. Dom Pedro I, R. General Carneiro 460, Curitiba, PR beto@adugestudio.com +55 41 9626 5302
Prof. Me. Rafael Dubiela Universidade Federal do Paraná - DeDesign Ed. Dom Pedro I, R. General Carneiro 460, Curitiba, PR rafaeldubiela@yahoo.com.br +55 41 8842 3123 RESUMO
Os estudos de design de jogos relacionados à área de dinâmicas de jogo possuem um aprofundamento deÞciente reßetindo-se na diÞculdade de se sustentar teorias a respeito do tema. Este artigo procura iniciar a correção deste problema. Com base no framework MDA e conceitos similares nós expandimos estes e fundamentamos nosso próprio framework o qual chamamos de ComponentesDin‰micas-Experiência (CDE). Com este framework conseguimos visualizar a estrutura de esferas de interação, estruturas formais de compreensão de dinâmicas de jogo a partir das interações dos seus componentes. Com este artigo torna-se poss’vel iniciar uma estruturaç‹o mais deÞnida de dinâmicas de jogo, as quais podem ser compreendidas e expandidas a partir do que apresentamos neste texto, contribuindo com o estudo e prática do design de jogos. Palavras Chave
Design de jogos, frameworks, interação, mecânicas, din‰micas, componentes-din‰micas-experiências (CDE). ClassiÞcaç‹o ACM
A.m. General Literature: Miscellaneous.
136
INTRODUÇÃO
Para estudar e desenvolver jogos existem diversas abordagens e caracterizações que auxiliam os processos. Um deles é a caracterização de Zimmerman e Salen (2004) [1] que estrutura os jogos em três níveis, do formal ao abstrato: rules, play e culture. Ele tem validade como ferramenta de investigação, porém não tem a precisão necessária para aplicação pratica de design de jogos. De forma similar, existe o framework1 Mechanics, Dynamics e Aestethics (MDA) de Hunicke et al (2004) [2] que defende uma abordagem do estudo e pratica do design de jogos nesses três níveis, do formal ao abstrato. O framework MDA tem grande funcionalidade pratica, e por sua vez não tem a profundidade e abrangência necessária para estruturas teóricas mais complexas. No entanto, este framework foi o ponto de partida para o desenvolvimento do nosso próprio, chamado Componentes, Dinâmicas e Experiência (CDE). No framework CDE, componentes lidam com as unidades que compõem o sistema. As regras, mecânicas, elementos sensoriais, a narrativa e a interface do jogo são exemplos de componentes. Componentes formam o nível formal do framework. Dinâmicas emergem das interações entre os componentes do jogo entre si e com os jogadores que utilizam o sistema de jogo. Portanto, emergem quando um ou mais jogadores participam do sistema. Dinâmicas formam o nível intermediário do framework. Experiência é o último nível, o qual diz respeito às respostas sensoriais dos jogadores ao participarem de um jogo. Experiência forma o nível abstrato do framework. De modo similar ao MDA, o CDE estrutura-se de forma que os componentes, durante o funcionamento do jogo, contribuem para a emergência de dinâmicas de jogo, as quais geram respostas sensoriais (experiência) no jogador. O objetivo do framework é auxiliar o estudo e a pratica do design de jogos ao encorajar os designers a visualizar a relação de causa-efeito que existe entre cada componente de um jogo e a experiência que os jogadores têm ao jogar. COMPONENTES
É o nível do framework que contempla as unidades de informação que compõem um determinado jogo. Os componentes existem de maneira independente ao andamento do jogo. É possível dividir os componentes em duas categorias, principais e secundários, sendo os componentes principais os componentes necessários para a existência do jogo e os secundários os componentes que auxiliam na formação do jogo e na interpretação deste por parte dos jogadores. 1
Componentes Principais Regras
Podemos deÞnir regras como um conjunto de premissas sistêmicas que ditam o que existe e o que é possível ou não dentro do universo do jogo. As regras são o principal componente de um jogo no sentido em que sem elas o jogo não existe. Com base no framework de Järvinen (2003) [3] e a deÞniç‹o de sistemas de Salen e Zimmerman (2004) [1], concluímos que regras além de delimitar o contexto do jogo, determinam a existência e função de todos os outros componentes, inclusive das mecânicas. Regras determinam:
¥ Quais s‹o os objetos e outros componentes que existem dentro do universo do jogo. Por objetos compreende-se quaisquer entidades que componham o jogo. As regras também determinam os atributos e características desses objetos. Podemos citar como exemplo o jogo de Xadrez onde as regras delimitam quais são as peças, quantas peças existem bem como seus atributos de movimentação. ¥ O espaço de possibilidades do jogo. Salen e Zimmerman (2004) [1] deÞnem espaço de possibilidades como todas as ações e estados possíveis que podem ser conseguidos dentro de um determinado jogo. As regras determinam este espaço criando um contexto e um ßuxo de jogo. Continuando o exemplo do Xadrez, o espaço de possibilidades deste são todas as jogadas possíveis a cada turno de jogo bem como todas as posições de peças possíveis dentro de uma partida. ¥ Condiç›es de in’cio e Þm de jogo, bem como o progresso deste, delimitando o contexto de jogo. No caso do Xadrez o jogo inicia-se com o jogador que controla as peças brancas dentro de uma posição determinada do tabuleiro e encerrase com um xeque-mate, desistência e empates técnicos. ¥ Relaç›es entre os objetos do jogo de acordo com seus atributos, dentro do espaço de possibilidades. Voltando ao exemplo do Xadrez a única peça que pode ser promovida é o peão limitando esta característica às outras peças. Mecânicas de jogo
São os componentes que alteram diretamente o estado do jogo. Sicart (2008)[4] classiÞca mec‰nicas como mŽtodos invocado por agentes, ou seja, ações executadas por agentes que exercem alguma inßuência no jogo. Sem mec‰nicas um jogo não existiria, pois sem elas os jogadores seriam impossibilitados de exercerem inßuencia sobre o seu resultado. O conjunto completo de todas as mecânicas em um determinado jogo pode ser chamado de interface de
Estrutura conceitual simplificada com o objetivo de solucionar ou melhor entender assuntos complexos.
137
jogabilidade, contrastando com a interface de usabilidade que descrevemos como um componente secundário mais adiante. ClassiÞcamos Mec‰nicas em dois atributos: relev‰ncia, com base na classiÞcaç‹o de Sicart (2008) [4], e tipo. Relevância:
¥ mecânicas centrais - s‹o usadas por um agente de jogo de maneira relevante, obrigatória e recorrente para atingir o estado desejado de Þm de jogo. Por exemplo, no Super Mario Bros. as mec‰nicas centrais s‹o andar e pular. Estas mec‰nicas s‹o suÞcientes e obrigat—rias para concluir o jogo.
Bros. n‹o existe exemplo de mec‰nicas acess—rias, mas se o personagem tivesse uma mec‰nica onde ele mostrasse uma careta para a tela, isto seria um exemplo de mec‰nica acess—ria. Tipo:
¥ mec‰nicas ativas - mec‰nicas nas quais o agente deve oferecer input para que estas sejam realizadas. No jogo Final Fantasy XII (Square Enix, 2006) a mec‰nica Attack pode ser acionada pelo jogador a partir de um menu contextual, caracterizando-a como uma mec‰nica ativa.
¥ mecânicas primárias - s‹o mec‰nicas de auxilio ˆs centrais podendo ser usadas recorrentemente a Þm de atingir o estado desejado de Þm de jogo. No exemplo de Super Mario Bros. (Nintendo, 1985) a mec‰nica de corrida Ž uma mec‰nica prim‡ria que pode utilizada recorrentemente para auxiliar a conclus‹o do jogo mas n‹o Ž obrigat—ria.
Figura 2. Em Final Fantasy XII as mecânicas ativas podem ter sua ativação programada para se tornarem passivas.
Figura 1. Super Mario Bros. é um jogo que se caracteriza por sua simplicidade mecânica.
¥ mecânicas secundárias - s‹o mec‰nicas que n‹o auxiliam diretamente o a atingir o resultado desejado de Þnal de jogo, ou s— se apresentam ocasionalmente, ou precisam ser combinadas com mec‰nicas prim‡rias. Continuando o exemplo anterior, atirar bolas de fogo Ž uma mec‰nica secund‡ria em Super Mario Bros. pois seu uso Ž ocasional e contextual. ¥ mecânicas acessórias - s‹o mec‰nicas que n‹o afetam o resultado do jogo de forma relevante. No Super Mario
¥ mec‰nicas passivas - mec‰nicas que independem de input do agente para serem realizadas. Estas mec‰nicas s‹o acionadas pelas regras em situaç›es projetadas. No mesmo Final Fantasy XII um gambit 2 programa o personagem a utilizar a mec‰nica Attack automaticamente dentro de um contexto caracteriza esta mec‰nica como uma mec‰nica passiva. Vale portanto ressaltar que o tipo da mec‰nica n‹o esta atrelada a ela em si e sim ao contexto do seu uso. Componentes Secundários Elementos Sensoriais
S‹o os elementos que apelam aos sentidos (especialmente visuais e auditivos) para traduzir aos jogadores os outros componentes. As regras e mec‰nicas tendem a ser abstratas em si mesmas e portanto necessitam de elementos sensoriais associados para serem compreendidas por jogadores humanos. Os elementos sensoriais s‹o an‡logos ao alfabeto e a linguagem enquanto os outros componentes s‹o an‡logos ˆ mensagem em si. Assets visuais (elementos
Um sistema de programação contextual de ações dos personagens. É utilizado para reduzir a carga de esforço do jogador ao fazer os personagens executarem ações automaticamente. 2
138
gr‡Þcos e animaç‹o) e sonoros (mœsica e efeitos sonoros) em jogos digitais bem como o formato e cores das peças de xadrez s‹o exemplos de elementos sensoriais. Narrativa
Jogos podem ou n‹o apresentar narrativas. Existem jogos focados apenas na experiência de jogo, enquanto outros jogos apresentam seqŸências de eventos que pode ser considerada uma hist—ria. Consideramos narrativa o componente que delimita a premissa que justiÞca o jogo, sendo essa abstrata ou n‹o. Pode-se aÞrmar tambŽm que narrativa contribui com o universo Þccional que Jesper Juul (2005) [5] diz estar presente em todos os jogos, e que faz a contra-partida com as regras reais destes. No ‰mbito da estrutura dos componentes neste framework, a narrativa em conjunto com os elementos sensoriais formariam este universo Þccional. Um exemplo de jogo focado apenas na experiência de jogo seria Tetris (Alexei Pajitnov, 1984), enquanto um exemplo de jogo com uma seqŸência de eventos que pode ser considerado uma hist—ria seria Super Mario Bros.. Uma premissa abstrata seria encontrada no jogo Gravitation (Jason Rohrer, 2008) onde infere-se que o personagem principal passa por diÞculdades na relaç‹o fam’lia-trabalho. Em contrapartida um exemplo de premissa concreta seria o j‡ citado Final Fantasy XII onde a historia do jogo Ž apresentada claramente utilizando tŽcnicas narrativas (di‡logos, seqŸências cinem‡ticas, etc).
principais. O uso de Heads Up Displays3 (HUD) em jogos eletr™nicos Ž um exemplo de interface de usabilidade. Outro exemplo pode ser encontrado em vers›es digitais de Xadrez onde h‡ a adiç‹o de objetos de interface (geralmente gr‡Þcos) que auxiliam o jogador a observar o movimento poss’vel das peças. DINÂMICAS
No framework CDE, o n’vel de Din‰micas diz respeito ˆs dinâmicas de jogo: o que as geram, como elas s‹o classiÞcadas e como elas se comportam. As dinâmicas de jogo emergem das esferas de interação. Ressalta-se que as dinâmicas de jogo existem apenas quando a inst‰ncia (uma partida) de um determinado jogo est‡ em seu estado ativo. Ou seja, dinâmicas de jogo surgem apenas quando um ou mais jogadores jogam um determinado jogo. Interação
Antes de entrar na descriç‹o de esferas de interação Ž oportuno deÞnir o pr—prio conceito de interaç‹o. Na l’ngua inglesa o conceito que mais se aproxima do que queremos dizer a respeito de interaç‹o Ž o interplay: 1. o efeito que duas ou mais coisas têm umas com as outras. [6] 1. relaç‹o, aç‹o ou inßuência rec’proca. 2. exercer inßuência em algo. [7] No entanto n‹o h‡ um equivalente direto para esse termo na l’ngua portuguesa, mas analisando as deÞniç›es de interplay podemos concluir que Ž um conceito an‡logo ˆ interaç‹o que signiÞca: 1. Inßuência rec’proca. [8] Portanto, o conceito de interaç‹o que utilizaremos Ž: aç‹o, relaç‹o e/ou inßuencia reciproca entre dois agentes ou objetos. Esferas de Interação
S‹o os ingredientes que geram as dinâmicas de jogo. Esferas de interação representam a interaç‹o dos componentes de jogo entre si, dos componentes com o jogador, ou entre os jogadores. N—s dividimos estas esferas em três categorias: superf’cie, emergente e de suporte. Figura 3. Gravitation é um exemplo de premissa abstrata. Interface de Usabilidade
ƒ a interface do jogo que preocupa-se em gerar uma experiência de uso mais eÞciente aos jogadores e n‹o inßuencia diretamente o jogo, seu estado e os componentes
Interações de superfície
S‹o as primeiras interaç›es a serem percebidas/sentidas por um usu‡rio/jogador e, portanto, s‹o chamadas de interaç›es de superf’cie. Elas consistem na interaç‹o direta do jogador
3 Termo emprestado da engenharia militar, onde aviões e outros veículos precisam informar o piloto sem que este precise desviar o olhar da ação dentro de uma situação de combate. Nos jogos digitais os HUDs têm exatemente a mesma função, informar o usuário sem que este precise tirar o olhar da ação ou interrompê-la.
139
com os principais componentes do jogo (mecânicas e regras) e com outros jogadores. Do Jogador com as Regras
A interpretação que o jogador infere no sistema do jogo (regras), a criação de regras pelo jogador que não façam parte do sistema do jogo mas inßuenciam o andamento deste, bem como a customizaç‹o e a ßexibilidade que as regras permitem ao jogador manipular são interações que este tem com as regras de um determinado jogo.
Exemplos: Mockball, x-ray climb, inÞnite bomb jump são exemplos de interaç›es inventivas do jogador com as mec‰nicas de Super Metroid (Nintendo, 1994); Utilizar o casco verde como escudo no Super Mario Kart (Nintendo, 1992) tambŽm Ž um exemplo de uma interaç‹o inventiva por parte do jogador.
Exemplos: Gambitos de Xadrez4 são interpretação de regras que, aparentemente, vão contra os objetivos do jogo, mas com o conhecimento superior de um jogador podem se tornar estratŽgias eÞcientes; O fair play em uma partida de Futebol é uma regra criada por jogadores com intuito pol’tico que gera uma situaç‹o amistosa na disputa; Planejamento do level up dos personagens no Final Fantasy X (Squaresoft, 2001) Ž uma manipulaç‹o direta do jogador sobre as regras do jogo, neste caso os atributos dos personagens.
Figura 5. Super Metroid permite diversos usos inventivos de mecânicas. Do Jogador com outros Jogadores
As interações entre jogadores surgem a partir do contato entre os agentes, que podem ou não ser humanos, ao jogar uma partida de um jogo que possibilite múltiplos jogadores. Podem haver interações a nível social, interações psicológicas e interações de jogadores humanos com jogadores artiÞciais.
Figura 4. Em Final Fantasy X o jogador pode manipular as regras que regem os atributos e habilidades dos personagens. Do Jogador com as Mecânicas
Pode ser considerada a simples execuç‹o das mec‰nicas pelo jogador. Vendo de uma perspectiva mais profunda pode ser considerada a utilização emergente dessas mecânicas, isto é, após a interpretação e domínio da mecânica pelo jogador, este a utiliza com um objetivo além do que foi proposto para o jogo pelo designer.
Exemplos: Partidas amistosas de Super Smash Bros. (HAL Labs., 1999) onde os jogadores est‹o mais interessados na atividade social do que na competiç‹o; Jogos mentais em partidas competitivas de jogos de luta; Luck manipulation5 de geradores de números aleatórios, presentes na maioria dos jogos digitais.
Jogada onde o jogador oferece uma peça para adquirir em troca uma posição mais vantajosa no tabuleiro que não é óbvia ou aparente no momento em que é realizada. 4
Também chamado de luck abuse ou randomness abuse que é a exploração consciente pelos jogadores dos algoritmos de geração de números aleatórios a fim de obter resultados previsíveis ao invés de aleatórios. Isto é possível por que na computação em jogos os números aleatórios são na realidade sequências pseudoaleatórias onde os números são obtidos através de operações matemáticas pré-estabelecidas. [13]
5
140
regra; Triangularidade mec‰nica presente principalmente em jogos de luta em que defender supera atacar, que supera agarrar, que, por sua vez, supera defender é um exemplo de como regras interagem com mecânicas. Interações de Mecânicas com Mecânicas
A diferença da relação Mecânicas com Regras para Mecânicas com Mecânicas está na perspectiva da utilização das mecânicas durante o jogo e a relação entre elas. Há interação entre as mecânicas a partir do momento em que uma mecânica altera, permite ou proíbe a exerção de outras mecânicas.
Figura 6. Mega Man 2 é um jogo onde as ações dos inimigos podem ser manipuladas através de técnicas de luck abuse. Interações emergentes
São as interações que ocorrem no plano de fundo do jogo entre seus dois componentes principais (mecânicas e regras) e emergem durante a instância de jogo gerando uma série dinâmicas de jogo. Estas interações transformam-se nas principais dinâmicas de jogo, aquelas cujo os comportamentos geram o signiÞcado do jogo. Interações de Regras com Regras
Primeiramente a interação entre regras se dá quando duas regras geram uma terceira regra, quando regras circunstanciais afetam a inßuência de outras regras, ou quando existem regras que demandam sub-regras que juntas formam a premissa de uma regra maior. Exemplos: Resposta dinâmica de velocidade máxima em jogos de corrida, em que os retardat‡rios têm a velocidade m‡xima aumentada e os l’deres têm sua velocidade m‡xima reduzida, a Þm de aumentar a dramaticidade; Contraste de regras entre as magias elementais de Final Fantasy X, em que fogo e gelo se opõem mutuamente, assim como água e eletricidade; Gravidade, atrito e velocidade s‹o regras por si só e se complementam, através de suas interações, formando um sistema de física. Interações de Regras com Mecânicas
Toda mecânica é uma interação com uma regra no momento em que é exercida, uma vez que as mecânicas são fundamentadas pelas regras. Alem disso existem mecânicas cujo uso afeta diretamente as regras. Quando uma regra determina a eÞc‡cia de uma mec‰nica sobre outra, tambŽm se caracteriza interação entre mecânicas e regras. Exemplos: A habilidade Armor Break em Final Fantasy X é um exemplo de mec‰nica que inßuencia o estado de uma
Exemplos: A mecânica de charge shot em Super Metroid, combinada com pulo, que a princ’pio n‹o inßige dano, modiÞca a mec‰nica de pulo gerando o pulo chamado de pseudo-screwattack, capaz de inßigir dano nos inimigos; A impossibilidade de alterar a direção do pulo do personagem Mario em Super Mario Bros. surge da interação da mecânica correr/mover-se com a mecânica de pulo. Interações de suporte
São as interações que envolvem os componentes secundários do jogo (elementos sensoriais, interface de usabilidade e narrativa). Estas interações são facultativas, pois jogos podem não apresentar um ou mais componentes secundários, muito embora estas interações não sejam menos importantes quando existentes. As interações de suporte são capazes de gerar uma série de novas interpretações que em conjunto com as dinâmicas das interaç›es emergentes afetam a ocorrência das interaç›es de superf’cie gerando a experiência de jogo como um todo. Cada nível de interação de suporte representa o tratamento das informações do sistema vistos sob diferentes perspectivas: das regras, das mecânicas e do jogador. Das Regras
Sob a perspectiva do sistema do jogo, são as regras que delimitam a atuação da narrativa, dos elementos sensoriais e da interface como agentes de informação no sistema do jogo. Regras determinam: ¥ os atributos dos elementos sensoriais, o que são e quais suas funções tanto como contribuintes de mecânicas de jogo, quanto agentes de informação. ¥ o quanto cada elemento da interface de usabilidade informa o jogador, inßuenciando a forma com que as informações são interpretadas. ¥ quais partes da narrativa estarão presentes no jogo bem como o ßuxo da desta durante o jogo.
141
Das Mecânicas
Sob a perspectiva do jogo em andamento, elementos sensoriais, narrativa e interface podem servir como componentes auxiliares às mecânicas. Estes componentes representam de maneira concreta elementos abstratos (mec‰nicas), agindo como um reforço ret—rico simpliÞcado. Os elementos sensoriais podem ser funcionalmente adequados a Þm de complementar os signiÞcados de uma mecânica. Por exemplo, a animação ofegante e debilitada do personagem Ico (SCEI, 2001) no jogo homônimo, quando ele está com pouca saúde. A interface apresenta quais são as mecânicas disponíveis em um determinado estado de jogo. O destaque nos quadrantes em que cada peça pode se movimentar em uma partida de Advance Wars (Intelligent Systems, 2001) pode servir como exemplo. A narrativa do jogo pode ser reforçada pelas mecânicas, bem como ser representada apenas por mecânicas. Em Gravitation as mecânicas de interação com a garota, a coleta de estrelas e as mecânicas de manipulação dos blocos de gelo são o que criam a narrativa do jogo. Dos Jogadores
Todos os elementos do jogo representam diferentes informações, podendo ser unidades individuais de informação ou unidades de informação que complementam outras. Para que essas informações cumpram um papel relevante elas devem ser interpretadas pelo jogador. Os componentes secundários podem facilitar a interpretação dos componentes principais, que são os mais relevantes na transmissão da mensagem imbuída ao jogo. Alguns designers de jogos, como Jonathan Blow (2008) [9], Jason Rohrer (2008) [10], Ian Bogost (2007) [11] e nós mesmos, compartilhamos a opinião de que regras e mecânicas são os componentes principais na transmissão da mensagem dos jogos. Esse é apenas um tipo de abordagem. Existe uma outra visão [12] na qual os componentes que consideramos principais são apenas um recurso (ou até mesmo um impasse) para se atingir a plenitude dos elementos sensoriais e narrativa. O jogador interpreta as informações contidas nos elementos sensoriais através de estímulos visuais e sonoros, que facilitam o processo de compreensão do jogo tanto em aspectos gerais (contexto do jogo), quanto nos aspectos espec’Þcos (interpretaç‹o de uma regra ou uma mec‰nica). Pode-se citar como exemplo a aparência corrompida do protagonista Wander à medida que o jogo progride em Shadow of The Colossus (SCEI, 2005).
A interface de usabilidade viabiliza o acesso a diversas informações para o jogador. Por exemplo a elaboração de uma estratégia por parte do jogador a partir da interpretação dos quadrantes nos quais uma unidade pode se movimentar numa partida de Advance Wars. O jogador entra em contato com a narrativa do jogo e a interpreta, adquirindo informações sobre o tema, o enredo, ou até os objetivos do jogo. Um exemplo disso seria a seqüência cinemática nas ruínas de Zanarkand no jogo Final Fantasy X. CONCLUSÃO
Neste artigo formalizamos uma parte do framework CDE expandindo o framework MDA ao torná-lo menos restrito e compatível com as necessidades de um estudo mais aprofundado do design de jogos. Acreditamos que as esferas de interação formuladas neste texto formam uma estrutura de compreensão mais clara de como as relações entre os componentes de jogos transformam-se em dinâmicas. Esta estrutura é uma contribuição na organização e entendimento de futuros trabalhos na área de dinâmicas de jogo. O framework e a própria estrutura ainda necessitam de melhorias. Mesmo assim, com a compreensão adicional gerada pelo presente artigo é possível estruturar novos conceitos, bem como reorganizar conceitos prévios dentro do estudo do design de jogos de uma maneira mais coerente. AGRADECIMENTOS
Gostaríamos de agradecer nossos companheiros de trabalho, Ingrid Skare e Mauricio Perin que auxiliaram o desenvolvimento deste artigo com apoio moral e revisões. Também gostaríamos de agradecer nosso professor e orientador Prof. Me. Rafael Dubiela que nos apresentou ao evento e indicou a oportunidade de publicação do artigo bem como nos desaÞou a desenvolver este trabalho com o máximo esforço que poderíamos exercer. REFERÊNCIAS
1. Zimmerman, E. and Salen, K. Rules of Play: Game Design Fundamentals, The MIT Press, Cambridge, 2004. 2. Hunicke, R., Le Blanc, M. and Zubek, R. MDA: a formal approach to game design and game research. Proc. GDC, San Jose, 2004. 3. Järvinen, A. Making and breaking games: a typology of rules. Proc. Level Up Conference, 2003. 4. Sicart, M. DeÞning game mechanics. Game studies vol. 8, iss. 2, 2008. http://gamestudies.org/0802/articles/ sicart 5. Juul, J. Half-real: video games between real rules and Þctional worlds. The MIT Press, Cambridge, 2005.
142
6. Cambridge Dictionary. http://dictionary.cambridge.org/ deÞne.asp?key=41547&amp;dict=CALD
13. TASVideos. Luck Manipulation. http://tasvideos.org/ LuckManipulation.html
7. Dictionary.com. http://dictionary.reference.com/browse/ interplay?jss=0
LUDOGRAFIA
8. Dicion‡rio AurŽlio. http:// www.dicionariodoaurelio.com/dicionario.php? P=Interacao
¥ Nintendo (1994). Super Metroid (Super Nintendo Entertainment System).
9. Blow, J. Fundamental conßicts in contemporary game design. MIGS, Montreal, 2008. http://braid-game.com/ news/?p=385 10.Rohrer, J. The Game Design of Art. The Escapist Magazine, 2008. http://www.escapistmagazine.com/ articles/view/issues/issue_155/4987-The-Game-Designof-Art 11.Bogost, I. Persuasive Games: the expressive power of videogames. The MIT Press, Cambridge, 2007. 12.Harvey, A. and Samyn, M. Realtime Art Manifesto. http://tale-of-tales.com/tales/RAM.html. 2006.
¥ Squaresoft (2001). Final Fantasy X (Playstation 2).
¥ Nintendo (1992). Super Mario Kart (Super Nintendo Entertainment System). ¥ HAL Labs. (1999). Super Smash Bros (Nintendo 64). ¥ Nintendo (1985). Super Mario Bros (Nintendo Entertainment System). ¥ SCEI (2001). ICO (Playstation 2).
¥ Intelligent Systems (2001). Advance Wars (Game Boy Advance). ¥ Jason Rohrer (2008). Gravitation (PC).
¥ SCEI (2005). Shadow of the Colossus (Playstation 2).
¥ Square Enix (2006). Final Fantasy XII (Playstation 2). ¥ Alexei Pajitnov (1984). Tetris (Eletronika 60).
143
Violent Video Games: Changes in non-verbal behavior and short-term effects on valence and arousal Sophia Atzeni, Ting-Ray Chang, Aljosja Jacobs, Paulo Melo, and Dirk Verhagen Eindhoven University of Technology (TU/e) User-System Interaction Programme s.e.atzeni;t.j.chang;a.jacobs;p.h.d.fonseca.melo;d.verhagen{@tue.nl} ABSTRACT
Video gaming researchers have already studied the effects of violent video games on gamers’ behavior. The present study investigated gamers’ non-verbal behavior and short term effects during and shortly after playing violent video games. The research included three main phases: 1) preselecting violent versus non-violent video games; 2) setting-up an experiment with 20 male college students playing a pair of video games (one violent and one nonviolent game) on Nintendo Wii. After playing each game, participants’ degree of violence and arousal were measured by using the International Affective Picture System (IAPS) and the results were compared; 3) asking another group of 17 students to distinguish each gamer’s film clips of playing violent versus non-violent video games. While IAPS results showed that gamers’ degree of violence and arousal did not change significantly after a short experience of playing violent video game, gamers’ non-verbal behavior (facial expression) was 78% correctly distinguished by observers. Limitations are reported and further work is proposed. Author Keywords
Violent video game, non-verbal behavior, Nintendo Wii, gamers’ experience. ACM Classification Keywords
J.4. Social and behavioral sciences: Psychology. INTRODUCTION
The influence of media violence on adolescents and children’s behavior has been a topic of discussion for a few decades. The majority of research was carried out to find a causal relationship between TV violence and aggressive behavior [1]. The sharp rise in availability and popularity of violent and realistic video games stirred up this discussion. Scientists also expected that violent video games cause
changes in people’s behavior [1] [2]. However, playing video games is different from watching violent television. When playing video games, there is more active participation and involvement [3]. Players receive rewards, identify with the aggressors, and repeat aggressive scripts [4]. Research that confirms or disconfirms the causal relationship of playing violent video games and aggressive behavior is very sparse. Many theories have proposed an explanation for the influence of media violence on people’s behavior. For instance, according to the excitation transfer theory, arousal from media exposure facilitates the response of an individual to a certain stimulus of provocation [5]. This theory also supports the idea that highly violent games provide the necessary arousal for aggressive reactions in real life. The media priming theory, on the other hand, states that specific processed information influences attitudes, norms, and behaviors. Therefore, exposure to violence in video games would foster the availability of aggressive schemata, which may be used for processing information in other situations than playing games [5] [6]. A combination of theories gave rise to the General Aggression Model (GAM), which can be applied to the effect of short-term and long-term exposure to violent game [7]. This model states that personal factors (e.g. knowledge structures and trait aggression) and situational factors (e.g. provocation and exposure to violent games) can influence aggressive behavior. Cognitive, affective and physiological arousal can affect decision processes which influence the behavior [4]. Due to playing violent video games the physiological arousal increases, which can lead to more aggression [3] [6] [8] [9]. Additionally, participant’s non-verbal behavior has been an issue poorly explored in this field so far. Even in the psychological field in general the usage of questionnaires and other tools of self-assessment is still a very strong paradigm. The adoption of observation by a third party has been a choice in some studies in order to adopt a more objective way to measure human behavior [10]. In the present work, we used the judgment by a third part as the way to evaluate players’ non-verbal reactions to playing video games.
144
The different approaches adopted in this field and the different methodologies used have led to inconsistent and diverse conclusions. Firstly, there is no clear guideline which games to compare. Games have confounding variables (e.g. difficulty, excitement, and frustration) that influence aggression related behavior. Secondly, the methods used to measure aggression are questionable and not standardized. These methods range from extensive nonstandardized questionnaires to hitting a bobo-doll [11]. Thirdly, the selection of dependent variables is not often supported by a general theoretical framework, which should be used to base this choice on. Finally, there are often conclusions about causal relationships using studies designed to find correlations, rather than actual causes [12]. In the present research we studied two main questions. First, is there a difference in the affective state (i.e. arousal and valence levels) after playing violent video games as opposed to non-violent video games for a short time? Second, is there an observable difference in non-verbal behavior when playing violent video games as opposed to those playing non-violent video games? To answer these questions, we went through three stages: game selection, measuring short-term effects (first experiment), and video observation (second experiment). The goal of the game-selection stage was to select a nonviolent and violent video game in an unbiased way. The two games had to differentiate on aggression and not on any confounding variables. In the second stage we conducted an experiment in which participants were filmed playing the two games previously selected. The participant’s affective state was measured after each game using standardized tools. During the last stage, participants judged if participants were playing violent or non-violent video games, using non-verbal behavior as a clue. The stages were designed in such a way that the output of one experiment was a validated component that was used in the next experiment. Special attention was paid to the experiment methodology in order to build a strong contribution to the field which suffers a lack of precision and consistency as already discussed. The following sections describe the phases carried out during the whole process of this study. First, the pre-test used to select the games is explained, followed by an explanation of experiments 1 and 2. Each description of experiment is accompanied by its respective results and discussion. Finally, a conclusion and the future work are presented regarding both experiments. GAME SELECTION
The goal of the pre-test was to let participants compare different video games selected by two experienced gamers. The selected video games are comparable in different dimensions, such as excitement, difficulty, frustration, aggressiveness, learning and controlling the game [3]. To compare the violent video game condition to the nonviolent video game condition, the only dimension that had
to vary between the conditions was the aggressiveness of the selected games. The game difficulty, learning time, frustration level, how to control the game, and excitement level between the two games used in the experiment had to be comparable, as they might have confounding influence on the dependent variables later on. Participants
Before the pre-test, two experienced gamers were asked to suggest a set of six games conforming to the aforementioned properties. For the pre-test itself a total of 10 interaction designers (5 males and 5 females) were recruited from the Industrial Design department of Eindhoven University of Technology (TU/e). The only requirement during the recruitment was that they had never played any of the games used in this study. Procedure
The participant was introduced to the study and asked to evaluate three games by giving their honest opinion. The games were randomly assigned to the participants. The experimenter explained how to play the game and the participants played each game during about 10 minutes. After each game, participants scored the games on five different dimensions. Materials
These six games were used in the pre-test: • • • • • •
Non-violent computer game: Spore Creature phase – herbivore; Violent computer game: Spore Creature phase – carnivore; Non-violent computer game: Spore Tide Pool phase – herbivore; Violent computer game: Spore Tide Pool phase – carnivore; Non-violent Wii game: Link’s Crossbow Training; and Violent Wii game: The House of the Dead (HotD): Overkill.
The questionnaire used in this phase consisted of five items: level of excitement, difficulty, aggressiveness, frustration and learning. Participants had to rate these dimensions on a five-point Likert scale (i.e. from very low to very high) for each game. Analysis
A t-test analysis was performed comparing the average rate obtained by each game for those five aspects according to the participants’ evaluation. Result
The results showed that HotD is the most violent game (scoring 3.4) among the games evaluated and Link’s Crossbow Training is the least violent (scoring 0.8). In terms of violence there was a significant difference (p<.01) between these two games. For the other variables measured, those two games were rated very similar, as expected. In
145
general, both games were considered exciting, easy to use and learn, and not frustrating. Besides the dimensions asked in the questionnaire, there were two more requirements. Firstly, the games should be in similar platform, which in this case was on the Nintendo Wii. Secondly, the user interaction should be similar. In this case, they are both shooting games (i.e. pointing the Wii mode to the target and hit a key to shoot). EXPERIMENT 1: MEASURING SHORT-TERM EFFECTS
In this experiment, playing violent games was compared to playing non-violent game. The main focus of this experiment was to look at the after effect. By this we mean if there was a change in the judgment of emotional pictures after playing a violent game for a short time. In addition, video material was gathered as stimuli for the second experiment.
Training (see figure 1) is a simple game where the player is challenged to hit targets on the screen as fast as possible by aiming the Wii remote control at a correct angle. Players have one minute to hit as many targets as possible, with successive hits giving exponentially increasing points. We used level 1-1, 3-1, and 3-2. Our criteria for selecting these levels was that they contained inanimate targets (bulls-eyes) and fruity balloons to shoot at, while still moving through the level, simulating the pace of HotD. The player is ‘onrails’ meaning that the only thing they had to do is to aim at the screen while the game handles the movement and progression through the level.
Participants
A total of 20 male participants recruited among first and second year TU/e students took part in this study. Their mean age was 19.45 years old (SD = 1.28, range 18-23). Before the experiment, the participants signed a consent form that stated that the recordings could be used for research purposes and that they were aware there could be shocking images during the experiment. Design
This experiment was a 2 (games: violent vs. non-violent) x 4 (pictures: low valence/low arousal vs. low valence/high arousal vs. high valence/low arousal vs. high valence/high arousal) within-subjects design. In total the participant played two games; a violent and a non-violent game. The pictures of IAPS were rated in terms of valence and arousal, which were the dependent variables. The order of the games was counterbalanced. Procedure
The experiment was conducted in a simulated living room at the TU/e. The experiment started with the participant reading and signing the consent form. The experimenter explained the first game and told them to feel at home and not to have any concerns in terms of performance or time spent on the game. After playing 10 minutes, the video game was switched off and the participant was invited to perform a picture judgment task. The participants had to rate how they felt in terms of valence and arousal when viewing a series of pictures (from the IAPS). After the judgment task, the participant watched a five minute underwater movie to neutralize their mood [10]. Then the second game was introduced to the participant, who played it for ten minutes and again different IAPS pictures were rated. Finally, a game experience questionnaire and an aggression questionnaire [13] had to be filled in. The participant was debriefed and received a compensation for participating. Materials
Two Nintendo Wii games were used for this experiment: Link’s Crossbow Training and HotD. Link’s Crossbow
Figure 1. Screenshot Link’s Crossbow Training
HotD (see figure 2) is a game designed to look like a grind core movie. It contains very graphic depictions of violence, including exploding heads, decapitations, removing limbs and explosions of blood. The story sets the player in a town infected by human-like mutants and partners the player up with a constantly swearing, politically incorrect detective. During the game the player has to shoot mutants coming towards him, with successive hits granting the player a higher score. The game’s main challenge is to get high scores. The mutants move very slowly and are usually very easy to dispatch. This game is also ‘on-rails’.
Figure 2. Screenshot of HotD.
The IAPS is a set of ‘standardized, emotionally-evocative, internationally accessible, color photographs that includes contents across a wide range of semantic categories’ [14].
146
The goal of using the IAPS was to measure the participantsâ&#x20AC;&#x2122; judgment of emotional pictures after each game. For each condition, the participant was asked to rate 40 pictures on valence and arousal. The 40 IAPS pictures were divided into four quadrants: low valence/low arousal, high valence/high arousal, high valence/low arousal, high valence/high arousal [14]. These pictures were shown on a laptop screen and the participant could indicate on a 7-point Likert scale how they felt while watching the picture in terms of their level of valence (i.e. from unhappy to happy) and arousal (i.e. from unaroused to aroused).
difference in scores between the different IAPS conditions for valence (3, 74.925) p < 0.01, p2 = .923, and arousal (3, 15.574) p < 0.01, p2 = .923.
The aggression questionnaire [13] consisted of 29 fivepoint Likert items to assess the more static aggression trait. Each Likert item had a range from extremely uncharacteristic of me to extremely characteristic of me. The Likert scales consisted of four factors, Physical Aggression, Verbal Aggression, Anger, and Hostility. A game experience questionnaire was developed during this project to check the differences in game experience between the participants. Questions asked were: how many times a week they played video games, what kind of gamer they thought they were (i.e. from no gamer at all to a real game hobbyist), what kind of games they like, and if they can name their favorite games. Analysis and results
For the first experiment we conducted a 2 (game: nonaggressive, aggressive) x 4 (pictures: low valence/low arousal, low valence/high arousal, high valence/low arousal, high valence/high arousal) repeated measures analysis. As measures a 7-point Likert scale for valence and arousal were used.
Figure 4. Average arousal values for the non-violent game (1) and the violent game (2). Discussion
At first glance it is visible that there seems to be no effect whatsoever of the type of game played on valence. However, a small effect is observed where arousal is concerned. This effect is non-significant though. We suspect this is due to the low power of our test (.296). Conducting the experiment with a bigger sample (around 50 participants) might give more conclusive results. At the moment, we observe that the effect is very weak and happens across IAPS conditions, which seems to indicate the change is independent of the nature of external stimuli presented after playing a violent video game. This would indicate a short-term effect on aggressive behavior according to the GAM [7]. It remains to be seen how this effect holds up in the long run, which is arguably more significant. The effect of arousal is probably due to the misattribution of arousal. Misattribution of arousal is the process in which an internal state of arousal is â&#x20AC;&#x2DC;misattributedâ&#x20AC;&#x2122; to an external cause. In our case, the increased arousal of playing a violent game is attributed to the IAPS picture that has to be judged after playing the game, thus resulting in a higher score on arousal.
Figure 3. Average valence values for the non-violent game (1) and the violent game (2).
There was a significant result for the multivariate test of the difference in scores between the different IAPS conditions (6, 112) p < 0.01, p2 = .770. There was a non-significant result for the multivariate test of the influence of type of game (non-violent or violent) on the difference of scores (2,18) p = .206, p2 = .161. There was a non-significant result for the interaction effect between the IAPS conditions and the type of game played (6,112) P = .591, p2 = .040. There were significant results for the univariate tests of the
Another conclusion that can be drawn is that the methodology seems to be very effective. The effect on arousal is measured across almost all IAPS conditions, lending greater credibility to the fact that this increase is not random. Furthermore, the power only has to be increased slightly to obtain significant results, given that this trend continues. Dill et al. [2] state 200 participants are necessary, at the least, to obtain significant results. However, with this methodology it would seem effects can be measured very reliably across less participants, and as such, fewer participants could be used. Especially given the fact we used only male participants, who seem to give a slightly weaker response to violence.
147
The significant result for the IAPS condition was expected, since the IAPS pictures are well validated and designed in such a way to elicit differences in ratings of valence and arousal. The non-significant results of the type of game played and the interaction between game played and the IAPS conditions are probably due to the low power of these tests (.314 and .296). Conducting this experiment with a bigger sample (around 50 participants) could increase the power levels. Although we have a lack of significance and power levels, some consistent small trends are visible as can be seen in figure 4. It is probable that there is no effect of the game played on the valence ratings given to subsequent judged pictures. Moreover it is more likely that for arousal ratings there is an effect of game played. Still it is a small effect, possible to be observed with increased power. EXPERIMENT 2: VIDEO OBSERVATION
In the first experiment video material was gathered of participants playing games. The video clips were then judged by another group of participants. The assumption behind this experiment is that observers can distinguish the non-verbal behavior of participants playing a violent or non-violent game. Furthermore, it is expected that common people, without any special qualification, are able to identify others’ reaction when exposed to such kind of games. Participants
A total of 17 students (9 male and 8 female) from the TU/e were recruited to judge the video clips. Before the experiment, a consent form had to be signed stating that they agreed with being part of this experiment. Experiment Design
The independent variable during this experiment was the collection of observed sets of two videos. The dependent variable was the choice which one of the videos in each set was the one where an aggressive game was being played. The experiment was done in a between-subjects-design. Materials
We decided to take 15 pairs of 20-second video fragments from the first experiment. Each pair consisted of a participant playing a violent and a non-violent game. The video fragments (figure 5) were chosen from a specific part in each game where players were facing extreme conditions in the game according to an experienced gamer. In addition, both parts had to be somewhat at the end of the gaming session, to make sure the participant was in a state of ‘flow’. In addition, the sound was removed and a head view of the gamer was chosen so the movement of the Wii remote control could not be distinguished according to the game played. The videos were projected on a wall with a projector to be watched by the group of participants. A questionnaire was developed in which the participants had to inform which participants were playing the violent game. In addition, the task difficulty was asked on a 5-point Likert scale and an open question was asked to find out which cues were used by participants to perform the judgment.
Figure 5. Sample of video clips watched by participants during experiment 2. Procedure
In small groups (i.e. 3 to 6 people), the participants were informed about the experiment and a consent form was signed. They received instructions that they would watch two short videos and they should mark in a form which video they thought the person was playing a violent game. Following each pair of video fragments, there were about six seconds time to make a choice. After the video fragments, the two additional questions could be filled in. Before the actual experiment, a training session was given with two video fragments to make the participants familiar with the task. The experiment lasted for approximately 10 minutes. RESULTS AND CONCLUSION
The 17 participants each saw 15 videos of people playing the violent videogame. 78% were correctly classified as ‘the participant is playing a violent videogame’. However, some questions about this high percentage have to be raised. When asked for the visual cues that clued our video observers into the fact that they were watching videos from the violent condition they used the following arguments: •
Fast jerky movement of the body;
•
Shoulder movement;
•
Tense faces; and
•
Less blinking of the eyes.
During our own review we concluded that especially the shoulder movement was very visible. Unfortunately, even though the ways of interaction to Link’s Crossbow Training and HotD are very similar, they differ on one detail, and that is a needed quick movement with the arm to reload the gun in HotD. This movement turned out to be easy to spot, even with videos cut down to just the head. It remains to be seen how big of an influence this had on the percentage of correct guesses. However, some interesting conclusions can still be drawn.
148
First of all, the fact that a shoulder movement is interpreted as a strong clue for aggressiveness is an interesting fact. Most observers correlated this fast body movement with aggressive behavior, even though we have given them no clue as to which games the participants that they were observing were playing. Furthermore, the look in the eyes and tense lips were often observed, and upon reviewing the videos, were definite signs of difference. The fact that there are more visual signs is also supported by the fact that participants who reportedly had no idea, or at least did not use body movements, to draw any conclusions, also all scored 10 or more out of 15 videos correct. Hence there seems to be an indication that there is an observable difference, but it may be less significant than reported here. CONCLUSION
Based upon the results from experiment 1 we can conclude that there seems to be a small correlation between aggressive video games and self-reported arousal. This confirms the results reported by Gentille et al. [9] who performed a meta-study where 9 studies reported increased measures in mainly physical arousal attributes. As arousal is positively correlated with aggressive behavior as predicted by the GAM (General Aggression Model) [4], this seems to indicate that there is some short-term effect on violent behavior, though one might note this effect very subtle. Others have also reported that in this age group, the effects are usually short-term [6], which is also in line with the GAM. Other studies have shown that the short-term arousal effect after playing a violent video game could be predicted by the misattribution of arousal, which also seems to indicate a short-term effect. The findings from the second experiment confirm the fact that there is an influence on non-verbal behavior. In that experiment observers were able to note differences in visual appearance between people playing a violent video game compared to those playing a non-violent video game without seeing the games or having any audible aids. This indicates that the effect violent video games have on people does not only affect their arousal, but has also implication on their visual appearance. It remains unclear however if this difference in visual appearance is caused by the raised arousal levels. Thus, the link between arousal and nonverbal aggressive behavior is one that needs to be either disproven, or firmly established, and as such, an extensive experiment in this direction might provide some answers on how to interpret the results of the video experiment. Wondering about potential aspects of improvement for this work, first and foremost, we consider the sample size of this study should be increased to confirm if the actual trend could become a significant effect. In addition, it would be valued to check the effect of a similar study with a female sample. While their visual reactions to the violent video games might differ too much from those of women playing the non-violent game to run a meaningful video observation
experiment, the effect in arousal that could be measured during the IAPS test would certainly be interesting, especially when compared to males. Concerning the methodology, we agreed this is a strong point of our study. The followed methodology is very reliable, using well accepted tools to assess violence on video games, measure arousal, and differences in nonverbal behavior. It would be advisable to standardize some of this methodology â&#x20AC;&#x201C; or set up guidelines based on some high quality game studies â&#x20AC;&#x201C; so further game research can be less controversial, and more accurate. This would be an important step in gaining definitive answers in issues that remain controversial in many countries, and for many people. Finally, one thing that deserves special attention is the game-selection process we used. Even though we only did a small pre-test, it was very important for obtaining reliable results. Specially if compared to what has been described in the literature, our method to choose the games to be investigated stand up due to its consistency. This pre-test might be extended, and perhaps even standardized, by a group of experts, leading to a large database of games rated on several objective attributes. One could than use this database to select games if one wishes to compare certain effects of videogames on population. These effects would not even have to be limited to aggression, for example they could also measure the influence of playability on general excitement measures. REFERENCES
1. Walsh, D. Video Game Violence and Public Policy. National Institute on Media and the Family (2009). 2. Dill, K., & Dill, J. Video game violence: a review of the empirical literature. Aggression and Violent Behavior 3, 4 (1998), 407-428. 3. Anderson, C., & Dill, K. Video Games and Aggressive Thoughts, Feelings, and Behavior in the Laboratory and in Life. Journal of Personality and Social Psychology 78, 4 (2000), 772-790. 4. Carnagey, N.L., Anderson, C.A., & Bartholow, B.D. Media Violence and Social Neuroscience: New questions and new opportunities. Association for Psychological Science, 16, 4 (2007), 178-182. 5. Vorderer, P., & Bryant, J. Playing Video Games: Motives, Responses, and Consequences. Routledge, 2006. 6. Bushman, B.J., & Huesmann, L.R. Short-term and Long-term Effects of Violent Media on Aggression in Children and Adults. Arch. Pediatr. Adolesc. Med. 160 (2006), 348-352, 2005 7. Anderson, C.A., & Carnagey, N.L. Violent Evil and the General Aggression Model. Chapter in A. Miller (Ed.) The Social Psychology of Good and Evil (168-192). New York: Guildford Publication, 2004.
149
8. Anderson, C.A., Carnagey, N.L., Flanagan, M., Benjamin, A.J., Eubanks, J., & Valentine, J.C. Violent Video Games: Specific effects of violent content on aggressive thoughts and behavior. Advances in Experimental Social Psychology, 36, 199-249. 9. Gentille, D.A., & Stone 3rd, W. Violent Video Game Effects on Children and Adolescents: A review of the literature. Minerva Pediatrica 57, 6 (2005), 337-358. 10. Krahmer, E.J., Schaafsma, J., Swerts, M., & Vingerhoets, A.J.J.M. Nonverbal responses to social inclusion and exclusion. Proc. Interspeech (2008), 809812.
11. Irwin, A.R., & Gross, A.M. Cognitive Tempo, Violent Video Games, and Aggressive Behavior in Young Boys. Journal of Family Violence 10, 3 (1995), 337-350. 12. Raessens, J., & Goldstein, J. Handbook of Computer Game Studies. Massachusetts Institute of Technology, Cambridge, 2005. 13. Buss, A.H., & Perry, M. The Aggression Questionnaire. Journal of Personality and Social Psychology 63 (1992), 452-459. 14. Lang, P.J., Bradley, M.M., & Cuthbert, B.N. International Affective Picture System (IAPS): Instruction manual and affective ratings. Centre for the Study of Emotion and Attention, University of Florida, 2005.
150
educação dinâmicas de interação
151
Some Issues on Instructional Design and Development for E-Learning Systems Amadeu Campos Cin-Centro de Informártica-UFPE Av. Professor Luís Freire s/n, Cidade Universitária - Recife - Pernambuco – Brasil CEP: 50740-540 ascf2@cin.ufpe.br ++5581933266232 ABSTRACT
With the advance of technology, many companies are facing the need to improve training processes because current life-long learning solutions are sometimes not effective and tedious. Moreover, time and cost issues usually favor distance learning alternatives. Thus, it is of the most important concern to introduce digital tools, such as computer, video, sound, games and virtual environments into the training. The appropriate use of these media for facilitating learning requires good knowledge of instructional design techniques. Today, many people involved in e-learning development are not aware of the deep educational issues of this process and often design this kind of training without any sound pedagogical foundation. Consequently, it´s necessary to analyze the instructional design of live training and adapt it for distance training purposes. This paper describes our own approach of instructional design considering all the phases necessary for the distance training development based on and adapted from live training. Author Keywords
Instructional Design, E-Learning, Distance Learning, Training. ACM Classification Keywords
H5.m. Information interfaces and presentation (e.g., HCI): Miscellaneous. INTRODUCTION
Instructional design is a process where it is possible to plan systematically how the training will be done through the specification of activities involved in the whole process. Instructional design can also be described as a hybrid Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA. Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
concept between learning theory, systems engineering and instruction technology[3]. It is also a system which involves organizational processes and methods to demonstrate the efficiency of educational content. Therefore, instructional design can be seen as a systematic process to transform the learning and training principles in planning of instructional content and activities [15]. For the development of the learning process, we need to take into consideration some variables that have to be studied and planned according to the type of approach to be adopted. Amongst the existing approaches, we have chosen the one where the content is the source to reach the learning objectives. Therefore, it leads to an ordered set of structured and articulated activities for the accomplishment of all the educational objectives [16]. The activities of instructional design for distance training include methodological strategies, content planning, implementation of communication, selection of technological and human resources and evaluation of the learning process. This paper introduces an instructional design model for distance training based on a general view of all phases of a conventional training elaboration. This new approach for distance learning was adopted in the design of an environment for training civil construction workers [1]. The instructional design involves the following phases: the identification of the problem, establishing the main goal, characterization of the audience, instructional analysis, decision on specific goals, communication and education strategy, development, maintenance and management, and evaluation. The paper is organized as follows: first, we describe the concept of instructional design, then we present the model adopted for instructional design for distance training. The following sections will describe each phase of this model. We conclude commenting on a prototype system where the model was implemented and validated. INSTRUCTIONAL DESIGN
During the research we have looked for a specific model of instructional design which could be a basis for the
152
development of a distance learning application. However, it was verified that amongst the existing training models (by 2003), no one had been specially developed for distance learning. Thus, we analyzed three instructional design models that were considered in terms of their appropriateness for use in e-learning design: 1- Morrison, Ross, and Kemp model [6]; 2- Smith and Ragan model [15]; 3- Dick and Carey model [4]. Each one of these models contains the five main instructional systems design (ISD) components [7]: analysis, design, development, implementation, and evaluation although not all in the same order or as discrete steps unto themselves. The Morrison, Ross and Kemp model is classroom-oriented and has three elements that differentiate it from some other models: i. the development of the instruction is based on the learner perspective; ii. the model takes a general systems view towards development (model components are independent of each other) with instructional design being presented as a continuous cycle; iii. the management of the instructional design process is the main aim of the model [6]. These elements of the model are independent of each other in that they do not need to be considered in order nor must one start with a particular element. The Smith and Ragan’s model is systems-oriented and was developed as a linear, procedural, instructional design model. Their instructional design model answers the questions “Where are we going?”, “How will we get there?” and “How will we know that we’ve arrived?” [15]. The Dick and Carey model is systems-oriented and have also developed a linear, procedural model with a series of steps. Instructional goals serve as the point of origin and the first step of the instructional design process. This model focuses the designer on the goal of the instruction by requiring a needs assessment and the documentation of clear and measurable learning objectives [4]. Based on these models, we made one comparative table based on five components to find a suitable model for instructional design in e-learning systems (Table 1).
Component
Morrison, Ross and Kemp - Instructional Problems. - Learner’s Characteristics. - Task Analysis.
Smith and Ragan - Learning Environments. - Learners. - Learning Tasks.
Design
- Instructional Objectives. - Content Sequencing. - Planning.
- Write Tests Items. - Organizational Strategy. - Delivery Strategy. - Management Strategy.
Development
- Instructional Strategy. - Support Services. - Designing the message. - Revision. - Project Management.
- Write and Produce Intructions.
- Develop Instructional Strategy. - Develop & Select Inst. Material. - Revise Instruction.
Implementation
- Instructional Delivery.
-
-
Evaluation
- Evaluation Instruments. - Formative Evaluation. - Summative Evaluation.
- Conduct Formative Evaluation. - Revise Instruction.
- Develop & Conduct Formation Evaluation. - Develop & Conduct Summative Evaluation.
Analysis
Dick and Carey - Identify Instructional Goals - Conduct Instructional Analysis. - Write Performance Objectives. - Develop Criterion Ref. Tests
Table 1. Comparative Table of Instructional Design Models
Based on Table 1, we analysed which steps could be used in e-learning systems and designed our own approach by integrating facets of the different models. In Figure 1 we represent this model. It resulted in a tailored methodology of instructional design for the development of distance training courses.
153
Figure 1. Training Design Workflow
In the following sections we describe the model, its characteristics and functioning. Problem Identification
The Problem Identification phase is the first stage in the development of the training. In this phase, the “problem” to be solved is identified through a requirement analysis and/or a performance analysis. According to [12], it is very important in this phase to know the meaning for the word "training needs" before the beginning of the project development. These authors also mention that there are four essential contents for the analysis of needs and evaluation of training; these are: − Environment: it is necessary to evaluate if the infrastructure is appropriate for the work; − Organization: it is necessary to evaluate if the training methodology is appropriate for the type of skill(s) that is intended to instruct on; − Knowledge: it is necessary to evaluate if the proposed learners have enough previous knowledge to develop the skill(s) required in the job; − Motivation: it is necessary to evaluate if there is some kind of motivation in the proposed learners related to the execution of the job. This evaluation of needs has to be focused on learner’s needs, instead of requirements as applied in the traditional instruction. The true problem is not always simple to discover. It is fundamental to know if the training is really necessary through a task performance analysis. The identification of these needs is done by sending questionnaires to the audience, conducting interviews with professionals, through bibliographical research and participation in focus groups.
Main Goal
After the identification of the problem, it is necessary to define the instructional goal of the training. According to [10], the instructional goal always refers to the main project goal the audience must reach. The instructional goal is stated in a measurable manner in order to facilitate the assessment of the audience learning level. For each goal, a deadline must be set and it must reflect in important results for the crucial aspects [8]. An instructional goal must present the following features: relevance, coherence, realism and ethics. Audience
The audience is relevant for the instructional design process because all instructional contents are elaborated according to audience features [12]. These characteristics are classified in three categories: specific, social-economic and behavioral. The evaluation of the audience characteristics is a wellknown idea but it is a difficult task and little used. Actually, it is one of the first principles of User Engineering [14]. Assessment of the audience is a complex task because it involves a deep knowledge of human characteristics such as cognitive processes, memory dynamics and their perceptual limits. However, a precise enough definition of the audience profile is necessary for the construction of distance learning scenarios because decisions regarding most aspects of the development are affected by audience characteristics. To that end, it is usually desirable to obtain data about the population that will directly use the final product (training) regarding their psychological profile, skills and experiences, jobs and tasks and physical characteristics.
154
[5] realized how important is to know the audience. Through proper research it is possible to identify the particular vocabulary used by the target audience (both regarding its technical jargon and its daily speech) ensuring the learning environment is easily understood, fostering acquaintance with its intended users. Instructional Analysis
Instructional analysis is the phase where the instructional content of training is defined. Content is necessary for the audience to reach the training goals. Good content is fitted to goals, audience, training level and available resources [9]. These authors also argued that the instructor is the main person that can adapt the content based on these aspects.
it is necessary to know the basic structure of human performance which depends on specific characteristics of the audience. This performance is described as a cycle of internal activities, such as: perception, memory, design and action. Each one of these activities can be developed in different ways, according to the kind of strategy chosen. There are two basic kinds of strategy for the audience to acquire knowledge:
The process of instructional analysis [4] helps to identify skills that should be included into the instruction for the learners to reach the training goals efficiently. According to [10], there are three models for the development of the instructional analysis process: i. Order model; ii. Hierarchical model; iii. Mixed model.
− Expositive strategy: In this strategy, the content message is exposed to learner and they perceive, understand and memorize the message, associating it to their previous knowledge. − Experiential strategy: in this strategy, the users learn by performing practical activities. The choice of a strategy for each specific learning task must be based in three steps [2]: i. to offer essential knowledge to begin the instructional process; ii. to give basic procedures and practical exercises; iii. to develop proficiency and skill.
The order model walk through each step where its structure is done with data entrance, procedure and exit. The hierarchical model identifies the learning level of each content to reach instructional goals through a hierarchical technique. Finally, the mix model is a combination of the two (previous) models. The last model is more common in complex psychomotor skill training or in complex sequences of cognitive tasks.
After the strategy has been chosen, it is necessary to define which didactic techniques will be applied in the training. There are many techniques and some of them are used in distance training and other in traditional training and the choice depends on the instructional content of it. For example, if distance learning is required, some didactic techniques such as chat, video conference, forum, e-mail, digital library, among others, may be used.
Specific Goals
According to [4], the choice of communicational and educational media must also consider the learning environment, instructional materials and available time.
Stating the specific goals clarify what learners should know, do or feel. They are the most important objectives that learners have to reach during the distance training. During the definition of specific goals, it is necessary to specify some features of them [12]: − Skill: it describes what the learners must know/do in order to reach a specific goal. The skill is always related to a task performance that it will be learned and it can be classified into one of three domains: affective, psychomotor and cognitive. − Condition: it describes which conditions and special tools (media) are necessary to perform the task; − Criterion: it describes the principle or standard by which the specific goals are measured. To write down specific goals, those authors recommend that it is necessary to begin the phrase with "By the end of training, the leaner will be able to…". Communication and Education Strategy
In this phase, the communication and educational strategies are chosen. The choice must enhance the audience learning so that the specific goals can be reached respecting all characteristics of training (audience profile, time, cost, kind of media, etc). To make the best choice, [11] described that
Implementation
This phase of instructional design regards the development of the training structure and the training instruction material. The contents structure is done according to the information that will integrate the training. In this phase, the Pedagogical design and Identification of instructional events and its sequence must be developed. During the development of the instructional material, a detailed study of the different multimedia components is done, so that the best ones for each specific content may be chosen. These multimedia components are classified as: sound, images, text, animations and videos, among others. In distance learning, another important point in the instructional material development is the visual design of the pedagogical material. This design is developed taking in consideration some concerns related to the learner's visual perception and the content presentation. Thus, it is necessary to create modules with icons, pictures and illustrations that can show functionalities, activities and characteristics of pedagogic concern. This way, a narrower bond with the audience is created, aiming to the thematic
155
and visual enrichment that facilitates the communication of the content to the audience. Finally, there are four important components that belong to a set of instructional materials [4] : − Instructional handbook: in this handbook there are guidelines for audience to know how to use all functionalities and components contained in the modules. − Instructional materials: this material is composed of instruments that, besides containing the necessary information for the instruction, also facilitate and help learning the content. − Tests: all instructional materials should contain tests. The tests are a complement of the instructional material and they are used in the formative evaluation as well as in the summative evaluation (see section 2.9 below). The tests are classified as: i. behavioral tests; II pre-tests; III post-tests; IV tests incorporated into the instruction. − Instructor handbook: this handbook describes how the instructor must transmit all learning sequence to the audience. In the case of distance training, this handbook does not exist or it could appear in the Tutor handbook. Those authors also relate that some factors affect the development of instructional materials, such as: i. instructional environment; ii. degree of instructor dependence; iii. availability of existing materials; iv. individual or group instruction On the other hand, the choice and development of instructional materials must be planned considering the amount of information to be presented, a predictable navigation system and the standardization of the elements of the environment. Execution
This phase is executed after that all the instructional content has been revised and it tends to be the most critical phase, considering the importance of the validation of the proposed model. The training execution provides the first impressions from the learners, as learner’s feedback. During the training, all information referring to the distance training is registered because it will provide a summary about the training performance. Such summary contains information from the degree of satisfaction generated by the delivery of the training up to the measuring of the methodology and pedagogical system. Thus, the quality of the course structure is controlled. The training execution must begin with a management plan and must contain the following elements: 1. A clear and complete description of the training; 2. Description of the audience; 3. Instructions for course delivery; 4. Instructions for test grading; 5. Instructions for controling, assisting and evolving the learners; 6. List of all the tasks to be executed; 7. Course Map or course sequence; 8. Instruction program:
How the training will be executed; 9. Copies of all training materials, such as training guidelines, learners handbook, among others and; 10. Learner’s requirements. Evaluation
After the training execution, the evaluation is applied. The goal of this phase is to validate the hypothesis that learners reached the specific goals which had been planned in the training design. The elaboration of the evaluation is the last phase of the training process structure, where we have to consider the following aspects: − the training has effectively achieved the expected modifications in the audience behavior; − the training was capable of increasing the audience knowledge, skills and attitudes; − it improved the education – learning process; − the expected goals for the teaching-learning process were reached; − the training results present relations with the training goals [2]; − the audience needs are being fulfilled by the training results. The three conventional evaluation forms can provide feedback on training process: diagnostic, formative and summative. The diagnostic evaluation of the course is executed before the training and its goal is to verify if all instructional materials are available to the training and if this material is outdated. This evaluation can identify some problems of instructional materials, prompting to solve them. The formative evaluation is executed frequently in distance training to verify if the expected goals are being reached and if the training is happening according to what is expected. In the formative evaluation, it is possible to know the students’ learning rate and their feedbacks. With these feedbacks, it is possible to identify structural problems in the training and reformulate it in order to improve the process. The summative evaluation is executed at the end of training. The goal of this evaluation is to classify the learning results that the audience achieved according to expected performance levels. The evaluation result is measured with pre- and post-tests. The pre-tests are applied before each training content. Through the evaluation, it is possible to measure the existing knowledge of learners about the content to be trained. The questions of the pre-test have to be based on criteria elaborated in the specific goals phase. The posttests are applied at the end of each training content. Their comparative results are organized statistically in order to be analyzed.
156
The use of these three kinds of evaluation guarantee the efficiency of evaluation process and the efficacy of the learning process. The evaluation and revision are executed together within the distance training. Relevant evaluation and revision adhere to the following strategy: − Define what to evaluate: what phase will be analyzed; − Define how to evaluate: which questions will be answered by learners. These questions will indicate the weaknesses and strengths of training; − Define how the revision will be made: what will be revised or remade in what time frame. − Evaluation of system efficiency: evaluate the performance of software applied in the training; − Evaluate the training efficacy: the training efficacy is evaluated through the main element of the training: the learners. PROTOTYPE SYSTEM
After the development of the adapted instructional design process for distance training presented here, we developed a prototype for training self-help construction participants (audience) to assemble the hydraulic system of a house (content)[1]. We believe the same system can be useful to train novice construction workers, as there is a great need for the delivery of better training for this kind of audience, especially with low-budget and short-term techniques. Then, this instructional design model was applied to investigate the effectiveness of such approach considering the adoption of a distance learning system for training the work force of civil construction. The chosen training domain was the assembly of the hydraulic installations used in some building systems. There are three great challenges facing this task: i. the target users, mostly with a low instruction level, frequently illiterate; ii. the type of content that is taught, of cognitive nature although connected to psicomotor activities such as piping assembly, i.e., comprises both the content understanding and the execution (activities involved), traditionally a very difficult task for the distance learning approach and iii. the need for achieving low cost on employee training which had a very strong impact in the type of resources that could be used. The proposed solution comprised the development of a modern learning tool, based on a virtual interactive environment enhanced with multimedia features and on this model of instructional design that was necessary to complete all phases of the distance learning activities. A complete description of the system may be found in [1]. After all instructional design tasks, the training was performed and the methodology was applied to evaluate results against a live training with the same contents. Finally we detailed these results and presented conclusions [1].
This distance training was developed based on four main domains: i. how to use the computer, because the audience had never worked with computers; ii. How to recognize the components of a hydraulics system; iii. How to prepare the components before the assembly of the hydraulic installation; iv. How to assembly the components in their correct position. The educational and communication strategy used were expositive and experiential using the computer with video and simulation software. They were used when psicomotor activities training was required. All simulations were developmented in Adobe Flash and each phase of the training was interactive, with animations, audio and video. There was no need of reading skills. Video was used for allowing the visualization of the real task. RESULTS
The evaluation of this prototype was elaborated based on pre-defined variables according to [1] and was divided in two stages: software evaluation and user learning evaluation. The result of software evaluation was relevant because the audience had few difficulties for using the software. The author concluded that the audience had more difficulties and made more mistakes in the last module than the in three previous ones. This occurred because some hydraulic system tools were presented in 2D. Also the poor graphical visual quality of some building tools in the user interface led the students to make more mistakes than expected. The limitations of module four were caused by the short amount of time to develop the application. The author concluded that the use of 3D visualization could solve these limitations. In the learning evaluation stage, we decided to make one distance training and other live training with an instructor. After that, we have conducted a comparative analysis of both trainings. According to the results, it was concluded that there was no significant difference between both trainings (live and distance) for tools identification and in the preparation phase. A similar conclusion was related by [13] in his book “The No Significant Different Phenomenon”. However, the live training had a better overall result than the distance training. This fact occurred because the technology chosen to design the graphical visuals of some building tools was wrong. This fact was proved also in the software evaluation. CONCLUSIONS
We have presented a new methology for instructional design of distance learning training, based on a combination of some previous methods developed for live training. All nine steps of the proposed methodology were
157
briefly described: problem identification, definition of main goal, definition of audience, instructional analysis, setting of specific goals, definition of communication and educational strategy, implementation, execution and evaluation. This methodology was tested with the development of a training targeting self-help construction participants. The training aimed to prepare individuals to assemble the hidraulic system components of their own future houses. Those learners, with low formal education, had no previous contact with computers and no training in construction activities. The distance training results were compared to those of a traditional face-to-face training session and showed to have about the same efficacy. The obtained results pointed out that it is possible to instruct construction workers using distance learning strategies and e-learning, regardless of their usual low level of education (or even illiteracy, specially in developing countries) and lack of previous contact with computer systems. Furthermore, the successful development of the training modules was able to validate the proposed instructional design methodology, although not in a formal way. REFERENCES
1.
Campos, A. S., Treinamento a Distância para Trabalhadores da Construção Civil. Master’s Thesis - Escola Politécnica da Universidade de São Paulo, São Paulo, Brazil. 2004.
2.
Chiavenato, I., Treinamento e desenvolvimento de recursos humanos: como incrementar talentos na empresa. 4th ed. Atlas, São Paulo. 1999.
3.
Coldeway, D. O., Spencer, R. E., 1982. Keller’s Personalized System of Instruction: The search for a basic distance learning paradigm. Distance Education, Vol. 3, No. 1, pp 51 – 71.
4.
Dick, W; Carey, L., 1978. The systematic design of instruction. Allyn & Bacon, Glenview, USA.
5.
Freire, P., 1979. Educação como prática da liberdade. 17th.ed., Paz e Terra, Rio de Janeiro.
6.
Kemp, J. E., Morrison, G., R., and Ross, S.T., 1996. Designing effective instruction. PrenticeHall, Upper Saddle River, NJ, USA.
7.
Kruse, K., 2004. Introduction to instructional design and the ADDIE model, [Online]. Available at: http://www.elearningguru.com/articles/art2_1.htm. [Accessed 12 April 2008].
8.
Milkovich, G. T.; Boudreau, J.W., 1996. Human Resource Management, Irwin, Homewood, IL.
9.
Mutti, C.N.; Heineck, L.F.M., 1996. Elaboração de material didático para mão de obra na Construção. Anais do Encontro Nacional de Engenharia de Produção. Piracicaba, SP, Brazil.
10. Piovesan, A.P. et al., 1991. Vídeo na Escola Pública Municipal de São Paulo: diagnóstico da utilização do vídeo no processo de ensinoaprendizagem. ECA/USP, São Paulo. 11. Romiszowski, A. J., 1981. Designing instructional systems. Kogan Page, London. 12. Rothwell, W.J.; Kazanas, H.C., 1998. Mastering the instructional design process: a systematic approach. Jossey-Bass, San Francisco. 13. Russel, T.L., 1999. The No Significant Difference Phenomenon. North Carolina University (Office of Instructional Telecommunications), Chapel Hill. 14. Shneiderman, B., 1997. Designing informationabundant web sites: issues and recommendation. Int. J. Human-Computer Studies, Vol. 47, No.1, pp 5-29. 15. Smith, P. L., Ragan, T. J., 1999. Instructional design. 3rd ed., McMillian, New York. 16. Toscaro, A. A. M. et al., 2003. Orientações para o desenvolvimento de cursos mediados por computador.: Unicamp, São Paulo, Brazil. Available at: http://www.unicamp.br/EA/documentos/orientaco es.pdf. [Accessed 21 July 2003].
158
Modelo de transcrição da Língua de Sinais Brasileira voltado a implementação de agentes virtuais sinalizadores Wanessa Machado do Amaral, José Mario De Martino wmamaral@gmail.com, martino@dca.fee.unicamp.br Departamento de Computação e Automação Industrial - DCA Faculdade de Engenharia Elétrica e de Computação – FEE Universidada Estadual de Campinas - Unicamp 13083-970, Campinas, SP, Brasil RESUMO
Acessibilidade é uma preocupação crescente em computação. Uma vez que as informações em ambientes computacionais são apresentadas em sua maioria por meios visuais, pode-se ter a falsa impressão de que a acessibilidade para deficientes auditivos não é um problema. No entanto, para pessoas que adquirem a surdez antes da alfabetização, materiais escritos geralmente são menos acessíveis do que se apresentados em línguas de sinais. Para a comunidade de surdos as línguas de sinais são geralmente a primeira língua, e ler um texto em uma língua escrita é o equivalente a utilizar uma língua estrangeira. Usabilidade é um dos aspectos com os quais o design de interação se preocupa. É possível aprimorar a relação homem-máquina de portadores de deficiência auditiva adequando as respostas dos sistemas computacionais às necessidades dos surdos. A LIBRAS, língua de sinais brasileira, utiliza gestos e expressões faciais para a comunicação, sendo utilizada pela comunidade brasileira de surdos. Para criar conteúdo virtual em língua de sinais, fazse necessária a criação de uma notação capaz de descrever os sinais de forma escrita. Sistemas de transcrição foram desenvolvidos para descrever as línguas de sinais, porém estes sistemas possuem limitações. Uma vez que não foram criados com o intuito de gerar animações computacionais, em geral o reconhecimento e a reprodução de um sinal nos sistemas de transcrições existentes são possíveis apenas por intérpretes experientes ou por profundos conhecedores da notação. O objetivo deste trabalho é desenvolver um sistema de transcrição para a reprodução computacional de conteúdo em língua de sinais. Para isso é necessário registrar explicitamente quantidade suficiente de informações, como velocidade de execução dos movimentos, concatenação de sinais, sequência de cada Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA. Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
configuração e expressões não manuais, para que a reprodução seja próxima à realidade. Apesar dos estudos das línguas de sinais existirem por quase meio século, o problema de transcrição continua um desafio. Dessa forma, a proposta de uma notação para descrever, armazenar e reproduzir conteúdo em LIBRAS por um agente virtual oferece uma ferramenta poderosa de estudo e pesquisa, que contribui para um melhor entendimento da língua de sinais brasileira, uma vez que se conhece pouco sobre sua estrutura, gramática e fonética. Palavras Chave
Computação Gráfica, LIBRAS, Língua de Sinais, XML, Acessibilidade, Realidade Virtual. ACM Classification Keywords
H5.1. Information interfaces and presentation (e.g., HCI): Artificial, augmented, and virtual realities. INTRODUÇÃO
De acordo com o IBGE[4] o Brasil possui atualmente 5,7 milhões de brasileiros com algum grau de deficiência auditiva. Kennaway[7] demonstra que a performance de leitura de crianças surdas geralmente é inferior quando comparada à performance de leitura de crianças com audição normal. Neste estudo, adolescentes entre sete e vinte anos obtiveram desempenho médio equivalente a uma criança de sete anos sem deficiência auditiva. Apenas vinte e cinco por cento tiveram desempenho igual ou superior ao de uma criança de nove anos com audição normal. Em situações onde as informações são apresentadas de maneira escrita, essa parcela da população encontra-se em posição desfavorável. A acessibilidade de deficientes auditivos em ambientes virtuais pode ser melhorada provendo conteúdo em língua de sinais. Conteúdo em língua de sinais vem sendo reproduzido nos computadores em forma de arquivos de vídeo. A criação de mídia de vídeo é utilizada atualmente não só para transmissão como também para o ensino da língua de sinais. Essa opção é bastante custosa, uma vez que se faz necessário o uso de infraestrutura física específica, bem como a participação de pessoas treinadas que conheçam em detalhes a língua de sinais. Para a criação
159
de um vídeo consistente é necessário haver continuidade, utilizando a mesma pessoa para reproduzir os sinais, com as mesmas roupas e o mesmo fundo. Dessa forma, criar pequenas partes de vídeo e depois agrupá-las para formar um único material não é tarefa trivial. A cada detalhe alterado no conteúdo, novo vídeo precisa ser produzido, tornando difícil a manutenção do material e aumentando os custos. A transmissão e o armazenamento de vídeos é outra dificuldade, uma vez que geralmente são arquivos grandes. Na internet, por exemplo, é necessária uma conexão rápida e estável para a transmissão e recepção de vídeos. A animação de humanos virtuais mostra-se, portanto, como uma alternativa conveniente. Entre as vantagens, destaca-se que a criação de conteúdo em língua de sinais poderá ser realizada por uma única pessoa utilizando um computador, sem a necessidade de equipamentos especiais para captura e processamento de vídeos. O conteúdo também pode ser criado mais facilmente, por pessoas não necessariamente treinadas e com fluência em língua de sinais. Um agente virtual possibilita a geração de conteúdo em tempo real. Dessa forma, a continuidade também deixa de ser um problema, uma vez que o conteúdo poderá ser alterado a qualquer momento, sem a necessidade de regravar a sequência de sinalização inteira. O armazenamento do conteúdo é outra vantagem. O espaço em disco no computador requerido para armazenar a descrição dos sinais é bastante inferior se comparado ao armazenamento de arquivos de vídeo. A transmissão do conteúdo também é facilitada, uma vez que o conteúdo transcrito pode ser armazenado em arquivos de texto, que são menores e mais fáceis de serem transmitidos que arquivos de vídeo. Existe ainda a possibilidade de oferecer ao usuário controle adicional sobre o material transmitido, como alteração do ponto de vista durante a reprodução para que o sinal seja melhor visualizado, o que é impossível na reprodução por vídeo. Para implementar um sinalizador virtual é necessário utilizar um sistema de transcrição da LIBRAS que registre todos os detalhes relevantes com o objetivo de reproduzir a naturalidade e espontaneidade presentes no trabalho do intérprete real, na tentativa de garantir o entendimento do sinal reproduzido. Entretanto, é importante salientar que o objetivo deste trabalho não é substituir o intérprete. As habilidades humanas são indispensáveis para a atividade de tradução, que não é o foco deste trabalho. As soluções apresentadas na literatura até o momento para a animação de agentes virtuais sinalizadores possuem algumas limitações. Os sistemas de transcrição tradicionais não foram desenvolvidos com o intuito de gerar animações. Muitas informações importantes para a reprodução do sinal não aparecem nas notações existentes. Algumas informações implícitas podem facilmente ser deduzidas por intérpretes reais, mas o mesmo não acontece com o uso de um intérprete virtual. Surge então a necessidade da criação
de um sistema de transcrição robusto o suficiente, contendo o maior número de informações relevantes, para garantir a animação realista de agentes virtuais. No entanto, apesar dos esforços na área, ainda não se avançou o suficiente para uma completa compreensão da estrutura das línguas de sinais. O trabalho em andamento de McCleary e Viotti [13] busca entender quais informações são relevantes e devem ser registradas nas transcrições. No entanto, quais informações são relevantes e realmente devem ser armazenadas ainda não é um consenso, nem mesmo para os linguistas. Por esse motivo, este trabalho possui um caráter multidisciplinar, cujo resultado auxiliará também nas pesquisas linguísticas das línguas de sinais. SÍNTESE DA BIBLIOGRAFIA FUNDAMENTAL Stokoe
Um dos primeiros trabalhos voltados á análise e registro de uma língua de sinais foi apresentado em 1960 por Stokoe [16]. A notação de Stokoe é baseada no alfabeto latino e foi criada para descrever a língua de sinais americana ASL (American Sign Language) na busca de mostrar que ela seria uma língua natural. No trabalho de Stokoe foi observado que os sinais em ASL requerem três diferentes tipos de informação que ocorrem simultaneamente. Estas informações foram chamadas de querema, e divididas em três grupos: •
Tabula: localização da mão no espaço;
•
Designator: configuração da mão, disposição dos dedos e juntas;
•
Signation: movimento executado.
Stokoe referiu-se aos queremas como sendo elementos sem significado que combinados formam os sinais de uma língua, analogamente aos fonemas das línguas faladas[12]. O termo querema acabou sendo abandonado por pesquisadores das línguas de sinais, sendo chamados atualmente de aspectos dos sinais[9]. Apesar da simultaneidade dos aspectos dos sinais, a notação de Stokoe escreve sequencialmente os símbolos que representam cada um destes aspectos. Esta estrutura sequencial dificulta a compreensão dos sinais pela leitura da notação. Para conhecedores da notação de Stokoe e das línguas de sinais, a reprodução dos sinais através de uma descrição textual pode ser simples. No entanto, para criar um programa de computador que realize a sinalização automaticamente, a sequencialidade das notações existentes, como Stokoe por exemplo, dificulta o trabalho, uma vez que para a reprodução deve-se considerar que os sinais são compostos pelos elementos Designator (configuração), Tabula (localização) e Signation (movimento) ocorrendo simultaneamente. Por outro lado, a estrutura interna dos sinais nem sempre é
160
simultânea[9]. Por exemplo, o sinal ''surdo'' na LIBRAS envolve dois toques com o dedo indicador no rosto, um primeiro toque na região abaixo da orelha e um segundo na região ao lado da boca, com a trajetória em arco entre os dois movimentos. Trocar a ordem desses movimentos resulta em um sinal inexistente na LIBRAS. Dessa maneira, o sinal ''surdo'' apresenta uma sequencialidade que não pode ser ignorada no sistema de transcrição proposto. Percebe-se que simultaneidade e sequencialidade são questões não resolvidas na notação de Stokoe, que são tratadas no sistema de transcrição apresentado. Também vale observar que a notação de Stokoe limita o número de configurações de mãos, atribuindo a cada uma um símbolo. Por isso, para escrever um novo sinal, um símbolo já existente e que mais se aproxime à nova configuração é utilizado. Esta é outra desvantagem da notação de Stokoe, uma vez que a língua de sinais não é estática, ou seja, novos sinais podem surgir necessitando de configurações não existentes. Outra limitação da notação de Stokoe é a falta de representação de sinais não manuais, que são fundamentais para o entendimento de muitos sinais, como por exemplo a representação de expressões faciais. O trabalho de Liddell [10] mostra que para reproduzir uma história com personagens sem nome, os sinalizadores podem utilizar expressões da face distintas para atribuir os sinais reproduzidos aos diferentes personagens. No entanto, outras expressões não manuais também podem ser utilizadas durante a sinalização. HamNoSys
Outro sistema de transcrição reportado na literatura é HamNoSys[14]. Este sistema é formado por aproximadamente duzentos símbolos representando os aspectos dos sinais, ou seja, configuração de mão, localização e movimentação, como em Stokoe. Uma limitação de HamNoSys, que também ocorre em Stokoe, é a falta de estrutura para a representação de sinais não manuais. Existem estudos utilizando a notação HamNoSys com o objetivo de gerar animações tridimensionais para os sinais. O projeto eSign[7] utiliza uma notação XML chamada SiGML, baseada em HamNoSys. O trabalho propõe um plugin para navegadores de internet capaz de traduzir conteúdo escrito e reproduzir o correspondente em língua de sinais. O sistema é independente de avatar, ou seja, não faz referência direta às dimensões de um avatar em particular. A notação SiGML possui algumas limitações conhecidas, indicadas por Kennaway[6]. Uma delas é a falta de uma posição padrão para a articulação dos sinais. Outra limitação é que SiGML descreve a velocidade de execução dos sinais apenas como rápido, devagar ou velocidade média[6]. No entanto, pode ocorrer a necessidade de variar a velocidade durante a sinalização,
por exemplo, para atribuir entonação. Neste caso, um sinal pode começar a ser executado com velocidade normal e ter velocidade de execução rápida ao final da sinalização. Esta questão será trabalhada no sistema de transcrição apresentado neste trabalho. SignWriting
SignWriting[15] foi criada em 1974 com o objetivo de capturar o movimento que esta sendo executado na língua de sinal e representá-lo. A notação SignWriting é definida por três estruturas básicas[17]: configuração de mão, contato e movimento. A posição das mãos pode ser fechada, aberta ou mão plana. Os sinais são escritos com a perspectiva de quem está sinalizando, ou seja, olhando as próprias mãos. Dessa forma, podem ser representadas a palma, dorso ou o lado da mão. O espaço de sinalização é representando em SignWriting com o uso de setas. Um grande diferencial de SignWriting, além da representação de expressões faciais, é a descrição da dinâmica dos movimentos. Em SignWriting existem símbolos de dinâmica que podem ser adicionados aos símbolos de movimento ou de expressões faciais para representar simultaneidade como, por exemplo, quando ambas as mãos movem-se ao mesmo tempo, movimentos alternados, movimento rápido, suave, tenso e relaxado. Nas línguas de sinais, a velocidade com que o movimento é executado pode alterar o significado do que está sendo sinalizado, assim como ocorre com a entonação das frases numa conversa falada. Percebe-se a importância de se acrescentar informações mais detalhadas sobre a velocidade de execução de cada sinal no sistema de transcrição proposto. A variação de velocidade na execução dos movimentos é chamada pelos linguistas de prosódia. A prosódia na LIBRAS pode ser representada pela pausa ou pelo alongamento final dos movimentos. A pausa pode ocorrer quando as mãos retornam para uma posição de repouso, após o movimento. Pausas também podem ocorrer durante a reprodução do sinal, quando o sinalizador suspende um sinal no ar, sem movimento, por um período relativamente prolongado de tempo. Já para os alongamentos finais, Liddell[10] afirma que sinais que aparecem em posição final em algumas orações apresentam uma duração significativamente maior do que os mesmos sinais em posição inicial ou medial na oração. É clara a importância da velocidade de reprodução dos sinais para obter um maior grau de realismo na sinalização virtual. Esta questão não aparece ou é trabalhada superficialmente nas notações existentes. TRANSCRIÇÃO DOS SINAIS
Informações oferecidas em línguas de sinais são raras nos ambientes digitais. Iniciativas de reproduzir conteúdos de vídeo existem, porém, essa não se mostrou uma alternativa conveniente para os meios computacionais. Existem
161
propostas de sinalizadores virtuais, no entanto, Kennaway[6] indica que os sistemas de transcrição tradicionais não foram criados com o intuito de gerar animação, não oferecendo todas as informações necessárias para uma reprodução realista por agentes virtuais sinalizadores. Este trabalho oferece um sistema de transcrição da língua de sinais brasileira apropriado para o armazenamento e reprodução computacional de conteúdo em LIBRAS. Um desafio é elaborar um modelo capaz de representar os sinais sem ter que armazenar todas as combinações imagináveis de gestos, o que certamente resultaria em uma explosão combinatória e tornaria o trabalho inviável. É claro que a LIBRAS, assim como qualquer outra língua de sinais, não abrange todas essas combinações, uma vez que muitas delas são fisicamente impossíveis. Mesmo considerando as limitações físicas, prever todas as combinações possíveis de gestos seria inviável. Com o sistema de transcrição aqui proposto, os sinais serão posteriormente articulados por um avatar, um humano virtual tridimensional, estrutura articulada que representa uma figura humana. Os sinais devem ser reproduzidos com a qualidade necessária para que um conhecedor da língua facilmente identifique qual sinal está sendo articulado. A execução dos sinais deve ser suave e contínua. Limitações morfológicas, como o espaço da execução dos gestos e o movimento permitido pelas articulações, devem ser consideradas como acontece com um humano real. O sistema de transcrição proposto neste trabalho considera principalmente as seguintes limitações das notações existentes: velocidade de execução dos movimentos, concatenação de sinais, sequência de cada configuração e expressões não manuais. Além disso, as informações descritivas do sinal foram agrupadas hierarquicamente, visando uma melhor organização da notação. XML
O sistema de transcrição foi proposto utilizando a linguagem de marcação XML (eXtensible Markup Language)[19]. Um documento XML obedece as regras pré definidas que estrutura o documento de maneira hierárquica. Documentos XML foram escolhidos para o formalismo da notação por apresentarem várias vantagens, dentre as quais destacam-se: •
são arquivos de texto, manipuláveis em qualquer editor de textos simples.
•
descrevem muito bem hierarquias, sendo uma linguagem de marcação validada e consolidada.
•
existência de editores e validadores de XML disponíveis gratuitamente.
•
facilidade para compartilhar arquivos XML.
O XML permite agregar semântica ao conteúdo de documentos, e cada aplicação interpreta a marcação do conteúdo da maneira que preferir. No entanto, o documento precisa seguir à regras especificadas para ser considerado um XML bem formado. O vocabulário da notação foi escrito em um Schema XML, documento de regras recomendado pela W3C[20]. Para facilitar a leitura do texto, a descrição XML será ilustrada através de diagramas da UML. Para este fim, cada elemento do XML será representado como uma classe. A cardinalidade das ligações entre as classes representa o número de vezes que o elemento pode aparecer no documento. Cada atributo, por sua vez, será representado como um atributo da classe. Os valores possíveis que os atributos podem assumir serão escritos imediatamente à frente do nome do atributo, podendo se referir a um conjunto de valores, por exemplo: 0..10, e precedidos do sinal igual (=), ou a um tipo de valor, por exemplo string ou inteiro, precedidos do sinal dois pontos (:). Notação
Como mencionado, inicialmente, foram três os aspectos identificados por Stokoe: configuração de mão, localização e movimento. Mais tarde, Battison[1] e Friedman[5] identificaram a orientação da palma da mão, que já existia nos estudos de Stokoe, porém com importância secundária. Klima e Bellugi[8] identificaram o arranjo das mãos, ou seja qual mão realiza o sinal e se ativa ou passivamente. Liddell e Johnson[12] dividiram os movimentos em locais e globais. O trabalho de Battison[2] apresenta duas restrições que limitam consideravelmente o número de combinações possíveis de sinais articulados com as duas mãos[9]. Uma delas é chamada condição de dominância, onde uma das mãos assume papel ativo e a outra, passivo, servindo de ponto de articulação para a mão ativa, como no sinal “banheiro” (Figura 1). A outra restrição é a simetria para casos nos quais as duas mãos são ativas. Segundo a condição de simetria ambas as mãos ativas adquirem configuração de mão idêntica e movimentos especulares, como no sinal “língua de sinais” (Figura 2). Na LIBRAS, tais condições foram validadas em uma primeira análise[18]. A sequencialidade é outra importante informação para a descrição dos sinais. A organização sequencial dos sinais foi apontada por Liddell[11] mostrando que os sinais da ASL podem ser divididos em dois tipos: unitários e sequenciais [18]. Nos sinais unitários os aspectos são estáveis, ou seja, informações de configuração de mão, orientação da palma da mão e localização, por exemplo, permanecem iguais durante a articulação do sinal, podendo ser realizado com ou sem movimento.
162
Figura 1. Sinal “banheiro”.[3] Figura 4. Sinal “mente fechada”.[3]
Figura 2. Sinal “língua de sinais”.[3]
No segundo tipo, os sinais apresentam sequencialidade na realização de alguns dos aspectos articulatórios, ou seja, existe uma ordem fixa para eles. Liddell indica que alguns sinais da ASL possuem duas configurações de mão, e/ou movimentos, e/ou localizações, que necessariamente devem ser articulados em sequencia. No sinal “mente aberta” (Figura 3), por exemplo, nos momentos em que as mãos estão paradas, a configuração de mão, a orientação da palma, a localização, entre outros aspectos, apresentam-se estáveis. É somente durante o movimento, da posição inicial à final, que alguns destes aspectos variam[18]. Com base nessa análise, Liddell[11] argumentou que todo sinal é composto de movimentos e/ou suspensões. Na LIBRAS, existem sinais que se distinguem um do outro apenas pela ordem dos movimentos e suspensões, como por exemplo “'mente aberta” (Figura 3) e “'mente fechada” (Figura 4). Baseada nestas considerações, a notação proposta neste trabalho primeiramente separa as informações em dois grupos, os elementos suspensao e movimento. O elemento sinal é a raiz da descrição. Um sinal pode ter uma ou mais suspensões, unidas ou não por movimentos globais A Figura 5 ilustra essa hierarquia.
Figura 5. Hierarquia simplificada da descrição de um sinal. Suspensão
A sequência da realização de cada componente do sinal é uma informação importante para a animação do avatar virtual. Em geral, um conhecedor das notações tradicionais consegue deduzir quando e como combinar os aspectos do sinal, como configuração de mão, movimentos locais, trajetórias e os demais componentes de um sinal isolado. Para a sinalização virtual estas informações não são tão óbvias, devendo portanto, ser consideradas explicitamente no sistema de transcrição. A sequência de cada suspensão é descrita na notação através do atributo numero (Figura 6). O elemento movimentoGlobal também possui atributo de mesmo nome. Deve-se observar no entanto que não é sempre que uma suspensão será sucedida por um movimento. O valor do atributo numero em movimentoGlobal está portanto diretamente relacionado ao número da suspensão. Assim sendo, um movimento global de número igual a 2 diz respeito ao movimento realizado após a suspensão de mesmo número. Foram criados elementos separados para aos mãos. Tanto a mão direita como a esquerda contém elementos para descrever configuração, localização, orientação da palma e movimento local (Figura 7). A mão esquerda contém o atributo espelhada, que permite ser atribuído valor igual a “sim” quando sua configuração de mão for igual da mão direita (Figura 8). O elemento face contém a descrição da expressão facial e está associada a suspensão. Configuração
Figura 3. Sinal “mente aberta”.[3]
A configuração da mão (Figura 9) é a maneira como estão dispostos os dedos, unidos ou separados, e a situação das juntas, se flexionadas ou distendidas, por exememplo.
163
Figura 6. Descrição de uma suspensão.
Figura 10. Alfabeto e números da LIBRAS.[21]
Figura 7. Descrição da mão direita.
O espaço de sinalização é representado como um região de três dimensões, como ilustram as Figuras 12 e 13, respectivamente. Dessa forma, existem pontos prédefinidos no espaço, na horizontal e na vertical, formando uma grade tridimensional. Cada um destes pontos é referenciado com um valor inteiro.
Figura 8. Descrição da mão esquerda.
Existem configurações de mão mais utilizadas na LIBRAS, de maneira que é possível estabelecer um conjunto finito de opções. Em geral, as configurações mais utilizadas são as letras do alfabeto e os números (Figura 10). Uma vez que as configurações pré-definidas foram criadas, elas podem ser referenciadas na descrição do sinal, como ilustra a Figura 9.
Figura 11. Descrição da localização da mão.
Localização
A localização é a região na qual as mãos articulam o sinal, e podem ser descritas como um ponto no espaço, ou como o contato com a mão, rosto ou corpo (Figura 11).
Figura 9. Descrição de configuração da mão.
Figura 12. Espaço de sinalização horizontal.
164
Figura 16. Pontos de contato no rosto.[12] Figura 13. Espaço de sinalização vertical.
Alternativamente, o espaço de sinalização pode ser representado como um ponto de contato, que pode ser com outra a mão (Figura 14), com partes do corpo (Figura 15) ou rosto (Figura 16). Quando não informada a localização, o sinal será articulado em frente ao corpo. Esta é uma vantagem da notação, uma vez que se faz desnecessária a descrição de localização para sinais onde não se deseja uma precisão muito grande do lugar no espaço onde o sinal será articulado.
Orientação da palma da mão
A orientação da palma da mão é um aspecto importante, que em alguns casos serve para a distinção entre um sinal e outro. A palma da mão é descrita aqui como se o sinalizador estivesse olhando para suas próprias mãos, de sua própria perspectiva (Figura 17). Dessa maneira, dizer que a posição da palma é para frente, significa que a palma da mão está para cima, visível para o sinalizador. LadoD, significa que a mão está voltada para o lado, com o dorso voltado para direita. Assim como LadoE, o dorso está voltado para esquerda. Finalmente, quando posição igual a dorso, significa que a palma da mão está voltada para baixo. A orientação da palma da mão pode estar na horizontal ou vertical, como ilustram as Figuras 18 e 19. Na horizontal, a palma da mão pode estar voltada para: •
cima, palma visível (Figura 18 a)
•
o lado, dorso voltado para direita (Figura 18 b)
•
baixo, dorso visível (Figura 18 c)
Na vertical, a palma da mão pode estar voltada para: Figura 14. Pontos de contato na mão.
•
o sinalizador, palma visível, dorso para frente (Figura 19 a)
•
o interlocutor, dorso visível, palma para frente (Figura 19 b)
•
o lado, dorso voltado para direita (Figura 19 c)
Figura 17. Orientação da mão. Figura 15. Pontos de contato no corpo.[12]
165
(a)
(b)
(c)
Figura 18. Orientações da palma da mão na vertical.[17]
(a)
(b)
(c)
Figura 19. Orientações da palma da mão na horizontal.[17] Movimento Local
Um sinal pode conter zero ou mais movimentos. Os movimentos são divididos em dois grandes grupos: locais e globais. Os movimentos locais são aqueles em que apenas a movimentação das articulações dos dedos, rotação do pulso ou do antebraço são realizadas, onde a localização das mãos no espaço não se altera. Liddell e Johnson classificaram os movimentos locais em tamborilar, circular, esfregar, achatar, dobrar, soltar, dobrar juntas distais e torcer. No entanto, para os propósitos deste trabalho optou-se por utilizar uma descrição mais detalhada destes movimentos, dividindo-os em três categorias: antebraço, pulso e dedos (Figura 20).
•
articulações proximais fecham e abrem (juntas)
•
articulações proximais abrem e fecham alternadas
•
articulações proximais fecham e abrem alternadas
•
articulações distais abrem
•
articulações distais fecham
•
articulações distais abrem e fecham
•
articulações distais fecham e abrem
•
esfregar
•
circular horário
•
circular anti-horário
O elemento dedos pode ter os seguintes elementos vazios como filhos: polegar, indicador, dedoMedio, anelar e dedoMinimo, que quando preenchidos indicam quais dedos realização o movimento. Por exemplo, se o elemento dedos tem os elementos filhos os elementos indicador e polegar, quer dizer que o movimento local é realizado apenas com os dedos indicador e polegar. É importante observar que é possível descrever mais de um movimento local para uma mesma suspensão, conferindo flexibilidade à notação. Dessa forma é possível movimentar pulso e dedos ao mesmo tempo, por exemplo.
Os movimento possíveis para o pulso e o antebraço são: • para baixo: da posição de repouso o pulso (ou antebraço) realiza rotação para baixo, como por exemplo no sinal moto (Figura 21). •
cima, movimento oposto ao anterior
Figura 20. Movimento Local.
• baixocima, rotação que parte da posição de repouso para baixo, volta e depois sobe. •
cimabaixo, movimento oposto ao anterior
O movimento dos dedos podem ser os seguintes: •
articulações proximais abrem
•
articulações proximais fecham
•
articulações proximais abrem e fecham (juntas)
Figura 21. Sinal “moto”.[3]
166
Expressões Faciais
As expressões faciais foram componentes como segue:
divididas
em
nove
•
testa: franzida;
•
sobrancelhas: para cima, retas, para baixo, para cima lado de dentro, para baixo lado de dentro;
•
olhos: abertos, espremidos, abertos, bem abertos;
•
olhar: é a direção do olhar, e pode ser para cima, para cima e um dos lados, para os lados, para baixo, para baixo e um dos lados;
•
bochechas: estufadas, sugadas, tensas, soprar;
•
nariz: franzido;
•
boca: fechada, sorriso fechado, sorriso aberto, bocejo, beijo, tensa, dobras ao redor da boca;
•
língua: visível dentro da boca;
•
dentes: superiores tocando lábio inferior, inferiores tocando lábio superior.
fechados,
meio
O atributo preDefinida foi criado para facilitar descrições de expressões “prontas”, como feliz ou triste. Este atributo pode ser utilizado quando não é desejada uma precisão muito grande na descrição da face, bastando dizer que a expressão é de alegria ou tristeza para uma boa articulação.
Figura 22. Descrição do movimento global.
ou espelhado. São valores possíveis para o atributo maos: •
direita: só a mão direita se move.
•
esquerda: só a mão esquerda se move.
•
simultâneo: ambas as mãos se movem, juntas.
•
alternado: mão direita move na direção contrária à mão esquerda, e vice versa.
•
consecutivoD: uma das mãos move enquanto outra fica parada. Depois inverte. Movimento começa com a mão direita.
•
consecutivoE: uma das mãos move enquanto outra fica parada. Depois inverte. Movimento começa com a mão esquerda.
•
espelhado: as duas mãos movimentos espelhados.
•
espelhadoConsecutivoD: as duas mãos se movem, em movimentos espelhados, uma de cada vez. Mão direita move primeiro.
•
espelhadoConsecutivoE: as duas mãos se movem, em movimentos espelhados, uma de cada vez. Mão esquerda move primeiro.
Movimento Global
Os movimentos globais são as trajetórias entre uma suspensão e outra, dentro de um mesmo sinal. Este movimento também pode ser automático e inconsciente, como por exemplo uma acomodação para a posição inicial, o que ocorre ao soletrar uma palavra. Neste caso, a trajetória não precisa ser descrita, uma vez que a reprodução computacional do sinal deverá resolver o problema. No entanto, para movimentos intencionais, onde a maneira como a trajetória entre as suspensões acontece é parte da sinalização e faz-se necessária para o entendimento do sinal, a descrição do movimento deve ser realizada. Movimentos globais são realizados com o deslocamento das mãos pelo espaço de sinalização, e são descritos como ilustra a Figura 22. O movimento pode ser na horizontal ou vertical. São classificados em circular (horário ou antihorário), meio circulo (horário ou anti-horário), reto (para direita, esquerda, frente ou trás) ou em zigue-zague (começando da direita e para frente, da direita e para trás, da esquerda e para frente ou da esquerda e para trás). O atributo maos descreve a dinâmica do movimento, ou seja, como o movimento é realizado, com uma ou duas mãos, e de que maneira, alternado, consecutivo, simultâneo
se
movem,
em
A velocidade de execução do movimento global pode ser rápida, lenta ou padrão. Quando não preenchido, o atributo é considerado com valor padrao. O movimento pode ter também sua velocidade acelerada ou desacelerada durante a articulação. O atributo repetir, assim como no movimento local, serve para descrever quantas vezes o movimento é repetido. Se igual a 0, o movimento ocorre e a mão não volta ao seu
167
local de repouso. Se o valor de repetir for 2, quer dizer que a mão vai, volta e vai novamente, assim por diante. Pode acontecer o contato com a mão, os dedos, parte do corpo ou rosto, durante ou no final da realização do movimento global. O atributo tempo define em qual momento do movimento o contato é realizado. O contato pode ser do tipo toque, bater, escovar (entra e sai de contato), esfregar (move, mas permanece na superfície) e pegar. O contato pode ocorrer de uma local para o outro, como no caso do sinal “pagar” (Figura 23), ou entre dois locais, como no sinal “castelo” (Figura 24). Os atributos local1 e local2 são referentes a pontos de contato com a mão (Figura 14), partes do corpo (Figura 15) ou rosto (Figura 16), idênticos aos utilizados na descrição da localização.
Figura 24. Sinal “castelo”.[3]
Descrevendo um sinal
Para exemplificar o modelo de transcrição, alguns sinais serão descritos com a notação proposta. O sinal “computador” (Figura 25) é articulado com as duas mãos, de forma espelhada e configuração de mão em C. É realizado movimento global circular horário com a mão direita, e movimento espelhado com a mão esquerda. O XML que descreve o sinal “computador” é mostrado a seguir: <sinal nome=”computador”> <suspensao numero=”1”>
Figura 25. Sinal “computador”.[3]
O sinal “árvore” (Figura 26) é articulado com duas mãos, de forma ativa/passiva e possui movimento local. Sua descrição é a seguinte: <sinal nome=”arvore”> <suspensao numero=”1”> <maoDireita> <configuracao predefinida=”a1” /> <localizacao>
<maoDireita>
<espaco vertical=”3” horizontal=”3” />
<configuracao predefinida=”c” />
</localizacao>
<localizacao>
<palma orientacao=”vertical” posicao=”dorso” />
<espaco vertical=”3” horizontal=”3” />
<movimentoLocal>
</localizacao>
<antebraco tipo=”cima” repetir=”0”/>
<palma orientacao=”vertical” posicao=”dorso”/>
</movimentoLocal>
</maoDireita> <maoEsquerda espelhada=”sim”/>
</maoDireita> <maoEsquerda>
</suspensao> <movimentoGlobal numero=”1” orientacao=”vertical” movimento=”circularH” maos=”espelhado” repetir=”2”/>
<configuracao predefinida=”b1” /> <localizacao>
</sinal>
<espaco vertical=”1” horizontal=”2” /> </localizacao> <palma orientacao=“horizontal” posicao=”dorso”/> </maoEsquerda> </suspensao> </sinal> Figura 23. Sinal “pagar”.[3]
168
<espaco vertical=”4” horizontal=”3” /> </localizacao> <palma orientacao=”vertical” posicao=”ladoD”/> </maoDireita> <maoEsquerda espelhada=”sim”/> </suspensao> Figura 26. Sinal “árvore”.[3]
<movimentoGlobal numero=”2” orientacao=”vertical” movimento=”meioCirculoH” maos=”espelhadoConsecutivoD” repetir=”0”/> </sinal> Descrevendo uma frase
Figura 27. Sinal “desenvolver”.[3]
O sinal “desenvolver” (Figura 27) é articulado com as duas mãos com configurações espelhadas. É realizado movimento global em meio circulo, sentido horário com a mão direita e anti-horário com a mão esquerda. No entanto, depois de fazer o primeiro meio circulo aos mãos não voltam para a posição inicial, e continuam a subir com outro meio círculo. Por isso, a descrição foi realizada com duas suspensões e dois movimentos, idênticos exceto pelos parâmetros de localização, como segue:
Até o momento foram descritos sinais isolados da LIBRAS. No entanto para a reprodução de conteúdo, faz-se necessária a descrição de frases inteiras. Com isso, surgem os problemas de concatenação de sinais, omissão de partes de sinais, e articulações que não possuem nenhum sinal correspondente. O diagrama da Figura 28 ilustra a descrição de uma sentença. O elemento sentenca pode ter quatro tipos de elementos filhos: •
sinal: para referenciar um sinal já descrito
•
concatenar: elemento que permite a concatenação de um sinal com outro sinal ou suspensão. Tudo que estiver dentro do elemento concatenar será articulado ao mesmo tempo, omitindo partes de um para a articulação de outro.
•
suspensao: no caso de ser necessária a articulação de alguma suspensão que só ocorre nesta sentença, mas não é comum o suficiente para ser armazenada como um sinal na base de dados, a articulação pode ser descrita na sentença como uma suspensão isolada.
•
movimentoGlobal: elemento utilizado para descrever movimentos que não constam nas descrições do sinal.
<sinal nome=”desenvolver”> <suspensao numero=”1”> <maoDireita> <configuracao predefinida=”d1” /> <localizacao> <espaco vertical=”3” horizontal=”3” /> </localizacao> <palma orientacao=”vertical” posicao=”ladoD”/> </maoDireita> <maoEsquerda espelhada=”sim”/> </suspensao> <movimentoGlobal numero=”1” orientacao=”vertical” movimento=”meioCirculoH” maos=”espelhadoConsecutivoD” repetir=”0”/> <suspensao numero=”2”> <maoDireita> <configuracao predefinida=”d1” />
A concatenação de sinais será descrita na próxima sessão. O elemento concatenar tem os seguintes elementos filhos: •
sinal: sinal que concatenação.
terá
partes
omitidas
na
•
suspensao: descrição a ser concatenada no sinal.
•
movimentoGlobal: utilizado para descrever movimentos que serão usados na concatenação.
Por exemplo, a frase: “Ele está chorando porque a bola sumiu”
<localizacao>
169
é descrita como segue: <sentenca> <sinal nome=”ele”/> <sinal nome=”chorar”/> <sinal nome=”porque”/> <sinal nome=”bola”/> <sinal nome=”sumir”/> </sentenca> A separação do conteúdo em sentenças é importante para sinalizar uma pausa entre duas frases durante a articulação, visando uma reprodução natural dos, próxima à realizada por um intérprete real. Sem esta pausa, a articulação poderia ser comparada à um texto em escrito sem acentos e pontuação. Ou seja, apesar de compreensível, um texto escrito dessa forma é deselegante e de difícil leitura. Concatenação de sinais
Uma informação necessária para a animação do avatar virtual, que não aparece nas notações existentes, é a concatenação de sinais. Considerando que os sistemas de transcrição tradicionais costumam representar os sinais isoladamente, a maneira como o sinal está inserido no contexto da frase também tem de ser interpretada pelo sinalizador virtual. A concatenação de sinais ocorre quando em uma frase existe a omissão de parte de um sinal com a sobreposição do sinal seguinte. Por exemplo, pode acontecer do movimento do sinal A começar antes que o movimento do sinal B termine, ocorrendo a sobreposição destes sinais. Não existe portanto garantia de que sempre os sinais serão reproduzidos em sua totalidade nas sentenças da LIBRAS. A composição de sinais na frase deve portanto ser considerada na animação do avatar para que a reprodução não seja uma mera sequencia de sinais, não correspondendo a conversação real dos surdos. Por exemplo, o sinal de “árvore” é articulado com o braço direito erguido na vertical, com a palma da mão aberta e os dedos afastados. O braço esquerdo serve como base, apoiando o cotovelo direito na mão esquerda (Figura 26). O sinal pegar começa com a mão aberta, dedos separados, e termina com a mão fechada (Figura 29). O menino pegou uma fruta na árvore A frase acima pode ser articulada da seguinte maneira: o braço esquerdo, passivo no sinal “árvore”, pode ser usado para articular o gesto pegar, direcionado para a mão direita, que está simbolizando a copa da árvore, onde está a fruta. Neste caso houve uma concatenação de apenas dois sinais, “árvore” e “pegar”, para formar uma frase inteira.
Figura 28. Descrição de sentenças.
A descrição XML da frase acima pode ser realizada da seguinte maneira: <sentenca> <concatenar> <sinal nome=”arvore” omitir=”esquerda”/> <suspensao> (descrição de pegar fruta na árvore) </suspensao> </concatenar> </sentenca> Observe que o elemento sinal tem um atributo chamado omitir. O atributo omitir permite que seja indicada qual mão será omitida na concatenação, direita ou esquerda. Outra ocasião que pode provocar concatenação dos sinais é na descrição de situações que ocorrem simultaneamente. Por exemplo, o sinal “bicicleta” é articulado com as duas mãos fechadas, como se segurassem o guidão da bicicleta. O sinal é articulado com o movimento circular dos braços, analogamente ao movimento dos pedais (Figura 30). Para articular a frase “Enquanto andava de bicicleta, seu chapéu caiu.” podemos articular o sinal “bicicleta” e tirar uma das mãos, que são espelhadas, para articular o sinal de cair o chapéu da cabeça, indicando que o chapéu caiu da cabeça enquanto se andava de bicicleta. Com dois sinais a frase é articulada. No entanto, a articulação dos sinais separadamente, em ordem sequencial, não alcançaria o mesmo sentido da frase. A descrição da frase é a seguinte: <sentenca> <sinal nome=”bicicleta”> <concatenar> <sinal nome=”bicicleta” omitir=”direita”/> <suspensao> (descrição de chapeu cair, mão direita) </suspensao> </concatenar> </sentenca>
170
É importante destacar o caráter multidisciplinar deste trabalho, uma vez que o levantamento detalhado dos aspectos que compõem um sinal pode ajudar nos estudos linguísticos da LIBRAS, que se trata de uma área promissora de pesquisa. REFERÊNCIAS Figura 29. Sinal “pegar”.[3]
1 Battison, R.. Phonological deletion in American Sign Language. Sign Language Studies 5 (1974), 1-19. 2 Battison, R. Linguistics of American Sign Language: An introduction. Washington, DC: Clerc Books: Gallaudet University Press, 2000. 3 Capovilla, F.C. e Raphael, W.D. Dicionário Enciclopédico Ilustrado Trilíngue: Língua de Sinais Brasileira. EDUSP - Editora da Universidade de São Paulo, 2001.
Figura 30. Sinal “bicicleta”.[3] TRABALHOS FUTUROS
O modelo tridimensional e o software para a leitura do XML e a animação dos sinais se encontram em desenvolvimento. Com sua conclusão, será possível testar com maior clareza o poder de descrição do modelo proposto. A reprodução de conteúdo para conhecedores da LIBRAS é indispensável nas avaliações futuras. A exibição de sinais gravados em vídeo e a comparação dos mesmos sinais articulados pelo avatar pode indicar se o sinal está sendo bem reproduzido pelo avatar virtual, e identificar eventuais melhorias no modelo de transcrção. O modelo de transcrição apresentado deve ainda ser avaliado quanto à capacidade de descrição de sinais em outras línguas além da LIBRAS, como a língua de sinais americana ASL, por exemplo. CONCLUSÃO
Neste trabalho foi apresentada uma notação XML para a língua de sinais brasileira. Percebe-se que a descrição textual de uma língua de sinais não é tarefa trivial. Mesmo com o uso das notações já existentes, para o entendimento inequívoco de como reproduzir os sinais faz-se necessária a utilização de outras fontes de informações, como imagens e anotações adicionais. O modelo de transcrição aqui proposto tem o objetivo de oferecer uma ferramenta de descrição dos sinais o mais detalhada possível, com o maior número de informações relevantes para sua reprodução computacional. Com um modelo de descrição das línguas de sinais aprimorado, criado com o objetivo de reproduzir os sinais por um agente virtual, é possível aumentar a acessibilidade computacional aos portadores de deficiência auditiva, melhorando assim a interação homem-máquina para estes usuários.
4 IBGE: População residente, por situação do domicílio e sexo, segundo o tipo de deficiência http://www.ibge.gov.br/home/estatistica/populacao/cens o2000/tabulacao_avancada/tabela_brasil_1.1.3.shtm, acessado em 15/09/2009. 5 Friedman, L.. Phonological deletion in American Sign Language. Sign Language Studies 51 (1975), 940-961. 6 Kennaway, R.J. Experience with and requirements for a gesture description language for synthetic animation. Lecture Notes in Computer Science 2915 (2004), 300311. 7 Kennaway, R.J.., Glauert, J.R.W. e Zwitserlood, I. Providing Signed Content in the Internet by Synthesized Animation. ACM Trans Comput Hum Interact (TOCHI) 14, 3 (2007). 8 Klima, E e Belluigi, U. The signs of language. Cambridge, Mass: Harvard University Press.,1997. 9 Leite, T.A. A segmentação da lingua de sinais brasileira (LIBRAS): Um estudo linguistico descritivo a partir da conversação espontânea entre surdos. Tese de Doutorado apresentada a Universidade de São Paulo. (2008). 10 Liddell, S.K.. Nonmanual signals and relative clauses in American Sign Language. In: P. Siple, P. (Ed.). Understanding language through sign language research. (1978), 59-90. 11 Liddell, S.K.. THINK and BELIEVE: Sequentiality. In American Sign Language 60(1984), 372-99. 12 Liddell, S.K. e Johnson, R.E. American Sign Language: the phonological base. Sign Language Studies. 64 (1989), 195-278. 13 McCleary, L. e Viotti, E. Transcrição de dados de uma língua sinalizada: um estudo piloto da transcrição de narrativas na língua de sinais brasileira (LSB). In H.Salles (Org) Bilinguísmo e surdez: Questões linguísticas e educacionais (2005).
171
14 Prillwitz, S., Leven, R., Zienert, H., Hanke, T., Henning, J and Colleagues. HamNoSys Version 2.0: Hamburg Notation System for Sign Languages:An Introductory Guide. International Studies on Sign Language and the Communication of the Deaf 5 (1989), 195-278. 15 SignWriting: http://www.signwriting.org, acesado em 15/09/2009. 16 Stokoe, W.C. Sign Language Structure: An Outline of the Visual Communication System of the American Deaf. Studies in Linguistics: Occasional Papers 8 (1960). 17 Stumpf, M. R. Lições sobre o SignWriting. Tradução Parcial e Adaptação do Inglês/ASL para Português
LIBRAS do livro 'Lessons in SignWriting', de Valerie Sutton, publicado originalmente pelo DAC, Deaf Action Committe for SignWriting. acesado em 15/09/2009. http://sign-net.ucpel.tche.br/licoes-sw/licoes-sw.pdf 18 Xavier, A.N. Descrição Fonético-Fonológica dos Sinais da Lingua de Sinais Brasileira (LIBRAS). Dissertação de Mestrado apresentada a Universidade de São Paulo. (2006). 19 http://www.w3.org/XML, acessado em 15/09/2009. 20 http://www.w3.org/XML/Schema, acessado em 15/09/2009. 21 http://www.unisc.br/universidade/estrutura_administrati va/nucleos/naac/alfabeto.htm, acessado em 15/09/2009.
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
New scenarios in the education design with dynamic of interaction H茅ctor Torres Bustos Lecturer Design Industrial Universidad Tecnol贸gica Metropolitana, Chile Dieciocho 414, Santiago, Chile 0056 2 787 73 81 htorres@proteinlab.cl ABSTRACT
The education design faces new challenges stemming from various factors that affect the lives of individuals, such as the introduction of IT in everyday life that transform the way people interact with their environment. There are three basic factors that must be incorporated in education design: the ability to create networks to enhance information flows, the domain of interactive technologies and new forms of relationships between people and their environments based on continuous dialogue with objects and environments.
KEYWORDS Interaction Design, User Experiences, Interactive Technologies
INTRODUCTION
The introduction of IT in everyday life of people challenges us to redesign the methodology of Education Design, where we will prepare the future designers that they must understand the technological phenomenon at different levels that influence the product design. The user experience based on dialogue with the product and environment, the diversity of users ranging, from final user, the technical user and repairer, are aspects that must be taken into account when designing products that integrate IT in its structure.
PROJECT Within the field of IT, education design challenge is fundamental to update your content for future professionals have the tools necessary to act in the world today. These challenges are three
1. Understanding the impact of connectivity technological in the relationship people have with their environment
Andrea Ordenes Godoy Lecturer Design Industrial Universidad Tecnol贸gica Metropolitana, Chile Dieciocho 414, Santiago, Chile 0056 2 787 73 81 Andrea.ordenes@proteinlab.cl
2. Understanding the operating logic of digital technologies and their impact on the design of objects, products and environments. 3. Understanding the impact of these technologies in user experience, interaction with information. The manager of these three aspects allow at future designers to do the job of new product development by understanding the context in which people develop their daily activities. In this context, the Program for Prospective and Technological Innovation, ProteinLab UTEM, IT Research Center in Design, develop jointly with Industrial Design UTEM, a final project with product design interactive for environments exhibition. In this final project, the student working with the three factors previously appointed in order that understand the new user interactions with the physical world. 1 .- In relation to understanding the impact of technological phenomenon in the relationship people have with their environment, students are trained in handling the concepts of connectivity and collaborative work that enable new dynamics of information flows between devices, environment and people. 2 .- In relation to understanding the logic of operation of digital technologies, students work with the development of a project with different technologies, e.g. multitouch, image processing, microprocessors and sensors system and whiterboard. The Students work in groups and each addresses a particular technology that must learn to understand and operate. 3 .- In relation to understanding the impact of these technology in the user experience and interaction with information, students should understand one of the most important transformations in the design of products that integrate IT inside structure object changing the paradigm shift in interacting with objects, which is transformed from a passive object when they are manipulated by the user to perform an action, to be an
188
active object, with which the user develops a constant dialogue to develop a system of functions.
APPLICATION PROJECT The two displays designed and produced as prototypes have been designed for the Triennial Visual Art Chile 2009. This project has had as goal to be a system of promotion to the different activities will take place in this event. The project development has been a challenger for design students where the task was to work with different levels of design (understanding and using of specific technology, the tangible design, interactive design and design of the user experience) which conform a complex system of product that aims to enrich the user perception of content in an exhibition environment.
DESCRIPTION OF PROJECTS The project developed have been two, the Fractal display and Multitouch Display, which have take the three aspects mentioned before.
FRACTAL DISPLAY Fractal is a display of tangible interface technology based on visual identification codes (Codes Fiducial Amoeba). The system have aim to provoke an experience to facilitate the exploration, generating feelings of amazement and joy, through to give of hypermedia information, which allows the user to control which information is projected onto a horizontal surface with projected images. The aim of this multitouch display will be to to give interactive Information about specific exhibition of the Triennial Visual Art Chile 2009. The design will have to generate interest in the public to visit the exhibition. The interactive display is a promoter of the First Triennial of Visual Arts in Chile, considering the use of interactive technologies and Tangible Interface as a step in innovation in the Industrial Design, where the technology will be the mediator between man and information. The proposal is divided in six parts:
1.- Modular structure transportable
This is designed with special structure which inside have all the electronic components and in turn, its
exterior is has been designed to facilitate the user interaction with content.
2.- Container hardware
This consists of two elements, the first associated with the projection and the second associated with the programming.
3.- Software and hardware to enables the interaction.
Processing and Reactivision are open source software that work together with a multimedia projector, a webcam, four infrared LED lights, a keyboard, a mouse, two speakers, and a reflector element (Mirror)
4.- Hypermedia information
This is developed in the Processing software which will provide the information which the user will interact.
5.- Tangible Interfaces
Elements to manipulate digital information through a physical object, it donâ&#x20AC;&#x2122;t have electronic connections.
6.- User Experience
This is designed to improve understanding of the information presented in an exhibition space by manipulating tangible interfaces.
MULTITOUCH DISPLAY This project involves the design and production of an interactive system based on the MultiTouch technology, which consists in a touch-sensitive surface capable of recognizing multiple touch points simultaneously. The aim interactive system is to provoke a dynamic experience when the user manages and access to information. This display is constituted as a mediator between the user and information through exploration and discovery of content through touch. The user can act through natural movements, allowing you to control freely and according to their interests the information. The interactive surface allows multiple users to interact simultaneously with different information.
The multitouch display has the following elements: 1.- A container box that contains the hardware required for the functional the MultiTouch system, a structure composed of aluminum and plastic material contain components for operation and isolates the light the exterior. In the top of box, there is a surface touch sensitive composed of an methacrylate flat surface illuminated in his contour with LEDs infrared diode. 2.- Software and hardware that enable interaction:
189
A system of identification points (fingers on the surface) are recorded by a camera with infrared filter and processed by software that can convert these data points that allows the control the information. The interaction and content are projected on surface, generating a continuous dialogue between the user and the system.
c. - Hypermedia application:
A hypermedia application in Flash format contains the information with that the user can interact directly with their hands without any physical interface in between.
d. - Accessories
For protect the interactive surface that allow to move and to storage the display structure was designed. These consist in a folding flat surface in wood. Additionally, was designed a folding aluminum structure plastic wheels, that allows transport de display structure.
e. - The user experience The user experience allows users to control hypermedia information directly with their hands through natural movements. The designed user experience allows at people to explore information intuitively, generating greater interest on the contents presented, increasing the cognitive capacity for understanding the information
CONCLUSION The development project we had allowed to give to our student the basic tools for understands the basic aspect about the new scenarios in industrial design with IT inside structure. This way, they will development can work in the new product taking the new relationship between environment, product and user experience.
190
http://web.media.mit.edu/~ishii/
Bibliographical references AICHER, Otl, Análogico y digital, traducido por Yves Zimmermann, Barcelona, Editorial Gustavo Gili, S.A., 2001, 337 pp., Traducción de Analog und digital. ISBN: 84-252-1846-2 Nathan Shedroff , MBA in Design Strategy Program, California College of the Arts (CCA) http://www.experiencedesignbooks.com/ Hiroshi Ishii and Brygg Ullmer, MIT Media Laboratory, Tangible Media Group http://sigchi.org/chi97/proceedings/paper/hi.htm Javier Velasco M. School of Information and Library Sciences, University of North Carolina at Chapel Hill http://www.mantruc.com/publicaciones/disenointeraccion.pdf Xavier Serra Grupo de Investigación en Tecnología Musical (MTG) de la Universidad Pompeu Fabra, España http://www.iua.upf.edu/~xserra/
Hiroshi Ishii, Tangible Media Group. http://web.media.mit.edu/%7Eishii/ Volker Brauer (ARTEC) University of Bremen, Germany http://www.media.tuwien.ac.at/e.hornecker/Tangibles.ht ml Eva Hornecker, in the Dept. of Computer and Information Science, University of Strathclyde, Glasgow, UK. http://www.ehornecker.de/Tangibles.html CHI Academy http://sigchi.org/documents/awards/awards-2006.html Nathan Shedroff , MBA in Design Strategy Program, California College of the Arts (CCA) http://www.experiencedesignbooks.com/
Hiroshi Ishii and Brygg Ullmer, MIT Media Laboratory, Tangible Media Group http://sigchi.org/chi97/proceedings/paper/hi.htm
Herbert Spencer, Universidad Católica de Chile, Santiago http://www.ead.pucv.cl/wiki/images/b/b4/Diseño_de_In teracción.pdf
Javier Velasco M. School of Information and Library Sciences, University of North Carolina at Chapel Hill http://www.mantruc.com/publicaciones/disenointeraccion.pdf
Arhippainen y Tähti http://www.nosolousabilidad.com/articulos/experiencia _del_usuario.htm#Tahti%23Tahti
http://tangible.media.mit.edu/people/hiroshi.php Hiroshi Ishii, MIT Grupo de Medios de comunicación Tangible.
191
interação por gesto movimentos interativos
192
Reconhecimento de Gestos da LIBRAS com Classificadores Neurais a partir dos Momentos Invariantes de Hu Alex T. S. Carneiro alextcarneiro@gmail.com
Paulo C. Cortez cortez@lesc.ufc.br
Rodrigo C. S. Costa rodcosta@lesc.ufc.br
Laboratório de Engenharia de Sistemas de Computação - LESC Universidade Federal do Ceará - UFC Campus do PICI S/N, Bloco 723, Cx.Postal 6015, CEP. 60455-970, Fortaleza - CE - Brasil
ABSTRACT This paper studies the Hu’s Invariant Moments as image descritors of a LIBRAS’ hand gestures recognition and introduces the Self-Organizing Maps (SOM) algorithm for preclassification of the data. The evaluation of the proposed method is realized according to classification results of neural supervised classifiers. In this work, the image is acquired in YCbCr format and the skin regions are segmented using Cb and Cr thresholding. The segmentated region is used to evaluate the image moments. The image Features are pre-processed using SOM as a pre-classifying process, and then, classified using the studied neural classifiers. The results shows that the proposed method has higher hit rates (at least 89%) using a gesture set composed by the 26 letters of the LIBRAS’ alphabet.
Categories and Subject Descriptors H5.2 [Human-Computer Interaction (HCI)]: User Interfaces
potencial de ser aplicada no campo da interfaces homemm´ aquina [21]. A literatura apresenta duas formas principais de proporcionar a intera¸c˜ ao homem-m´ aquina por meio de gestos, sendo a primeira por meio de luvas com sensores espec´ıficos [20, 1, 6] e a outra por meio de t´ecnicas de vis˜ ao computacional [15, 18, 19, 2, 5]. Este trabalho descreve um m´etodo baseado na segunda categoria mencionada para o reconhecimento de gestos referentes as letras do alfabeto da LIBRAS, mostrada na Figura 1. Os surdos enfrentam dificuldades em seu processo de letramento que chegam at´e a impedir o avan¸co no fluxo da escolariza¸c˜ ao, fato decorrente da falta de contato destes com a l´ıngua falada e escrita. O sucesso em trabalhos como este abrem possibilidades para aplica¸c˜ oes baseadas em gestos, e possibilita a inclus˜ ao s´ ocio-digital de surdos [16].
Keywords LIBRAS, Vis˜ ao Computacional, Reconhecimento de Gestos
1.
INTRODUÇÃO
Os gestos s˜ ao usados pelas pessoas em sua comunica¸c˜ ao natural. Pessoas surdas utilizam os gestos que comp˜ oem a L´ıngua de Sinais, como principal forma de comunica¸c˜ ao com outras pessoas. Dentre estas, a LIBRAS (L´ıngua de Sinais Brasileira) ´e utilizada em nosso pais e tem ganhado uma importˆ ancia cada vez maior nos u ´ ltimos anos. O objetivo do reconhecimento de linguagem de sinais ´e fornecer um mecanismo eficiente e preciso para traduzir linguagem de sinais em texto ou fala. O reconhecimento de l´ıngua de sinais ´e uma ponte de comunica¸c˜ ao entre as pessoas com deficiˆencia auditiva e ouvinte. Entretanto, esta tecnologia tamb´em tem
Figure 1: Gestos que comp˜ oem o alfabeto da LIBRAS. Dentre os diversos trabalhos de reconhecimento de gestos desenvolvidos nos u ´ ltimos tempos, os trabalhos propostos por [22], [23], [17], [3] e [2] utilizam os descritores extra´ıdos da imagem da m˜ ao segmentada. Dentre estes descritores, destacam-se os Momentos Invariantes de Hu e os descritores de Fourier. O primeiro, associa baixa complexidade computacional e as altas taxas de acerto de gestos segundo a literatura, enquanto que, o segundo ´e mais complexo computacionalmente, n˜ ao sendo tratado neste trabalho devido esta caracter´ıstica. Os descritores extra´ıdos s˜ ao aplicados em sistemas de classi-
193
fica¸c˜ ao supervisionada. Grande parte dos trabalhos presentes na literatura leva em considera¸c˜ ao a dinˆ amica do movimento do gesto atrav´es dos Modelos Escondidos de Markov [13], tornando assim o procedimento mais complexo. A proposta deste trabalho ´e adotar os Momentos Invariantes de Hu como descritores das imagens e usar algoritmos de classifica¸c˜ ao cl´ assicos, baseados em redes neurais, para fazer o reconhecimento do gesto a cada frame capturado com uma abordagem menos complexa. Al´em disso, ´e avaliado o desempenho de cada classificador.
apresenta os referidos limiares 77 ≤ Cb ≤ 127 . 133 ≤ Cr ≤ 173
(1)
A Figura 2 apresenta alguns dos resultados obtidos com a aplica¸c˜ ao da segmenta¸c˜ ao da pele. A efic´ acia do algoritmo ´e comprovada pela an´ alise das imagens segmentadas em n´ıveis de cinza, em que observa-se que a regi˜ ao segmentada corresponde a pele e n˜ ao existem regi˜ oes relevantes segmentadas erroneamente.
E ainda, diferentemente dos trabalhos exitentes na literatura, o m´etodo proposto neste trabalho acrescenta uma etapa de pr´e-classifica¸c˜ ao n˜ ao-supervisionada, o que possibilitou o reconhecimento de 26 gestos distintos, em contraste com os demais trabalhos que fazem reconhecimento de, no m´ aximo, 5 gestos. Apesar da grande quantidade de gestos, as taxas de acerto obtidas s˜ ao compat´ıveis com a literatura. (a)
(b)
Uma forma de identificar gestos por vis˜ ao computacional ´e feita a partir da extra¸c˜ ao de caracter´ısticas da m˜ ao segmentada. Dentre as caracter´ısticas de objetos segmentados dispon´ıveis na literatura, os Momentos Invariantes de Hu possuem propriedades muito u ´ teis para o reconhecimento de gestos, das quais se destacam a invariˆ ancia ` a transla¸c˜ ao, rota¸c˜ ao e escala [10]. Este trabalho prop˜ oe um sistema de reconhecimento de gestos por vis˜ ao computacional em que o processo de reconhecimento das imagens ´e baseado nos Momentos Invariantes de Hu submetidos ` a uma pr´e-classifica¸c˜ ao n˜ ao-supervisionada, implementada pelos Mapas de Kohonen, seguida dos classificadores neurais que implementam classifica¸c˜ ao supervisionada para a determina¸c˜ ao dos gestos. Os algoritmos estudados s˜ ao apresentados na Se¸c˜ ao 2, na Se¸c˜ ao 3 o sistema proposto ´e descrito globalmente e, por fim, as Se¸c˜ oes 4 e 5 apresentam e discutem, respectivamente, os resultados experimentais obtidos e uma an´ alise final do trabalho.
2.
(c)
(d)
(e)
(f)
Figure 2: a) e b) Imagens originais, c) e d) imagens bin´ arias resultantes da segmenta¸ c˜ ao e e) e f ) imagens segmentadas em n´ıveis de cinza.
FUNDAMENTAÇÃO TEÓRICA
Nesta se¸c˜ ao s˜ ao descritos os fundamentos conceituais utilizados na elabora¸c˜ ao deste trabalho.
2.1 Segmentação
Atrav´es da Figura 2, observa-se a qualidade da segmenta¸c˜ ao deste m´etodo, no qual, a regi˜ ao segmentada corresponde a pele e n˜ ao existem regi˜ oes relevantes segmentadas erroneamente.
A segmenta¸c˜ ao consiste em isolar o(s) objeto(s) de interesse em uma imagem atribuindo r´ otulos aos pixels, por exemplo, 1 caso perten¸ca ao objeto de interesse ou 0, caso contr´ ario [7]. A segmenta¸c˜ ao pode ser a etapa mais cr´ıtica do processo, pois todas as etapas seguintes s˜ ao dependentes do resultado da segmenta¸c˜ ao.
2.2 Momentos Invariantes de Hu
Neste trabalho, o objeto de interesse ´e a m˜ ao do usu´ ario do sistema. A m˜ ao ´e localizada utilizando um algoritmo de segmenta¸c˜ ao de pele humana. Segundo [4], a pele humana ´e facilmente segmentada quando representada em imagens coloridas.
O Momento Centrado de ordem pq em uma imagem f (x, y) ´e definido por [12] Z ∞ Z ∞ µpq = (x − x ¯)p (y − y¯)q f (x, y)dxdy, (2)
O algoritmo de segmenta¸c˜ ao de pele adotado neste trabalho consiste na aplica¸c˜ ao de dois limiares nos canais Cb e Cr da imagem codificada em YCbCr [14]. A equa¸c˜ ao a seguir
Os Momentos Invariantes de Hu, baseados nos Momentos Centrados, consistem em um conjunto de 6 atributos e s˜ ao apresentados como descritores de formas para objetos em imagens [7, 12].
−∞
−∞
T
em que [¯ x y¯] correspondem ao centro de massa da imagem f (x, y) e s˜ ao definidos por x ¯=
R∞ R∞ xf (x,y)dxdy R−∞ R−∞ ∞ ∞ −∞ −∞ f (x,y)dxdy
e y¯ =
R∞ R∞ yf (x,y)dxdy R−∞ R−∞ ∞ ∞ −∞ −∞ f (x,y)dxdy
.
(3)
194
A partir da defini¸ca ˜o dos momentos centrados, podem-se definir os Momentos Invariantes de Hu da seguinte forma φ1 = µ20 + µ02 , φ2 = (µ02 − µ20 )2 + 4µ211 , φ3 = (µ30 − 3µ12 )2 + (µ03 − 3µ21 )2 , φ4 = (µ30 + µ12 )`2 + (µ03 + µ21 )2 , ´ φ5 = (µ30 − 3µ12 )(µ30 + µ12`) (µ30 + µ12 )2 − 3(µ03 + µ21´)2 2 2 +(µ03 − 3µ21 )(µ03 + µ`21 ) (µ03 + µ21 ) − 3(µ30 + µ´12 ) , φ6 = (µ20 − µ02 ) (µ30 + µ12 )2 − (µ03 + µ21 )2 +4µ11 (µ30 + µ12 )(µ03 + µ21 ). (4) O vetor x = [φ1 φ2 φ3 φ4 φ5 φ6 ]T corresponde a entrada dos classificadores usados na identifica¸c˜ ao dos gestos.
2.3 Classificadores Algoritmos de classifica¸c˜ ao (classificadores) s˜ ao t´ecnicas computacionais de reconhecimento de padr˜ oes, de modo a possibilitar a distin¸c˜ ao dos dados nas classes existentes. Existem diversos classificadores, entretanto neste trabalho s˜ ao usados, para efeito de avalia¸c˜ ao de desempenho, os classificadores Perceptron Simples (PS) e o Perceptron Multi-camadas (MLP).
2.3.1 Mapas de Kohonen Os Mapas Auto-Organiz´ aveis (SOM) s˜ ao redes neurais de aprendizagem n˜ ao-supervisionada usados em situa¸c˜ oes que envolvem quantiza¸ca ˜o vetorial ou clustering. As redes SOM s˜ ao compostas por neurˆ onios, identificados por um vetor de pesos m i = [µi1 µi2 ... µin ]T ∈ ℜn , os quais s˜ ao dispostos em um grid de uma ou duas dimens˜ oes conforme apresentado na Figura 3 [11].
corresponde ` a fun¸c˜ ao vizinhan¸ca da rede neural. Os parˆ ametros α(t) e σ(t) s˜ ao fun¸c˜ oes monotonicamente decrescentes ao que estabilizam a aprendizagem, e ri representa a posi¸c˜ do i-´esimo neurˆ onio na rede neural [11]. O algoritmo de aprendizagem ´e repetido at´e que uma condi¸c˜ ao de parada seja estabelecida.
2.3.2 Redes perceptron Os classificadores neurais s˜ ao baseados em algoritmos de inteligˆencia computacional denominados redes neurais [8, 9]. As redes neurais podem apresentar diversas arquiteturas, neste trabalho s˜ ao utilizadas duas redes neurais supervisionadas: Perceptron Simples (PS) e Multi-Layer Perceptron (MLP). As arquiteturas de redes neurais abordadas neste trabalho s˜ ao contitu´ıdas de elementos chamados neurˆ onios perceptron, estes s˜ ao formados de um vetor de entrada x = [x1 , x2 , ..., xn ]T , um vetor de pesos w = [w1 , w2 , ..., wn ]T , um valor de limiar b e uma sa´ıda y dada conforme a equa¸c˜ ao y = ϕ (x · w − b) ,
(8)
em que ϕ(.) ´e a fun¸c˜ ao de ativa¸c˜ ao da rede neural, normalmente adotam-se fun¸c˜ oes sigmoidais como a sigm´ oide log´ıstica ou a tangente hiperb´ olica. Neste trabalho ´e utilizada a tangente hiperb´ olica por esta apresentar uma diferen¸ca maior entre os limites m´ınimo e m´ aximo [8]. A capacidade da rede neural de realizar o reconhecimento de padr˜ oes prov´em da etapa de treinamento da mesma, que tem por objetivo modificar os pesos dos neurˆ onios de tal modo que estes realizem a tarefa desejada. O algoritmo mais difundido para o treinamento de redes neurais MLP ´e o algoritmo de retro-propaga¸c˜ ao do erro para altera¸c˜ ao dos pesos [8]. O treinamento da rede PS segue os seguintes passos, os quais s˜ ao aplicados a cada neurˆ onio de forma independente [12]:
(a)
(b)
Figure 3: Rede SOM de (a) uma e (b) duas dimens˜ oes. A aprendizagem, ou treinamento, da rede SOM acontece em dois passos principais, para cada padr˜ ao de entrada, representado por x = [φ1 φ2 ... φn ]T ∈ ℜn , apresentado. O primeiro passo ´e determinar o neurˆ onio mais semelhante ao padr˜ ao de entrada x , representado por m c c = arg min {�x − m i �} . ∀i
(5)
Uma vez determinado o neurˆ onio m c , o segundo passo do treinamento da rede SOM consiste em atualizar os pesos dos neurˆ onios da rede
1. Para uma entrada x , cuja sa´ıda desejada para a rede PS seja conhecida (d). 2. Computa-se a sa´ıda yj fornecida pela rede neural, conforme a Equa¸c˜ ao 8. 3. Atualizar o vetor w j segundo a Equa¸c˜ ao w j (t) = w j (t − 1) + αx (d − y),
(9)
em que α corresponde ao ganho de adapta¸c˜ ao ou passo de aprendizagem. 4. Retornar ao segundo passo at´e que uma condi¸c˜ ao de parada seja obtida. As referˆencias [8, 9] apresentam a prova da convergˆencia do algoritmo de treinamento apresentado.
m i (t + 1) = m i (t) + hci (t) (x − m i ) ,
(6)
„ « �rc − ri �2 hci (t) = α(t) exp − 2σ 2 (t)
O processo de atualiza¸c˜ ao dos pesos dos neurˆ onios para uma rede MLP ´e semelhante ` a rede PS, por´em, a equa¸c˜ ao de atualiza¸c˜ ao dos pesos ´e dada por
(7)
w j (t) = w j (t − 1) + αx φ˙ (νj ) (d − y),
em que
(10)
195
3.1.2 Classificação dos gestos
em que p
νj =
X
wji y,
(11)
i=0
sendo p o total de neurˆ onios na camada do j-´esimo neurˆ onio. A referˆencia [8] descreve detalhadamente como obter o reonios da rede MLP. sultado ej φ˙ (νj ) para todos os neurˆ
3.
A pr´e-classifica¸c˜ ao ´e implementada por uma rede SOM que mapeia toda a informa¸c˜ ao de treinamento separando-as por cluster, em que cada cluster det´em um conjunto de classes, ou seja, cada cluster, ap´ os o treinamento da rede de pr´e-classifica¸c˜ ao, mapeia algumas das 26 classes (letras do alfabeto da LIBRAS), e para cada cluster ´e treinada uma rede neural perceptron que identifica a classe propriamente dita, conforme ilustrado na Figura 5.
METODOLOGIA
Nesta se¸c˜ ao ´e feita a descri¸c˜ ao global do sistema proposto.
3.1 Sistema Proposto O sistema proposto est´ a mostrado, em diagrama de blocos, na Figura 4. A primeira etapa do sistema ´e a captura da imagem pela cˆ amera, a etapa seguinte consiste na segmenta¸c˜ ao da m˜ ao do usu´ ario de acordo com o algoritmo apresentado na Subse¸c˜ ao 2.1, a seguir os Momentos Invariantes de Hu s˜ ao calculados a partir da imagem segmentada e, por fim, o vetor obtido ´e passado para uma etapa de pr´e-classifica¸c˜ ao atrav´es de uma rede SOM e classificado atrav´es de classificadores neurais supervisionados1 .
Figure 4: Diagrama do sistema proposto. A maior contribui¸c˜ ao deste trabalho est´ a na proposta da pr´e-classifica¸c˜ ao que reduz o n´ umero de classes que o classificador final precisa identificar.
3.1.1 Aquisição das Imagens As imagens utilizadas neste trabalho foram geradas nas dependˆencias da Federa¸c˜ ao Nacional de Educa¸c˜ ao e Integra¸c˜ ao de Surdos (FENEIS - Ce) e da Associa¸c˜ ao de Pais e Amigos de Deficientes Auditivos (APADA - Ce) em um ambiente de ilumina¸c˜ ao controlada. Foram geradas 50 imagens de 3 pessoas diferentes para cada um dos 26 gestos, totalizando 3900 imagens. O equipamento utilizado neste processo foi uma webcam VGA (resolu¸c˜ ao de 640 x 480 pixels) ligada a um laptop. Os softwares usados para gerar as imagens foram o Scilab juntamente a toolbox SIVp2 . As imagens obtidas s˜ ao direcionadas primeiramente ` a segmenta¸c˜ ao da pele e em seguida ` a extra¸c˜ ao de atributos, conforme os algoritmos apresentados nas Subse¸c˜ oes 2.1 e 2.2, respectivamente. 1
Na etapa de classifica¸c˜ ao com rede neurais MLP, estas foram utilizados com 1 camada oculta. 2 Os softwares usados neste trabalho est˜ ao dispon´ıveis gratuitamente em http://www.scilab.org/.
Figure 5: Diagrama do processo de reconhecimento dos gestos. A Figura 5 apresenta um caso em que a rede de Kohonen, que faz a pr´e-classifica¸c˜ ao, tem seis neurˆ onios. A etapa de pr´e-classifica¸c˜ ao possibilita o reconhecimento de uma quantidade maior de classes, visto que o espa¸co de busca da rede neural supervisionada torna-se compat´ıvel com a capacidade de reconhecimento da mesma. As redes MLP adotadas nos testes apresentam seis neurˆ onios na camada escondida, este valor foi definido pelo m´etodo da m´edia em que o n´ umero de neurˆ onios da camada oculta, noc, ´e a m´edia do n´ umero de entradas, ne, (seis) e do n´ umero de sa´ıdas, ns, (m´ aximo de seis): noc = ne+ns = 6. 2
4. RESULTADOS Esta se¸c˜ ao apresenta primeiramente os resultados da pr´eclassifica¸c˜ ao e, em seguida, os resultados obtidos na fase classifica¸c˜ ao final. Para as etapas de treinamento e valida¸c˜ ao dos classificadores os dados dispon´ıveis foram divididos em dois grupos de 70% e 30%, respectivamente.
4.1 Resultados da pré-classificação A pr´e-classifica¸c˜ ao tem por objetivo reduzir a quantidade de classes para o classificador final. Neste trabalho foram realizados testes com o algoritmo SOM para obter clusters com no m´ aximo seis classes. A Tabela 1 apresenta a rela¸c˜ ao de classes por cluster para cada uma das trˆes pessoas.
196
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 T GLMNXY EZ CPX BI P ARW FHUV JK OS Q D
Pessoa 2 ABEISX GHKPTZ J FRU LVWZ CIMNQY D O -
3 Z CRU H AEIMSX FT J FKPV DO BGLW LNQSY
Table 1: Tabela de resultados da pr´ e-classifica¸ c˜ ao.
A perten¸ca de uma classe a um determinado cluster ocorre quando ao menos 13 dos dados de treinamento desta classe pertencem ao cluster referido. Observa-se na Tabela 1 a existˆencia de clusters com que mapeiam uma u ´ nica classe ou nenhuma classe, para estes casos, quando uma amostra de teste incide sobre algum destes clusters, esta ´e diretamente classificada como a classe mapeada pelo cluster ou descartada, respectivamente.
4.2 Resultados da classificação Cada cluster que tenha mapeado duas ou mais classes ´e seguido de uma rede neural perceptron. Os gr´ aficos das Figuras 6 e 7 mostram as taxas de acerto m´edias e os desvios padr˜ ao obtidos no reconhecimendo dos dados de teste para as redes neurais PS e MLP, respectivamente, para cada uma das trˆes pessoas.
1
Taxa de acerto (×100%)
Cluster
Pessoa 1 Pessoa 2 Pessoa 3
0.8 0.6 1 0.8 0.6 1 0.8 0.6 0.4 2
4
6
8
10
´Indice dos Neurˆ onios
12
14
Figure 7: Taxas de acerto, por cluster, para cada uma das trˆ es pessoas usando a rede MLP. cluster. A Tabela 2 apresenta o resultado obtido para cada uma das pessoas com as redes PS e MLP considerando todo o processo de classifica¸c˜ ao. Tipo de Rede Neural PS MLP
PS MLP
PS MLP
Pessoa 1 M´ ax M´ın 0,97 0,81 0,95 0,79 Pessoa 2 M´ed M´ ax M´ın 0,89 0,95 0,82 0,87 0,93 0,78 Pessoa 3 M´ed M´ ax M´ın 0,92 0,97 0,87 0,93 0,97 0,87 M´ed 0,89 0,89
Table 2: Tabela de resultados por classificador.
Taxa de acerto (×100%)
1
Pessoa 1 Pessoa 2 Pessoa 3
0.8
O resultado para cada uma das redes neurais ´e obtido pela m´edia aritm´etica dos resultados de cada pessoa, de modo que a taxa de acerto m´edia para a rede PS ´e de 0,89+0,89+0,92 = 3 = 0, 8966. 0, 9 e para a rede MLP: 0,89+0,87+0,93 3
1 0.8
5. CONCLUSÕES
1 0.8 0.6 2
4
6
8
10
´Indice dos Neurˆ onios
12
14
Figure 6: Taxas de acerto, por cluster, para cada uma das trˆ es pessoas usando a rede PS. Os resultados apresentados nas Figuras 6 e 7 foram obtidos ap´ os com 100 testes com os dados de valida¸c˜ ao dos classificadores. As taxas de acerto finais, incluindo todos os 26 gestos, s˜ ao obtidas pela m´edia ponderada das taxas de acerto por
Neste trabalho, a an´ alise das caracter´ısticas e m´etodo de classifica¸c˜ ao s˜ ao avaliadas. Para isto, foi utilizado um ambiente controlado e com poucos detalhes. Este trabalho apresentou os Momentos Invariantes de Hu para como descritores de imagens Ambos os classificadores mostraram-se eficientes na tarefa de classifica¸c˜ ao de gestos apresentando taxas de acerto m´edias superiores a 89%, dentro dos padr˜ oes encontrados na literatura para quantidades de gestos reduzidas. Todavia, a literatura encontrada n˜ ao apresenta testes com quantidades superiores a cinco gestos, enquanto que o sistema proposto obteve resultado semelhantes com vinte e seis gestos. A segmenta¸c˜ ao da m˜ ao ´e um aspecto cr´ıtico do sistema e necessita ser avaliado para tornar o sistema mais robusto as
197
varia¸c˜ oes do ambiente, pois as imagens usadas neste trabalho foram obtidas em um ambiente controlado. As pr´ oximas atividades relativas a este trabalho consistem em avaliar e implementar algoritmos de realce e filtragem para melhorar a segmenta¸c˜ ao e torn´ a-la robusta quanto a varia¸c˜ oes de ilumina¸c˜ ao do ambiente. Em trabalhos futuros ser˜ ao avaliadas m´etodos de segmenta¸c˜ ao robustos as varia¸c˜ oes do ambiente, para possibilitar o uso do m´etodo proposto em diversos ambientes.
Agradecimentos Os autores gostariam de agradecer ` a Funda¸c˜ ao Cearense de Apoio ao Desenvolvimento Cient´ıfico e Tecnol´ ogico (FUNCAP) pelo apoio financeiro, ao Laborat´ orio de Engenharia de Sistemas de Computa¸c˜ ao (LESC) pelo fornecimento das condi¸c˜ oes necess´ arias para o desenvolvimento deste trabalho e` a Federa¸c˜ ao Nacional de Educa¸c˜ ao e Integra¸c˜ ao de Surdos (FENEIS - CE) e a ` Associa¸c˜ ao de Pais e Amigos de Deficientes Auditivos (APADA - CE) pelas imagens obtidas para elabora¸c˜ ao deste trabalho.
6.
REFERENCES
[1] H. Brashear, V. Henderson, K.-H. Park, H. Hamilton, S. Lee, and T. Starner. American sign language recognition in game development for deaf children. Proceedings of the 8th international ACM SIGACCESS conference on Computers and accessibility, pages 79 – 86, 2006. [2] P. Campr, M. Hr´ uz, A. Karpov, P. Santemiz, ˇ M. Zelezn´ y, , and O. Aran. Sign-language-enabled information kiosk. Proceedings of Summer Workshop on Multi-Modal Interfaces, pages 24 – 33, 2008. [3] S. Conseil, S. Bourennane, and L. Martin. Comparison of fourier descriptors and hu moments for hand posture recognition. Proceedings of Eusipco, pages 1960 – 1964, 2007. [4] T. M. de Oliveira, P. C. Cortez, W. P. da Silva, J. M. Soares, and G. C. Barroso. Segmenta¸c˜ ao de pele humana em imagens de v´ıdeo utilizando wavelet e redes neurais. II Workshop de Vis˜ ao Computacional, 2006. [5] K. P. de Souza, J. B. Dias, and H. Pistori. Reconhecimento autom´ atico de gestos da l´ıngua brasileira de sinais utilizando vis˜ ao computacional. III Workshop de Vis˜ ao Computacional, 2007. [6] T. M. Gabardo. Reconhecimento computacional da l´ıngua brasileira de sinais. Monografia, UnicenP, 2005. [7] R. C. Gonzalez and R. E. Woods. Digital Image Processing. Prentice Hall, 3nd edition, 2008. [8] S. Haykin. Neural Networks: A Comprehensive Foundation. Prentice Hall, 2nd edition, 1999. [9] J. A. Hertz, R. G. Palmer, and A. Krogh. Introduction to the Theory of Neural Computation. Westview, 1st edition, 1998. [10] M.-K. Hu. Visual pattern recognition by moment invariants. Ire Transactions on Information Theory, pages 179–187, 1962. [11] T. Kohonen. Self-Organizing Maps. Springer, 3nd edition, 2001.
[12] J. S. Marques. Reconhecimento de padr˜ oes: m´etodos estat´ısticos e neuronais. Ensino da Ciˆencia e da Tecnologia, 2nd edition, 2005. [13] A. Papoulis and S. U. Pillai. Probability, Random Variables and Stochastic Processes. Mcgraw Hill Companies, 4th edition, 2002. [14] S. L. Phung, A. Bouzerdoum, and D. Chai. Skin segmentation using color pixel classification: analysis and comparison. IEEE Transactions on Pattern Analysis and Machine Intelligence, 27(1):148 – 154, 2005. [15] H. L. Ribeiro and A. Gonzaga. Reconhecimento de gestos de m˜ ao usando o algoritmo gmm e vetor de caracter´ısticas de momentos de imagem. II Workshop de Vis˜ ao Computacional, 2006. [16] M. J. A. Sampaio. A constru¸c˜ ao de textos na escrita de surdos: estrat´egias do sujeito na transi¸c˜ ao entre sistemas lingu´ısticos. Master’s thesis, Universidade Federal da Para´ıba, 2007. [17] K. P. Souza and H. Pistori. Geometric features for improving continuous appearance-based sign language recognition. Simp´ osio Brasileiro de Computa¸c˜ ao Gr´ afica e Processamento de Imagens, 2005. [18] C. Vogler and D. Metaxas. Parallel hidden markov models for american sign language recognition. Proceedings of the International Conference on ˘ S 25, 1999. Computer Vision, page 22 ˆ aA¸ [19] C. Vogler and D. Metaxas. Handshapes and movements: Multiple-channel asl recognition. Springer Lecture Notes in Artificial Intelligence 2915, page 247 ˘ S 258, 2004. aA¸ ˆ [20] H. Wang, M. C. Leu, and C. Oz. American sign language recognition using multi-dimensional hidden markov models. Journal of Information Science and Engineering, (22):1109 – 1123, 2006. [21] Q. Wang, X. Chen, L.-G. Zhang, C. Wang, and W. Gao. Viewpoint invariant sign language recognition. Computer Vision and Image Understanding, 108:87–97, 2007. [22] M. Zahedi. Robust Appearance-based Sign Language Recognition. PhD thesis, Rheinisch-Westf¨ alischen Technischen Hochschule Aachen, 2007. [23] M. Zahedi, P. Dreuw, D. Rybach, T. Deselaers, and H. Ney. Geometric features for improving continuous appearance-based sign language recognition. Proceedings of British Machine Vision Association, 3:1019 – 1029, 2006.
198
Correction of high lighting using histogram matching for skin segmentation on white background images Alex T. S. Carneiro alextcarneiro@gmail.com
Paulo C. Cortez cortez@lesc.ufc.br
Rodrigo C. S. Costa rodcosta@lesc.ufc.br
Laboratório de Engenharia de Sistemas de Computação - LESC Universidade Federal do Ceará - UFC Campus do PICI S/N, Bloco 723, Cx.Postal 6015, CEP. 60455-970, Fortaleza - CE - Brazil
ABSTRACT In this work, the histogram matching is used as a tool to improve the skin segmentation in images with white background and high illumination. Traditional skin detection algorithms realize the segmentation without doing any enhancement in the images and the proposed enhancement method solves this point. The results of this work demonstrate that the proposed method improves the quality of image segmentation at least 75%, when compared with manual segmentation.
Categories and Subject Descriptors I4.8 [Image Processing and Computer Graphics]: Scene Analysis
Keywords Skin segmentation, Image enhancement, Histogram matching
1.
INTRODUCTION
Human Computer Interfaces (HCI) are becoming smarter to each year [26]. Some techniques used in HCI are intelligent sensors [25, 4, 24] and Computer Vision (CV) [22, 26, 8, 5, 23]. Many state of art systems based on CV need an adicional device to make the object detection easier, but those systems are uncomfortable for users [5, 23]. So, systems that interact directly with human body are more indicated for common users.
togram [10]. This technique requires the knowledge of a established background. During the study, images with white background were used to specify the histogram. This work is part of a Brazilian Sign Language Recognition System. This work is organized as follow. Section 3 presents and describes the background algorithm used in the work. The experimental setup is described in Section 4. The proposed method is explained in the Section 5. The results are presented in Section 6 and Section 7 presents the conclusion and comments.
2. RELATED WORKS Skin segmentation is an important component in many systems for human-computer interaction or any system that should detect people, like systems for security or monitoring [2, 27, 21, 1, 12, 11, 3]. The more used approaches involve models of statistical analysis of the images [21, 1] or changes in the imaging devices [12, 3].
3. BACKGROUND This work proposes a technique to improve skin segmentation and this section presents the used algorithms and describes how they work.
3.1 Histogram matching
Skin segmentation is a fundamental step in many Human Computer Interfaces that interact directly with human body, like gesture based. A key problem of this kind of algorithm is it dependence of illumination conditions [20, 27]. This work proposes a technique to correct high illumination and to improve the skin segmentation in a white background, while the state of art doesn’t address this interesting aspect.
The histogram of a digital image with gray levels in the range [0, L − 1] is a discrete function h(rk ) = nk , where rk is the k-th gray level and nk is the number of pixels in the image having the gray level rk [10]
The proposed method consists in apply the histogram matching to change the original histogram to a controlled his-
for an image with N pixels and p(x) is the incidence’s probability of x in the image.
nk =
p(rk ) , N
(1)
The histogram matching, or histogram specification, is an algorithm for change the histogram to any other shape using two functions, T (r) and G(z), as follow [10]. Given pr (r) the original histogram, T (r) is given by T (r) =
Zr
pr (w)dw,
(2)
0
199
and, given a desired histogram pz (z), G(z) is given by G(z) =
Zz
pz (t)dt,
(3)
0
where w and t are dummy variables. (a)
(b)
Doing G(z) = T (r), so the obtained transformation is z = G−1 [T (r)] .
(4)
So, for each pixel’s value r the histogram matching applies the transformation z = G−1 [T (r)], and the result is an image which its histogram is similar to pz (z) desired.
3.2 Color images models In this work, the images are represented in color models because skin is better represented in color images [9]. Color images have three channels of color, usually RGB (Red Green - Blue) the basic color components [10]. Other representations of colors are obtained using transformations over the image, the most commons are: YCbCr (Luminance - Chrominance blue - Chrominance red), CMY (Cyan - Magenta - Yellow) and HSV (Hue - Saturation - Value). Each color representation enhances different features from the image, e.g. the YCbCr decomposes the image in one channel for bright (luminance) and two channels for colors (chrominance blue and chrominance red) [14, 7]. The RGB to YCbCr transformation is given by [7] Y = 0.299R + 0.587G + 0.114B, Cb = 0.564(B − Y ), Cr = 0.713(R − Y ).
(5)
The skin segmentation algorithm used in this work uses the components Cb and Cr. Those components have no bright information, but they undergo influence of the light and it may do the segmentation worse. The most ones works in the literature use the components Cb and Cr in skin segmentation algorithms, presented in [9], [6] and [13].
3.3 Skin segmentation
Figure 1: Images for validation of the skin segmentation algorithm (a) original image and (b) image segmented.
and the result of thresholding algorithm. However, the high lighting intensity may change the acquirement colors. Observing the Figure 1, the algorithm segments dark and clear skins correctly, but it confuses skin with red regions (non-skin). Therefore, the test’s images were obtained in a controlled environment without red regions.
4. EXPERIMENTAL SETUP This work was developed in a Notebook with the following configuration: Intel Core 2 Duo processor, 2 GB of RAM memory. The images were captured using a VGA webcam (640 x 480 pixels) with focus control. The softwares used in this work, for development of the algorithms and simulations, were the Scilab and the toolbox for image manipulating Scilab Image and Video Processing toolbox (SIVp), over the GNU/Linux Ubuntu 8.04 operating system. About the SIVp toolbox, it provides a set of functions of image manipulation and processing, for this work were used functions for read/write files and convert the color model RGB to YCbCr. The SIVp toolbox adds a constant term of 128 in the Cb and Cr components, so the used transformation from RGB to YCbCr is Y = 0.299R + 0.587G + 0.114B, Cb = 0.564(B − Y ) + 128, Cr = 0.713(R − Y ) + 128.
(7)
Segmentation is a process of labeling in the image to identify desired regions on the image [10, 18]. In this work, the region desired is the human skin, in special the hand.
The softwares were chosen because they are free software and compatible with the proposed application. All softwares used in this work are available for freely download in: http://www.scilab.org/ and http://www.ubuntu.com/.
The algorithm used for skin segmentation is implemented like following. The color coding used is the YCbCr. The Cb and Cr components of each pixel are analyzed using the following Equation [17]
5. PROPOSED METHOD
77 ≤ Cb ≤ 127 and 133 ≤ Cr ≤ 173
5.1 Histogram of reference
(6)
the Equation 6 characterizes an image thresholding in the channels Cb and Cr of the image. This is a key algorithm for skin segmentation because its simplicity and different skin tones are grouped in a specified region, the difference between two, or more, persons is the absorption of light by the skin. The Figure 1 shows an image
The proposed method consists in specify the desired histogram pz (z) presented in the Equation 3.
The images have two regions: hand and background. So, the histogram presents two concentrations of pixels: one to the hand and other to the background, like showed at the Figure 2. The hand’s concentration is called Gh (Cb, Cr) and the background’s concentration is called Gb (Cb, Cr). Analyzing the histograms of the Figures 2(c) and 2(d), the
200
deviations and amplitudes for Gb (Cb, Cr) and Gh (Cb, Cr), respectively. Using the separability property of independent random variables [15], the distribution may be rewritten as following G(Cb, Cr) = G(Cb)G(Cr), (a)
this property will be useful to specify the parameters of the reference’s histogram for each component.
(b)
5.2 Determination of the gaussians’ parameters
0.40
0.35
0.30
So, to determinate the standard deviation and amplitude of each gaussian, the following information is necessary
pr (r)
0.25
0.20
0.15
0.10
0.05
0.00
(10)
0
50
100
150
200
250
300
Ampl {Gb (Cb, Cr)} = 10Ampl {Gh (Cb, Cr)} ,
(11)
Area {Gb (Cb, Cr)} = 7Area {Gh (Cb, Cr)} .
(12)
and
Cb
(c) 0.45 0.40 0.35
pr (r)
0.30
The Equations 11 and 12 may be rewritten as
0.25 0.20
Gb (µb ) = 10Gh (µh ),
0.15
(13)
0.10
and
0.05 0.00
0
50
100
150
200
250
300
R∞ R∞
Cr
(d)
Gb (x, y)dxdy = 7
−∞ −∞
Figure 2: (a) Image in analysis and histograms of (c) Cb, (d) Cr components and (b) segmentation results.
R∞ R∞
The result of skin segmentation algorithm applied to image of the Figure 2(a) is shown in Figure 2(b), this image is the best result possible of be obtained and it was captured in a controlled lighting environment. The black region on the Figure 2(b) corresponds to the skin region in the original image presented in Figure 2(a).
Substituting the Equations 8 and 9 in the Equations 13 and 14 obtains the following relations
Supposing that the both concentrations are independent gaussians, but each one has different means, standard deviations and amplitudes, the distributions of background Gb and hand Gh are given respectively by Gb (Cb, Cr) = √
− Ab e 2πσb
�
[Cb Cr]−µb T 2σ2 b
�
Ab σh . 10Ah
(15)
Thus, any values according to the Equation 15 may be used, but computational limitations introduce some restrictions. The work [19] presents the values for µh =
µh = The image of Figure 2(b) has about 14,3%, approximately 1 , of white pixels, thus the area with greater concentration 7 may be considered seven times greater than the other.
(14)
respectively.
Ab = 7Ah and σb = conclusion is that the greater concentration (background) is about ten times higher than the other.
Gh (x, y)dxdy ,
−∞ −∞
»
»
114.872 148.875
–
,
»
µCb µCr
–
: hand
(16)
–
µCb is obtained doing R = G = µCr background B = 255 in the Equation 7: and µb =
µb =
»
128 128
–
.
(17)
2
(8)
The value of σh used is σh = 1.0e − 3, thus σb = 7.0e − 4. The value of Ah used is Ah = 1, thus Ab = 7.
and �[Cb Cr]−µh T �2 − Ah 2σ2 h , (9) e Gh (Cb, Cr) = √ 2πσh – – » » µCb µCb and µh = , σ where µb = µCr background µCr hand b and σh , and Ab and Ah are the means (vector), standard
The desired histogram is obtained with the adding Gb (Cb, Cr)+ Gh (Cb, Cr). Using the Equation 10, the desired histogram for each component is given by p(x) = Gb (x) + Gh (x).
(18)
The obtained reference’s histograms are shown in Figure 3.
201
4000
3500
3000
pz (z)
2500
2000
1500
1000
500
0
0
50
100
(a)
150
200
250
(a)
(b)
(c)
(d)
(e)
(f)
300
Cb
4000
3500
3000
pz (z)
2500
2000
1500
1000
500
0
0
50
100
(b)
150
200
250
300
Cr
Figure 3: Histograms of reference for the (a) Cb and (b) Cr components.
Figure 4: (a), (c) and (e) original images and (b), (d) and (f ) segmentation results.
RESULTS
The images used in the tests and the results obtained with the skin segmentation algorithm are shown on the Figure 4, those images show three gestures of the Libras, the Figure 4(a) shows the letter ’A’, the Figure 4(c) shows the letter ’B’ and the Figure 4(e) shows the letter ’G’. This figure presents images with bad segmentation with inadequate illumination, and it modifies the captured colors from the skin.
0.12
0.10
0.08
pz (z)
6.
0.06
0.04
0.02
The original images were captured in a place with natural illumination and them backgrounds are white predominant.
0.00
0
50
100
(a) The Figure 5 shows the histograms of the image from the Figure 4(a). According with this figure, may be observed that the Cb component is very concentrated, seeming like the image have only one object.
150
200
250
300
200
250
300
Cb
0.18 0.16 0.14
pz (z)
0.12
The enhanced histograms obtained after the application of the proposed method are shown on the Figure 6. These histograms have two distinct concentrations: the greater is the background and the smaller is the hand.
0.10 0.08 0.06 0.04 0.02 0.00
The enhanced histograms pz (z) are not equal to reference, presented in Figure 3, because the algorithm undergoes influences of the digitalization. The enhanced image and segmentation results are shown in Figure 7. After the enhancement, the skin regions are in evidence, but some noises were introduced on the segmented image. To evaluate numerically the improvement of segmentation, the original images are segmented manually, shown in Figure 8, resulting in a reference image. The presented segmentation results are similar of others results found in the literature, some of them were obtained in
0
50
100
150
Cr
(b) Figure 5: Histograms of (a) Cb and (c) Cr components of the image presented in Figure 4(a).
lighting controlled environments [9, 6, 13, 18, 16]. The segmentation results using enhanced and original are compared pixel-per-pixel with reference image. The percentual of segmented pixels of that corresponds of skin pixels
202
0.18 0.16 0.14 0.12
pz (z)
0.10 0.08 0.06 0.04 0.02 0.00
0
50
100
150
200
250
(a)
(b)
(c)
(d)
(e)
(f)
300
Cb
(a) 0.30
0.25
pz (z)
0.20
0.15
0.10
0.05
0.00
0
50
100
(b)
150
200
250
300
Cr
Figure 6: Enhanced Histograms of (a) Cb and (c) Cr components from the image of the Figure 4(a).
Figure 8: (a), (c) and (e) original images and (b), (d) and (f ) manual segmentation results.
(a)
(b)
Table 1: Correspondence of pixels. Image Image 1 Image 2 Image 3 Reference 100.00% 100.00% 100.00% Original 9.44% 0.07% 40.41% Enhanced 62.21% 76.29% 68.70% Improvement 84.82% 99.90% 41.18%
in different illumination conditions. (c)
(e)
(d)
7. CONCLUSION
(f)
This work proposed a technique to correct high lighting images for skin segmentation using histogram matching. Analyzing the obtained results, the conclusion is that the segmentation provided much better results after the application of the histogram matching than before. The proposed method is very efficient, robust and simple to develop. The average gain in the studied images is 75.30%, compared with reference images.
Figure 7: (a), (c) and (e) enhanced images and (b), (d) and (f ) segmentation results.
to the reference images are presented in the Table 1. According to the results, the proposed enhancement improves, in average, 75.30% the segmentation results. The results motivates the use of the proposed method as a image enhancement to improve the efficiency of hand gesture recognition
The efficiency of the proposed method is limited to the environment because the gaussians’ parameters are dependents of the scene and it inserts few noises doing that non-skin regions were labeled as skin. The inserted noises can be removed using simple filters, like morphological filters. The images segmented obtained were not filtered because the focus of this work is to present the histogram matching.
8. ACKNOWLEDGEMENTS The authors would like to thank Funda¸c˜ ao Cearense de Apoio ao Desenvolvimento Cient´ıfico e Tecnol´ ogico (FUNCAP),
203
Coordena¸ca ˜o de Aperfei¸coamento de Pessoal de N´ıvel Superior (CAPES) and the Laborat´ orio de Engenharia de Sistemas de Computa¸c˜ ao (LESC) for technical and financial support. Special thanks to Federa¸c˜ ao Nacional de Educa¸c˜ ao e Integra¸ca ˜o de Surdos (FENEIS - CE) and Associa¸c˜ ao de Pais e Amigos de Deficientes Auditivos (APADA - CE) for their generous help with this project.
9.
REFERENCES
[1] E. K. J. Alfatly and N. J. Ibrahim. Video image for security system by using chaotic oscillator for segmentation. Eng. and Tech. Journal, 27(6):1162–1173, 2009. [2] H. K. Almohair, A. R. Ramli, E. A. M., and S. J. Hashim. Skin detection in luminance images using threshold technique. International Journal of The Computer, the Internet and Management, 15(1):25 – 32, 2007. [3] K. Barnard. Improvements to gamut mapping colour constancy algorithms. European Conference on Computer Vision, 1, 2000. [4] B. R. C. Bedregal, G. P. Dimuro, and A. C. R. Costa. Hand gesture recognition in an interval fuzzy approach. Tendˆencias em Matem´ atica Aplicada e Computacional, 8(1):21–31, 2007. [5] H. Brashear, V. Henderson, K.-H. Park, H. Hamilton, S. Lee, and T. Starner. American sign language recognition in game development for deaf children. Proceedings of the 8th international ACM SIGACCESS conference on Computers and accessibility, pages 79 – 86, 2006. [6] P. Campr, M. Hr´ uz, A. Karpov, P. Santemiz, ˇ M. Zelezn´ y, , and O. Aran. Sign-language-enabled information kiosk. Proceedings of Summer Workshop on Multi-Modal Interfaces, pages 24 – 33, 2008. [7] W. C. Chan, O. C. Au, and M. F. Fu. A novel color interpolation framework in modified ycbcr domain for digital cameras. IEEE International Conference of Image Processing, 2003. [8] H. Cooper and R. Bowden. Large lexicon detection of sign language. Human-Computer Interaction (HCI), pages 88 – 97, 2007. [9] T. M. de Oliveira, P. C. Cortez, W. P. da Silva, J. M. Soares, and G. C. Barroso. Segmenta¸c˜ ao de pele humana em imagens de v´ıdeo utilizando wavelet e redes neurais. II Workshop de Vis˜ ao Computacional, 2006. [10] R. C. Gonzalez and R. E. Woods. Digital Image Processing. Prentice Hall, 3nd edition, 2008. [11] M. J. Jones and J. M. Rehg. Statistical color models with application to skin detection. International Journal of Computer Vision, 46(1):81–96, 2002. [12] S. Kunimatsu, H. Kumeno, N. Tsukuda, T. Takubo, K. Inoue, T. Arai, Y. Mae, and T. Umetani. Cooperative monitoring by fixed cameras and moving cameras. Proceedings of International Symposium on Automation and Robotics in Construction, 23, 2006. [13] M. Leo, T. D’Orazio, A. Caroppo, S. Spagnolo, and C. Guaragnella. Unsupervised skin colour modelling for hand segmentation. Proceedings of Visualization,
Imaging, and Image Processing (VIIP), 2005. [14] H. Noda and M. Niimi. Colorization in ycbcr color space and its application to jpeg images. Pattern Recogn., 40(12):3714–3720, 2007. [15] A. Papoulis and S. U. Pillai. Probability, Random Variables and Stochastic Processes. Mcgraw Hill Companies, 4th edition, 2002. [16] S. L. Phung, A. Bouzerdoum, and D. Chai. Skin segmentation using color and edge information. Proceedings of the Int. Symposium on Signal Processing and its Applications (ISSPA), 2003. [17] S. L. Phung, A. Bouzerdoum, and D. Chai. Skin segmentation using color pixel classification: analysis and comparison. IEEE Transactions on Pattern Analysis and Machine Intelligence, 27(1):148 – 154, 2005. [18] S. B. Rasool. Skin segmentation: Combining color and edge information. Technical report, King Fahd University of Petroleum and MInerals, Dhahran, Saudi Arabia, 2003. [19] F. M. Reaes. Reconhecimento de faces em imagens: Projeto beholder. Monografia, USP, 2006. [20] L. Sigal, S. Sclaroff, and V. Athitsos. Estimation and prediction of evolving color distributions for skin segmentation under varying illumination. Proceedings IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2000. [21] L. Sigal, S. Sclaroff, and V. Athitsos. Skin color-based video segmentation under time-varying illumination. Technical report, Boston University Computer Science, 2003. [22] T. Starner, J. Weaver, and A. Pentland. Real-time american sign language recognition using desk and wearable computer based video. Technical report, MIT Media Laboratory Perceptual Computing, 1996. [23] C. Vogler and D. Metaxas. Parallel hidden markov models for american sign language recognition. Proceedings of the International Conference on ˘ S 25, 1999. Computer Vision, page 22 ˆ aA¸ [24] C. Vogler and D. Metaxas. Handshapes and movements: Multiple-channel asl recognition. Springer Lecture Notes in Artificial Intelligence 2915, page 247 ˘ S 258, 2004. aA¸ ˆ [25] H. Wang, M. C. Leu, and C. Oz. American sign language recognition using multi-dimensional hidden markov models. Journal of Information Science and Engineering, (22):1109 – 1123, 2006. [26] M. Zahedi. Robust Appearance-based Sign Language Recognition. PhD thesis, Rheinisch-Westf¨ alischen Technischen Hochschule Aachen, 2007. [27] J.-H. Zheng, C.-Y. Hao, Y.-Y. Fan, and X.-Y. Zang. Adaptative skin detection under unconstrained lighting conditions using a bigaussian model and illumination estimation. Image Analysis and Stereology, 24:21 – 33, 2005.
204
Design de Interação para um Atlas Virtual de Anatomia Usando Realidade Aumentada e Gestos Romero Tori Lpai / SENAC e Interlab / POLI-USP tori@acm.org
Fatima L. S. Nunes LApIS / EACH-USP e Interlab / POLI-USP fatima.nunes@usp.br
Ricardo Nakamura Interlab / POLI-USP ricardo.nakamura@poli.usp.br
João Luiz Bernardes Jr. Interlab / POLI-USP joao.bernardes@poli.usp.br
Cléber Gimenez Corrêa Interlab / POLI-USP correacleber@yahoo.com.br
Daniel Makoto Tokunaga Interlab / POLI-USP daniel.tokunaga@poli.usp.br
ABSTRACT
Este artigo discute conceitos, decisões de projeto e avaliações realizadas no projeto da interface de interação do sistema VIDA (Virtual and Interactive Distance-learning on Anatomy). O projeto VIDA visa o desenvolvimento de um atlas anatômico virtual, voltado ao treinamento de estudantes de medicina e áreas afins, que faz uso de técnicas de Realidade Aumentada (RA), estereoscopia e reconhecimento de gestos para possibilitar a manipulação direta dos elementos anatômicos virtuais, como se esses fossem projeções holográficas posicionadas entre as mãos do aluno. Como as mãos do usuário devem ficar livres para a manipulação desses objetos, dois dos requisitos estabelecidos para a interação é que a atenção do treinando não seja desviada do objeto de estudo e que, portanto, se evite o uso de mouse e teclado. Desta forma a solução adotada foi o emprego de técnicas de reconhecimento de gestos. A hipótese que motivou este projeto, e comprovada neste artigo, é que com o uso de técnicas de Realidade Aumentada (RA) e reconhecimento de gestos é possível o desenvolvimento de uma solução que atenda tais requisitos. Uma segunda hipótese, ainda por comprovar, mas com indícios positivos, é que a manipulação direta, com as mãos livres, de objetos virtuais aumenta a sensação de presença em atividades de aprendizagem a distância. Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. Interation 2009, November 26–28, 2009, São Paulo, SP, Brasil. Copyright 2009 .
Author Keywords
Design de interação, realidade aumentada, manipulação direta, reconhecimento de gestos, atlas de anatomia, elearning ACM Classification Keywords
H.5.2 User Interfaces: Input devices and strategies; Interaction styles. INTRODUÇÃO
A educação a distância (EAD) tem permitido a democratização do acesso ao conhecimento, por meio da disponibilização de recursos – materiais, pessoas, experiências, entre outros – de forma ubíqua. Embora a necessidade de tecnologia adequada seja imprescindível para viabilizar esta forma de ensino-aprendizagem, verificam-se esforços no sentido de se levar computadores e Internet a todas as camadas da população, como é o caso, entre outras iniciativas, dos chamados [5]. Muitas têm sido as áreas beneficiadas pela EAD e percebese a sua expansão principalmente nos campos de conhecimento que não apresentam grandes exigências de interatividade. Na área de saúde, verifica-se o uso de EAD principalmente no ensino de conteúdos teóricos, compostos basicamente por informações textuais. No entanto, o uso de recursos multimídia vem crescendo à medida que se observa a diminuição no preço da tecnologia e o consequente aumento na quantidade de pessoas com acesso à tecnologia. Especificamente, a construção de atlas virtuais para o ensino de Anatomia e Fisiologia é um dos assuntos que mais exploram recursos multimídia no campo de educação em saúde [3,11,16,19,45]. A aplicação de atlas virtuais
205
pode diminuir o uso de laboratórios físicos, proporcionando diminuição nos custos da educação em saúde, conforme analisaram Ma e Nicherson [25]. Ao mesmo tempo, a junção de ferramentas deste tipo aos conceitos de EAD promove a democratização do ensino, visto que, a partir da disponibilização da tecnologia e da Internet, qualquer cidadão terá acesso aos conteúdos disponibilizados. Um dos problemas percebidos nos cursos a distância é a alta taxa de evasão quando comparada às taxas percebidas em cursos presenciais [13]. Assim, as ferramentas construídas devem, entre outras estratégias, promover a interatividade para motivar o aluno a manter a autodisciplina necessária nesta categoria de ensino. A importância da interatividade na educação, em especial na educação a distância, para aumentar a participação do aluno é defendida por diversos autores, entre eles Silva [40], Mattar [27] e Tori [46]. Nesse contexto, considerando particularmente os atlas virtuais e as tecnologias de Realidade Virtual (RV), ferramentas que permitam a interatividade e a manipulação direta de objetos tridimensionais usando apenas parte do corpo do usuário (como a mão e a cabeça) podem colaborar para reduzir a sensação de distância [45,46], ao aumentar a possibilidade de o usuário sentir-se imerso na aplicação. As interfaces bidimensionais já foram bastante exploradas na construção de atlas virtuais [10,48]. Uma geração mais recente de aplicações propõe o uso de interfaces tridimensionais indiretas (usando a tela do computador) e diretas (usando luvas e capacetes, caves e outras soluções imersivas), conforme citam Bowman et al. [9]. A contribuição do trabalho aqui apresentado é a proposição do uso de Realidade Aumentada (RA) e reconhecimento de gestos para propiciar interação tridimensional direta a distância, sem necessidade de equipamentos caros ou desconfortáveis. O presente estudo tem por objetivo encontrar soluções de design de interface baseada em gestos e RA para o Atlas Virtual VIDA [45]. Esse atlas, destinado a treinamento a distância de profissionais da área da saúde, se baseia na manipulação direta de objetos tridimensionais projetados no ar, à frente do usuário. Inicialmente está sendo utilizada a técnica de anaglifos, mais adequada para uso caseiro. Para testes em laboratório podem também ser utilizadas lentes polarizadas, óculos tridimensionais (3D) ativos ou monitores autoestereoscópicos. Apesar das limitações dessa solução, que apenas simula uma projeção holográfica, sabe-se que já há tempos são pesquisadas soluções tecnológicas para um verdadeiro display holográfico interativo [22,24] bem como tecnologias para possibilitar retorno háptico no ar sem o uso de luvas [21]. Produtos comerciais já exploram, ainda de forma limitada, a tecnologia de displays holográficos. Mas por enquanto há dificuldades em se integrar nesses sistemas imagens capturadas ou sintetizadas em tempo real [35].
Desta forma, as pesquisas de design de interação que estamos realizando agora, e que já permitem aplicações práticas de imediato, serão úteis também no futuro, para subsidiar o desenvolvimento de novos paradigmas de interface e interação em sistemas de projeção holográfica. A seguir são apresentados os fundamentos tecnológicos e conceituais desse projeto, a identificação de necessidades do usuário, os requisitos que foram estabelecidos, a prototipagem, testes iniciais realizados, a avaliação da interface, conclusões e próximos passos. CARACTERIZAÇÃO DO PROBLEMA E DO USUÁRIO Atlas Virtuais
Ainda hoje o ensino de anatomia é realizado majoritariamente por meio de livros e manipulação de cadáveres. Limitações como o desgaste dos cadáveres, não reprodução das condições reais do corpo humano in vivo, e a dificuldade de se perceber a estrutura tridimensional por trás de imagens bidimensionais, fazem com que novas formas de ensino sejam investigadas. A esses fatores, acrescentam-se os altos custos de implantação e manutenção de laboratórios que, em muitos casos, podem limitar o acesso do estudante a estruturas reais, como já foi discutido por Ma e Nicherson [25]. Os atlas virtuais constituem ferramentas computacionais construídas com recursos multimídia. No contexto de Realidade Virtual e Aumentada, disponibilizam objetos tridimensionais e/ou representação de funcionamento de órgãos, permitindo o estudo de uma ou mais estruturas do corpo humano. Ferramentas completas incluem módulos de auxílio ao ensino, avaliação e técnicas de inteligência para definir o conteúdo a ser estudado de acordo com as características e histórico do usuário. Coube à National Library of Medicine [30] a apresentação de uma das primeiras iniciativas nesta área, por meio do projeto Visible Human, que tinha o objetivo de criar um conjunto completo de imagens digitais do corpo humano, a partir de dois cadáveres congelados (um masculino e outro feminino) e posteriormente fatiados. Usando imagens do Visible Human, outras ferramentas foram criadas para navegação, exploração e exibição de estruturas do corpo humano, como o Visible Human Explorer (VHE) de North, Shneiderman e Plaisant [31] e o iVoxel Browser, um programa que exibe essas imagens, incluindo dados em voxels, modelos de faces e anotações [1] . É comum a construção de atlas virtuais para o estudo específico de uma parte do corpo humano, usando imagens médicas reais. Com esta abordagem, Shenton et al. [39] apresentaram um atlas virtual do cérebro para estudo de anatomia que utilizava imagens adquiridas por Ressonância Magnética (RM). Albrecht et al. [2] apresentaram um atlas da mão humana, considerando as características físicas definidas para cada tecido (pele, ossos, músculos e
206
ligamentos) e um Atlas Virtual do Coração Humano foi construído por Park [32], também utilizando imagens obtidas por RM. No Brasil, é interessante citar os trabalhos de Ramos e Nunes [36], que apresentaram um Atlas Virtual para estudo da anatomia e fisiopatologia do câncer de mama e o AnatomI, apresentado por Cunha et al. [11], um atlas digital de uso livre e que permite, de forma interativa, a manipulação e o estudo de estruturas tridimensionais do corpo humano com textos descritivos sobre cada estrutura. Perfil do Usuário
O público-alvo do projeto VIDA é composto por pessoas com acesso à Internet interessadas em conteúdos de anatomia e fisiologia, em especial alunos e treinandos da área da saúde. Como mencionado nas seções seguintes, alguns requisitos em relação a software foram definidos a fim de permitir o uso da ferramenta tanto de forma caseira quanto em laboratório.
• Escala do objeto – permite aumentar ou diminuir o tamanho do objeto manipulado; o centro geométrico do objeto é mantido na mesma posição. REQUISITOS
A partir da caracterização do problema e do usuário, e com base nas diretrizes de Preece et al. [34] foram estabelecidos os requisitos apresentados a seguir. Requisitos do sistema
•
baixo custo;
•
duas versões: uso caseiro e em laboratório;
•
uso caseiro: máximo duas webcams, mas deve funcionar com apenas uma;
•
deve ter a opção de funcionar com visualização convencional, isto é, usando monitor de vídeo comum (para o caso de o usuário não conseguir ver em estéreo ou não dispor de óculos anaglíficos).
Preveem-se três categorias de usuários para o projeto VIDA: aluno, professor e administrador. O aluno pode acessar os conteúdos disponibilizados, considerando diferentes formas de interação. O professor tem acesso a todos os conteúdos do aluno, mas adicionalmente pode incluir e configurar conteúdos a serem estudados. Por fim o administrador é o usuário que pode configurar o sistema a fim de permitir diversas formas de interação, armazenamento em banco de dados e funções de gerenciamento para garantir o funcionamento adequado da ferramenta. O estudo aqui apresentado teve como foco o usuário final do sistema, ou seja, o aluno.
Requisitos Funcionais
Casos de Uso
Requisitos de Dados
O estudo de anatomia envolve a manipulação das estruturas em questão a fim de que o usuário possa conhecer seus nomes, características e composição. A fim de atingir esses objetivos foram definidos os seguintes casos de uso: • Translação do objeto – permite que o usuário altere a posição do objeto no ambiente virtual, no plano paralelo à tela de projeção (horizontal e vertical). • Rotação do objeto – possibilita a manipulação do objeto nos três eixos (x, y e z) a fim de que todas as suas partes possam ser inspecionadas. • Visualização de camadas internas - permite a navegação em um conjunto de objetos a fim de possibilitar a visualização de camadas interiores do objeto em estudo.
•
uso preferencialmente de manipulação direta, com as mãos livres, para executar as funcionalidades do sistema;facilidade de configuração e calibragem;
•
não necessidade de uso de mouse e teclado - eventuais comandos devem ser realizados por voz, gestos ou alguma outra forma de interação multimodal que dispense teclado e mouse.
•
Disponibilidade de formas indiretas de manipulação (teclado e mouse), para testes e usos eventuais (se a câmera não estiver funcionando, por exemplo);
•
sistemas de nanco de dados para armazenar informações das estruturas e dos modelos anatômicos deve ser um sistema embarcado para não comprometer o desempenho, mas eficiente para permitir armazenar e recuperar dados e modelos de forma rápida;
•
deve permitir armazenar, de forma persistente e estruturada, tanto o conteúdo de estruturas anatômicas, incluindo seus nomes e descrições, quanto os conteúdos de fisiologia que permitam aprendizagem do funcionamento dos órgãos humanos.
Requisitos do Ambiente de Interação
•
espaço adequado para o usuário movimentar os braços e se posicionar no melhor ângulo de visão para uso confortável do sistema;
• Seleção de partes do objeto – permite que o usuário selecione e destaque uma parte do objeto em estudo.
•
uso de óculos anaglíficos, polarizados ou ativos, caso o sistema não seja autoestereoscópico;
• Identificação de partes do objeto - fornece informações adicionais, como o nome e descrição, sobre uma parte do objeto selecionada e destacada pelo usuário.
•
possibilidade de controle de iluminação;
•
facilidade para posicionamento e ajuste de câmeras;
•
monitor ou telão de alta resolução.
207
Requisitos do Ambiente Tecnológico
•
linguagem gratuita sem necessidade de licença;
•
linguagem com recursos para Internet;
•
portabilidade;
•
placa gráfica 3D;
•
facilidade de configuração dos parâmetros do sistema, via arquivo XML e/ou painel de controle;
•
funcionamento em máquinas comuns, sem necessidade de hardware especial, além de webcams e placa gráfica.
Requisitos de Usabilidade
•
realismo dos modelos a partir, inicialmente, de sintetização de objetos tridimensionais;
•
tarefas interativas intuitivas;
•
exigência de pouco ou nenhum treinamento para uso.
INTERAÇÃO, PRESENÇA E TELEPRESENÇA
Ivan Sutherland [42] demonstrou, no início da década de 1960, a possibilidade de se obter telepresença por meios tecnológicos. Desde as suas pesquisas até hoje, as tecnologias de videoconferência e tele presença evoluíram bastante e são largamente utilizadas em reuniões profissionais, educação a distância, pesquisas e entretenimento, entre outras atividades. No entanto ainda há uma percepção, por parte dos participantes de atividades de tele conferência, de que a atividade está se realizando a distância. É fácil imaginar a diferença entre se participar de uma palestra ao vivo e de uma apresentação realizada via videoconferência. Numa atividade de aprendizagem a distância, a principal dificuldade é fazer com que o estudante se sinta presente sem estar compartilhando o mesmo espaço físico com colegas, professores e laboratórios. É certo que quanto maior a imersão propiciada pelos equipamentos de RV, mais fácil fica a eliminação da barreira da distância. Mas há outros fatores que contribuem para se obter a sensação de presença e que podem ser trabalhados a fim de que não sejam necessários equipamentos caros e desconfortáveis para a imersão do usuário. Neste ponto torna-se importante que se defina o conceito de "presença", no contexto de atividades a distância mediadas por tecnologia. Segundo a International Society for Presence Research (ISPR), “presença (versão reduzida do termo ‘telepresença’) é um estado psicológico, ou percepção subjetiva, no qual a percepção de determinado indivíduo, passando por uma experiência gerada e/ou filtrada, parcial ou totalmente, por meio de tecnologia, falha, total ou parcialmente, em reconhecer o papel da tecnologia no processo. [...] Experiência é definida como o ato de uma pessoa observar, e/ou interagir com objetos, entidades e/ou eventos em seu ambiente; Percepção [...] é definida como uma interpretação significativa da experiência.” [20]
Biocca [8] identifica três formas de presença: Presença Física - a sensação de “estar lá”, de estar imerso por determinado ambiente físico; Presença Social - a sensação de estar com alguém, de estar face a face com outra(s) pessoa(s) e Autopresença - a sensação de autoconsciência, de identidade, de pertencer ao corpo (o corpo é integrado à mente, formando uma espécie de "simulador mental interno"). A partir desse conceito de presença levanta-se a hipótese de que ao se prover ao usuário manipulação direta, com as mãos livres, se estará ampliando duas percepções importantes para o aumento da sensação de presença: a autopresença, por sentir que a sua mão está atuando diretamente sobre o objeto, e a redução da percepção da tecnologia, ao se eliminar dispositivos de intermediação. O usuário de ambientes virtuais (AVs) manipula objetos de acordo com os objetivos que deseja atingir e recebe feedbacks do ambiente que o orientam quanto ao progresso da interação. No nível da arquitetura do sistema, Pinho e Rebelo [33] decompõem a interface homem-máquina de AVs em: dispositivo de entrada – para introdução dos comandos do usuário; função de transferência – para mapeamento da ação de entrada para um elemento, ou elementos, controlado pelo sistema; e dispositivo de saída – para envio de retorno ao usuário. Já no nível da interação 3D, Bowman et al. [9], fazem a seguinte classificação: navegação - movimento do usuário dentro do AV; seleção/manipulação - escolha de um objeto virtual e modificação de suas características; controle do sistema comandos específicos para alterar o estado do sistema; e entrada simbólica - utilização de símbolos (números e texto) para a comunicação entre usuário e sistema. O ambiente aqui proposto trabalha apenas com seleção/manipulação, numa arquitetura de interação em que o dispositivo de entrada será composto por uma ou mais câmeras, e o dispositivo de saída será uma projeção estereoscópica. Para o usuário, no entanto, tais dispositivos deverão ser “transparentes, de tal forma que a interação, aparentemente, se dará pela ação de suas mãos sobre uma projeção virtual 3D do objeto de estudo. REALIDADE AUMENTADA E O DESIGN DE INTERAÇÃO
A RA reúne técnicas de computação gráfica, visão computacional, RV e games, para propiciar ao usuário a sensação de enriquecimento do ambiente real com elementos virtuais1. Ao contrário da RV, a RA não busca retirar do usuário as sensações provenientes do ambiente real para inseri-lo em um mundo virtual (imersão). Na RA, 1
Neste trabalho, e no contexto das áreas de pesquisa em realidade virtual e aumentada, considera-se “real” como aquilo que existe em forma física e na forma como é percebido pelo ser humano sem utilização de aparatos tecnológicos. “Elementos Virtuais” se referem a ilusões causadas ao usuário, por meio de dispositivos tecnológicos, visando-se simular sua existência física.
208
o usuário já se encontra naturalmente imerso no mundo físico e assim permanece, sendo que os objetos virtuais são inseridos nesse ambiente. Ao mesmo tempo em que são eliminados problemas enfrentados pelos desenvolvedores de RV para propiciar imersão no ambiente virtual, novos desafios surgem nas aplicações de RA, relacionados com a necessidade de manter consistência entre elementos virtuais e ambientes reais.
as informações sobrepostas. Os problemas dessa técnica, além do desconforto de se ter os equipamentos acoplados à cabeça, se referem à perfeita calibragem entre o que é exibido ao usuário e o que seria capturado por seus olhos, e perda total da visão no caso de falha na exibição das imagens pelo equipamento. •
optical see-through: é utilizado um dispositivo óptico semi-transparente, o qual exibe simultaneamente imagens captadas diretamente pelos olhos do usuário a imagens projetadas que se sobrepõem às imagens reais. Essa técnica traz algumas vantagens em relação à de video see-through, como a eliminação da necessidade de captação de vídeo do mundo real, não perda da visão em caso de falha do equipamento, e maior realismo na visualização do ambiente. Traz, no entanto, alguns desafios, tais como: perfeito registro entre a visão direta do ambiente e os elementos projetados à frente dos olhos do usuário, oclusão de elementos reais pelas projeções virtuais, equalização da luminosidade, entre outros.
•
visualização indireta: técnica bastante popular, devido ao baixo custo e facilidade de implementação, consiste em se misturar, de forma similar ao que se faz na técnica de video see-through, o vídeo capturado do mundo real com os elementos virtuais que se deseja inserir à cena. A diferença é que, em vez de se projetar em um capacete ou óculos de RV, a imagem misturada é exibida em uma tela de computador. O usuário, dessa forma, não olha diretamente para o ambiente real, mas o visualiza, de forma indireta, como se estivesse observando um espelho mágico, no qual os elementos virtuais tornam-se visíveis. Um dos primeiros projetos a se utilizar dessa técnica foi o ALIVE [26], no qual uma pessoa, visualizando-se no ambiente real, interage com um cão virtual inserido à cena real projetada à sua frente. A biblioteca gratuita e aberta AR Toolkit [17] é um entre diversos recursos disponíveis aos interessados em desenvolver aplicações de RA indireta e de baixo custo. Um exemplo de produto desenvolvido com essa tecnologia é o “Mixed Reality Book” [15]. Trata-se de um livro real, que ao ser folheado é enriquecido com informações virtuais que podem ser visualizadas por video see-through ou, indiretamente, em um monitor.
•
RA Espacial (RAE): a RA espacial [7] produz a ampliação do real por meio de projeções de imagens sobre o ambiente real; exemplos do uso dessa técnica são o AR X-RAY [28], um raio-x virtual que permite a visualização de estruturas internas de paredes, e o sistema Shader Lamps [37], que projeta texturas virtuais e informações sobre superfícies de objetos; a maior vantagem da RAE sobre as demais técnicas é a dispensa do uso de capacetes, óculos ou outro dispositivo de visualização, permitindo a visualização direta das informações virtuais no ambiente real.
Caracterização da Realidade Aumentada
Os sistemas de RA devem possuir três características simultaneamente [4]: •
misturar elementos reais e virtuais, por meio de tecnologia;
•
ser interativo, reagindo em tempo real;
•
prover registro em três dimensões, ou seja, continuidade e consistência espacial, entre elementos reais e virtuais.
Pelos requisitos acima, a simples inclusão de informações virtuais em determinado ambiente não implica, necessariamente, numa aplicação de RA. Se isso fosse suficiente qualquer ambiente com televisão ligada ou um cinema seriam ambientes de RA. Nos exemplos citados faltam dois requisitos: a interatividade e o registro entre imagens e ambiente. Já um carrinho virtual que possa ser controlado interativamente e que se movimenta por um ambiente real de acordo com sua posição no espaço (não flutua nem penetra no chão ou nas paredes por exemplo) seria um caso de RA. Outra dúvida que surge é se um filme mostrando uma pessoa interagindo com um elemento virtual perfeitamente integrado e registrado ao ambiente seria RA. Por ser filme, não há interação em tempo real e, portanto, não pode ser classificado como RA. No entanto, no contexto diegético, ou seja, da narrativa do filme a situação pode ou não ser classificada como RA. Se a personagem está interagindo com um elemento que, para a história, foi gerado artifical e tecnologicamente e que possui registro com o ambiente físico da narrativa e resposta em tempo-real, estaríamos diante de uma situação diegeticamente de RA. Mas se para o enredo, o monstro criado computacionalmente existe, então não teríamos RA, nem mesmo diegeticamente. Técnicas de Realidade Aumentada
As principais técnicas hoje utilizadas para obtenção de efeitos de RA são: •
video see-through: são utilizados óculos ou capacetes de RV para isolar o usuário da visão do mundo real, apresentando-lhe um vídeo em tempo-real, em geral estereoscópico, que mistura o vídeo capturado do ambiente à sua frente com os elementos virtuais que se deseja inserir no ambiente físico. O efeito para o usuário é como se estivesse olhando diretamente para o ambiente ao seu redor e vendo, além dos objetos reais,
209
Registro e Rastreamento
Registro é o processo pelo qual se define o mapeamento de pontos entre dois sistemas de coordenadas. No caso de RA, esse registro deve ocorrer a todo tempo entre dois sistemas de coordenadas 3D: um sistema que descreva distâncias e objetos no mundo real e um que faça o mesmo para os objetos virtuais. O sistema de coordenadas virtuais é bem conhecido pelo desenvolvedor do sistema, visto que é gerado pelo computador. A maior dificuldade para se obter o registro, portanto, está em se coletar e processar adequadamente informações sobre o ambiente real, principalmente a posição de objetos, reais ou virtuais, de interesse e a posição do usuário, inclusive a direção de seu olhar e de suas mãos, caso a interface permita usá-las para interagir diretamente com objetos virtuais. Esse é o papel do rastreamento, ou seja, da localização de objetos ao longo do tempo, com base em imagens ou dados de outros sensores e utilizando informações de estados anteriores desses objetos. Já na década de 1990, Azuma [4] citava esse registro entre real e virtual como um dos desafios para sistemas de RA. Hoje em dia esse desafio ainda existe e há uma tendência a causar cada vez menos interferência no usuário ou no ambiente (sejam sensores ou marcas) e a utilizar cada vez mais a visão computacional, inclusive por questões de custo. Soluções para registro usando marcadores no mundo real, como o ARToolkit, já são bem conhecidas e aplicáveis a uma série de problemas, mas nos últimos anos tem havido intensa pesquisa e resultados promissores na área de rastreamento sem marcadores. Lima et al. [23] discutem essa questão em mais detalhe e apresentam uma taxonomia para as diferentes abordagens para rastreamento sem marcadores. Atualmente no sistema VIDA o registro acontece principalmente entre as mãos do usuário e os objetos virtuais, e as mãos são rastreadas sem o uso de marcadores ou outros sensores, a não ser uma câmera. TÉCNICAS DE ESTEREOSCOPIA
Nos seres humanos, o fenômeno de estereoscopia, ou visão binocular, corresponde à percepção simultânea de duas imagens distintas pelos olhos – a diferença entre as imagens ocorre devido à distância horizontal ou separação entre os olhos. O cérebro humano é capaz de interpretar estas diferenças e, a partir delas, estimar a distância dos objetos que são visualizados. As diferentes técnicas de geração de imagens estereoscópicas existentes procuram simular este fenômeno para criar uma visualização tridimensional de objetos [41]. Existem dois aspectos principais a serem considerados na geração de imagens estereoscópicas: a reprodução da configuração geométrica dos olhos humanos, para que as imagens sejam criadas de pontos de vista corretos e a tecnologia empregada para que cada imagem seja apresentada somente a um dos olhos. Quanto à configuração geométrica, os parâmetros relevantes são: a
distância de separação entre os olhos, e a distância de convergência, ilustradas na Figura 1. A separação entre os olhos varia conforme o usuário, enquanto a distância de convergência depende do objeto que é foco de atenção do usuário. Na geração de imagens estereoscópicas, os dois parâmetros podem ser manipulados para se obter efeitos exagerados de percepção de profundidade da imagem. No entanto, isto também pode causar desconforto e cansaço visual. Gateau [14] apresenta algumas recomendações neste sentido.
Figura 1: Parâmetros da configuração geométrica dos olhos para visão estereoscópica. Com relação às tecnologias de apresentação de imagens separadamente para cada olho, podem-se destacar três abordagens encontradas com mais frequência: anaglifos, lentes polarizadas e óculos com obturadores sincronizados. Uma revisão mais abrangente pode ser encontrada em Siscoutto et al. [41]. Na apresentação por meio de anaglifos, as imagens correspondentes aos olhos esquerdo e direito são processadas usando filtros de cores primárias e combinadas em uma única imagem. Para visualização em monitores de vídeo, são comuns os anaglifos vermelho/azul ou vermelho/ciano. Para que se tenha a visualização estereoscópica, é preciso utilizar óculos com filtros correspondentes às cores dos anaglifos – esses filtros podem ser obtidos com papel celofane ou outros materiais de baixo custo, o que é uma das vantagens desta técnica. Outra vantagem é que ela não requer dispositivos de exibição especializados. A principal desvantagem dos anaglifos é que muitas das informações de cores dos objetos visualizados são perdidas. Na técnica de apresentação de imagens estereoscópicas através de lentes polarizadas, utiliza-se o fenômeno da polarização da luz, que pode ser explicado da seguinte forma: a luz se comporta como uma onda eletromagnética que vibra em todas as direções perpendiculares à direção de propagação. Um filtro polarizador permite somente a passagem de luz que esteja vibrando em uma direção específica, como ilustrado na Figura 2. Nessa técnica, as imagens estereoscópicas são exibidas com diferentes polarizações de luz e o observador utiliza óculos especiais
210
com filtros polarizadores. Como estes filtros efetivamente bloqueiam parte da luz, pode-se perder parte do brilho da imagem. Além disso, são necessários dispositivos de exibição especiais, como por exemplo, dois projetores com lentes polarizadoras e uma tela capaz de refletir a luz sem alterar sua polarização. Por outro lado, esta técnica preserva as cores dos objetos visualizados, ao contrário dos anaglifos.
Figura 2: Filtro polarizador de luz. Por fim, a técnica de óculos com obturadores sincronizados utiliza tais dispositivos para bloquear, alternadamente, as visões dos olhos esquerdo e direito. A alternância entre os obturadores é sincronizada com a exibição das imagens estereoscópicas correspondentes. Ao contrário dos filtros para anaglifos ou polarização, neste caso os óculos utilizam componentes ativos – tipicamente, pequenas telas de cristal líquido – o que corresponde a um custo maior. Esta técnica também requer um dispositivo (projetor ou monitor de vídeo) capaz de exibir imagens com o dobro da frequência com a qual as imagens serão visualizadas. Também é preciso que exista uma maneira de se transmitir o sinal de sincronização. Existem tanto modelos de óculos conectados ao computador por um cabo, como versões que utilizam sinal infravermelho ou de radiofrequencia. RECONHECIMENTO DE GESTOS
Bowman et al. [9] contam que a possibilidade de transmitir comandos a um sistema computacional usando as próprias mãos e gestos tem capturado o interesse de pesquisadores e usuários por décadas e foi um dos primeiros tópicos de pesquisa em interfaces com o usuário, em grande parte por utilizar habilidades bem desenvolvidas e aplicadas no dia-adia. Com a capacidade computacional disponível atualmente e o uso cada vez mais comum de dispositivos de captura de imagem, mesmo em sistemas domésticos é possível implementar esse tipo de interação utilizando visão computacional, o que libera o usuário do uso de luvas, sensores e cabos e ainda se apresenta como solução de menor custo. Das diversas funções que gestos podem ter na comunicação, a função simbólica, em que o gesto tem um significado próprio que deve ser aprendido, e a mimética,
onde o gesto imita ou descreve algum objeto ou ação, são as mais exploradas nesse tipo de interface. E, embora sejam usados principalmente para controle de sistema, através de comandos, Bowman et al. [9] citam diversas aplicações que usam gestos nas tarefas de seleção e manipulação e até em navegação. Citam ainda a possibilidade, ainda pouco explorada, de utilizá-los para entrada simbólica de números. Gestos, assim como comandos de voz ou de texto, são "interfaces invisíveis", ou seja, o usuário em geral não tem a sua disposição na interface indicações de quais gestos ou comandos são aceitos pelo sistema (ao contrário, por exemplo, de menus). Esse tipo de interface normalmente permite que os comandos sejam dados de forma mais rápida, mas são mais difíceis de aprender e lembrar, dois requisitos importantes da usabilidade. Para aumentar a usabilidade, portanto, é recomendável ter um grande vocabulário de gestos para escolher os que serão usados no sistema, de forma a aumentar a possibilidade de escolher gestos mais relacionados com o domínio da aplicação, com a tarefa ou ação que será associada ao gesto na interface e com os conhecimentos e a cultura do usuário. Além disso, não é recomendável utilizar um grande número de gestos num mesmo contexto na aplicação, o que torna a interface mais complexa, difícil de memorizar e aumenta a carga cognitiva. Esse é um dos motivos pelos quais gestos são frequentemente usados em interfaces multimodais, combinados, por exemplo, com comandos de voz. Interfaces baseadas nos gestos de uma só das mãos são comuns, mas Bowman et al. [9] afirmam que o uso de interfaces bimanuais pode ser mais natural e trazer ganhos de performance mensuráveis. Nessas interfaces, o movimento das mãos pode ser assimétrico, quando em geral a mão não dominante serve para definir ou apoiar o espaço de interação onde a mão dominante realiza gestos mais complexos, ou simétrico, onde ambas as mãos têm cargas de trabalho equivalentes, seja com movimentos síncronos, como empurrar uma parede ou escalar uma corda, ou assíncronos, como digitar em um teclado. Para o projeto da interface para o sistema VIDA, devem ser considerados e testados gestos de todas essas diferentes naturezas: mono e bimanuais, simétricos ou não. O AMBIENTE VIDA
O projeto VIDA (Virtual and Interactive Distance-learning on Anatomy) [45] busca desenvolver um ambiente de RA direta, diferente das técnicas até hoje utilizadas (video seethrough, optical see-trhough, indireta ou espacial), baseada no conceito dos futuros displays holográficos, mas que possam ser utilizado hoje, com equipamentos comuns e de baixo custo. Esse ambiente deve oferecer um Atlas Virtual 3D, como meio para aprendizagem e treinamento de estudantes da área de saúde, via Internet. Em lugar de se utilizar holografias ou projeções de imagens no espaço, o que seria ideal e, espera-se, deverá ser disponível por meio
211
de equipamentos holográficos em futuro breve, são utilizadas técnicas de estereoscopia, em especial, pares anaglíficos, para dar ao usuário a ilusão de estar manipulando um objeto virtual no espaço entre suas mãos. A Figura 3 apresenta imagens que explicam o conceito do Atlas Virtual, na visão subjetiva do usuário. Após calibragem dos parâmetros de convergência e paralaxe, necessários para adaptação da exibição estereoscópica ao sistema visual de cada pessoa, o aluno carrega os elementos anatômicos que deseja estudar e os manipula diretamente, com as mãos livres.
utilizando-se a técnica do “Mago de Oz” [12,38]. Essa técnica possibilita que sejam avaliados diferentes tipos de interação antes que essas sejam totalmente implementadas, uma vez que uma pessoa interpreta as ações do usuário e faz com que o sistema responda ao usuário como se aquele comando estivesse sendo realizado de forma automática pelo computador. A vantagem de se usar esse recurso é poder ampliar o leque de possibilidades de interações, de forma rápida e barata, concentrando os esforços de pesquisa e desenvolvimento apenas nas interações escolhidas para compor o sistema definitivo.
Figura 3: Interação direta do usuário com as estruturas anatômicas tridimensionais.[45]
Figura 4: a) Modelo em formato de estéreo anaglifo; b) par de óculos descartável para visualização em anaglifo; c) sensação do usuário. [45]
A Figura 4 exibe o resultado produzido pela técnica de anaglifo. Como em nosso sistema não é possível sentir feedback tátil deve ser evitado que as mãos do usuário transpassem o modelo virtual projetado à sua frente, o que quebraria a ilusão produzida pelo efeito estereoscópico e, consequentemente, a sensação de manipulação direta de um objeto tridimensional no ar. Um dos requisitos da interação é, portanto que não haja possibilidade de toque no objeto virtual. Isso pode ser obtido de várias maneiras, como afastar o objeto na medida em que a mão do usuário deste se aproxima, não permitindo que nunca o alcance. Para que o realismo da interação não seja quebrado deverão ser criados contextos consistentes e verossímeis, para que a interação se dê de forma natural. O estudo em curso deve encontrar as melhores formas de se obter tais efeitos, entre diversas possibilidades, como, por exemplo, a simulação de um campo de força invisível emanando das mãos do usuário. Outro gesto possível seria um que provoque um "efeito raio-x" fazendo com que camadas mais internas ou mais externas sejam exibidas.
Gestures2Go [6], o sistema escolhido para realizar o reconhecimento e que pode ser integrado ao VIDA de forma simples, já existe. Esse sistema é capaz de tratar de grande variedade de gestos bimanuais paramétricos em tempo real usando técnicas de visão computacional e atualmente utiliza uma única câmera (o que limita o emprego de algumas posturas). Mesmo assim, optou-se por utilizar testes com a técnica de Mágico de Oz principalmente por dois motivos:
Além dos possíveis gestos descritos, todas as outras ações que o usuário pode realizar, citadas nos casos de uso, serão implementadas através de reconhecimento de gestos bimanuais, com as mãos livres, reconhecidos usando técnicas de visão computacional. Esses gestos serão definidos tanto pela postura das mãos como por seus movimentos. Parâmetros dos gestos, como as posições das mãos ou a velocidade de execução, também serão reconhecidos e poderão ser utilizados no projeto da interface.
•
não limitar o design da interface aos gestos que atualmente podem ser reconhecidos pelo sistema, visto que estão previstas novas versões com funcionalidades como o uso de estereoscopia para obter mapas de profundidade e permitir um maior número de gestos;
•
permitir rápidas interações no design da interface e o teste de diversas opções de gestos para cada ação, inclusive criando novas opções, baseadas em feedback dos usuários, rapidamente durante os próprios testes (sem exigir mudanças na implementação, por mais simples que fossem) para que pudessem ser avaliadas.
Versões anteriores do VIDA usavam um reconhecimento de gestos mais simples, baseado somente no movimento do usuário, inferido pelo fluxo ótico da imagem de suas mãos. Design da Interação
Após o desenvolvimento da prova de conceito do sistema VIDA [45], passou-se a elaborar em detalhes a interface de interação do sistema.
Até este momento foi desenvolvida uma prova de conceito do sistema VIDA e um teste inicial com usuários,
212
Tabela 1: Funcionalidades do Sistema VIDA e respectivos conjuntos de gestos candidatos. Funcionalidade
Rotação do Objeto
- carregamento e visualização de camadas de modelos 3D;
Gestos
- renderização em anaglifos;
1. Rotação de uma das mãos - utilizar a mão aberta para movimento e a mão fechada para voltar à posição neutra
- comandos de teclado para: ajustes de convergência e paralaxe; escala, translação e rotação; para de partes do modelo; apresentação do nome da parte realçada.
2. Rotação das duas mãos abertas ao mesmo tempo (como se elas envolvessem o objeto) 3. Mãos (abertas ou fechadas) uma acima e outa abaixo do objeto - movimentos opostos das mãos em profundidade 1. Movimentação de uma das mãos (aberta) na horizontal ou na vertical
Translação do objeto
recursos:
Em seguida foi elaborado um questionário, usando-se o recurso “Forms” do “Google Docs” (Figura 5).
2. Movimentação das duas mãos abertas ao mesmo tempo, na horizontal e na vertical (como se realmente segurassem o objeto) 3. Movimentação de uma das mãos (fechada) na horizontal ou na vertical 1. Movimentação das duas mãos horizontalmente, uma em direção à outra, para reduzi-lo e em direções opostas para ampliá-lo
Escala do Objeto
2. Movimentação das duas mãos verticalmente, uma em direção à outra, para reduzi-lo e em direções opostas para ampliá-lo 3. Formando os cantos de uma janela com os dedos polegar e indicador de ambas as mãos, movimentar as mesmas na diagonal em sentidos opostos simultaneamente
Visualizaçã o de camadas das externas para as internas e vice-versa
Seleção de partes do objeto Identificaçã o de partes do objeto
1. Aproximação e afastamento horizontal dos dedos indicadores (como se cortassem o objeto) 2. Inclinação e afastamento horizontal dos dedos indicadores 3. Uma mão indica o número da camada e a outra indica se a camada deve ficar visível (mão aberta) ou invisível (mão fechada) Obs: Fixação de uma das camadas: Fechar a mão - o treinamento é iniciado com as mãos abertas (ou dedos) 1. Apontamento, com dedo indicador, da parte que se deseja destacar 2. (nãodefinido) 3. Movimento da mão em torno do objeto provoca o realce sequencial das partes; fechando a mão, a última parte sele cionada é liberada (nesta versão a identificação será automática, tão logo determinada parte seja selecionada)
O perfil do usuário foi estudado e os requisitos do sistema e da interface estabelecidos, conforme apresentado nas Seções “Caracterização do Problema e do Usuário” e “Requisitos”. A partir dos requisitos foram estabelecidos 3 possíveis gestos para cada funcionalidade (Tabela 1). Com base nos gestos selecionados pelos usuários durante o processo de avaliação, e do feedback recebido dos participantes, será implementado um primeiro protótipo funcional do ambiente VIDA. AVALIAÇÃO E RESULTADOS
Tendo-se como referência a tabela de funcionalidades e gestos (Tabela 1) foi desenvolvido um ambiente que permitisse a simulação dos gestos e funcionalidades previstos por meio da técnica do “Mago de Oz”. Tal ambiente deveria oferecer recursos mínimos para que a simulação das interações pudesse ser executada pelo operador humano. Foram implementados os seguintes
Figura 5: Trecho do Formulário utilizado para avaliação das interações.
Esse questionário pede para cada usuário avaliar a qualidade de cada funcionalidade do sistema, escolher o que considera ser o melhor gesto para cada funcionalidade e também possibilita a sugestão de outro gesto ou outra funcionalidade. Há também questões sobre conforto, eventuais problemas de visão, e se foi efetivamente percebida a sensação de o objeto estar entre as mãos do operador. Para a realização dos testes foi montado um telão com back projection (Figura 6) para que houvesse mais espaço para manipulação dos objetos anatômicos e que esses pudessem ser visualizados em tamanhos próximos aos naturais. Optou-se por fazer o teste com 5 pessoas, seguindo a recomendação de Nielsen [29]. No entanto, um dos
213
avaliadores não pode comparecer aos testes, ficando-se então com um total de 4 avaliações. A seguir são apresentados os resultados obtidos.
Figura 6: Instalação utilizada para a realização dos testes. Resultados dos testes
A Tabela 2 apresenta os gestos que foram selecionados. Tabela 2: Gestos selecionados pelos avaliadores. Funcionalidade Rotação do Objeto
Translação do objeto
Escala do Objeto
Visualização de camadas - das externas para as internas e vice-versa Seleção de partes do objeto
Gestos 1. Rotação de uma das mãos - utilizar a mão aberta para movimento e a mão fechada para voltar à posição neutra (2 votos) 2. Rotação das duas mãos abertas ao mesmo tempo (como se elas envolvessem o objeto) (2 votos) 2. Movimentação das duas mãos abertas ao mesmo tempo, na horizontal e na vertical (como se realmente segurassem o objeto) (3 votos) 1. Movimentação das duas mãos horizontalmente uma em direção à outra para reduzí-lo e em direções opostas para ampliá-lo (2 votos) 3. Formando os cantos de uma janela com os dedos polegar e indicador de ambas as mãos, movimentar as mesmas na diagonal em sentidos opostos simultaneamente (2 votos) 1. Aproximação e afastamento horizontal dos dedos indicadores (como se cortassem o objeto) (2 votos) 3. Uma mão indica o número da camada e a outra indica se a camada deve ficar visível (mão aberta) ou invisível (mão fechada) (2 votos) 1. Apontamento, com dedo indicador, da parte que se deseja destacar (3 votos)
Por termos um número par de avaliadores houve alguns casos de empate. Quanto às funcionalidades, Rotação e Escala ficaram com avaliações entre Excelente e Bom, enquanto que as demais foram avaliadas com conceitos entre Bom e Ruim. Nenhuma funcionalidade foi considerada desnecessária. Aproximadamente metade dos avaliadores sentiu algum incômodo durante o processo. Todos sentiram o objeto projetado no ar, entre suas mãos. Os únicos problemas visuais informados pelos participantes foram miopia e astigmatismo, sendo que um deles não apresentava problema algum de visão. Todos qualificaram a interação com o objeto comoe muito próxima da interação direta com um objeto real.
CONCLUSÕES E PRÓXIMOS PASSOS
O conceito que estamos trabalhando no design de interação do projeto VIDA é o de "manipulação direta", com as mãos livres, como hipótese de aumento da percepção de presença. O objetivo é encontrarmos metáforas, ambientações e interações consistentes e convincentes para s idéia de se ter o objeto virtual literalmente entre as mãos. Os primeiros resultados mostram que estamos no caminho certo. Algumas limitações, como ausência de force feedback e a facilidade com que se perde a sensação de estereoscopia devem ser contornadas no design de interação, como por exemplo, pela criação de gestos que simulem “campos de força” e “campos de atração” entre as mãos e o objeto, nunca permitindo que aquelas o toquem ou o transpassem. A visualização de camadas precisa ser mais elaborada para se aproximar de uma "penetração de raio-X”. No futuro, pretende-se passar a modelar os objetos de forma sólida, baseados em matrizes de “voxels” (o equivalente ao pixel, mas com volume 3D), o que possibilitará a realização de novas funcionalidades, como cortes, demandando assim novos gestos. A técnica do “Mago de Oz” mostrou-se eficaz e deverá ser empregada nas futuras evoluções do sistema. Os recursos do sistema e das instalações para a realização dos testes com base nessa técnica deverão ser aprimorados. Há necessidade de se oferecer maior agilidade ao operador humano, para que não ocorram lags (atrasos) durante as respostas do sistema aos comandos do usuário. Também é difícil para o operador identificar movimentos do usuário de maior resolução e precisão. Outro problema é que o operador possui outro ponto de vista e outros parâmetros de calibragem em relação ao usuário, dificultando a identificação precisa dos movimentos. Os gestos de seleção e identificação das partes necessitam ser mais bem desenhados, pois os resultados não foram satisfatórios. Conforme já mencionado, o gesto de seleção de camadas, pode ser aprimorado, com a introdução da metáfora do “raio-x” ou alguma outra solução a ser projetada. A partir dos resultados obtidos, os próximos passos previstos são a integração do Atlas Virtual com um framework para simulação de exames de biópsia, no contexto do projeto Instituto Nacional de Ciência e Tecnologia – Medicina Assistida por Computação Científica [18] e a integração com os projetos video-avatar [43] e Janela 3D [47] resultantes da pesquisa financiada pela FAPESP dentro do projeto Tidia-Ae. Após tais integrações, pretende-se realizar avaliações com usuários finais – alunos e docentes da área de saúde a fim de se verificar a real possibilidade de adotar o projeto VIDA como uma ferramenta didática para o ensino de anatomia.
214
AGRADECIMENTOS
Os autores agradecem ao pesquisador de iniciação científica Fábio Luiz Picchi, pelo planejamento e execução dos testes do sistema; à FAPESP, pelo apoio ao projeto Interlab, dentro do programa TIDIA-Ae, e pela bolsa de treinamento técnico concedida a Cleber Correa; ao CNPq, pelo apoio concedido no contexto do projeto INCT-MACC, à CAPES, pela bolsa de mestrado concedida a Daniel Tokunaga; ao CNPq, pela bolsa PIBIC concedida a Fábio Luiz Picchi; e à diretoria de pós-graduação e pesquisa do Centro Universitário SENAC, pelas horas de pesquisa concedidas a Romero Tori. REFERÊNCIAS
1. ADE, A. The Visible Human http://vhp.med.umich.edu/UMVB.html.
Project.
2. Albrecht, I. Construction and Animation of Anatomically Based Human Hand Models. Proc. Eurographics/SIGGRAPH Symposium on Computer Animation 2003, ACM Press (2003), 98-109.
12. Dahlbäck, N., Jönsson, A., Ahrenberg, L. Wizard of Oz Studies – Why and How. Proc. of ACM Intelligent User Interfaces. (1993).193-200. 13. Favero, R.V.M., Franco, S.R.K. Um estudo sobre a permanência e a evasão na Educação a Distância. Novas Tecnologias na Educação 4, 2, (2006), 1-10. 14. Gateau, S. 3D Vision Technology: Develop, Design, Play in 3D Stereo. Disponível em: http://developer.nvidia.com/object/siggraph-2009.html (Acesso em 17 Set 2009). 15. Grasset, R., Billhinghurst, M., Dünser, A. and Seichter, H. The Mixed Reality Book: A New Multimedia Reading Experience. Proc. CHI 2007, ACM Press (2007), 1953 - 1957. 16. Halle, M.W. and Kikinis, R. Flexible frameworks for medical multimedia. Proc. MULTIMEDIA '04, ACM Press (2004), 768-775 17. Hitlab. AR Toolkit http://www.hitl.washington.edu/artoolkit/
Homepage.
3. Ariza, O., Figueroa, P., and Valbuena, G. Integration of 2D and 3D medical data for education. Proc. SIGGRAPH '06 , ACM Press (2006), 174.
18. INCT-MACC Instituto Nacional de Ciência e Tecnologia – Medicina Assistida por Computação Científica. http://www.lncc.br/macc/.
4. Azuma, R.T., Baillot, Y., Behringer, R., Feiner, S., Julier, S., Macintyre, B. Recent Advances in Augmented Reality. IEEE Computer Graphics and Applications, (2001).
19. Imielinska, C. and Molholt, P. Incorporating 3D virtual anatomy into the medicalcurriculum. Commun, ACM Press (2005), 49-54.
5. Barreto, A.M., Paradella, M.D., Assis, S. Bibliotecas públicas e telecentros: ambientes democráticos e alternativos para a inclusão social. In Ci. Inf., Brasília, v. 37, n. 1 (2008), 27-36 6. Bernardes, J., Nakamura, R., Tori, R. Design and implementation of a flexible hand gesture command interface for games based on computer vision, Proc. of SBGames 2009, (2009). 7. Bimber, O., Raskar, R. Spatial Augmented Reality. A. K. Peters, (2005).
20. ISPR - International Society for Presence Research. “The Concept of Presence:Explication Statement”. http://ispr.info/. 21. Iwamoto, T., Tatezomo, M., Hoshi, T. e Shinoda, H. Airborne Ultrasound Tactile Display. SIGGRAPH 2008 New Tech Demos (2008). 22. Jones, A., McDowall, I., Yamada, H., Bolas, M. e Debevec, P. Rendering for an Interactive 360◦ Light Field Display. ACM Transactions on Graphics 26, 3 (2007), 40-2 - 40-10.
8. Biocca, F. The cyborg's dilemma: progressive embodiment in virtual environments. Journal of Computer-Mediated Communication, 3(2), (1997).
23. Lima, J. et al., Online Monocular Markerless 3D Tracking for Augmented Reality, Abordagens Práticas de Realidade Virtual e Aumentada. SBC, Porto Alegre, 2009.
9. Bowman, D., Kruijff, E., Laviola, J.J., Poupyrev, I. 3D User Interfaces:Theory and Practice. Addison-Wesley, Boston, 2005.
24. Lucente, M. and Galyean, T. Rendering Interactive Holographic Images. Proc. SIGGRAPH '95, ACM Press (1995), 387-394
10.Brenton, H., Hernandez, J., Bello, F., Strutton, P., Purkayastha, S., Firth, T., and Darzi, A. Using multimedia and Web3D to enhance anatomy teaching. Comput. Educ. 49, 1 (2007), 32-53.
25. Ma, J. and Nickerson, J.V. Hands-on, simulated, and remote laboratories: A comparative literature review. ACM Comput. Surv. 38, 3 (2006), 7.
11.Cunha, Í.L.L., Monteiro, B.S., Moraes, R.M., Machado, L.S. AnatomI 3D: Um Atlas Digital Baseado em Realidade Virtual para Ensino de Medicina, Proc. SVR 2006, SBC Press (2006), 3-14.
26. Maes, P., Darrell, T., Blumberg, B. and Pentland, A. The ALIVE system: wireless, full-body interaction with autonomous agents. Multimedia Systems vol. 5, 2, (1997) ,105-112. 27. Mattar, J. Interatividade e Aprendizagem. In: LITTO, F. M.; FORMIGA, M. (org.). Educação a Distância: O
215
Estado da Arte. São Paulo: Pearson Education do Brasil, (2009), 112-120 28.Miranda, F.R., Tori, R., Bueno, C.E.S, Trias, L.P. AR X-Ray : portable projector-based augmented exploration of buildings. Proc. SVR 2008, SBC Press (2008), 185195. 29.Nielsen, J. Why You Only Need to Test with 5 Users. Jakob Nielsen's Alertbox, March 19 (2000). http://www.useit.com/alertbox/20000319.html 30.NLM (Nacional Library of Medicine). http://www.nlm.nih.gov/research/visible. 31.North, C., Shneiderman, B., and Plaisant, C. UserControlled Overviews of an Image Library: A Case Study of the Visible Human. Proc. ACM DL 96, ACM Press (1996). 32.Park, K. et al. Volumetric Heart Modeling and Analysis, CACM 48, 2 (2005). 33.Pinho, M.S., Rebelo, I.B. Interação em Ambientes Virtuais Imersivos, Realidade Virtual – Conceitos e Tendências. Editora Mania de Livro, (2004), 109. 34.Preece, J, Rogers, Y., Sharp, H. Design de Interação. Porto Alegre: Bookman, (2005), 550. 35.ProVision. http://www.provision3dmedia.com/. 36.Ramos, F.M. and Nunes, F.L.S. Construção de Atlas de Anatomia e Fisiopatologia do Câncer de Mama utilizando Realidade Virtual, Proc. SIBGRAPI '05, SBC Press (2005). 37.Raskar, R., Welch, G.; Low, K. Shader Lamps: Animating Real Objects with Image-Based Illumination. Proc. EGWR '01, (2001). 38.Salber, D., Coutaz, J. Applying the Wizard of Oz Technique to the Study of Multimodal Systems. Lecture Notes in Computer Science, vl. 753. Springer-Verlag (1993). 219-230.
39. Shenton, M.E. et al. Harvard Brain Atlas: A Teaching and Visualization Tool. Proc. BioMedVis '95, (1995). 40. Silva, M. Sala de Aula Interativa. Rio de Janeiro: Quartet, 3ª. Ed. (2002). 220 p. 41. Siscoutto, R. A., Szenberg, F., Tori, R., Raposo, A. B., Celes, W., Gatass, M. Estereoscopia. In: Kirner, C., Tori, R. Realidade Virtual: Conceitos e Tendências. São Paulo: Mania de Livro, 2004. p. 179-201. 42. Sutherland, I. The Ultimate Display. Packer, R; Jordan, K. (ed.). Multimedia: From Wagner to Virtual Reality. W. W. Norton & Company, (1965), 396. 43. Tokunaga, D.M., Sancher, S.R.R., Trias, L.P., Bernardes JR, J.L., Nakamura, R. Video-Based MicrofacetBillboard Avatar for Educational Immersive Teleconference Systems. Proc. SVR 2009, SBC Press (2009). 44. Tori, R.; Kierner, C., Siscoutto, R. Fundamentos e Tecnologia de Realidade Virtual e Aumentada. SBC Press (2006), 422. http://www.interlab.pcs.poli.usp.br. 45. Tori, R., Nunes, F.L.S.; Gomes, V.H.P., Tokunaga, D.M. VIDA: Atlas Anatômico 3D Interativo para Treinamento a Distância. Proc. XV Workshop Sobre Informática na Escola, SBC Press (2009). 46. Tori, R. Educação sem Distância. São Paulo: Editora Senac. (2009), no prelo. 47. Trias, L.P., Tori, R. Janela3D: a Visual Telecommunication Tool Sensible to User’s Viewpoint. Proc. SVR 2009, SBC Press (2009) 48. Tsai, M. C. and Melmon, K. L. 1998. Digital library for education and medical decision making. In Proceedings of the Third ACM Conference on Digital Libraries (Pittsburgh, Pennsylvania, United States, June 23 - 26, 1998). I. Witten, R. Akscyn, and F. M. Shipman, Eds. DL '98. ACM, New York, NY, 311-312.
216
Gestures: Pushing the Boundaries of Touch-based Interfaces Gabriel Celemin Giro54 – User Experience Design Manuel Ugarte 1818, Apt 1 C. C1428BRH Buenos Aires, Argentina gabriel@giro54.com ABSTRACT
Touchscreens have become a key component of digital devices, from mobile phones to laptop PCs. Their characteristics enable new interactions –referred to as “gestures”– that extend beyond the traditional manipulation of elements on screen with a mouse and a keyboard. They also raise issues on how these interactions affect the design of digital products such as applications and websites, that must simultaneously serve people using operating system metaphors from different generations and present new challenges on how to standardize and develop best practices and design patterns. Author Keywords
Interaction techniques, gestures, touchscreen, post-WIMP interfaces, mobile devices, touch Figure 1. The Macintosh System 1.0 (1984) ACM Classification Keywords
H.5.2 [Information Interfaces and Presentation]: User Interfaces --- Interaction styles INTRODUCTION
The introduction and proliferation of touch-screen based devices like the iPhone, the iPod Touch and –to a lesser extent– the touch-enabled PCs, is causing a revolution in HCI –especially in Interaction Design– not seen since the development of the mouse-driven Graphical User Interface (GUI) at Xerox PARC that moved us beyond the commind-line interface more than thirty-five years ago [3]. Interactions born with the WIMP (window, icon, menu, pointing device) paradigm such as point, click, doubleclick, select, drag & drop have been the standard since the early eighties and are as prevalent on the first Macintosh System (Figure 1) as on the last incarnation of Windows (Figure 2).
Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA. Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Figure 2. Windows Vista Desktop
However, the physical keyboard and mouse are beginning to give place to the hands and fingers as ubiquitous input devices, thus creating a whole new world of interactions called “gestures” [6].
217
GESTURES
In touch-based interactions, a gesture is a quick movement of one or more fingers on a screen that the computer interprets as a command, rather than as a mouse movement, writing, or drawing [9]. Gestures are made up of two components: a “chord” or combination of digits that touch the surface, and a motion associated with a chord that triggers an action (Figure 3) [1].
scroll or pan a screen. For example, if a user needs to see information that is not currently on the screen, she can place a finger on the screen and drag it up, down, left or right. Flick
Placing a finger and sliding it quickly across the screen is called a Flick. It’s like a faster version of Drag and is used to perform a quick scroll or to move an object on or off the screen. Pinch
This gesture requires two fingers (usually the thumb and the index finger). It is used to scale objects by placing both fingers on screen and bringing them together (to reduce the size of the object) or by sliding them apart (to increase its size). Swipe
Figure 3. Chord diagram from Apple’s multi-touch patent.
The multi-touch (multiple simultaneous contact points) interface enables a greater sense of direct manipulation. Using gestures, people feel a greater affinity for, and sense of control over, the objects they see on screen, because they do not use any intermediate device (such as a mouse) to manipulate them [4]. The combination of a multi-touch interface and gestures makes new interactions possible. As Jacob, et al [5] explain “in the [iPhone’s] photograph viewing application, zoom functions that would traditionally be accessed through combo boxes, button presses, or other widgets are instead activated by pinching and stretching the display with two fingers using the illusion of a pliable rubber surface”. The number of chord-motion combinations can get quite large, so much so that Apple Inc. filed a patent for a “gesture dictionary” to potentially help users to learn and remember the meaning of numerous gestures and take full advantage of a multi-touch gesture language. Among the most popular gestures are: tap, drag, flick, pinch and swipe. Tap
Tap is the simplest and most commonly used gesture. It is equivalent to selecting or clicking with a mouse. It is performed by tapping on the screen with just one finger (usually the index). It is used to select, open or activate an object such as an icon, a button or an item on a list. Drag
A Drag consists of placing a finger over an object on the screen and sliding it slowly to a different area. It is used to
Place a finger on an item and swipe it across the screen (left or right) to perform a Swipe. It is used as a shortcut to reveal the Delete button on the iPhone, for example when doing it on an email message. In the Firefox browser, swiping left will take you to the previous page (the same as the Back button). CHALLENGES OF THE FOURTH-GENERATION UIs
Andries van Dam [8] calls the “post-WIMP” user interfaces that “don’t use menus, forms, or toolbars, but rely on, for example, gesture and speech recognition for operation” the forth-generation UIs. The main characteristics of each UI are compared in Table 1. This paradigm opens up new possibilities to user interface and interaction design, while at the same time bringing new challenges. WIMP UIs
Touch-based UIs
Accurate pointing device (mouse cursor/pointer)
Inaccurate pointing device (finger)
Single pointer
Multiple pointers
Physical keyboard
No physical keyboard (usually)
No portion of the display covered
Portions of the display covered by the fingers, hand, arm
Menus and icons
Buttons and icons
Table 1. Comparison of UI characteristics.
Some methods extensively used on WIMP interfaces become cumbersome or obsolete. For example, hover (placing the mouse cursor over an item on screen) is not supported by most touch screens.
218
Portable devices like mobile phones have other limitations: ¥ Smaller displays and screen resolutions (480x320 vs. 1024x768+); ¥ One window displays (vs. multiple-window); ¥ Complex context of use (glare, etc) The implications for designers are significant as websites and applications cannot be easily adapted to touch interfaces. Besides the aesthetic update, the core functions and navigation systems will need to be redesigned. It is much harder to target small objects on the screen with a finger than with a mouse. With little success, Windows offers a tool called “touch pointer” to accomplish tasks that require fine movement or hover [10]. It uses an on-screen mouse (with right and left buttons) and a drag area to control the pointer. On most mobile devices users can visualize only one window at a time. According to the iPhone Human Interface Guidelines “applications can contain as many different screens as necessary, but users access and see them sequentially, never simultaneously.” The lack of standardization in the names and actions triggered by gestures between Apple’s iPhone OS and Microsoft’s Windows OS brings even more confusion. Gestures with conflictive meanings include:
Figure 4. The eight Flick gestures and their default assignments in Windows 7. RECOMMENDATIONS Discoverability.
A good touch interface should afford “touch”. Make sure users understand what is touchable and what is not. Larger is better.
Buttons and other UI elements should be big enough to be manipulated with the fingertips. Controls of at least 40-45 pixels are considered comfortable to use. Avoid tasks that require precise cursor placement. Not great for input.
Press and Hold
Apple: display a magnified view of text (i.e.: for cursor positioning in editable text or to make it easier to read). Microsoft: similar to a right-click with a mouse. Double Tap
Apple: zoom in (and center) or zoom out a block of content or an image. Microsoft: similar to double-clicking on items with a mouse. Flick
Apple: Flick uses the same motion as Drag, only done faster, to pan or scroll quickly. For example, it allows users to scroll a list of contacts or music tracks rapidly. Microsoft: defined two categories of touch flicks: navigational and editing. Navigational flicks (up-down and left-right movements) are for dragging up or down and moving back and forward. Editing flicks (diagonal movements) are for copy, paste, undo, and delete (Figure 4). Zoom / Pinch
Zoom (Microsoft) and Pinch (Apple) are the same, but use different names.
Text input and editing are a lot harder without physical input devices [7] so interfaces should provide alternative input methods or rely on predictive text and autocompletion. Avoid Hover.
As mentioned, the majority of touch screens do not support Hover. Avoid designing tasks that depend on it. Provide feedback.
Due to the lack of physicality of touch interfaces (although some already provide haptic feedback) it is extremely important that the system gives visual cues that an action has take place. Screen size matters.
In a large screen it can be tedious to repeatedly move one’s hands between targets that are far apart. It's better to keep task interactions within the range of a resting hand whenever possible [10]. CONCLUSION
The aim of this text is to enable a better understanding of the challenges of designing interfaces and interactions for touch-enabled systems among practitioners in the region and raise awareness of the need for developing design patterns and best practices.
219
ACKNOWLEDGMENTS
Thanks to Suzanne Ginsburg for her helpful suggestions and revisions, to Nora Blanco for her support and to Amyris Fernandez for her patience. REFERENCES
1. Apple applies for patent on dictionary of multi-touch gestures http://arstechnica.com/apple/news/2007/08/appleapplies-for-patent-on-dictionary-of-multi-touchgestures.ars 2. Buxton, Bill. Multi-Touch Systems that I Have Known and Loved http://www.billbuxton.com/multitouchOverview.html 3. History of the Graphical User Interface http://en.wikipedia.org/wiki/History_of_the_graphical_u ser_interface 4. iPhone Human Interface Guidelines, 16-31. 5. Jacob, R.J.K., Girouard, A., Hirshfield, L.M., Horn, M.S., Shaer, O., Solovey, E.T. and Zigelbaum, J.,
Reality-Based Interaction: A Frame-work for PostWIMP Interfaces in CHI 2008. 6. McLaren, L. Swipe and Drag, Tap and Flick - Getting to Grips With Your iPhone 3G's Gestures http://constantcontentsource.com/reference-andeducation/swipe-and-drag-tap-and-flick-getting-to-gripswith-your-iphone-3gs-gestures.html 7. Sadun, E. The iPhone Developerâ&#x20AC;&#x2122;s Cookbook. AddisonWesley (2009), 10 8. Van Dam, A. Post-WIMP user interfaces. Communications of the ACM, 40 (2). 63-67. 9. Windows User Experience Interaction Guidelines for Touch http://msdn.microsoft.com/en-us/library/cc872774.aspx 10. Windows Vista Help, What is the touch pointer? http://windowshelp.microsoft.com/Windows/enUS/help/ba353fd0-a160-4246-9e823c82a869d6b91033.mspx
220
tv/ dispositivos m贸veis converg锚ncia digital
218
TV Digital: Usuário ou Telespectador Televisivo? Christian Brackmann Programa de Pós-Graduação em Informática (PPGINF) Universidade Católica de Pelotas (UCPel) Rua Félix da Cunha, 412 – 96010-000 – Pelotas – RS christian@ucpel.tche.br
Fabiane Marroni Programa de Pós-Graduação em Informática (PPGINF) Universidade Católica de Pelotas (UCPel) Rua Félix da Cunha, 412 96010-000 - Pelotas – RS fvmar@ucpel.tche.br
RESUMO
Este artigo tem o propósito de levantar uma discussão e exemplificar diferenças existentes entre os aplicativos para computador e TV Digital. Esta interatividade televisiva que já encontra-se em fase experimental será introduzida ao povo brasileiro ainda este ano. É proposta ainda uma terminologia didática e uma categorização de atores para facilitar ao projetista e ao desenvolvedor identificar possíveis rejeições do público e da audiência televisiva. A análise de novos perfis de usuário deve ser levada em consideração na criação de aplicativos televisivos. Estes demandam cuidados para melhoria de sua usabilidade devido às diferenças encontradas entre os televisores e os “computadores televisivos”. Author Keywords
TV Digital, Usabilidade, Perfis de Usuários ACM Classification Keywords
H.5.2 User Interface: User Centered-Design INTRODUÇÃO
A revolução digital da década de 1990 provocou uma sobrecarga de informações e ofereceu possibilidades incontáveis ao telespectador. A primeira adesão em massa de equipamentos digitais nos domicílios começou em dezembro de 1995 com o lançamento do DVD (Digital Video Disc). Pela primeira vez foi possível gravar um filme inteiro em um disco inteiramente digital. O segundo grande passo no processo de digitalização da televisão ocorreu em março de 1999 com o surgimento de um serviço nos Estados Unidos chamado TiVo, também conhecido como DVR (Digital Video Recorder) ou PVR (Personal Video Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA. Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Paulo R. Gomes Luzzardi Programa de Pós-Graduação em Informática (PPGINF) Universidade Católica de Pelotas (UCPel) Rua Félix da Cunha, 412 96010-000 - Pelotas – RS luzzardi@ucpel.tche.br
Recorder). Com o uso de equipamentos DVR, foi possível pausar, voltar e gravar uma programação ao vivo sem o uso de fitas magnéticas em formato digital. Com os veículos "de massa", é possível atingir uma multidão de anônimos. As ondas do rádio encurtam distâncias. O telégrafo (criado em 1835 por Samuel Morse) e o telefone (criado em 1876 por Alexander Graham Bell) possibilitou a comunicação e disseminação da informação de forma instantânea - com a interação quase imediata do emissor e receptor [1]. Com a superposição da informática e das telecomunicações o campo de atuação da televisão adquire uma enorme diversificação. Um século de acelerada evolução tecnológica da televisão se passou desde as primeiras invenções, mas a era da informação está apenas começando, pois quando o tema é televisão digital, certamente a palavra mais apropriada é convergência. Desde a implantação do primeiro canal de TV, a BBC (British Broadcasting Corporation) de Londres, fundada em 1936, a televisão já passou por várias mudanças, em um constante processo de evolução e adaptação às novas necessidades sociais e comerciais. Levando-se em conta que a difusão ocorre através de ondas eletromagnéticas, deve-se considerar também o impacto que este processo de digitalização terá no Brasil. O país é um dos que mais possui televisores por domicílio no mundo e também o um dos bens duráveis mais presente nas casas dos brasileiros (vide Tabela 1). Com a chegada da televisão digital em todo o território nacional, as emissoras têm um grande desafio de adequar as múltiplas possibilidades de produção e distribuição de conteúdo da mais alta tecnologia para um público de cultura heterogênea e de contrastes sociais marcantes. Estes telespectadores podem ser dos mais diversos tipos, regiões, classes sociais e credos, ou seja, o conteúdo televisivo deve ser compatível com todo o público da emissora.
219
1995
1996
1998
2002
2004
2005
2006
2007
Rádio
88,9
90,4
90,4
87,9
88,1
88,4
88,1
88,2
Televisão
81,1
84,4
87,5
90,0
90,9
92,0
93,5
94,8
Microcomputador
-
-
-
14,2
16,6
18,8
22,4
27,0
Acesso à Internet
-
-
-
10,3
12,4
13,9
17,1
20,4
Tabela 1. Domicílios com bens duráveis e serviços de acesso a comunicação de 1995 a 2007 (adaptado de [2]).
Além dos critérios sociais, devem ser levados em consideração pela emissora e o desenvolvedor as novas características que a televisão digital leva à casa dos telespectadores e estes devem ser tratados de forma diferenciada. Esta diferenciação de público e interatividade será discutida neste artigo para auxílio na criação de aplicativos voltados a este novo jeito de “assistir” televisão. Propõe-se ainda no final deste trabalho uma proposta de categorização de atores. Este artigo está organizado como segue. Primeiramente fazse uma breve introdução sobre a TV Digital e a interatividade que é provida por ela. A seção seguinte discorre sobre interatividade e como esta se difere de computadores e televisores. A próxima seção apresenta a proposta deste trabalho e sua aplicabilidade em conjunto com premissas do Design de Interação. Por fim, expõe-se as conclusões acerca deste trabalho e sua continuidade. INTERATIVIDADE NA TELEVISÃO
É importante ressaltar que ainda havendo uma interpretação abrangente do que se entende por TV interativa, ela não deve ser confundida com TV Digital. Apesar de haver uma ampla intersecção entre estes dois conceitos, eles são em si, diferentes. Se considerarmos a interatividade em toda sua complexidade, pode-se afirmar que se trata também de interação mediada por um dispositivo eletrônico, e é possível que a televisão analógica seja interativa em alguns aspectos, assim como pode não haver interatividade na TV Digital [3]. A interatividade até os dias atuais no Brasil é feita através do envio de SMS, ligações telefônicas, sites, entre outros. O usuário tem uma falsa impressão de interatividade pela televisão, pois depende de outra(s) mídia(s) para interagir com uma pequena parte da programação. Um exemplo deste tipo de interação foi o programa chamado “Você Decide” que veiculou de 1992 a 2000, muito antes da interatividade prometida pela TV Digital.
está sendo transmitida através de aplicações que são enviadas juntamente à transmissão do sinal digital, ou seja, parte da banda será alocada para o envio de dados. Atualmente a interatividade na televisão ainda não existe devido a questões técnicas e governamentais. O seu componente responsável pela interatividade (middleware Ginga) não foi oficialmente lançado. A previsão de seu lançamento está previsto para o final deste corrente ano (2009) e sua chegada promete muitas novidades aos telespectadores. Estas novidades estarão disponíveis para todo o público que possua um sinal digital (inicialmente) e até o final da implantação do novo sistema de TV, todo o Brasil poderá ter acesso a esta tecnologia. Esta inovação trará novas possibilidades aos telespectadores e também para as emissoras de televisão, por este motivo sentiu-se uma necessidade da análise deste novo modo de “assistir” televisão. CONTEXTUALIZAÇÃO
Uma televisão convencional é usada em um contexto bastante diferente em relação ao de um computador de mesa (desktop), portátil ou de mão. Tradicionalmente, o telespectador assiste à televisão sentado em um sofá ou poltrona confortável e em uma postura passiva, deixando-se levar pela programação, interagindo com equipamentos e programas voltados para entretenimento e informação. Por outro lado, em termos tecnológicos, um televisor que possibilita interação pode ser muitas vezes visto como um computador, cujo monitor é um aparelho de televisão e o controle-remoto substituem o teclado e o mouse. De qualquer forma, estes dispositivos têm uma grande vantagem: os “computadores televisivos” (ou sistemas embarcados) são simplificados e dedicados a um pequeno grupo de tarefas e não solicitam a carga de trabalho de atualização, proteção, configuração e a gestão de um enorme sistema operacional. Estes dispositivos também são citados na literatura como URD (Unidade Receptora Decodificadora) ou Set-Top Box. Podem-se distinguir vários aspectos em relação à televisão e o computador, sendo alguns considerados mais evidentes [4][5]: a)
computadores são usados geralmente para atividades bem-definidas (p.ex. redigir um documento, pagar contas, chats, jogar, entre outros). Do outro lado, a televisão tem um contexto de uso basicamente de entretenimento passivo, com o espectador assistindo aos programas. Note que a palavra “assistir” já transmite uma idéia de passividade, ao contrário das palavras que se enquadram mais aos computadores: “escrever”, “pagar”, “jogar”, “conversar”, entre outros;
A interatividade televisiva promovida através do middleware do Sistema Brasileiro de TV Digital permitirá ao telespectador participar ativamente da programação que
220
b) computadores possuem uma finalidade mais genérica, pois eles podem ser usados para as mais diferentes tarefas. Como uma URD é considerada um sistema embarcado, seu poder de processamento e possibilidades de flexibilidade são limitados e isso também limita a forma que será utilizada e considerada pelo usuário; c)
o computador se localiza geralmente em escritórios, ao contrário da televisão que muitas vezes é sinônimo de entretenimento e são posicionados em ambientes relaxantes. Vale salientar que com o surgimento da portabilidade, a televisão começará a surgir em todo e qualquer ambiente, como por exemplo: pessoas sem o hábito da leitura em ônibus superlotados podem ter acesso às informações durante a ida e volta do trabalho, escola ou outro compromisso;
d) fisicamente falando, assiste-se televisão de forma relaxada em um sofá, muitas vezes durante o período da noite com as luzes apagadas. O computador geralmente é manuseado em cadeiras próprias para manter a postura ereta da coluna e braços. Em outras palavras, um usuário tem uma inclinação mais para frente e um telespectador com uma inclinação para trás; e)
televisores podem vir a ter vários telespectadores por tela e um computador dificilmente terá mais de um usuário;
f)
utiliza-se a televisão muitas vezes como uma atividade social, no qual o indivíduo interage com sua família e amigos para discutir assuntos pertinentes ao programa televisivo e compartilhar emoções. No computador, geralmente envolve atividades profissionais de um indivíduo;
g) as diferentes atitudes também implicam em diferenças evidentes na quantidade de recursos físicos (tempo) e cognitivos (atenção e memória) que um usuário de computador e um telespectador estão dispostos a investir durante suas interações. O usuário se concentrará para alcançar seus objetivos em seu trabalho, ao contrário do telespectador, que se deixará levar pela experiência de lazer proposta pela emissora. Ou seja, um usuário pode ter uma tolerância maior para aprender seu caminho em uma interação longa e complexa. Um telespectador, provavelmente, não teria disposição de tolerar algo complexo. Levando-se isto em conta, os critérios que caracterizam a usabilidade também devem variar: enquanto a eficiência e eficácia são essenciais para
a satisfação do usuário, a satisfação do telespectador deve ser priorizada em primeiro lugar e não a eficiência; h) a tela da televisão e suas especificações atuais têm grandes limitações para exibição de textos e outras informações estáticas e coloridas. Estas especificações ainda terão que ser respeitados por muito tempo devido ao período de transição do formato de transmissão; i)
o número de dispositivos que são utilizados para interação na televisão são limitados e com características únicas. O principal dispositivo de apontamento e entrada de texto é o controle remoto;
j)
a distância do telespectador e o usuário também deve ser levado em consideração, pois o telespectador se encontra geralmente alguns metros distante da tela e o usuário apenas alguns centímetros do monitor.
Como se pode perceber existem vários motivos para comprovar a notória divergência entre os dois modelos comparados, a TV Digital e o computador, motivo pelo qual se fez necessário a criação de nomenclaturas específicas para este novo tipo de “telespectador”. Com o surgimento das novas oportunidades frente à televisão surgem também os telespectadores ativos, ou seja, o modelo de transmissão digital cria um novo modelo de relacionamento com seu público [6] [7]. À frente destas diferenças, tornou-se necessária a definição de uma terminologia própria para facilitar a compreensão do assunto discutido. O objeto de estudo pode ser categorizado em: • programa: define-se este termo como uma apresentação, sistemática ou não, de espetáculos televisionados através de um fluxo audiovisual principal. São as atrações já conhecidas pelo atual sistema de transmissão e captação analógico da televisão. Pode ser também chamado de programação linear; • aplicativo: conforme Barbosa (2008), um aplicativo é transmitido em formato de dados em conjunto ao programa. Estes dados constituem outros áudios e vídeos, além do principal, imagens, textos, etc., e um aplicativo relacionando temporalmente e especialmente todos esses objetos de mídia. Esse relacionamento pode ser guiado por interações do usuário telespectador, ao qual poderá ser delegado o controle de fluxo de um programa
221
televisivo, determinando se um determinado conteúdo deve ser exibido ou não e, em sendo, a forma como será exibido. Como o fluxo de um programa televisivo deixa de ser contínuo em sua concepção e com vários caminhos alternativos de exibição. Um aplicativo também é encontrado na literatura como “Programa nãolinear”;
•
Adulto Conectado: adulto, boa familiaridade com tecnologia e assiste à televisão durante seu trajeto ao trabalho e/ou outro compromisso em seu celular ou televisão móvel;
•
Meia Idade com Ajuda: acima de 50 anos, necessita óculos para curta distância, pouca familiaridade com a tecnologia mas possibilidade de ajuda de parente ou amigo;
•
Avesso à Tecnologia: adulto, essencialmente masculino, tem aversão à tecnologia e desiste caso encontre obstáculos.
•
Idoso: indivíduo idoso e apenas assiste à televisão. Não tem conhecimento algum de tecnologia e não interage.
Baseados nestes conceitos são propostos os perfis de usuários na seção seguinte. PROPOSTA
Os indivíduos que atualmente são apenas telespectadores também terão que passar por uma metamorfose, pois os “espectadores” se transformarão em “usuários” e os “usuários” podem voltar à condição de “espectadores” – uma mudança comportamental. Neste caso, sugere-se a seguinte definição ao ator: • Telespectador (t-espectador): indivíduo que assiste um determinado programa, ou seja, uma ação passiva. Também chamado de “tevente”; • Teleusuário (t-usuário): agente externo que interage com o sistema, ou seja, um indivíduo que interage com aplicativos televisivos; No Brasil, Gil Barros, após analisar quatro pesquisas de modelagem de usuários, feitas no Reino Unido, Estados Unidos e em Portugal, propôs em seu trabalho uma classificação que julgou mais próxima da realidade brasileira de televisão aberta, porém acredita-se que não foram listados todos os possíveis modelos. Propõem-se então a seguinte classificação de perfis de maior audiência (adaptado de [8]): •
Juvenil: criança ou adolescente que tem muito tempo para se entreter com a televisão. Devido ao fato de já ter sido alfabetizado digitalmente, não encontra dificuldades ao interagir com aplicativos;
•
Torcedor Antenado: adulto, essencialmente masculino, boa familiaridade com tecnologia e interesse específico em esportes;
•
Pai/Mãe de família: adulto(a), familiaridade médio-baixa com tecnologia e interesse específico em programas pré-definidos;
•
Mãe Ocupada: adulto, feminino, indiferença pela tecnologia e atenção dispersa entre muitas atividades;
As novas experiências que o telespectador tem com a televisão também são analisadas em BERNHAUPT, onde sustenta a presença dos aplicativos de TV Digital em nosso quotidiano para comprar, se informar e comunicar. Conforme o autor, assistir televisão é fácil, interagir com ela demanda conhecimento, habilidade e competência. Enquanto um telespectador tradicional dificilmente errará, um usuário de TVDi facilmente falhará [9]. Baseado neste princípio notou-se a possibilidade de uso da aplicação de técnicas de usabilidade voltada para a TV Digital para facilitar a inclusão de novos perfis. Aplicando os conhecimentos do Design de Interação (campo que se preocupa em pesquisar e projetar sistemas baseados em computador para pessoas), os projetistas de interação criam produtos e serviços de maior usabilidade sob o conceito do projeto centrado no usuário, levando-se em conta os objetivos, funções, experiências, necessidades e desejos destes. Havendo uma maior aceitação do público, ocorrerá também uma influência da audiência da mesma [10]. O termo usabilidade é frequentemente usado para referir-se à capacidade que um produto possui em ser facilmente usado. Conforme visto anteriormente, a televisão encontra-se presente em quase todos os lares brasileiros e seu público é muito heterogêneo, o que demanda uma abordagem diferente aos aplicativos de acordo com o perfil do seu público alvo. Usuários preferem sistemas que sejam fáceis de aprender e utilizar, assim como eficazes, eficientes, seguros, satisfatórios, agradáveis atraentes, desafiadores e outras características que garantam sua qualidade. Esta avaliação é necessária para a certificação de que os teleusuários possam vir a utilizar os aplicativos e apreciá-lo. Identificado os diferentes perfis de maior audiência, pretende-se realizar testes de usabilidade em aplicativos televisivos para avaliar a importância destas características
222
para os padrões através de técnicas de entrevista, formulário e observação. A seguir, faz-se uma breve conclusão sobre o assunto e continuidade do trabalho. CONCLUSÃO
A chegada da TV Digital no território Brasileiro provoca muitos questionamentos sobre o futuro da televisão. Especula-se inclusive a diminuição da audiência na programação linear, pois um aplicativo pode vir a ser mais interessante que a própria programação [6]. A chegada da interatividade televisiva pela televisão deve ser analisada e projetada de uma forma muito cuidadosa pelas emissoras, pois seu público é muito heterogêneo e necessita de diferentes requisitos de usuário que até então não eram questionados [10]. Uma forma de solucionar estas diferenças é na criação de diferentes formatos do mesmo aplicativo para os distintos perfis. Este artigo tentou exemplificar e discutir diferenças e características que devem ser levadas em consideração no momento de projetar e desenvolver aplicativos interativos para TV Digital pelo designer. AGRADECIMENTOS
Esta pesquisa é parcialmente financiada pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPES (PROSUP). REFERENCES
1. BECKER, V., & MONTEZ, C. TV digital interativa: conceitos, desafios e perspectivas para o Brasil. Florianópolis: UFSC, 2a ed. 2005 2. PNAD 2007 (Pesquisa Nacional de Domicílios 2007). Disponível em: www.ibge.gov.br/home/presidencia/noticias/noticia_vis ualiza.php?id_noticia=1230&id_pagina=1. Acesso em: 14/07/2009. 2008
3. TEIXEIRA, L. H. P. Televisão Digital: Interação e Usabilidade. Em: Dissertação (Mestrado em Comunicação). UNESP - Universidade Estadual Paulista, Faculdade de Arquitetura, Artes e Comunicação. Disponível em: http://www.dominiopublico.gov.br/download/texto/cp06 2814.pdf. 2008 4. GOMES, A. S.; MONTEIRO, B. S.; MELO, C.; ARCOVERDE, D.; ALVES, C. F. Design da Interação de Novos Produtos para TVD: Abordagens Qualitativas. Em: Simpósio Brasileiro de Fatores Humanos em Sistemas Computacionais 2008. Editora SBC. 2008 5. CYBIS, W.; BETIOL, A. H.; FAUST, R. Ergonomia e Usabilidade - Conhecimentos, Métodos e Aplicações. Editora Novatec. 344 páginas. ISBN: 978-85-7522-1389. 2007 6. COSTA, L.; CARNEIRO, L. G.; DORNELLES, M.; KIST, C.; CÍRIO, M.; PEREZ, M.; ADAMSKI, F. R. SET: as novas relações da mídia com o Público. Em: Jornal Hipertexto / Jornal da Famecos/PUCRS. Edição Ano 10, Nº 66. 2008 7. FLORES, V. F.; FAUST, R.; PIMEN TA, M. S. Definindo uma Proposta para Avaliações de Usabilidade de Aplicações para o Sistema Brasileiro de TV Digital. Em: IHC 2008 (Simpósio Brasileiro de Fatores Humanos em Sistemas Computacionais). Editora PUCRS. 2008 8. BARROS, G. A consistência da interface com o usuário para a TV interativa. Universidade de São Paulo. São Paulo: POLI-USP. 2006 9. BERNHAUPT, R.; OBRIST, M.; TSCHELIGI, M. Usability and Usage of iTV services: lessons learned in an Austrian field trial. Em: ACM Comput. Entertaint. Vol. 5. No. 2. 2007 10.PREECE, J; ROGERS, Y; SHARP, H. Design de Interação: Além da interação homem-computador. Porto Alegre. Bookman. 2005.
223
A personalização como estratégia para o gerenciamento da obsolescência de artefatos Cláudia Regina Hasegawa Zacar Universidade Federal do Paraná R. General Carneiro, 460 -8º andar- Curitiba, PR claudiazacar@yahoo.com.br
Maristela Mitsuko Ono Universidade Tecnológica Federal do Paraná Av. Sete de Setembro, 3165 -BlocoD- Curitiba, PR maristelaono@gmail.com Neste contexto, torna-se importante a investigação de estratégias visando à transformação dos atuais padrões de consumo em favor de práticas mais adequadas sócioambientalmente, como nos chamados modelos de “consumo sustentável” e “consumo lento” [7]. Esses modelos trariam um duplo benefício: uma melhora da qualidade de vida, paralelamente a uma redução significativa dos impactos ao ambiente [14].
RESUMO
Neste artigo, sugere-se que o gerenciamento do processo de obsolescência de artefatos se apresenta como uma possibilidade de contribuir no desenvolvimento de sistemas de produção e consumo mais adequados sócioambientalmente. Argumenta-se que uma das possíveis estratégias de design visando ao gerenciamento da obsolescência dos produtos é facilitar e incentivar sua personalização. Por meio da aplicação desta estratégia, pode-se viabilizar uma interação mais satisfatória entre usuário e produto, estimulando relações emocionalmente mais significativas entre ambos.
Uma das maneiras possíveis para se atingir um modelo de consumo mais adequado seria buscar a extensão da vida útil dos produtos, mediante o aumento de sua durabilidade [7]. O aumento da durabilidade dos artefatos prevê o gerenciamento de seu processo de obsolescência, considerando seus aspectos objetivos e subjetivos1 [15].
Palavras-chave
Design, Durabilidade, Interação
Obsolescência,
Personalização,
Ao gerenciar este processo, torna-se possível postergar a necessidade de substituição e renovação e, consequentemente, de produção de novos artefatos, limitando a geração de resíduos e seus impactos [15]. Além dos benefícios ambientais, acredita-se que produtos mais duráveis podem apresentar benefícios como conforto emocional, ao servir como fator de estruturação e estabilização da vida cotidiana [1].
ACM Classification Keywords
Design
INTRODUÇÃO
O consumo de bens tem aumentado rapidamente em muitos países em desenvolvimento, como China, Índia [29] e Brasil. No país, este fenômeno tem sido particularmente impulsionado pelo expressivo aumento de aquisição de produtos por parte da população de baixa renda [2].
DESIGN, DURABILIDADE E OBSOLESCÊNCIA
De forma geral, a durabilidade pode ser definida como a capacidade do objeto de se inscrever em uma certa perenidade [15], ou sua habilidade de desempenhar as funções requeridas durante um longo período de tempo, sem gastos excessivos com manutenção e reparo [19].
Ainda que a relativa democratização ao acesso aos bens possa apresentar inúmeros benefícios, torna-se fundamental considerar os impactos decorrentes do aumento exponencial das taxas de consumo e produção. Estima-se que se os níveis de consumo que as pessoas mais ricas têm atualmente fossem replicados à metade da população mundial de 9 bilhões de pessoas, projetada para o ano de 2050, os impactos socioambientais resultantes seriam bastante severos [29].
Alguns autores consideram que a durabilidade é o aspecto mais importante da qualidade do produto, tanto em relação a fatores econômicos quanto em relação a fatores ambientais. Isto porque a durabilidade afeta diretamente a frequência de repetição de compras dos consumidores e, consequentemente, o lucro dos produtores, o volume de
Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. CHI 2009, April 4–9, 2009, Boston, Massachusetts, USA. Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
1
É válido considerar que há certos casos em que a obsolescência planejada se faz desejável e até necessária, como no caso de produtos perecíveis e produtos hospitalares descartáveis.
1
224
acumulação de bens dos consumidores e a taxa de consumo dos recursos naturais [19].
do produto depende diretamente de uma interação envolvente e durável entre ambos [25].
Sob outro ponto de vista, podem-se considerar ainda as implicações sociais da durabilidade dos artefatos. Os objetos da cultura material têm a função de estabilizar a vida humana, uma vez que permitem às pessoas, a despeito de sua contínua mutação, reencontrar sua identidade nos artefatos à sua volta. Sob essa perspectiva, os sistemas de produção centrados na abundância tornam o mundo cada vez mais instável, pois a necessidade de constante renovação dos artefatos faz com que eles não sejam mais utilizados, mas somente consumidos [1]. Obviamente essa instabilidade tem reflexos sociais importantes que, porém, não serão aprofundados no presente trabalho.
Ao considerar estratégias de design visando a essa interação mais satisfatória, destaca-se a importância de se evitar a programação excessiva da semântica do produto, de forma a permitir que o usuário tenha espaço suficiente para suas próprias interpretações. Considera-se que um objeto dotado de qualidades ambíguas propicia um aumento da intimidade com o usuário, bem como o desenvolvimento de uma maior empatia [5]. É válido considerar, por outro lado, o caráter naturalmente polissêmico dos artefatos. Os produtos estão sujeitos à apropriação, dispersão e transformação por meio do uso e da posse e, ao mudarem de contexto, vão perdendo e adquirindo novos sentidos [9].
Diferentes abordagens são possíveis para aumentar a durabilidade de um produto, conforme as etapas de seu ciclo de vida. Pode-se, por exemplo, procurar utilizar materiais adaptados ao envelhecimento, favorecer o reparo e a manutenção, facilitar mutações e upgrades, entre outras [15]. É válido considerar que o desenvolvimento de produtos duráveis pode envolver ainda ações políticas, como a aplicação de taxas pelo descarte e implementação de programas educativos, para dar às pessoas informação e confiança para reagir às pressões sociais e à propaganda [6].
O que se propõe é que os designers utilizem essa instabilidade do significado das coisas como um agente de possibilidades, permitindo que os objetos se apresentem de múltiplas formas, de maneira a estimular o usuário durante a interação [5]. Sugere-se que uma das formas de fazer uso deste caráter polissêmico, no processo de design, é possibilitar ou facilitar a personalização dos artefatos. DESIGN E PERSONALIZAÇÃO
A personalização pode ser definida como um processo de transformação da funcionalidade, interface, conteúdo informacional ou de distinção de um sistema para aumentar sua relevância pessoal para um indivíduo [4]. Implica ter no usuário um parceiro na criação do conteúdo da experiência [24].
O aumento da durabilidade dos produtos prevê sempre o gerenciamento de seu processo de obsolescência, levando em conta tanto seus fatores objetivos quanto subjetivos [15]. Como aspectos objetivos, consideram-se as questões físicas, econômicas, técnicas e tecnológicas, de qualidade material e disponibilidade de recursos. Como aspectos subjetivos, consideram-se as dinâmicas socioculturais e sua relação com alguns fatores psicológicos, incluindo questões como moda, estética, status, desejo e satisfação [6, 15, 23, 26, 28]. Dentre os fatores subjetivos da obsolescência, uma questão fundamental é o grau de empatia que se estabelece entre o artefato e o usuário2 [5]. Isto porque a vida útil prolongada
Esta parceria é, portanto, fundamental para o design para a experiência, que requer o conhecimento holístico do usuário, como uma pessoa ativa que pensa e sente. Assim, ainda que produzidos em massa, os produtos devem ser projetados para indivíduos e, neste contexto, torna-se cada vez mais importante a inclusão do usuário final no processo de design [3].
2
A estratégia de personalização pode ser iniciada tanto pelo sistema quanto pelo usuário, sendo no primeiro caso descrito como customização [4].
Cabe observar que o termo “usuário” tem se mostrado limitado em design de interação, na medida em que o mesmo restringe o sujeito a um mero receptor de informações e utilizador de um artefato.
A customização envolve a escolha, por parte do consumidor, entre produtos e serviços variados previamente disponibilizados no sistema [24].
Um termo que procura ampliar este papel é o de “interator”, empregado por Janet Murray em seu livro “Hamlet no Holodeck: o futuro da narrativa no ciberespaço" (2003), que se refere ao receptor e usuário que assume um papel mais amplo na utilização de mídias / hipermídias, agindo e interagindo, participando ativamente do processo de comunicação e de informação, não se limitando apenas a receber informações ou a utilizar um artefato.
A aplicação da customização em massa é defendida como forma de diferenciar e diversificar os produtos, melhor adequando-os às necessidades e demandas dos consumidores. Considera-se que é mais fácil os consumidores desenvolverem ligações mais significativas com produtos customizados, consequentemente tornando mais difícil seu descarte prematuro [17].
Neste artigo, estaremos utilizando o termo usuário, pela relativa maior familiaridade dos leitores em geral com o mesmo, com a ressalva de que se trata de seu entendimento
ampliado, como sujeito participante do processo de comunicação e informação. 2
225
Argumenta-se, porém, que, apesar de os produtos customizados serem efetivamente melhores na satisfação das necessidades dos usuários, não garantem ligações afetivas mais significativas [20]. Isso possivelmente ocorre porque os produtos customizados não são verdadeiramente individualizados, uma vez que os consumidores realizam apenas escolhas, sem poder fazer nenhuma alteração criativa durante o processo. Enfatiza-se, desta forma, a diferença entre os conceitos de customização e personalização, sendo este diretamente relacionado à interferência ativa e criativa do usuário [18].
Além disso, alguns autores consideram que abordagens focadas na personalização têm relevância questionável, uma vez que, independente de um projeto explícito e do grau de controle do designer sobre os fatores envolvidos, a apropriação ocorrerá [25]. É de fato comum que os usuários realizem interferências na aparência de produtos padronizados e impessoais, aplicando decalques, adesivos, pinturas em spray, entre outros. Desta maneira, buscam incutir nos objetos um “toque pessoal” de individualidade [16]. Ao observar artefatos utilizados no cotidiano, é possível encontrar diversos exemplos desse tipo de interferência pessoal, como o automóvel ilustrado na Figura 1.
Sob este prisma, salientam que o estímulo à ligação afetiva do usuário com o artefato, proveniente do processo de personalização, dá-se com investimento de tempo, esforço e atenção a ele, por parte do indivíduo. A ligação com o produto tende a estar, desta forma, também relacionada à energia psíquica nele investida ao longo do processo, demandada pelas escolhas criativas necessárias para a personalização do artefato [18]. Além disso, quando personalizado, o produto se torna um veículo de auto-expressão, apresentando certas características pessoais do indivíduo a si mesmo e à sociedade. Desta forma, participa da construção e manutenção da identidade pessoal, adquirindo um significado simbólico para o usuário, por meio do qual ele pode se tornar emocionalmente ligado ao objeto [18]. Ao refletir a identidade do sujeito, o objeto personalizado estimula o envolvimento e comprometimento do usuário, que tende a ter mais cuidado com ele [13]. Neste cuidado incluem-se as práticas de manutenção, relacionadas à conservação e preservação dos bens [12]. Desta forma, a personalização estimula o vínculo entre usuário e produto, vínculo este que acarreta um maior zelo e consequentemente uma maior longevidade do produto.
Figura 1: Automóvel Lada com intervenção do usuário na pintura externa: aplicação de representação de morcegos [22]
Outro exemplo interessante de personalização é a tendência japonesa de decoração de telefones celulares, conhecida como “deco-den”, abreviação de “decorated denwa”, telefones decorados (Figura 2).
Porém, a estratégia de personalização apresenta algumas dificuldades. Não é possível especificar até o momento, por exemplo, qual o grau de influência dos vários tipos de personalização na ligação afetiva com um artefato específico. Não se sabe também precisar qual o nível de demanda de energia física e psíquica suficiente para que o processo de personalização efetivamente estimule uma ligação afetiva. Outra questão relevante é que o consumidor tem que ter o desejo e a habilidade de personalizar seu artefato, e muitas vezes as pessoas têm medo de estragá-lo durante o processo de personalização [18]. Cabe lembrar ainda a importância em se considerar a questão da diversidade cultural, na medida em que esta pode manifestar-se, inclusive, na disposição das pessoas para intervirem em artefatos. Exemplo disso é a relativamente lenta e bastante restrita assimilação do sistema de montagem “monte você mesmo” (Ready-toAssemble (RTA) = Self Assembly) no segmento de móveis, no Brasil. Diversamente, nos Estados Unidos, Japão e países europeus, este sistema encontra-se mais amplamente disseminado [21].
Figura 2: Telefones celulares japoneses decorados [27]
No Japão, existem revistas e lojas especializadas em decoden, que oferecem decorações artesanais, com adesivos, cristais coloridos ou formas modeladas em massa. São vendidos kits do tipo “faça você mesmo” (Do-it-Yourself
3
226
(DIY)), para que os próprios usuários realizem a decoração (Figura 3) [27].
Figura 5: Vaso, linha Do Create, Droog Design [11]
Uma das causas da baixa durabilidade dos artefatos é justamente o fato de que boa parte deles não foi projetada para proporcionar experiências variadas e significativas. Ao buscar-se acelerar a interação, com a aplicação de inovações tecnológicas, o processo de tomada de decisão é frequentemente removido, o que pode contribuir para tornar os usuários cada vez mais alienados [5].
Figura 3: Kit japonês do tipo do-it-yoursef, para decoração de telefones celulares [26]
Esse tipo de intervenção permite a apropriação do objeto em diferentes estágios de seu relacionamento com o usuário, ao estampar a identidade deste em sua aparência. Assim, essas intervenções fazem parte dos rituais de passagem que marcam o relacionamento de longo termo entre o indivíduo e o objeto [8].
Assim, ao facilitar o processo de personalização, o designer poderia resgatar e estimular a interferência ativa do usuário no processo de interação, propiciando o desenvolvimento de laços afetivos mais significativos entre sujeito e objeto.
Apesar de a personalização constituir-se, desta forma, como um processo espontâneo, sugere-se que os designers podem estimular as pessoas a alterarem criativamente a aparência dos produtos. E uma das maneiras de fazê-lo seria desenvolvendo artefatos que não estejam totalmente finalizados no momento da compra. Desta forma, demandariam uma alteração criativa antes de poderem ser utilizados. Com isso, os usuários teriam que ativamente formar e finalizar o produto, tornando-o pessoal e único [18].
CONSIDERAÇÕES FINAIS
Como visto, são inúmeras as questões subjetivas relacionadas à durabilidade e obsolescência dos artefatos, daí a dificuldade de se projetar produtos que resistam a essas complexas dinâmicas. Porém, ao considerá-las, é possível vislumbrar algumas estratégias passíveis de serem utilizadas pelos designers na busca pelo desenvolvimento de produtos menos efêmeros e que atendam as necessidades e anseios das pessoas em seu cotidiano, com base em uma perspectiva de responsabilidade social e de desenvolvimento sustentável.
Como exemplo, é possível citar a série Do Create (Figuras 4 e 5), da Droog Design, que incentiva o usuário a se apropriar dos objetos, quebrando-os, cortando-os, riscandoos, adicionando sua própria interpretação aos artefatos [11]. Essa estratégia pode contribuir para que o usuário vivencie experiências mais significativas com o produto.
Ressalta-se, ainda, que, até o momento, as estratégias para a extensão do tempo de vida dos produtos têm sido relativamente pouco exploradas, tanto na teoria quanto na prática. Assim, fica clara a necessidade de investigações mais abrangentes e aprofundadas acerca de possíveis estratégias voltadas ao gerenciamento da obsolescência de artefatos, bem como das implicações, desafios e benefícios de sua aplicação. Cabe observar que a intensificação no uso de artefatos também tem relação com a durabilidade, sendo igualmente relevante, assim como a adoção de abordagens sistêmicas e interdisciplinares no desenvolvimento de produtos e serviços sustentáveis. A estratégia proposta, de personalização, permite de fato uma melhor adaptação do artefato às necessidades específicas dos usuários, facilitando ainda a construção de laços afetivos mais significativos entre sujeito e objeto.
Figura 4: Luminária, linha Do Create, Droog Design [11]
4
227
15. Kazazian, T. (Org.). Haverá a idade das coisas leves: design e desenvolvimento sustentável. Senac São Paulo, São Paulo, 2005.
Cabe frisar que a construção desses laços pode ser influenciada por diversos outros fatores, como funcionalidade, marca e comportamento do artefato, relações sociais, entre outros. Além disso, as emoções em relação a um artefato são complexas, pessoais, mutáveis, temporais e culturalmente dependentes [10].
16. Löbach, B. Design industrial: bases para a configuração dos produtos. Edgard Blücher, São Paulo, 2001. 17. Mont, O. Innovative approaches to optimizing design and use of durable consumer goods. International Journal of Product Development, 6, 3-4 (2008).
Salienta-se ainda que, como visto, desenvolver artefatos que estimulem sua personalização envolve desafios, inclusive metodológicos, que demandam maiores investigações.
18. Mugge, R., Schifferstein, H. N. J., & Schoormans, J. P. L. Personalizing product appearance: the effect on product attachment. In Proc. International Conference on Design and Emotion 2004, Kurtgözü, A. (ed.) (2004).
REFERENCES
1. Arendt, H. A condição humana. Forense Universitária, Rio de Janeiro, 2001. 2. Bastos, C. Consumo de bens duráveis aumenta por causa do Bolsa Família. http://www.mds.gov.br/noticias/consumo-de-bensduraveis-aumenta-por-causa-do-bolsa-familia
19. Muis, H. Eternally yours: some theory and practice on cultural sustainable product development. In Verbeek, P.P.; Slob, A. (ed.). User behavior and technology development: shaping sustainable relations between consumers and technology. Springer, Berlin, 2006. 20. Norman, D. Emotional design. Basic Books, New York, 2004.
3. Battarbee, K., Mattelmäki, T. Meaningful Product Relationships. http://smart.uiah.fi/home/Katjansiwu/Meaningfulproduc trelationships.pdf
21. Ono, M. M. Design industrial e diversidade cultural: sintonia essencial. Estudos de casos nos setores automobilístico, moveleiro e de eletrodomésticos no Brasil. 2004. Tese (Doutorado em Arquitetura e Urbanismo), Faculdade de Arquitetura e Urbanismo, Universidade de São Paulo, São Paulo, 2004.
4. Blom, J. O. Personalization: a taxonomy. In Proc. CHI 2000, ACM Press (2000), 393-401. 5. Chapman, J. Emotionally durable design: objects, experiences & empathy. Earthscan, London, 2005.
22. Ono, M. M. Foto tirada no dia 25/03/2006, na Av. Souza Naves, Curitiba.
6. Cooper, T. Inadequate life? Evidence of consumer attitudes to product obsolescence. Journal of Consumer Policy, 27 (2004), 421-449.
23. Packard, V. The Waste Makers. Penguin Books, London, 1963.
7. Cooper, T. Slower consumption: Reflections on product life spans and the “throwaway society”. Journal of Industrial Ecology, 9, 1-2 (2005), 51-67.
24. Prahalad, C.K.; Ramaswamy, V. Como incorporar as competências do cliente. HSM Management, 20 (2000). 25. Van Hinte, E. Eternally yours: time in design, product value sustenance. 010 Publishers, Rotterdam, 2004.
8. Csikszentmihalyi, M.; Rochberg-Halton, E. The meaning of things: domestic symbols and the self. Cambridge University Press, Cambridge, 1981.
26. Van Nes, N.; Cramer, J.; Stevels, A. A Practical Approach to the Ecological Lifetime Optimization of Electronic Products. In Proc. I International Symposium on Environmentally Conscious Design and Inverse Manufacturing, IEE Computer Society (1999), 108-112.
9. Denis, R. C. Design, cultura material e o fetichismo dos objetos. Revista Arcos, I (1998), 14-39. 10. Desmet, P.M.A. A multilayered model of product emotions. The Design Journal, 6, 2 (2003), 4-13.
27. Watanabe, A. Trend watch Harajuku: deco-den all over! http://pingmag.jp/2008/09/18/decoden/
11.Droog Design, Do Create http://www.droog.com/presentationsevents/docreate/do-eat/
28. Woolley, M. Choreographing Obsolescence. Ecodesign: the Pleasure/ Dissatisfaction Cycle. In Proc. International Conference on Designing Pleasurable Products and Interfaces 2003, ACM Press (2003), 7781.
12.Gregson, N.; Metcalfe, A.; Crewe, L. Practices of object maintenance and repair: how consumers attend to consumer objects within the home. Journal of Consumer Culture, 9, 2 (2009), 248-272.
29. Worldwatch Institute. The state of consumption today. http://www.worldwatch.org/ node/810#7
13.Ilmonen, K. The Use of and Commitment to Goods. Journal of Consumer Culture, 4, 1 (2004), 27-50. 14.Jackson, T. Live better by consuming less? Is there a “double dividend” in sustainable consumption? Journal of Industrial Ecology, 9, 1-2 (2005), 19-36.
5
228
229
230
231
232
Uma casa no controle da TV: Desenvolvimento de um Programa para TV Digital para Controle de Dispositivos Domésticos Bruno Julian Dias de Oliveira LAVID/Laboratório de Aplicações de Vídeo Digital UFPB Cidade Universitária - João Pessoa – PB - Brasil, CEP - 58059-900 +55 (083) 3216-7093 - Ramal 26 brunodias20@gmail.com
Julio Cesar Ferreira da Silva LAVID/Laboratório de Aplicações de Vídeo Digital UFPB Cidade Universitária - João Pessoa – PB - Brasil, CEP - 58059-900 +55 (083) 3216-7093 - Ramal 26 julio@lavid.ufpb.br
Hildegard Paulino Barbosa Mus3 – Departamento de Informática – UFPB Cidade Universitária - João Pessoa – PB – Brasil – CEP - 58059-900 +55 83 8861-6164 hildegardpaulino@gmail.com
Tatiana Aires Tavares LAVID - Departamento de Ciência da Informação UFPB Cidade Universitária - João Pessoa – PB - Brasil, CEP - 58059-900 +55 (083) 3216-7093 - Ramal 26 tatiana@lavid.ufpb.br
RESUMO
A implantação da TV Digital permite pensar em um novo paradigma para os veículos de comunicação de massa, através da inserção de mecanismos de interatividade. No Brasil, estamos passando por um período de definições e experimentações sobre a implementação desses mecanismos nos programas para TV Digital. Hoje, o sistema brasileiro abrange dois ambientes essenciais de execução: o Ginga-NCL e o Ginga-J. Neste artigo apresentamos resultados de experimentos realizados envolvendo o Ginga-NCL, que é o ambiente já em funcionamento no mercado. Nossa aplicação alvo é um programa residente e independente do conteúdo televisivo onde o usuário utiliza a TV para controlar dispositivos de uma rede residencial. Palavras chave TV Digital Interativa, Automação Residencial, Ginga NCL, Ginga-J. ACM Classification Keywords
H5.m. Information interfaces and presentation (e.g., HCI): Miscellaneous. INTRODUÇÃO
A TV Digital no Brasil, já é uma realidade em termos de transmissão na maioria das capitais. Desde 2005, esforços têm sido realizados para o estabelecimento de um Sistema Brasileiro de TV Digital Interativa. O Fórum SBTVD [1] é
uma dessas realizações que hoje é responsável pela tomada de decisões sobre a implantação de um sistema de TV Digital no Brasil. No dia 06 de abril de 2009 o Fórum deliberou que o padrão JAVA DTV será adotado como solução procedural do middleware brasileiro. Já o NCL que foi recentemente incorporado como norma ITU-T responde pela parte declarativa do Ginga. Enquanto a transmissão digital já é uma realidade nacional, no campo das aplicações - grande atrativo dos programas para TV Digital - ainda há muito para se descobrir. Hoje a vertente das aplicações está muito atrelada à demonstração de funcionalidades básicas oferecidas pelo middleware. Mesmo assim a comunidade ainda necessita de articulações para intensificar o desenvolvimento de programas que utilizam aplicações interativas. Nesse âmbito, serão apresentados neste artigo, resultados obtidos a partir de experimentos realizados com a implementação de aplicações interativas para TV Digital brasileira explorando a porção declarativa – Ginga NCL da solução nacional. Procurando colaborar também para elucidar as diferentes áreas para o desenvolvimento de aplicações, focamos nossos experimentos em uma aplicação residente e independente de conteúdo televiso para controle de dispositivos conectados numa rede doméstica (HAN – Home Area Networks).
233
TV DIGITAL INTERATIVA
Um sistema de TV Digital Interativa é uma consequência da TV digital. O fluxo de vídeo passa a ser transmitido num formato digital, que permite multiplexar informações de áudio, vídeo e dados num mesmo canal de transmissão[1]. Esses dados podem ser utilizados por diversos tipos de aplicativos, desde simples enquetes até uma aplicação de comércio eletrônico. Estudos feitos pelo IBGE mostram que o percentual de domicílios com televisão vem crescendo desde 1992, ano em que as pesquisas começaram a ser feitas. Neste ano, o percentual era de 74% e em 2007, 94,8%. Esses percentuais representam a posse, nos domicílios brasileiros, de aparelhos receptores de sinal analógico, o único em vigor até o dia 2 de dezembro de 2007 [2]. A partir de então, deu-se início à transmissão de sinal digital pelas emissoras de televisão, resultado de anos de estudos em universidades brasileiras e acordos envolvendo o Ministério das Comunicações e várias empresas, privadas e públicas, interessadas na transmissão de sinal de televisão no país. Atualmente, de acordo com o site DTV [3], o sinal digital está presente em quase todas as capitais das regiões Sul, Sudeste e Centro-Oeste, em algumas cidades do interior paulista (como São Carlos) e capitais do Norte-Nordeste, como Aracaju, Fortaleza, Teresina, Recife e João Pessoa. Um dos grandes diferenciais que a transmissão do sinal digital de televisão trará é a interatividade. Com a TV Digital Interativa (TVDI), o usuário deixará de apenas receber o sinal e passará a também enviar dados de seu interesse, tais como e-mail, requisição a uma página da internet, saldo de conta corrente, resposta de enquete ou até arquivos via torrent etc., o que é impossível com a transmissão do sinal analógico. Segundo [4], ao enviar um dado para outras pessoas, o telespectador atende uma necessidade inerente ao ser humano, que é a de participar, se pronunciar e se sentir mais inserido em seu contexto social. Podemos definir um programa interativo como sendo aquele em que o utilizador pode explorar a mensagem à sua vontade, dialogando e construindo-a enquanto a utiliza. Os programas interativos podem ser divididos em três categorias: (a) dependentes do conteúdo televisivo; (b) independentes do conteúdo televisivo, e (c) residentes no STB. Os dependentes são os que se relacionam com o conteúdo corrente da TV, como por exemplo, uma campanha publicitária para um comercial de TV. A primeira propaganda que conteve um aplicativo interativo no Brasil foi desenvolvida pela empresa Nova S/B para a Caixa Econômica Federal. Nela o usuário pode simular valores de financiamento de compra da casa própria. Os aplicativos interativos independentes do conteúdo televisivo não se relacionam com o que está sendo exibido.
Um exemplo deste caso seria um aplicativo que exibiria notícias durante toda a programação do canal, independente do programa de TV exibido em um dado instante. Por fim, os programas residentes no STB são os que não necessitam receber informações da emissora para serem executados, tipicamente fazem do STB um console para execução de aplicações que podem ser executadas mesmo sem transmissão. Jogos são um exemplo típico desses programas. Esses programas também podem ser oferecidos pelos fabricantes de STBs tornando-se um diferencial dos mesmos. Outro nicho que pode ser explorado nesse mercado de programas residentes são as soluções voltadas para controle de dispositivos para automação residencial. Hoje cada vez mais os fabricantes de eletrodomésticos e eletroeletrônicos estão voltados para soluções “all connected” onde o dispositivo oferece interface de comunicação que viabilizam seu controle e monitoração remotos. No presente artigo abordamos a TV como dispositivo de controle para outros dispositivos domésticos. Acreditamos que a TV é o recurso que agrega popularidade e facilidade de uso, premissas para se tornar um “desktop” para controle de dispositivos convergentes domésticos, ou seja, como uma central de automação residencial. AUTOMAÇÃO RESIDENCIAL
Desde o surgimento das civilizações até os dias atuais, o homem vem buscando uma maior praticidade no seu dia-adia, ao criar ferramentas que o auxilie nas tarefas cotidianas. Isso pode ser observado na evolução dessas ferramentas, que estão cada vez mais acessíveis e o esforço final empregado é reduzido gradativamente, como pode ser verificado nas tecnologias de iluminação. O esforço necessário para se acender uma lamparina é muito maior do que o necessário para se acender uma lâmpada. A busca do ser humano pela praticidade nas operações cotidianas, devido à necessidade de economia de dinheiro e esforço físico empregado nessas operações, aliada a falta de tempo do homem moderno, fez com que ele buscasse cada vez mais facilitar seu dia-a-dia. Com isso, surge a Automação Residencial que é o meio pelo qual um morador de uma casa pode centralizar o controle de vários de seus dispositivos, como lâmpadas, portas e alarmes, em uma central de automação única. Vários poderiam ser os dispositivos que atuariam como centrais de automação residencial. Entre eles estão os dispositivos móveis (PDAs, celulares etc.), computadores e, com o surgimento da TV Digital, a televisão. Uma das maneiras de controlar remotamente os itens da casa por meio desses dispositivos (atuando como centrais) é colocar um dispositivo que se comunique com a central entre o item caseiro e sua tomada (ou bocal) e impeça ou permita a passagem de corrente elétrica. Desse modo, o usuário pode economizar energia, dinheiro, esforço e tempo. Projetos como a “Casa do Futuro” [5] ilustram o cenário de possibilidades de aplicação de soluções de automação residencial. Mais que um conforto, hoje em dia
234
esse tipo de solução tem um viés importante de responsabilidade social e preservação do meio ambiente, uma vez que ao controlar nossos dispositivos domésticos podemos também otimizar o consumo de recursos e implantar técnicas para diminuir o desperdício de energia, água e outros recursos no escopo doméstico. DESENVOLVIMENTO DE UM PROGRAMA INTERATIVO EM GINGA PARA CONTROLE DE DISPOSITIVOS DOMÉSTICOS
Neste artigo apresentamos nossa experiência no desenvolvimento de um programa compatível com as tecnologias da TV Digital brasileira (Ginga-NCL e GingaJ) que permita ao usuário controlar dispositivos em uma rede doméstica. Nossa proposta é baseada em trabalhos já desenvolvidos nessa área. Nesta seção abordamos um esforço para prototipação de uma interface em NCL e outra em JAVA (utilizando JAVA TV) para o controle de motores de passo responsáveis por acionar aberturas em uma maquete real [6]. Uma das vantagens do Ginga é a possibilidade de inserção de novas funcionalidades ao middleware brasileiro através da API (API, do inglês Application Programming Interface) de Inovação. O projeto Ginga@Home explora a API de inovação do Ginga no intuito de oferecer uma solução que integra o Ginga com um modelo de comunicação que centraliza o controle de determinados dispositivos de uma residência, ou seja, visa possibilitar a automação residencial, utilizando a TV como central de automação residencial dentro de uma rede doméstica (HAN). A Fig.1 ilustra o cenário de execução do Ginga@Home [6].
tudo que está ocorrendo em sua residência naquele momento. Também há um mecanismos de ajuda para auxiliar o telespectador durante a interação. Devido às limitações de usabilidade da TV Digital, as aplicações construídas para esse meio devem ser bastante intuitivas e simples de utilizar, pois o único meio de interação com o sistema é o controle remoto, que é bastante restrito. Na etapa de especificação de requisitos do sistema, foi feito um diagrama com todos os casos de uso que seriam implementados. Com isso é possível ter-se uma visão geral das funcionalidades do sistema. Podemos visualizar o diagrama na Figura 2.
Figura 2. Diagrama de Casos de Uso VISÃO ARQUITETURAL Tabela 2. Valores possíveis dos campos do pacote.
A aplicação foi desenvolvida utilizando o protocolo de comunicação TCP/IP. A Internet foi usada como suporte ao protocolo para possibilitar a comunicação com os dispositivos da residência, feita através da arquitetura cliente-servidor. O servidor tem como tarefa receber as informações enviadas pela aplicação, tratá-las, aplicar as devidas ações nos dispositivos da casa e logo em seguida retornar o estado do dispositivo alterado. Na Fig. 3 podemos ter uma visão geral do sistema.
Figura 1. Cenário de automação residencial utilizando Ginga@Home VISÃO CONCEITUAL
Em linhas gerais, essa aplicação é composta por funções que controlam dispositivos variados de uma residência. O sistema foi desenvolvido utilizando três paradigmas de linguagem de programação: declarativo, estruturado e orientação a objetos. Na versão atual da aplicação, foram desenvolvidas três funções básicas, controle de portas, controle de iluminação e controle de invasão. Na aplicação também é possível ver a situação atual de todos os dispositivos que estão conectados, para que o usuário possa ter uma visão geral de
235
faz as operações e retorna um feedback para a TV que, por fim, informa ao usuário o(s) estado(s) atual (is) do(s) dispositivo(s). Toda essa comunicação, presente em cada operação feita pelo usuário, obedece a um protocolo de arquitetura, uma espécie de linguagem de comunicação desenvolvida especialmente para este sistema e que é compreendida por ambas as partes.
Figura 3. Visão Arquitetural
A comunicação com o servidor (controlador) é feita via socket, pelo qual são enviados pacotes com as alterações desejadas pelo usuário. Neles, são enviados o tipo, a identificação e o estado do dispositivo que se deseja alterar, como mostra a Tabela 1. Tabela 1. Formato padrão do pacote de comunicação com o servidor
Na Tabela 2 são mostrados os valores possíveis para cada campo do pacote que será enviado pela aplicação. Nela é possível identificar o tipo de dispositivo de acordo com o valor que lhe foi atribuído na especificação. Como pode haver mais de um dispositivo do mesmo tipo, é necessário um campo próprio de identificação para representar um dispositivo em particular. Finalmente, são mostrados os estados que podem ser atribuídos a cada dispositivo. Segundo esse protocolo, a lâmpada com o valor de estado 1 estará apagada e acesa se o valor for 2. Para abrir ou fechar a porta será seguido o mesmo raciocínio. Porém, há uma particularidade no dispositivo de alarme, que além dos estados ligado e desligado (1 e 2, respectivamente), pode assumir o estado “Alarmando”, representado pelo valor 3. Para a aplicação realizar consultas ao servidor, ela precisa enviar um pacote padrão (0, 0, 0) que significa a solicitação ao servidor da situação atual de todos os dispositivos. Sempre que a aplicação é iniciada, ela tenta uma conexão com o servidor. Se a conexão for estabelecida, o servidor envia um pacote padrão para que o sistema possa estar atualizado com a situação de todos os dispositivos e exibilos ao usuário quando ele estiver na cena de uso "Consulta" do programa. Uma situação possível para exemplificar a comunicação será o usuário querer acender a lâmpada 2. Para isso, será enviado o pacote (1, 2, 2) para o servidor. O servidor tratará a informação e retornará a nova situação dessa lâmpada para o set-top Box. DETALHES DE IMPLEMENTAÇÃO
Para que a automação residencial aconteça de fato, a televisão se comunica com um servidor. Esse, por sua vez,
Finalmente, o último aspecto que merece ser tratado é o da comunicação entre o usuário e a interface da aplicação, necessária para que ele saiba o que pode fazer, o que não pode, aonde deve ir para executar uma ação etc. Enquanto está manuseando o programa, sem se perder ou desistir de usá-lo, isto é, para que tenha total domínio sobre o sistema. [7] afirmam que cores, ao lado de palavras e menus, são potenciais signos de interface. Também é possível acrescentar nessa lista símbolos, ícones, movimentos e outros. Com exceção dos movimentos, todos os outros citados foram aplicados na GUI em questão e compõem sua comunicabilidade. Para informar o usuário tudo o que ele pode fazer em um dado momento, decidiu-se por botar todas as informações na própria tela, de modo organizado e rico em cores. DESENVOLVENDO EM GINGA-NCL
Ginga-NCL é o subsistema do middleware Ginga responsável por dar suporte às aplicações escritas na linguagem declarativa NCL. As aplicações desenvolvidas nessa linguagem têm a característica de serem voltadas para a manipulação direta de documentos hipermídia, visando principalmente sincronizar no tempo e no espaço vários objetos de mídia. Com o Ginga-NCL é possível escrever TIPO DO DISPOSITIVO (1 ... 255) 1 BYTE
ID DO DISPOSITIVO (1 ... 255) 1 BYTE
ID DO DISPOSITIVO
ESTADO DO DISPOSITIVO (1... 255) 1 BYTE
DISPOSITIVO
TIPO DO DISPOSITIVO
ESTADO DO DISPOSITIVO
LÂMPADA 1
1
1
1–2
LÂMPADA 2
1
2
1–2
PORTA
2
1
1–2
ALARME
3
1
1–3
CONSULTA
0
0
0
aplicativos em XHTML, podendo ou não utilizar CSS, que é uma linguagem na qual são declaradas propriedades e valores de estilização para os elementos do HTML. Também é possível implementar aplicações com técnicas de script, usando ECMA Script ou Lua. Além disso, é possível chamar códigos em Lua através de chamadas NCL. Por NCL ser uma linguagem declarativa, o programador não especifica nenhum detalhe das funcionalidades da aplicação, isto é, de como elas vão ser executadas. O que se determina é o que vai ser feito e o que vai ser usado. Isto significa que o comportamento da aplicação não muda de acordo com seu estado, ou seja, não há nenhuma decisão a ser tomada em tempo de execução.
236
Para suprir essa falta, NCL oferece fácil integração com a linguagem Lua, de modo que com ela é possível tomar decisões em tempo de execução. “Lua foi planejada para ser utilizada por qualquer aplicação que necessite de uma linguagem de script leve e poderosa” [8], por isso é ideal para executar as partes procedurais dessa aplicação.
coloridos, peculiaridade dos sistemas de TV Digital. As teclas coloridas devem ser usadas para indicar algumas ações comuns como confirmar, voltar, sair e navegação rápida.
Como é mostrado na figura 4, o programa principal é escrito em NCL. O código em Lua está embutido nele e fica responsável pela interação com o usuário e pelo processamento de todas as requisições feitas por ele, como por exemplo, acender a lâmpada ou abrir a porta, onde o telespectador vai dizer o que deseja fazer por meio da interface controlada pelo código Lua. A partir disso, a requisição é enviada pelo socket para o servidor, obedecendo às normas arquiteturais descritas anteriormente. Logo em seguida, o servidor retorna para o aparelho o estado atual de todos os dispositivos.
Figura 5. Interface de Usuário do aplicativo para TV Digital
Figura 4. Visão da aplicação em NCLua integrada com C
A comunicação com o servidor, necessária para que seja possível controlar os dispositivos da residência, é feita utilizando sockets, como foi dito anteriormente. Primeiro foi pensado em fazer a comunicação também em Lua. Porém, na especificação do Ginga-NCL normatizada pela ABNT [9] não foi encontrada nenhuma referência à criação de sockets em Lua. Porém a linguagem Lua tem bibliotecas de criação de sockets. Sendo assim, foi necessária a integração do código responsável pelo restante das funcionalidades (escrito em Lua) com um código em C por meio de bibliotecas dinâmicas. Essas bibliotecas contêm as chamadas às funções de sockets (Berkeley Sockets) utilizada para realizar de fato a comunicação com o servidor. Foi escolhida a linguagem C devido à facilidade de integração com Lua e também por esta ser totalmente escrita em C puro. INTERFACE DE USUÁRIO
A comunicação do usuário com a interface gráfica do sistema se dá através das teclas direcionais e dos botões
Figura 6. Maquete que simula o ambiente real
Através do programa desenvolvido, o usuário pode executar as seguintes categorias de ações: operações de automação residencial (manuseio e consulta), consultar ajuda e configuração da aplicação. Estas categorias são separadas por abas nas quais o usuário pode navegar por meio das teclas direcionais laterais e por meio de algumas teclas coloridas do controle, como é indicado no detalhe da Fig. 5. A figura 6 mostra a maquete utilizada para realizar os testes de aplicação e simulação em um ambiente real. Ela contém dispositivos eletrônicos, motores e sensores que são acionados através da aplicação. CONCLUSÃO
Neste artigo apresentamos uma experiência de implementação utilizando o middleware brasileiro – Ginga.
237
Foi explorado um subssistema existente para implementação de programas interativos no Brasil – GingaNCL. Apresentamos também uma possibilidade de aplicação que ilustra as aplicações consideradas residentes integradas à outra tendência tecnlógica da atualidade: a automação residencial. Procuramos, ainda, ilustrar como os programadores devem agir para criar aplicações utilizando o Ginga-NCL – que tem a parte declarativa com a linguagem NCL e a parte procedural com a linguagem Lua. Assim, é recomendado que sempre antes de começar o desenvolvimento sejam feitas análises e comparações visando escolher a melhor para o domínio para o qual a futura aplicação será voltada. AGRADECIMENTOS
Gostaríamos de agradecer aos alunos da turma de Métodos e Projetos de Software da UFPB 2008.2 pelo empenho no desenvolvimento dos módulos de hardware, web e mobile integrantes do sistema apresentado. REFERENCIAS 1. BECKER, Valdecir. Moraes, Áureo. A necessidade da inovação no conteúdo televisivo digital: uma proposta de comercial para
TV interativa. Disponível em <http://www.tvdi.inf.br/upload/artigos/a-scpdi_03.pdf>. Acesso em: 21 de março de 2009. 2. Instituto Brasileiro de Geografia e Estatística <http://www.ibge.gov.br/>. Acesso em: 3 de abril de 2009 3. DTV (2009) Site Oficial da TV Digital Brasileira <http://dtv.org.br/materias.asp?menuid=3&id=11>. Acesso em: 24 de março de 2009. 4. WAISMAN, Thais. TV Digital Interativa na Educação: Afinal, interatividade para que?. Escola do Futuro da USP. Disponível em <http://www.abed.org.br/congresso2002/ trabalhos/texto25.htm> Acessado em: 10 de março de 2009. 5. Globo Noticias. Conheça a casa do futuro. Disponível em <http://g1.globo.com/Noticias/Tecnologia/0,,MUL141816174,00.html>. Acesso em: 7 de marco de 2009. 6. VIEIRA, D. A. et al. Ginga@Home – Ginga and Zigbee Integration for Controlling Devices in Smart Homes. 7. PEDROSA, C. M. T. TOUTAIN, B. L. O Uso Das Cores Como Informação Em Interfaces Digitais. 8. Lua – The Programming Language. Disponível em <http://www.lua.org/>. Acesso em: 15 de março de 2009. 9. ABNT NBR 15606-2 - Associação Brasileira de Normas Técnicas, “Televisão digital terrestre – Codificação de dados e especificações de transmissão para radiodifusão digital - Parte 2: Ginga-NCL para receptores fixos e móveis – Linguagem de aplicação XML para codificação de aplicações”.
238
metodologia radiografias do design de interação
239
software
software software
software designers software
software
atra angage
240
software
et al.
atural Programming design
et al. Intentional Programming software softwareExtreme Programming designers design Domain Driven Design
apud
software
241
in loco
designers, etc. workflow
workflow
all
softwaredesign
242
caput getterssetters
Strings string if Caput return
243
parse
web
open source web
244
software software, workflow atral rorain Intentional
245
Software
software
Proc. 29th International Conference on Software Engineering, ICSE'07
Proc. SIGCHI'86: Human Factors in Computing Systems
246
Communications of the ACM VIII Simpósio sobre Fatores Humanos em Sistemas Computacionais, Proc. OOPSLA'06
12. Revista Comum Rio e aneiro Proc. ACM CHI 2009 ACM SIPLA OOPS Messener
247
Representação de Casos sobre a Implicação da Usabilidade para o Sucesso de um Produto Utilizando a Técnica de Storytelling Leandro Santiago da Silva Universidade de Fortaleza Av. Washington Soares, 1321 leandrosantiago_@hotmail.com +55 (85) 8659-1090 RESUMO
INTRODUÇÃO
Esta pesquisa foi iniciada motivada pela necessidade de entender qual a importância de garantir a usabilidade de um produto para o seu sucesso de uso e aceitação por parte dos usuários através de casos. Foi preciso entender o que é usabilidade de um produto, verificar se avaliar sua usabilidade garante este sucesso e definir o que pode ser considerado um produto de software ter sucesso. Este trabalho é focado em casos-problemas definidos pela técnica de RBC (Raciocínio Baseado em Casos), no qual auxiliam o proprietário do produto no processo reflexivo. Estes casos foram fundamentados no cenário de um sistema colaborativo com o objetivo de proporcionar suporte aos consultores de usabilidade a investigarem causas de não uso e dificuldade de uso de sistemas computacionais. Logo após, estes casos deverão ser armazenados em um sistema utilizando a técnica de interactive storytelling.
Um sistema computacional com boa usabilidade visa garantir que o sistema funcione de forma adequada, provendo os meios e as funcionalidades necessárias para garantir seu bom uso por parte do usuário [4]. Autores como [9] definem o surgimento da engenharia de usabilidade como esforço sistemático das empresas e organizações para desenvolver programas de software interativo com usabilidade. O principal componente de um sistema interativo é a interface formada por apresentações e estruturas de diálogos que lhe conferem um comportamento em função das entradas dos usuários ou de outros agentes externos. Dentre as características que revelam se um produto de software tem sucesso, do ponto de vista do proprietário do produto (empresa ou pessoa física), estão as seguintes: lucratividade, muitos acessos, reconhecimento no mercado e etc. Neste texto, acredita-se que algumas ações do proprietário podem contribuir também para o sucesso de uso do produto, tais como: i) contratar uma equipe para tratar as questões de usabilidade do produto, ii) definir o segmento de mercado a fim de entender o perfil dos usuários e conseqüentemente seus interesses, iii) realizar um bom marketing, etc. A equipe de usabilidade seria responsável pelo estudo do comportamento do usuário, levantamento dos requisitos de usabilidade, realização de pesquisas de mercado, avaliações de usabilidade, etc. Apesar dos proprietários serem conscientes da necessidade dessas ações, é importante ressaltar que um proprietário lida com uma questão muito relevante: o tempo, pois o mercado competitivo impõe agilidade que podem comprometer o produto. Quem primeiro lança uma idéia pode ter as seguintes vantagens competitivas: 1) o reconhecimento de ser o pioneiro; 2) receber maior atenção, inclusive da mídia, fazendo publicidade do produto; 3) receber rapidamente feedback e evoluir o produto. Como conseqüência para um processo de desenvolvimento ágil do produto tem-se: 1) o tempo de desenvolvimento acelerado, 2) o custo do
ABSTRACT
This research began its studies motivated by the understanding need about the importance of ensuring the usability of a product to its use success and acceptance by users through cases. We had to understand what a product usability was, make sure that the usability evaluation would guarantee its success and define what has to be considered in order to have a successful software product. This work is focused on RBC (Case-based Reasoning) technique which helps the product owner on the reflective process. These cases were based on a collaborative system scenario with the objective of providing support to the usability consultants to investigate causes of non-use and difficulty of computing systems use. Then these cases should be stored in a system using the interactive storytelling technique. Palavras-Chaves
Sucesso do produto, casos, usabilidade, storytelling.
248
desenvolvimento que se torna mais barato e conseqüentemente mais rápido o retorno do investimento do produto (caso o produto venha obter sucesso). Tais motivações levam o proprietário a lançar um produto de imediato. É comum se vê também a adoção da prática de lançar no mercado um produto na versão Beta, ou seja, a primeira versão de um sistema computacional que implementa todos os recursos na fase inicial de análise, e é útil para demonstrações internas e para usuários, mas ainda permanece instável e não é apropriada para lançamento [2]. A versão beta é a seqüência da fase alfa, sendo a segunda grande fase no estágio de desenvolvimento. Nesse estágio, os desenvolvedores anunciam que não serão mais adicionados novos recursos ao produto, somente consertos em falhas técnicas (bugs) e recursos não-implementados receberão atenção [2]. Esta tendência pelo fast and run seguida pelos idealizadores de um projeto que rapidamente se tornam proprietários de um produto tem impulsionado desenvolvedores de software a “enxugarem” os PDS (Processos de Desenvolvimento de Softwares) adotados. Em 2001, foi criada a Aliança Ágil, uma união de dezessete especialistas em desenvolvimento de software, representando métodos como Extreme Programming (XP) [5] e [12], SCRUM [12], dentre outros, onde foi definido um conjunto de princípios em comum que seriam seguidos por todos, representados pelo Manifesto Ágil [3]. Os processos de desenvolvimento ágeis têm sido bem recebidos pelos profissionais porque produzem uma primeira versão do sistema em poucas semanas, com intuito de receber um rápido feedback por parte do usuário, além de projetar soluções simples diminuindo a necessidade e complexidade no momento de se realizar mudanças. Melhorar a qualidade do design testando-o constantemente, com objetivo de antecipar e consertar problemas de usabilidade é o principal princípio destes tipos de processos e que apóia esta pesquisa. Isto porque pretende-se apoiar proprietários/desenvolvedores de um produto previamente lançado, mas que necessita constantemente de melhorias. Este trabalho se encontra fundamentado num dos aspectos da teoria thoughtful interaction design [9] em que os principais produtos não são os artefatos mas o conhecimento que se cria durante o processo. Conhecimento este que deverá estar disponível para outros profissionais num processo de construção de conhecimento colaborativo e contínuo. Ter uma base de conhecimento eficaz só é possível quando os produtos desenvolvidos têm sua utilidade comprovada. Além disso, o trabalho é baseado na técnica de RBC (Raciocínio Baseado em Casos), uma importante técnica que tem idéia de que descrição, análise e reflexão sobre ações do cotidiano contribuem enormemente para a solução de problemas. Aprender baseado em casos já existentes tem sido uma técnica bastante utilizada. Causas são analisadas e conflitos são identificados para que se possa elaborar os casos e contar histórias interessantes. Outra característica
do RBC consiste nos bons resultados obtidos quando se experimentam os casos em contextos colaborativos [7]. Para o armazenamento, ordenação, organização e apresentação dos RBC’s será desenvolvido um sistema em Interactive Storytelling (IS), uma técnica utilizada para narrar histórias mediante a criação de cenários. Segundo [4], IS é uma área de pesquisa que busca o desenvolvimento de técnicas que permitem a criação de sistemas computacionais interativos com ênfase em aspectos dramáticos e narrativos. Esta técnica será ainda implementada para poder facilitar especialistas de usabilidade que são encarregados comumente com avaliação de problemas nos diversos níveis: do negócio, do usuário, do produto. Sendo um sistema colaborativo, o produto também poderá ser além de consultado, inserido histórias e narrativas para que a base de conhecimento se torne mais ampla e consistente . IMPLICAÇÃO DA USABILIDADE PARA O SUCESSO DE UM PRODUTO
Um produto que tem sucesso, do ponto de vista do usuário pode se caracterizar pela: utilidade operacional do produto, interesse do usuário pelo conteúdo, facilidade de uso, aumento de produtividade do usuário, agilidade para realizar uma tarefa, facilidade de lembrar (memorizar), o número de comandos ou outras características nunca utilizadas pelo usuário, entre outros. Ainda sim algumas ações do usuário podem significar sucesso de uso do produto, tais como: i) usar o produto fragmentado, ii) acessar o conteúdo do produto, iii) fazer referência ao produto no segmento em que pertence. É importante ressaltar que um proprietário lida com uma questão muito relevante: o tempo, pois o mercado competitivo impõe agilidade que podem comprometer o produto se este não incluir um bom processo de desenvolvimento de software para a equipe de programação que deve estar vinculada com a equipe de design para que ambos operem em conjunto, evitando o retrabalho após um produto ser lançado no mercado. Outro fator a ser levado em consideração é a ansiedade em obter sucesso, seja de reconhecimento e/ou financeiro. Segundo [18], ter sucesso significa que o produto deve ter a aceitação por parte do usuário, onde o sistema deve ser de fácil aprendizado, fácil de usar e possuir as funcionalidades que o usuário espera encontrar. O retorno de uso do produto por parte dos usuários também é relevante, pois se todos os usuários utilizarem somente uma vez (ou poucas vezes) determinado produto, isto acarretará uma possível causa de insatisfação com o sistema. Portanto, algumas perguntas são pertinentes na visão de um proprietário do produto que não fez sucesso de imediato: porque as pessoas não utilizam o meu produto? Será que o produto que fiz irá obter sucesso? Possíveis cenários podem acontecer: 1) o proprietário pode acabar mudando de negócio, ou até mesmo abandonando e desistindo do produto sem nem saber qual o real problema do seu produto para não ter alcançado o sucesso desejado.
249
2) o proprietário pode esperar mais, antes de tentar modificar o produto mas ele não fez nenhuma investigação. 3) o proprietário pode pedir consultoria aos especialistas que trabalham com usabilidade, para investigar possíveis problemas relacionados ao uso do sistema, na tentativa de resgatar o que já foi desenvolvido. Esta pesquisa investigou que os relatos existentes na literatura, estão fazendo, especificamente como os desenvolvedores se comportam diante destes cenários. Existe na literatura uma série de trabalhos tais como o de [1], [9] e [22], que sugerem a aplicação de práticas e técnicas de IHC (tais como estudo do comportamento do usuário, pesquisas de mercado, realização de publicidade, entre outros). O trabalho de [1], que foca no estudo do comportamento do usuário, realizou uma pesquisa sobre o design experimental, onde foi elaborado um esquema para auxiliar a compensação de diversos fatores que participam da experiência do usuário. Este trabalho envolve o pensamento lógico das ciências cognitivas, psicologia cognitiva, ciência da computação e IHC. O trabalho teve o foco na análise das diferentes categorias de experiência do usuário no sentido de valorizar produtos e serviços, teve com resultados uma nova maneira de enxergar o planejamento do produto e também as motivações emocionais e humanas dos usuários, além das racionais. Algumas hipóteses têm levado os autores deste trabalho a ter uma visão abrangente do problema, são elas: um produto necessita ter níveis de usabilidade satisfatórios, um segmento de mercado bem definido, um bom marketing, suportar os interesses do usuário, enquanto mantendo-o motivado a usar sempre o sistema, e outras mais que serão estudadas. A visão abrangente exige dos profissionais de IHC um conhecimento multidisciplinar, envolvendo as áreas de comunicação, administração, IHC, psicologia e engenharia de software. Se este for um estudante os currículos não têm esta abrangência interdisciplinar, se o profissional for um funcionário de uma organização um estudo ainda precisa ser feito para saber de que forma equipes multidisciplinares trabalham juntas, e se trabalham, se o profissional for um pesquisador, ele pode compor sua equipe com estudantes de diversos cursos, então a situação pode ser menos crítica. A questão da pesquisa deste trabalho é a seguinte: profissionais de usabilidade devem identificar, escolher e realizar atividades sobre design da interação, conhecimento do negócio e do usuário e sobre o conteúdo tratado a fim de investigar e entender porque as pessoas não utilizam um produto assim como para entender as chances de sucesso e de melhoria de tal produto. Investigar esta questão requer responder algumas perguntas nesta pesquisa: Como o profissional deve escolher tais atividades que o levem a investigar porque as pessoas não utilizam um produto? Quais os fatores que podem levar este produto a ter sucesso? Que resultados o profissional deve apresentar ao proprietário do produto que tem esperança em ter um produto de sucesso?
Para melhor compreensão e reflexão sobre estas questões, a representação dos dados serão demonstradas através de casos. REPRESENTAÇÃO DE CASOS ATRAVÉS DE RBC
Os sistemas RBC utilizam um processo interativo constituído genericamente por: identificação da situação atual, busca da experiência mais semelhante na memória e aplicação do conhecimento desta experiência na situação atual. Entretanto, a literatura usualmente não considera a identificação da situação atual como parte do processo RBC, adotando um modelo genérico baseado em quatro etapas: recuperar, reutilizar, revisar e reter. Autores como [1] referem-se a estas etapas como o ciclo do RBC (figura 1): 1) Recuperar: busca, na base de casos, um ou mais casos a partir da comparação da situação atual (caso de entrada) com cada um dos casos da base (casos candidatos). O processo de comparação é realizado através da avaliação das similaridades entre o caso de entrada e os casos candidatos. 2) Reutilizar: procura utilizar a informação e o conhecimento contidos nos casos recuperados (pode ser apenas um) para resolver o caso de entrada. 3) Revisar: procura avaliar a solução proposta. 4) Reter: adiciona o caso de entrada com sua solução revisada na base de casos. Esta etapa representa a característica de aprendizagem de um sistema RBC. Aqui está, portanto, a grande importância do RBC: a possibilidade de redistribuir e compartilhar o conhecimento, de forma dinâmica, entre vários indivíduos, respeitando seu caráter contextual e pessoal, mas procurando agir conforme uma base comum, composta de regras genéricas e amplas, num processo permanentemente adaptativo. O modelo clássico do ciclo de um sistema de RBC é o seguinte [7]:
250
Segundo [11] o processo de revisão dos casos recomendados, também conhecido como adaptação de casos, permite incorporar conhecimento especialista Novo humano ao processo, principalmente quando o domínio é caso muito complexo e o sistema de RBC não consegue capturar todo o conhecimento tácito. O usuário de um sistema de RBC pode então decidir incorporar à BC o novo caso com a Caso solução adaptada. Isto faz com que a BC (Base de Conhecimento) cresça com qualidade e gere casos diversos. Casos aprendid recuperado A conseqüência é que na recuperação de casos, há maiores o Figura 1. Ciclo de um RBC. s chances de se encontrar um caso similar ao que está sendo testado (aumenta a probabilidade de casos similares). Este Base de processo, chamado de retenção, é importante para gerar Casos casos semelhantes, mas com pequenas diferenças e é uma das vantagens da abordagem de RBC, pois representa o aprendizado do sistema. Assim, fica mais fácil encontrar Base de casos com maior semelhança para um caso que precise de Conhecimento uma solução específica. É também possível incorporar s casos fictícios à BC. Estes casos não representam um indivíduo real, mas representam um grupo de indivíduos. Isto aumenta a diversidade de casos e melhoram as chances Caso Caso na hora da recuperação. resolvi testado O ser humano naturalmente utiliza-se da experiência de do uma situação já conhecida para a resolução de um problema. Aproveitar conhecimentos adquiridos em situações passadas é algo feito constantemente, muitas Solução Solução vezes de forma inconsciente [11]. Confirmada Sugerida Casos são situações problemáticas advindas da experiência, Figura 1. Ciclo de um RBC que são utilizados para auxiliar no processo de reflexãoação com vistas à resolução de problemas. Segundo [12], um caso pode ser definido como um pedaço Segundo [7] temos o seguinte processo detalhado: contextualizado de conhecimento que representa uma experiência real e é utilizado para sugerir um meio de 1. Identificação do problema a ser resolvido (problema de resolver um novo problema, avisar o usuário de possíveis entrada, identificado como novo caso); falhas observadas no passado e para interpretar a situação 2. Definição das principais características que identificam atual. este problema; Um caso consiste então em uma experiência real onde o 3. Busca e recuperação, na base de casos, de casos com problema proposto já foi resolvido procurando-se características similares; representar o problema através de atributos. Estes atributos, 4. Seleção de um ou mais dentre os casos recuperados; juntamente com seus valores devem identificar da forma 5. Reutilização da informação e do conhecimento do caso mais distinta possível o contexto e o conteúdo do problema adaptado para resolver o problema de entrada; [12]. 6. Revisão deste(s) caso(s) para determinar a necessidade A definição de caso é parte importante de um sistema de de adaptação; RBC, pois um problema mal definido ou identificado 7. Avaliação da solução do problema de entrada; poderá gerar uma recomendação não adequada. A 8. Inclusão do caso adaptado na memória de casos representação de um caso compreende três componentes (retenção). básicos: 1. Descrição do problema: a definição das características Definido a representação de um caso, o sistema deverá ser que contribuem para a identificação do problema. Estas capaz de ser reutilizável (consultado) futuramente, de modo podem ser nomes, números, textos, funções que os usuários tomem a decisão de optar ou não pela representativas para a correta descrição e recomendação do sistema. O usuário também é capaz de contextualização do problema eleger qual o caso mais similar e assim optar pelo caso mais 2. Descrição da solução: corresponde à solução parecido com seu problema atual. Além disso, o usuário recuperada pelo sistema para o problema proposto, pode decidir por ajustar a solução recomendada pelo devidamente validade e descrita. sistema, ou seja, poderá adicionar informações às recomendações já citadas. Problema
251
3. Conclusão: também chamado de resultado, consiste em uma avaliação da solução recomendada durante a sua aplicação demonstrando resultados obtidos. Recomendações quanto a futuras utilizações desta solução podem fazer parte da conclusão e conferem maior qualidade e confiabilidade a BC (Base de Conhecimento). Caso-problema são casos com caracterização e desenvolvimento, porém sem desfecho mas que estabelece claramente um obstáculo, a partir do qual gera-se o problema. Assim, seu objetivo é colocá-lo dentro da situação-problema, levando-o à reflexão sobre alternativas de solução e decisões a serem tomadas. Este tipo de caso trabalha especialmente com a noção de que a tarefa do engenheiro de usabilidade é especialmente complexa, e que não pode ser reduzida à mera racionalidade instrumental. A partir disto, foram criados casos-problemas com suas respectivas reflexões. ELABORAÇÃO DE CASOS
Diante das dificuldades definidas na introdução, ficou clara a necessidade de fornecer suporte aos profissionais de IHC contendo elementos multidisciplinares que podem influenciar o sucesso de um produto através de um RBC onde estes são geralmente executados pelo consultor de usabilidade, para ajudar a reerguer ou fazer com que seu produto obtenha sucesso no mercado. Os casos definidos neste trabalho consistiram de uma descrição, sob a forma narrativa, de uma situação baseada nos fatos realmente acontecidos, procurando oferecer uma perspectiva multidimensional do contexto e dos participantes. A necessidade da escolha de situações reais se deve ao fato de propiciarem a exploração, análise e representação baseado no cenário do wikicrimes Social [22]. Os casos foram criados visando promover discussões, pois procuraram incluir suficientes detalhes e informações de modo a possibilitar análises e interpretações sob diferentes perspectivas. Os casos-problemas foram elaborados à partir do sistema colaborativo wikicrimes social (http://www.wikicrimes.org/), devido este não ter obtido o sucesso desejado pelos idealizadores do projeto, vinculando assim características relacionadas à usabilidade que podem ter sido as razões para o não sucesso do produto. Verificou-se também aspectos como sua mobilidade, marketing, comportamento dos usuários e outros. Abaixo segue alguns exemplos deste caso-problema definido para proprietários de um sistema que estejam com os problemas similares ao wikicrimes Social. Caso 1: Olha o barulho, aí! Descrição do Problema Proprietário inconformado com a perda de oportunidade de negócio. Objetivos
Levar o proprietário a refletir sobre o que pode acontecer, quando proprietário não lança seu produto a tempo para ganhar de um concorrente. Analisar o que o proprietário pode fazer para reverter a situação e ganhar do concorrente. Levar o proprietário a pensar na influência do contexto para valorizar o produto. Caso-problema Ventura é um proprietário de um sistema que foi desenvolvido para usuários marcarem qualquer coisa num mapa geográfico do mundo. Um marcador posicionado num lugar específico do mapa pode representar que neste lugar tem barulho, mosquito da dengue, buraco, etc. Tiago teve cuidado para que a informação do marcador fosse configurável pelo próprio usuário, a fim de que o usuário tenha um sistema adaptado as suas necessidades. Ventura acabou de obter do Tiago a primeira versão do produto, e se depara com um triste episódio. Ventura vê no jornal, mais lido na cidade onde mora, um mapa geográfico, onde barulhos estão sendo modelados pela população. Em uma semana, são vários marcadores, e o processo é em progressão geométrica. O resultado é mostrado no jornal. Ele logo pensou: puxa vida, perdi esta oportunidade. Ventura ficou a se interrogar o que o sistema sendo usado tinha que o dele não tinha. Comparou a interface, e não pode encontrar problemas. Apenas poucos detalhes de cores, fontes. Então ele pensou: será que se eu fosse lá e apresentasse o meu sistema, eles mudariam e usariam o meu? Não, acho que cheguei tarde demais. Se ao menos eu tivesse um cliente, poderia dizer: Olha Fulano já adota a minha solução, adote-a também. Então ele faz outras reflexões procurando as vantagens de seu produto: o meu produto é gratuito e configurável, não sei se o outro é, tenho que saber mais sobre este outro. Como fazer? Estou cheio de dúvidas. Perguntas investigativas - Como você acha que um proprietário tem que ficar atento às oportunidades? - Você acha que lançar um produto antes dos concorrentes é mais importante do que investir para ter um produto atraente? Como ponderar tempo e beleza? - Você acha se o proprietário de um produto tem outros clientes, ele pode conseguir reverter a situação e ganhar o cliente? - Você acha que a facilidade de interface no produto pode fazer com que o proprietário reverta a situação e ganhe do concorrente? - Quais dos três fatores você acha mais importante para ganhar um cliente de outro concorrente? Ter outros clientes, ter um produto com boa interatividade (bonito, configurável, fácil de usar) ou ter o preço mais acessível para que o cliente passe a adotá-lo? Um segundo exemplo de caso-problema também pode ser considerado a seguir:
252
Caso 2: Tenho que ter tudo isto? Descrição do Problema Usuário insatisfeito pelo incômodo das assistências recebidas pelo sistema Objetivos Levar o proprietário a refletir em que condições as pessoas estão dispostas a usar soluções sofisticadas e inovadoras Levar o proprietário a perceber qual o limite aceitável de combinação de soluções inovadoras num mesmo produto Questionar o proprietário se ele acha que soluções inovadoras são para poucos, e assim podem ser caras. Caso-problema Ventura decidiu ousar no seu novo produto. Para um problema grave na sociedade que é a sensação de insegurança, ele pensou: se as pessoas pagam tão caro por carros blindados, então porque não pagarem bem para ter um sistema para ser notificado quando se aproximarem de zonas perigosas, e solicitarem segurança no local e terem seu carro devidamente adaptado ao perigo do contexto? Desta forma eu poderia garantir serviços para dar mais segurança a quem estiver no interior do carro. Ele então combinou uma série de tecnologias num sistema de segurança para automóveis. Tal carro teria um computador a bordo, sistema de GPS, vidros elétricos e controláveis pelo sistema. Gilmar, um empresário, achou a idéia bem interessante e comprou o produto quando ficou pronto. O problema é que Gilmar ao usar o sistema, viu que tinha mais interesse em ficar olhando a tela do computador, para ficar acompanhando informações criminais, além disto, sua família não gostava do alarme que tocava e ficava apavorada. Gilmar comentou sua insatisfação com Ventura, alegando que tinha muita tecnologia inovadora, mas que o sistema tirava o seu foco principal, que era dirigir. Tal fato levou Ventura a pensar se ele poderia simplificar o sistema, diminuindo a quantidade de serviços oferecidos num só sistema. Perguntas investigativas - Você acha que o desespero e medo da violência levam a quem tem carro com computador a investir em soluções tecnológicas e interativas que lhe garantam uma segurança particular/privada? - Você acha que um sistema não intrusivo seria a solução apropriada para este caso? - Que tipos de relações existem entre a interface de um sistema e a segurança de uso do sistema: i) O usuário deixaria de usar o sistema porque sua interface influencia negativamente na sua forma de dirigir? ii) O usuário deixaria de usar o sistema porque sua interface não lhe assegura que os dados existentes são corretos? iii) o usuário teria medo de registrar informações criminais, por não ter segurança de quem pegaria. - Você acha que deixar de usar um sistema por medo, pode significar que as pessoas ainda não estão preparadas para se apropriar de todos os recursos que a Web 2.0 disponibiliza (de colaboração, por exemplo).
- Como você acha que desenvolvedores deveriam agir para entenderem a experiência do usuário com a solução, antes de investir tanto recurso? Em que momento? Ainda como terceiro exemplo de caso-problema temos: Caso 3: Cheguei na hora errada Descrição do Problema Proprietário sente que o público não está preparado para se apropriar de uma solução inovadora Objetivos Ajudar o proprietário a perceber se as pessoas estão preparadas para um novo modo de viver com a tecnologia, se elas percebem as vantagens da tecnologia. Ajudar o proprietário a perceber se ele não está na hora errada e no lugar errado com a sua solução. Ajudar o proprietário a entender quais as necessidades dos usuários para criar a solução. Caso-problema Ventura tem um produto super-inovador, além de usufruir da filosofia ao redor da Web 2.0, também aproveita os recursos de comunicação e hardware existentes para trabalhar a interoperabilidade de seu produto. Agora você pode registrar crimes usando o celular, e integrado ao mapa de crimes. Enquanto no Brasil, as experiências não têm sido motivadoras, o sistema tem sido usado com muito sucesso na África, onde a tecnologia do celular está bem difundida. As operadoras permitem que a pessoa registre crimes manipulando diretamente o mapa onde se encontra o problema. O sistema não usa SMS como as pessoas estão comumente acostumadas. Perguntas Investigativas - Você acha que o problema está no seu produto ou nas pessoas, que não vêem os benefícios que elas podem ter se apropriarem da filosofia web 2.0? - Você disse que o sistema tem integração com outros sistemas em outras plataformas. Você acha que as pessoas já estão preparadas para esta operabilidade? - Tem se percebido uma tendência, em usar o celular como uma plataforma para se fazer tudo. Que recursos interativos estão sendo oferecidos no celular que tem trazido esta motivação? As soluções variam muito do contexto em que o usuário vive? - Você tem medo de investir em soluções inovadoras e o público não está preparado para se apropriar de uma solução inovadora? Podemos ainda citar um quarto exemplo: Caso 4: Me ouça! Descrição do Problema O proprietário dos produtos usados pelos usuários não sabem receber suas reclamações e necessidades em decorrência das experiências de uso. Objetivos Interrogar sobre estratégias para ouvir os usuários
253
Levar o proprietário a perceber que existem soluções na interface que podem melhorar a relação entre empresa e usuários? Levar o proprietário a perceber a influência da imagem da empresa para a aceitação dos produtos da empresa pelos usuários Caso-problema Ventura solicita a Carol para refletir na interface do site da empresa, soluções para um problema que ele tem atualmente. Ele acha que a imagem da empresa está muito ligada a uma empresa mercenária, porque eles têm ganhado muito dinheiro. Conseqüentemente a empresa tem dificuldade de relacionamentos com o usuário. Os funcionários comentam que os usuários ligam geralmente muito abusados para fazerem reclamações, que muitas vezes nem é tão séria. Não justificando tal comportamento. Ventura não sabe o que pode ser feito na interface do site da empresa, mas ele quer se seja por lá, já que todos os serviços são disponibilizados no site, etc. Perguntas Investigativas - Você acha que uma solução possível seria dar maior visibilidade sobre os valores éticos da empresa? Colocar imagens de sites onde mostram nas interfaces as políticas de privacidade da empresa, por exemplo, informações sobre políticas de privacidade que o sistema adota. - Você acha que existem padrões de interface para resolver esta situação? - Como se descobre o padrão ideal para um problema? Após estes casos definidos, estes deverão ser armazenados, ordenados e organizados em um sistema IS. As experiências relatadas sobre a utilização de sistemas de RBC têm sido muito promissoras. Os autores desta pesquisa estão vivenciando o processo de alimentar tais sistemas com casos que sejam realmente eficazes. Casos estão sendo estudados e avaliados freqüentemente. A idéia é desenvolver um framework com uma BC ampla no sentido de ser referência na busca por reflexões através de casos. INTERACTIVE STORYTELLING
O ato de contar histórias faz parte da vida dos homens. E este recurso é uma forma simples e natural de transmitir conhecimento. Os seres humanos contam histórias para compartilhar experiências e casos [2]. O estudo desenvolvido nesta pesquisa permite o suporte do processo de argumentação e envolvimento das partes através da organização, estruturação e análise da informação resultante do processo, além da criação da base de conhecimento para futura utilização. Esta técnica permite que as partes relatem os acontecimentos de um processo legal através da utilização de uma história. Segundo [22] storytelling não é mais do que um método que se baseia no ato de contar uma história e tem como finalidade a captura e transmissão de conhecimento. É com
este fim que, precisamente no campo da gestão do conhecimento, este método tem sido estudado e aplicado. É neste contexto que se tem vindo a desenvolver estudos sobre a aplicabilidade do Storytelling dentro das organizações, uma vez que a estrutura narrativa de uma história permite aos intervenientes estabelecer uma plataforma de comunicação eficiente e eficaz do ponto de vista da partilha do conhecimento [22]. Neste sentido, percebe-se em Storytelling um grande potencial para criar e contar casos interessantes. Entretanto, a história precisa ter uma estrutura narrativa, como: 1. Enredo: Conjunto de fatos de uma história 2. Personagem: Participa do enredo e pode ser fictício ou não 3. Tempo: Pode-se referir tanto a época em que se passa a história quanto à duração da mesma 4. Espaço: Local onde ocorre o problema 5. Narrador: Autor da história A espinha dorsal da narrativa é a organização dos eventos em seqüência. Uma história pode ser dividida em eventos e o propósito da narrativa definirá a forma pela qual serão apresentados esses eventos. Segundo [2], é importante ressaltar que ao elaborar uma história deve-se ter muito cuidado para que não seja chata e nem difícil de ser visualizada. Desta maneira a ferramenta deverá permitir a utilização de cores, textos, links, vídeos, sons e figuras. Com a BC bem definida foi elaborado um framework conceitual contendo quatro pilares: design da interação, negócio, conteúdo e usuário. A partir deste, o framework possuirá um conjunto de elementos multidisciplinares para lidar com determinados problemas associados ao mal ou não uso de produtos anteriormente definidos, que será demonstrado através de um sistema em interactive storytelling, uma análise contextual que descreve uma situação concreta atual (corrente) ou potencial (futura) de uso de um sistema. Este IS conterá atividades que estarão associados aos casos. Esta tarefa promoverá a comunicação usuário-analista, pois permite exemplificar comportamentos e refletir sobre sua adequação através de situações concretas de uso do sistema, facilitando assim o trabalho do consultor. O framework será também um documento norteador para o sucesso de sistemas computacionais, tanto na fase de desenvolvimento, quanto na fase final (momento em que o produto já está totalmente concluído). Este framework estimulará as equipes de usabilidade a adotarem os elementos definidos no mesmo, em diferentes produtos, ou seja, será um modelo genérico que possa ser aplicada em vários outros tipos de produtos para que assim diminuam os riscos de o projeto não atender às necessidades dos usuários. Será também incentivado a inserção de elementos multidisciplinares no processo de desenvolvimento de software desde o início, para que no futuro, não tenham problemas por não estarem utilizando o produto adequadamente por motivo do mau uso.
254
Com esta prática desenvolvida, o especialista de usabilidade poderá interagir com o sistema e eleger as opções necessárias providas do framework fornecidas pelo storytelling, no qual determinará o problema que mais se adéqua ao interesse de investigação e verificação do seu produto. Feito isto, poderá ter mais detalhadamente informações de como este poderá atuar e aplicar a atividade em seu próprio produto, com comentário através da narrativa de cenários. Tudo isto só é permitido por conta de uma base de conhecimento e o desenvolvimento de um storytelling com fornecimento dos elementos definidos no framework conceitual. Uma vez definido a BC, será desenvolvido este sistema em interactive storytelling para que todos possam colaborar e permitir que outros interessados possam usufruir do conteúdo demonstrado de forma facilitadora. O sistema já está em fase de desenvolvimento sendo baseado em todos os requisitos anteriormente definidos para tão logo serem colocados em execução. CONSIDERAÇÕES FINAIS
Acredita-se que este trabalho poderá acrescentar a literatura de IHC, pois com o framework desenvolvido permitirá o suporte de elementos multidisciplinares a ser considerado no desenvolvimento do lançamento e divulgação de um produto (sistemas computacionais). As experiências relatadas no trabalho de [18] e [12] sobre a utilização de sistemas de RBC têm sido muito promissoras. Estes ambientes têm contribuído de maneira importante para a resolução de problemas, em várias situações e áreas do conhecimento. Os sistemas de RBC possuem características dinâmicas, que proporcionam a modificação ou adaptação de uma solução recuperada de sua base de casos, quando esta necessita ser aplicada em um contexto diferente de solução de problemas. Além disso, o sistema aprende com os novos casos, trazidos por proprietários e/ou especialistas em usabilidade, incorporando-os à base de casos e reutilizando-o para outros alunos com casos similares. Além disso, o envolvimento de todos os componentes que influenciam no sucesso do produto foi levado em consideração na pesquisa, como o segmento de mercado, o marketing, o negócio, a análise das informações colhidas, resultando em geração de atividades e técnicas com vista não somente na solução do conflito, mas também à criação do conhecimento para futura utilização e aplicação, através da técnica de interactive storytelling. A técnica de Storytelling foi analisada e fundamentada quanto à sua aplicação a metodologia de atividades e técnicas, compreendendo o porquê da utilização e criação de um modelo genérico que está sendo desenvolvido. As histórias narrativas que fazem parte do storytelling não são mais do que um conjunto de eventos com determinado significado e que traduzem uma ligação causal ou temporal entre pessoas, acontecimentos ou coisas (BROOKS, 1997). Como proposta de trabalhos futuros temos a criação de mais casos vivenciados por outros sistemas que não tenham
obtido sucesso, assim como o desenvolvimento da ferramenta, que já está sendo implementado, voltada para web para que esta possa então ser ampliada, consultada e alterada por proprietários e engenheiros de usabilidade. Por fim, como resultados finais desta narrativa através de cenários, trazem a criação de uma BC e o desenvolvimento do framework, atividades de suporte para os mais diversos fins com foco na redução de riscos e (re)utilização de um sistema computacional, pois é de extrema importância poder saber se o software vai ser ou não sustentável no mercado que faz parte. A idéia é também fortalecer a utilização de uma equipe multidisciplinar em uma visão mais cautelosa no que diz respeito ao desenvolvimento de um produto, como forma manter este produto sempre valioso para ambas as partes (usuários e clientes). AGRADECIMENTOS
Ao Laboratório de Uso e Qualidade de Software (LUQS) por toda estrutura oferecida. À Fundação Cearense de Apoio e Desenvolvimento Científico Tecnológico (FUNCAP) pelo incentivo e apoio à pesquisa. REFERÊNCIAS
1. Aamodt, A. Plaza, E., Case-Based Reasoning: Foundational Issues, Methodological Variations, and Systems Approaches. Artificial Intelligence Communications, Vol. 7, No. 1, 1994. 2. Assis, L. F, Pietrobon, C. A. Utilização de Storytelling para Manipulação do Conhecimento gerado no Processo de Desenvolvimento de Software. In: SBQS, 2008, Florianópolis. Workshop de Teses e Dissertações em Qualidade de Software (WTDQS), 2008. 3. Barbosa, David F., Dissertação de Mestrado (Informática Aplicada). Uma estratégia de apoio à institucionalização da usabilidade em ambientes de desenvolvimento ágil. Universidade de Fortaleza, 2008, Brasil. 4. Barros, Leandro M. Dissertação de Mestrado em Computação Aplicada. Um modelo para prover consistência narrativa em interactive storytelling. Universidade do Vale do Rio dos Sinos, 2007, Brasil. 5. Beck, K. Andres, C. Extreme Programming Explained: Embrace Change. 2nd. ed. Boston: Addison-Wesley, 2004. 224 p., ISBN 0-321-27865-8. 6. Beck, K. eXtreme Programming Explained: embrace change, Addison Wesley, 2000. 7. Broks, K. M., Do story agents use rocking chairs? The theory and implementation of one model for computational narrative. Proceedings of the fourth ACM international conference on Multimedia Boston, Massachusetts, Estados Unidos, 1997.
255
8. Cybis, Walter, Betiol, Adriana H., Faust, Richard. Ergonomia e usabilidade. São Paulo, Novatec, 2007.
Computadores) Universidade Técnica de Lisboa, 2006, Brasil.
9. Filardi, Ana Lúcia, Traina, Agma Juci M., Montando questionários para medir a satisfação do usuário: Avaliação de interface de um sistema que utiliza técnicas de recuperação de imagens por conteúdo. In: IHC 2008, Brasil, 2008.
22. Silva, Sara Alves. Dissertação de Mestrado em Engenharia de Informática e de computadores. Modelação de processos alternativos de conflito utilizando a técnica de storytelling, Universidade Técnica de Lisboa, 2006. Portugal.
10. Freitas, João Vitor, Benjamin, Marcelo Braga, Pastor, Saulo Oliveira. Usabilidade e acessibilidade para portadores de necessidades especiais na web. Disponível em: http://www.frb.br/ciente/Impressa/Info/2004.2/usabilida de.pdf. Acesso em: 15 abr. 2009.
23. Site do Sistema Colaborativo http://www.wikicrimes.org/.
11. Junior, Dagoberto Telles, Telles, Viviane Carra, Lorenzi, Fabiana, Loh, Stanley, Franceschi, Analucia Schiaffino Morales de. Sistema de raciocínio baseado em casos para recomendação de programa alimentar. Revista Eletrônica de Sistemas de Informação, Edição 9, Nº 3, 2006.
Wikicrimes
24. Tait, Tania Fátima C., Silveira, Mário Cesar, Simões, Rafael, Cybis, Walter. Desenvolvimento de software para trabalho cooperativo auxiliado por computador: uma abordagem ergonômica. 25. Thiry, Marcelo. Uma arquitetura baseada em agentes para suporte ao ensino a distância. Tese de Doutorado. Florianópolis: UFSC, 1999.
12. Kolodner, J. Case-Based Reasoning. Morgan Kaufmann, 1993. 13. Lelic, S. Fuel your imagination – KM and the art of storytelling. Knowledge Management by the ARKGroup, 2001. 14. Löwgreen, Jonas; Stolterman, Erik. Thoughtful interaction design: design perspective on information technology. Cambridge: MIT Press, 2004. 15. Mattos, F. L. Dissertação de Mestrado em Educação. Uma metodologia para formação continuada de professores universitários no contexto de um ambiente computacional multiagentes. Universidade Federal do Ceará, 2002, Brasil. 16. Queiroz, Ana Emília de M., Braga, Maurício Motta, Gomes, Alex Sandro. Design de ajudas inteligentes em interfaces educativas. In: IHC 2008, Brasil, 2008. 17. Ribeiro, Marcos Buccini P., Design Experiencial em Ambientes Digitais: Um Estudo de Uso de Experiências em Web Sites e Junto a Designers e Usuários da Internet. Dissertação de Mestrado (Design). Universidade Federal de Pernambuco (UFPE), 2008. 18. Schank, Roger. Dynamic University Press, 1982.
Memory.
Cambridge
19. Schwaber, K. Beedle, M.; Agile Software Development with SCRUM, Prentice Hall, 2002. 20. Silva, André Constantino da. Silva, Júnia Coutinho Anacleto. Penteado, Rosângela Aparecida D. Silva, Sérgio Roberto P. da. Aplicabilidade de padrões de engenharia de software e de IHC no desenvolvimento de sistemas interativos. Anais do IV Congresso Brasileiro de Computação, 2004. 21. Silva, Sara A. da. Modelação de processos alternativos de conflito utilizando a técnica de storytelling. Dissertação de Mestrado (Engenharia Informática e de
256
Usos e significados do sofá: uma sondagem de usuários Clarice Goulart ESDI/UERJ R. Evaristo da Veiga, 95, RJ, Brasil clagoulart@gmail.com
Rafael de Vasconcelos ESDI/UERJ R. Evaristo da Veiga, 95, RJ, Brasil rd_vasconcelos@yahoo.com
RESUMO
Este trabalho trata da aplicação de diversos métodos de sondagem de usuários em uma investigação a respeito do uso do sofá em famílias de diferentes realidades socioeconômicas no estado do Rio de Janeiro e apresenta os resultados obtidos. São descritos os insights encontrados a respeito das apropriações e significações do sofá. Também constam algumas observações sobre os métodos em si, que se somam aos estudos do design atitudinal. O artigo dá sequência ao artigo “Métodos de sondagem de usuários na pesquisa da inovação familiar”, de dois dos autores deste trabalho.
Lucy Niemeyer ESDI/UERJ R. Evaristo da Veiga, 95, RJ, Brasil lucy@esdi.uerj.br
de métodos de sondagem de usuários desenvolvidos e utilizados por pesquisadores em design, visando à implementação do design atitudinal. Essa área de estudo do design concentra sua atenção na atitude manifesta dos usuários em relação aos objetos, permitindo que o desenvolvimento de projetos integre a significação, atribuída pelo usuário no contexto de uso, à eficiência do objeto projetado. Assim, as atividades desenvolvidas na pesquisa visam a fornecer subsídios para a definição de estratégias no âmbito do desenvolvimento de produtos, com fundamento nos processos de construção da significação.
Palavras-chave dos autores
Design atitudinal, sondagem de usuários, metodologia de design, mobiliário.
O trabalho descrito por este artigo e por aquele que o antecede resultam de uma experiência de iniciação científica em que um dos autores participou como bolsista, o segundo como voluntário e o terceiro como orientador da pesquisa.
1. INTRODUÇÃO
2. METODOLOGIA
Como descrito em um trabalho anterior1, ao qual este dá sequência, a pesquisa “Inovação familiar” trata, em seu escopo mais abrangente, de como as concepções na área do design podem levar em consideração mudanças nos modos de vida e de mentalidade. A proposta dessa pesquisa é observar as transformações sociais e suas implicações no uso de objetos no cotidiano e a atribuição de significado por parte de usuários em diferentes contextos. À criação do novo, realizada constantemente pelos indivíduos em seu habitat, dá-se o nome de inovação familiar. Este artigo trata de uma fase da pesquisa em que se optou por investigar os usos da sala de estar, ambiente de convivência da residência, e especificamente foi proposta a observação do sofá, havendo interesse nos usos desse produto em diferentes realidades socioeconômicas fluminenses. Nesta fase também foram realizados o levantamento, a análise e a experimentação 1 O trabalho referido é o artigo “Métodos de sondagem de usuários na pesquisa A inovação familiar”, referenciado na bibliografia desde trabalho. O artigo trata da primeira etapa da pesquisa que também é tema deste trabalho, detalhando o levantamento bibliográfico e a sistematização de métodos de sondagem de usuários desenvolvidos e utilizados por pesquisadores em design.
A fase da pesquisa acerca da inovação familiar aqui descrita foi dividida em três grandes etapas: estado da arte, experimentação e aplicação das metodologias levantadas e divulgação dos resultados. As etapas são listadas a seguir, com a breve descrição dos métodos e materiais utilizados em cada uma delas. 2.1. Primeira etapa: estado da arte
Nessa primeira etapa, foi realizado um levantamento bibliográfico sobre design atitudinal e design emocional. Em seguida, procedeu-se à análise e à catalogação dos métodos e técnicas de sondagem de usuários desenvolvidos pela pesquisa em design identificados no levantamento. Tais métodos foram estudados e então selecionaram-se aqueles que seriam utilizados na etapa seguinte da pesquisa. A seguir são brevemente descritos2 os métodos de sondagem analisados, tendo sido as técnicas agrupadas segundo os textos de referência em que foram encontradas. 2.1.1. Sondas culturais (Cultural Probes)
Sondas culturais (Gaver et al., 1999) é um método de sondagem de usuários em que o participante realiza independentemente atividades prescritas pelos pesquisadores, utilizando um kit que contém itens como cartões-postais, mapas, fotos e câmeras. Os resultados as atividades, enviados posteriormente à equipe de design, permitem conhecer hábitos, valores e necessidades dos participantes, funcionando como material inspirador para o processo de ideação e desenvolvimento de projeto. O método foi desenvolvido como parte de uma estratégia de busca por um design experimental que dialogue com questões culturais de grupos a princípio desconhecidos pelo designer. 2 Descrições mais detalhadas sobre as técnicas de sondagem citadas são apresentadas no trabalho anterior, supracitado.
257
2.1.2. PrEmo (Product Emotion Measurement)
PrEmo (www.premo-online.com), desenvolvido por Pieter Desmet e comercializado pela empresa holandesa SusaGroup, é um instrumento para medição de respostas emocionais a produtos de consumo. Consiste em um conjunto de doze personagens animados, apresentados em uma interface digital, que representam emoções através de expressões faciais, corporais e vocais. Das doze emoções representadas, seis são positivas e seis são negativas. O sistema funciona por meio de estímulos visuais, em geral fotografias dos produtos a serem avaliados pelos participantes. Estes informam sua reação às imagens apresentadas classificando o grau de intensidade em que sentem (ou não) cada emoção numa escala numérica de 0 a 4. 2.1.3. Ferramentas generativas (Generative Tools)
Ferramentas generativas são métodos listados por Elizabeth Sanders e Colin William (Sanders et al., 2001) para liberar e estimular a criatividade das pessoas através da comunicação visual. Os autores consideram três tipos de métodos: os métodos diga, com base em comunicação verbal, os métodos faça, que geram insights a partir da observação do que as pessoas fazem, e os métodos crie,1 que estimulam a ideação. Os participantes são convidados a documentar diariamente pensamentos e sentimentos a respeito da experiência investigada, ou simplesmente prestar atenção nas suas rotinas e comportamentos. Os resultados dessa tarefa fornecem subsídios para as tarefas seguintes, realizadas em conjunto com os pesquisadores, evocando e ativando determinados sentimentos, memórias e desejos, expressos na etapa final por meio de colagens, mapeamentos cognitivos (associações semânticas) e modelagens em velcro. O material resultante serve de referência para a análise pelos designers. 2.1.4. Métodos da Research Toolbox
As empresas americanas de pesquisa e design Daedalus Excel (www.daed.com) e ThoughtForm (www.thoughtformdesign. com) publicaram em 2005 um documento chamado Research Toolbox, que apresenta 23 métodos para “descobrir o que os usuários realmente querem”, distribuídos em um gráfico de dois eixos – de perguntar ao usuário a observar o usuário e de o usuário pode falar sobre suas necessidades a o usuário não tem consciência das necessidades – e classificados em seis 1 No original, métodos say, do e make.
Figura 1: Algumas das formas disponibilizadas aos participantes para realização do mapeamento cognitivo.
tipos: conte-me, mostre, faça um relatório, veja e ouça, teste e pense em voz alta e crie, cada um propondo tarefas para participantes e pesquisadores, realizadas individualmente e em conjunto. Os métodos incluem entrevistas, visitas guiadas, relatos dos participantes sobre suas atividades, observações via web ou in loco, testes com protótipos, colagens e modelagens, entre outros. 2.1.5. Modelo Kano
Modelo Kano é um método que categoriza produtos similares, contrastando a reação dos usuários com a presença e a ausência de cada um dos atributos de um produto, classificando-os em seis categorias: atrativos, básicos, lineares, indiferentes, reversos e questionáveis. Para chegar a essa classificação, o Modelo Kano utiliza um questionário e procedimentos precisos de avaliação dos resultados. O questionário apresenta duas questões em relação a cada requisito, uma positiva, a questão funcional, e outra negativa, a disfuncional. As respostas são contabilizadas em uma tabela a partir da qual se dá a classificação dos requisitos. 2.2. Segunda etapa: experimentação e aplicação das metodologias levantadas
A segunda etapa da pesquisa foi iniciada pela sistematização dos métodos levantados, selecionando-se aqueles que seriam utilizados para as sondagens com os participantes. Em seguida realizou-se a preparação do material necessário para a aplicação das sondagens e os participantes foram contactados. 2.2.1. Sistematização dos métodos levantados
Uma vez sistematizados os métodos levantados, foi definido um planejamento para aplicação das sondagens em dois grupos de participantes: I) seis famílias de baixo poder aquisitivo (classes C e D) e II) seis famílias de alto/médio poder aquisitivo (classes A e B). O planejamento descrito no trabalho anterior sofreu alterações ao longo da realização das sondagens, tendo sido utilizados os seguintes métodos: • Métodos do tipo veja e ouça: observação etnográfica. • Métodos do tipo faça um relatório: diário de registro das atividades e emoções. • Métodos do tipo mostre-me: tour guiado e observação do local de uso.
Figura 2: Algumas das imagens disponibilizadas aos participantes para realização da colagem e do card sort.
258
• Métodos do tipo diga: entrevista contextual. • Métodos do tipo crie: colagem, mapeamento cognitivo e card sort. A distribuição dos métodos para aplicação nos participantes seguiu os seguintes roteiros: • Roteiro 1: visita ao local de uso, entrevista contextual e tour guiado em lojas de móveis – um usuário de cada um dos grupos I e II. • Roteiro 2: visita ao local de uso, entrevista contextual, mapeamento cognitivo e colagem – um usuário de cada um dos grupos I e II. • Roteiro 3: visita ao local de uso, entrevista contextual, mapeamento cognitivo e card sort – um usuário de cada um dos grupos I e II. • Roteiro 4: visita ao local de uso, entrevista contextual e PrEmo – três usuários de cada um dos grupos I e II. Independentemente dos roteiros, definiu-se que metade dos participantes dos grupos I e II seriam solicitados a realizar o diário de registro das atividades e emoções.
2.2.2. Contato com os participantes
Os pesquisadores realizaram contato com os participantes por intermédio de pessoas conhecidas, às quais se pediu a indicação de famílias de médio ou baixo poder aquisitivo que tivessem pelo menos um sofá em suas casas e disponibilidade de até duas horas para a realização de uma entrevista presencial no local de uso. Os participantes indicados receberam esclarecimentos em relação aos procedimentos da pesquisa e acordaram sua participação em atividades complementares à entrevista contextual, tais como o PrEmo ou o tour guiado, por meio do telefone e do correio eletrônico. 2.2.3. Aplicação dos métodos
As técnicas de sondagem foram aplicadas entre março e abril de 2009, tendo sido realizadas treze entrevistas, sete em famílias do grupo I, sendo que uma delas não possuía sofá, e seis em famílias do grupo II. Um participante de cada grupo realizou o tour guiado com os pesquisadores. Foram produzidos mapeamentos cognitivos e colagens com três famílias do grupo I e duas famílias do grupo II. O experimento do PrEmo foi respondido por cinco participantes de cada grupo. 2.3. Terceira fase: divulgação dos resultados
Havia a previsão de incluir um terceiro grupo, de especialistas – que participariam de entrevistas e de um grupo focado. No entanto, essa parte do planejamento foi alterada em função da disponibilidade de tempo para conclusão da pesquisa e os especialistas não foram contactados.
A terceira etapa prevê a publicação de artigo científico para disponibilização dos resultados obtidos e compilação de todo o material da pesquisa para produção de um DVD. A pesquisa teve outros desdobramentos tais como a realização de oficinas sobre pesquisa de usuários, descritas adiante neste artigo.
A preparação dos materiais para a pesquisa também é descrita em detalhe no trabalho anterior, valendo relembrar que foram desenvolvidas e selecionadas: questões para orientação das entrevistas contextuais, palavras e imagens para os mapeamentos cognitivos, imagens fotográficas para as colagens e para o card sort e fotografias de sofás como estímulos para o experimento do PrEmo. O grupo inicial de 12 imagens selecionadas para este último método foi reduzido a 10 (Figura 1), por recomendação do próprio representante da SusaGroup, para que o experimento não excedesse o tempo considerado adequado para adesão dos participantes.
3. RESULTADOS OBTIDOS 3.1. Insights das entrevistas contextuais
As entrevistas realizadas levaram a insights a respeito do comportamento dos participantes diante da própria situação da entrevista e sua relação com o objeto estudado, as significações atribuídas ao móvel, os problemas encontrados no uso etc. 3.1.1. Atitude dos participantes
Desde as primeiras entrevistas pôde-se notar uma diferença entre os grupos, no que diz respeito à postura dos participantes em relação à entrevista e à presença dos pesquisadores em suas residências. Na maioria das famílias do grupo I, os pesquisa-
Figura 3: Da esq. para a dir. e de cima para baixo, sofás de 1 a 10, selecionados como estímulos no experimento do PrEmo.
259
dores sentiram-se muito bem-vindos e acolhidos, sendo tratados como visitas ou amigos, convidados a almoçar ou tomar lanches e a voltar futuramente. Os participantes mostraram-se satisfeitos em poder ajudar e foi visível o esforço de muitos em colaborar ao máximo com a pesquisa. Por outro lado, não fizeram muitas perguntas sobre a finalidade da entrevista. Já nas entrevistas realizadas com famílias do grupo II, os pesquisadores sentiram muitos dos participantes menos disponíveis. Todos foram gentis e não houve nenhum constrangimento na realização das entrevistas, mas em geral o tempo passado nas residências desse grupo foi bem mais curto e as entrevistas foram mais objetivas, já que as respostas dos participantes eram em geral mais pontuais e eles faziam menos digressões para contar experiências vividas ou memórias subjetivas. Essa diferença de postura entre os grupos de participantes ultrapassa as diferenças na forma como se relacionam com os sofás em suas residências, havendo inclusive consonância em muitos aspectos dessas relações. 3.1.2. Papéis do sofá
A partir das entrevistas realizadas, nota-se que o sofá é um móvel que assume diversos papéis nas residências, muitos deles repetindo-se em várias das famílias entrevistadas. Dentre os participantes do grupo I, o sofá é entendido principalmente como um objeto confortável, para descansar, onde se pode fazer (e de fato se faz) de tudo. Os moradores demonstram grande afeto pelo objeto, referindo-se a ele como um item muito importante de suas casas, parecendo valorizá-lo mais que o restante dos móveis. Mesmo que durante as entrevistas
Figura 4: planta-baixa do apartamento de uma família do grupo II, em Copacabana, na zona sul do Rio de Janeiro.
tenham sido observados problemas ergonômicos ou dificuldades de acomodar o objeto no ambiente doméstico em razão do tamanho, os participantes desse grupo fizeram poucas críticas ao móvel. Pelo contrário, vários participantes fizeram muitos elogios à qualidade do sofá, pelo conforto proporcionado, assumindo uma postura como que de gratidão por possuírem esse objeto e nele poderem usufruir momentos de descanso e de convívio familiar. Já dentre os participantes do grupo II, o sofá é um elemento tradicional da sala, cuja função entendida é principalmente receber e acomodar visitas, mesmo que não seja esse o uso predominante. Muitas pessoas desse grupo não têm o costume de utilizá-lo sozinhas, apesar de saberem que outras o fazem, preferindo a cama para atividades como leitura e descanso. Em ambos os grupos os participantes comentaram que o sofá é o que permite que a sala seja “de estar”, pois acomoda visitas que não poderiam ser recebidas em outros cômodos como o quarto de dormir, o que seria constrangedor por ser um ambiente mais íntimo. Outras observações são comuns a famílias de ambos os grupos. É unânime a percepção de que o sofá forma uma dupla com a televisão, sendo posicionado sempre em função da localização desta (Figuras 4 e 5), em geral determinada pela disponibilidade da antena ou pela configuração do cômodo, considerando-se o tamanho das paredes e a posição das janelas (que podem causar reflexos na televisão). A posição da televisão define também o modo de sentar dos moradores. Quando o sofá fica perpendicular a ela, as pessoas deitam no sentido longitudinal, apoiando a cabeça no braço do móvel. Quando o sofá fica diante da televisão, é mais comum que as pessoas se sentem, apoiando os pés em bancos, cadeiras ou pufes para esticar as pernas.
Figura 5: planta-baixa da casa de uma família do grupo I, na Penha, na zona norte do Rio de Janeiro.
260
Em função do hábito de ver televisão – que as entrevistas revelam ser a principal atividade de lazer doméstico da grande maioria dos participantes –, o sofá ganha ainda mais importância dentre os móveis da casa, substituindo a mesa de jantar, já que muitas das refeições são feitas diante da televisão, com os pratos apoiados diretamente no colo, sobre almofadas ou bandejas próprias para essa finalidade. É comum também apoiar copos nos braços do sofá, quando estes são largos e oferecem equilíbrio. Comer no sofá é encarado como um “mau hábito que todo mundo tem”. As pessoas admitem que comem no sofá com uma certa culpa ou vergonha, achando graça, como se fosse uma pequena contravenção. O sofá também é um substituto da cama, já que algumas pessoas costumam assistir à televisão à noite e nele adormecem (muitas vezes deliberadamente, havendo até uma preparação, forrando-o com roupa de cama apropriada para passar a noite). Dormir no sofá é mais comum no grupo I, principalmente como hábito diário, mas também há relatos desse costume entre participantes do grupo II. Além de passar a noite no sofá em função da televisão, outras situações levam a trocar a cama por ele. Por exemplo, algumas pessoas declaram a necessidade de mudar de ambiente para ler, estudar ou descansar, comentando também que no sofá conseguem encontrar maior variedade de posições confortáveis sem sentir sono. Até mesmo ver televisão no sofá em vez de na cama é justificado dessa forma, já que deitar-se na cama causa mais sonolência. Alguns dos participantes que têm televisores em seus quartos declaram que gostariam de ter um sofá pequeno neste cômodo para não terem que ver televisão deitados na cama. Essas declarações no entanto são contraditórias, pois a maioria das pessoas deita-se no sofá e acaba adormecendo ali mesmo. Algumas pessoas, quando ficam doentes, preferem passar o dia deitadas no sofá da sala, para variar de ambiente e também para estar mais perto de certas facilidades domésticas, ficando, por exemplo, no meio do caminho entre a cozinha e o banheiro. Quando as casas estão cheias de visitas, o sofá é transformado em cama, havendo móveis que já são comprados com essa intenção. Uma das participantes mora com a irmã e seus pais vivem em outra cidade, vindo visitá-las algumas vezes por mês. Isso as levou a comprar um sofá-cama, que acomoda também amigos ou mesmo namorados. Os hóspedes nem sempre são acomodados no sofá, havendo participantes que preferem ceder a própria cama e deitar-se na sala. Isso revela que a substituição não é considerada totalmente adequada, sendo preferível que houvesse um quarto de hóspedes com cama. O sofá é um móvel versátil para a realização de atividades diversas. Por oferecer bastante espaço de superfície, o móvel adequa-se ao trabalho de alguns participantes, como é o caso de uma senhora que costura bonecos de pano e costuma sentarse no sofá e espalhar ao seu redor os materiais de que necessita, utilizando o encosto para apoiar os bonecos para secar a cola. Outra participante comentou que se senta no sofá sempre que vai organizar coisas, como documentos, contas etc., justificando o hábito em virtude da possibilidade de espalhar tudo no
móvel. Ambas consideram mais confortável sentar-se no sofá do que à mesa, o que seria muito formal. Além disso, assistem à televisão enquanto realizam essas atividades. A grande superfície disponível também confere ao sofá um papel de depósito temporário. É comum que roupas lavadas sejam deixadas no móvel para serem posteriormente passadas, ou que depois de passadas sejam deixadas no sofá para serem guardadas. Muitas pessoas também costumam deixar bolsas, casacos e outros itens no sofá ao entrar em casa, voltando para guardá-los depois. É comum situar o telefone ao lado do sofá (como pode ser observado nas plantas mostradas anteriormente), ou mesmo haver um “sofá do telefone” na casa, utilizado apenas para realizar e receber ligações. Isso se dá mesmo em residências em que os telefones fixos são sem fio ou foram substituídos por telefones celulares. 3.1.3. Modos de sentar e lugares
Notam-se diferenças quanto ao modo de sentar ou mesmo o lugar escolhido no sofá quando a pessoa está sozinha ou em grupo, variando também em função da situação. Quando estão sozinhas, as pessoas ficam mais à vontade, permitindo-se até ter “maus modos”, fazendo coisas que reprovariam em outras, como deitar-se com os pés sobre o estofado. Muitos participantes declaram não admitir que familiares ou visitas coloquem os pés sobre o sofá, pulem, “façam bagunça” ou se sentem no braço do sofá, mas essas declarações são contraditórias, já que as mesmas pessoas admitem em outros momentos das entrevistas que gostam de se deitar “à vontade” no sofá para descansar. Na dinâmica familiar é comum que cada pessoa tenha o seu lugar, que muitas vezes não é o mesmo em que se sentariam sozinhas, já que o “melhor lugar” em geral é o mesmo para vários moradores da casa, sendo com frequência o lugar de melhor visibilidade da televisão. Aparatos como bancos para apoiar os pés se tornam mais necessários quando as pessoas se sentam em grupo, situações em que é preciso se apertar para que todos caibam. Em ocasiões especiais como festas de família é comum não caberem todos os presentes no sofá, que então torna-se um local privilegiado – para uso dos mais velhos, por exemplo. 3.1.4. Compra e transporte
No momento da compra, é mais comum a pessoa saber a cor que procura, ou ter em mente características como resistência e durabilidade, do que o modelo específico – que é decidido na hora. em função dos outros critérios. Entre os participantes do grupo I, o preço e as condições de pagamento são os principais fatores determinantes da escolha da loja e do modelo. Já no grupo II, o modelo é escolhido principalmente de acordo com a estética, para combinar com a decoração do cômodo ou pelo conforto. Em relação a este último critério, muitos participantes relatam ser difícil certificar-se de ter encontrado o móvel “certo”, já que não é possível sentar-se ou deitar-se no sofá no local da compra da mesma forma que se faria em casa ou por
261
tempo suficiente para testar de fato o conforto do móvel. Em geral a entrega não é apontada como uma dificuldade para os participantes, mesmo em casos relatados por moradores de comunidades carentes, onde o acesso às residências é mais difícil e requer manobras como passar o móvel pela casa de algum vizinho. Dentre os moradores de condomínios, a maioria relata que o sofá chegou pelo elevador, às vezes sendo necessário retirar os pés para passá-lo pela porta. 3.1.5. Funções abandonadas
Os sofás novos são mais bem cuidados; à medida que o sofá fica velho, as pessoas se sentem mais à vontade no modo de usá-lo. Mudanças na vida pessoal (rotina, família) também transformam os usos. Uma das participantes relata que se sentava no sofá com o marido para assistir à televisão enquanto o filho brincava no chão, portanto o móvel representava o centro da vida familiar. Hoje, divorciada e com o filho crescido, ela utiliza o sofá como local de trabalho para costurar seus bonecos de pano. “A vida da gente vai mudando e a função do sofá muda junto.” 3.1.6. Problemas encontrados no uso e modificações desejadas
Apesar de reconhecerem defeitos, as pessoas em geral gostam mais do próprio sofá do que de outros, por isso declaram que preferem reformar o que têm a comprar um novo. Entretanto, o custo da reforma às vezes não é considerado compensador, sendo mais barato desfazer-se do sofá velho e adquirir outro. Costuma-se fazer o descarte por meio de doações para conhecidos ou mesmo abandonando-se o móvel na rua. Há problemas ergonômicos, como a profundidade e a altura do assento, que são parcialmente solucionados com o uso de almofadas. As almofadas completam o sofá, adaptando-o aos diversos usos. Como apoio para as costas, permitem sentar-se ereto e reduzem a profundidade do assento. No colo, servem para apoiar o prato de comida. Podem também aumentar a altura do braço ou torná-lo mais confortável, se for muito duro.
cognitivo e PrEmo. Cada uma delas revelou insights sobre a atividade em si e sobre o tema do estudo. 3.2.1 Tour guiado
O tour, realizado com um integrante de cada grupo, foi dificultado pela inibição dos participantes diante dos vendedores das lojas. As pessoas não formularam claramente suas opiniões sobre os objetos vistos e testados, principalmente quando eram negativas. A cor e o modelo parecem ser o primeiro critério para que a pessoa seja ou não atraída pelo sofá. Se essas características a agradam, ela se senta e toca o sofá para testar o conforto. O preço, mesmo sendo o que define a compra (ou a não compra) em algumas situações, é o último critério considerado, depois que a opinião sobre o sofá já está formada. 3.2.2. Métodos crie: mapeamento cognitivo, colagem e card sort
Na realização do mapeamento cognitivo, os participantes foram solicitados a representar um “mapa” do sofá que possuem. Os resultados variam entre a representação do sofá atualmente, com a descrição de características positivas e de problemas, e a representação do sofá em momentos diversos, desde sua aquisição. Já nas colagens e no card sort, a instrução dada foi a de utilizar as imagens para falar sobre o sofá dos sonhos, o sofá ideal, sem considerar restrições financeiras, de espaço disponível ou mesmo relativas a materiais etc. Em geral, os participantes do grupo I tiveram mais dificuldade de abstração para realizar a colagem e o mapeamento do que os do grupo II, falando mais da experiência presente e de associações das imagens com experiências passadas do que de experiências ideais desejadas.
Foram realizadas atividades complementares às entrevistas de cinco tipos: tour guiado, colagem, card sort, mapeamento
Nas primeiras entrevistas em que foram utilizadas as imagens selecionadas para o card sort e a colagem, notou-se que os métodos se mesclam. Por um lado, as pessoas às quais foi solicitado realizar uma colagem tenderam a comentar cada imagem, não se preocupando com as relações entre as imagens distribuídas no campo, ou seja, não fizeram composições com as imagens. Já aqueles a quem foi solicitado realizar o card sort simplesmente foram selecionando e comentando as imagens que evocavam memórias ou sonhos, sem organizá-las em uma sequência. Considerando que a colagem facilitava o registro da atividade por induzir o participante a dispor as imagens selecionadas sobre o fundo branco, mesmo sem realizar uma composição, os participantes seguintes foram solicitados a fazer colagens em vez do card sort. No mapeamento cognitivo o
Figura 7: Participantes do grupo I realizam e comentam card sort e mapeamento cognitivo, respectivamente.
Figura 8: Participantes do grupo II realizam e comentam mapeamento cognitivo e colagem, respectivamente.
Vários participantes, principalmente casais, declaram que gostariam que o sofá fosse mais apropriado para duas pessoas se deitarem juntas ao assistir à televisão ou para descansar e dormir. 3.2. Insights das atividades complementares
262
Figura 6: Alguns dos mapeamentos cognitivos e colagens realizados por participantes de ambos os grupos.
campo foi mais explorado para a criação de narrativas, sendo a composição muito importante para que o participante transmitisse seus conceitos. Um aspecto interessante da utilização das imagens nas colagens foi a observação das diversas interpretações de um mesmo estímulo por diferentes observadores. Por exemplo, uma imagem que fora selecionada pelos pesquisadores para a atividade a partir do conceito “sensualidade”, por mostrar as pernas de uma mulher em roupas íntimas, foi selecionada por uma das participantes para ilustrar a ideia de que seu sofá ideal deveria permitir ficar à vontade. 3.2.3. PrEmo, Product Emotion Measurement.
O experimento do PrEmo foi aplicado em dez participantes, cinco de cada um dos grupos. Alguns participantes dessa atividade também foram entrevistados, mas outros responderam apenas a esse experimento. A ferramenta funciona da seguinte
Figura 9: Personagens das animações do PrEmo, representando as 12 emoções do sistema.
forma: o experimento é preparado pelo pesquisador, que deve selecionar os estímulos visuais que serão avaliados pelos participantes. Para esta pesquisa, foram selecionadas imagens de dez sofás, variando em preço, modelo, cor e material. A avaliação dos estímulos se dá a partir de doze personagens animados, seis deles representando emoções positivas – desejo, satisfação, orgulho, esperança, alegria e fascinação – e seis, emoções negativas – repulsa, insatisfação, vergonha, medo, tristeza e tédio. Os participantes devem então declarar, em relação cada animação, em que grau sentem a emoção representada. Essa gradação é feita dando-se uma “nota” em uma escala de 0 a 4 para cada emoção em relação ao sofá apresentado. O procedimento é repetido para cada estímulo. Os participantes tiveram acesso ao sistema pela internet. Todos os participantes do grupo I que realizaram o experimento receberam instruções dos pesquisadores presencialmente, sendo que muitos deles tinham pouca ou nenhuma familiaridade com o uso do computador. Já os participantes do grupo II realizaram o experimento seguindo apenas as instruções do sistema. Isso se deu em função da menor disponibilidade de tempo dos participantes do grupo II, que não puderam realizar o experimento em sequência à entrevista contextual, como fizeram os do grupo I. Ao iniciar o experimento, os participantes tinham acesso a uma introdução que os ensinava a interagir com as animações e explicava a lógica do sistema, demonstrando como classificar as emoções em relação aos estímulos. Em seguida o experimento era iniciado e deveria ser completado em um único acesso, durando em média vinte minutos. A utilização do PrEmo revela insights interessantes a respeito de padrões de comportamento entre os participantes e das preferências específicas de cada grupo.
263
Tabela 1: Anรกlise dos dados das respostas dos participantes ao PrEmo.
264
Para a análise dos resultados do experimento, foi montada uma tabela (Tabela 1) que reúne as respostas de todos os participantes, separadas por grupo, constando médias das emoções positivas e das negativas para cada estímulo. De acordo com os desenvolvedores do sistema, cada animação representa uma emoção, tendo sido os termos traduzidos do inglês durante a realização deste estudo, mas vale ressalvar que os participantes não tiveram nenhum contato com tais nomenclaturas, que servem apenas para os procedimentos de análise. Em ambos os grupos observa-se que alguns dos participantes classificam as emoções de forma bastante polarizada. É comum por exemplo, classificarem com nota 4 todas as animações que representam emoções positivas e com nota 0 todas as que representam emoções negativas em relação a determinado estímulo. Tal comportamento sugere uma dificuldade no entendimento ou na adesão à ferramenta por parte desses participantes, já que um dos objetivos do sistema é indicar qual emoção cada estímulo suscita, e não apenas revelar preferências do tipo “gosto” ou “não gosto”. Esse comportamento pode ser observado muito claramente em dois dos participantes do grupo I e de forma mais sutil em outro participante do mesmo grupo e em um participante do grupo II. Outros participantes apresentam um comportamento curioso, oposto ao descrito anteriormente, dando notas altas e baixas para emoções positivas e negativas em relação a um mesmo estímulo, não permitindo avaliar se o sofá apresentado os agrada ou não, visto que suas respostas são contraditórias (exemplo: um participante declara sentir ao mesmo tempo o nível máximo de desejo e de repulsa). Esse comportamento também aparece com mais frequência no grupo I. Observa-se que os participantes do grupo I deram mais notas altas, em relação tanto às emoções positivas quanto às negativas. Assim, as médias das respostas são quase sempre mais altas no grupo I. Já no grupo II as classificações são mais baixas, seja para as emoções positivas ou negativas. A incidência de notas 0 é muito maior no grupo II do que no grupo I, chegando a ocorrer um caso em que todos os participantes classificaram com nota 0 todas as emoções negativas em relação a determinado estímulo. Esse é o caso do sofá 2, um sofá de canto com seis a oito lugares, que foi o preferido em ambos os grupos. Esse sofá recebeu notas muito altas em relação às emoções positivas, ficando com média 3,37 no grupo I – onde há uma incidência muito alta de notas 4 – e 2,3 no grupo II. Em relação às emoções negativas, apenas um participante deu notas diferentes de 0, o que resultou na média 0,45 no grupo I e na média 0 no grupo II. As emoções positivas que obtiveram notas mais altas em relação a esse estímulo diferem dentre os grupos, tendo sido alegria e fascinação no grupo I e satisfação no grupo II. Ao observar os sofás que suscitaram respostas mais negativas (médias positivas baixas e negativas altas) em cada grupo, verificam-se situações curiosas. O sofá 8 foi o que mais desagradou ao grupo I, recebendo respostas às emoções positivas que resul-
taram na média 0,33 e às emoções positivas, 2,95. Já no grupo II, esse sofá causou uma resposta positiva dos participantes, obtendo média 1,36 nas respostas positivas e 0,46 nas negativas. O sofá 10, que mais desagradou ao grupo II, obteve respostas positivas no grupo I. No grupo II todos os participantes deram nota 0 às emoções positivas e a média das emoções negativas foi de 2,04. No grupo I, o mesmo móvel recebeu média 2,08 para as emoções positivas contra 1,58 para as negativas. Todas as notas e médias aqui comentadas podem ser observadas em mais detalhe na tabela de análise de dados das respostas dos participantes ao PrEmo apresentada anteriormente. 3.2.4. Diário de registro de atividades e emoções
No contato com os primeiros participantes da pesquisa, parte deles foi solicitada a produzir um diário do sofá, registrando durante o período de uma semana anterior ao encontro com os pesquisadores as atividades realizadas no sofá e emoções relacionadas a esses momentos. Apenas uma participante dos cinco solicitados produziu esse diário. O registro é muito preciso, mostrando horários e a descrição de todas as atividades realizadas, incluindo impressões subjetivas sobre o sofá. No início da entrevista contextual com essa participante, ela comentou as anotações e muitas das observações registradas foram recorrentes durante a entrevista, confirmando que o diário é uma técnica útil para preparar o entrevistado, fazendo-o prestar mais atenção na questão estudada. Infelizmente, os demais participantes solicitados a produzir o diário não o fizeram por esquecimento ou por falta de tempo, o que sugere que o sucesso do método requer algum estímulo capaz de motivar o participante a colaborar, podendo ser um incentivo financeiro, um presente ou um mecanismo de status como a publicação da pesquisa em alguma mídia. Outra dificuldade encontrada na realização dos diários foi o fato de que muitas entrevistas não foram marcadas com a devida antecedência. Chegaram a ocorrer casos de indicação de participantes no momento da entrevista, por exemplo, quando os pesquisadores estavam na casa de uma família do grupo I e a participante apresentou uma vizinha que aceitou participar da pesquisa no mesmo momento. Também foram frequentes remarcações por pedido dos participantes. 4. CONCLUSÕES
O levantamento de métodos de sondagem de usuários aqui apresentado poderá ser utilizado como referência para o desenvolvimento de projetos no âmbito do design atitudinal. A metodologia adotada na pesquisa “Inovação familiar” serve como referência para o desenvolvimento de trabalhos similares. Os resultados da pesquisa levam a conclusões interessantes em relação aos usos e significados do sofá pelos dois grupos de participantes. No grupo I, de poder aquisitivo mais baixo, o sofá é um item importantíssimo no dia a dia de quase todos os entrevistados, concentrando grande parte das atividades domésticas e representando uma espécie de núcleo para o lazer doméstico
265
e também representando o descanso, o “estar em casa”. Apesar de possuírem em geral modelos simples do móvel em suas residências, grande parte dos participantes desse grupo tende a exaltar as qualidades do sofá, parecendo atribuir ao objeto os méritos pelos bons momentos nele vividos. Os participantes do grupo II, de poder aquisitivo mais alto, também consideram o sofá um item importante, mas principalmente por questões estéticas e convenções a respeito do conceito de sala de estar e das atividades relacionadas a este cômodo, como a recepção de visitas, e não em razão do uso real do objeto em seu cotidiano. Nesse grupo os participantes mostraram-se mais críticos em relação ao objeto, fazendo muitas ressalvas à qualidade dos materiais e à adequação ergonômica dos móveis, queixando-se de dificuldades com a limpeza ou de desconforto ao sentar-se e deitar-se, e considerando praticamente impossível encontrar um sofá ideal ou perfeito. Verificam-se também diferenças em relação aos modelos preferidos, como revelam alguns resultados do experimento do PrEmo. Essas diferenças de perspectivas são muito significativas no que diz respeito aos perfis de consumidor encontrados nesses grupos. Foram observadas também semelhanças entre os grupos no que diz respeito a alguns usos do sofá. Esse móvel assume funções domésticas tais como servir de espaço para refeições e para depósito temporário de objetos, como bolsas e roupas. Além disso, notou-se claramente na grande maioria das entrevistas realizadas que a localização do sofá está condicionada ao posicionamento da televisão, assim como o telefone localiza-se em função do sofá. O hábito de dormir no sofá – seja em pequenos períodos durante o dia, seja durante toda a noite – é crescente e também relaciona-se ao uso da televisão. Tais usos sugerem que sejam pensadas novas configurações do móvel, mais adequadas a eles. O fato de um mesmo sofá ter sido preferido pelos dois grupos indica que o modelo de sofá de canto é muito atrativo, representando um objeto de desejo inatingível para muitos dos participantes, pois, além de ser um modelo mais caro que os outros, requer disponibilidade de espaço, o que a maioria das salas de estar não oferece. Também é válido apontar algumas conclusões em relação aos métodos aplicados. Constatou-se grande diferença de postura dos participantes de cada grupo em relação aos métodos. Os do grupo I demonstraram maior disponibilidade para receber os pesquisadores e as entrevistas nesse grupo foram mais longas e ricas. No entanto, esses participantes demonstraram maior dificuldade em realizar algumas das atividades complementares, principalmente aquelas que requeriam maior abstração e criatividade, mostrando-se retraídos ou confusos diante das atividades propostas. Em ambos os grupos a adesão ao método do diário foi baixíssima, o que indica a necessidade de uma abordagem que engaje os participantes e garanta seu comprometimento com a atividade. Os insights encontrados na aplicação dos métodos abre a discussão a respeito de sua aplicação em diferentes realidades socioeconômicas brasileiras, sugerindo que sejam adaptados aos comportamentos e necessidades de diversos grupos de nossa população.
5. DESDOBRAMENTOS
O presente estudo deu origem a oficinas sobre inovação e métodos de sondagem de usuários, realizadas pela bolsista da pesquisa com colaboradores de outras instituições em encontros organizados por estudantes de design brasileiros durante o ano de 2009. As duas primeiras oficinas tiveram quatro horas de duração, tendo sido a primeira uma atividade teórica a respeito de métodos de sondagem de usuários e a segunda de caráter teórico-prático, sobre o mesmo tema. A terceira oficina foi realizada como primeiro módulo de uma atividade teórico-prática de doze horas de duração, que também contou com atividades tratando de criatividade e sustentabilidade. No total, as três oficinas envolveram mais de quarenta estudantes de design de diversas habilitações e em diferentes momentos do curso, provenientes de variadas regiões do país. A bolsista colaborou ainda com uma disciplina de projeto de produto, ministrada pela orientadora da pesquisa, realizando apresentações acerca dos métodos de sondagem levantados na primeira etapa do estudo, contribuindo para a realização de sondagens pelos próprios estudantes da disciplina, para o desenvolvimento de projetos de sofás. Outro resultado positivo da pesquisa que vale ser ressaltado é o fato de que o contato com Pieter Desmet, da universidade holandesa TU Delft, e com a empresa SusaGroup para negociação do uso do PrEmo foi uma iniciativa que pode abrir caminho para um estreitamento de relações entre essas instituições e a nossa ou outras instituições de ensino e pesquisa em design no Brasil. 6. REFERÊNCIAS BIBLIOGRÁFICAS
DAEDALUSEXCEL e THOUGHTFORM INC. Research Toolbox, 2005. Disponível em: http://daed.com/ResearchToolbox.pdf (último acesso: 1/4/2009). DESMET, P.M.A., HEKKERT, P. e HILLEN, M.G. Values and emotions; an empirical investigation in the relationship between emotional responses to products and human values. In: Proceedings of the fifth European academy of design conference. Disponível em: http://static.studiolab.io.tudelft.nl/gems/ desmet/papervaluesemotion.pdf (último acesso: 1/4/2009). DJAJADININGRAT, J.P.; OVERBEEKE, C.J.; WENSEVEEN, S.A.G. Touch Me, Hit Me and I Know How You Feel: A Design Approach to Emotionally Rich Interaction. New York: ACM, 2000. GAVER, W.; DUNNE, T.; PANCETI, E. Cultural Probes. In: Interactions. Danvers: ACM, 1999. p. 21-29. GOULART, C.; NIEMEYER, L. Métodos de sondagem de usuários na pesquisa A inovação familiar. In: Anais do 5o Congresso internacional de pesquisa em design. Bauru: CIPED, 2009. MATTELMÄKI, T.; BATTARBEE, K. Empathy Probes. In: Proceedings of PDC2002. Malmö, 2002 NIEMEYER, L. Design Atitudinal: uma abordagem projetual. In: G.C. Lima (org.) Textos selecionados de design. Rio de Janeiro: PPDESDI UERJ, 2006.
266
SANDERS, E.B.N. Generative Tools for CoDesigning. In: Ball and Woodcock (Eds.) Collaborative Design. New York: Springer-Verlag London Limited, 2000. SANDERS, E.B.N.; WILLIAM, C.T. Harnessing People’s Creativity: Ideation and Expression through Visual Communication. In: Langford J. e McDonagh-Philp D. (Eds.) Focus Groups: Supporting Effective Product Development. Taylor and Francis, 2001.
THE CENTER FOR QUALITY OF MANAGEMENT, INC. Kano’s Methods for Understanding Customer-defined Quality. In: Center for Quality of Management Journal, 1999. Disponível em: http://www.walden-family.com/public/cqm-journal/24-Whole-Issue.pdf (último acesso: 1/4/2009) VAN HOUT, M. Interactive Products and User Emotions. Dissertação de mestrado. Twente, 2004.
267
usabilidade a solução está no usuário
268
M-Cube: A Visualization Tool for Multi-dimensional Multimedia Databases André Maximo COPPE/UFRJ andmax@cos.ufrj.br
Maria Paula Saba ESDI/UERJ msaba@esdi.uerj.br
ABSTRACT
The last decade was marked by a striking growth on database size and dimension. This increase is noticeable in many areas, ranging from personal data storage to large corporation databases. The size and high dimensionality of these data sets prompt the application of specialized graphical representations rather than tables and generic charts to visualize the data. This specialization limits the representation to a particular type of database, but ensures a better understanding of its data. In this paper, we present an innovative visualization tool for multi-dimensional multimedia databases, called Multidimensional Cube (or M-Cube). Unlike previous data cubes, which are simple extensions of two-dimensional tables or charts for any type of data, the M-Cube employs a three-dimensional space to visualize multimedia content with great interaction flexibility – the user can change any of the current dimensions by rotation. Our tool is specialized for multimedia contents, that is, text, music, images and videos, allowing the M-Cube to improve both visually and interactively. While the visualization is enhanced by visually rich data elements inside the cube, the interaction provides fast change of dimensions required when exploring multimedia databases. Author Keywords
HCI, Visualization Tool, Interaction, Multi-dimensional Database, Information Design. ACM Classification Keywords
H.5.2 [HCI] User Interfaces: Graphical user interfaces; Input devices and strategies.
Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. IxDA-SP and Interaction South America 2009, November 26–28, 2009, São Paulo, SP, Brazil. Copyright 2009 ACM 978-1-60558-246-7/09/04...$5.00.
Luiz Velho IMPA lvelho@impa.br
INTRODUCTION
In the last decade, we witnessed a fast growing in digital data supported by a constant increase in data storage devices as well as larger communication bandwidths. This striking growth appears not only on the size of databases but also on the number of attributes classifying the raw data. The data attributes, or metadata, decompose the corresponding data set in dimensions, playing an important role on both fronts: large data sets visualization and querying. The complexity behind these tasks lies on humancomputer interfaces (HCI) to employ metadata in a meaningful and consistent way. In this work, we explore both visualization and HCI to build an innovative tool to deal with multi-dimensional multimedia databases. The visualization activity on databases aids the creation of queries which, in turn, work to produce better visualizations. This recurring process aims to extract significant information from a data set. It has in principle an exploratory context, where the user interacts with the data set searching for a specific content or, conversely, the user wishes to analyze the data in a more generic form. The most common techniques employ relational tables and textual languages in order to carry out these interactions, that is, establish visualization and query, respectively. The result is a poor visualization with difficult interaction, as can be seen in Figure 1. One of the features which make large database visualization especially challenging is its inherent high dimensionality. Interesting enough, the n-dimensions can be used to avail the visualization itself by means of data classification. The classification is done by projecting data elements in each dimension, which leads to an n-dimensional chart, where n is the number of attributes or database dimensions. For instance, a simple database with 3 attributes could be plotted in a 3-d chart. The chart presents a better database visualization than the table, depending on the data visualized and the exploration process.
269
Rotation – the cube can be rotated for a better view of the data or to change the current dimensions, similar to change pivots in pivot tables; Selection – parts of the cube edges can be chosen in order to narrow the current view or produce a new visualization, working as queries in the recursive process of exploration; Zooming – regions inside the cube can be magnified for a proper view of the data, allowing to change fast from a generic analyze to a more specific one.
Figure 1: Example of a query textual language (upper box) and a table relating office supplies with different client types.
The type of data is an important aspect to analyze when building a database visualization tool. However, the majority of interfaces available ignore the data type, leading to an inadequate visualization. Examples of such interfaces include: table with numbers (see Figure 1) [6], discretized or aggregated; graphs with bar charts, such as histograms [6]; scatter plots with icons or glyphs, varying in color, size, etc. [12]; data cubes [13]; and so on. A usual problem arises when dealing with complex types of data, for instance media data are poorly visualized with generic tools [1]. In this paper, we are interested in visualizing multimedia data inside a relational multi-dimensional database. One tool often employed in multi-dimensional database visualizations is a dynamic table with numbers in cells, called Pivot Table [6]. These tables can be organized in data cubes, as shown in Figure 2, where each dimension of the relational database can be rotated, or pivoted. Once the pivots are set in rows and columns of the table, the dimensions left are aggregated and the results are shown as numbers or plotted as graphs. One advantage of tables over graphs is the freedom to apply a desirable order to the data, while charts present data in a fixed sequence, depending on the dimension. Nevertheless, the common desirable order is intrinsic to the dimension and thus respected by the chart. The interaction on pivot tables and data cubes fails to grant the user easy ways to change pivots and make different views of the database quickly. The problem is that it is based on a limited visualization of the data set – relational tables – in order to be generic enough to deal with any type of data. This limitation leads to difficult ways to change pivots, e.g. typing or drag-and-drop dimensions, and both visualization and interaction become compromised. In this paper, we present the Multi-dimensional Cube, 3 dubbed M-Cube (or M ), a visualization tool for multidimensional multimedia databases. M-Cube extends the data cube representation by offering a three-dimensional space to visualize and explore multimedia data. In addition to normal actions, such as opening a media data, the MCube allows three new interactions:
Figure 2: Example of data cube visualization.
M-Cube also employs innovative database visualization, taking advantage of the specialized data type. The data elements inside the cube are displayed representing its type and hinting its content, for example, an image data set is displayed with each data element as the actual picture inside a frame. Other visual improvement appears when grouping or aggregating data elements, different media objects can be grouped making a new object, for instance several music tracks could be aggregated to a song album. Note, however, these improvements can only be achieved with specialization of our visualization tool to one type of data: multimedia content. The visualization and HCI of the M-Cube are simple and intuitive. The user employs natural actions to interact with the M-Cube interface and have a meaningful and rich graphical response from the visualization. This helps the interaction and the overall exploratory process. M-Cube can be used to analyze a complete multimedia database as well as browse its data searching for a specific content. The remainder of this paper is organized as follows. In the related work section we discuss previous work on database visualization and interaction techniques. Next, we describe the design principles behind our tool. While, in the following sections we present the M-Cube and its results. Finally, in the last section we conclude providing several future work directions.
270
RELATED WORK
The area of multi-dimensional database visualization receives special attention in both ventures: commercial products and research studies. One example on commercial trends is the Excel™ application [6] from Microsoft™. This application employs pivot tables with different projections of large multi-dimensional databases. Each projection defines a new dimension, or pivot, for a row or column of the table. The interaction is made by text-based fields forcing the user to enter new pivots by typing, making the interface difficult to use. Another example on commercial trends is the Spotfire® application [8]. This application from TIBCO® targets to allow interactive analysis of multi-dimensional data. In the Spotfire®, users can organize data in pages containing a set of restricted visualizations, such as descriptive text areas, details-on-demand and filtering panes. The limitation on visualization drives the user to follow a particular path of data exploration without freedom. One example on research ventures is the Multi-dimensional Data Viewer [10]. This application maps visual objects in a 3D space to a final image by projecting the 3D scatter plot accordingly to a given point-of-view. Users can interact with the plot by rotation, changing the point-of-view and thus the final image. The data elements are displayed as glyphs, which have different visual features (such as size and color), creating layers of representation on top of data types. These layers make the real meaning of the data difficult to distinguish. Another problem arises when trying to choose a good point-of-view; the user may get the wrong data multiple times in the final image. Another application based in scatter plot graphics is the Scatterdice [3]. In this application, users can explore information in a matrix of 2D scatter plots and browse the data in a structured multi-dimensional space. It uses 3D animation to navigate among plots, and apply bounding volumes to create queries, allowing the user to explore the database by clipping the plots. Dimensions in navigation space are reordered to highlight correlations and differences among them. The main disadvantage of this approach is a confusing visualization due to many different scatter plots on the same view. The Dynamic Homefinder application [16] employs an alternative way of interaction. It provides database searching using a more direct manipulation, called dynamic queries. This type of query is made by interactively adjust graphical widgets, such as sliders, to produce better visualizations. It is interesting to note that even though the HCI of the Dynamic Homefinder is inadequate, this dynamic technique is applied nowadays as a standard form of interaction, and it is used in data cubes and in our visualization tool. The Polaris system [12] presents an interface for exploring large multi-dimensional databases. Polaris is based on the construction of table-based graphical displays through
consecutive queries. It also exploits traditional 2D charts adding to them an algebraic formalism based in Bertin’s graphical properties [2]. Users can choose among basic visual principles for data visualization. At this point, the HCI of the system suffers with drag-and-drop widgets, while the visualization is limited by two-dimensional tables and charts. Stolte et al. [13] describe a multiscale visualization of data cubes, building it on top of their Polaris formalism. They apply data and visual abstraction in a general mechanism in order to deal with many types of data sets. The multiscale feature is combined with independent zooming at different scales along one or more dimensions. As the Polaris system, it is based on tables and data cubes yielding to a poor visualization and ineffective HCI. The zooming interaction of the M-Cube is also explored by two consecutive works; Magic Lens [14] and 3D Magic Lens [15]. They use the concept of a magnifying glass to distinguish data objects packed together in a small space. This interaction, in 2D or 3D, is important when dealing with large databases, where there are more regions with many data elements making the visualization difficult. Our M-Cube addresses the problem of large database visualization by using a zooming interaction, as described in the M-Cube section. One interesting mathematical technique used to improve multi-dimensional database visualization and interaction is the dimensionality reduction. Hypercell [9] describes a filtering approach to reduce a database dimension and achieve a simplified interface. It provides tools for extraction of subspaces, called cells, from the original database, reducing the overall complexity and organizing filtered cells as workspaces. Other mathematical-based effort is the Wolfram Alpha [17] system, by applying builtin algorithms it allows computational queries to be done on a huge data collection. In this paper, we use the idea of dimensionality reduction but in an interface driven way, improving it with a fast switch of current dimensions. Filter Flow [7] explores a visual query language to provide a simple interface through the usage of images. It uses pictorial icons in the visualization and applies filter operators as the result of queries. The visual query paradigm is also explored in this work, and filtering is achieved by combining one or more selections in a certain view with changing of dimensions and others selections in different views. An important commercial trend is the iTunes™ [1] from Apple™, which implements a table-based interaction to deal with a multi-dimensional music database. Even though it is a personal database, interaction and visualization are compromised by an arduous interface, where the user has to fill attributes in non-intuitive windows. The software tries to evade this problem by offering an artificial intelligence tool to manage the database for the user, going in a complete opposite direction of an effective HCI.
271
DESIGN PRINCIPLES
In this section, we present conceptual ideas for the development of the M-Cube: a visualization tool for multidimensional multimedia databases. M-Cube employs a 3D space, which is more natural and richer than a 2D table, outlined by the edges of a cube. The data elements are projected into this space, as normally done in a three-dimensional scatter plot. The projection result is a floating 3D object inside the cube. The tool allows a natural rotation of the space, as it was a real cube, in order to better visualize the data objects. The M-Cube also allows, in the same rotation interface, the switching of the current three dimensions being used to project the data. The user chooses a side dimension, i.e. an attribute not in use, in a preferred axis, rotates the cube with it and the axis become the chosen dimension changing the visualization instantly. For example, the user may choose the theme attribute in the year axis, shown in Figure 3, rotate the cube from right to left switching the current view to become location, artist and theme.
Data elements are normally displayed as glyphs, i.e. objects with different shapes and colors, without any meaning related to the data. For example, the Polaris system [12] allows the user to choose among geometric shapes, such as triangles and circles, to represent data elements, such as cities and states. In the M-Cube shown in Figure 3, we display image elements as boxes with different colors, where each color corresponds to an image file type. On the other hand, the glyph sizes are proportional to the image file size. Moreover, we add a preview visualization of the image inside each box, discussed in the next section, improving the meaning of the data glyph. The visual aspects of the glyphs add more dimensions to the original three-dimensional M-Cube. For instance, the image file type and size are encoded to glyph colors and box sizes in Figure 3, adding two new attributes to the visualization. In this example, the M-Cube has 5 dimensions: location, artist and year in the three axes; plus image type and size. In addition to viewing rotation and switching of dimensions by touch gestures in the M-Cube, we have two other interaction gestures: zooming and filtering. For these two gestures, it is important to have a multitouch interface, where the touchable screen can recognize more than one touch. In the case of zooming, the user touches with two fingers determining a region of zoom, and pinch the fingers together to zoom in or reverse pinch to zoom out. While filtering, or selection, is done by touching with one or two fingers in each axis, determining a specific attribute value or a range of values between the fingers to make selections on the database. The HCI gestures will be explained in more details in the next section. The M-Cube is a new interface in both visualization and interaction aspects. It presents a clean interface, so it won’t compete with database information, with natural and intuitive interaction. Moreover, the M-Cube features are better achieved when using a high quality screen with multitouch interaction. M-CUBE 3
Figure 3: A design example of the M-Cube, the current media is images represented by two boxes on the top left corner of the interface.
The action of choosing in the M-Cube can be accomplished by mouse clicking or using a touchable interface. The latter is better than the former, in the case of the M-Cube, since the gesture related to change pivots, or dimensions, is more natural and intuitive; the user chooses a side dimension by touch and rotates the cube while touching it. On the other hand, the user has the option to touch any region inside the cube (excluding axes and border labels) and apply a gesture to rotate the cube without changing dimensions.
The M – Multi-dimensional Cube (or M-Cube) – is designed for multimedia databases, providing visualization and interaction in a novel way. There are four types of media: text, music, image, and video. Figure 4 illustrates one M-Cube example for each type of media. The icons on the top left corner of each example show the four media types with the current one bigger than the others. The user can change the current displayed type by choosing one of these four icons. Note that each media type has different associated attributes on the axes. For instance, images and texts are static media, lacking the time duration dimension of music and videos.
272
static values, the user wants to see and analyze the data but not interact with it. Examples of these types of visualization and interaction can be seen in Figure 1 and 2. There are many interfaces to handle multimedia data. Operating systems, such as Microsoftâ&#x201E;˘ Windows and Appleâ&#x201E;˘ OS X, exhibit multimedia content in file browsers, organizing the data in tables and relying in different applications to preview and open media. M-Cube introduces a unified interface to both interactions and for any type of media. The visualization is more natural and intuitive than tables showing data elements in rows and attributes in columns. In the M-Cube interface, the attributes are presented on three axes and the data elements are floating objects inside the cube. The attributes, or dimensions, on each axis have different types of values. For example, the artist attribute have name strings as values, while the date of creation attribute is identified by dates. Attributes may also have different scales for values. For instance, the date of creation of a media data can be expressed in days, weeks, months, etc. Figure 4: The four types of media: music, text, image and video, from top to bottom and left to right.
The data elements illustrated in Figure 4 are displayed using the same glyph object regardless of the media type. However, depending on the current type, each element has a different border and preview image inside the glyph. For instance, image glyphs have a picture frame and an image preview inside, while video glyphs have a movie style border and a short sequence of the video inside. In the examples shown in this section, we use the same glyph objects as a design representation of any multimedia element. Nevertheless, the final glyph objects for music and 3 images can be seen in the M prototype explained in the next section.
M-Cube interface allows the user to choose the scale of any dimension having more than one scale. Figure 6 illustrates an M-Cube for images where the user can choose a more refined view for the date axis or a coarser one. The option appears in the form of a plus and minus sign when the user touches the current dimension. These options allow the user to increment, or decrement, the attribute resolution and the M-Cube visualization changes accordingly.
In the case of a music database, we add an audio representation to the glyphs besides the retinal properties, such as color and shape. The preview audio plays when the user interacts with a particular data element, and stops playing when leaving that element. This interaction is different from the opening action, where the user wants to play or look at the entire content of the media data. While the preview interaction is done by touching the element once, the opening action is done by touching it twice. The action of opening a video data element using the MCube is illustrated in Figure 5. The user navigates through the video database, changing dimensions and making filters, until a particular video is found (the white box in the middle). The user chooses to open this video, by double touching it, and the video starts playing.
Figure 5: The action of opening a multimedia data element in a video database.
Opening and previewing elements are important actions when dealing with rich and complex content, such as multimedia. In the case where data means quantities or
273
Using the same rotation gesture, the user can change dimensions. M-Cube interface allows the user to touch one of the side dimensions, such as color and theme in Figure 6, in a preferred axis and, by rotating the cube while touching the side dimension, the current dimensions change. This interaction makes database exploration easy, since the user rotates the cube to better visualize the current M-Cube and also rotates the cube to change dimensions.
Figure 6: The action of choosing from different scales of the date of creation attribute in an image database.
A key feature of using a cube representation to the space is the ability to rotate naturally the space in order to better visualize the data elements. Figure 7 exemplifies a rotation interaction with an M-Cube for text media. The user can manipulate the cube in any direction, making it display the database in preferred faces or transforming the cube into a 2D scatter plot by making one face aligned to the view, as can be seen in the top right corner of Figure 7. The rotation is done by touching any part of the space and gesturing the desired direction to rotate. Note the bottom two M-Cubes in Figure 7, when the user rotates the cube more than a certain angle, making one face more emphasized, the axes change to adapt to this new configuration.
Another important feature of our representation is the selection of attributes by choosing one or more axes to reduce the database visualization. The values on axes can be chosen by intervals or single values. For example, Figure 8 shows two selections, in the first one value is chosen on the year dimension (top), and then an interval is chosen on the same dimension (bottom). Each time a selection is made a slice of the M-Cube is created with the elements of the corresponding selection (two cube slices in the middle). The slices are combined forming a selection query, as shown in the right side of Figure 8.
Figure 8: The action of selecting attribute values in axes reduces the M-Cube visualization.
The selection action is used to find a particular data element or to make s subset of the database. In the former, the selection improves the rotation action by reducing the number of data elements in the visualization. In the latter, the selection can be used to make playlists when dealing with a music data set, for example.
Figure 7: The action of rotation changes the M-Cube visualization allowing database exploration.
Building subsets of the database is a common and desirable feature in the case of multimedia data sets. Texts can be organized into folders, music into albums or playlists, pictures and movies into events, such as â&#x20AC;&#x153;vacationsâ&#x20AC;?. These 3 subsets can be built using the M tool by the action of selecting augmented by the action of filtering.
274
The action of filtering permits the user to select multiple axes at the same time, and filter out the M-Cube to reflect the selected axes. Figure 9 shows an example of a large music data set being filtered by a user selection. In a large database, the data elements are very small and difficult to visualize. The filtering action, as the selection, can be used to enhance visualization or build a subset of the data set.
Another way to better visualize the database is the zoom interaction. Large data sets impose a great number of data elements inside the M-Cube, making data glyphs difficult to distinguish. The user can touch with two fingers inside the cube to determine a magnifying region. Note that this gesture is different than touching with two fingers in one of the axes for selection.
In the example shown in Figure 9, the user selects desirable values in the current dimensions (top): genre, artist and year. The intervals can be selected at the same time using two fingers to touch the start and end values, and different hands to choose more than one attribute. After the selection, the M-Cube animates from the original data elements to the filtered cube (arrows indicate the animation). The result is a new M-Cube with dimensions limited by the intervals specified by the user (bottom). The original M-Cube appears as an icon on the top right corner of the interface, allowing the user to touch it and go back to the original visualization (top cube).
Figure 10 illustrates the action of zoom in a large music data set. The circle with bigger data elements inside is a hand lens; the user defines the lens border using two fingers. The region of zoom can be moved by moving the fingers and changing the position of the lens accordingly. This interaction is similar to a cartographer holding a magnifying glass to analyze a map. In the case of a very large database, this type of zoom can still result in a cluster of many data elements inside the lens. To address this problem, the zooming action allows a second gesture; the user defines the lens border normally, 3 and pinches the fingers together to zoom in the entire M or reverse pinch to zoom out. This interaction discards data elements falling outside the cube as the user zoom in, similar to the action of filtering, and recovers the discarded data elements as the user zoom out.
Figure 10: The action of zoom allows the user to distinguish data elements in a dense cluster of glyphs.
Figure 9: The action of filtering uses multiple selections to make a new M-Cube from a portion of the database; the original M-Cube is displayed in the top right corner.
The last interaction provided by the M-Cube is a semantic filtering action. In multimedia databases, data can be associated to other elements. For example, lecture texts of a course, the same music played by different artists, pictures taken of the same place, and videos of a movie sequence. M-Cube allows the user to choose one data object and drag it outside the cube, creating a view of related files to the selected data object.
275
Figure 11 shows an example of semantic filtering in a movie data set. The user chooses a particular data element (the white box on top), drags it outside the cube and another view appears (arrow indicates the change in the visualization). This view shows the semantic features shared by the selected object and the other data elements. It is a reduced set of the original database, since not every data is correlated, and can be visualized as a 2D scatter plot (bottom) or another M-Cube.
Figure 12: M-Cube prototype for music data sets, visualizing tracks (left) and albums (right).
The prototype implements two types of visualization: music tracks and albums. The first (illustrated in the left of Figure 12) has small gray rectangles as glyphs and is used when tracks of an album does not share the same values in the current dimensions. For instance, the time attribute (y-axis in purple) is different for the music tracks inside the same album. Conversely, the second (illustrated in the right of Figure 12) has album arts as glyphs and is used when tracks of the same album share the current attributes. For instance, the genre (in red) and year (in green) dimensions have the same value for all music tracks inside the same album. In this first prototype, the M-Cube can be rotated to change its dimensions but the cube ends the rotation facing the user. Figure 13 illustrates a rotation animation of the cube. The prototype allows only one axis to be rotated, or pivoted, at each time. The final goal is to allow rotation in any direction (not only facing the user) and in one or more axes, changing more than one dimension at the same time.
Figure 11: The action of semantic filtering allows the user to explore the correlation among files. RESULTS
In this section we present an implementation prototype of 3 the Multidimensional-Cube â&#x20AC;&#x201C; M-Cube or M . We build an interactive table based on the reacTIVision framework [4] to support our tool; a display surface which recognizes multiple fingers touches. We choose to start with music data sets, reading the database from the iTunesâ&#x201E;˘ [1] library described in XML. The prototype is part of a previous work called collecTable [5], written in Python and running on Linux operating system. Figure 12 shows two snapshots of the M-Cube prototype. Note that, even though it is based on a personal database, the music collection can still be large (left snapshot).
Figure 13: The rotation animation of the M-Cube prototype.
276
In the second version of the prototype, we build a file browser based on the M-Cube concepts. The user is 3 presented with a base M , and chooses one type of media. After that, the user navigates the selected media database. Figure 14 shows a user named Joe choosing images file type to browse (arrows indicate animation after choosing). The resulting M-Cube (bottom) displays Joe’s pictures as previews inside glyphs and folders storing more pictures. Each folder when opened, using double touch, transforms the current M-Cube, the visualization changes to the display the elements inside the folder.
CONCLUSIONS
We have presented M-Cube, a multi-dimensional visualization tool for multimedia databases. M-Cube introduces new concepts on both visualization and interaction lines. It is based on 3D scatter plots and pivot tables, but improves in both directions. We use specialized glyphs to represent data elements inside the 3D scatter plot, and the rotation action provides great interaction flexibility to change pivots. M-Cube can be used to visualize any type of media database: text, music, image and video. It can be used as a better visualization tool on top of iTunes™ [1], as demonstrated in the prototype of the previous section. Or as an improved file browser. M-Cube unifies preview and open actions with database visualization in a novel way. It provides a keen visualization of the complete data set, as well as enhanced tools to search for a specific content. We choose to restrict our visualization tool for multimedia databases in order to benefit from the synergism among this type of data. In this way, M-Cube improves both visually, by rich data elements, and interactively, by specialized interaction techniques. Our tool is designed for personal use and for large corporation databases. For personal data, we have tested our prototype in different iTunes™ collections. For corporation data sets, we plan to implement the M-Cube in a public institute dedicated to the musician Tom Jobim. This institute has a large collection of data related to Tom Jobim, ranging from letters and music scores to performance and interview videos. Another path for future work is to implement the M-Cube interface as an add-on of the open source project called Songbird [11]. ACKNOWLEDGMENTS
We would like to thank the Brazilian agency CNPq (National Counsel of Technological and Scientific Development) for the grant provided to the first author. REFERENCES
1. Apple iTunes™. http://www.apple.com/itunes 2. Bertin, J. Semilogy of Graphics, Madison, Wis: Univ. of Wisconsin Press, 1983.
Figure 14: The use of M-Cube as a file browser.
There are still many interaction and visualization ideas to implement. Nevertheless, we believe the prototype acts as a proof of concept and the possibilities that M-Cube offers open a new area on visualization tools for multidimensional multimedia databases.
3. Elmqvist, N., Dragiceviv, P., Fekete, J., Rolling the Dice: Multidimensional Visual Exploration Using Scatterplot Matrix Navigation. In IEEE Transactions on Visualization and Computer Graphics, Vol. 14, 2008. 4. Kaltenbrunner, M., Bencina, R. reacTIVision: A Computer-Vision Framework for Table-Based Tangible Interaction. In TEI’07: Proceedings of the 1st international
277
conference on Tangible and embedded interaction, 2007, ACM, New York, NY, USA, pp. 69-74. 5. Maximo, A., Saba, M. P., and Velho, L., collecTable: a Natural Interface for Music Collections. In SIGGRAPH‘09 Posters (New Orleans, Louisina, August 03 – 07, 2009). DOI = http://doi.acm.org/10.1145/1599301.1599346. 6. Microsoft Excel™. http://office.microsoft.com/pt-br/excel/default.aspx 7. Morris, A. J., Abdelmotv, A. I., El-Geresy, B. A., Jones, C. B., A Filter Flow Visual Querying Language and Interface for Spatial Databases. In GeoInformatica 8:2, 2004, 107-141. 8. TIBCO Spotfire®. http://spotfire.tibco.com/ 9. Santos, S. R., A Framework for the Visualization of Multidimensional and Multivariate Data. Ph.D Thesis from The University of Leeds School of Computing Doctor Thesis, September 2004. 10. Schroeder, W., Martin, K., Lorensen, B., The Visualization Toolkit, Upper Saddle River, NJ: PrenticeHall, 1998. 11. Songbird. http://getsongbird.com/
12. Stolte, M. C., Tang, D., Hanrahan P., Polaris: a system for query, analysis, and visualization of multidimensional relational databases. In IEEE Transactions On Visualization And Computer Graphics ,Vol.8, N.1 January-March, 2002, 52-65. 13. Stolte, M. C., Tang, D., Hanrahan P., Multiscale Visualization Using Datacubes. In IEEE Transactions On Visualization And Computer Graphics ,Vol.9, N.2 AprilJune, 2003, 176-187. 14. Stone, M. C., Bier, E. A., Pier, K., Buxton, W., DeRose, T. D., Toolglass and Magic Lenses: The SeeThrough Interface. In Proceedings of the 20th annual conference on Computer graphics and interactive techniques, 1993 ACM, 73-80. 15. Viega, J., Conway, M. J., Williams, G., Pausch, R. 3D Magic Lenses. In Proceedings of the 9th annual ACM symposium on User interface software and technology, 1996 ACM, 51-58. 16. Williamson, C., Schneiderman, B., The Dynamic HomeFinder: Evaluating Dynamic Queries in a Real-Estate Information Exploration System. In 15th Ann Int’1 SIGIR ‘92/Denmark-6/92, 1992 ACM, 338-346. 17. Wolfram Alpha. http://www.wolframalpha.com
278
Resultados da avaliação de um protótipo para inclusão digital usando Avaliação de Recuperabilidade Claudia A. Tambascia, Robson Duarte, Ronaldo Rocha Diretoria de TV Digital da Fundação CPqD Rodovia SP-340 km 118,5 Campinas SP {claudiat,robsonb,ronaldor}@cpqd.com.br RESUMO
Soluções de acessibilidade universal precisam passar por avaliações criteriosas nas etapas iniciais do projeto, em virtude dos riscos de inadequação. Este trabalho relata os resultados da avaliação do protótipo de um sistema visando inclusão digital, cujo público alvo são pessoas com baixo letramento, com deficiência auditiva ou visual. Usou-se a técnica de Avaliação de Recuperabilidade, técnica de inspeção que explora a capacidade da interface permitir que o usuário restabeleça o fluxo de interação, caso tenha havido um erro. Apresenta-se o processo de avaliação e alguns de seus resultados relevantes. Palavras-chave
Acessibilidade universal, inclusão digital, avaliação de recuperabilidade. 1. INTRODUÇÃO
O projeto STID (Soluções de Telecomunicação para Inclusão Digital) foi desenvolvido com o objetivo de prover soluções de inclusão digital para pessoas analfabetas plenas e funcionais, idosas e deficientes visuais ou auditivas. Como parte da concepção e concretização dessas soluções, faz-se necessário desenvolver interfaces e modelos de interação que permitam a esses usuários o acesso efetivo a serviços eletrônicos, disponibilizados pelas novas tecnologias de informação e comunicação (TICs). A despeito do grande número de analfabetos plenos ou funcionais no Brasil, cerca de 74% da população, as experiências e iniciativas voltadas à inclusão digital desses cidadãos são mais escassas do que as que buscam atender o público com deficiências físicas, motoras e sensoriais, refletindo, talvez, a escala de importância que as duas modalidades de barreira têm em países desenvolvidos, onde a proporção de analfabetos é inferior à de deficientes em geral. Essa desproporção entre a magnitude do problema em nosso país e dos esforços para contorná-lo foi um dos vetores que definiram o foco da atuação deste projeto. Desenvolver um projeto visando inclusão digital para atender a uma grande diversidade populacional requer um
Lucia V.L. Filgueiras, Stefan J.O. Martins Escola Politécnica Universidade de São Paulo Av. Prof. Luciano Gualberto, 158 São Paulo SP {lucia.filgueiras. stefan.martins}@poli.usp.br esforço bastante grande dos projetistas, no sentido de incluir diferentes mecanismos no projeto que permitam às pessoas vencerem as barreiras iniciais e progredirem na direção da conclusão de seus propósitos. Assim, a descrição de alternativas de modelos de interação pressupõe uma prévia análise e contextualização às necessidades e cultura locais sobre a própria comunicação humana e sua nova dimensão, mediada por artefatos computacionais, que é a principal forma de interação no uso das novas TICs, assim como sobre diversas soluções propostas para interfaces de usuários encontradas na literatura técnico-científica, a fim de tomá-los como referência na modelagem das interações dos usuários com as TICs e avaliar suas implicações cognitivas, psicológicas e de usabilidade. O desenvolvimento de interfaces computacionais para usuários com baixa alfabetização ainda é um tema incipiente de pesquisas que começou a merecer a atenção de empresas e pesquisadores da área tecnológica, talvez como conseqüência da percepção de que as carências educacionais observadas nos países em desenvolvimento representam um grande obstáculo para a expansão e popularização da internet e dos computadores nesses países. Na inexistência de soluções consagradas, o desenvolvimento de um sistema envolve um grande risco. Gerenciar esses riscos implica na construção de protótipos, em diferentes níveis de fidelidade, acompanhados de avaliações que forneçam insight sobre os fenômenos de uso. Na etapa inicial do projeto STID desenvolveu-se, portanto, um protótipo de baixa fidelidade cujo objetivo foi o de materializar a visão sobre o modelo de interação adequado à meta de acessibilidade universal. Considerando que um protótipo não executável está em uma fase muito inicial do desenvolvimento, espera-se que sejam identificados potenciais problemas que podem dar origem a modificações no projeto. Não é possível, nesta fase do projeto, avaliar impacto destas mudanças na usabilidade do sistema sendo, portanto, uma avaliação de natureza formativa.
279
Nesta fase, ainda não é possível o teste com usuários, devido à particularidade da população. Nestas etapas, a técnica mais usada é o Percurso Cognitivo, que permite a um grupo de avaliadores inspecionarem a interface do ponto de vista de sua inteligibilidade. Devido a características específicas da população alvo, optou-se por uma forma derivada do percurso cognitivo para a avaliação do projeto STID. Este artigo descreve, portanto, os resultados obtidos nesta avaliação. A Seção 2 elabora os conceitos desejados para o projeto. A Seção 3 mostra características do projeto e da interface avaliada. A Seção 4 trata do método usado, justificando-se sua adoção. A Seção 5 apresenta detalhes da aplicação do método, enquanto a Seção 6 relata os resultados da avaliação. 2. ACESSIBILIDADE UNIVERSAL
Do ponto de vista da acessibilidade universal, o fato de garantir a usabilidade e a acessibilidade de uma TIC não garante a apropriação da tecnologia pelo indivíduo. Para tanto, é importante que sejam considerados aspectos relacionados a inteligibilidade, nível de letramento e, em alguns casos, aspectos relacionados a regionalismos. A isso se devem juntar os níveis de letramento em Braile e Libras, nos casos dos deficientes visuais e dos auditivos, respectivamente, e também destes últimos em relação à língua portuguesa, quando se tratam de surdos oralizados. Nesta adequação de conteúdo são considerados, também, aspectos de ergonomia cognitiva, que correspondem aos modelos mentais e às estratégias de memorização e abstração empregadas pelo público-alvo da interface para vencer a barreira que sua condição impõe à interação com os conteúdos digitais disponíveis na Internet. Dessa forma, passa a se tornar essencial o uso e aplicação de recursos de usabilidade, acessibilidade e inteligibilidade para garantir ao usuário uma interação adequada, com ganhos de aprendizado e superação de obstáculos. Acessibilidade universal é referenciada na literatura com vários conceitos diferentes, mesclados ao conceito de acesso universal [1]. O primeiro é com relação a normas e recomendações para disponibilizar um serviço ou produto para todas as pessoas. Esse conceito foi utilizado no “U.S. Communications Act of 1934” para a definição da cobertura de serviços de telefonia, telégrafo e rádio. Neste documento diz que precisa haver “instalações adequadas a custos razoáveis”, considerando também as áreas rurais. E dá prioridade para não haver “discriminação com base de raça, cor, religião, origem nacional ou sexo.” [2]. Emiliani [3], também relata que o acesso universal é alcançado com a existência de acessibilidade e
usabilidade em tecnologias de informação, disponível para qualquer pessoa, em qualquer lugar, a qualquer hora. Neste sentido, o conceito de acessibilidade universal foi utilizado para definir a disponibilidade de recursos tecnológicos para todas as pessoas de um país, sem qualquer tipo de discriminação. Mace; Hardie e Plaice [4] utilizaram outro sentido ao conceito referindo-se a facilidade do acesso para as pessoas com necessidades especiais. Este sentido é utilizado para promoção do acesso aos deficientes físicos, visuais e auditivos, ou ainda idosos e não letrados. Stephanidis [5] possui uma outra definição, considera que, no contexto de interação homem-computador, a acessibilidade universal introduz uma nova perspectiva que possibilita o reconhecimento e a tentativa de acomodação de uma extensa variedade de habilidades, experiências e necessidades de usuários no projeto de produtos baseados em computadores. É possível então definir, com base na literatura que acessibilidade universal é importante porque garante o acesso e autonomia de uso do usuário. Isso independe se o usuário é ou não deficiente. Esse entendimento dos conceitos de usabilidade, acessibilidade e inteligibilidade, aplicados de forma a superar as barreiras inerentes ao público-alvo, foram transpostos para o modelo de interação, resultando em algumas diretrizes, descritas a seguir. Pode-se considerar que o objetivo de autonomia reflete-se nos seguintes atributos de usabilidade: 1. Inteligibilidade: para ser autônomo, o usuário precisa encontrar no sistema todas as informações necessárias para orientar sua interação até a conclusão da tarefa. 2. Recuperabilidade: para ser autônomo, o usuário precisa ser capaz de reorientar sua interação com o sistema no caso de essa interação se desviar do objetivo pretendido. 3. Acessibilidade: para ser autônomo, o usuário deve poder cumprir seus objetivos independente de suas limitações sensoriais. 3. O PROJETO STID E SUA ACESSIBILIDADE UNIVERSAL
INTERFACE
DE
O projeto STID teve como objetivo facilitar a acessibilidade às informações por usuários analfabetos ou deficientes auditivos ou visuais, auxiliando na inclusão digital dessas pessoas. Para tanto, especificou-se dois serviços de interesse da população alvo: o Inclua Saúde e o Previdência Fácil.
280
Conforme a documentação do projeto, os principais requisitos destes sistemas são:
As Figuras 2 e 3 apresentam as telas de início do serviço de Previdência Fácil e Inclua Saúde, com as funcionalidades que estão disponíveis aos usuários.
Inclua Saúde
Agendamento prévio de atendimentos disponíveis no nível da atenção básico à saúde (consulta médica, tratamento ou acompanhamento periódico); Consulta de informações e dicas de saúde de interesse local ou nacional. Previdência Fácil
Facilitar o processo de obtenção de informações para solicitação da aposentadoria para os trabalhadores rurais e urbanos; Facilitar o entendimento das informações para a obtenção da aposentadoria e dos documentos necessários para a solicitação da aposentadoria;
Figura 2 – Tela inicial do Previdência Fácil
Promover a descentralização do atendimento feito atualmente pelo INSS para fornecimento de informações, consultas ao sistema e atualizações cadastrais. O protótipo não funcional dos sistemas foi desenvolvido após uma fase de estudo de diversos elementos de interação que poderiam ser combinados para resultar em uma interface de acessibilidade universal. Usando-se estes elementos, a equipe da Fundação CPqD desenvolveu um protótipo não funcional dos serviços. A equipe da Escola Politécnica da USP foi chamada para realizar a avaliação de uma versão em Flash da primeira interface preliminar dos serviços, com o objetivo de coletar informações sobre a adequação do modelo de interação escolhido às necessidades da população alvo. O protótipo é composto por 28 telas, que representam um subconjunto dos requisitos do projeto. A Figura 1 apresenta a tela inicial do projeto, com a apresentação dos dois serviços.
Figura 3 – Tela inicial do Inclua Saúde Visando o aspecto da acessibilidade universal, as seguintes características foram embutidas no protótipo: Iconografia visando facilidade de reconhecimento da função, sempre acompanhada do respectivo texto; Texto simples; Leitor de tela ; Acesso às funções com as teclas TAB/ENTER; Número reduzido de opções na tela; Utilização de um avatar para transmitir as informações da interface em Libras; Áudio associado aos textos da interface. Alguns cenários foram obtidos após um estudo de caminhos sobre o protótipo, mostrado na Figura 4. Nesta figura, representam-se as telas do protótipo, identificadas por números entre parênteses, e a navegação entre elas. Omite-se, por clareza, a navegação do botão “Voltar”.
Figura 1 – Tela inicial de apresentação dos serviços
281
Os caminhos marcados em vermelho e em azul e correspondem aos cenários mais exigentes do Inclua Saúde e do Previdência Fácil, em termos dos elementos de interação envolvidos. As telas marcadas em roxo são comuns aos dois cenários. Cenário 1
Sr. Otacílio, 72 anos, trabalhou como barbeiro por 35 anos, com carteira assinada e deseja aposentar. Ele ficou sabendo que são necessários vários documentos. Ele acredita que será necessária, para se aposentar, sua carteira de trabalho, porém ela foi perdida em sua última mudança. Como ele deve proceder, utilizando o sistema Previdência Fácil? Cenário 2
O sr Luis tem 67 anos e trabalha há mais de 35 anos em indústria farmacêutica e gostaria de se aposentar. Ao chegar ao posto do INSS com apenas o seu RG e o seu CPF em sua carteira, ele foi informado que faltavam outros documentos, mas não consegue se lembrar de quais. Sr Luis quer descobrir que documentos estão faltando e levar para casa uma lista com o nome dos documentos, para ele não esquecer de levá-los na sua próxima visita ao posto do INSS. Como ele deve proceder, utilizando o sistema Previdência Fácil?
Cenário 3
Dona Serafina, de 62 anos, trabalhou numa confecção de uniformes escolares por 30 anos e deseja se aposentar. Porém a dona Serafina está com alguns problemas de saúde e por isso não consegue se locomover. Ela gostaria que houvesse uma possibilidade de que sua filha, Maria José, tomasse as devidas providências necessárias para obtenção de sua aposentadoria. Maria José gostaria de saber se existe uma forma de ajudar sua mãe, se houver, ela deseja dar procedimento e conseguir a aposentadoria para a Dona Serafina. Como ela deve proceder, utilizando o sistema Previdência Fácil? Cenário 4
O sr. Adílio foi avisado por sua esposa que precisará levar Mariana, sua filha de 2 anos, ao pediatra. Mas ela se esqueceu do horário da consulta marcada e não soube informar o marido. Por isso ele precisa confirmar a data da consulta e horário. Como ele deve proceder, utilizando o sistema Inclua Saúde? Cenário 5
A sra. Virgínia está com sintomas de gripe. Ela soube por uma vizinha que uma pessoa em seu bairro já teve dengue. Ela teme que este seja seu caso, mas como não tem nenhum conhecimento a respeito disso, ela gostaria de fazer uma consulta médica e também descobrir como se proteger da dengue. Como ela deve proceder, utilizando o sistema Inclua Saúde? 4. O MÉTODO DE AVALIAÇÃO
Protótipos não executáveis e de baixa fidelidade podem ser testados com usuários, com técnicas como, por exemplo, a de Paper Prototyping [6] na qual se constrói um esboço da interface com materiais simples, como papel e fita adesiva, submetendo-se o esboço a uma simulação de uso com pessoas do público alvo, durante a qual os usuários “fazem de conta” que estão usando o sistema computacional. O engajamento do usuário na dramatização do uso, atuar sobre a interface “como se fosse” real, é necessário para que a avaliação seja bem sucedida. No caso do projeto PROJ, a avaliação com usuários foi realizada em uma etapa seguinte. Este trabalho tem foco na primeira avaliação realizada, para a qual se adotou uma técnica de inspeção. Por ser o público alvo formado de pessoas com nenhuma experiência computacional anterior, não se podia garantir o engajamento na simulação.
Figura 4 – Caminhos do protótipo
Uma alternativa para a avaliação de protótipos conceituais e modelos de interação é uma técnica do Percurso Cognitivo ou cognitive walkthrough. Esta técnica e suas variações empregam, ao invés de usuários, especialistas no domínio do projeto e em usabilidade, conforme descrito na seção que se segue.
282
4.1 Percurso Cognitivo
Percurso Cognitivo é um método de inspeção de usabilidade cujo objetivo principal é avaliar a interface com relação à facilidade de aprendizado, partindo-se do princípio que os usuários em geral exploram a interface para aprender a usá-la. No Percurso Cognitivo, os avaliadores procuram compreender se os usuários têm os recursos cognitivos necessários para explorar o sistema e realizar as tarefas a cada passo. O questionamento do modelo de interação quanto aos recursos cognitivos produz, em geral, diversos comentários ao protótipo. Tratando-se de um protótipo não-funcional, que esboça o modelo de interação, é cedo ainda para se falar em problemas de usabilidade; no entanto, a técnica dá bons resultados no sentido de identificar problemas na coordenação do modelo de interação com o modelo mental do usuário. A solução desses problemas, em geral, implica em grandes revisões ao modelo de interação; desta forma, a utilização da técnica é mais bem aceita quando aplicada no início do projeto, como é o caso desta avaliação. Essa técnica está baseada nos fundamentos da Engenharia Cognitiva [7]. O método de avaliação de usabilidade denominado Percurso Cognitivo surgiu em 1990 com Lewis [8], porém ganhou notoriedade quando Nielsen e Mack editaram um livro com os resultados de um workshop sobre métodos de inspeção de usabilidade na CHI 1992, no qual se inclui o capítulo de Wharton e colaboradores sobre a técnica de Percurso Cognitivo [9]. O Percurso Cognitivo baseia-se na técnica de walkthrough, na qual um artefato de projeto é inspecionado por uma equipe de revisores. O walkthrough é um processo tradicionalmente usado na indústria de software para inspecionar o código fonte, percorrendo as decisões tomadas a cada passo. Uma aplicação bastante comum é em análises de segurança do código fonte de sistemas críticos. Na aplicação à interação homem-computador, os primeiros autores sobre o método definiram que o Percurso Cognitivo tem os seguintes passos: 1. Definir as entradas do percurso, identificando: os usuários do sistema; as tarefas a serem avaliadas; a seqüência esperada de ações do usuário para alcançar seu objetivo; a interface implementada (o protótipo). 2. Reunir os revisores e as pessoas que defenderão o projeto.
3. Percorrer o cenário de uso postulado para a avaliação. Os projetistas mostram quais são as ações postuladas para cada passo da interação. A cada decisão, no cenário, são formuladas quatro perguntas aos participantes. Os usuários tentarão atingir o efeito correto? Os usuários perceberão que a ação correta está disponível? Os usuários irão associar a ação correta com o efeito que se quer obter? Se a ação for executada, os usuários perceberão que foi feito um progresso em relação à finalização da tarefa? 4. Registrar os problemas encontrados 5. Revisar a interface para resolver os problemas. A análise dos resultados deve evidenciar o que o usuário precisa conhecer antes de realizar a tarefa e o que ele vai aprender durante a execução da tarefa. Na avaliação, é necessário que os revisores se coloquem na posição dos usuários, em situações reais de uso. Somente assim, um protótipo não funcional faz sentido. Para isso, os instrumentos de teste devem ter cenários de uso muito bem definidos, de forma a explorar as condições possíveis de se analisar no protótipo. Toda a interação deve ser registrada pelos pesquisadores. Além de anotações feitas durante as discussões, a utilização de filmadoras é muito útil para analisar posteriormente os comentários e extrair os resultados. 4.2 Análise de Recuperabilidade
A Análise de Recuperabilidade é uma variação da técnica de Percurso Cognitivo na qual se explora a capacidade de um usuário se manter no caminho correto em sua tarefa proposta e a capacidade de a interface auxiliá-lo a retomar o caminho correto caso dele o usuário se desvie. A técnica está descrita em detalhes em outra publicação dos autores [10], resumindo-se a seguir as características que a diferenciam da técnica original. A Análise de Recuperabilidade é uma combinação da técnica de Percurso Cognitivo com técnicas de avaliação de confiabilidade, como a técnica de HAZOP. Ela se baseia na visão de que “the result of learning by exploration is, in all situations but one, the error.” Na análise de recuperabilidade, os avaliadores estão interessados em determinar: Quais aspectos da interface evidenciam ao usuário que uma determinada opção é correta num passo de sua atividade Quais aspectos da interface evidenciam ao usuário que ele está no caminho errado?
283
Quais recursos são disponibilizados ao usuário para que ele retorne ao seu caminho correto? Assim, analisa-se o projeto não apenas em termos do caminho de sucesso, mas em termos dos caminhos de erro e do conceito de recuperabilidade. Para tanto, a Análise de Recuperabilidade agrega duas questões: Os usuários conseguem detectar que realizaram uma tarefa errada? Diante da situação de erro, os usuários conseguem descobrir qual a ação tomar para retornar a navegação da tarefa e chegar a um status em que ele possa executar a tarefa correta novamente? Uma vez que a aplicação do percurso cognitivo já tende a ser demorada e tediosa, a Análise de Recuperabilidade apóia-se em uma versão reduzida do Percurso Cognitivo. As perguntas relacionadas à recuperação do erro são a principal modificação desta técnica em relação à original, mas não a única. A Avaliação de Recuperabilidade tem ainda uma importante característica que a diferencia do Percurso Cognitivo que é o fato de se basear em um modelo de personas para representar os usuários e em selecionar cuidadosamente os avaliadores com base em seu conhecimento sobre a população alvo do produto. Cada avaliador selecionado desta forma age como um advogado da persona. Este aspecto é importante porque as inspeções heurísticas são em geral realizadas por profissonais de usabilidade, por conta dos resultados rápidos que obtém. No entanto, a grande vantagem da inspeção vem do fato de que os avaliadores, por serem especialistas, conseguem antecipar os problemas dos usuários. Uma inspeção realizada por avaliadores inexperientes pode não dar resultados satisfatórios. Outra característica da Análise de Recuperabilidade é que a sessão de avaliação é filmada, não sendo produzidas anotações pelos avaliadores, para se ganhar tempo. 5. APLICAÇÃO DA ANÁLISE DE RECUPERABILIDADE
Para o protótipo do PROJ, o percurso da interface foi feito com representantes da população alvo e que, portanto conhecem seu comportamento de uso de computadores e pelos projetistas da interface que fazem a defesa da interface projetada. Um mediador conduz o debate, propondo as questões na medida em que se avança nos cenários de execução. A seguir, apresentam-se os recursos usados na aplicação da técnica. 5.1 Definição dos Usuários
O público alvo do projeto é representado pelo modelo de personas do projeto. Os revisores foram selecionados com base na sua experiência com a população alvo, e
pôde-se contar com avaliadores especialistas em acessibilidade. O modelo de personas foi apresentado aos revisores no início da sessão, solicitando-se a cada revisor que adotasse uma delas como foco de sua revisão. 5.2 Tarefas
As tarefas ensaiadas foram obtidas a partir da execução de cenários de uso. Dos cenários implementados no protótipo, foram selecionados os cenários 1 e 5, que davam a máxima cobertura do protótipo. 5.3 Instrumentos de teste
Os seguintes instrumentos de teste foram usados na Análise de Recuperabilidade: Apresentação da técnica, que consistia numa apresentação PowerPoint para preparar os participantes. Acordo de participação, que descreve os direitos do usuário participante do experimento. Registro dos cenários de teste. Este documento descrevia os cenários, para ajudar a memorização. 5.4 Aspectos Éticos
As sessões de teste foram filmadas. Todos os participantes assinaram um acordo de participação nos quais autorizam a filmagem e o uso da imagem e do áudio para fins de pesquisa, proibindo a veiculação das mesmas em mídias de massa, como TV e internet. O acordo garante ainda o direito de não responder a alguma pergunta que for feita pelos pesquisadores ou de desistir de participar do experimento por qualquer motivo. Esse acordo é feito em duas vias sendo que uma via fica como o entrevistador e a outra fica como o usuário participante do experimento. 6. RESULTADOS
Os ensaios resultaram em um total de 181 tópicos de discussão, que foram resumidos em um total de 56 problemas. Os problemas foram agrupados em categorias, que podem ser associadas aos fatores que ocasionam as ocorrências observadas: Projeto centrado no processo institucional (projeto “chapa branca”); Questões de acessibilidade; Instruções para ação; Recursos não previstos no modelo de interação; Aspectos de design. Cada problema localizado foi apresentado em um quadro, cujo modelo é o do Quadro 1 que se segue. Observe-se que em várias situações, os revisores fizeram sugestões de modificações à interface. Nestes casos, a equipe adotou a política de localizar o problema que provocava cada sugestão.
284
Identificação resumida do problema
A palavra PREVIDÊNCIA não indica claramente o destino onde o usuário deseja chegar.
Discussão
Detalha o problema e seu contexto
Localização
Mostra telas ou elementos das telas que ajudem a compreender o problema
Proposta de solução
Sugestões dadas pelos participantes
Discussão
A palavra PREVIDÊNCIA não é uma palavra presente no vocabulário da maioria dos usuários do público alvo, portanto pode haver confusão no momento de optar por este serviço.
Localização
Quadro 1. Modelo de apresentação de problemas As sugestões foram também repassadas no laudo final, com a recomendação de não serem vistas pela equipe de projetistas como requisitos. São apresentadas como documentação da aplicação da técnica, na expectativa que possam esclarecer a forma como pensam os representantes dos usuários. Sugestões dos participantes e avaliadores são comuns em avaliações de usabilidade. A política de identificar o problema e de apenas mencionar a sugestão foi adotada por se entender que não cabe aos avaliadores propor uma solução que não tenha sido submetida a uma avaliação e, também, que cabe aos projetistas encontrar a melhor solução para cada problema (ou mesmo, de não resolvêlo) em função dos recursos e requisitos do projeto. As seções seguintes detalham o significado de cada categoria de problema e dá um exemplo de um problemas relevantes de cada categoria, encontrados no protótipo. 6.1 Projeto centrado (“chapa branca”)
no
processo
institucional
Considerou-se um fator de problemas no protótipo analisado a opção por um modelo de interação centrado no processo institucional, ao invés de uma visão centrada no usuário. Isto é, o fluxo da interação foi desenvolvido pensando-se na forma como os funcionários do serviço de governo coletam as informações do cidadão. Isso pode ser considerado crítico, pois o cidadão precisa se localizar em meio a termos e classificações que não lhe são familiares. O Quadro 2 mostra um exemplo de problema identificado pelos revisores durante a aplicação da metodologia, que podem ser considerados sintomáticos deste fator. É interessante notar que na determinação deste problema, os avaliadores que defendiam as personas representativas de pessoas com deficiência mostraram que elas poderiam optar por Saúde, caso quisessem buscar os recursos de aposentaria por invalidez ou os recursos da LOAS – Lei Orgânica da Assistência Social, já que a questão de saúde é envolvida.
Proposta solução
de
Substituir a palavra PREVIDÊNCIA por informações sobre aposentadoria.
Quadro 2. Problema relacionado ao projeto centrado no processo institucional 7.2 Questões de Acessibilidade
Alguns dos problemas identificados foram sintomáticos de uma compreensão ainda não total das barreiras enfrentadas pela população com deficiência. Os problemas de acessibilidade exibidos a seguir estão relacionados a dificuldades que os usuários com deficiência visual e auditiva possuem durante o acesso a um sistema de computador. São problemas de uso de computador e particularidades do modelo mental dessa população. A lista de problemas está dividida entre problemas que afetam os deficientes visuais e problemas que afetam os deficientes auditivos. 7.2.1.Problemas que afetam as pessoas com deficiência visual
O problema descrito no Quadro 3 foi obtido da constatação de que se a pessoa com deficiência visual errasse nesta etapa (o que foi considerado bastante provável), as conseqüências para a finalização da tarefa seriam muito negativas, porque a lista final de documentos a serem obtidos dependia da seleção dos documentos que ele já tinha. 7.2.2.Problemas que afetam as pessoas com deficiência auditiva
Detectou-se o problema dos regionalismos dos sinais, pois um sinal em uma região pode ter um significado e em outra região pode ter um outro diferente, conforme o Quadro 4. Isso pode interferir na compreensão do conteúdo abordado nos vídeos que servem como referência para o entendimento da mensagem e escolha dos caminhos que o deficiente auditivo irá tomar durante a interação.
285
Check boxes não são compreendidos por deficientes visuais com baixo letramento digital Discussão
Os deficientes visuais têm dificuldade em trabalhar com elementos interativos, devido a sua baixa acessibilidade. A metáfora de selecionar uma caixa para indicar uma escolha de opção pode ser compreensível para o vidente, mas não o é para o deficiente visual que não está habituado a interagir com o computador.
Localização
7.3 Instruções para ação
Os problemas relacionados a instruções são aqueles que ocorrem nas chamadas de ação para os usuários, que podem acontecer antes do início da interação, durante a execução do diálogo com o computador ou mesmo após o término da interação. A falta de instruções adequadas foi evidenciada como um fator para o usuário seguir um caminho errado e também para voltar ao caminho certo. No exemplo do Quadro 5, mostra-se uma situação na qual o erro do usuário poderia acontecer mesmo depois de terminada a interação com o sistema, por conta de um resultado emitido pelo sistema. A impressão da lista de documentos tem que produzir a relação dos documentos necessários, distinguindo os que o usuário tem dos que ele não tem. Discussão
Proposta solução
de
Instruir o deficiente visual que existe uma necessidade de escolha e orientá-lo sobre a forma de escolher.
A produção de uma lista apenas com os documentos que faltam pode prejudicar o usuário na identificação dos documentos que ele deve portar para solicitar a aposentadoria.
Localização
Quadro 3. Problema relacionado a dificuldades da população com deficiência visual Podem existir problemas de interpretação devido às traduções para LIBRAS. Discussão
A linguagem de sinais possui muitos regionalismos que podem interferir na compreensão dos vídeos. Se o deficiente auditivo não entender a intérprete, ele irá buscar outras opções, que precisarão existir.
Localização
Proposta solução
de
Ao imprimir a lista de documentos, que ela contenha tanto os documentos que ele já tem quanto os documentos que ele ainda não tem
Quadro 5. Problema relacionado a instruções ao usuário 7.4 Recursos não previstos no modelo de interação
Durante a discussão do protótipo, algumas situações possíveis foram identificadas, para as quais o protótipo não apresentava solução como no Quadro 6. Estas situações foram em relação: • Marcação de exames; • Agendamento de consultas em outros postos de saúde; • Situações específicas de cadastro e representação. 1. Não há recursos para desmarcar a consulta
Proposta solução
de
Criação de conteúdo em Libras padrão e com um intérprete que transmita confiança aos surdos.
Discussão
É necessário haver recurso fácil de cancelamento de consultas junto dos recursos de marcação, para não prejudicar o atendimento no posto de saúde.
Localização
Não se aplica.
É necessário que os intérpretes sejam avaliados por surdos. É necessário que existam 2 vídeos, um com a intérprete, outro com a dramatização, para que os surdos comparem e estabeleçam o relacionamento de confiança com o interprete do vídeo.
Quadro 4. Problema relacionado a dificuldades da população com deficiência auditiva
Proposta solução
de
Ao finalizar a interação, desmarcar a consulta.
mostrar
como
Informar ao usuário a importância de desmarcar a consulta caso não possa comparecer.
Quadro 6. Problema relacionado a recursos não previstos
286
7.5 Aspectos de Design
Diversos problemas com naturezas diferentes foram agrupados na categoria de problemas de design, que abrange os elementos de interface e o conceito de acessibilidade universal. Os problemas de design foram agrupados nas seguintes categorias: elementos de interface: aspectos do projeto relacionados a elementos que compõem as diversas telas; seqüência de interação: aspectos relacionados com a navegação;
do
projeto
terminologia: aspectos relacionados à compreensão dos termos empregados; implementação: aspectos que podem ser ou não problemas, dependendo da forma como o sistema definitivo seja implementado. O Quadro 7 apresenta um exemplo de avaliação de um dos aspectos relevantes do projeto, a iconografia, considerada na categoria de elementos de interface. O uso do ícone oficial do INSS pode dar ao usuário a impressão falsa de que ele está no site oficial da previdência. Discussão
A presença do ícone oficial, além de iludir o usuário quanto à natureza do serviço, pode leválo a esperar que o sistema forneça outros serviços eventualmente necessários para ele.
Localização
detecção das situações de erro e de reversão desta condição e de acessibilidade, construindo-se mecanismos que promoveram a acessibilidade universal. A técnica de Análise de Recuperabilidade é uma adaptação do Percurso Cognitivo, que permitiu perseguir melhor os objetivos principais do projeto PROJ, descritos acima. Essa técnica pode ser considerada extremamente aplicável para avaliação de interfaces que procuram promover a inclusão digital, devido ao do impacto negativo que a incidência ao erro causa em usuários que vão ter a experiência com a tecnologia pela primeira vez. Pretendeu-se aqui elucidar as contribuições desta técnica em uma aplicação real no projeto STID, através da avaliação do protótipo não-funcional de dois serviços de cidadania voltados à inclusão digital. Os sistemas Inclua Saúde e Previdência Fácil foram posteriormente disponibilizados, em suas versões executáveis, em telecentros especialmente instalados em duas cidades piloto. A avaliação dos modelos de interação, à luz da técnica da Análise de Recuperabilidade, nos estágios iniciais de desenvolvimento com foco em acessibilidade e inteligibilidade contribuiu para a versão final implementada e implantada. AGRADECIMENTOS
Agradecemos aos participantes voluntários da sessão de Avaliação de Recuperabilidade, em especial a Fulano e Beltrano. REFERÊNCIAS
Proposta solução
de
Deve-se utilizar iconográfica.
outra
representação
Quadro 7 - Problema relacionado à iconografia 7. CONCLUSÕES
Acessibilidade universal tem sido um tema de interesse, não apenas para pesquisadores, mas também para produtores de websites comerciais, que cada vez mais percebem a importância de desenvolverem sistemas adequados a públicos com necessidades diferenciadas. Como dito anteriormente, o principal objetivo de usabilidade do sistema disponibilizado pelo projeto STID é permitir ao público alvo o acesso autônomo ao mesmo. Retomando-se os objetivos do projeto, conclui-se que a avaliação do protótipo produziu resultados significativos, tanto em termos da inteligibilidade, por promover recursos que auxiliam o entendimento das tarefas e da posição atual do usuário nestas tarefas, da recuperabilidade, porque permitiu criar recursos de
1. Aquino Junior, P.T; Filgueiras, L.V.L; (2007) The Multiple Identity of Universality. IADIS International Conference Interfaces and Human Computer Interaction, 192-196. 2. FCC - Federal Communications Commission, (1998). Communications Act of 1934: as ammended by Telecom Act of 1996. Washington, In: http://www.fcc.gov/Reports/, Version September 3. Emiliani, P.L. et al, (2005). Universal access to ambient intelligence environments: Opportunities and challenges for people with disabilities. IBM Systems Journal, Vol. 44, No. 3, pp 650 – 619. 4. Mace, R.L. et al, (1991). Accessible environments: Toward universal design. In W. Preiser, J. Vischer and E. White (eds.) Design Interventions: Toward a More Human Architecture. New York: Van Nostrand Reinhold. 5. Stephanidis, C., (2001). Adaptive Techniques for Universal Access. International Journal of User Modelling and User-Adapted Interaction 11, No. 1–2, Kluwer Academic Publishers. Netherlands, pp 159 – 179.
287
6. Snyder, C. (2000) Paper Prototyping. The fast and easy way of refining user interfaces. San Francisco, CA. Morgan Kauffman 7. Norman, D. A. (1986). Cognitive engineering. In D. A. Norman & S. W. Draper (Eds.), User centered system design: New perspectives in human-computer interaction. Hillsdale, NJ: Lawrence Erlbaum Associates. 8. Lewis, L.; Polson, P, Wharton, C. & Rieman, J. (1990) Testing a Walkthrough Methodology for TheoryBased Design of Walk-Up-and-Use Interfaces. CHIâ&#x20AC;&#x2122;90 Proceedings pp235-242
9. Wharton, C.; Rieman, J.; Lewis, C.; Polson P. G. (1994) The cognitive walkthrough method: a practitioner's guide In J. Nielsen & R. Mack Usability Inspection Methods (Eds.) John Wiley & Sons, pp. 105-140. 10. Filgueiras, L.V.L. et al. (2009) Recoverability walkthrough: an alternative to evaluate digital inclusion interfaces. In Proceedings of CLIHC â&#x20AC;&#x201C; Conferencia Latinoamericana de Interaccion Humano Computadora. .
288
Efeitos dos Alarmes Automáticos na Consciência Situacional de Operadores de Sistemas de Monitoramento Daniel Maier de Carvalho Instituto Tecnológico de Aeronáutica São José dos Campos – SP – Brasil maier@ita.br +55-12-39476897
Carlos Henrique Costa Ribeiro Instituto Tecnológico de Aeronáutica São José dos Campos – SP – Brasil carlos@ita.br +55-12-39475895
RESUMO
INTRODUÇÃO
Sistemas digitais de monitoramento online oferecem vantagens de informações que se traduzem em vantagens na tomada de decisão. Contudo, a natureza complexa e dinâmica destes sistemas pode impactar na consciência situacional (CS) dos operadores e dos tomadores de decisão. Com o aumento da quantidade de informação disponibilizada, o uso de alertas automáticos como forma de chamar atenção de eventos críticos pode ser importante. Contudo, durante períodos de alta carga de trabalho, alertas podem realmente tornar-se intrusivos, e atende-los pode aumentar a carga de trabalho mental e desviar a atenção do operador. Este trabalho mostra o resultado de dois experimentos que investigaram como alertas visuais automáticos afetam a consciência situacional percebida de usuários em cenários desses sistemas. Utilizando um delineamento por blocos incompletos balanceados, a CS foi medida em dois cenários com os alertas ligados em um e desligados em outro, e os resultados apontaram que o uso dos alertas não influencia a tarefa de monitoramento. Porém, a forma de apresentação e a interação com o alerta quando combinado às situações de alta carga de trabalho podem contribuir para a perda de consciência situacional. Os resultados podem ser usados para ajudar a conceber quando mensagens automatizadas devem ou não ser incluídas em sistemas digitais de monitoramento. Palavras - Chaves
Alertas, Consciência Monitoramento.
Situacional,
Sistemas
O compartilhamento de informações sobre uma rede de computadores é uma forma comum de comunicações, em muitos domínios. Sistemas de monitoramento online têm tirado partido desta tecnologia para melhorar o desempenho nas áreas de tráfego aéreo, medicina e atividades de segurança. Por exemplo, analistas da Defesa Civil em operações de desastres geograficamente distantes, mas comunicando-se através de uma rede, podem acompanhar eventos do resgate em uma tela de computador quase em tempo real. O uso de computadores em rede aumenta a agilidade e abre novas possibilidades. Os dados podem ser analisados digitalmente e os resultados exibidos aos interessados, proporcionando-lhes uma melhor informação para tomar uma decisão. Operadores podem ser providos com feedbacks imediatos sobre suas atuações. Uma tecnologia promissora seria um sistema de computadores para monitorar o fluxo de dados e fornecer alertas quando ocorrem eventos críticos para garantir que eles não sejam perdidos pelo operador. Funcionalidades como um sistema de alertas automático pode ajudar a direcionar a atenção do usuário para eventos importantes, e aumentar a consciência situacional. No entanto, experiências em outras áreas com sistemas de alertas demonstraram que a automação pode causar complacência, aumentar requisitos de monitoramento e, paradoxalmente, contribuir para a redução da CS [1]. De fato, diferentes fatores podem contribuir para redução da CS. Durante períodos de alta tensão ou stress, alertas podem tornar-se intrusivos, e responder-lhes pode aumentar a carga de trabalho e desviar a atenção do operador por engano [2] apud [1].
de
Classificação ACM
H.1.2 User/Machine Systems: Human factors. H5.2 User Interfaces.
Isto levanta a questão de saber se feedbacks imediatos ou sistemas de alarmes automáticos reforçam a CS ou interferem na CS. Pesquisas sugerem que isso depende da situação e das condições ambientais [3] apud [1]. Sob certas condições, alertas aumentam a CS, enquanto que noutras condições, interferem na CS. Nos experimentos aqui relatados, os participantes foram avaliados durante a simulação de uma atividade de 1
289
monitoramento de um cenário operacional militar, ao qual foi acoplado um sistema de alertas automático. A CS foi medida usando o Situation Awareness Global Assessment Technique (SAGAT). O questionário SAGAT, desenvolvido por Endsley [4], avalia qualitativamente os usuários e pode cobrir os níveis da percepção, compreensão e projeção da CS, que foi medida com o sistema de alertas ativado e desativado.
ajudam a aumentar a consciência situacional do decisor. Normalmente tais sistemas são providos de ferramentas analíticas com simbologia própria, como análise e filtragem, que automaticamente contribuem com a consciência situacional sem a necessidade de textos explicativos. Existem vários tipos de sistemas de monitoramento diferentes. Alguns são específicos para determinada atividade, como medicina, controle de tráfego aéreo, militar, logística, etc. Outros podem agregar várias atividades e ser observado por diversos especialistas, cada um aproveitando o sistema do seu ponto de vista específico. Dessa forma o tomador de decisão pode gastar menos tempo em identificar e tomar conhecimento da situação, e mais tempo em planejar e levantar as possíveis linhas de ação.
O primeiro experimento mostrou que alertas automáticos reduziram a CS do usuário, enquanto que o segundo experimento, que foi realizado mudando a apresentação e a interação com os alertas, evidenciou CS similar em ambas as condições de alertas. A primeira parte deste artigo apresenta, como background, uma breve descrição sobre o software de monitoramento utilizado e sobre alertas automáticos. Apresenta ainda o conceito de consciência situacional (CS) como um fator humano importante para operadores de sistemas digitais e identifica como medir essa CS.
O software escolhido como ferramenta de apoio ao presente experimento foi o “C2 em Combate” do Exército Brasileiro. Este programa permite a apresentação de uma carta de visualização gráfica da operação, incluindo: desdobramento das forças amigas e inimigas; zona de ação e objetivos e outras medidas de coordenação e controle (limites, pontos de reunião etc.). Um exemplo de tela do programa “C2 em Combate” é mostrada na figura 1.
Na segunda parte do artigo é detalhada a condução dos experimentos e os resultados obtidos com as duas execuções, e finalmente, na última parte, é apresentada a conclusão do trabalho. CONCEITOS FUNDAMENTAIS
Nesta parte serão apresentados alguns importantes para entendimento do experimento.
conceitos
Sistemas Digitais de Monitoramento
Sistemas digitais de monitoramento centrados em rede constituem importante ferramenta de apoio ao processo de tomada de decisão e propiciam realizar tarefas de planejamento, análise e acompanhamento das ações que, antes, eram executadas manualmente ou por programas aplicativos, não específicos, que permitiam apenas limitadas funcionalidades. Um exemplo é o planejamento de operações de segurança, como no conhecido reveillon de Copacabana, que antes utilizava um mosaico de mapas da região contendo os principais pontos de vigilância, as áreas de fogos, policiamento e defesa civil, dentre outras informações, e que agora permite monitoramento utilizando cartas digitalizadas e camadas de visualização das mesmas informações com filtros.
Figura 1. Exemplo de tela do Programa “C2 em Combate”.
Quanto mais são utilizados sistemas digitais de monitoramento, mais os usuários vão percebendo seu potencial e novas funcionalidades vão sendo requeridas. Tais funcionalidades vão tornando os sistemas cada vez mais complexos e dinâmicos. Uma tecnologia promissora para ajudar no gerenciamento dessa quantidade cada vez mais crescente de dados poderia ser um sistema que monitorasse o fluxo de dados e alertasse quando eventos críticos ocorressem. Tal sistema é caracterizado na próxima seção.
Informações sobre os diversos sensores podem ser distribuídas através da rede de dados dos chefes para os subordinados e vice-versa. Segundo Barnett [1], a digitalização não somente aumenta a capacidade operacional, mas também aumenta a segurança reduzindo as chances de incidentes entres elementos cooperativos. Ademais, espera-se que profissionais que usam sistemas digitais mantenham uma melhor consciência situacional para planejar e executar ações mais rapidamente do que os que não usam.
Sistemas de Alertas Automáticos
Um sistema de alertas automático é uma ferramenta utilizada para monitorar os dados e prover alertas quando eventos críticos ocorrem, de forma a garantir que estes não sejam esquecidos pelo operador. De fato, uma consideração
Os sistemas de monitoramento digitais ajudam a visualizar o ambiente e fornecem informações em formatos que 2
290
importante é que operadores que visualizam telas de computador podem falhar em detectar alterações no visor, um fenômeno chamado change blindness [5] apud [1].
Isso eximia o operador de uma atribuição a mais na execução da tarefa de monitoramento. Consciência situacional
Change blindness tende a ocorrer concorrentemente com movimento de ícones, refresh da tela ou piscada de olhos. Ademais, operadores podem falhar em detectar alterações quando estiverem realizando outras tarefas, ou ainda, quando estiverem focados em um determinado nível de zoom e elas acontecerem fora da sua área de visão. As pessoas tendem a detectar mudanças quando um ícone aparece, desaparece ou muda de cor, mas tem mais dificuldades em detectar alterações no formato do ícone ou movimento, particularmente se o ícone está na periferia da tela e o movimento for pequeno [5] apud [1].
A consciência situacional (CS) está associada com o conhecimento e compreensão do meio ambiente. Mais do que isso, CS, é basicamente um "estado cognitivo humano" [6], construído com informações de várias fontes e afetado por fatores como personalidade, fadiga, carga de trabalho (trabalho mental), medo, etc. É muito importante que os operadores e tomadores de decisão tenham consciência do que está acontecendo nos sistemas de comando e controle, de forma que eles compreendam melhor as tarefas que eles estão conduzindo e o contexto no qual eles estão trabalhando.
O conceito de change blindness está ligado a sistemas de alarmes de duas formas. Primeiro, alertas podem chamar a atenção para eventos críticos quando o operador do sistema não o está monitorando propriamente, dessa forma o sistema influencia positivamente na tarefa do operador. Segundo, alertas podem “cegar” o operador capturando sua atenção em momentos inoportunos, fazendo com que este perca uma mudança na tela que deveria perceber, tal efeito é negativo à tarefa do operador. Ambos os efeitos afetam a consciência situacional do operador.
Nos anos 50, a força aérea dos Estados Unidos cunhou como elemento vitorioso dos combates ar-ar na Coréia e no Vietnam o termo ace factor ou o que eles chamavam ter uma boa consciência situacional [7], Desde que surgiu o termo CS, ele foi expandido para qualquer domínio que envolvesse tarefas humanas em sistemas complexos e dinâmicos. Assim como as aplicações sobre CS aumentaram e se propagaram, assim aconteceu também com as definições e técnicas de medidas. Algumas definições de CS são centradas no homem, outras são centradas na tecnologia, e algumas englobam ambos o aspecto humano e tecnológico. Mas todas as definições se referem ao conhecimento do que está acontecendo e do que irá acontecer logo a seguir. CS é importante porque freqüentemente norteia tomadas de decisões e ações. A definição mais aceita é a interpretação centrada no homem de Endsley [4] que diz que “consciência situacional é a percepção dos elementos no ambiente com um volume de tempo e espaço (nível 1), a compreensão do que eles significam (nível 2), e a projeção de seus status em um futuro próximo (nível 3)”. A figura 2 ilustra essa definição.
Tal dualidade de efeitos constitui-se na principal questão que o presente trabalho busca estudar e que está descrita nas seções seguintes. Ainda sobre os sistema de alarmes, podemos dizer que podem ser simples ou possuir várias funcionalidades projetadas para reduzir a intrusividade e ajudar nas análises. É interessante que o sistema de alertas possa ser habilitado ou desabilitado de acordo com a vontade do usuário e também ajustado para quais tipos de eventos vão disparar o alarme. Outra funcionalidade que o sistema pode fornecer é quanto à forma com que o alerta aparece, diferentes formatos podem ser usados, textuais, sonoros ou gráficos. Quando o alerta estiver desabilitado, é interessante que o sistema armazene um registro dos alarmes ocorridos e que não foram apresentados; contendo as informações relevantes. Dessa forma os usuários podem desabilitar os alertas durante um período de alto stress e acionar o registro dos alarmes no período de baixa carga de trabalho subseqüente para verificar se algum alarme permanece relevante, isto é, se a situação que levou a disparar o alerta ainda está acontecendo. O presente experimento foi executado em duas ocasiões. Na primeira ocasião os alertas foram implantados como uma mensagem textual que aparecia em uma janela no centro da tela, e os operadores eram obrigados a clicar nesta para prosseguir na atividade. Isso garantia que o operador não deixaria de prestar atenção ao alerta. No segundo experimento, os alertas foram implantados como uma mensagem textual em uma janela no canto inferior direito da tela. Os operadores não eram obrigados a clicar nela.
Figura 2. Modelo de CS Segundo Endsley.
3
291
Aplicações de comando e controle sempre se referem à CS como o conhecimento dos elementos físicos no ambiente (equivalente ao nível 1 de Endsley), enquanto que os outros níveis (níveis 2 e 3) são referidos como compreensão da situação e avaliação [8]. Definições de CS centradas em tecnologia estão ligadas a aplicações de monitoramento na medida em que elas referem-se à quantidade e qualidade das informações fornecidas pela tecnologia, incluindo visualização de dados.
Medição de Consciência Situacional
Vários métodos têm sido desenvolvidos para medição de consciência situacional, principalmente no domínio da aviação [10]. Eles incluem medidas baseadas em desempenho e comportamento, técnicas subjetivas e questionários/perguntas. Um exemplo de uma medida baseada em desempenho para o meio militar poderia ser o saldo de uma batalha, a taxa de perda entre os dois oponentes. Essas medidas são atrativas por que elas são diretas, não-intrusivas e geralmente fáceis de obter. Contudo, em um ambiente complexo, falta-lhes sensitividade e precisão, uma vez que outros fatores que não a consciência situacional contribuem para o resultado. Apurações subjetivas de consciência situacional são interessantes para prover medições individuais e verificar o que a pessoa está entendendo, porém pode faltar fidedignidade porque os participantes podem não estar certos de que estejam se lembrando de toda informação. Medidas por observação podem ser bastante válidas se os observadores são conhecedores da situação e estão treinados em observar o comportamento dos participantes. A não-intrusividade, nesse tipo de medição, é um fator positivo. Medidas objetivas produzem dados diretos e também detalhados, e têm sido extensivamente usadas e validadas [11], o desafio é adaptá-las ao domínio que se pretende medir. Questionários são melhores para medir CS de uma forma global sobre variadas condições experimentais e podem ser aplicados em realidades simuladas. Contudo, questionários administrados após o término de um exercício podem levar a falsos resultados devido ao atraso entre quando os eventos ocorreram e o questionamento em si.
Definições centradas no homem e no sistema têm ganhado maturidade e popularidade recentemente, e relacionam informações providas pelo sistema às informações necessárias ao operador. O modelo de Miller e Shattuck aproveita a definição do modelo centrado no homem de Endsley e o conceito de lentes em um processo multi-passo mostrado na figura 3 [9]. O lado esquerdo ilustra a parte tecnológica da consciência situacional, enquanto que o lado direito representa a parte da consciência situacional humana ou cognitiva.
Ainda conforme a figura 3, uma quantidade de informações provenientes do mundo real é detectada pelos sensores e uma quantidade filtrada é disponibilizada ao homem que percebe as informações mostradas, compreende, toma decisões a partir daquelas informações e finalmente as usa para prever o que irá acontecer a seguir.
Após um estudo das peculiaridades dos diferentes métodos, optou-se por utilizar o questionário SAGAT (Situation Awareness Global Assessment Technique). O SAGAT é uma medida direta e objetiva de CS e consiste em interrupções na simulação de um cenário, em momentos aleatórios, durantes as quais os participantes são questionados. As respostas das questões ou problemas são comparadas à situação no momento da interrupção. Esta comparação torna a técnica mais imparcial do que a autoavaliação ou observação da consciência situacional.
Independente da definição de CS, medi-la sempre é um desafio. A informação necessária em um determinado momento em uma particular situação depende dos objetivos e missões correntes da organização, que são sempre dinâmicos. Mesmo quando todas as informações estão acessíveis, somente um subconjunto delas é necessário para planejar e avaliar os objetivos correntes. Encontrar a informação certa no momento certo para estar consciente do que está acontecendo é um desafio, como é recolher informações pertinentes para poder tomar uma decisão. Nos complexos cenários do mundo real, é crucial que as questões e metodologias de medição de CS sejam adequadas para o domínio e o contexto em que elas serão utilizadas.
O SAGAT contém um conjunto de problemas que são relevantes ao domínio estudado e às questões, que abrangem os três níveis de consciência situacional, e são baseadas na CS requerida para a tarefa. Os requisitos críticos, para a CS, são analisados e identificados utilizando um GDTA (Goal Directed Task Analysis), um relatório específico de análise de tarefas cognitivas que é construído em sessões de estudo conduzidas por pessoal perito no domínio da tarefa [4]. A finalidade do GDTA é identificar os principais objetivos de uma determinada tarefa e as decisões que levam aos melhores resultados, bem como para delinear os requisitos críticos de CS necessários a cada objetivo e decisão [12]. Um subconjunto desses requisitos é argüido durante cada interrupção.
Figura 3. Um modelo dinâmico de cognição.
4
292
A principal limitação do SAGAT é que a simulação deve ser interrompida para coleta dos dados. Podemos elencar como vantagens que o SAGAT provê uma “fotografia” da consciência situacional corrente do avaliado; podem-se avaliar os três níveis de CS; é uma medida direta não dependente de recursos externos e pode ser objetivamente coletada e avaliada.
realizar todas as combinações dos tratamentos em cada bloco. A tabela 1 mostra um exemplo do delineamento para quatro operadores.
Com alertas
SET UP EXPERIMENTAL
Sem alertas
Foi montado um experimento que busca responder como feedbacks provenientes de sistemas de alertas automáticos afetam a CS sob variadas condições de carga de trabalho. Foram levantadas duas hipóteses: H0: CS é igual em ambas as condições de alertas (habilitado e desabilitado).
A
B
A
B
operador 3 A
Baixa dificuldade
pts
-
-
pts
pts
-
-
pts
Alta dificuldade
pts
-
-
pts
pts
-
-
pts
Baixa dificuldade
-
pts
pts
-
-
pts
pts
-
Alta dificuldade
-
pts
pts
-
-
pts
pts
-
H1: CS é diferente com alertas habilitados e com alertas desabilitados.
operador 1
operador 2
operador 4 B A
Tabela 1. Exemplo de um BIBD.
Nestes experimentos os participantes e os cenários A e B são considerados como blocos, desta forma, segundo Montgomery [13], as diferenças entre a pontuação de cada participante e entre as simulações A e B não irão influenciar no resultado da análise dos tratamentos. Consideramos como tratamentos o uso dos alertas (habilitados ou não) e a dificuldade (baixa ou alta), que são as grandezas que queremos analisar se influenciam ou não nesse experimento.
Método
Após o preenchimento de um termo de consentimento, os participantes realizaram um treinamento na ferramenta onde todas as informações necessárias ao cumprimento da tarefa foram passadas. Em seguida, realizaram uma avaliação do treinamento para garantir que estavam em condições de continuar no experimento. Após essa avaliação foi dado um tempo para prática no sistema e no questionário de avaliação, em uma simulação de um cenário prático. Após essas etapas, o participante estava apto a iniciar o experimento propriamente dito.
A tarefa de monitoramento que o participante deve executar consiste em acompanhar com o olhar as alterações/atualizações de ícones e feições do programa, executar operações de zoom conforme convier e realizar pesquisa em itens específicos, também quando julgar necessário.
Durante a execução do experimento os participantes foram avaliados utilizando o software duas vezes, uma vez com o sistema de alertas habilitado e outra vez com o sistema de alertas desativado, não necessariamente sempre nesta ordem. Ao utilizar o programa, o participante monitorava uma simulação e, em seguida, respondia ao questionário SAGAT. Ao utilizar o programa pela segunda vez, o operador não podia monitorar a mesma simulação, pois já se sabia o que iria acontecer. Cada participante então teve de monitorar duas simulações diferentes (cenários experimentais A e B).
Ao final do experimento os participantes ainda realizavam uma pesquisa de opinião respondendo se o uso dos alertas foi positivo ou negativo para a tarefa de monitoramento. Experimento 1
O experimento 1 foi realizado no 5º Batalhão de Infantaria Leve, em Lorena – SP. Participaram do experimento: quinze militares de carreira do Exército Brasileiro, voluntários e devidamente autorizados pelo comandante da unidade.
A fim de avaliar também a influência da carga de trabalho, cada cenário foi dividido em duas etapas, uma com baixa dificuldade e outra com alta dificuldade. A dificuldade foi caracterizada pela quantidade de eventos que o operador teve que monitorar por intervalo de tempo. Esses eventos aconteciam de forma aleatória, sendo que em baixa carga de trabalho acontecia em média um evento a cada 30 segundos, e com alta carga de trabalho acontecia, em média, um evento a cada 15 segundos. Cada participante teve de monitorar então dois cenários diferentes, cada um deles sob duas condições de dificuldade.
Resultados
O software estatístico “R” foi utilizado para a realização dos cálculos e análises [14]. Trata-se de um software open source, freeware, que está se tornando um padrão no mundo acadêmico. A fim de verificar a influência dos componentes no fenômeno foi conduzida uma análise de variância (ANOVA), separando como tratamentos os fatores alertas e a carga (dificuldade da tarefa), e como blocos os fatores cenários e participantes, obtendo-se o seguinte resultado:
Tal delineamento é chamado de delineamento por blocos incompletos balanceados (BIBD) [13]. Tal escolha foi feita porque não era possível o mesmo participante realizar o mesmo cenário com e sem alertas, ou seja, não era possível 5
293
A ANOVA evidenciou uma diferença entre as condições de alertas no experimento, mas nenhuma relação com o nível de dificuldade da tarefa. Baseado nisso, resolvemos investigar um pouco mais o fenômeno. Um resultado interessante foi obtido quando geramos um gráfico boxplot dos alertas e da carga (dificuldade da tarefa), conforme a figura 5. O resultado aponta que os cenários A e B podem ser considerados equivalentes (Pr > 0,05), o que significa que os cenários, apesar das simulações distintas, não influenciam nos resultados. A pontuação entre os participantes foi muito diferente (Pr < 0,05). O fato de eles serem considerados como bloco foi importante para que a influência dessa diferença não residisse nos erros aleatórios. O objetivo não era verificar quem obteve uma melhor consciência situacional, mas sim se existe uma diferença de CS com uso de alertas ou não. Quanto à carga de trabalho, o resultado da ANOVA não apresentou diferença significativa (Pr > 0,05), ou seja, apesar da quantidade de eventos em alta dificuldade ser superior à quantidade de eventos em baixa carga, a pontuação SAGAT dos questionários foi equivalente nas duas condições. Quanto ao fator alerta, o resultado aponta uma diferença entre o uso de alertas com uma margem de erro de 5% (Pr < 0,05).Observando o gráfico boxplot apresentado na figura 4, a pontuação sem o uso de alertas foi superior à obtida com o uso de alertas, ou seja, o uso de alertas no experimento gerou uma menor consciência situacional dos participantes.
Figura 5. Boxplot da pontuação alertas x carga.
Esse gráfico mostra a pontuação SAGAT para a combinação das amostras com e sem alertas e com dificuldade baixa (ST) e dificuldade alta (HD). Chama a atenção a diferença de pontuação no uso de alertas quando os participantes estavam submetidos a uma alta carga (HD).Isso sugere que a diferença entre a pontuação relativa ao uso dos alertas é mais enfatizada quando as condições de carga de trabalho são altas. Discussão
O resultado da ANOVA indica que, sobre alta carga de trabalho, a diferença induzida pelo uso dos alertas foi significativa. A CS foi mais baixa quando os alertas estavam ligados. Este resultado confirma que a automação, incluída em um sistema, introduz conseqüências negativas, incluindo a complacência, aumentando os requisitos de monitoração, e perda de CS [15] apud [1]. Apesar do resultado contrário do questionário SAGAT, foi observado que, ao final do experimento, os participantes responderam que os alertas constituíram auxílios positivos na tarefa de monitoramento.
Figura 4. Boxplot da pontuação com e sem alertas.
Os alertas podem dar uma falsa sensação de segurança aos usuários, e mesmo assim, em alguns casos, eles podem ser úteis em sistemas de comando e controle, mas atenção especial deve ser dada sobre quando usá-los em situações de alta carga de trabalho mental.
É importante fazer uma checagem da adequação do modelo. Fazendo uma análise dos gráficos de aleatoriedade dos resíduos, normalidade dos resíduos e resíduos versus valores preditos, não identificamos nenhuma tendência, e, portanto consideramos o modelo válido.
Depois de examinar os resultados do experimento 1, foi levantado que os alertas, da maneira que foram colocados, 6
294
poderiam ter influenciado de maneira negativa na CS dos operadores, uma vez que aparecia como uma mensagem textual no centro da tela, e o operador deveria clicar com o mouse no botão OK da janela para continuar sua tarefa (figura 6).
Figura 7. Exemplo de alerta do experimento 2. Resultados
O mesmo software estatístico do experimento 1 foi utilizado para a realização dos cálculos e análises, e o mesmo delineamento BIBD também foi utilizado, desta vez para 18 participantes.
Figura 6. Exemplo de alerta do experimento 1.
Tal interação com o alerta foi forçada para garantir que o mesmo não passasse despercebido pelo operador, pois se acreditava que se essa interação fosse dispensada, o alerta poderia não ser notado. Conseqüentemente foi idealizado um segundo experimento a fim de avaliar a posição dos alertas e a interação obrigatória.
Foi realizada uma análise de variância (ANOVA) separando como fatores os alertas e a carga (dificuldade da tarefa) e como blocos o cenário e os militares participantes, obtendo-se o seguinte resultado:.
Experimento 2
O experimento 2 foi realizado na 2a Companhia de Comunicações Leve, em Campinas – SP. Participaram do experimento dezoito militares de carreira do Exército Brasileiro, voluntários e devidamente autorizados pelo comandante da unidade. Como o sistema de alertas foi bem aceito pelos participantes, apesar dos resultados negativos, este segundo experimento foi realizado para confirmar se a apresentação dos alarmes poderia ter influenciado o resultado.
O novo resultado aponta uma diferença nos dois fatores considerados como blocos, os cenários A e B e os participantes (Pr < 0,05). Foi importante tê-los considerados como bloco para que a influência dessa diferença não recaísse nos erros aleatórios.
O experimento aconteceu conforme o anterior: mesmos cenários táticos, mesmas avaliações SAGAT, mesmo tempo de execução e os mesmos eventos geradores de alertas. As únicas diferenças foram na apresentação dos alertas e na interação.
Quanto aos tratamentos carga e alerta e a interação entre os dois, o resultado da ANOVA não apresentou diferença significativa (Pr > 0,05), ou seja, a pontuação SAGAT dos questionários foi equivalente nas diferentes condições de alertas e carga.
Os alertas agora aparecem no canto inferior direito da tela e o operador não precisa mais interagir com ele (figura 7), pois não é necessário clicar no alerta para poder continuar a tarefa. O alerta aparece quanto um evento crítico ocorre, se nada for feito a janela permanece em segundo plano e reaparece, na frente, quando um novo alerta é disparado.
Observando o gráfico boxplot apresentado na figura 8 verificamos que a pontuação em relação ao uso dos alertas foi equivalente, ou seja, não houve indícios estatísticos que mostrassem que os alertas influenciaram na consciência situacional dos participantes.
7
295
prejudicava a visão geral do operador naquele momento, como mostrou o experimento 1. Os resultado corroboraram os achados de outros autores [15] apud [1]. Porém, ao ser realizar uma investigação na interface do alerta, um segundo experimento mostrou que a mudança de posição e a não-obrigatoriedade da interação com o alerta ajudaram a anular o resultado negativo do primeiro experimento. Sob a nova interface, a CS dos participantes foi igual em ambas as condições de alertas (habilitado e desabilitado). Apesar dos alertas não interferirem diretamente na CS, foi verificado que, para os participantes, os alertas ajudavam a diminuir a complexidade cognitiva do sistema. O sistema de alertas ao prover os participantes com pistas cognitivas sobre eventos importantes permitiu que estes acreditassem que os alarmes pudessem lhe salvar de situações críticas, diminuindo sua responsabilidade.
Figura 8. Boxplot da pontuação com e sem alertas.
Estes resultados sugerem que alertas automáticos não prejudicam a CS dos operadores, e nem facilitam. Porém os participantes acreditaram que o sistema de alarmes lhes ajudara. Isto pode indicar que o benefício do sistema de alarmes é mais psicológico do que prático. Considerando a complexidade de operação dos sistemas de monitoramento, isso pode ser de fato um benefício concreto.
Discussão
Ao contrário de outros autores que expressaram que a automação pode reduzir a CS pela redução de recursos cognitivos [15] apud [1], este segundo experimento mostrou que nossa hipótese nula não pôde ser rejeitada. A CS é igual em ambas as condições de alertas (habilitado e desabilitado).
AGRADECIMENTOS
Aos comandantes e militares voluntários do 5º Batalhão de Infantaria Leve – Lorena e da 2a Companhia de Comunicações Leve – Campinas, que gentilmente autorizaram e disponibilizaram seu tempo de expediente, respectivamente, para participar deste trabalho.
A alteração na exibição/interação com os alertas anulou o resultado negativo do primeiro experimento. Foi verificado que os operadores puderam realizar a tarefa de monitoramento, zoom e pesquisa sem o ônus de fechar obrigatoriamente os alertas. Os alertas foram percebidos pelos operadores, mas mesmo assim não tiveram efeito sobre a CS. Talvez se os participantes tivessem realizando outras atividades, e não focados 100% na tarefa de monitoramento, os alertas poderiam apresentar resultados mais positivos.
REFERÊNCIAS
1. Barnett J. S. And Ross J.M. Automated Feedback and Situation Awareness in Net-Centric C3, United States Army Research Institute for the Behavioral and Social Sciences, Fevereiro 2008. 2. Parasuraman, R., Mouloua, M., Molloy R. & Hilburn, B. Monitoring automated systems. In R. Parasuraman and M Mouloua (Eds.), Automation and human performance: Theory and applications. (pp. 117-136). Mahwah, NJ: Lawrence Erlbaum Associates.
Um resultado interessante foi que, novamente, os participantes responderam que os alertas influenciaram de forma positiva na tarefa de monitoramento. CONCLUSÃO
Este trabalho mostrou o resultado de dois experimentos sobre alertas automáticos em sistemas digitais de monitoramento. A CS foi medida usando o questionário SAGAT em uma simulação utilizando o software “C2 em Combate” do Exército Brasileiro, e com um sistema de alertas ativado e desativado.
3. Billings, C. E. Aviation automation: The search for a human-centered approach. Mahwah, NJ: Lawrence Erlbaum.10Spick, M. The ace factor: Air combat and the role of situational awareness. Annapolis, MD: Naval Institute Press. 1997. 4. Endsley M. R. Direct measurement of situation awareness: Validity and use of SAGAT. In M. R. Endsley and D. J. Garland (Eds.), Situation Awareness Analysis and Measurement. (pp. 147-173) Mahwah, NJ: Lawrence Erlbaum Associates.2000.
Ao se propor uma nova funcionalidade, que é o sistema de alertas para auxiliar no monitoramento de atividades, imaginava-se que tal uso iria aumentar o ganho de informações, e com isso, contribuir para o aumento da CS. Mas os testes não mostraram isso. Sob condições de alta carga de trabalho, os alertas diminuíram a CS. Os alertas que surgiam na tela atrapalhavam o monitoramento, e isso
5. Durlach, P. J. e Chen, J. Y. C. Visual change detection in digital military displays. Paper presented at the 8
296
Interservice/Industry Training, Simulation, and Education Conference (I/ITSEC), December 1-4, 2003.
11. Endsley, M, et al. Modeling and Measuring Situation Awareness in the Infantry Operational Environment. United States Army Research Institute for the Behavioral and Social Sciences, 1999.
6. Dixon, M. Combat ID and Force Traking â&#x20AC;&#x201C; Technological Challenges and Perspectives. Centre for Opeational Research and Analysis, Defence R&D Canada. IV SEDOP. Julho, 2008.
12. Bolstad, C.A., Cuevas, H.M. Team Coordination and Shared Situation Awareness in Combat Identification. SA Technologies. Marietta, GA.
7. Natter, Mandy, Ockerman Jennifer, Baumgart Leigh. Review of Cognitive Metrics for C2. 13th International Command and Control Research and Technology Symposium, C2 for Complex Endeavors.
13. Montgomery, D. Design and Analysis of Experiments. New York: John Wiley & Sons, 2001. 14. The R Project for Statistical Computing version 2.6.2. 2008. http://www.r-project.org.
8. Natter, M, Ockerman, J e Baumgart, L. Review of Cognitive Metrics for C2. 13th International Command and Control Research and Technology Symposium, C2 for Complex Endeavors. 2008.
15. Bowers, C. A., Oser, R. L., Salas, E. & Cannon-Bowers, J. A. (1996). Team performance in automated systems. In R. Parasuraman and M. Mouloua (Eds.), Automation and human performance: Theory and applications. (pp. 243-263). Mahwah, NJ: Lawrence Erlbaum Associates.
9. Miller, N E., Shattuck, L. A process model of situated cognition in military command and control. San Diego, 2004. 10.Stanton N, et al. Human Factors Methods: A Practical Guide for Engineering and Design. Ashgate Publishing, Ltd, 2005.
9
297
cases de mercado da teoria à prática
298
Desenvolvimento de uma estratégia de inovação em Design de Interação James Italiano Instituto Nokia de Tecnologia Av. Torquato Tapajós, 7200 – Manaus/AM james.italiano@openbossa.org +55 92 21261140 ABSTRACT
The capability of an entrepreneur to innovate has become an essential characteristic of survival in the current economy. However, innovation requires doing things in a different manner and accepting risks, something that a great number of companies still try to avoid. This paper describes an internal project undertaken at the Nokia Institute of Technology – INdT, a non-profit organization in Manaus Brazil, with the objective of breaking the daily work routine and fomenting practices of innovation amongst its employees. It details the participants involved in the project, the methodology adopted, the evolution of the project over the course of six months, the obtained results and the opinions of the professionals that took part in the process. Author Keywords
Design management, innovation, organization strategy. ACM Classification Keywords
H.5.3. Group and Organization Interfaces: Organizational design. INTRODUÇÃO
Devido às rápidas mudanças tecnológicas e um público consumidor cada vez mais exigente, a indústria de dispositivos móveis tem procurado se adaptar constantemente a um cenário onde novos aparelhos são lançados em frações de semanas. Dentro desse contexto, o design torna-se determinante na humanização inovadora das tecnologias e o fator crucial na mudança cultural e econômica [4]. Contudo, devido à pressão da concorrência e a necessidade de uma resposta cada vez mais rápida ao mercado, os cronogramas são reduzidos e boa parte das empresas adotam um comportamento “estável”. Segundo [2], o comportamento estável pode ser definido pelo lema “não balance o barco”: a organização somente muda quando em crise; tem baixa preferência ao risco; sempre busca restaurar o status quo; o foco do aprendizado é tentativa e erro; administra-se por manuais e métodos. Esse tipo de comportamento estimula a rotina, que segundo [10], é uma barreira para inovação: [...] Conhecimento e hábito uma vez adquiridos se enraízam em nossa pessoas com trilhos à terra. Eles não precisam ser continuamente renovados ou reproduzidos de maneira consciente, mas se
Miguel Peres Instituto Nokia de Tecnologia Av. Torquato Tapajós, 7200 – Manaus/AM miguel.peres@openbossa.org +55 92 21261140 alojam no estrato do subconsciente. [...] Tudo que pensamos, sentimos ou fazemos com freqüência torna-se automático. [...] Essa enorme economia de energia que ao mesmo tempo facilita o desempenho da rotina em indivíduos e organizações, implica que cada passo dado fora do caminho habitual pareça muito mais difícil [5]. Pode-se observar esse comportamento com certa freqüência, dentro de ambientes como agências de publicidade e pequenas e médias empresas de TI . Esta realidade também está presente, ainda que em menores proporções, em indústrias e institutos de pesquisa que nao adotam uma postura empreendedora e evitam o confronto entre o retorno e o risco, relação necessária para o desenvolvimento da prática de inovação. Por outro lado, algumas empresas seguem na contra-mão e adotam um comportamento “de iniciativa” [1], onde a ordem, estrutura e conservação (caracterizadas pela rotina, disciplina, tradição, estabilidade, rigidez, repetição, centralização e padronização) cedem espaço para a liberdade, ação e mudança (caracterizadas pela inovação, autonomia, contemporalidade, instabilidade, flexibilidade, originalidade e criatividade). No Google, um dos maiores expoentes dessa cultura, os funcionários são incentivados a usar 20% de seu tempo (1 dia por semana) para desenvolverem projetos pessoais. Esta técnica, conhecida como Innovation Time-Off (ITO), além de estimular os funcionários pode trazer resultados positivos para empresa. Segundo Merissa Mayer, Vicepresidente de Pesquisa de Produtos e Experiência do Usuário no Google, mais de 50 novos produtos nasceram dessa prática, entre eles o Gmail e o AdSense [6]. Este artigo tem como objetivo descrever um projeto interno do Instituto Nokia de Tecnologia - INdT1 realizado pelo
1
Instituição sem fins lucrativos fundada no Brasil pela Nokia em 2001 com base nos incentivos da Lei de Informática (Zona Franca de Manaus).
299
Etapa
Duração
Análise
2 meses
Geração de Alternativas
2 meses
Avaliação das Alternativas
1 mês
Realização da solução
1 mês
Tabela 1. Cronograma sugerido pelo coordenador.
Grupo de Software and User Interface – SW&UI2 para quebrar a rotina de trabalho e fomentar a inovação. METODOLOGIA
A Equipe de Design do grupo de SW&UI em Manaus é composta por cinco Designers: dois com foco em Arquitetura da Informação e Usabilidade, dois Designers Gráficos e um Designer de Interação que também atua como líder técnico. Ficou definido que o líder técnico atuaria como coordenador e facilitador do projeto, enquanto três dos demais Designers ficariam responsáveis por gerar, cada um, uma proposta de produto com tema livre dentro de um período de seis meses. O quarto integrante da equipe de design não participou do projeto pois estava alocado em um treinamento externo. No INdT os funcionários são avaliados semestralmente a fim de medir a evolução técnica e a contribuição do funcionário para os projetos da instituição. Alem de servir como critério de promoção, essa avaliação também é usada como métrica para definir o bônus semestral de cada funcionário. Sendo assim, além de possibilitar a realização de todas as etapas de um projeto de design, o prazo se encaixava com o calendário da instituição. Nesse período ficou estipulado que cada Designer reservaria uma tarde por semana e mais uma hora nos demais dias úteis, aproximadamente 18% da carga horária de trabalho, para elaborar sua proposta de produto. Além do prazo estipulado, os Designers também foram estimulados a dedicar o tempo livre entre os projetos regulares da instituição para a mesma finalidade. Com o calendário definido, cada participante foi instruído a trabalhar o tema de sua escolha seguindo quatro etapas durante o processo de design. “Processos de design são, processos criativos e de grande esforço intelectual onde se faz um balanceamento entre forma e função para criar um
2
O INdT é dividido em 4 grupos (Streams) que atuam em áreas distitintas, são eles: Network Technologies – NT, Product and Manufacturing – PM, Service Experience – SE e Software and User Interface – SW&UI. O grupo de SW&UI concebe e cria implementações de referência para plataformas móveis utilizando uma abordagem de experiência centrada no usuário. Atualmente este grupo é composto de 60 programadores e 15 Designers distribuídos em duas sedes, localizadas em Manaus e Recife.
objeto útil e agradável aos usuários” [3]. Para [7] esses processos normalmente possuem quatro etapas, são elas: ¥ Análise do Problema: etapa em que o público-alvo e seu contexto são analisados e os objetivos e problemas são definidos. ¥ Geração de Alternativas: etapa em que são geradas as idéias e conceitos a serem avaliados. ¥ Avaliação de Alternativas: etapa em que os conceitos são avaliados e submetidos à seleção da melhor proposta a ser integrada ao produto. ¥ Realização da solução do problema: etapa em que é realizado o desenvolvimento e implementação da proposta. Baseado nestas etapas, foi sugerido pelo coordenador o cronograma descrito na Tabela 1. Ao final da quarta fase, cada Designer deveria apresentar o conceito de seu produto a um comitê avaliador. Este comitê, composto pelo coordenador do projeto e por três programadores do grupo de SW&UI, ficou responsável por analisar a criatividade, qualidade, viabilidade técnica e a pertinência do projeto para instituição. Apesar do calendário proposto, os Designers tiveram a liberdade de utilizar o tempo que achassem necessário para cada fase, sob a condição de não deixarem de executar nenhuma das etapas citadas. CRIAÇÃO DAS PROPOSTAS
A primeira etapa realizada foi a definição do tema de cada integrante. Através de pesquisas e debates sobre os atuais nichos de mercado, a Equipe de Design chegou a três temas específicos: Serviços para Internet, Aplicações para Dispositivos Móveis e Conceitos para Aparelho Celular. No decorrer do primeiro mês, todos os integrantes realizaram um levantamento de similares e buscaram informações básicas sobre o mercado e sobre o públicoalvo, procurando especificar ainda mais o foco das propostas. O Designer com o tema de Serviços para Internet procurou focar na otimização de serviços já existentes e como adaptá-los para dispositivos móveis; o Designer com tema de Aplicações ainda estava indeciso com a escolha de um foco, sinalizando inicialmente assuntos relacionados a mídias; o Designer com tema de Conceitos para Aparelho Celular focou em um telefone de pulso para praticantes de esportes. Devido ao hábito de não executar todas as etapas de forma linear, o Designer com tema de Conceito para Aparelho Celular começou criando esboços visuais, definindo formas, posicionamento e algumas possíveis funções, antes mesmo de uma pesquisa mais profunda sobre o mercado e públicoalvo. Segundo o próprio Designer, seu conhecimento de técnicas de ilustração foi o fator decisivo para antecipação do visual de sua proposta logo no primeiro mês. No segundo e no terceiro mês houve uma redução na evolução das propostas devido ao aumento da demanda nos projetos
300
Figura 1. Estrutura do aplicativo de microblogging.
Figura 2. Tela principal do aplicativo de edição de vídeo.
regulares da instituição. O Designer com tema de Aplicações ainda estava com o foco indefinido.
mensagem junto com uma coordenada geográfica e/ou visualizar comentários feito sobre a partir de um determinado local.
Nos dois meses seguintes a maior parte das propostas já estavam bem delineadas, o celular de pulso tinha a maior parte do visual definido e o Designer com tema de Serviços para Internet já havia iniciado a elaboração dos fluxos de tarefas da sua proposta, um cliente3 para o Twitter com suporte a GPS. O aplicativo relacionado a mídias ainda permanecia indefinido. Novamente, houve momentos onde a demanda nos projetos regulares aumentou fazendo com que alguns integrantes tivessem o tempo reduzido para desenvolverem suas propostas. No último mês, o Designer responsável pela tema de Aplicações para Dispositivos Móveis conseguiu definir o foco de sua proposta: um editor de vídeo para aparelhos celulares com tela sensível ao toque. Com o prazo de entrega perto do fim, o design gráfico da aplicação teve que ser concebido em paralelo com a pesquisa de público-alvo. Por outro lado, o Designer da proposta do cliente para o Twitter já havia detalhado e finalizado toda a documentação, enquanto a proposta do celular de pulso já estava com o conceito finalizado, o que permitiu ao autor usar o prazo restante para realizar uma pesquisa de aceitação do produto junto a comunidade esportiva.
A segunda proposta foi um aplicativo de editor de vídeo para dispositivos móveis com tela sensível ao toque (Figura 2). Voltado para usuários leigos ou com pouco conhecimento de edição de vídeo, a aplicação permite ao usuário editar e mesclar imagens, vídeos e músicas capturadas com o dispositivo de forma linear em um único arquivo e com possibilidade de posterior publicação em redes sociais. A terceira proposta apresentada foi um conceito de produto para desportistas que não desejam abrir mão das facilidades oferecidas por um telefone celular durante a prática de atividade física (figura 3). Segundo o Designer responsável pela proposta, a intenção foi criar um produto que aliasse as funcionalidade encontradas em aparelhos para prática esportiva (cronômetro, medidor de freqüência cardíaca, GPS, etc.) às funções mais importantes de um aparelho celular (receber e efetuar ligações, escutar música, etc.).
Na última semana do projeto, a interação entre os Designers foi intensificada, a ajuda mútua foi notória e os conhecimentos e habilidades de cada integrante complementaram-se, colaborando para que todas as propostas fossem concluídas ainda que com um pequeno atraso de 2 dias. RESULTADOS
Ao final de todo processo, a iniciativa gerou três propostas de design alinhadas com o mercado e com as expectativas do grupo SW&UI. A primeira proposta (Figura 1) foi um aplicativo de microblogging4 que permite ao usuário publicar uma
3 4
Aplicativo que permite fazer uso de um servidor. Ato de postar pequenos textos (até 140 caracteres) em um
Figura 3. Conceito de produto para desportistas.
blog pessoal, em especial a partir de comunicadores instantâneos ou de um celular [8].
301
CONCLUSÃO
Analisando os resultado, pode-se observar que durante o desenvolvimento dos projetos houve dificuldades no cumprimento das etapas do processo de design e no gerenciamento de tempo. Em contrapartida, a interação e ajuda mútua entre os Designers e o coordenador possibilitou a troca de experiências e aproximou os participantes, contribuindo para uma equipe mais concisa e comunicativa. Foi notório também a evolução da equipe na apresentação da propostas, demonstrando o amadurecimento profissional gerado pelo processo. Segundo os Designers quer participaram do projeto, o fator decisivo para o seu sucesso foi a experiência de sentirem-se responsáveis por todo o ciclo de uma proposta de design com foco no usuário. Os participantes foram unânimes em afirmar que essa experiência deveria ser repetida com mais freqüência. Conclui-se, então, que empresas e instituições que estimulam seus funcionários a conduzirem projetos pessoais de design dentro de suas instalações e durante o expediente de trabalho, estão contribuindo efetivamente para fomentar a prática da inovação e auxiliando o amadurecimento interno do processo de design. REFERÊNCIAS BIBLIOGRÁFICAS
1.Alves, S. A multidimensionalidade nas organizações empresariais: proposta de um modelo analítico. Revista de Administração Contemporânea 8, 2 (2004), 71-93. 2.Araújo, U. and Cabral, S. Relações entre inovação e rotina: Evidências de um caso empírico. Revista Eletrônica de Administração 14, 60 (2008), 2.
3.Chiou, F. We are all connected: The Path from Architecture to Information Architecture. Boxes and Arrows, 2003. http://www.boxesandarrows.com/view/we_are_all_conne cted_the_path_from_architecture_to_information_archite cture. 4.Definition of design. International Council of Societies of Industrial Design. http://www.icsid.org/about/about/articles31.htm?query_p age=1. 5.Fagerberg, J. and Verspagen, B. Innovation Studies - the emerging structure of a new scientific field. Centre for Technology, Innovation and Culture, University of Oslo, 2009. 6.Iyler, B. and Davenport, T. Reverse Engineering: Google's Innovation Machine. Harvard Business Review (2008), 59-68. 7.Löbach, B. Diseño Industrial: bases para la configuración de los productos industriales. Gustavo Gili, Barcelona, 1981. 8.McFedries, P. Technically Speaking: All A-Twitter. Spectrum, IEEE 44, 10 (2007), 84. 9.Reis, G. Por uma metodologia de arquitetura de informação. Webinsiders, 2006. http://webinsider.uol.com.br/index.php/2006/06/16/poruma-metodologia-de-arquitetura-de-informacao/. 10.Schumpeter, J. The Theory of Economic Development. Harvard University Press, 1934.
302
Design de interface para questionário online do Censo Demográfico 2010 Taissa Abdalla Filgueiras de Sousa Designer e especialista em análise de sistemas IBGE – Instituto Brasileiro de Geografia e Estatísica (taissaabdalla@ibge.gov.br)
RESUMO
Em 2007, o IBGE começou a utilizar dispositivos móveis como ferramenta de coleta de dados no Censo Agropecuário e na Pesquisa Nacional por Amostra de Domicílios (PNAD). Em 2010, a expectativa é a realização da coleta do Censo Demográfico também pela Internet. Com base na experiência de coleta em PDA obtida nos projetos anteriores, foi desenvolvida uma interface web para o Censo 2010 para este fim. A nova interface buscou contemplar novos paradigmas decorrentes da mudança de mídia impressa para eletrônica e tem como principais desafios motivar o preenchimento pelo cidadão através da Internet e preservar o entendimento dos conceitos do IBGE. Este artigo visa descrever as etapas de desenvolvimento deste. Palavras-chave
Pesquisa, interface, usabilidade, avaliação heurística, design de interação. ABSTRACT
In 2007, IBGE started to use mobile devices for data collection in household surveys. In 2010, the expectative is realize the data collection of Demographic Census also through the Internet. Based on the experience of data collection through the PDA obtained in previous projects, we developed a web interface to the Census 2010 for this purpose. The new interface aimed to address new paradigms of the switching from printed media to electronic media and the main challenges are motivate citizens to fill through the Internet and preserve the understanding of the concepts of the IBGE. Author Keywords
Survey, interface, usability, heuristic evaluation, interaction design. ACM Classification Keywords
H5.m. Information interfaces and presentation (e.g., HCI): Miscellaneous.
Luiz Agner DSc, Programador visual e professor IBGE – Instituto Brasileiro de Geografia e Estatística (luizagner@gmail.com)
INTRODUÇÃO
Em 2010, o Instituto Brasileiro de Geografia e Estatística (IBGE) realizará o 12º. Censo Demográfico, um retrato em extensão e profundidade da população brasileira e das suas características sócio-econômicas e, ao mesmo tempo, na base sobre a qual deverá se assentar todo o planejamento público e privado no Brasil na próxima década. (IBGE, 2009). O Censo Demográfico é a maior pesquisa realizada pelo IBGE e abrange todos os domicílios brasileiros. Nele são pesquisados os seguintes temas: características do domicílio, emigração internacional, religião, educação, trabalho, nupcialidade, fecundidade e falecimento. Seus resultados mostram a realidade do país e servem como base para “calibrar” os dados de outras pesquisas realizadas entre um Censo e outro. O IBGE realiza o Censo Demográfico a cada 10 anos. Durante esses longos períodos muitas mudanças ocorrem nas sociedades, criando a necessidade de adaptação da pesquisa em todos os aspectos: conteúdo, abordagem, tecnologia etc. Esse artigo irá tratar somente sobre a nova interface desenvolvida para Internet, ferramenta que se faz necessária nos dias de hoje pela facilidade que fornece ao cidadão, e também para manter a imagem institucional da organização. OBJETIVO DO PROJETO
O projeto apresentado neste artigo inscreve-se dentro da prática cotidiana em design de interação. Para PREECE, ROGERS e SHARP (2005), além de enfocar a eficiência e a produtividade do trabalho, o design de interação está preocupado com a criação de sistemas satisfatórios, agradáveis, úteis, motivadores e interessantes. Segundo KOLKO (2007), o Design de interação representa a criação de um diálogo entre pessoas e produtos, serviços ou sistemas. A tarefa do designer de interação é árdua, pois engloba a função, a linguagem e os seus significados. Para PREECE, ROGERS e SHARP (2005), por Design de interação pode-se entender o Design de produtos interativos que fornecem suporte às atividades cotidianas das pessoas, seja no lar ou no trabalho.
303
Motivado pela possibilidade de obter um maior número de entrevistas com a implantação do questionário web, o IBGE preparou um sistema para disponibilizar aos cidadãos brasileiros o questionário online do Censo 2010. Com a implementação desta facilidade, o IBGE pretende abranger também domicílios cujos moradores não têm disponibilidade de tempo para conceder entrevista, não são encontrados durante o horário das entrevistas (9h às 21h), ou se recusam a receber o recenseador, por motivo de segurança. Além disso, o questionário pela Internet é importante para manutenção da imagem da Instituição, visto que alguns institutos de estatística internacionais já iniciaram seus testes de coleta pela Internet com um pequeno percentual de domicílios. Para se desenvolver a interface do sistema brasileiro foram estudadas as experiências obtidas pelo Australian Bureau of Statistic na Internet e pelas pesquisas realizadas no IBGE com a utilização de dispositivos móveis (PDAs). Isso resultou numa nova interface diferenciada e com particularidades que estão sendo testadas pela primeira vez nos pré-censos (testes do censo), realizados em 2009.
motivos. Primeiramente, o questionário online possibilita que o informante inicie o questionário e depois continue o preenchimento a partir de qualquer computador, inclusive através de lan houses. Além disso, permite uma interação do usuário web com o IBGE através de chats e facilitava a inclusão de outras mídias para orientar o usuário, tais como vídeos, links, textos, entre outros. Entre os requisitos dessa solução está o desafio em criar uma interface amigável para motivar o preenchimento por parte do cidadão-informante, o que foi desenhado com base nos princípios heurísticos de Jakob Nielsen: 1- Visibilidade do status do sistema; 2- Equivalência entre o sistema e o mundo real; 3- Controle do usuário e liberdade; 4Consistência e padrões; 5- Prevenção de erro; 6Reconhecer em vez de relembrar; 7- Flexibilidade e eficiência de uso; 8- Estética e design minimalista; 9Auxílio ao usuário para reconhecer, diagnosticar e recuperar-se de erros; 10- Ajuda e documentação (NIELSEN, apud AGNER, 2009). “1- Visibilidade do status do sistema: O sistema deve sempre manter o usuário informado sobre o que está acontecendo através de feedback apropriado.”
A COLETA DE DADOS PELA INTERNET
O sistema de coleta do Censo 2010 pela web funcionará da seguinte forma: o recenseador vai até o domicílio do informante. Ao ser recebido pelo morador, caso este opte por esta opção, o recenseador entrega-lhe um envelope contendo os dados de acesso ao questionário online. O código do envelope entregue é associado àquele domicílio no PDA. A partir deste momento, o morador já poderá responder o questionário pela Internet e as informações serão gravadas diretamente no banco de dados do IBGE.
Figura 2 - Tela da pergunta 7 da parte 2 – Características do Domicílio.
O conteúdo foi dividido em partes de acordo com cada tema (2-característica do domicílio, 3-emigração, 4responsabilidade do domicílio, 5-lista de moradores e relação com responsável, 6-característica dos moradores, 7falecimento) para formar uma navegação amigável. Em cada uma dessas partes, incluímos a informação do número máximo de questões a ser respondida sempre exibindo de forma visual o status de cada questão, permitindo retornar a qualquer momento para questões anteriores. A figura 2 mostra que o usuário está preenchendo a questão 07 da parte 2 e que esta possui no máximo 19 questões, das quais algumas já foram preenchidas e outras não se aplicam, conforme a legenda na própria tela. Figura 1 – Fluxo simplificado da coleta via web do Censo Demográfico de 2010.
A SOLUÇÃO E OS PRINCÍPIOS DE USABILIDADE
Entre as opções de questionário eletrônico, foram analisadas as possibilidades de responder online ou baixar um programa. A primeira foi a solução adotada por vários
“2- Equivalência entre o sistema e o mundo real: O sistema deve falar a linguagem do usuário, com palavras, frases e conceitos que lhes sejam familiares, ao invés de termos orientados ao sistema. Deve-se seguir convenções do mundo real, fazendo a informação aparecer em ordem natural e lógica.” Diferentemente do PDA que é operado pelo recenseador do IBGE, na Internet procurou-se trocar alguns termos técnicos
304
por termos de mais fácil compreensão para o usuário, por ex: No quesito sobre o tipo de piso trocou-se madeira apropriada para construção (aparelhada), por madeira aparelhada (ex: taco, tábua corrida etc). “3- Controle do usuário e liberdade: Este princípio afirma que os usuários podem escolher funções do sistema por engano e precisarão de uma saída de emergência bem marcada para deixar o estado não desejado, sem ter que passar por um extenso diálogo. Deve possibilitar que o usuário possa desfazer e refazer ações.”
“6- Reconhecer em vez de relembrar: Deve-se tornar objetos, ações e opções visíveis. O usuário não deve ter que relembrar informações de uma parte do diálogo em outra parte. Instruções para uso do sistema devem estar visíveis ou facilmente recuperadas.” A qualquer momento do preenchimento do questionário, o usuário poderá retornar a uma questão específica para relembrar uma resposta. Para facilitar a busca por determinada questão, ao passar o mouse sobre o número da questão, o sistema exibe a pergunta. (Figura 4)
A qualquer momento, no questionário online, o usuário poderá retornar para qualquer uma das questões já respondidas para alterar a resposta. Ele tem duas formas de fazer isso: pelo menu, pois todas as questões já respondidas ou puladas se tornam links, ou pelo botão voltar, passando por todas as questões até chegar à questão desejada. (Figura 2) “4- Consistência e padrões: Os usuários não devem ter que imaginar se palavras, situações ou ações diferentes significam a mesma coisa. Deve-se seguir as convenções de plataforma, inclusive visuais.” Todos os links e botões presentes nas questões do questionário têm sempre a mesma funcionalidade, mantendo a consistência com relação a rótulos textuais, cores, tipografia e layout. “5- Prevenção de erro: Muito melhor que boas mensagens de erro é um projeto cuidadoso que previne a ocorrência de problemas” Dependendo de respostas anteriores, idade e sexo respondidos, alguns itens foram escondidos: Por ex: No quesito sobre escolaridade que investiga o curso que os moradores freqüentam, para uma criança de 10 anos, as opções: superior, especialização, mestrado, doutorado estarão inibidas, prevenindo que ele marque uma das opções inválidas. Um outro exemplo: No quesito de idade, se o morador é a pessoa responsável, ao lado do campo tem a mensagem que ele deve ter 10 anos ou mais de idade. (Figura 3)
Figura 4 – pergunta 5 da parte 6 – característica dos Moradores com mouseover na item 02
“7- Flexibilidade e eficiência de uso: Os atalhos das tarefas (muitas vezes não percebidos pelos usuários novatos) podem aumentar a velocidade de interação para o usuário experiente de forma que o sistema possa atender tanto aos usuários experientes quanto aos inexperientes.” Os atalhos do teclado para preenchimento de formulários utilizados são os já conhecidos pelos usuários da Internet. Por ex: Tecla tab para mudar o foco e enter para submeter. Para os inexperientes, basta clicar com o mouse. “8- Estética e design minimalista: Os diálogos não devem conter informação irrelevante ou desnecessária. Toda unidade de informação extra em um diálogo compete com unidades de informação relevantes e diminui sua visibilidade relativa.” Procurou-se deixar somente o mínimo de texto necessário: o título da parte, o tema, a pergunta e os itens da resposta. Textos de ajuda podem ser encontrados ao clicar nos links correspondentes caso o usuário necessite.
Figura 3 – Pergunta 2 da parte 6 – Características dos moradores
305
“9- Auxílio ao usuário para reconhecer, diagnosticar e recuperar-se de erros: O princípio auxílio ao usuário para reconhecer, diagnosticar e recuperar-se de erros afirma que as mensagens de erro devem ser expressas em linguagem clara (sem códigos), indicar precisamente o problema e sugerir construtivamente uma solução.” Caso o informante erre na digitação ou pule um quesito, o sistema exibirá caixas de diálogo para confirmação da resposta fornecida (Figura 5) ou apresentará mensagens de erro em casos de preenchimento obrigatório e respostas inconsistentes.
NOVA MÍDIA PRESSUPÕE NOVOS PARADIGMAS
Uma novidade do questionário online do Censo 2010, em relação aos questionários anteriores no PDA e aos desenvolvidos por institutos de estatísticas de outros países, é a inclusão do módulo de preenchimento simultâneo dos dados de diversos moradores por um informante. Esta possibilidade não tinha sido implementada anteriormente porque a metodologia utilizada no questionário em papel era de preenchimento dos dados de um morador de cada vez.
Figura 7 – Tela para a seleção de moradores Figura 5 – Caixa de diálogo que aparece ao pular um quesito
“10- Ajuda e documentação: Ainda que seja melhor que o sistema possa ser usado sem documentação, pode ser necessário prover ajuda. Qualquer informação deste tipo deve ser fácil de buscar, ser focada na tarefa do usuário, relacionar passos concretos a serem desenvolvidos e não ser muito longa.”
Esta solução está sendo aplicada pela primeira vez neste aplicativo e também será utilizada no PDA dos recenseadores. Esta funcionalidade é uma demanda da pesquisa desenvolvida anteriormente, a Pesquisa Nacional por Amostra de Domicílios (PNAD). Durante as entrevistas realizadas nos domicílios selecionados para esta pesquisa, que era muito longa, observou-se que ao finalizar um morador e iniciar um outro, o informante se demonstrava insatisfeito em repetir a maioria das questões já respondidas anteriormente. No questionário impresso, era impossível este preenchimento simultâneo, pois cada morador, dependendo da resposta do quesito, seguiria um fluxo diferente e o recenseador teria que lembrar das respostas de cada um para saber qual seria o próximo quesito. Era por isso que, na metodologia anterior, as perguntas eram feitas por morador.
Figura 6 – Conceito de morador que aparece no mouseover da palavra morador
Verificou-se que a metodologia de perguntas deveria ser alterada e que a mudança de mídia implicava numa mudança de paradigma para melhor utilização do recurso e facilidade de preenchimento.
Nota-se que o IBGE utiliza conceitos, necessários para o entendimento da pesquisa, que são passados em treinamentos aos recenseadores. Uma vez que o usuário da Internet não receberá treinamento, inserir os conceitos é necessário. Para inserir esses conceitos, sem prejudicar a clareza da interface, inseriram-se boxes explicativos para cada item de cada questão, assim como em cada palavrachave com a sua definição.
306
As dúvidas foram passadas para as equipes responsáveis. O teste foi uma avaliação quantitativa fundamental para calcular a infra-estrutura necessária para o sucesso do questionário online do Censo 2010.
Figura 8 – Seqüência de telas mostrando um domicílio com dois moradores. Na primeira tela os dois respondem a questão sobre cor e raça. A próxima pergunta sobre etnia, responde apenas o morador indígena.
TESTANDO A SOLUÇÃO NA PRÁTICA
Diversos testes quantitativos têm sido feitos a fim de avaliar diferentes aspectos do questionário online para o Censo Demográfico 2010 tais como infra-estrutura, respostas dos usuários, sistema e interface. O primeiro teste quantitativo foi realizado com a participação de funcionários do IBGE que acessaram simultaneamente o questionário a fim de se calcular a infraestrutura necessária e avaliar as funcionalidades do sistema. Mais de quatro mil funcionários participaram do experimento, no período de 19:00hs às 23:00hs. No evento, a equipe de desenvolvimento esteve presente acompanhando os gráficos do link da Embratel, da performance dos servidores web, dos servidores de banco de dados, do servidor de balanceamento de carga e o tempo de resposta do sistema. Uma equipe de call center também participou, tirando dúvidas do sistema e respondendo perguntas por telefone e por email.
O segundo experimento realizado foi o teste piloto que aconteceu em 15 capitais do Brasil. Em cada capital, foram escolhidos dois setores censitários com aproximadamente 300 domicílios cada para realização deste teste. A finalidade foi avaliar as respostas dadas através da interface do questionário web. A equipe de call center atendeu aos usuários que optaram por esta forma de participação. O teste piloto foi feito com um questionário piloto: acertos necessários foram identificados e corrigidos, tais como erros tratados mas não prevenidos. Relatórios estatísticos foram gerados para analisar a qualidade das respostas pela Internet, com a finalidade de alterar a forma de apresentar as perguntas, caso necessário. A importância do experimento foi analisar as perguntas e a interface do sistema. O preenchimento simultâneo de dados de diversos moradores foi objeto de elogios por parte dos funcionários da Instituição e pelo grupo de recenseadores equipados com PDAs. Com as perguntas, sistema e infra-estrutura definidas nos testes, o questionário apresentado neste artigo começou a ser testado novamente, em setembro de 2009, quando se iniciou a etapa do Censo Experimental, um ensaio geral para o Censo 2010.
REFERÊNCIAS:
AGNER, Luiz. Avaliações Heurísticas [online]. Disponível em http://www.slideshare.net/agner/heuristicas-usabilidade. Acesso em 14/07/2009 KOLKO, John. Thoughts on interaction design. Savannah, Georgia: Brown Bear, 2007 IBGE. Apresentação do Censo 2010. [online] http://www.ibge.gov.br/censo2010/ Acesso em 20/07/2009 PREECE, J; ROGERS, Y; SHARP, Helen. Design de interação: Além da interação homem-computador. Porto Alegre: Bookman, 2005. SOUSA, Taissa Abdalla; AGNER, Luiz. Design de Interação para Sistemas de Apoio a Pesquisas Domiciliares com Utilização de Dispositivos Móveis [online]. Disponível em: http://www.congressoebai. org/index.php/ EBAI/ 2008/paper/viewFile/20/5. Acesso em 20/07/2009
307
Linguagem visual como facilitador de interação com arquitetura da informação em empresa do ramo de Gás LP RESUMO
Esse artigo demonstra como o design de informação auxiliou empresa distribuidora de Gás LP, subsidiária brasileira de uma multinacional estrangeira, a reformular sua arquitetura de informação organizacional e reagrupar seus processos orientados à cadeia de valor da organização. Palavras Chaves
Design de informação, design de interação, arquitetura de informação, cadeia de valor. ACM Classification Keywords
H5.m. Information interfaces and presentation. INTRODUÇÃO
A empresa analisada neste estudo de caso é um dos principais players do mercado brasileiro de distribuição de Gás Liquefeito de Petróleo - também conhecido como “gás de cozinha” – e trata-se de uma subsidiária de uma multinacional estrangeira. O GLP é um dos insumos energéticos mais importantes do país, sendo utilizado na preparação de refeições em 95% dos lares brasileiros (Sindigas, 2008). Atuando com duas marcas próprias distintas, a empresa atende ao mercado doméstico, clientes industriais e comerciais, distribuindo gás na forma envasada (“botijões”) e a granel. Essa distribuição é feita em todo o território nacional e pode chegar ao consumidor final diretamente por uma das marcas da organização ou através de revendedores, também clientes da empresa em estudo. Em 2009 a companhia estudada iniciou um processo de reformulação de diversos processos internos, incluindo a criação de uma central de serviços compartilhados para atividades operacionais que atendesse a toda a companhia. Dentro dessas iniciativas foi elaborado um estudo de arquitetura da informação organizacional da empresa, de forma que todas as demais ações – como implementações de sistemas corporativos e agrupamentos de processos – fossem direcionadas conforme essa arquitetura. Por se tratar de uma estrutura complexa, resultado de diversas culturas reunidas – duas marcas nacionais e uma empresa multinacional – a compreensão da arquitetura de informação enfrentou obstáculos iniciais, principalmente no que se refere ao diversos modelos mentais já existentes na companhia. Através de um estudo detalhado da cadeia de valor da corporação, associado a um trabalho de design de informação, a interação entre as partes se fez mais ágil e
harmoniosa. O que antes se mostrou desafiante através de textos e planilhas, por fim tornou-se mais simples e fluido, graças à fácil absorção cognitiva de determinadas idéias através da linguagem visual adotada. ANÁLISE DA SITUAÇÃO DA EMPRESA
Como explicado anteriormente, a empresa objeto deste trabalho atua através de duas marcas distintas, que surgiram no Brasil de forma independente. Após a aquisição pela multinacional, as duas marcas passaram a ser coordenadas por uma administração central única, orientada conforme as diretrizes da matriz no exterior. Todo processo de aquisição enfrenta diversos riscos, principalmente ao considerarmos a interação entre as culturas da empresa adquirida com a da nova empresa dominante. No caso da empresa estudada isso se tornou ainda mais delicado devido ao processo concomitante de fusão das duas empresas nacionais, que desde suas origens foram concorrentes dentro do mesmo mercado. Temos aqui uma situação de fusão e aquisição acontecendo ao mesmo momento, o que já seria suficiente para oferecer um cenário de risco na confluência de culturas. Um fator a mais também presente neste estudo de caso são os processos produtivos existentes na distribuição de GLP. Como mencionado, o gás pode ser levado ao consumidor final através dos formatos de granel e envasado. Os dois processos podem ser atendidos por equipe e instalações similares em determinados momentos, porém em certas etapas seguem lógicas completamente distintas. Estas etapas distintas possuíram mais força no momento de definir a estrutura organizacional da empresa, sendo que se tornou comum escutar dentro da companhia que ambas as formas de distribuição, granel e envasado, praticamente dividiam a mesma organização em duas empresas distintas. DIAGNÓSTICO
Após análise realizada foram levantados três pontos principais de dificuldade para compreensão da arquitetura de informação organizacional da companhia: • A aquisição no mercado brasileiro por parte de uma organização estrangeira; • A fusão de duas empresas concorrentes sob a mesma direção; • A forte divisão de modelos mentais entre as duas formas de distribuição da companhia (granel e envasado).
308
Ao início do projeto estipulou-se que era desejo da organização chegar a uma arquitetura única, perene, que seria diretriz para demais iniciativas estratégicas que abrangessem toda a companhia. Esse objetivo encontravase em sintonia com uma das metas estratégicas da empresa: migrar de uma estrutura de modelos mentais fragmentados para uma cultura mais homogênea e identidade forte, para que tanto a força de trabalho como o mercado pudessem identificar a consistência das ações da companhia. A cultura de uma organização inclui seus valores, suas convicções e atitudes (Muchinsky, 2004), e todos esses fatores normalmente encontram-se fortemente arraigados na mentalidade de sua equipe. No caso estudado temos uma reunião de diversas culturas distintas, portanto diversos valores e modelos mentais arraigados a serem trabalhados. ESTRATÉGIA DE PROJETO
Ao longo do processo de levantamento foi identificado que o risco de aceitação da arquitetura proposta pela equipe de consultoria seria grande, devido aos choques culturais já existentes dentro da organização. Para mitigar esse risco foi definido que a arquitetura e sua apresentação deveriam ser orientadas por modelos que pudessem ser compreendidos pela maior parte da companhia. Para atingir esses objetivos decidiu-se pelo estudo da cadeia de valor da empresa e utilização da linguagem visual para apresentação da arquitetura. Dessa forma esperou-se reduzir a dificuldade de interação entre a equipe da organização estudada e a arquitetura proposta pela equipe de consultoria autora do presente documento. Cadeia de Valor
A cadeia de valor, conforme teoria defendida por Michael Porter em 1985, tem como objetivo identificar as competências centrais (core) de uma organização e distinguir as atividades que direcionem as suas vantagens competitivas (Fig. 1). Definiu-se utilizar a cadeia de valor da empresa como guia matriz para sua arquitetura de informação, por considerar-se que ela seria mais perene como diretriz do que o modelo utilizado até então pela empresa. Até aquele momento os processos e sistemas estavam organizados em torno do organograma funcional da companhia, estrutura esta em constante transformação. A utilização do organograma como diretriz para arquitetura da informação é frágil, pois a cada mudança no quadro funcional a arquitetura precisa ser revista, causando inconsistências e perda de continuidade em determinadas análises.
Figura 1. Análise de Cadeia de Valor (Fonte: Michael Porter, 1985)
Portanto considerou-se a cadeia de valor mais pertinente para o objetivo pretendido pelo projeto. Além de ser mais perene e estável que o organograma funcional, por se tratar do fluxo de trabalho da equipe a cadeia de valor lida com idéias e termos familiares para todos nas organizações, independentes de suas posições hierárquicas. A importância da linguagem visual
Além da escolha de um modelo perene que guiasse a arquitetura proposta, foi definido que a apresentação desta arquitetura deveria primar pela acessibilidade por parte da força de trabalho da empresa, de forma a mitigar o risco das diversas culturas pré-existentes. Por isso decidiu-se que a matriz da arquitetura seria apresentada de forma visual, e não textual ou tabular. Existem diversas pesquisas que demonstram o ganho de eficácia ao demonstrarmos idéias complexas através de imagens. Um estudo de Paivio’s (1986), baseado em sua teoria de código duplo (dual coding), define que “palavras e frases são normalmente processadas e codificadas apenas pelo sistema verbal, enquanto imagens são processadas e codificadas tanto pelo sistema visual quanto pelo verbal” (Schnotz, 2002: 107). Por isso a utilização de imagens e diagramas traz uma vantagem sobre o texto, no que diz respeito à memória humana, visto que “é mais fácil para o receptor cruzar diferentes informações e posteriormente recuperá-las” (Schnotz, 2002: 107). Um estudo feito por Robert Horn pela Wharton School of Business (Fig. 2), mostra que uma discussão em que é utilizada linguagem visual tem probabilidade de chegar a um consenso cerca de 20% maior que quando apenas textos são utilizados. Uma vez tendo a cadeia de valor levantada e ilustrada para a equipe da empresa, esperou-se que a arquitetura de informação proposta seria mais facilmente assimilada, não obstante os diferentes modelos mentais existentes.
309
Figura 2. Comparação de eficácia e produtividade em tomadas de decisão em grupo (Fonte: Robert Horn, 1999) O PROCESSO DE DEFINIÇÃO DA ARQUITETURA
Definiu-se por iniciar a arquitetura da cadeia de valor de forma simples, definindo os elos principais do processo: Fornecedores >> Empresa >> Clientes (Fig.3). A ilustração representa o fluxo do principal produto comercializado pela organização: o GLP.
Figura 4. Cadeia de Valor - Etapa 2
Esse diagrama foi importante para elucidar uma das principais questões existentes dentro da companhia: os Revendedores (no diagrama chamados de “Intermediários”) seriam Clientes ou Parceiros da empresa de GLP? Essas duas visões existiam dentro da corporação, mas a análise visual da cadeia de valor ajudou a tornar claro que, por mais que os revendedores tenham também papel na distribuição do GLP – como a empresa estudada – na verdade eles também são clientes da companhia. Detalhando os sub-elementos da cadeia
Figura 3. Cadeia de Valor - Etapa 1
Tendo em vista os componentes básicos da cadeia, na próxima etapa foi estudado como cada um desses objetos se dividem. Quem são os fornecedores? Como a empresa de GLP está dividida? Quem, em detalhes, são os clientes da empresa? Essas dúvidas levaram ao próximo diagrama.
Apesar da aparência simples, esse diagrama inicial já contornou importantes paradigmas existentes na empresa: • Ao se colocar um único elemento representando a empresa de GLP, já foram unificadas no mesmo corpo as duas marcas da companhia. A unificação demonstra para ambas as equipes que, na análise global, o mercado de atuação das duas é basicamente o mesmo; • Ao mostrar o caminho do GLP a empresa entende que, apesar das diferenças de processo, o fluxo produtivo macro do Granel e do Envasado é o mesmo. Seguindo o processo de aprofundamento da cadeia de valor, foram separados em dois elementos os diferentes grupos de clientes: o Consumidor Final e os Revendedores (Fig. 4). Essa divisão se fez importante para atender as especificidades do funcionamento da empresa, considerando que a forma de tratamento dos dois grupos de clientes é diferenciada e que, da perspectiva da cadeia de valor do revendedor, os consumidores finais são seus clientes. Para manter a identidade de clientes de ambos os grupos foram mantidas variações da cor do diagrama original.
Figura 5. Cadeia de Valor - Etapa 3
Nessa etapa o nível de detalhe aumenta consideravelmente, e todos os sub-grupos existentes na cadeia passam a ser representados. Talvez esse momento possa ser considerado o mais importante do processo, pois toda a organização passar finalmente a ver como se enquadra no processo, ao identificar-se com um ou mais desses detalhamentos da cadeia de valor que dizem respeito ao seu trabalho diário (Fig. 6).
310
Figura 6. Cadeia de Valor - Etapa 3 (detalhamento)
A fim de aumentar a compreensão da equipe da empresa analisada de forma simples e intuitiva, as 5 Leis da Gestalt (Kiyan, 2001) foram utilizadas para a construção desse diagrama, sendo elas: a)
Lei da Proximidade: elementos próximos são identificados como sendo do mesmo grupo.
Figura 9. Lei da Gestalt – Continuidade
d) Lei da Clausura: a disposição dos elementos delimita os grupos existentes
Figura 10. Lei da Gestalt – Clausura Figura 7. Lei da Gestalt – Proximidade
e) b) Lei da Semelhança: a semelhança entre elementos (cores, forma, tamanho...) ajuda a identificar diferentes grupos
Lei da Simplicidade: o ser humano tem facilidade de assimilar diferentes elementos quando estes se apresentam da forma mais simples
Figura 11. Lei da Gestalt - Simplicidade Detalhando os sub-fluxos da cadeia
Figura 8. Lei da Gestalt – Semelhança
c)
Lei da Continuidade: o ser humano tende a seguir um fluxo para conectar os elementos em uma direção específica
Tendo todos os elementos da cadeia de valor detalhados, a próxima etapa consistiu no detalhamento do fluxo do Gás, fundamental para finalizar a compreensão do processo produtivo. Nessa etapa foram explicitados como de fato são as interações entre a empresa de GLP, seus fornecedores e seus clientes. O primeiro passo foi compreender como o gás era transportado de um elemento a outro da cadeia. Chegou-se às seguintes alternativas: Caminhão Granel, Caminhão Envasado e Gasoduto.
311
Continuando o processo de facilitar a absorção da informação pela equipe da empresa estudada, decidiu-se representar as alternativas de transporte de GLP no diagrama através de ícones. Já prevendo que o diagrama final à primeira vista seria muito denso, optou-se por ícones nessa etapa de forma diminuir a resistência inicial do receptor da informação.
Figura 12. Ícones representando transporte de GLP
Essas alternativas podem ser coordenadas pelos fornecedores da companhia, pelos seus clientes ou pela própria empresa. Ainda seguindo os estudos da Gestalt – no caso a Lei da Semelhança – decidiu-se usar as mesmas cores da cadeia para informar de quem seria responsabilidade de cada fluxo.
CONCLUSÃO
A partir da análise gráfica construída para ilustrar a Cadeia de Valor da empresa de GLP, a mesma pôde identificar, em um mesmo diagrama, que os processos de suas duas marcas são basicamente os mesmos. E em que momentos da produção as linhas de Granel e Envasado de fato são distintas. Essa análise guiou a taxonomia construída para a arquitetura da informação da empresa, e já está sendo guia tanto para o agrupamento dos processos internos quanto para a navegação de alguns dos sistemas corporativos. Comprovou-se como para esta situação a linguagem visual reduziu resistências e facilitou a absorção de uma nova disponibilização de arquitetura da informação, mesmo que esta vá de encontro com paradigmas já arraigados na organização. O mais importante é que com esse trabalho a empresa pôde ver reunida uma gama de informações sobre si mesma como ainda não tinha sido feita antes. Essa disposição de informação poderá ser insumo para novas análises e reflexões, que poderão ser de extrema importância nas decisões tomadas daqui para frente. Por último, é importante ressaltar a crescente relevância que o design de informação e interação está recebendo no direcionamento estratégico de algumas empresas no mercado brasileiro. REFERÊNCIAS
Figura 13. Exemplos de Legenda do Fluxo do GLP
Com a simbologia definida, foram estudados todos os pontos de ligação entre cada sub-elemento da cadeia de valor (Fig. 14). Em um mesmo diagrama final (Anexo A) foi possível demonstrar: a) Fluxo da Cadeia de Valor; b) todos os elementos existentes da Cadeia; e c) atuação de cada elemento dentro da cadeia.
1. Horn, Robert. Visual Language: Global Communication for the 21st Century. Macrovu Inc.(1999) 2. Kiyan, Ana. E a gestalt emerge: vida e obra de Frederick Perls, Editora Altana (2001) 3. Muchinsky, Paul. Psicologia Organizacional, Thomson (1992) 4. Paivio, Allan. Mental representations: a dual coding approach. Oxford. England: Oxford University Press (1986) 5. Porter, Michael. Competitive Advantage, Free Press (1998) 6. Sindigás, Gás LP no Brasil, acessado em http://www.sindigas.com.br/sala_imprensa/cartilha_glp. asp (Abril 2009) 7. Schnotz, Wolfgang. An Integrated Model of Text and Picture Comprehension, Cambridge Univ. Press. (2005)
Figura 14. Fragmento da Cadeia de Valor detalhada
312
ANEXO A: Representação Gráfica da Cadeia de Valor da empresa distribuidora de GLP
313
Avaliação do site “Cocoricó” com crianças em idade préescolar Renata Yumi Shimabukuro Tamago Rua Natingui, 922b, Pinheiros, São Paulo - SP renata@tamago.at + 55 11 3032 1648 RESUMO
A rotina das crianças vem se modificando, assim como a sua relação com as tecnologias digitais. Por dominar de maneira cada vez mais precoce os meios digitais, as crianças estão tendo acesso a diversos produtos interativos. Mas nem sempre as interfaces ou conteúdos desses produtos atendem aos requisitos e objetivos dos seus usuários, ainda mais quando eles se encontram em idade pré-escolar, não totalmente alfabetizados. Assim, esse estudo procura, através da avaliação do site do programa televisivo “Cocoricó”, apontar a importância da usabilidade e do design de interação na criação e no desenvolvimento de produtos destinados ao público infantil. Enfatizando que os princípios de design desenvolvidos para adultos não podem ser aplicados aos produtos infantis, pois as crianças são usuários especiais e por isso dispõem de metodologias específicas. Palavras-chave do Autor
Usabilidade, avaliação heurística, avaliação observativa, crianças, mídias digitais, pré-escola. Palavras-chave de Classificação da ACM
H5.m. Information interfaces and presentation. INTRODUÇÃO
A rápida evolução das tecnologias digitais vem provocando diversas mudanças no cotidiano familiar. As rotinas estão sendo alteradas, assim como a importância e o modo de utilização das mídias pela população. Essas mudanças são evidentes não só na vida dos adultos, mas também na vida da grande maioria das crianças. Rodeadas por uma série de aparelhos eletrônicos, as crianças têm acesso aos mais variados tipos de conteúdos digitais, tendo a seu alcance diversas formas de entretenimento. Por esta razão, a televisão vem perdendo seu lugar cativo como o principal meio de comunicação, tendo agora de dividir a atenção das crianças com a Internet e o videogame, sem mencionar telefones celulares e outros aparelhos. Essa concorrência entre mídias, juntamente com a tendência multitarefa dessa nova geração, vem aumentado consideravelmente a quantidade de conteúdo interativo destinada às crianças. Por conta disso, maior atenção vem
Cauê Ueda Tamago Rua Natingui, 922b, Pinheiros, São Paulo - SP ueda@tamago.at + 55 11 3032 1648 sendo dada ao processo de criação, desenvolvimento e disponibilização desses conteúdos, aplicando a eles princípios do design de interação específicos para crianças. Isto é evidente nos países europeus e na América do Norte, onde é realizada anualmente a International Conference on Interaction Design and Children - IDC. No Brasil, em contrapartida, pouco se discute sobre o assunto, sendo recorrente a criação de sites infantis que não consideram, como deveriam, os requisitos e as peculiaridades da faixa etária de seus usuários. As maiores prejudicadas por esta inadequação são as crianças mais novas, em idade pré-escolar, as quais ainda não dominam a leitura e acabam perdidas ou frustadas diante de interfaces de usuário complexas e textuais. Por isso, se faz necessária não só a realização de avaliações de usabilidade, mas principalmente a inclusão de crianças no processo de design. Ainda que designers já tenham sido crianças algum dia, é muito difícil resgatar fielmente as percepções infantis quando se é adulto. Levando em consideração esse atual panorama, foi realizado um estudo em parceria com a Fundação Padre Anchieta – TV Cultura de São Paulo. Através dele procurou-se entender melhor a interação das crianças mais novas com o computador e avaliar a adequação dos conteúdos educativos à faixa pré-escolar. A Fundação Padre Anchieta – TV Cultura, ciente da relevância das pesquisas na área de design de interação para crianças, e com o claro intuito de aprimorar os produtos e serviços interativos disponibilizados ao seu público infantil, autorizou o uso do site do programa “Cocoricó” como objeto de estudo desta pesquisa, uma vez que se trata da sua marca infantil/pré-escolar de maior sucesso, tendo o maior número de produtos licenciados no mercado. CRIANÇAS E AS MÍDIAS DIGITAIS
Muito tem sido discutido a respeito de uma mudança geracional, causada principalmente pelo uso e impacto das novas tecnologias na vida das crianças e jovens, os quais são descritos como “geração digital” [5]. Uma geração que nasceu e vive imersa em tecnologia, apresentando características distintas das gerações anteriores, as quais, na grande maioria das vezes, estão relacionadas à habilidade e facilidade de lidar com as novas tecnologias. Para Prensky
314
[22], essa nova geração é formada por “nativos digitais”, aqueles que dominam de maneira fluente a “linguagem” dos meios digitais, sem necessidade de aprendizagem profunda ou adaptação. O impacto da tecnologia na vida das crianças é gigantesco, sendo possível notar mudanças no papel e na importância dos meios eletrônicos no cotidiano desses jovens. Mudanças no público infantil
As crianças têm passado menos tempo com seus pais, já que tanto marido como esposa trabalham, e também dificilmente desfrutam da companhia de irmãos. Por estarem a maior parte do tempo sozinhas, os pais, receosos da violência externa, as proíbem de aproveitar o tempo de lazer na rua. Isso fez com que o local de lazer tenha mudado dos espaços públicos (ruas, praças, etc.) para o espaço familiar (sala de estar) e, em famílias mais abastadas, para o espaço privado (quarto das crianças) [4]. Como consequência do aumento da renda familiar e do declínio no número de filhos, os pais têm investido cada vez mais em aparelhos eletrônicos para entreter seus filhos dentro de casa, principalmente em computadores, que podem ser utilizados como ferramenta tanto de lazer como para educação.Desta forma, a televisão que costumava ser a principal mídia consumida pelas crianças e tinha um papel central na vida desse público, que até então era passivo, está deixando de atrair a atenção individualizada do seu público infantil por conta da digitalização das mídias e o aumento do número de aparelhos eletrônicos disponíveis. Mais do que substituir a televisão, as novas tecnologias estão modificando significantemente o modo como a TV está sendo utilizada pelas crianças. Aos três anos de idade, elas já são capazes de usar o controle remoto para encontrar seus canais favoritos, e aos cinco anos já dominam o uso do aparelho [16]. Mesmo sendo a TV o primeiro aparelho com o qual as crianças têm contato, e persistindo assim durante toda a infância, a grande maioria das crianças entre sete e nove anos de idade entraram pela primeira vez em um website de comunidade online quando tinham entre cinco e oito anos, enquanto oito por cento tinham apenas entre zero e quatro anos em seu primeiro contato com a Internet [26]. Por conta disso, elas estão agora usando o tempo que assistiam à TV para fazer uso de outros aparelhos [21]: seu tempo livre é agora divido entre televisão, Internet e videogame [10]. Como se não bastasse, as crianças estão desenvolvendo características multitarefa, ou seja, realizam diversas atividades ao mesmo tempo, já a partir dos dois anos de idade [20]. Atualmente, a concorrente mais direta da televisão é a Internet, por multiplicar exponencialmente as possibilidades de acessos a conteúdos, de geração de conteúdos próprios e de comunicação entre grupos de amigos [10].Assim, vem aumentando também a preocupação das emissoras de televisão em se adaptar a essa nova realidade. Cientes da
familiaridade do público infanto-juvenil com a tecnologia, produtores de conteúdo estão se esforçando para conquistar esta audiência em outras mídias além da televisão [2]. CRIANÇAS X USABILIDADE
Apesar do crescimento da oferta de conteúdos infantis online, pouco se discute sobre como tornar os produtos interativos mais acessíveis e agradáveis a esse público. Designers geralmente assumem que uma interface que funciona para adultos, quando aliada a algumas animações e cores mais alegres, se tornará , por sua vez, mais apropriada para crianças, as quais são raramente envolvidas no processo de desenvolvimento dos conteúdos interativos infantis [6]. É um erro muito comum pensar que as crianças são “experts” da tecnologia, que podem resolver qualquer problema quando estão lidando com computadores. No entanto, as crianças são incapazes de sobressair e resolver muitos problemas de usabilidade. Além disso, os problemas encontrados durante a navegação fazem com que as crianças deixem o site, pois não possuem paciência e perseverança suficientes para enfrentar as dificuldades impostas pelo sistema [12]. Crianças não são adultos em miniatura [8] e, por essa razão, medidores tradicionais de usabilidade, como índices de produtividade, rapidez e eficiência no cumprimento de uma tarefa, geralmente não são adequados para serem aplicados em avaliações de produtos infantis [13]. Diferente dos adultos, as crianças utilizam computadores para fins educacionais ou para o lazer, e não para a realização de tarefas [6]; por isso os princípios de design desenvolvidos para adultos não podem ser aplicados aos produtos infantis. Crianças possuem suas próprias necessidades e objetivos, são uma audiência especial, diferente dos adultos, e contam com necessidades diferenciadas dependendo da idade em que se encontram [27]. Assim como os produtos elaborados para adultos precisam considerar as especificidades de seus usuários (como sua habilidade de leitura, entendimento de conceitos abstratos, etc.), os produtos desenvolvidos para crianças precisam levar em consideração o estágio de desenvolvimento cognitivo e motor de seu usuário. Sua fase de desenvolvimento determinará o nível de interação esperada, afinal, uma criança em idade pré-escolar utiliza o computador de uma maneira extremamente diferente de uma criança com dez anos de idade [6]. Qualquer interação que as crianças menores possam experimentar poderá influenciar diretamente o seu desenvolvimento. O que determinará se a interação é positiva ou negativa, serão as características de uma determinada atividade. A interação com computador, por exemplo, pode melhorar a capacidade cognitiva da criança, mas também pode privá-la de outras formas de interação que poderiam ser ainda mais benéficas [11]. Um exemplo é o fato das crianças a partir dos três anos de idade poderem obter benefícios pelo uso de mídias eletrônicas com
315
Ambos os métodos foram aplicados por dois especialistas em usabilidade, enquanto uma adaptação simplificada desses métodos foi repassada a cinco profissionais de pedagogia, os quais avaliaram a qualidade e pertinência dos conteúdos apresentados pelo site. A partir dos resultados obtidos com as avaliações heurísticas foi possível diagosticar os principais problemas do site, considerando-os durante todo o processo de elaboração da avaliação observativa. Assim, as ferramentas ou conteúdos considerados mais problemáticos para essas crianças foram priorizados, tornando-se obrigatória a sua avaliação pelas crianças. Somente desta maneira, poderíamos comprovar que as hipóteses levantadas pelos especialistas estavam corretas ou não. Desta forma, iniciou-se o processo de avaliação observativa ou testes de usabilidade. Avaliação por crianças em idade pré-escolar
A escolha pela realização dos testes no próprio ambiente escolar, e não em laboratório, foi baseada no levantamento dos seguintes dados: entre as nove milhões de crianças de quatro a seis anos de idade, quase 78% desse total frequentam a escola [9], sem contar que mais de 60% das crianças e jovens do Brasil utilizam a escola como o lugar mais habitual para navegar na internet [10]. Desta forma, foram contatadas duas escolas de educação infantil, uma pertencente à rede pública de ensino e outra de regime particular. Essa diferença foi necessária para cobrir os diferentes níveis socio-econômicos do público do “Cocoricó”. Seguindo as recomendações de Nielsen, o qual afirma que é preciso realizar testes com mais de cinco usuários quando há distinção de grupos [19], foram selecionados dez participantes entre três e seis anos de idade, sendo cinco de cada escola. Antes da realização dos testes, foram encaminhados a cada pai ou responsável uma carta explicativa sobre a pesquisa, um termo de autorização (solicitando, inclusive, direitos de uso de imagem e som da criança) para ser assinado, além de um questionário sobre os hábitos das crianças em relação ao uso da TV e do computador. Todos aqueles que participaram dos testes estavam devidamente autorizado pelos pais ou responsáveis. A avaliação foi realizada em um único computador. Toda a ação ocorrida na tela e reação por parte do usuário foram gravadas simultaneamente. Além disso, as imagens da movimentação geral dos participantes foram registradas por uma câmera digital posicionada ao lado do computador. Seguindo as recomendações de Hanna et al [14], foram estipulados para a realização dos testes não mais que 30 minutos com cada criança, para que elas não perdessem a paciência e a concentração. Foi solicitada a cada escola que um de seus profissionais, professores ou coordenadores, estivessem disponíveis para acompanhar a avaliação, a fim
de proporcionar maior conforto e sensação de segurança às crianças, principalmente àquelas mais tímidas. Além disso, antes de iniciar o teste, o facilitador dava início a uma curta conversa sobre o que cada criança mais gostava de ver na TV ou de brincar no computador, uma forma de “quebrar o gelo” e deixar a criança mais a vontade e mais animada. Por se tratar de crianças mais novas, optou-se pela realização inicial de um teste sem tarefas definidas (Nontask-Based Testing), seguido de um teste baseado em tarefas (Task-Based Testing). Apesar de ser recomendado o uso espontâneo de produtos interativos quando lidando com crianças menores [14, 18], o levantamento dos principais problemas realizados anteriormente por especialistas mostrou diversos pontos que deveriam ser comprovados (ou não) a partir da interação direta com a criança. Assim, foi solicitado ao participante que interagisse livremente pelo site, por um período médio de cinco minutos. Em seguida, solicitou-se à criança que encontrasse e interagisse com alguns outros elementos do site que não haviam ainda sido explorados durante o tempo de livre interação. Dessa forma, foi possível avaliar algumas ferramentas que as crianças não conseguiram encontrar sozinhas, além de verificar o que ela era capaz de encontrar e interagir sem nenhuma explicação ou questionamento externo. E para avaliar o grau de satisfação da criança com o site, foi aplicado o método Fun Tool Kit [23]. Seguindo as adaptações para crianças em idade pré-escolar realizadas por Ana Vitória Joly [17], neste estudo foram utilizados o Smileyometer e a tabela The Again-again. Ao utilizar o Smileyometer, uma escala horizontal que apresenta cinco versões de sorrisos (que vai do “péssimo” ao “ótimo”), a criança deveria responder a pergunta “O que você acha do site do Cocoricó?” escolhendo um dos adesivos com o sorriso correspondente e colando-o logo abaixo à imagem do site. Já a tabela The Again-again, originalmente utilizada para comparar atividades, foi empregada aqui para confirmar as opiniões das crianças, que muitas vezes tendem a agradar os adultos dando respostas muito positivas. Quando questionadas se elas gostariam de brincar novamente no site, tendo como opções “sim”, “não” e “talvez”, a resposta é sempre muito mais imediata e sincera do que quando utilizando o Smileyometer. No final da sessão, como retribuição à ajuda prestada aos pesquisadores, cada criança recebeu um certificado com ilustrações do "Cocoricó" para colorir. De acordo com Markopoulos et al. [18], as crianças não esperam receber nada em troca, uma vez que estão acostumadas a realizar atividades por solicitação dos adultos. Por isso, elas se satisfazem e se alegram ao receber um certificado que demonstre o quanto ela foi prestativa. Principais resultados
De modo geral, os principais problemas levantados pelos especialistas em usabilidade e pedagogia, através das avaliações heurísticas, foram condizentes com os resultados obtidos através da análise dos testes de usabilidade. Os
316
testes não só confirmaram algumas hipóteses, mas também reforçaram alguns aspectos relacionados à capacidade de interação das crianças de idade pré-escolar.
classificarem o site como “ótimo”, quando perguntadas se gostariam de brincar de novo, uma respondeu “não” e outra “talvez”, demonstrando alguma insatisfação com o produto.
Foi comprovada a dificuldade de navegação das crianças através de menus textuais. O uso de ícones ou sons é essencial para facilitar a busca da criança por um determinado conteúdo, principalmente quando ela ainda não está alfabetizada.
Pode-se afirmar que o site do “Cocoricó” apresenta boas atividades, algumas delas bastante atrativas para o público ao qual se destina, mas que acabam não sendo encontradas ou totalmente compreendidas pelas crianças por conta de alguns problemas de usabilidade. Problemas que poderiam ter sido evitados se as crianças e os especialistas em usabilidade infantil tivessem sido consultados previamente.
Além disso, as páginas devem ser configuradas de maneira a evitar a necessidade de usar as barras de rolagem do navegador ou do mouse. Por mais que a criança seja um usuário experiente, nem sempre utiliza tais recursos para explorar o restante da página, podendo perder informações relevantes. Páginas com excesso de texto não atraem as crianças, mesmo as alfabetizadas. É recomendável que os textos sejam usados em pouca quantidade, com vocabulário acessível a essa faixa etária, e se possível acompanhado de áudio para que a criança que ainda não domina a leitura possa acompanhar e compreender o que está escrito. A habilidade na navegação está muito mais relacionada ao nível de desenvolvimento psicomotor do que ao nível sócioeconômico. Uma participante da escola pública que nunca havia tido contato prévio com computadores conseguiu realizar praticamente o mesmo número de tarefas que seus colegas mais experientes, mas da mesma idade. O domínio do mouse e das ferramentas de interação vem com a prática. A maior diferença encontrada entre os alunos da escola pública e da escola privada foi o nível de alfabetização. As crianças da escola particular apresentaram muito mais facilidade de completar o jogo das palavras (uma adaptação do jogo da forca, em que os usuários precisam completar o nome do objeto ilustrado por um desenho), acertando rapidamente as palavras e até afirmando que o jogo era fácil. Enquanto que, para as crianças da escola pública, esse foi o jogo que menos gostaram ou que acharam mais difícil, conseguindo completar algumas palavras apenas com a ajuda do facilitador. Porém, mesmo as crianças alfabetizadas não utilizaram a leitura para navegar. Elas geralmente seguiam sua intuição, e somente quando se sentiam perdidas faziam uso da leitura. Este dado reforça ainda mais a importância da usabilidade na criação de produtos infantis, independente do grau de alfabetização do usuário final. Ficou clara também a necessidade de revisão dos níveis de dificuldade de cada jogo. No jogo da memória, por exemplo, nenhuma criança conseguiu completar o nível “fácil”, enquanto que algumas completaram o nível “difícil”. Além disso, quando encontravam muita dificuldade para jogar ou compreender o que deveria ser feito, as crianças logo mudavam de jogo ou saíam da seção. Já o uso do Smileyometer juntamente com a tabela Againagain se mostrou eficaz. Apesar de algumas crianças
CONCLUSÃO
Por meio deste estudo, ficou clara a importância da aplicação dos conceitos do design de interação na elaboração de conteúdos interativos para crianças. Ainda mais quando se tratam de crianças em idade pré-escolar, cujo processo de alfabetização ainda não foi concluído. É fato que as crianças estão cada vez mais habilidosas no manuseio de tecnologias interativas, fazendo uso de aparelhos digitais cada vez mais cedo. Mas, sem uma interface de usuário e conteúdos adequados ao seu período de desenvolvimento cognitivo, ela não conseguirá realizar as atividades da maneira esperada, deixando de ser beneficiada por essa interação. Por isso, é preciso consultar e utilizar as guidelines de design de interação para crianças já publicadas e, principalmente, envolver as crianças no processo de criação. Torná-las apenas avaliadoras, como neste estudo, é uma solução, mas os riscos são muito maiores. Qualquer avaliação sempre trará algum dado relevante que implicará na realização de mudanças no design, ocasionando mais gastos de tempo e dinheiro. O ideal é envolver as crianças como parceiras ou pelo menos como informantes, consultando-as durante todo o processo de criação e desenvolvimento do produto interativo. E, durante a avaliação dos protótipos ou produtos, é extremamente necessário aplicar os métodos elaborados especificamente para lidar com o público infantil. As crianças são usuários especiais e exigem uma aproximação diferenciada, que considere seu nível de desenvolvimento e sua sensibilidade. A partir dos resultados desse estudo e da consciência da importância do design de interação na elaboração de conteúdos interativos para crianças, acredita-se que a TV Cultura estará ainda mais preparada para oferecer não somente programas de televisão de alta qualidade, mas produtos interativos de excelente nível. AGRADECIMENTOS
Nossos sinceros agradecimentos à equipe Tamago, principalmente à Fernanda Frasca, pelo suporte e total apoio durante o desenvolvimento desta pesquisa. A colaboração das crianças e dos coordenadores da escola O
317
Mundo de Sofia e da EMEI Pedroso de Moraes. A assessoria das pedagogas: Andréa Isiara, Fernanda Matsuda Giron, Marcia Martins, Marisa Isiara e Regiane Mendes. A disponibilidade de Elton Mattos. E o interesse e apoio de Âmbar de Barros e Ricardo Mucci. REFERÊNCIAS
1.Baauw, E., Bekker, M. M., Assessing the applicability of evaluation method (SEEM) for Proc.Conference on interaction IDC '06. ACM (2006), 73-80.
and Markopoulos, P. the structured expert a wider age group. In Design and Children.
2.Barbosa, A. C. Nativos digitais. Revista Tela Viva Vews. No. 188 (2008). http://www.telaviva.com.br/revista/188/capa.htm 3.BBC. Goodbye children everywhere: the changing world of children's TV. BBC4 (2007). 4.Buckingham, D. After the death of childhood: growing up in the age of electronic media. Cambridge: Polity. 2000. 5.Buckingham, D., Willett, R. (ed.). Digital generations: children, young people, and new media. Mahwah, N.J.; London: Lawrence Erlbaum, 2006. 6.Chiasson, S., Gutwin, C. Design Principles for Children's Software. http://www.hci.usask.ca/publications 7.Druin, A. The Role of Children in the Design of New Technology. Behaviour and Information Technology Journal: Taylor & Francis, 2002. 8.Druin, A., Solomon, C. Designing multimedia environments for children: Computers, creativity, and kids. New York, NY: John Wiley & Sons. 1996. 9.Fundação ABRINQ. Relatótio de Atividades 2008. 10.Fundación Telefónica. A Geração Interativa na IberoAmérica: crianças e adolescentes diante das telas. Barcelona: Editorial Ariel. 2008. 11.Gelderblom, H., Kotzé, P. Designing technology for young children: what we can learn from theories of cognitive development. In Proc. SAICSIT '08, vol. 338. ACM (2008), 66-75. 12.Gilutz, S., Nielsen, J. Usability of Websites for Children: 70 Design Guidelines. Fremont, CA, USA: Nielsen Norman Group, 2002. 13.Hanna, L. et al. The role of usability research in designing children’s computer products. In Druin, A.(ed.) The Design of Children’s Technology. Morgan Kauffman Publishers. San Francisco, California. 1998. 14.Hanna, L., Risden, K., and Alexander, K. Guidelines for usability testing with children. interactions 4, 5 (1997), 914.
15.IBGE. Síntese de Indicadores Sociais. Brasil termina o século com mudança sociais. http://www.ibge.gov.br/home/presidencia/noticias/0404si ntese.shtm 16.Jackson, L. Changes to media consumption affecting production methods. University of Westminter. 2007. 17.Joly, A. V. Design and evaluation of interactive crossplatform applications for pre-literate children. Proc. international Conference on interaction Design and Children. ACM (2007) 185-188. 18.Markopoulos, P. et al. Evaluating children’s interactive products: principles and practices for interaction designers. Morgan Kaufmann. 2008. 19.Nielsen, J. Why You Only Need to Test with 5 Users. Jakob Nielsen's Alertbox (2000). http://www.useit.com/alertbox/20000319.html 20.NPD Insights. Understanding Tweens and Tech: It's Not Just Kids Stuff. http://www.npdinsights.com/archives/march2007/cover.st ory.html 21.Pecora, N. The Changing Nature of Children’s Television: Fifty Years of Research. In: Pecora, N., Murray,J.P. & Wartella, E.A. (ed.). Children and television: fifty years of research. London : Lawrence Erlbaum Associates. 2007. 22.Prensky, M. Digital Natives, Digital Immigrants. In: On the Horizon. NCB University Press, Vol. 9 No. 5, 2001. 23.Read, J. C., MacFarlane, S., Using the Fun Toolkit and Other Survey Methods to Gather Opinions in Child Computer Interaction. Proc.IDC2006, ACM Press (2006), 81-88. 24.Shimabukuro, R. Y. A programação infantil na era digital: as tendências mundiais na produção de contúdo telvisivo para crianças. In: Squirra, S., Fechine, Y. (org.). Televisão digital: desafios para a comunicação. Livro da COMPÓS 2009. Porto Alegre: Sulina (2009). 25.The Future of Children. Children and Electronic Media. Volume 18. Number 1. Princeton-Bookings. 2008. 26.Tinti, S. Cartoon Network divulga pesquisa sobre as crianças "multitarefa". Crescer. http://revistacrescer.globo.com/Revista/Crescer/0,,EMI11 262-10541,00.html 27.Wartella, E. Where have we been and where are we going? In: In: Mazzarella, S. R. (ed.). 20 Questions about Youth & the Media. Oxford, Peter Lang. 2007. 28.Wollock, E., Orr, A., Buckleitner, W. Child Development 101 for the Developers of Interactive Media. Active Learners Associate. 2006.
318