Proposta de metodologia para descoberta automatizada de associações em bases de dados, aplicando o

Page 3

como por exemplo, itens que aparecem juntos em diversos registros. Os padrões frequentes são indícios de possíveis associações (Han et al., 2006, p. 23). As informações sobre associações entre dados podem ser muito úteis para se compreender possíveis relações de causa e efeito entre muitas variáveis envolvidas em estudos e análises para tomada de decisões de administradores. 3 Execução do processo de mineração de dados Acredita-se que os melhores resultados sobre descoberta de informações não são alcançados quando simplesmente técnicas de mineração de dados são aplicadas diretamente em uma base de dados. Não se trata apenas do uso de um software que busca informações, pois a mineração de dados, na verdade, compreende todo um processo com um conjunto de procedimentos que precisam ser realizados adequadamente. Segundo Passos et. al. (2005, p. 11) é preciso compreender a mineração de dados como um processo com pelo menos três etapas, conforme está demonstrado na figura 1 a seguir. Entrada de Dados

PréProcessamento de Dados

Mineração de Dados

PósProcessamento

Informações

Figura 1 – Processo de mineração de dados

A entrada do processo de data mining é uma série de registros de dados relacionados a fatos, pessoas, objetos, etc. Na série, cada registro possui uma ou várias características predeterminadas, também chamadas de atributos. Assim, esse conjunto de dados é representado por uma matriz de registros x atributos. Ao visualizar a série na forma de uma tabela, cada linha é um registro e cada coluna é um atributo (característica) deste registro (Witten et al., 2005, p. 45). É muito incomum uma situação em que os dados disponíveis para aplicação de um processo de mineração de dados tenham sido coletados e armazenados já com esse propósito (Berry et al., 1997, p. 67; Witten et al., 2005, p. 59). No mundo real, os dados não estão prontos para um processo de data mining. Muitas transformações são necessárias para preparar os dados em um formato para a mineração de dados (Berry et al., 2000, p. 181). Na etapa de pré-processamento são realizados os procedimentos para extração, seleção, limpeza e transformação dos dados para a realização da efetiva mineração de dados. Essa etapa geralmente consome a maior parte dos esforços aplicados no processo inteiro (Witten et al., 2005, p. 52) e, quanto bem executada, melhora-se substancialmente a qualidade dos resultados (Han et al., 2006, p. 47). As transformações de dados necessárias e específicas dependem da técnica escolhida e do software utilizado como ferramenta para aplicação do processo de data mining. Algumas ferramentas, por exemplo, precisam que todas as variáveis numéricas sejam divididas em intervalos, já outras exigem que todos os valores sejam normalizados em um intervalo específico entre 0 e 1 (Berry et al., 1997, p. 67).


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.