quarta-feira, 23 de maio de 2012

Profecias em posts? Ferramenta que faz previsão de epidemias e enchentes a partir das redes sociais


Profecias em posts

Ferramenta desenvolvida no DCC viabiliza previsão de epidemias e enchentes a partir das redes sociais


Por Gabriella Praça
Prever situações de calamidade pública, garantindo que medidas de controle sejam tomadas a tempo para reduzir o impacto sobre a população. Essa é uma das aplicações da metodologia desenvolvida pela pesquisadora Janaina Gomide, em dissertação de mestrado defendida em abril no Programa de Pós-graduação em Ciência da Computação do Icex. O estudo propõe metodologia para previsão de surtos de dengue e ocorrência de enchentes, a partir da análise de mensagens postadas no Twitter.
“Decidimos trabalhar com epidemia de dengue e enchentes porque se trata de ocorrências de grande impacto para o país e que atingem boa parte da população”, justifica a autora. “As pessoas têm seu cotidiano afetado por esses eventos e comentam na internet”, acrescenta. No universo de dados circulantes na rede, optou-se por coletar mensagens publicadas em redes sociais, por ser possível classificá-las segundo o conteúdo, eliminando aquilo que não esteja relacionado à abordagem da pesquisa. Além disso, podem-se obter no perfil dos usuários informações como localização, idade e sexo do autor da mensagem, o que viabiliza um estudo estatístico e demográfico.

Funcionamento

Após definido o tema de interesse, a primeira etapa da metodologia é a coleta das mensagens publicadas nas redes sociais. Esse material servirá de insumo para a fase seguinte, cujo objetivo é classificar o conteúdo das publicações, selecionando as que são relevantes para o estudo. Em seguida, é feito o cruzamento desses dados “virtuais” com informações “reais” capazes de oferecer evidências. Aqui, o intuito é prever o número de ocorrências e inferir o nível de gravidade do evento. Por fim, o método elabora um alerta que agrega todas as etapas anteriores e disponibiliza visualmente as informações obtidas, podendo ser empregado como mecanismo complementar ao sistema de vigilância tradicional.
No caso de dengue, observou-se alta correlação entre mensagens que expressam a experiência pessoal e a ocorrência da doença, o que viabilizou a construção de um sistema de alerta por localidade com acurácia superior a 90% em cidades com alta incidência. Em relação às enchentes, a metodologia se mostrou capaz de detectar e prever diariamente pontos de alagamento.
Entretanto, Janaina Gomide salienta que nem todas as informações obtidas em redes sociais apresentam dados corretos. “Um usuário pode, por exemplo, declarar sua localização como sendo ‘Rio de Janeiro’, e ter se mudado há anos para Salvador”, observa. Dessa forma, “para saber o grau de correlação entre os dados da ‘vida real’ e sua repercussão na internet, e avaliar o poder de detecção da metodologia proposta, realiza-se análise de correlação que provê esse indicativo”, esclarece a pesquisadora.
O processo leva em consideração quatro dimensões: volume, conteúdo, localização e tempo. O volume se refere à quantidade de mensagens na rede social que contêm em seu texto pelo menos um dos termos definidos como “relacionados ao evento”. Já o conteúdo diz respeito à percepção e ao sentimento do público expressos nas mensagens. A localização relaciona-se à informação geográfica declarada pelo autor do texto ou ao local do evento. O tempo, por sua vez, indica quando as mensagens foram enviadas ou quando se deu a ocorrência. Confirmada a correlação dos dados, as mensagens publicadas podem ser utilizadas tanto como previsores do evento quanto na elaboração do alerta.
O método e os resultados obtidos foram empregados no Observatório da Dengue (www.observatorio.inweb.org.br/dengue), sistema de vigilância epidemiológica a partir da internet, com o propósito de prever possíveis casos da doença e alertar sobre sua situação em cada cidade brasileira. A partir de parceria firmada entre o Observatório da Dengue e o Ministério da Saúde, a ferramenta tem sido usada como sistema de vigilância complementar ao tradicional. O modelo foi disponibilizado ao Ministério da Saúde por meio de página na internet de acesso restrito que contém a avaliação da incidência atual e da tendência do contágio de dengue.

Título: Mineração de redes sociais para detecção e previsão de eventos reais
Autora: Janaina Sant’Anna Gomide
Orientador: Wagner Meira Jr.

Co-orientador: Virgílio Almeida
Programa: Pós-graduação em Ciência da Computação do Icex
Defesa: 2 de abril de 2012


Nenhum comentário:

Arquivo do blog