Minerando Eleições: opSys, versão 2.0

opsys-logo
Algumas semanas atrás, liberei a segunda versão do opSys, ferramenta para mineração de opiniões em conteúdo Web. Agora, com recursos que permitem que qualquer pessoa monte um conjunto (SET) de variáveis e extrair opiniões de acordo com sua necessidade. Assim, você pode configurá-lo para medir a opinião de algum assunto que você gosta, marca, gadget, etc. As aplicações são inúmeras, podendo ser usado em pesquisas para medir uma marca, inclusive. Logo que o usuário acessa, ele tem agora duas opções para visualizar o opSys funcionando: A Análise de Investimentos[bb], que explora notícias e comentários sobre o mundo dos investimentos na bolsa, e também o mais novo Set padrão no sistema: Eleições 2010.

Minerando opiniões sobre as Eleições

A maior novidade é que já criei também um conjunto para analisar as Eleições 2010, ou melhor, analisar as opiniões sobre os presidenciáveis num conjunto de blogs, portais e no Twitter. Serra e Dilma já estão sendo minerados pelo sistema, que vai medir o feeling das postagens relacionadas em diversos sites nacionais, blogs diversos e também citações no Twitter. Claro, essa nova investida vai demandar uma série de atualizações no sistema, muitas delas já planejadas desde o ano passado, mas também algumas que vão surgir nesse novo período. Certamente, mudanças esperadas no ciclo de evolução de um sistema dinâmico na Webesfera.

E nesse ponto, as críticas e dicas dos usuários serão muito importantes! Como nunca, aguardo comentários, críticas e sugestões de todos que utilizarem e avaliarem o opSys, para deixá-lo sempre melhor. Confira agora mesmo: http://www.opsys.com.br

Novidades chegando

Nesse momento, já temos algumas pessoas com habilidades distintas colocando seus skills para funcionar, arquitetando mudanças para o opSys, que o tornaram mais fácil de navegar e “consumir”. Designers[bb], Arquitetos da informação[bb], marketeiros… Logo logo, poderão conferir mais novidades! Aguardem!

opSys, up and running

opSys, novo logotipo

Como a maioria de vocês deve ter visto, o Arena Info já chegou ao seu fim faz algum tempinho (e ufa!, finalmente consegui algum tempinho para postar aqui!). Infelizmente, não fui vencedor com o opSys, mas me considero um, graças ao voto de confiança de 177 pessoas que atestaram sua preferência pelo sistema extrator de opiniões. Para mim, um final vencedor, mesmo não sendo o primeiro. Esse concurso levou o opSys ao conhecimento geral, permitindo algumas parcerias bacanas (uma delas com um dos grupos participantes do concurso) que irão permitir seu desenvolvimento ao longo desse 2010 que vem, e assim participar de outros concursos mais.

Obrigado pessoal! Fiquem com um preview do novo logotipo do projeto.

opSys na reta final

opsys-arenaO projeto opSys (http://dev.thlopes.com/opsys), o sistema de mineração de opiniões em conteúdo web, está na final do concurso Arena Info (http://info.abril.com.br/arena/votacao/). Nessa fase, apenas 5 projetos foram escolhidos por categoria, e será escolhido apenas um em cada uma delas para ganhar o prêmio. O mais legal até agora não é apenas estar concorrendo ao prêmio, mas ter essa oportunidade de divulgar o projeto e conseguir frutos com ele. Depois de mais de um ano de trabalho duro, alguns frutos já estão sendo colhidos.

E as coisas não param por aí: já estamos desenvolvendo a nova versão, escalável, com desempenho superior e novas técnicas para extrair informação dos textos inseridos. Também serão inclusas opções de gráficos, como no estudo realizado da época do desenvolvimento da versão de pesquisa, porém automatizados, que ajudarão a aferir o sentimento em relação a um período de tempo definido. Pensem nisso como um “Como está a empresa X no último mês na Web?“,  facilitando a sumarização da informação. Contamos com a força de todos para vencer mais esse desafio!

O que você acha da Mineração?

Não, não vou fazer uma análise da Vale (do Rio Doce) hoje não (que frase negativa, não acha?). Vou falar sobre outro tipo de mineração: a de textos. Na verdade, mineração de opiniões, encontradas em textos.

É uma das especialidades da PLN (Processamento de Linguagem Natural), um ramo da IA (Inteligência Artificial) que estuda a linguagem tal qual os humanos utilizam, no dia-a-dia, falando, escrevendo, ouvindo, pensando (calma lá…). Uma busca pela compreensão da linguagem humana pela máquina[bb] sem a necessidade de traduções manuais. O objetivo dessa ciência é fazer com que as máquinas possam um dia conversar com humanos assim como os humanos falam entre si.

Para que isso possa acontecer, a máquina precisa analisar sintaticamente os textos (se estão escritos de forma correta, dentro da estrutura base da linguagem), e  semanticamente (se o texto tem algum ‘sentido’, no tocante às relações entre as palavras do mesmo texto).

Mas, além dessas análises, podemos analisar um texto e classificá-lo em categorias pré-definidas (clustering), onde a máquina pode ajudar (e muito bem já) a saber sobre o que um dado texto fala, e também podemos analisar a Orientação Semântica do texto: sua opinião, sobre o tema que trata, se aquele texto fala positivamente ou negativamente sobre o tema abordado em seu conteúdo.

Nessa vertente, desenvolvo um trabalho, começado em meu TCC, e continuado desde então, sobre mineração de opiniões de conteúdo comum na web, que é, a meu ver, o principal canal de comunicação de nossa época, e principalmente dos jovens. Esse trabalho discursa sobre um sistema que extrai esse conteúdo (textos sobre entidades, como empresas, organizações, pessoas), e aplica um método computacional para extrair essas orientações (em relação à entidade), mostrando ao usuário um parecer sumarizado no período analisado. Resumindo: o sistema pode analisar se estão falando bem ou mal de uma empresa em blogs, portais, etc. É ou não interessante para elas? É o que toda empresa deveria buscar na Web.

Trago esse assunto aqui pois será abordado no mais recente artigo que será publicado no WTI – 2009 (II International Workshop on Web and Text Intelligence) , a ser realizado em Setembro desse ano. Um evento muito legal para quem trabalha com Web e tecnologia. Torçam pela aprovação galera, e quem puder estar lá, até breve!

Rumo ao Arena Info!

Banner oficial do Evento

Banner oficial do Evento

Acabo de confirmar minha participação (inscrição garantida) no Evento Arena Info, uma espécie de concurso que premiará os melhores softwares[bb] dentro das seguintes categorias:

  • Aplicativo Online
  • Widget
  • Inteligência Artificial
  • Game[bb]
  • Android
  • iPhone[bb]

Pena não poder cadastrar o opSys em mais de uma categoria, ficando apenas em Aplicativo Online (caberia muito bem em IA também). De qualquer forma, o interessante é poder divulgar o projeto e também levar o nome da Universidade adiante (quem sabe um dia eu não entro para o time do SENAC? Nunca se sabe!).

Me diga o que buscas…

wolfram-alpha screenshot…e lhe direi a resposta. Essa é uma frase que ajuda a lembrar o propósito do Wolfram Alpha, um novo sistema de busca, baseado em Processamento de Linguagem Natural, um ramo da Inteligência Artificial. A idéia, é com esse tipo de processamento, encontrar respostas diretas a perguntas feitas pelo usuário. Diferente do Google, que busca conteúdo levando em conta a presença dos termos buscados, esse novo conceito procura “entender” a semântica das frases (nem tão novo assim, o Yahoo! Respostas já tentava sanar essa necessidade, mas deixando os usuários responderem) usa o banco de dados textual da web para encontrar a frase que mais se adequa como uma resposta para tal questão.

Pôster no WebMedia 2008Apesar de ser anunciado como uma novidade, esse tipo de abordagem já é estudado há muito tempo, assim como outros aspectos do processamento de linguagem, tais como “Clustering” e uma área mais recente, chamada Mineração de Opinião (Orientação semântica,  da PLN, abordada muito bem aqui),  que inclusive foi tema do meu TCC no ano passado (Mineração de Opinião aplicada à Análise de Investimentos), e uma área à qual dedico parte do meu tempo livre.

Então, muito em breve, além de obter respostas no seu mecanismo de busca como se perguntasse a seu mestre, você ainda vai poder perguntar: “O que o mundo pensa sobre a empresa X?“, ou “O que fulano acha do novo trabalho de sicrano?“. Mas será você quem vai se interessar por essa pergunta, ou as empresas? Aguardem novidades…