Minerando Eleições: opSys, versão 2.0

opsys-logo
Algumas semanas atrás, liberei a segunda versão do opSys, ferramenta para mineração de opiniões em conteúdo Web. Agora, com recursos que permitem que qualquer pessoa monte um conjunto (SET) de variáveis e extrair opiniões de acordo com sua necessidade. Assim, você pode configurá-lo para medir a opinião de algum assunto que você gosta, marca, gadget, etc. As aplicações são inúmeras, podendo ser usado em pesquisas para medir uma marca, inclusive. Logo que o usuário acessa, ele tem agora duas opções para visualizar o opSys funcionando: A Análise de Investimentos[bb], que explora notícias e comentários sobre o mundo dos investimentos na bolsa, e também o mais novo Set padrão no sistema: Eleições 2010.

Minerando opiniões sobre as Eleições

A maior novidade é que já criei também um conjunto para analisar as Eleições 2010, ou melhor, analisar as opiniões sobre os presidenciáveis num conjunto de blogs, portais e no Twitter. Serra e Dilma já estão sendo minerados pelo sistema, que vai medir o feeling das postagens relacionadas em diversos sites nacionais, blogs diversos e também citações no Twitter. Claro, essa nova investida vai demandar uma série de atualizações no sistema, muitas delas já planejadas desde o ano passado, mas também algumas que vão surgir nesse novo período. Certamente, mudanças esperadas no ciclo de evolução de um sistema dinâmico na Webesfera.

E nesse ponto, as críticas e dicas dos usuários serão muito importantes! Como nunca, aguardo comentários, críticas e sugestões de todos que utilizarem e avaliarem o opSys, para deixá-lo sempre melhor. Confira agora mesmo: http://www.opsys.com.br

Novidades chegando

Nesse momento, já temos algumas pessoas com habilidades distintas colocando seus skills para funcionar, arquitetando mudanças para o opSys, que o tornaram mais fácil de navegar e “consumir”. Designers[bb], Arquitetos da informação[bb], marketeiros… Logo logo, poderão conferir mais novidades! Aguardem!

opSys, up and running

opSys, novo logotipo

Como a maioria de vocês deve ter visto, o Arena Info já chegou ao seu fim faz algum tempinho (e ufa!, finalmente consegui algum tempinho para postar aqui!). Infelizmente, não fui vencedor com o opSys, mas me considero um, graças ao voto de confiança de 177 pessoas que atestaram sua preferência pelo sistema extrator de opiniões. Para mim, um final vencedor, mesmo não sendo o primeiro. Esse concurso levou o opSys ao conhecimento geral, permitindo algumas parcerias bacanas (uma delas com um dos grupos participantes do concurso) que irão permitir seu desenvolvimento ao longo desse 2010 que vem, e assim participar de outros concursos mais.

Obrigado pessoal! Fiquem com um preview do novo logotipo do projeto.

opSys na reta final

opsys-arenaO projeto opSys (http://dev.thlopes.com/opsys), o sistema de mineração de opiniões em conteúdo web, está na final do concurso Arena Info (http://info.abril.com.br/arena/votacao/). Nessa fase, apenas 5 projetos foram escolhidos por categoria, e será escolhido apenas um em cada uma delas para ganhar o prêmio. O mais legal até agora não é apenas estar concorrendo ao prêmio, mas ter essa oportunidade de divulgar o projeto e conseguir frutos com ele. Depois de mais de um ano de trabalho duro, alguns frutos já estão sendo colhidos.

E as coisas não param por aí: já estamos desenvolvendo a nova versão, escalável, com desempenho superior e novas técnicas para extrair informação dos textos inseridos. Também serão inclusas opções de gráficos, como no estudo realizado da época do desenvolvimento da versão de pesquisa, porém automatizados, que ajudarão a aferir o sentimento em relação a um período de tempo definido. Pensem nisso como um “Como está a empresa X no último mês na Web?“,  facilitando a sumarização da informação. Contamos com a força de todos para vencer mais esse desafio!

FILE – Feira Internacional de Linguagem Eletrônica

NURBS PROTO 4KT é a temática do FILE 09, que ocorre em São Paulo de hoje até 30 de agosto. Em sua décima edição, o evento conta novamente com um programação ampla e vanguardista cheia de instalações, performances, exibições, palestras e mesas-redondas para reflexão sobre tecnologia e arte.

Durante este FILE, vai acontecer a primeira transmissão transcontinental em alta definição de um longa-metragem: “Enquanto a Noite Não Chega”, do cineasta brasileiro Beto Souza, entre as cidades de São Paulo (Brasil), San Diego (Estados Unidos) e Yokohama (Japão); haverá também a apresentações de 5 incubadoras tecnológicas e palestra e mesa-redonda com José Murilo, Gerente de Cultura Digital do Ministério da Cultura, falando sobre o Fórum da Cultura Digital Brasileira (culturadigital.br).

Não precisa nem perguntar! Eu vou!

Via Startupi

O que você acha da Mineração?

Não, não vou fazer uma análise da Vale (do Rio Doce) hoje não (que frase negativa, não acha?). Vou falar sobre outro tipo de mineração: a de textos. Na verdade, mineração de opiniões, encontradas em textos.

É uma das especialidades da PLN (Processamento de Linguagem Natural), um ramo da IA (Inteligência Artificial) que estuda a linguagem tal qual os humanos utilizam, no dia-a-dia, falando, escrevendo, ouvindo, pensando (calma lá…). Uma busca pela compreensão da linguagem humana pela máquina[bb] sem a necessidade de traduções manuais. O objetivo dessa ciência é fazer com que as máquinas possam um dia conversar com humanos assim como os humanos falam entre si.

Para que isso possa acontecer, a máquina precisa analisar sintaticamente os textos (se estão escritos de forma correta, dentro da estrutura base da linguagem), e  semanticamente (se o texto tem algum ‘sentido’, no tocante às relações entre as palavras do mesmo texto).

Mas, além dessas análises, podemos analisar um texto e classificá-lo em categorias pré-definidas (clustering), onde a máquina pode ajudar (e muito bem já) a saber sobre o que um dado texto fala, e também podemos analisar a Orientação Semântica do texto: sua opinião, sobre o tema que trata, se aquele texto fala positivamente ou negativamente sobre o tema abordado em seu conteúdo.

Nessa vertente, desenvolvo um trabalho, começado em meu TCC, e continuado desde então, sobre mineração de opiniões de conteúdo comum na web, que é, a meu ver, o principal canal de comunicação de nossa época, e principalmente dos jovens. Esse trabalho discursa sobre um sistema que extrai esse conteúdo (textos sobre entidades, como empresas, organizações, pessoas), e aplica um método computacional para extrair essas orientações (em relação à entidade), mostrando ao usuário um parecer sumarizado no período analisado. Resumindo: o sistema pode analisar se estão falando bem ou mal de uma empresa em blogs, portais, etc. É ou não interessante para elas? É o que toda empresa deveria buscar na Web.

Trago esse assunto aqui pois será abordado no mais recente artigo que será publicado no WTI – 2009 (II International Workshop on Web and Text Intelligence) , a ser realizado em Setembro desse ano. Um evento muito legal para quem trabalha com Web e tecnologia. Torçam pela aprovação galera, e quem puder estar lá, até breve!

Me diga o que buscas…

wolfram-alpha screenshot…e lhe direi a resposta. Essa é uma frase que ajuda a lembrar o propósito do Wolfram Alpha, um novo sistema de busca, baseado em Processamento de Linguagem Natural, um ramo da Inteligência Artificial. A idéia, é com esse tipo de processamento, encontrar respostas diretas a perguntas feitas pelo usuário. Diferente do Google, que busca conteúdo levando em conta a presença dos termos buscados, esse novo conceito procura “entender” a semântica das frases (nem tão novo assim, o Yahoo! Respostas já tentava sanar essa necessidade, mas deixando os usuários responderem) usa o banco de dados textual da web para encontrar a frase que mais se adequa como uma resposta para tal questão.

Pôster no WebMedia 2008Apesar de ser anunciado como uma novidade, esse tipo de abordagem já é estudado há muito tempo, assim como outros aspectos do processamento de linguagem, tais como “Clustering” e uma área mais recente, chamada Mineração de Opinião (Orientação semântica,  da PLN, abordada muito bem aqui),  que inclusive foi tema do meu TCC no ano passado (Mineração de Opinião aplicada à Análise de Investimentos), e uma área à qual dedico parte do meu tempo livre.

Então, muito em breve, além de obter respostas no seu mecanismo de busca como se perguntasse a seu mestre, você ainda vai poder perguntar: “O que o mundo pensa sobre a empresa X?“, ou “O que fulano acha do novo trabalho de sicrano?“. Mas será você quem vai se interessar por essa pergunta, ou as empresas? Aguardem novidades…