Minerando Eleições: opSys, versão 2.0

opsys-logo
Algumas semanas atrás, liberei a segunda versão do opSys, ferramenta para mineração de opiniões em conteúdo Web. Agora, com recursos que permitem que qualquer pessoa monte um conjunto (SET) de variáveis e extrair opiniões de acordo com sua necessidade. Assim, você pode configurá-lo para medir a opinião de algum assunto que você gosta, marca, gadget, etc. As aplicações são inúmeras, podendo ser usado em pesquisas para medir uma marca, inclusive. Logo que o usuário acessa, ele tem agora duas opções para visualizar o opSys funcionando: A Análise de Investimentos[bb], que explora notícias e comentários sobre o mundo dos investimentos na bolsa, e também o mais novo Set padrão no sistema: Eleições 2010.

Minerando opiniões sobre as Eleições

A maior novidade é que já criei também um conjunto para analisar as Eleições 2010, ou melhor, analisar as opiniões sobre os presidenciáveis num conjunto de blogs, portais e no Twitter. Serra e Dilma já estão sendo minerados pelo sistema, que vai medir o feeling das postagens relacionadas em diversos sites nacionais, blogs diversos e também citações no Twitter. Claro, essa nova investida vai demandar uma série de atualizações no sistema, muitas delas já planejadas desde o ano passado, mas também algumas que vão surgir nesse novo período. Certamente, mudanças esperadas no ciclo de evolução de um sistema dinâmico na Webesfera.

E nesse ponto, as críticas e dicas dos usuários serão muito importantes! Como nunca, aguardo comentários, críticas e sugestões de todos que utilizarem e avaliarem o opSys, para deixá-lo sempre melhor. Confira agora mesmo: http://www.opsys.com.br

Novidades chegando

Nesse momento, já temos algumas pessoas com habilidades distintas colocando seus skills para funcionar, arquitetando mudanças para o opSys, que o tornaram mais fácil de navegar e “consumir”. Designers[bb], Arquitetos da informação[bb], marketeiros… Logo logo, poderão conferir mais novidades! Aguardem!

Visualizando a Internet

Treemap of the Internet Top 100 Sites

Encontrei no site da BBC, esse incrível TreeMap (pra quem não sabe, é um gráfico que permite visualizar grandes quantidades de dados em um espaço pequeno, de uma forma bem condensada) mostrando uma ‘fotografia’ que representaria nossa internet, através de uma pesquisa com os Top 100 Sites. Realizada pelo grupo Nielsen, como parte do projeto SuperPower, uma temporada de programas explorando o poder da Internet.

Cada conjunto de quadrados da mesma família de cores representa um dos sites daquela categoria. Por exemplo, em Busca e Portais, o maior grupo, temos 5 grandes sites disputando terreno na lista. Já em Vídeo, temos apenas, ou seja, apenas um grande site dessa categoria entrou no Top 100.

Visitando o site da BBC, você pode interagir melhor com o gráfico, e visualizar detalhes de cada categoria.

Zapping semanal – 48/53

ConhecimentoConhecimento é poder. E poder demais, nunca é bom nas mãos de uma pessoa só. Por isso, vou compartilhar semanalmente links, artigos, dicas e tudo o mais que eu conseguir absorver pelo caminho, seja em relação a trabalho ou projetos pessoais (tudo relacionado à temática do site: Desenvolvimento Web, Computação, Ciência e poesia!). Novidades dos projetos também entram!!! Claro, como não vou poder destrinchar todos os conteúdos aqui, conto com a ajuda de todos vocês, queridos leitores, com comentários, mais links, e mais coisas sobre os assuntos abordados. Enjoy!

opSys, up and running

opSys, novo logotipo

Como a maioria de vocês deve ter visto, o Arena Info já chegou ao seu fim faz algum tempinho (e ufa!, finalmente consegui algum tempinho para postar aqui!). Infelizmente, não fui vencedor com o opSys, mas me considero um, graças ao voto de confiança de 177 pessoas que atestaram sua preferência pelo sistema extrator de opiniões. Para mim, um final vencedor, mesmo não sendo o primeiro. Esse concurso levou o opSys ao conhecimento geral, permitindo algumas parcerias bacanas (uma delas com um dos grupos participantes do concurso) que irão permitir seu desenvolvimento ao longo desse 2010 que vem, e assim participar de outros concursos mais.

Obrigado pessoal! Fiquem com um preview do novo logotipo do projeto.

opSys na reta final

opsys-arenaO projeto opSys (http://dev.thlopes.com/opsys), o sistema de mineração de opiniões em conteúdo web, está na final do concurso Arena Info (http://info.abril.com.br/arena/votacao/). Nessa fase, apenas 5 projetos foram escolhidos por categoria, e será escolhido apenas um em cada uma delas para ganhar o prêmio. O mais legal até agora não é apenas estar concorrendo ao prêmio, mas ter essa oportunidade de divulgar o projeto e conseguir frutos com ele. Depois de mais de um ano de trabalho duro, alguns frutos já estão sendo colhidos.

E as coisas não param por aí: já estamos desenvolvendo a nova versão, escalável, com desempenho superior e novas técnicas para extrair informação dos textos inseridos. Também serão inclusas opções de gráficos, como no estudo realizado da época do desenvolvimento da versão de pesquisa, porém automatizados, que ajudarão a aferir o sentimento em relação a um período de tempo definido. Pensem nisso como um “Como está a empresa X no último mês na Web?“,  facilitando a sumarização da informação. Contamos com a força de todos para vencer mais esse desafio!

Conectando cérebros

cerebroA Ciência está avançando. Você sabia que já estão cogitando a conexão de cérebros, como se fossem nós de rede? Pois é, alguns pensadores do meio científico acreditam que, com o avanço da pesquisa, e pelo cenário que temos hoje em dia, num futuro próximo, nós humanos iremos nos conectar uns aos outros, trocando pensamentos, memória, e tudo o mais que o cérebro puder prover. Inclusive, processamento. Silvio Meira, em sua coluna, comenta sobre o fato: “Vamos pensar Juntos” vai se tornar uma expressão literal e física.

“Onde dois ou mais estiverem reunidos, ali estarei”, disse Jesus há mais de dois mil anos. Estaria o homem próximo a descobrir o significado dessa frase, chegando mais próximo da essência da vida e das respostas para a existência humana?

Acho que vou escrever mais sobre essa temática (e já estou…)

Lido em Silvio Meira

O que você acha da Mineração?

Não, não vou fazer uma análise da Vale (do Rio Doce) hoje não (que frase negativa, não acha?). Vou falar sobre outro tipo de mineração: a de textos. Na verdade, mineração de opiniões, encontradas em textos.

É uma das especialidades da PLN (Processamento de Linguagem Natural), um ramo da IA (Inteligência Artificial) que estuda a linguagem tal qual os humanos utilizam, no dia-a-dia, falando, escrevendo, ouvindo, pensando (calma lá…). Uma busca pela compreensão da linguagem humana pela máquina[bb] sem a necessidade de traduções manuais. O objetivo dessa ciência é fazer com que as máquinas possam um dia conversar com humanos assim como os humanos falam entre si.

Para que isso possa acontecer, a máquina precisa analisar sintaticamente os textos (se estão escritos de forma correta, dentro da estrutura base da linguagem), e  semanticamente (se o texto tem algum ‘sentido’, no tocante às relações entre as palavras do mesmo texto).

Mas, além dessas análises, podemos analisar um texto e classificá-lo em categorias pré-definidas (clustering), onde a máquina pode ajudar (e muito bem já) a saber sobre o que um dado texto fala, e também podemos analisar a Orientação Semântica do texto: sua opinião, sobre o tema que trata, se aquele texto fala positivamente ou negativamente sobre o tema abordado em seu conteúdo.

Nessa vertente, desenvolvo um trabalho, começado em meu TCC, e continuado desde então, sobre mineração de opiniões de conteúdo comum na web, que é, a meu ver, o principal canal de comunicação de nossa época, e principalmente dos jovens. Esse trabalho discursa sobre um sistema que extrai esse conteúdo (textos sobre entidades, como empresas, organizações, pessoas), e aplica um método computacional para extrair essas orientações (em relação à entidade), mostrando ao usuário um parecer sumarizado no período analisado. Resumindo: o sistema pode analisar se estão falando bem ou mal de uma empresa em blogs, portais, etc. É ou não interessante para elas? É o que toda empresa deveria buscar na Web.

Trago esse assunto aqui pois será abordado no mais recente artigo que será publicado no WTI – 2009 (II International Workshop on Web and Text Intelligence) , a ser realizado em Setembro desse ano. Um evento muito legal para quem trabalha com Web e tecnologia. Torçam pela aprovação galera, e quem puder estar lá, até breve!