quarta-feira, 15 de abril de 2015

R e SPOTIFY

R+API+SPOTIFY

Hoje resolvi acessar a API do serviço de streaming de música Spotify, na minha opinião o melhor da categoria e um dos apps que mais utilizo. Só pra constar, odeio todo o conceito do potencial concorrente, Tidal.

Mais uma vez, tudo foi feito utilizando o software livre R.

As funções que criei fazem algumas coisas básicas como: baixar informações de usuários (seguidores,listas etc), baixar informação dos artistas e os artistas que o Spotify define como relacionados. Essa última informação permitiu que eu gerasse grafos. Para ilustrar, coloco aqui dois casos que permitem  visualizar  a rede de artistas relacionados de acordo com o Spotify. 

Interessante ver como cada artista se situa dentro da rede. Olhe com atenção os detalhes e veja como você consegue definir gêneros musicais pelas aglutinações naturais da rede. 

Clique nas imagens para ver com mais detalhes. 

Beatles 




Anitta

Repare como os artistas de Pagode e Samba estão mais próximos, os de Axé, funk, Sertanejo e Rock também estão no que parecem ser um cluster. E a Cláudia  Leite é um híbrido nesses grupos?!

Obs: Obviamente a rede real é muito mais extensa e defini pontos de corte para melhor visualização. Caso gerasse os pontos de maneira indefinida poderia inclusive encontrar artistas de encontro entre a Anitta e os Beatles. Quantos passos seriam necessários?!




Aos que se interessarem nessa e em outras aplicações utilizando redes sociais e o R, recomendo o curso: Análise de dados de redes sociais utilizando o R oferecido como curso de extensão pela PUC-Rio.







segunda-feira, 6 de abril de 2015

R e WhatsApp

Fiz um WordCloud com as minhas conversas no WhatsApp com a Daiane (minha esposa)​ no início de 2012 e do meio de 2014 até hoje em dia. 

Mais uma vez fiz tudo utilizando o R e agora os dados do WhatsApp. 

"Moo" definitivamente caiu em desuso entre nós hehe!

Meus amigos mais próximos vão logo reconhecer as palavras que mais usamos.

Aos que se interessarem em aprender, recomendo o curso abaixo:
Análise de dados de Redes Sociais utilizando o R





segunda-feira, 16 de março de 2015

Ideologia de Políticos usando o Twitter


Utilizando dados do twitter, sua API e o R, resolvi estimar ideologia de políticos importantes no cenário nacional.A ideia é  calcular "Pontos ideais" levando em consideração os seguidores das contas do twitter de cada Político.

Estimar "Ideal Points" não é uma ideia nova e a interpretação do que de fato significam essas estimativas ainda são pontos de discussão. Entretanto, não é incomum associar os resultados a ideologia. 

Vemos, como era de se esperar, que políticos do DEM estão mais associados a direita, assim como políticos do PSOL estão mais associados a esquerda, de acordo com seus seguidores no Twitter.

Veja o gráfico abaixo:





- Próximo passo: Estimar "Pontos Ideais" pros usuários. Exemplo: Luciano Huck, Leonardo Boff e Jabour estão mais identificados, ideologicamente, com a esquerda ou com a direita?

Obs: Esse é só um exercício inicial... Preciso de um computador um pouco mais potente que meu MacBook Pro (i5 com 4gb) pra fazer esses cálculos. Quem tiver um super computador eu ofereço minha amizade verdadeira em troca de algumas (muitas) horas de processamento =)




Questões Técnicas :

O exercício foi possível e graças ao excelente artigo e documentação do Pablo Barberá da New York University (Birds of the Same Feather Tweet Together. Bayesian Ideal Point Estimation Using Twitter DataPolitical Analysis, 2015, 23 (1), 76-91).  O modelo dele estima Ideal Points não só para os Políticos (e outros), como também para os seguidores desses políticos. A probabilidade de um usuário do twitter  i seguir uma conta de um político j é dada por:

Nenhum dos parâmetros do modelo pode ser observado então fazer inferência, principalmente sobre theta e o phi (ideal points dos usuários e dos políticos) é problemático... 

A função de máxima verossimilhança é:


Já da pra ver que estimar isso é um verdadeiro INFERNO! pode ser bem complicado . A ideia é, então, partir pra simulação usando Markov Chain Monte Carlo (http://en.wikipedia.org/wiki/Markov_chain_Monte_Carlo). Usando distribuição Normal pra cada um dos parâmetros Alpha, Beta, Theta e Phi, a distribuição conjunta a posteriori é então:



 Agora é só simular e correr pro abraço!




quarta-feira, 28 de janeiro de 2015

Modelo de Volatilidade para Ação da Petrobras

Resolvi modelar a volatilidade da ação da Petrobras (PETR4). Para tal, ajustei um modelo Beta-Skew-t-Egarch, quem tiver interesse vale a pena olhar em http://www.econ.cam.ac.uk/dae/repec/cam/pdf/cwpe1236.pdf

O modelo tem várias vantagens em relação ao tradicional GARCH.

Fatos interessantes:
- O nível de volatilidade do papel está ficando cada vez mais próximo de 2008 quando houve a crise financeira Mundial. Se algum amigo seu, metido a "inteligente", falar que é uma boa hora pra comprar, fuja e rompa a amizade. A não ser que vc queira especular e não investir seu dinheiro, nem pense nisso.
- Repare na diferença entre os papeis do Bradesco e Petrobras (BBDC4 e PETR4), na segunda figura. A marca preta no gráfico em 2010 mostra o momento da posse da Dilma.




quarta-feira, 21 de janeiro de 2015

Dilma e Aécio no Facebook


Pensando no Aécio Neves e na Dilma Rousseff, fiz um gráfico usando o R e a API do Facebook. 

Desde o fim das eleições, o Slogan do Aécio Neves tem sido ‪#‎nãovamosnosdispersar‬. Bom, a frase é interessante mas parece que o político precisa de uma equipe mais atuante. Repare que a Dilma, assim como no período pré eleição, continua fazendo muito mais postagens no Facebook... 

Aécio, você vai precisar melhorar seu jogo. Uma derrota não foi suficiente? A eleição de 2018 já começou.



quarta-feira, 7 de janeiro de 2015

#JeSuisCharlie

O gráfico mostra a utilização da hashtag #JeSuisCharlie no twitter no dia 7 de Janeiro de 2015. Tweets vindo principalmente da Europa mas de maneira geral o mundo inteiro estava mostrando solidariedade as vítimas e usando a Hashtag.