A informação veiculada em quadros e gráficos estatísticos é imensa e multivariada. Geralmente, fazem-se análises particulares segundo o ângulo que ao observador interessa mais, que noutros momentos, pode ser muito diferente. Assim, creio que o disponibilizarem-se quadros e gráficos estatísticos aos estudiosos é muito importante e que, num blogue, permite que se faça debate das interpretações e análises que cada observador faz dos dados apresentados.

quinta-feira, 10 de dezembro de 2009

Redes Sociais em Portugal: Análise de Audiências Dez’09 (II)

via Dissonância Cognitiva by Bruno Ribeiro on 12/10/09

Ontem apresentei o ranking das redes sociais em Portugal via Alexa. Hoje é a vez das tendências de tráfego dessas mesmas redes sociais usandos os dados do Google Trends for Websites. É preciso que se perceba que estes dados são estimativas do Google para o número de visitas únicas diárias a um dado site, como tal estão sujeitas a erro. É também importante afirmar que o número de visitas a um site não é igual a número de utilizadores registados. Posto isto, fica a análise a cada uma das redes socias no Top 100 de sites em Portugal de acordo com a Alexa – excepcção feita ao Orkut para o qual o Google guarda os dados só para si.

Hi5

A tendência no que toca ao Hi5 não podia ser mais óbvia: queda constante! De número 2 no ranking Alexa de sites em Portugal, passou para número 5 e, atendendo a estes dados do Google, a queda irá continuar.

Facebook

Comportamento oposto tem denotado o Facebook que, mais do que crescer tem vindo a fazê-lo de forma constante o que demonstra que não se trata tanto de uma moda mas sim de uma plataforma em plena implementação

Para se perceber melhor a relação entre as tendências de tráfego desta duas redes sociais, nada como compará-las num mesmo gráfico, o que torna ainda mais evidente o aproximar do Facebook ao Hi5 em termos de acessos (o que é diferente de utilizadores registados).

Twitter

Analisar o tráfego ao site twitter.com é mais problemático do que para as restantes redes sociais, já que muitos utilizadores acedem à plataforma através de aplicações externas. Em todo o caso nota-se uma diminuição no número de acessos face ao verificado no primeiro semestre de 2009, algo que já havia sido abordado por Paulo Querido no diário2.

MySpace

Como referi ontem, o MySpace foi a única rede social cuja tendência de tráfego não aparentava estar de acordo com aquilo que os dados de Agosto davam a entender. Mas como avancei, isso poderia dever-se a flutuações em outros sites e não propriamente no MySpace. Os dados do Google parecem corroborar esta versão já que a queda de tráfego para esta rede social tem continuado.

Badoo e Tagged

O perfil de tráfego para estas duas redes sociais é similar – com a diferença de o volume ser superior no caso do Badoo – e a queda de ambos no ranking de sites Alexa para Portugal é perfeitamente compreensível visualizando estes dois gráficos.

LinkedIn

Tal como em Agosto referi o maior interesse pelo uso de redes sociais a nível profissional iria resultar certamente num crescimento do LinkedIn. A entrada no ranking Alexa face a Agosto – de referir que a sazonalidade também terá contribuído para essa mesma ausência – demonstra um maior interesse pela rede social vocacionada para aspectos profissionais, o que é confirmado pelos dados fornecidos pelo Google.

Estes dados do Google vêm corroborar aquilo que afirmei em Agosto: o Facebook está a crescer ao ponto de se tornar – talvez mais rapidamente do que esperado – na rede social predominante em Portugal. No que toca ao Twitter, volto a reafirmar que este dados tornam, pelas características de utilização específica do serviço, difícil a tarefa de prognosticar uma tendência futura. Aliado a isso existe o crescimento de serviços de acesso mobile integrados que poderão vir a ser no futuro os meios de acesso privilegiados a este tipo de plataformas. Para tentar compensar esta falta de informação, resolvi acrescentar mais dados a esta análise, usando o Google Trends for Search, cujos resultados irei apresentar num outro post amanhã.

Redes Sociais em Portugal: Análise de Audiências Dez’09 (I)

via Dissonância Cognitiva by Bruno Ribeiro on 12/9/09

Em Agosto deste ano escrevi um duplo post de análise de audiências às redes sociais em Portugal, usando para isso dados dos sites Alexa e do Google Trends for Websites. Passados 4 meses, resolvi efectuar nova análise e verificar se existiram alterações e se a minha análise, tentando prever um pouco de futuro, estava correcta. Na altura, em jeito de conclusão escrevi o seguinte:

O que estes dados demonstram (…) é que o Facebook e Twitter estão em plena fase de expansão em Portugal, muito provavelmente às custas de Myspace e hi5.

Na altura referi ainda ser previsível que o Facebook viesse a "ameaçar" o domínio do hi5 e que acreditava que o LinkedIn – que não surgia no top 100 do Alexa – viesse a crescer nos meses seguintes. A seguinte tabela comparativa entre as posições de 8 redes sociais em Portugal entre Agosto e Dezembro vem de certa forma confirmar aquilo que escrevi:

Comparando com aquilo que já se poderia ver em Agosto em termos de tendências, não é de surpreender que hi5 tenha perdido posições e que Facebook e Twitter pelo contrário tenham subido no ranking. Do mesmo modo, hi5 e Facebook estão agora muito mais próximos. Tal como esperava, o LinkedIn surje agora na lista na posição 84 o que apenas vem confirmar o maior interesse profissional sobre as redes sociais. O único facto surpreendente, tendo em conta a análise feita em Agosto, é a melhoria da posição do MySpace.

Mas, tal como indiquei em Agosto, esta análise é apenas uma "fotografia" num determinado momento e não nos permite inferir tendências. Para tal é necessário analisar os padrões de acesso a cada uma das redes sociais, pois só assim poderemos afirmar que um determinado site está a crescer ou não. É possível que as alterações nos rankings se devam em parte ao crescimento, ou à diminuição, de tráfego de outros sites e não a qualquer alteração no padrão de utilização de redes sociais por parte dos portugueses. Como tal, para amanhã fica a análise da tendência de tráfego destas redes sociais – excepção para o Orkut porque o Google Trends for Websites não fornece dados para propriedades Google.

segunda-feira, 7 de dezembro de 2009

Cartograms Show AIDS Around the World

via RT @cienciasexactas -from:cienciasexactas - Twitter Search by tvinsomne@twitter.com (tv insm) on 12/7/09
RT: @CienciasExactas: informática: - Cartograms Show AIDS Around the World http://bit.ly/6h7eef

quarta-feira, 18 de novembro de 2009

Weekends and Afternoons Show the Highest Twitter CTRs

via Dan Zarrella by Dan Zarrella on 10/27/09

Want more clicks? My new data suggests that you should Tweet your links in afternoons, evenings and on weekends.

Continuing the study of Twitter clickthrough rates I started last week, I added over 100 more of the most followed Twitter accounts to my database and indexed click data on over 20,000 bit.ly links Tweeted by those accounts. In all of the data below, I measured CTR as the number of clicks a link received, divided by the number of followers the sending account had on the day it Tweeted it. As I noted in my other post, this number can be over 100% due to ReTweets that may use the same bit.ly link.

The graphs below shows the percentage of difference in CTR at each hour or day from the specific average for each account. I did it this way to account for the wide variation in CTRs between accounts (some accounts have much higher rates than others).

The first data point I analyzed is time of day (EST). It showed the expected afternoon/evening preference seen in my other Twitter stats.

Next I looked at days of the week, which showed a much less expected weekend preference. I believe this is due to the "link fatigue" present during the weekdays, where there is a much higher level of activity and many more links are posted.


Download the Science of ReTweets Report here.

Modeling ReTweet Dynamics

via Dan Zarrella by Dan Zarrella on 10/26/09

Earlier this year I read a paper called "Modeling Blog Dynamics" in which they propose a method of modeling the spread of links through the blogosphere using zero-crossing random walks and exploitation vs. exploration applied to a logical flowchart model:

The authors suggested that the model could be used in influence maximization algorithms which aim to identify key, influential individuals in a given social network for the purposes of viral marketing. I was intrigued by the possibilities and have been tossing around a possible flowchart model of how individuals decide to ReTweet specific Tweets since reading that paper. Here's my first attempt:

There are three steps in the process where a marketer can increase the chances of a specific Tweet being ReTweeted. The first step indicates that a user must be following the sender of the target Tweet; the second step means that they must actually see the Tweet in question (try to imagine what percentage of your friend's timeline you actually see). Step three is where the user must find some motivation to ReTweet it.

Maximizing the number of followers the Tweet's original sender has is fairly straightforward, and most of my Science of ReTweets data has explored the ReTweet motivation percentage. I had not put much effort into analyzing statistics around the attention problem, but I've begun to.

Because there is no way to exactly measure what percentage of followers will actually read a given Tweet, the next best metric we have is click through percentages, so that is what I've been working with. You can expect to see more work to that end in the next few weeks.

My work has been concentrated on maximizing the contagiousness of ideas, whereas much of the aforementioned academic work focuses on the people involved in spreading ideas. So you can also expect to see me advance the concepts of "ReTweetability" I began a few months ago with the purpose of identifying influential users.


Download the Science of ReTweets Report here.

Want More Clicks? Tweet Less

Um livro interessante, de apenas 22 páginas, que apresenta dados estatísticos dos utilizadores do tweetter e que nos mostra as tendências comportamentais destas pessoas no fazerem re-tweets. O estudo responde, em parte, à seguinte questão - Qual a melhor hora para se fazer um re-tweet de modo a ser lido por um maior número de pessoas?
http://danzarrella.com/science-of-retweets.pdf
Rui Moio

via Dan Zarrella by Dan Zarrella on 10/21/09

Tweet Much? Don't Expect a High CTR. New data I've been working on seems to indicate that the more frequently you Tweet links, the fewer clicks you'll get.

I've been working towards a statistical model of how an individual makes a decision to ReTweet a specific Tweet and in that process, I came across an interesting problem: before someone ReTweets something, they have to notice it. If you're anything like me, you're only able to actually read a small percentage of the total activity in your friend's timeline, which means that very few of the Tweets I'm technically "exposed" to ever even have the chance of being ReTweeted.

As a measure of "attention," I started looking into click-through data. The wonderful thing about bit.ly is that it has an API that allows anyone to view the stats on any bit.ly link. I grabbed as many of the bit.ly-containing Tweets of several of the most followed and link-heavy Twitter accounts as the Twitter API allows (it imposes a limit of 3,200 total Tweets accessible per user) and the number of clicks each link had gotten. For the time of each Tweet, I also pulled the number of followers that account had and calculated a followers-to-clicks conversion rate. I'll call this rate CTR for simplicity's sake. I was able to get this information for about 2000 Tweets. It is important to note that ReTweets of a bit.ly containing Tweet (if the ReTweeter does not change the link) also count toward the total number of clicks, so it is possible in some cases for a link to have a CTR of over 100%.

Digging into this data, I started to notice an interesting trend: the higher the number of links an account Tweets in a given timeframe, the lower the CTR on each individual link. If you want your Tweet to get noticed and ReTweeted, you should slow down your posting rate.

First, I looked at this data hourly, by graphing the CTR of Tweets over the number of other Tweets posted in the same hour. The first graph below shows individual lines for each account measured; the second graph shows an average for all those accounts.

Then I looked at the numbers by day. The CTR fall-off in these graphs seems to be slower than those above, but the trend is still prominent.

I've got a bunch more stats and analysis to run on this dataset to isolate some factors that lead to increased CTR, and therefore increased attention. I'd also love your feedback on data points you'd like to see.


Download the Science of ReTweets Report here.

sábado, 14 de novembro de 2009

TinEye and plugins

via The Idee Blog by Leila Boujnane on 11/13/09

Picture 3

We spend a significant amount of time in the Ideeplex looking over and analyzing data. We work with extremely large data sets (images typically) and it is always interesting to see what rises up to the surface once you dive in.

Our image search engine TinEye is used by a lot of people and it is interesting (for us) to see the browsers used to access TinEye. Since we launched a TinEye Firefox add-on, we received a lot of requests to develop plugins for other browsers particularly Opera, Safari and Chrome. However the bulk of our visitors are Firefox and IE users. Looking at the data our plugin development plan is pretty wrapped up! We can now go and focus on other things (such as TinEye APIs!).

Incidentally the TinEye Firefox add-on is getting close to 400,000 downloads! I want to see the 1 million download before the year end…