A informação veiculada em quadros e gráficos estatísticos é imensa e multivariada. Geralmente, fazem-se análises particulares segundo o ângulo que ao observador interessa mais, que noutros momentos, pode ser muito diferente. Assim, creio que o disponibilizarem-se quadros e gráficos estatísticos aos estudiosos é muito importante e que, num blogue, permite que se faça debate das interpretações e análises que cada observador faz dos dados apresentados.
domingo, 17 de maio de 2009
Análise dos resultados do concurso "A Bordo do Beagle"
quarta-feira, 29 de abril de 2009
Que nota dão a Obama?
Obama completou 100 dias na Casa Branca
A aprovação é a mais alta dos últimos 20 anos.
69% dos americanos aprovam Obama
54% dizem que ele superou as expectativas
56% consideram o seu governo excelente
93% dos democratas aprovam a sua governação
36% dos republicanos concordam com as políticas de Obama
Antes de Obama,
19% achavam que o país estava no bom caminho,
agora a percentagem é de 50%.
35 analistas avaliaram a política externa americana
e atribuíram a Obama a nota de 6,34 (escala de dez).
E vocês,
que nota atribuem aos primeiros 100 dias do presidente dos EUA?
Luís Castro
terça-feira, 28 de abril de 2009
Gripe suína: 10.000 tweets por hora (25 em Portugal)

Em Portugal os números são mais modestos mas acompanham a onda: 25 menções por hora das palavras "gripe" ou "flu" no conjunto de 5.900 contas que seguimos para estes efeitos estatísticos. Ou seja, pelo menos 575 tweets diziam directamente respeito à gripe suína. O tema dominante, ocupando, sozinho, mais de 5% do total de tweets rastreados ao longo das 24 horas de segunda-feira.
domingo, 19 de abril de 2009
Audiências do 1.º Trimestre de 2009
sábado, 4 de abril de 2009
10 anos de palavrões no Guardian

Leitura do quadro feita pelo próprio Hume:
- Swearing is growing slowly year-on-year, across the board;
- Unusually, in 2001, swearing stayed more-or-less level. Bastard declined after 2001 - probably an after-effect of 9/11, after which most other swearing grew;
- Wank is massively underperforming over the last decade, whilst cock is flat;
- Shit has grown disproportionately and steadily since 2005, whilst fuck has gone as far as it can;
[Informação original recolhida aqui]
quarta-feira, 1 de abril de 2009
El 79% de las personas vuelve a leer sus libros
segunda-feira, 23 de março de 2009
O ciclo diário da comunicação
A publicação nos social media diverge do ciclo diário dos órgãos de comunicação social e quanto mais pessoal a comunicação se torna, mais se acentua a divergência.
Esta é a minha mais imediata conclusão de um pequeno estudo que levei a cabo e cujos resultados se sintetizam no gráfico abaixo com o ciclo diário de publicação. Nele podemos seguir as três curvas e a sua distribuição ao longo do dia: a azul as notícias nos mainstream media (MSM), a verde os posts na blogosfera e a vermelho os tweets no Twitter.
Quadro com a distribuição percentual (à esquerda) pelas horas do dia (em baixo) do total de tweets, posts e notícias. Analisados 622.293 tweets de 3.552 contas, 53.690 posts publicados por 520 blogs e 74,776 notícias publicadas por 12 órgãos de comunicação social
É fácil perceber que o ciclo dos blogs — um meio social que se caracteriza por ser sobretudo opinativo — segue colado ao ciclo dos noticiários, com um intervalo típico de uma hora de "atraso". Os bloggers tendem a comentar a actualidade e esta é-lhes fornecida (ainda lhes é fornecida…) sobretudo pelos órgãos de comunicação social.
Mesmo as duas vezes em que a linha verde ultrapassa a azul — isto é, quando a frequência de publicação em blogs é superior à frequência de publicação em MSM — acentuam a interpretação: a meio da manhã e a seguir aos noticiários televisivos prime time, ou seja, reagindo a maiores doses de informação para digerir sob a forma de comentário, opinião, acrescento, rectificação.
Mas à medida que o meio se torna menos opinativo e tende para o conversacional esta colagem atenua-se, se é que não desaparece mesmo. O ondulado da linha vermelha tem mais a ver com os horários das pessoas, não estando sujeito à "ditadura do noticiário". Não cheguei a isolar, nos dados do Twitter, as fontes automáticas das humanas; penso que sem a influência dos automatismos, que replicam na twitosfera as publicações da blogosfera e da mediaesfera, a curva vermelha se afastaria um pouco mais, ainda, da curva azul.
Intrigante é o duplo pico da meia noite. Naqueles 60 minutos entre as 00:00:00 e as 00:00:59 há um verdadeiro despejo dos MSM para dentro da Internet. Este explica-se facilmente: jornais como o Correio da Manhã e o Diário de Notícias libertam a essa hora as notícias das edições de papel que estão a sair das rotativas, influenciando a curva. Mas penso ser abusivo interpretar o pico dos blogs à mesma hora dentro da lógica da reacção opinativa às notícias. Na falta de melhor explicação, será assim tão grande a quantidade de bloggers que deixa posts agendados para a meia noite, como já me foi sugerido?
A observação da blogosfera desde 2003 leva-me a ser prudente. Talvez este pico se deva, isso sim, àquela parte dos bloggers que nem sequer está particularmente interessada em comentar a actualidade; os blogs diarísticos, os blogs virados para interesses como a puericultura, a música, etc. Este "turno" pega ao "trabalho" a partir das nove da noite e até à uma da manhã, com os miúdos já na cama e a casa mais sossegada, tem então o seu tempo recreacional. Embora a lista dos 520 analisados tenda a incluir em especial os blogs mais lidos, que são os opinativos, nem estes são "puros", nem a actividade de publicação dos outros diminuiu por terem sido ultrapassados no que respeita ao tamanho das audiências.
Enfim — aguardo os contributos dos leitores, no sentido de interpretarmos melhor este tipo de dados, publicados pela primeira vez.
O quadro com os três ciclos ajuda-nos a estudar melhor o funcionamento colectivo dos diversos agentes da infoesfera. A curva fornece elementos de análise importantes, como é o caso das horas em que existe maior presença humana na rede, tanto passiva (leitor) como activa (editor). Já a questão da distribuição da atenção das pessoas, que é um recurso limitado — e o recurso disputado… –, fica para outro tipo de data mining. Uma interrogação pertinente: será que o potencial viral das redes sociais segue a curva do tamanho da audiência instantânea? (hint, ainda antes de publicar dados em próximo artigo: não, é totalmente diferente!).
A recolha de dados foi efectuada ao longo dos últimos meses. Desde Abril de 2008, foram analisados 622.293 micro-posts, ou tweets, de 3.552 contas no Twitter; desde Novembro desse ano fiz a contabilidade a 53.690 posts publicados por 520 blogs e a 74,776 notícias publicadas por 12 órgãos, incluindo televisão, rádio, imprensa diária, não diária e edição web.

















