Fala, Scup!

Archive for abril, 2010

Filtro novo no Scup: Amostragem

Uma das maiores necessidades de operações no Scup que trabalham com muitos itens é conseguir retirar uma amostra dos itens para classificação e tagueamento, já que a classificação de todos os itens é  muito custosa. Normalmente esse processo acontecia de forma improvisada, a partir da data/hora dos posts, manualmente “classificando um, pulando-se 2″ ou a partir algum outro processo.

Entretanto, agora lançamos um filtro novo, capaz de taguear uma porcentagem das postagens.

Isso significa que a cada novo item, ele tem x% de chance de ser tagueado com a tag especificada. É portanto, uma escolha aleatória.

Como usar uma amostragem por tag ?

Uma vez configurado um filtro de amostragem para uma tag, o trabalho de tagueamento e classificação dos posts deve ser feito nos itens tagueados apenas. Ou seja, na aba “Monitor” você deve restringir postagens apenas com a tag especificada.  Dessa forma, o trabalho de classificação e tagueamento se torna bem menor e, em contrapartida, você está tendo resultados que estão com uma margem de erro em relação ao total.

Na aba “Estatísticas”, você também deve restringir pela tag, para ter resultados referentes apenas ao universo tagueado pelo filtro de amostragem.

Aproveitem

Recentemente muitas pessoas estão passando por problemas relacionados à língua em buscas no Twitter. Esse problema é gerado por uma má interpretação do Twitter da língua de um post, gerando uma inconsistência nos resultados.

Vamos pegar um exemplo para ilustrar:

Busca no twitter por “rede globo”, em português (15:00 de 14/04/2010)

Busca no twitter por “rede globo” em “All languages” (todas as línguas) (15:00 de 14/04/2010)

Vejam que não foi encontrado nenhum post pelo twitter em português, mas quando trocamos por “all languages”, vários aparecem e todos em português. Ou seja, o Twitter errou ao identificar a língua do post ou algum erro interno não disponibilizou os itens na listagem de português.

Como isso afeta meu monitoramento no Scup ?

Se você está realizando as buscas do twitter em portuguẽs no Scup, esse problema pode afetar seu monitoramento. Isso porque a busca do Twitter no Scup traz exatamente os mesmos resultados da busca no search.twitter.com. Dessa maneira, se você não quer correr o risco de perder itens importantes em português, vocẽ deve configurar sua busca do Twitter no Scup para “Todas” as línguas.

O problema dessa abordagem é a presença de itens que estão em outras línguas, levando eventualmente a um trabalho de apagá-los recorrentemente. A questão aí é colocar na balança o risco de perder alguns itens mal interpretados pelo twitter contra a possibilidade de encontrarmos posts eventualmente em outras línguas. É uma decisão estratégica que deve estar presente na decisão e manutenção do planejamento do monitoramento em mídias sociais.

Em breve, teremos outras postagens com outros erros comuns em monitoramentos de mídias sociais.