21/09/09 – Um teste com uma ferramenta aberta desenvolvida pelo Web Ecology Project, de Boston, em um milhão de postagens no Twitter mostrou que o português é a segunda língua mais usada nesta rede social. Veja o quadro abaixo:
O Web Ecology Project é um grupo interdisciplinar de pesquisa que usa data mining em larga escala para avaliar os fluxos de cultura e as comunidades online e desenvolve ferramentas abertas para proporcionar acessibilidade. O grupo desenvolveu um módulo Phyton para facilitar o uso das ferramentas do Google Language, que envolvem identificação de línguas e sua tradução. Foi este o módulo usado para identificar a linguagem dos tweets.