Hackeando a sua comunidade

Este título parece meio sensacionalista mas é uma maneira de dizer que utilizamos as nossas habilidades hackers para descobrir informações sobre a nossa comunidade. Trocando em miúdos, fizemos uma análise dos dados do Meetup.com para entender como a comunidade tem funcionado e como podemos melhorá-la. Quer saber como?

Há um ano atrás criamos o grupo do GDG BH no Meetup.com, ferramenta para reunir pessoas com interesses em comum e marcar encontros. A partir disso, quase todos os nossos encontros foram marcados por lá. Somos atualmente 1.150 membros, com 31 eventos realizados ao longo desse ano.

Acompanhar o crescimento da comunidade é interessante mas não é a melhor métrica para saber se estamos de fato sendo uma comunidade que engaja, compartilha, inspira e cria novas coisas juntos. Por isso resolvemos utilizar os dados da própria comunidade para entender coisas como quais os melhores dias e horário pra realizar os eventos, quais os perfis existentes na comunidade, o que as pessoas interessam-se mais… E por aí vai!

Quanto organizadores nós tínhamos algumas perguntas sem respostas, como:

  • Qual o melhor dia e horário para realizar os eventos?
  • Quais os assuntos de interesse?
  • Qual o perfil dos participantes da comunidade?

Por isso resolvemos analisar os dados do GDG-BH (ou tentar)!

O Meetup oferece uma API que possibilita a coleta de dados dos grupos. Então você pode coletar informações sobre os eventos, as confirmações, os tópicos de interesses e muito mais. Esses dados são uma fonte rica para sabermos quem é a comunidade.

Captura de Tela 2015-12-01 às 23.43.14

Utilizamos o Python para fazer a coleta dos dados, utilizando a biblioteca requests – que torna a vida bem mais fácil. Pra armazenar, utilizamos o MongoDB. Os dados retornados pela API tem formato JSON, o que facilitou a inserção no Mongo.

Fizemos uma coleta no mês de Agosto, onde tínhamos 800 membros e 25 eventos realizados, capturando os dados de eventos, membros e RSVPs (confirmações ou “Respondez s’il vous plait” – “responda, por favor”, em francês). A partir disso, começamos a brincar com os dados e fazer novas perguntas, como:

Quantos membros já foram aos eventos?

Para essa pergunta, distribuímos o número de membros pelo número de eventos que estes membros já foram (lembrando que até aqui nós não tínhamos como saber se a pessoa foi de fato :( ). A partir dessa distribuição, esse gráfico:

distribuicao_rsvp_membros

Fazendo uma leitura dele temos que 278 pessoas foram apenas uma vez aos encontros. Enquanto 204 pessoas foram de 2 a 5 vezes e 30 pessoas foram mais de 6 vezes. Isso significa que temos muitas pessoas novas indo aos meetups e que 24% das pessoas que foram mais de 6 vezes.

Mas voltando a tentativa de responder as perguntas iniciais, começamos a analisar os horários em que já realizamos eventos. Tivemos 16% de eventos pela manhã, 28% a tarde e 56% a noite.

Captura de Tela 2015-12-02 às 00.48.38

Algumas curiosidades:

  • Nunca fizemos eventos no Domingo :)
  • Durante a semana, terças e quintas comandam!
  • 95% das atividades do sábado foram relacionadas ao Women Techmakers!

Embora tenhamos achado interessante essas estatísticas, não tivemos como medir o interesse das pessoas pois as vagas foram todas preenchidas e não tínhamos como medir o no-show (não comparecimento no evento).

Porém, já ficou a dica para as próximas análises adicionarmos dados do número de vagas disponíveis e número de pessoas que não compareceram.

Partindo para a próxima pergunta, buscamos entender quais os assuntos interessam mais os membros da comunidade.

Todas as vezes que um usuário cadastra-se no Meetup.com a ferramenta solicita que ele preencha temas que sejam de seu interesse e também possibilita que o usuário insira novos tópicos. Tópicos de interesse podem ser: aprender inglês, html, jogar futebol, praticar yoga, e-commerce, mobile. Para descobrir o que interessa mais ao membro do GDG BH nós utilizamos os tópicos informados pelo membro em seu perfil.

Somando todos tivemos 851 tópicos! Ou seja, tópicos pra c*%$# burro! Então resolvemos agrupar os tópicos semelhantes. Por exemplo: impressora 3D, impressora 3D maker, impressora 3D modelos. Todos esses tópicos formaram apenas um: impressora 3D. Com esse filtro ficamos com 247 tópicos. Muito melhor! :)

Qual o tópico mais citado? CARREIRA. Pois é, a maioria dos membros do GDG BH está interessado em como melhorar a sua carreira. Mas vamos aprofundar mais essas descobertas!

Com esses tópicos, criamos um grafo que conectava todos os interesses de um usuário. Os nós do grafo eram os tópicos e as arestas a conexão entre esses tópicos (criada de acordo com os interesses). Caso já existisse uma conexão (aresta), era contabilizado um peso na aresta – ou seja, aquela conexão tinha uma relevância maior.

Então nosso grafo ficou assim! :-O

Captura de Tela 2015-12-02 às 01.07.04

E isso significa: nada. 😛

Apenas observando esse grafo, não conseguimos entender muitas coisas pois os interesses estão bem conectados. Nas bordas os tópicos com pouco interesse e no meio os tópicos com bastante interesse.

Como são 247 tópicos, resolvemos extrair as 20 conexões mais relevantes para os membros da comunidade.

 

 

Com algumas surpresas e outros interesses já esperados, encontramos este subgrafo:

Captura de Tela 2015-12-02 às 01.11.00

O interesse em desenvolvimento, empreendedorismo e carreira é latente. Podemos perceber um grande interesse em empreendedorismo, o que reflete o San Pedro Valley, uma das comunidades de startups mais ativas do Brasil. O perfil geral da comunidade GDG BH é de pessoas que estão interessadas em desenvolvimento mas também tem uma veia empreendedora. Os participantes tem uma preocupação em melhorar sua carreira através de habilidades solicitadas pelo mercado (como criatividade, inglês, opensource).

Também temos interesse em big data, mobile, artes, música e aventura. Isso nos ajuda a tomar decisões sobre quais tipos de eventos realizar e quais temas não relacionados a vida profissional podem ser motivadoras para a entrada em novos projetos.

Mas nós sabemos que sempre existem subgrupos dentro de grandes grupos. Ou seja, pessoas com perfis diferentes. Daí partimos para a nossa próxima (e última) pergunta:  qual o perfil dos participantes da comunidade?

Utilizando o LDA (Latent Dirichlet allocation), uma técnica para descobrir temas em documentos, nós consideramos o grupo de tópicos de cada usuário um documento para descobrir quais os perfis (temas) dentro da comunidade. Cada perfil tem um nome e os tópicos que tem uma probabilidade maior de representá-lo.

Encontramos os seguintes perfis:

  • Cloud: desenvolvimento, empreendedorismo, cloud, carreira, engenharia
  • Artes e Criatividade: artes, cultura, empreendedorismo, carreira, criatividade
  • Web: desenvolvimento, javascript, html, opensource, empreendedorismo
  • Cultura Nerd: desenvolvimento, empreendedorismo, inovação, jogos, nerds
  • Carreira: desenvolvimento, empreendedorismo, carreira, inovação, inglês

Estes foram os 5 perfis mais representativos dentro da comunidade. Sabendo disso, podemos direcionar as nossas ações (palestras, codelabs, etc) baseando-se nos públicos.

Fizemos uma análise superficial e muitas outras coisas podem ser criadas ainda, como:

  • Mais métricas de desempenho (no-show, pagamentos, presença feminina)
  • Processamento de linguagem natural
  • Análise de Sentimentos
  • Predição? Por que não?! :)

Mas nós queremos ir além dos scripts simples criados para analisar a nossa comunidade. Queremos desenvolver uma ferramenta para que todos os organizadores de qualquer grupo do Meetup.com possa visualizar informações sobre a sua comunidade. Caso você queira contribuir, fale com a gente.

Para dúvidas, críticas, contribuições e sugestões, manda um email pra gente: gdgbhz@gmail.com. Queremos ouvir você! :)