A plataforma utilizou modelos de aprendizagem automática (Machine Learning) para remover registos de veículos, e-bikes mal categorizadas e erros de usuários, resultando na devolução de milhares de atletas ao “trono” dos rankings mundiais.
O Strava decidiu declarar guerra às atividades suspeitas que poluem os seus quadros de líderes (leaderboards). Numa operação de escala massiva, a empresa eliminou milhões de registos de atividades que estavam incorretamente categorizados ou que continham dados fraudulentos, sejam eles intencionais ou por mero erro do usuário.
O fim do “flagging” manual?
Até agora, a integridade das classificações de segmentos dependia em grande parte da comunidade, que denunciava manualmente atividades suspeitas. No entanto, o Strava treinou três modelos avançados de Machine Learning para automatizar este processo. A inteligência artificial da plataforma foi programada para detectar especificamente três tipos de infrações:
- Deteção de veículos: Atividades onde o utilizador se esqueceu de parar a gravação e conduziu até casa.
- E-bikes em voltas convencionais: Cerca de 2,3 milhões de atividades foram eliminadas por estarem classificadas como bicicletas normais quando, na verdade, eram elétricas.
- Troca de modalidades: Casos em que, por exemplo, um usuário usa um dispositivo de ciclismo para registar uma corrida a pé (ou vice-versa) sem corrigir o perfil da atividade.
Impacto nos Leaderboards
A limpeza não foi apenas superficial. O Strava analisou as 100 melhores marcas de cada segmento de ciclismo a nível global. De acordo com um comunicado da empresa no Reddit, 293.000 atletas recuperaram o seu lugar de direito no “Top 10” de vários segmentos, após a remoção de registros inválidos que ocupavam o topo das tabelas.
No total, além das e-bikes, mais de 1,6 milhões de atividades que incluíam trajetos feitos de automóvel foram removidas permanentemente.