3 alternativas de Kaggle para la ciencia de datos colaborativa

¿Cuál es la mejor manera de obtener una buena respuesta a una pregunta difícil? Pregúntele a un grupo de personas y conviértalo en una competencia. Ese ha sido durante mucho tiempo el enfoque de Kaggle hacia la ciencia de datos: convertir misiones difíciles, como hacer que la detección del cáncer de pulmón sea más precisa, en competiciones de pago de recompensas, donde los mejores equipos y los mejores algoritmos ganan.

Ahora Kaggle se está incorporando a Google, y aunque todas las señales apuntan a que se mantendrá como está por ahora, habrá inquietudes sobre las perspectivas a largo plazo de un sitio con una comunidad tan dedicada y un enfoque idiosincrásico.

Aquí hay otros tres sitios que comparten una misión similar, si no se siguen explícitamente los pasos de Kaggle. (Tenga en cuenta que algunos sitios, como CrowdAnalytix, pueden considerar las soluciones aceptadas en concursos como obras de alquiler y, por lo tanto, su propiedad).

CrowdAI

Un producto de la École Polytechnique Fédérale de Lausanne en Suiza, CrowdAI es una plataforma de código abierto para albergar desafíos de datos abiertos y obtener información sobre cómo se resolvieron los problemas en cuestión. La plataforma es bastante nueva, con solo seis desafíos ofrecidos hasta ahora, pero los tutoriales derivados de esos desafíos son detallados y valiosos, proporcionando metodologías paso a paso para reproducir ese trabajo o crear algo similar. Los ejercicios existentes cubren marcos comunes como Torch o TensorFlow, por lo que es un buen lugar para adquirir detalles prácticos para usarlos.

DrivenData

DrivenData, creado por una consultora que se ocupa de problemas de datos profesionales, alberga desafíos en línea que duran unos meses. Cada uno se centra específicamente en problemas urgentes que enfrenta el mundo en general, como predecir la propagación de enfermedades o extraer datos de Yelp para mejorar los procesos de inspección de restaurantes. Al igual que Kaggle, DrivenData también tiene un tablero de listas de trabajos de ciencia de datos, una característica que a la gente le preocupa que pueda perderse en Kaggle después de la adquisición.

CrowdAnalytix

Con el respaldo de inversionistas de Accel Partners y SAIF Partners, CrowdAnalytix se enfoca en albergar concursos de resolución de problemas basados ​​en datos, en lugar de compartir información que resulta de ellos. Se ofrecen concursos para encontrar soluciones a problemas en categorías como modelado, visualización e investigación, y cada uno tiene recompensas de miles de dólares. Algunos desafíos anteriores incluyen predecir los costos reales de las reclamaciones de compensación para trabajadores o los retrasos de las aerolíneas. Sin embargo, otros concursos no se organizan por dinero, sino por brindar una opción competitiva para aprender una disciplina relacionada, como el lenguaje R.