Los mejores cursos gratuitos de ciencia de datos durante el bloqueo

Si está bloqueado debido a la pandemia de COVID-19, es posible que tenga algo de tiempo adicional en sus manos. Binging Netflix está muy bien, pero quizás te estés cansando de eso y te gustaría aprender algo nuevo.

Uno de los campos más lucrativos que se han abierto en los últimos años es la ciencia de datos. Los recursos que enumero a continuación ayudarán a aquellos lo suficientemente técnicos como para comprender las matemáticas a nivel de estadística y cálculo diferencial para incorporar el aprendizaje automático en sus conjuntos de habilidades. Incluso podrían ayudarlo a comenzar una nueva carrera como científico de datos. 

Si ya puede programar en Python o R, esa habilidad le dará una ventaja en la ciencia de datos aplicada. Por otro lado, la programación no es la parte difícil para la mayoría de las personas, son los métodos numéricos.

Coursera ofrece muchos de los siguientes cursos. Puede auditarlos de forma gratuita, pero si desea obtener crédito, debe pagarlos.

Recomiendo comenzar con el libro Los elementos del aprendizaje estadístico para que pueda aprender las matemáticas y los conceptos antes de comenzar a escribir código.

También debo señalar que hay varios cursos buenos en Udemy, aunque no son gratuitos. Por lo general, cuestan alrededor de $ 200 cada uno para el acceso de por vida, pero he visto muchos de ellos con un descuento de menos de $ 20 en los últimos días.

Jeff Prosise de Wintellectnow me dice que está planeando hacer algunos de sus cursos más gratuitos, así que estad atentos.

Los elementos del aprendizaje estadístico, segunda edición

Por Trevor Hastie, Robert Tibshirani y Jerome Friedman, Springer

//web.stanford.edu/~hastie/Papers/ESLII.pdf

Este libro electrónico gratuito de 764 páginas es uno de los libros más recomendados para principiantes en ciencia de datos. Explica los fundamentos del aprendizaje automático y cómo funciona todo detrás de escena, pero no contiene código. Si prefiere una versión del libro con aplicaciones en R, puede comprarlo o alquilarlo a través de Amazon.

Ciencia de datos aplicada con especialización en Python

Por Christopher Brooks, Kevyn Collins-Thompson, VG Vinod Vydiswaran y Daniel Romero, Universidad de Michigan / Coursera

//www.coursera.org/specializations/data-science-python

Los cinco cursos (89 horas) de esta especialización de la Universidad de Michigan le presentan la ciencia de datos a través del lenguaje de programación Python. Esta especialización está dirigida a estudiantes que tienen una formación básica en Python o programación, y que desean aplicar técnicas estadísticas, aprendizaje automático, visualización de información, análisis de texto y análisis de redes sociales a través de kits de herramientas populares de Python como Pandas, Matplotlib, Scikit-learn, NLTK y NetworkX para obtener información sobre sus datos.

Ciencia de datos: fundamentos que utilizan la especialización R

Por Jeff Leek, Brian Caffo y Roger Peng, Johns Hopkins / Coursera

//www.coursera.org/specializations/data-science-foundations-r

Esta especialización de 68 horas (cinco cursos) cubre herramientas y técnicas fundamentales de ciencia de datos, incluida la obtención, limpieza y exploración de datos, programación en R y realización de investigación reproducible.

Aprendizaje profundo

Por Andrew Ng, Kian Katanforoosh y Younes Bensouda Mourri, Stanford / deeplearning.ai / Coursera

//www.coursera.org/specializations/deep-learning

En 77 horas (cinco cursos), esta serie enseña los fundamentos del aprendizaje profundo, cómo construir redes neuronales y cómo liderar proyectos exitosos de aprendizaje automático. Aprenderá sobre redes convolucionales (CNN), redes neuronales recurrentes (RNN), redes de memoria a largo plazo a corto plazo (LSTM), Adam, Dropout, BatchNorm, inicialización de Xavier / He y más. Trabajará en estudios de casos de atención médica, conducción autónoma, lectura de lenguaje de señas, generación de música y procesamiento del lenguaje natural. Además de la teoría, aprenderá cómo se aplica en la industria utilizando Python y TensorFlow, que también enseñan.

Fundamentos del aprendizaje automático

Por Jeff Prosise, Wintellectnow

//www.wintellectnow.com/Videos/Watch?videoId=fundamentals-of-machine-learning

En este curso de video introductorio gratuito de dos horas, Prosise lo lleva a través de regresión, clasificación, máquinas de vectores de soporte, análisis de componentes principales y más, utilizando Scikit-learn, la popular biblioteca de Python para el aprendizaje automático. 

Aprendizaje automático

Por Andrew Ng, Stanford / Coursera

//www.coursera.org/learn/machine-learning

Este curso en video de 56 horas brinda una amplia introducción al aprendizaje automático, la minería de datos y el reconocimiento de patrones estadísticos. Los temas incluyen aprendizaje supervisado (algoritmos paramétricos / no paramétricos, máquinas de vectores de soporte, kernels, redes neuronales), aprendizaje no supervisado (agrupamiento, reducción de dimensionalidad, sistemas de recomendación, aprendizaje profundo) y mejores prácticas en aprendizaje automático e inteligencia artificial (teoría de sesgos / varianzas). y proceso de innovación). También aprenderá a aplicar algoritmos de aprendizaje para construir robots inteligentes, búsqueda web, anti-spam, visión por computadora, informática médica, audio, minería de bases de datos y otras áreas.

Aprendizaje automático

Por Carlos Guestrin y Emily Fox, Universidad de Washington / Coursera

//www.coursera.org/specializations/machine-learning

Esta especialización de 143 horas (cuatro cursos) de los principales investigadores de la Universidad de Washington le presenta el apasionante campo de alta demanda del aprendizaje automático. A través de una serie de estudios de casos prácticos, obtendrá experiencia aplicada en las principales áreas del aprendizaje automático, incluidas la predicción, la clasificación, la agrupación en clústeres y la recuperación de información. Aprenderá a analizar conjuntos de datos grandes y complejos, a crear sistemas que se adapten y mejoren con el tiempo y a crear aplicaciones inteligentes que puedan hacer predicciones a partir de los datos.