Descripción del puesto
Profesional especializado en el análisis avanzado de datos mediante modelos estadísticos.
El científico de datos es responsable de explorar y analizar los datos de forma escalable, así como de definir e implementar modelos estadísticos para cumplir los objetivos empresariales.
Se encargan de implementar los algoritmos necesarios, de formular las preguntas adecuadas para encontrar las mejores respuestas, de entender cómo integrar múltiples fuentes de datos de diferentes formatos e incluso datos incompletos.
Tienen la capacidad de procesar estos datos para que puedan ser utilizados de forma confiable.
Responsabilidades
Análisis exploratorio de datos: modelado de los datos en el nivel de descubrimiento del conocimiento para identificar la falta de datos o información, su distribución y las posibles correlaciones para así iniciar las actividades de análisis estadístico.
Machine Learning: Transformar teoremas matemáticos en algoritmos computacionales, lo que permite que un ordenador tenga la capacidad de aprender diferentes estrategias de agrupación y clasificación a partir de un entrenamiento proporcionado. Conocimientos avanzados en algoritmos no supervisados, semisupervisados y supervisados con fines de análisis predictivo;
Análisis estadístico y predictivo: a partir del conocimiento de los datos se realiza un estudio para determinar cuál es el modelo matemático que mejor se aplica para construir un algoritmo de recomendación o predicción o agrupamiento (clustering), entre otros, o incluso una combinación de diferentes algoritmos. En esta fase también se realizan pruebas de hipótesis para validar los experimentos y determinar si el modelo en cuestión es el que mejor se adapta al escenario requerido;
Interacción: Capacidad de realizar presentaciones para explorar y exponer los resultados obtenidos de forma simplificada obteniendo la opinión de las partes interesadas y recopilando más información para potenciar los algoritmos.
Mentoring hacia los negocios: Capacidad para compartir conocimientos, colaborar con colegas y exponer sus teorías y conclusiones.
Conocimientos sólidos en
Python y/o R
Preparación de datos: Pandas, Numpy, Dplyr
Modelado: regresión, clasificación, agrupación
Métricas de validación del modelo
Power BI y/o Tableau y/o Qlik y/o Data Studio
Excel
Buenas prácticas en ingeniería de software
Conocimientos deseables
Control de Versiones: Git / Github
Base de Datos: SQL
ETL: Alteryx y/o Knime y/o Pentaho
Ingenieria de Datos: deploy, webapp, api, containers, cloud (de preferencia Azure)
Gestión de Proyectos Agile
Experiencia
Experiencia de 2 años mínimo en implementación de proyectos de ciencia de datos.
Experiencia en empresas Manufactura es un plus.
Idiomas
Ingles Intermedio - Avanzado (B2+)
Carreras
Ingenierías
Matemático
Estadista
Carreras afines
Ubicación: CIUDAD DE MEXICO (CDMX)