Todo lo que hay que hacer con los datos es ciencia de datos

La parte más importante es la aplicación Data Science, todo tipo de aplicaciones. Sí, lo has leído bien, todo tipo de aplicaciones, por ejemplo, aprendizaje automático.

La revolución de los datos

Alrededor del año 2010, con una gran cantidad de datos, hizo posible entrenar máquinas con un enfoque basado en datos en lugar de un enfoque basado en el conocimiento. Todos los artículos teóricos sobre la grabación de redes neuronales que soportan máquinas de vectores se hicieron factibles. Algo que puede cambiar la forma en que vivimos, cómo experimentamos las cosas en el mundo. El aprendizaje profundo ya no es un concepto académico que se encuentra en un trabajo de tesis. Se convirtió en una clase de aprendizaje tangible y útil que afectaría nuestra vida cotidiana. Por lo tanto, Machine Learning y AI dominaron los medios que eclipsaban todos los demás aspectos de la ciencia de datos, como el análisis exploratorio, métricas, análisis, ETL, experimentación, pruebas A / B y lo que tradicionalmente se llamaba inteligencia empresarial.

Ciencia de datos – la percepción general

Así que ahora, el público en general piensa en la ciencia de datos como investigadores centrados en el aprendizaje automático y la inteligencia artificial. Pero la industria está contratando científicos de datos como analistas. Por lo tanto, hay una desalineación allí. La razón de la desalineación es que sí, la mayoría de estos científicos probablemente pueden trabajar en problemas más técnicos, pero las grandes empresas como Google, Facebook y Netflix tienen tantas frutas para mejorar sus productos que no necesitan adquirir más aprendizaje automático. o conocimiento estadístico para encontrar estos impactos en su análisis.

Un buen científico de datos no se trata solo de modelos complejos.

Ser un buen científico de datos no se trata de qué tan avanzados son sus modelos. Se trata de cuánto impacto puede tener en su trabajo. No eres un cruncher de datos, eres un solucionador de problemas. Eres un estratega. Las compañías le darán los problemas más ambiguos y difíciles y esperan que usted guíe a la compañía en la dirección correcta.

El trabajo de un científico de datos comienza con la recopilación de datos. Esto incluye contenido generado por el usuario, instrumentación, sensores, datos externos y registro.

El siguiente aspecto del rol de un científico de datos es mover o almacenar estos datos. Esto implica el almacenamiento de datos no estructurados, el flujo de datos confiables, la infraestructura, ETL, las tuberías y el almacenamiento de datos estructurados.

A medida que avanza en el trabajo requerido para un Data Scientist, el siguiente es transformar o explorar. Este conjunto particular de trabajo abarca la preparación, detección de anomalías y limpieza.

Lo siguiente en la jerarquía de trabajo para un científico de datos es la agregación y el etiquetado de datos. Este trabajo involucra Metris, análisis, agregados, segmentos, datos de entrenamiento y características.

Aprender y optimizar forma el siguiente conjunto de trabajos para científicos de datos. Este conjunto de trabajo incluye algoritmos simples de aprendizaje automático, pruebas A / B y experimentación.

En la parte superior del conjunto se encuentra el trabajo más complejo de los científicos de datos. Consta de Inteligencia Artificial y Aprendizaje Profundo,

Todo este esfuerzo de ingeniería de datos es muy importante y no se trata solo de crear modelos complejos, hay mucho más en el trabajo.

Dejar respuesta

Please enter your comment!
Please enter your name here