BigData Magazine Nº5 (Diciembre 2021)

Page 28

28 Snowflake

Seis consejos para mejorar la ciencia de datos en la nube La nube ha transformado las posibilidades de la ciencia de datos. Los equipos de datos tienen ahora acceso a un vasto conjunto de potencia informática elástica, numerosas fuentes de datos internas y externas, y servicios gestionados en la nube que reducen la complejidad de la creación, la formación y la implementación de modelos de aprendizaje automático y aprendizaje profundo a escala.

L

Firma: José

María Alonso

a nube ha transformado las posibilidades de la ciencia de datos. Los equipos de datos tienen ahora acceso a un vasto conjunto de potencia informática elástica, numerosas fuentes de datos internas y externas, y servicios gestionados en la nube que reducen la complejidad de la creación, la formación y la implementación de modelos de aprendizaje automático y aprendizaje profundo a escala. Pero eso no significa que no haya desafíos cuando los equipos se adaptan de una infraestructura local a un modelo basado en la nube. Los científicos de datos, los ingenieros de datos y los desarrolladores tienen que aprender y adaptarse a un nuevo entorno, y hay un ecosistema de herramientas y marcos en constante expansión y rápida evolución entre los que elegir. Muchos están BigDatamagazine | Diciembre 2021

aprendiendo sobre la marcha, averiguándolo sobre la marcha. Las mismas capacidades que hacen que la nube sea tan emocionante también crean posibles escollos con los que hay que tener cuidado. La facilidad con la que se copian los datos en diversos sistemas puede crear problemas de gobernanza si no se maneja adecuadamente. La velocidad del cambio significa que los equipos de datos pueden apostar por la herramienta o el marco de trabajo equivocados y quedarse varados en ellos. Los hábitos y prejuicios del mundo de la infraestructura local pueden limitar la comprensión de lo que es posible en la nube. Después de crear tecnología de gestión de datos durante muchos años, y de hablar con frecuencia con organizaciones de todos los tamaños y de todos los sectores, he visto algunas trampas y malentendidos comunes que pueden impedir que los equipos de datos

hagan un gran trabajo. La nube abre una frontera apasionante para entender mejor a los clientes, monetizar los datos de nuevas maneras y hacer predicciones sobre el futuro. Así que espero que los siguientes consejos permitan a los equipos de datos aprovechar esas ventajas, al tiempo que trabajan de forma segura, eficiente y eficaz. Hacer de la gobernanza la principal prioridad

Es fundamental permitir la iteración y la investigación sin comprometer la gobernanza y la seguridad. Por ejemplo, muchos científicos de datos quieren intuitivamente copiar un conjunto de datos antes de empezar a trabajar en él. Pero es demasiado fácil hacer copias, seguir adelante y olvidarse de que existen, creando una pesadilla en términos de cumplimiento, seguridad y privacidad. Una plataforma de datos moderna debería permitirle trabajar con instantáneas, o


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.