deConceptualizaciónla analítica de datos y sus empresarialesvínculos

DATA SCIENCE


Matemáticas y algoritmos DatoscomputacionalesCiencias Ingeniería de datos Análisis de datos Software
Ciencia de los datos o Data Science

• Ciencia interdisciplinaria que relaciona métodos científicos para la extracción y procesamiento de datos con la finalidad de generar conocimiento • Insumo: Distintas formas de datos (estructurados y no estructurados) • Involucra: programación, estadística y negocios Lenguaje de programación de la ciencia de datos Phyton JuliaR Java C++Scala







¿Qué es la ciencia de datos?

Matemáticas: MatemáticasEstadísticadiscretasTeoríadedecisiónMachineLearning Sistemas información:de Ciencia DesarrolloIngenieríacomputacionaldesoftwaredesistemas Negocios: AdministraciónEconomíaFinanzas ActuarialesCientíficosEconometristasdeadministración Programadores estadísticos Visualizadores de datos Software Científicodedatos
Científico de datos o Data Scientist




Comunicación de resultados 1 32 4 65 DescubrimientoPreparación de datos Planificación del modelo a emplear Construcción del modelo Ejecución

Proceso para resolución de problemas a través de la ciencia de datos

1. Descubrimiento Insumo principal “DATOS”, provenientes de: § servidores web (webservers) § redes sociales (social media) § bases de datos públicas (censo) § fuentes online (data streamed) Adquisición de datos por medio de fuentes internas y externas para responder la pregunta enfocada en el negocio 2. Preparación de datos Verificación de inconsistencias como: § valores perdidos § valores en blanco § valores atípicos § valores incorrectos Limpieza de datos a través de la exploración, pre procesamiento y acondicionamiento previo al Identificaciónmodelamientode posibles relaciones entre las variables.

3. Planificación del modelo a emplear
Exploratory Data Analysis (EDA) utilizando distintas herramientas estadísticas y de visualización como histogramas, gráfico de líneas, box plots para identificar la distribución de los datos.
4. Planificación del modelo a emplear

Identificación de métodos y técnicas para el pre modelamiento de relaciones entre variables.
Exploratory Data Analysis (EDA) utilizando distintas herramientas estadísticas y de visualización como SQL, R, SAS.
Identificación de métodos y técnicas para el pre modelamiento de relaciones entre variables.
Analizar distintas herramientas de entrenamiento como por ejemplo clasificación, asociación, clustering. Herramientas para la construcción de modelos: SAS, R, Phyton, etc.
Creación de base de datos para entrenamiento y testeo.
Revisar las posibles restricciones no consideradas previamente.
5. Ejecución

4. Construcción del modelo
Generación de reporte técnico. Implementación de un plan piloto en un ambiente de producción real.
6. Comunicación de resultados

Determinar si los resultados del proyecto son satisfactorios o se deben realizar ajustes
Identificación de los hallazgos principales y comunicarlo internamente a los accionistas y mandos superiores.
Explicación técnica y funcional del modelo.
Volumen
Valor
Veracidad
Generación de datos a un ritmo alarmante
Incremento del tamaño de base de datos
Encontrar el significado correcto de los datos
Big Data
de datos
Diferentes tipos
Colección de distintas bases de datos grandes y complejas difíciles de procesar a través de métodos tradicionales
Variedad
Velocidad
Incertidumbre e inconsistencias en los
datos 1 1 2 2 3 3 4 4 5 5 6 6

Análisis de datos y desempeño empresarial


Acceso a datos abiertos (open data) se incrementa día a día, con lo que se reducen los costos operativos
1
Analítica de datos se transforma en valor para los accionistas y con ello, se obtiene mejorfinancierorendimiento
3
4
2
Capturar los datos todos los días en actividades y permitenestablecidoshorariosgenerar un modelo robusto
Modelos de negocio que análisisincorporandedatos,generanvaloragregado
Detección del fraude Optimizacióndereddeoficinas


Análisis productosde Gestión de rutas
Curvas planificadasprogresode vs. Actuales Índice rendimientode
Ejemplos de métricas que vinculan el análisis de datos y el desempeño empresarial
Interrupciones Tiempo esparcimientode

• Visión empresarial: industrialización de la analítica
• Capacidad sistemáticas, programas sostenibles, innovación.
• Transformación digital permite el desarrollo de la empresa en su potencial completo.
• Aprovechamiento de datos y analítica en gran escala.
Análisis de datos y competitividad
• Análisis de datos se traduce en ventaja competitiva a través de la identificación de preferencias de compra y comportamiento


• Análisis de datos: disciplina estratégica para las empresas
• Inversión en la industrialización de la analítica de datos, conocida como factorización analítica (generación de valor continuo y sistematizado)
Eficiencia y calidad de los modelos
• Área de analítica:inteligencia aporte de conocimiento para identificar respuestas a las planteadaspreguntaspor el negocio.
Industrialización de modelos (reducir tiempo y mejor servicio cubriendo más necesidades)
Incorporación de nuevas tecnologías como Big Data
ÁREAS INVOLUCRADAS:
• IT: gestiona y aprovisiona los datos, garante de la calidad de la información y asegura la sistemática.ejecución
Diagnóstico de actuales capacidades analíticas en función de necesidades y objetivos empresariales

Competitividad a través de la industrialización de la analítica de datos
• Negocio: identifica las necesidades de información.
4º
de socioeconómicasactividadesaInternet 2º

Analítica de datos e innovación empresarial y tecnológica
Migración
Identificación de patrones y tendencias, mitigar el riesgo, anticipación a necesidades, información personalizada, mejorar la experiencia del usuario
Beneficios en la calidad del producto, satisfacción del cliente, mejor rendimiento financiero, reducción impacto ambiental, y diversidad de mano de obra
de almacenamiento y distribución 3º
Disminución de costos
1º
Empresas impulsadas por los datos, pues los datos son un activo y permiten tomar decisiones Geolocalización,argumentadas redes sociales, e-commerce, IoT, inteligencia artificial se han convertido en herramientas aliadas a las empresas
Coherencia en la estructura organizacional

Analítica de datos e empresarialinnovación y tecnológica
Optimización del desarrollo de capacidades a través de alianzas tecnológicas que conlleven a innovación empresarial duradera y con proyección
Modelo centrado en el cliente
Liu, H., Huang, S., Wang, P., & Li, Z. (2021). A review of data mining Methods in financial markets. Data Science in Finance and Economics 1(4): 362392. Nadikattuhttp://www.aimspress.com/article/doi/10.3934/DSFE.2021020,R.(2020).Researchondatascience,dataanalyticsandbig data. International Journal of Engineering and Science 9(5), 99105. https://ssrn.com/abstract=3622844 y http://dx.doi.org/10.2139/ssrn.3622844 Terán, A., Dávila, G., & Castañon, R. (2019). Gestión de la tecnología e innovación: Un modelo de redes bayesianas. Economía: teoría y práctica 50, 63100. https://doi.org/10.24275/etypuam/ne/502019/teran
BIBLIOGRAFÍA


