Proyecto Final Procesador de Texto María Paula Gonzalez Rojas María Elieth Castro Castro.

Page 5

18-8-2022 Gestión en Big Data 18 de agosto de 2022 1 Gestión en BiG Data Por: María Paula González Rojas y María Elieth Castro Castro.

Gestión en Big Data 18 de agosto de 2022 Tabla de Contenidos Contenido Tabla de Contenidos...........................................................................................................................2 Articulo 1 3 ReferenciasArtículoVentajasFasesUtilidad...............................................................................................................................................45.............................................................................................................................................72............................................................................................................................................814 2

Articulo 1 B ig Data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos.Apesar de que el término Big Data se asocia principalmente con cantidades de datos exorbitantes, se debe dejar de lado esta percepción, pues Big Data no va dirigido solo a gran tamaño, sino que abarca tanto volumen como variedad de datos y velocidad de acceso y procesamiento. En la actualidad se ha pasado de la transacción a la interacción, con el propósito de obtener el mejor provecho de la información que se genera minuto a minuto ¨El crecimiento en el volumen de datos generados por diferentes sistemas y actividades cotidianas en la sociedad ha forjado la necesidad de modificar, optimizar y generar métodos y modelos de almacenamiento y tratamiento de datos que suplan las falencias que presentan las bases de datos y los sistemas de gestión de datos tradicionales¨. Hernández Leal (2017).Big Data. 3

Gestión en Big Data 18 de agosto de 2022 Por: María Paula González R.

Gestión en Big Data Por: María Paula González R. 18 de agosto de 2022 Utilidad Lo que hace que Big Data sea tan útil para muchas empresas es el hecho de que proporciona respuestas a muchas preguntas que las empresas ni siquiera sabían que tenían. En otras palabras, proporciona un punto de referencia. Con una cantidad tan grande de información, los datos pueden ser moldeados o probados de cualquier manera que la empresa considere adecuada. Al hacerlo, las organizaciones son capaces de identificar los problemas de una forma más comprensible. 4

Gestión en Big Data Por: María Paula González R. 18 de agosto de 2022 Fases Se pueden encontrar cuatro fases donde se agrupan o clasifican las diferentes tecnologías de soporte, estas son: 5 Almacenamie-Generación nto Adquisición AnálisisDatosde

6

 Atiende la necesidad de extraer rápidamente información desde los datos masivos para poder generar valor en las organizaciones y facilitar procesos de toma de decisiones, se requiere de tecnologías que faciliten incluso el análisis en tiempo real.

GeneraciónAdquisición Fase almacenamientode Fase Análisisde

 Se genera una cantidad inmensa de datos, que, según su naturaleza, puede estar almacenada y estructurada o puede corresponder a datos sin ninguna estructura, pero con características de gran valor.

 Es la colección de todo dato generado en la vida diaria, la trasmisión de los mismos es de gran importancia, ya que muchos conjuntos de datos presentan redundancia o datos inútiles y si no se tratan pueden incrementar el espacio de almacenamiento innecesario y afectar los resultados de una fase de análisis.

 Ha provocado la necesidad de generar estudios y propuestas de nuevas estrategias que permitan afrontar los tipos de datos que no se pueden gestionar con un sistema de bases de datos relacionales.

Gestión en Big Data Por: María Paula González R. 18 de agosto de 2022

Gestión en Big Data Por: María Paula González R. 18 de agosto de 2022 Ventajas 7 Variedad Big Data Veracidad "Los proyectos de 'big data' han cambiado radicalmente y ahora mezclan información de todo tipo" Juanjo García - 'ACCOUNT MANAGER MEDIA INDUSTRY' DE GOOGLE CLOUD

Gestión en Big Data 18 de agosto de 2022 Por: María Elieth Castro C.. Artículo 2

• El Big Data y la gestión documental, el futuro es aquí y ahora Los documentos son ya parte importante de las estrategias de Big Data. Es innegable que se han convertido en el patrimonio con más valor que tienen hoy las organizaciones, atesorando mucha información relevante para las mismas y, por tanto, extraer de ellos conocimiento supone un paso certero hacia la una mejor comprensión de lo que sucede y, sobre todo, la vía para tomar mejores decisiones en el futuro. “Sin embargo, la mayoría de ellos entran a formar parte de la clase de datos que no tienen campos fijos definidos, los llamados datos no estructurados, y que constituyen cerca del 80 por ciento de la información que reside en las organizaciones. Son en realidad uno de los cinco tipos de fuentes de Big Data: el generado por humanos.” (2019) Es gracias a la gestión documental inteligente cuando el análisis de este tipo de datos es cada vez más fácil por medio de la digitalización de documentos que está facilitando el orden, la identificación e indexación de estos, elevando las cotas de productividad y eficiencia en las organizaciones.

Precisamente uno de los mayores problemas a los que se enfrentan las organizaciones es la búsqueda de información, máxime cuando ésta aún se encuentra en distintos soportes y ¿Cuálformatos.esla importancia de los metadatos en la gestión documental inteligente?

Encontrar información adecuada en el momento preciso tanto en los expedientes, facturas, documentos, albaranes, hoy es mucho más sencillo gracias a 8

Gestión en Big Data Por: María Elieth Castro C. 18 de agosto de 2022 la indexación, siendo clave ya en cualquier proceso de digitalización, al identificar la información precisa de cada documento para su clasificación y localización futura, gracias a un término: metadato.

Se trata de aquel dato que describe a otro dato y la vía que permite encontrar, controlar, gestionar y preservar la información a lo largo del tiempo gracias a un etiquetado correcto, siendo puerta de entrada para que la analítica de datos sea más precisa en las compañías y las estrategias de Big Data sean más exitosas.

De hecho, el futuro de la gestión documental pasa por que estas herramientas mejoren sus funcionalidades para lograr extraer mejor el conocimiento a través de una indexación más certera que permita clasificar más adecuadamente la información de manera rápida, precisa y sencilla, facilitando con ello la compresión de esta.

Su misión es organizar los contenidos, siendo normalmente posible gracias a herramientas de OCR (Reconocimiento Óptico de Caracteres) que ayudan a extractar aquella información relevante, estructurándola y haciéndola accesible a todos.

Así, los llamados ECM, herramientas de Gestión de Contenido Empresarial, y dentro de estos las herramientas de gestión documental, están viviendo una mejora continua de sus funcionalidades para adaptarse a los requerimientos de análisis que buscan hacer más fácil y sencilla tanto la comprensión como el acceso de la información que manejamos.

Como aseguran ya muchos expertos, el futuro de la gestión documental pasa por incorporar soluciones que conviertan el dato en información relevante para tomar mejores decisiones usando incluso herramientas de Inteligencia Artificial para conseguirlo También los conocidos BPM (Business Process Management) consiguen un incremento mayor de la capacidad de análisis en las organizaciones, eliminando errores, siendo una herramienta también importante para introducir mejoras en las compañías.

9

Por ejemplo, las organizaciones se están volcando al análisis predictivo porque las ayuda a profundizar su interacción con los clientes, a optimizar los procesos, y a reducir los costos operativos. La combinación de flujos de datos en tiempo real y el análisis predictivo al que suele denominarse procesamiento sin fin- tiene el potencial de ofrecer una ventaja 10

Big Data deriva la mayoría de su valor de la información que produce cuando se lo analiza; lo que ayuda a las organizaciones a descubrir patrones, encontrar significados, tomar decisiones, y responder en última instancia al mundo con inteligencia. A medida que madure la tecnología y la conversación continúe evolucionando, las organizaciones desarrollarán nuevas formas de obtener información adoptando nuevos enfoques respecto de Big Data que solían estar fuera del alcance de la empresa tradicional.

Gestión en Big Data Por: María Elieth Castro C. 18 de agosto de 2022

El reto de los datos generados por humanos está, por tanto, en aplicar técnicas para su extracción automática y conseguir una óptima gestión de los documentos que los contienen, de tal manera que faciliten aún más el análisis de esos datos no estructurados para ayudar en la mejora de la productividad y eficiencia a las compañías, misión última de la analítica de datos.

Gestión en Big Data Por: María Elieth Castro C. 18 de agosto de 2022 competitiva significativa a la empresa. Para una descripción del análisis predictivo, incluyendo por qué es importante y cómo las empresas pueden ponerlo en funcionamiento. Comprender las tecnologías de Big Data y Las herramientas e infraestructura tradicionales no son eficientes funcionando con conjuntos de datos más grandes, variados y que se generan con rapidez. Para que las organizaciones puedan realizar el potencial completo de Big Data, deben encontrar un nuevo enfoque para capturar, almacenar, y analizar datos.

Las tecnologías de Big Data usan la potencia de la red distribuida de los recursos de computación y “arquitectura que no comparte nada”, marcos de procesamiento distribuido, y bases de datos no relacionales para redefinir la forma en que los datos se administran y analizan. Las innovaciones en los servidores y las soluciones de análisis en memoria escalables facilitan la optimización de la potencia de computación, escalabilidad, confiabilidad, y costo total de propiedad para las cargas de trabajo de análisis más exigentes. Dependiendo del caso de uso, su grupo de soluciones de Big Data incluye una infraestructura de alto desempeño que da vida a alguna combinación de marcos de procesamiento distribuido como el software Apache Hadoop, de datos de análisis relacionales y no relacionales, y aplicaciones analíticas. Software Apache Hadoop es un marco completo de código abierto para Big Data y ha surgido como uno de los mejores enfoques para procesar conjuntos de datos grandes y variados. El marco Hadoop proporciona un modelo de programación simple para el procesamiento distribuido de grandes conjuntos de datos. Desde un punto de vista funcional, estas tecnologías se complementan y trabajan juntas como una plataforma flexible de Big Data que también puede aprovechar la arquitectura existente de administración de datos. 11

1- Volumen: Nos referimos al tamaño de paquetes de datos e información que se generan y extraen, ya que, es inmenso y requiere de tecnología especifica y personalizada para poder tratarlos adecuadamente y que sean útiles para las organizaciones.

Gestión en Big Data Por: María Elieth Castro C. 18 de agosto de 2022 “El análisis histórico de Hadoop puede trasportarse a bases de datos analíticas, integrarse con datos estructurados en los almacenes de datos empresariales tradicionales EDW para mayor análisis” (2021).

2- Velocidad: En un mundo cada vez más interconectado la velocidad es el procesamiento del Big Data es cada ves más alto; porque se necesitan los datos procesados y analizados a tiempo real especialmente en determinados tipos de procesos.

3- Variedad: Se refiere a la tipología de datos dependiendo de su fuente y su formato. Según IBM, existen varios tipos según su fuente de recogida: los que se crean por interacción a través del diseño web y redes sociales, los datos de grandes transacciones, los biométricos, los generados por los seres humanos y los generados por máquinas.

12

¿Qué caracteriza las V’s del Big Data?

Gestión en Big Data Por: María Elieth Castro C. 18 de agosto de 2022 13

14

Referencias Hernández-Leal, E. J. (2017). Big Data: una exploración de investigaciones, tecnologías y casos de aplicación. Big Data. https://www.redalyc.org/journal/3442/344251476001/html/

Gestión en Big Data Por: María Elieth Castro C. 18 de agosto de 2022

Big Data: ¿En qué consiste? Su importancia, desafíos y gobernabilidad

. (2021). Big Data.

https://www.powerdata.es/big-data Center, I. I. (junio de 2014). Intel IT Center Obtenido de Comenzando con Big Data: Comenzando con Big Data (intel.la) Prometeus. (22 de febrero de 2019). Prometeus. Obtenido de La gestión de documentos y el Big Data, el futuro es aquí y ahora: La gestión documental y el Big Data, el futuro es aquí y ahora (prometeusgs.com) Robotics, E. (22 de febrero de 2021). EDS Robotics. Obtenido de ¿Qué es el Big Data? Ventajas y Desventajas: ¿Qué es el Big Data? Ventajas y desventajas | EDS Robotics

Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.