Issuu on Google+

Nº 2

Año I

2014

¿Hasta dónde Big Data es capaz de transformar en valor los datos de tu negocio?

Até onde os dados são capazes de se transformar em valor para o seu negócio?

Big Data

Nº 2 • 2014

Alianza Latinoamericana de Medios TIC

1


EDITORIAL

Big Data, un futuro prometedor en Latinoamérica

L

a expansión del Big Data y Analytics en la región alcanzará 657% en menos de cinco años. Lo avala un estudio de IDC que pronostica US$12.6 mil millones de dólares de ingresos al finalizar 2014, producto de la adopción de tecnologías y arquitecturas diseñadas para extraer, analizar y generar valores de negocios. Mientras que para 2015, los especialistas anticipan que el desarrollo de Big Data alcanzará los US$1.4 mil millones. Y proyecciones más alejadas en el tiempo hablan que en el año 2018, el gasto por Big Data en la región será de US$6.590 mil millones.

Todo parece indicar que el futuro en Latinoamérica es más que prometedor, pero lo cierto es que queda mucho camino por recorrer para que Big Data y Analytics puedan convertirse en un verdadero acelerador de negocios. Los empresarios tienen por delante la difícil tarea de combinar los desarrollos con otras tres tendencias tecnológicas que también llegaron para quedarse: Movilidad, Nube y Social Business. Pero además, como si esto fuera poco, deberán considerar algunos factores claves a desarrollar: el grado de formación de los profesionales en Analytics, el

Hora de aprender com os dados

N

uma época em que as pressões se sucedem, a área de Tecnologia da Informação vive sob mais uma. Estruturar aplicações até então inimagináveis desafia não apenas os gestores de TI, mas também quem define a estratégia do negócio. Lapidar o dado, agora, é uma obrigação. É fazer ou ficar fora do mercado. E como lidar com tantas novidades? O big data é isso. Cuidar dos dados não estruturados, estabelecer novos padrões de conduta. A informação vira bem essencial para o negócio. As orientações são as de sempre, mas bem-vindas: comece pequeno, mas não deixe de pensar grande. Os números ligados ao big data são impressionantes. Dados da Federação Brasileira de Bancos (Febraban) mostram que, em 2013, as instituições financeiras armazenaram 194

2

petabytes de dados, um incremento de 28% em relação a 2012, quando foram armazenados 151 petabytes. Em 2011, eram 117 petabytes. Para 2014, a previsão é que esse montante cresça ao menos na mesma proporção, o que implica estratégias para armazenamento e entendimento. Mais: o estudo Universo Digital, realizado pela IDC, destaca que em 2014 o big data representará 3% do total do volume de dados do mundo, com 212 exabytes. Até 2020, o volume de dados digitais gerados no Brasil chegará a 1.600 exabytes, respondendo por 4% dos 40 mil exabytes estimados mundialmente. Como estruturar todos esses dados? Essa missão é realidade em muitas empresas no Brasil. A Revista Alianza, que tem o big data como tema, mostra que já há quem tenha colocado a mão na

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


diseño de calidad en el sistema de TI, la prominencia en la gobernabilidad de datos, el sistema de seguridad en el manejo de la información, la mayor participación de gestión no ejecutiva, la desigualdad en la metodología de gestión de rendimiento, y la diferenciación y falta de integración de las tecnologías a nivel local y regional. En esta segunda edición de nuestra revista digital ALIANZA Latinoamericana de Medios TIC, buscamos acercarlos al mundo de la acumulación y análisis de la información y su real importancia para el futuro de los negocios, intentamos develar, a través de la visión de los especialistas ¿Hasta qué punto Big Data es capaz de transformar en valor agregado los datos del negocio?

massa para transformar cada byte em um item relevante para o negócio. É o caso, por exemplo, do Disque-Denúncia, que utiliza o big data e a inteligência associada à informação para combater o crime na cidade do Rio de Janeiro. As redes sociais ganham atenção, e uma das maiores distribuidoras de cosméticos do país, a Avon, também usa o big data para lidar com as reclamações e reverter situações de conflitos com seus consumidores. Tratar o dado, certamente, traz benefício para as corporações, mas há que se pensar em como adotar esse modelo. Especialistas advertem que o big data não é um projeto convencional para a TI. E, de fato, parece não ser. Tanto que as provas de conceitos se multiplicam. O big data está à mesa das áreas de negócio. Exatamente por isso, a revista Alianza desenha um cenário da adoção e implementação do big data na América Latina, ouvindo usuários e fornecedores. Boa leitura!

ANA PAULA LOBO

ORLANDO ROJAS

Diretora editorial

Director y Editor

MARÍA FARÍAS

Ángel Colángelo

Directora y Editora

Editor

Nº 2 • 2014

ALIANZA Latinoamericana de Medios TIC

3


ÍNDICE

COMITÉ EDITORIAL María Farías Ana Paula Lobo Luiz Queiroz Orlando Rojas

ESPECIAL

BIG DATA

6 14

EDITORES

Big Data, el camino hacia una mayor productividad

María Farías Maria.farias@inversorlatam.com @fariasmari

opiniÓn

Intel: “el fenómeno Big Data y su impacto en los negocios” gaBriela gallardo - Gerente de Marketing de Negocios de Intel para América Latina

16

entrevista

TOTVS: Big Data, el camino a seguir para las empresas de América Latina

Ana Paula Lobo analobo@convergenciadigital.com.br @ convergencia Orlando Rojas ojrojasp@evaluamos.com @ojrojas Luiz Queiroz queiroz@convergenciadigital.com.br @ convergencia

denis del BianCo - Director de TOTVS Consulting y Performance Empresarial

18 20 24 32

Grandes Datos La gente inteligente que logre aprovechar sus Grandes Datos será más inteligente aún. entrevista

El almacenamiento de archivos crece en forma exponencial

Ángel Colángelo Angel.colangelo@inversorlatam.com @angelcolangelo Bia Alvim bia.alvim@pebcomunicacao.com Luís Osvaldo Grossmann ruivo@convergenciadigital.com.br

Brian BlaCK - Vicepresidente de EMC para América Latina del Norte

Roberta Prescott prescottroberta@gmail.com

Mão na massa Lapidar o dado, agora, é obrigação. É fazer ou morrer.

Diseño Pedro Costa pedro@convergenciadigital.com.br

entrevista

En el año 2020, el 90% de todos los datos serán no estructurados manoJ sUvarna - Vicepresidente de Sistemas Convergentes HP Big Data

36 38 4

El cliente no requiere una infraestructura costosa

http://www.convergenciadigital.com.br

http://www.inversorlatam.com

artÍCUlo

Big data para ‘small users’ Jaime ernesto dUeÑas montaÑo

ALIANZA Latinoamericana de Medios TIC

http://www.evaluamos.com

Nº 2 • 2014


Nยบ 2 โ€ข 2014

Alianza Latinoamericana de Medios TIC

5


BIG DATA

6

ALIANZA Latinoamericana de Medios TIC

Nยบ 1 2 โ€ข 2014


Mucho más que una base de datos

Big Data, eL cAmino HAciA unA mAYor proDuctiViDAD Ya no es una promesa ni una tendencia, Big Data es una realidad. Provocó cambios en todas las industrias, y en el ritmo y la dirección de la economía a nivel global, regional y local. ¿Hasta dónde Big Data es capaz de transformar en valor los datos de tu negocio? Ángel Colángelo

Nº 1 2 • 2014

D

ebido al gran avance registrado en las tecnologías de la información, las organizaciones se han tenido que enfrentar a nuevos desafíos que les permitan analizar, descubrir y entender más allá de lo que sus herramientas tradicionales reportan sobre la información y datos que poseen. A esto se sumó que en los últimos años, se ha producido un importante crecimiento de las aplicaciones disponibles en la Internet, junto a la proliferación de las redes sociales, ya no sólo como mero entretenimiento, sino también como parte de la planificación estratégica de las empresas, provocando significativos cambios en la toma de decisiones de

ALIANZA Latinoamericana de Medios TIC

7


BIG DATA

Los sistemas de RFID (identificación por radiofrecuencia) generan hasta 1.000 veCes mÁs datos que los sistemas convencionales de códigos de barras. Más de 5.000 millones de personas telefonean, mandan mensajes de texto, tuitean y navegan por internet con teléfonos móviles. Facebook tiene más de 901 millones de usuarios activos generando datos de interacción social. Cada día se envían 340 millones de tuits. Son unos 4.000 por segundo. Al día se generan 2,5 trillones de bytes de datos que hay hoy en día en el mundo se han creado tan sólo en los dos últimos años. Walmart gestiona más de 1 millÓn de transacciones con clientes por hora. En el mundo se registran cada segundo 10.000 transacciones de pagos con tarjetas.

8

los encargados de pensar el negocio. Pero ¿Qué es Big data? y ¿por qué se ha convertido en algo tan importante para las organizaciones? Big data es el término que se emplea para describir el conjunto de procesos, tecnologías y modelos de negocio que están basados en datos y en capturar el valor que los propios datos encierran. En términos generales se podría decir que es la tendencia en el avance de la tecnología que abrió las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes cantidades de datos (estructurados, no estructurados y semi estructurados) que tomaría demasiado tiempo y sería muy costoso cargarlos a un base de datos relacional para su análisis. Hay cierto consenso entre los especialistas en determinar tres principales características atribuidas a Big Data, llamadas comúnmente como “las 3 V”: volumen: las proyecciones a futuro que realizan entidades de investigación como la International Data Corporation –IDC–, advierten que para 2020 se habrá multiplicado por 44 la cantidad de datos que existen en la actualidad, residiendo la mitad de ellos en servidores remotos alojados en la nube. En el informe que aborda el “Universo Digital de Datos”, si bien se observa que cada vez se procesan más datos, paradójicamente también se registra que porcentualmente se analizan menos. De ahí que Jeremy Burton, vicepresidente ejecutivo, marketing y operaciones de productos de EMC Corporation, destaca “la gran oportunidad que existe para las empresas que no solo deben identificar los beneficios potenciales del Universo Digital, sino que también reconocer la importancia de explorar ese universo para lograr el equilibrio correcto entre tecnología, prácticas de seguridad y capacidades de TI”. velocidAd del movimiento, proceso y captura de datos dentro y fuera de la empresa ha aumentado significativamente. En este mundo tan vertiginoso tomar decisiones en tiempo real es casi un imperativo. A veces 5 minutos pueden ser un mundo si hay que escoger la mejor opción en una situación de negocio. El procesamiento de datos en tiempo real permite tomar medidas

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


de inmediato mediante una lógica de ubicación. Enviar alertas por correo electrónico, generar informes y mucho más. vAriedAd en datos, cada vez más semiestructurados y no estructurados - datos en streaming, cotizaciones bursátiles, medios sociales, máquina a máquina, datos de sensores, entre otros-, que necesitan ser procesados y convertidos en información.

Big DAtA: unA tenDenciA Que AVAnZA en toDo eL munDo Esta tecnología aportará 206.000 millones de euros a la economía europea en 2020, así lo indica el estudio de Microsoft “Big & Open Data in Europe: A growth engine or a missed opportunity?”, que además explica que la inversión en Big Data supondrá nada menos que el 1,9% del PIB europeo en ese año, y que los sectores más beneficiados serán comercio, industria y administración públicas. Precisamente el crecimiento en el PIB que

en 2015

Costaria 5 aÑos ver todos los videos que se distribuirán en las redes IP cada segundo.

Hoy

El número de dispositivos en red equivale a la poBlaCiÓn mUndial

para 2015

El número de dispositivos en red equivaldrá a 2X la poBlaCiÓn mUndial

Nº 2 • 2014

se derivará de la adopción de tecnologías Big Data, se traducirá de la misma forma en una mayor demanda de expertos en esta área y un crecimiento sustancial del empleo. “Según Gartner, para 2015 se prevén 4,4 millones de puestos en Big Data, lo que se traduce en nuevos puestos de trabajo para profesionales especializados en el sector”, expresó Raúl Arrabales, responsable del Área de Ingeniería del Centro Universitario de Tecnología y Arte Digital U-tad, en En España, uno de los pocos centros de este país que ofrece un grado de especialización en Big Data. Latinoamérica no se queda atrás, un estudio sobre tendencias globales en Big Data, publicado por Tata Consultancy Services (TCS) en 2013, reveló que esta región es la segunda en el mundo con la mayor adopción de iniciativas de Big Data después de los Estados Unidos. Las empresas norteamericanas son las que tienen las mayores iniciativas en la industria con el 68%, seguidas por el 51% de las empresas que van desde México hacia el sur del Continente. Ankur Prakash, Vicepresidente Ejecutivo

Según Gartner, para 2015 se prevén 4,4 millones de puestos en Big Data, lo que se traduce en nuevos puestos de trabajo para profesionales especializados en el sector raúl Arrabales

Responsable del Área de Ingeniería del Centro Universitario de Tecnología y Arte Digital U-tad

ALIANZA Latinoamericana de Medios TIC

9


BIG DATA

para Latinoamérica de Tata Consultancy Services, explicó que “en Latinoamérica un 68% de empresas mexicanas reportan iniciativas de Big Data, seguidas por empresas de Brasil con 46%. El 64% de los negocios predicen un alto retorno de la inversión por iniciativas de Big Data, siendo la segunda región con la más alta expectativa de retorno de la inversión, después de Asia Pacifico”. Más allá de estos números alentadores, cabe aclarar que mientras América Latina implementa el Big Data en una etapa que se podría llamar exploratoria, en el mundo se espera su consolidación con el incremento de la oferta de las principales compañías tecnológicas. En Argentina, Telefónica ya implementó a fines de 2013 una plataforma IT de IBM incorporando datos de sus clientes. Se trata de descubrir patrones a partir de preguntas, con una velocidad de procesamiento de millones

de filas por segundo. “Incorporamos voice analytics para las llamadas de call center, para medir niveles de satisfacción o rechazo”, comenta María Inés López, Database Marketing manager de Telefónica Argentina.

Big DAtA: LA cLAVe en eL negocio DeL Futuro En la actualidad la recolección, procesamiento y análisis de datos se ha convertido en el área de negocio de mayor inversión de gigantes como IBM, compañía que planea invertir más de 100 millones de dólares en la expansión global de sus servicios de consultoría de diseño de la experiencia del consumidor, y como parte de esa inversión, abrirá ocho nuevos laboratorios IBM Interactive Experience por todo el mundo y planea contratar a 1.000 empleados con el objetivo de crear modelos

áreAs Que se BeneficiAn de Big dAtA

10

% respuestAs

Marketing personalizado utilizando tendencias sociales

61

Visión del negocio precisa

45

Segmentación de los clientes

41

Captura de oportunidades en ventas y marketing

38

Toma de decisiones en tiempo real

37

Detección de pérdida de clientes

35

Detección de fraude

33

Cuantificación del riesgo

30

Tendencias del sentimiento de mercado

30

Compresión de cambio del negocio

30

Planificación y predicción

29

Mejor análises de costes

29

Análisis del comportamiento de los clientes

27

Rendimiento de la produción

06

otros

04

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


personalizados para las empresas de relación con sus clientes a través de los datos y el diseño. Bridget van Kralingen, vicepresidenta de IBM Global Business Services, señaló: “A medida que nuestros clientes redefinen cómo se vinculan con sus consumidores o empleados, descubren que el modelo tradicional de agencia digital tiene sus limitaciones. Nosotros damos solución a esas lagunas con esta combinación de diseño excelente e investigación de IBM, que se suma a nuestra consultoría estratégica y nuestra fortaleza en Big Data, que es la clave del negocio del futuro”. Lo cierto es que no todos son IBM, y que hay mucho camino por recorrer en la concientización sobre el capital que tienen las empresas en sus datos y sobre la importancia de estos para el desarrollo estratégico de un negocio que presente ser exitoso. Las preguntas frecuentes son ¿para qué sirve Big Data?; ¿qué puedo hacer en mi negocio con Big Data?; o ¿cómo puedo desarrollar con Big Data nuevos modelos de negocio? Según The Boston Consulting Group, el Big Data tiene cinco aplicaciones principales: “generar ideas, mejorar los procesos, mejorar la toma de decisiones, modificar las cadenas de valor tradicionales y conducir nuevos negocios de datos”. Esta gestión del Big Data supone que las empresas organicen el creciente flujo de datos de sus clientes y accedan a él de manera recurrente. Las empresas se pueden beneficiar con Big Data en varias áreas, como el conocimiento del cliente, planes de marketing, diagramación de operaciones y gestión del riesgo: Análisis de los clientes • Marketing impulsado por los clientes: promociones y ofertas personalizadas basándose en las pautas de compras individuales. Prevención de la pérdida de clientes. • Recomendación de productos: filtros colaborativos, recomendaciones basadas en la actividad multicanal. Análisis de marketing • Modelos del marketing mix: optimización del marketing mix y de las promociones utilizando

Nº 2 • 2014

A medida que nuestros clientes redefinen cómo se vinculan con sus consumidores o empleados, descubren que el modelo tradicional de agencia digital tiene sus limitaciones. Bridget van Kralingen

Vicepresidenta de IBM Global Business Services

modelos econométricos para evaluar el aumento de ventas con diferentes herramientas de marketing e identificar el más efectivo. • Optimización de los precios: utilizar los datos para evaluar la sensibilidad de la demanda a los precios y para optimizarlos en diversos puntos del ciclo de vida del producto Análisis de internet/ móviles/redes sociales • Análisis de la actividad del cliente: almacenar las preferencias del cliente para personalizar lo que se muestra, monitorizar el uso para evaluar las métricas de la web. • Monitorizar los medios sociales: analizar los sentimientos del consumidor hacia la marca y sus productos en redes sociales. Efectividad operativa • Análisis de datos operativos aprovechando abundantes datos de producción para mejorar procesos y la calidad del producto. • Mejor planificación y predicción aprovechando la cantidad de datos de procesos históricos, recursos y productos. Análisis de fraude y riesgo • Análisis de datos sobre clientes, transacciones y

Alianza Latinoamericana de Medios TIC

11


BIG DATA

mercados para cuantificar el riesgo de clientes y productos. • Detección de fraude en tiempo real aprovechando datos de los puntos de venta y de los sistemas de transacciones y análisis. Ejecutivos y profesionales de tecnología, marketing y administración, tienen grandes expectativas con respecto a Big Data. La tendencia de las organizaciones es ir creando las estructuras y formas de aplicar este concepto innovador, con la convicción de que obtendrán un retorno significativo para su negocio. Es así que se pueden identifican ciertos modelos de negocios emergentes en Big Data que se basan en tres formas de planeamiento: Diferenciación basada en la Información, Intercambio basado en la Información y Redes de Distribución basadas en la Información. A partir de estas formas de recolección,

procesamiento, análisis y distribución de la información surgen nuevas ofertas de servicios, mejor satisfacción de las necesidades del cliente, mayor relevancia de lo contextual en los análisis, la venta de información en bruto (base de datos), la identificación de los puntos de referencias para los estudios, la suministración de nuevas perspectivas, el impulso hacia el intercambio de información y el desarrollo de nuevas estrategias en publicidad y promoción. El Internet de las Cosas o Internet of Things (IoT) es un claro ejemplo de como se abrió paso hacia una nueva era del análisis de datos al proporcionar a las empresas valiosas oportunidades, como lo es la posibilidad de cumplir con la entrega a tiempo de productos y servicios, adecuándose a las necesidades específicas de sus clientes. “Lo que la IoT revolucionará es la forma en que las empresas utilizan y se benefician

2017

gloBAl moBile dAtA Traffic growth & forecast (terabytes per month)

2012 11,115,532

2009

884,906 90,829

Asia Pacific Middle East & Africa Latin America Central & Eastern Europe Western Europe North America

12

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


de una amplia gama de datos y aplicaciones, incluyendo el análisis de Big Data”, explicó Dave Evans, Chief Futurist de Cisco, quien además agregó: “El Internet de las Cosas se trata de la primera evolución real de la Internet, es decir un salto que conducirá a aplicaciones revolucionarias con el potencial de mejorar drásticamente la manera en que las personas viven, aprenden, trabajan y se entretienen”.

Big Data: resta mucho camino por recorrer Si bien hoy en día -salvando la diferencia de infraestructura entre los diferentes países, regiones y sectores del mercado-, hay suficiente conocimiento tecnológico para desarrollar este concepto de forma exitosa en un gran porcentaje de las compañías, todavía resta un largo camino por recorrer: la necesidad de sortear ciertos obstáculos culturales, y principalmente saber cómo generar negocio con la gran cantidad de información disponible es el gran reto a mediano plazo. La promesa del Big Data ha sido recibida con advertencias sobre sus peligros. Los riesgos y desafíos más urgentes para la investigación y el debate son los derechos individuales, la privacidad, la identidad y la seguridad de los datos. “Las inversiones en Big Data aún están muy lejos de lo necesario, ya que en 2013 la cantidad promedio por empresa no pasó de los US$10 millones. Para los ejecutivos, el aspecto cultural es el punto principal con relación a la aplicación de Big Data, seguido por el aspecto tecnológico, y al final por la dificultad en la interpretación de los datos y la aplicación de los resultados en las decisiones de negocios”, señaló Ankur Prakash, Vicepresidente Ejecutivo para Latinoamérica de Tata Consultancy Services. Por su parte, Víctor Pichardo, vicepresidente para América Latina de Excelerate Systems, planteó: “Los factores que han contribuido en gran medida a que

Nº 2 • 2014

Big Data no haya prosperado de una manera importante dentro de Latinoamérica han sido la falta del nivel adecuado de madurez en la administración de la información en la mayoría de las organizaciones; y la desinformación existente sobre el concepto de Big Data, y cómo puede ser aplicado en beneficio de las distintas áreas de la organización”. Acelerar la velocidad de adopción y el crecimiento de Big Data en América Latina durante 2014 dependerá de los beneficios que perciban las empresas, y de los pasos que estén dispuestas a dar para lograr ventajas diferenciales para sus negocios, especialmente en industrias tan competitivas como la de telecomunicaciones, finanzas, hospitalidad y retail. “Un estudio de IDC revela que sólo 10% de las organizaciones tienen las características necesarias para explorar la información y descubrir insights. Hay claramente muchas oportunidades para mejorar”, afirmó Dan Vesset, vicepresidente de Programación, Business Analytics y Big Data de IDC. Y agregó: “Una plataforma integrada de descubrimiento de información debería ser parte del portafolio de todas las organizaciones. Sin esta capacidad, las compañías tienen una falla real en su estrategia de análisis de negocio”. Tal vez, una posibilidad de menor costo para ingresar al mundo Big Data, sea recurrir a soluciones en la nube de implementación rápida y que no requieren tecnologías altamente especializadas. El futuro es prometedor para Big Data y la rentabilidad para el negocio podría ser muy significativa. Para que esto sea realidad, es necesario un profundo cambio de mentalidad en los encargados de la toma de decisiones, ejecutivos capaces de liderar proyectos a largo plazo que estén anclados en Big Data, e idóneos profesionales especialistas en las TICs, permitiendo así, que el capital en información agregue valor a la compañía y guíe el curso del negocio hacia una mayor productividad. El desafío está planteado…

Alianza Latinoamericana de Medios TIC

13


BIG DATA

intel: “el fenómeno Big Data y su impacto en los negocios” OPINIÓN

gabriela gallardo Gerente de Marketing de Negocios de Intel para América Latina

14

Las soluciones que ofrece Big Data han evolucionado para dejar de ser solamente una tendencia, para convertirse en una fuerza fundamental auxiliar para la generación de nuevos negocios en todos los segmentos, desde el gobierno y las grandes compañías, hasta las PYMEs. “Se estima que desde el principio de la civilización hasta el 2003, la humanidad ya había producido cinco exabytes (un millón de billones de bytes) de información. En la actualidad, generamos esa cantidad cada dos días. Un estudio de la consultora IDC indica que de 2012 hasta el 2020, el volumen de datos almacenados en Internet se duplicará cada dos años. Las razones por detrás de esta explosión de datos son fáciles de entender”, asegura Gabriela Gallardo, Gerente de Marketing de Negocios de Intel para América Latina. A saber: “La proliferación de las redes sociales, el crecimiento del comercio electrónico y la creciente penetración de los dispositivos móviles son fenómenos relativamente recientes y se intensificarán en los próximos años”. Y agrega: “Además, se estima que para el 2015 habrá 25 mil millones de dispositivos conectados, que van desde PC, tabletas y smartphones hasta dispositivos sensoriales, como cámaras de monitoreo y medidores de velocidad, lo que dará como resultado una avalancha de datos complejos”. La expresión ‘Big Data’ se refiere a esos enormes conjuntos de información caracterizados por grandes volúmenes, de gran variedad, que se originan de diversas fuentes de datos generados a alta velocidad y que pueden obtenerse en el instante en que se crean. “Cuando se habla de Big Data, desde el punto de vista empresarial, la gran oportunidad que las empresas tienen, es la de extraer inteligencia efectiva para los negocios a partir de estos datos. Las herramientas de análisis específicos, también conocidas como Analytics, permiten implementar estrategias para conocer y fidelizar

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


En el mundo corporativo, existen ejemplos notables de creación de ventajas competitivas a partir de estrategias basadas en las técnicas de Big Data

mejor a los clientes, reducir costos operacionales y mejorar sus productos”, afirma la ejecutiva. Y continúa: “En el mundo corporativo, existen ejemplos notables de creación de ventajas competitivas a partir de estrategias basadas en las técnicas de Big Data. Las empresas de comercio electrónico utilizan los datos del perfil de sus consumidores, así como el perfil de navegación, para definir en tiempo real los productos que ofrecerán a sus clientes”. Y da algunos ejemplos: “Netflix aproximadamente dos terceras partes de sus ventas son realizadas a través de recomendaciones personalizadas. Las grandes operadoras de Telecom correlacionan los datos del perfil de uso de sus clientes y del perfil de tarifas para definir las estrategias que reduzcan la deserción de clientes. Las empresas del mercado financiero correlacionan también los datos públicos de múltiples fuentes de sus clientes con el fin de auxiliar en la construcción del perfil de crédito. Mientras tanto, las empresas del sector minorista buscan sus puntos de venta utilizando herramientas que relacionan datos complejos de demografía, flujo de personas y de consumo sectorial”. El mercado de “Big Data” es aún relativamente nuevo si lo comparamos con el potencial que tiene. En 2013, estudios de mercado indicaron que el mercado global moviliza aproximadamente US$ 10 billones, siendo que aproximadamente un 30% de este volumen está representado por software, mientras que el resto está dividido entre hardware y servicios. A pesar de ser relativamente pequeño, es uno de los segmentos de mayor crecimiento proyectado en el sector de tecnología, con tasas superiores a 50% al año en los próximos años.

En Brasil, el segmento de Analytics debe movilizar más de US$ 260 millones este año, un crecimiento de 70% con relación al año pasado, según datos de la consultora Frost & Sullivan. “El fenómeno de Big Data, en conjunto con la computación en la nube – cloud computing– tiene potencial para perjudicar a la industria de software”, comenta Gallardo. “Después de un período de maduración, las soluciones de Analytics permitirán que las empresas obtengan perspectivas significativas acerca de sus mercados, de sus competidores y de sus negocios, lo que representará un elemento competitivo importante, así como también creará beneficios de productividad e innovación”, indica. Desde 2008, más de 500 empresas ya invirtieron en el sector de forma global, en una asignación superior a US$ 4.9 billones, según la CB Insights. “Sin embargo, hay un reto relevante –y que está lejos de resolverse de simplificar las soluciones de Analytics hasta el punto en que los usuarios de negocios puedan utilizarlo, y no sólo los ingenieros especialistas y estadistas”, expresa la especialistas. “Con relación a este desafío y a todo ánimo –a veces exagerado natural de las nuevas tecnologías, las perspectivas son muy positivas y están corroboradas por la fértil actividad de inversión por parte de los fondos de Venture Capital y Private Equity en este sector, incluso en las empresas emergentes”, agrega. Por último, la Gerente de Marketing de Negocios de Intel para América Latina, deja un mensaje: “¡Si su idea de startup ofrece una solución a este desafío, es muy probable que tenga mucho éxito en el mercado en los próximos años, siga nuestro consejo y explore un nuevo mercado muy prometedor!”.

El fenómeno de Big Data, en conjunto con la computación en la nube – cloud computing – tiene potencial para perjudicar a la industria de software

Nº 2 • 2014

Alianza Latinoamericana de Medios TIC

15


BIG DATA

totVs: Big Data, el camino a seguir para las empresas de América Latina Ángel Colángelo

E N T R E V I S TA

denis del Bianco

Director de TOTVS Consulting y Performance Empresarial

16

La economía mundial considera que la gigante masa de información que crece por minuto en Internet es el nuevo gran activo. ¿Cómo convertirla en beneficios? Es el desafío que plantea el ejecutivo de TOTVS. Debemos entender a Big Data no como una solución tecnológica, sino como una práctica, que surge en un escenario de empresas propio de la era digital. “Consiste en un análisis estadístico de un gran volumen de datos que brinda la posibilidad de analizar los datos no estructurados, o sea, aquellos que están dispersos en varias fuentes externas a la empresa”, cuenta Denis Del Bianco, Director de TOTVS Consulting y Performance Empresarial. Y continúa: “Cuando hablamos de Big Data, tenemos que considerar tres factores, las 3 V: volumen (de datos); variabilidad (de las fuentes de datos); y velocidad (de monitoreo y de análisis). Los modelos estadísticos y matemáticos para el análisis de datos no son nuevos. Matemáticos e institutos de investigación ya los utilizaban hace tiempo. La diferencia es que ahora aplicamos estos modelos a datos traídos de ambientes como redes sociales”. A modo de ayuda y de acercamiento al funcionamiento del proceso que se conoce como Big Data, el ejecutivo da un ejemplo: “Netflix ilustra bien el funcionamiento de Big Data: inicialmente no se cuenta con información alguna, pero, conforme se utiliza la plataforma, la misma monitorea los géneros que se asisten y con qué frecuencia se accede a los mismos, y pasa a sugerir títulos en los que el usuario puede tener interés. Es un análisis predictivo, en que se extrae un modelo de lo que puede estar sucediendo con base en dados históricos y premisas de simulación. Big Data significa una disrupción y un salto de calidad en el proceso de análisis de datos para las empresas”. Independientemente del porte, los beneficios de Big Data

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


para las empresas están ligados al potencial de mejorar su toma de decisión, ya sea de procesos administrativos, operacionales, comerciales o de marketing, a través de la organización y el análisis de un gran volumen de informaciones, que hasta un pasado muy reciente no eran utilizadas ni tenidas en cuenta. “Se estima que el mundo usó 2,8 zetabytes (2,8 trillones de gigabytes) en 2012 y apenas 0,5% de eso fue analizado. Apenas 25% de estos 2,8 zetabytes tienen valor potencial. El desafío es saber filtrar estos 25% y conseguir analizarlos”, explica Denis Del Bianco. Y agrega: “Con la evolución de los medios sociales, de la movilidad y de herramientas de análisis (Business Analytics), hoy es posible realizar cruce de datos estructurados y no estructurados, internos o externos a la empresa, para alimentar modelos estadísticos que apoyen a la toma de decisión, sea sobre el mantenimiento de un equipamiento, sea del producto a ser ofertado a un determinado cliente, o sobre qué ruta utilizar para entregar su producto, entre otros”. Pero ¿cuál es el grado de conocimiento, introducción y desarrollo de Big Data en la región?. “Argentina y América del Sur usan poco Big Data en comparación, por ejemplo, con Estados Unidos”, manifiesta el CEO de TOTVS. Pero al mismo tiempo, “existe un camino a seguir en Big Data”, asegura y sobre los modelos de negocios emergentes a partir de Big Data describe: “En algunos negocios, Big Data tiene sentido naturalmente, como en e-commerce, empresas de medios, empresas de bienes de consumo y todas aquellas que tienen como objetivo el consumidor final. Empresas B2C tienen una gran tendencia a beneficiarse, pero hay oportunidades también para empresas B2B. El sector financiero, por ejemplo, puede beneficiarse mucho a la hora de realizar análisis de comportamiento de compra y de uso de tarjetas de crédito. Un caso común es el control contra fraudes de tarjetas de crédito con base en el monitoreo de valor de las compras y de la

localidad en que la operación fue realizada”. Y continúa: “La industria de seguros usa métodos estadísticos hace mucho tiempo. Ahora, con Big Data, tiene otras fuentes de datos no estructurados. En el pasado, recolectaban informaciones por medio de encuestas y entrevistas. Hoy es posible capturar y monitorear comportamientos por sensores GPS y alarmas de auto. Y, el concepto de Internet de las Cosas debe potencializar la disponibilidad de estos datos”. Queda claro que para los usuarios la utilización de Big Data significará una evolución del tratamiento individual al cliente. En la medida en que las empresas procesan las bases de datos que poseen, tendrán mayor posibilidad de saber los intereses, gustos, preferencias y necesidades de sus clientes y en consecuencia, saber qué y cuándo ofrecer un producto y/o servicio. El desafío está planteado y para Denis Del Bianco el futuro de Big Data es más que prometedor ya que “en la actualidad hay disponibles plataformas completas de BI en la nube, con control de versiones de los datos, análisis de tendencias, herramientas de extracción, transformación y carga de datos, capacidad de juntar datos estructurados y desestructurados internos y externos en un mismo análisis, funcionamiento en dispositivos móviles, opciones avanzadas de análisis, visualización atractiva y ambiente de colaboración, entre otras”. Y concluye: “Los ejecutivos están percibiendo esto y la adopción de sistemas de BI en la nube viene creciendo a grandes pasos. El propio empleo de la nube ganó madurez. Dieron cuenta que es una bella evolución de la terciarización tradicional de infraestructura, por permitir una escalabilidad más simple y rápida, por tanto más económica y productiva. Ya hay casos de éxito muy interesantes, en empresas de los más variados portes, en proyectos mucho más rápidos y más accesibles económicamente, si se lo compara a las ya conocidas soluciones tradicionales”.

Argentina y América del Sur usan poco Big Data en comparación, por ejemplo, con Estados Unidos

Nº 2 • 2014

Alianza Latinoamericana de Medios TIC

17


BIG DATA

Grandes Datos

La gente inteligente que logre aprovechar sus Grandes Datos será más inteligente aún. Orlando Rojas Pérez

A

sí como la energía fue el combustible del progreso del siglo XX, la convergencia de tres conceptos tecnológicos son y serán el combustible del progreso del siglo XXI que transformará a los Estados, a los negocios y a la vida de los individuos para mejorar su calidad. Hasta ahora comenzamos a entender, a aplicar y a utilizar la información que pueden brindar los grandes datos, lo que podemos captar hasta ahora es la punta del iceberg, el reto es sacarle provecho a toda esa gran masa de datos. Dos factores que han ayudado a la implementación del manejo de los Grandes Datos son la reducción del costo en sí del almacenamiento y el incremento en la velocidad de transferencia de la información. Sin olvidarnos de las grandes mejoras en rendimiento, seguridad y confiabilidad al contar con la opcional implementación de tener la información distribuida y/o replicada. Los continuos avances en memoria Flash aportan a ambos factores. Estos tres conceptos son: • Los Grandes Datos. • Asistentes para toma de decisiones. • Manejo de los datos y centros de datos, por software.

18

los grAndes dAtos Los procesos de los repositorios de Grandes Datos son: captura, almacenamiento, organización, disponibilidad, adecuada protección, entrega ante una búsqueda, descubrirlos, entenderlos, compartirlos y combinarlos con otros Grandes Datos, análisis, visualización, reportes y encontrarles nuevos usos. Asistentes pArA tomA de decisiones Hace 40 años se comenzaba a hablar de las herramientas asistentes para modelar y tomar decisiones de los datos almacenados, después le llamaron a esto minería de datos y ahora le llaman Inteligencia de Negocios e incluyen más variables como geo-referenciación, redes sociales, dispositivos, redes y su información, etc. Antes en una empresa cuando un vicepresidente comercial quería simular un modelo para una nueva idea, producto o estrategia, debía solicitarle al departamento de sistemas que le asignara a un ingeniero, quien a los dos meses se aparecía con una resma de papel verde y blanco con el resultado. Muy posiblemente el vicepresidente había tomado la decisión de arriesgarse a ciegas un mes antes. Ahora es el mismo vicepresidente quien con el uso de tablas dinámicas, profundiza al nivel que quiera en los Grandes Datos organizados y define el modelo que quiere simular, en segundos obtiene la respuesta a sus inquietudes, planes o estrategias y toma de inmediato la decisión. Para comprender a los asistentes de toma de decisiones podríamos imaginarnos una pirámide con los datos en su base, sobre ellos la información, encima el conocimiento y en la punta la sabiduría. Esto es lo que se conoce como el uso efectivo del conocimiento en la toma de decisiones. mAneJo de los dAtos y centros de dAtos, por softWAre El software ha sido en los años recientes el gran transformador del hardware y de los equipos, para poder obtener el máximo beneficio y rendimiento de los fierros. Todos los equipos están acompañados de mejores programas que optimizan su trabajo.

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


Universo de datos Antes del 2012 Estados Unidos producía la mayoría de los Grandes Datos, en el año 2020 serán los países emergentes los grandes productores de Grandes Datos. El punto de quiebre será en el año 2017, en menos de tres años, desde ese momento los líderes serán los países emergentes.

Crecimiento del universo de datos: 1 Zetabyte = 1.000 Exabytes = 1´000.000 Petabytes = 1.000´000.000 Terabytes 2005: 0,13 Zetabytes. 2010: 1, 227 Zetabytes 2012: 2, 837 Zetabytes 2015: 8,591 Zetabytes 2020: 40,026 Zetabytes, en este momento los datos serán casi en su totalidad digitales para conformar el Universo Digital, se acabarán los datos análogos. El Internet de las Cosas –IoT- con dispositivos inteligentes que entregarán datos así sean de poca cantidad será un gran aportante a los datos almacenados, los carros, los sensores médicos, las cámaras de video, la meteorología, las finanzas, los negocios, el tráfico de personas y vehículos, los consumos y ahorros de agua, gas, energía, la seguridad,

Uso de los datos: En la actualidad se utiliza el 0,5% de los datos que se capturan. En el 2020 el 33% de los datos serán útiles. Las empresas se preguntan: ¿Qué información debo analizar? En lugar de preguntarse ¿Qué quiero mejorar o qué problema deseo resolver?

Cifras de EMC e IDC: En el 2013 hay 28 millones de ingenieros de Tecnologías de la Información y cada uno mantiene 230 GBytes de información.

Nº 2 • 2014

En el 2020 habrá 28 millones de ingenieros de Tecnologías de la Información y cada uno mantendrá 1.231 GBytes de información.

Tipo de datos en 2020, según EMC e IDC 10% será de Computadores Personales, teléfonos, dispositivos móviles y de dispositivos de consumo. 8% será de datos personales y de salud. 47 % será información de entretenimiento. 35% serán datos de vigilancia.

Seguridad Hoy en día, la mitad de la información que debería estar protegida y salvaguardada no lo está. El gran reto ante las violaciones de privacidad y seguridad dentro de los países e internacionalmente, es ¿Cómo proteger los Grandes Datos de información que debe ser privada?

Nuevos usos y aplicaciones Las máquinas guardan unos y ceros, pero por sí mismas no saben organizar la información, de manera que lo que entreguen lo comprendan los humanos. Volvemos al viejo concepto de cuando nacían los computadores: La información debe ser de calidad, si entra basura sale basura, la máquina procesa grandes cantidades de datos y a velocidades nunca antes soñadas, es el hombre quien debe evaluar y confirmar la calidad de los datos que entregan las máquinas. Si la información de una empresa es su más valioso activo, ¿Qué podremos decir de sus Grandes Datos? La ciencia del manejo y aprovechamiento de sus datos se convierte en uno de los procesos secretos de las empresas, como si fuera la fórmula de su Coca Cola. La gente inteligente que logre aprovechar sus Grandes Datos será más inteligente aún.

Alianza Latinoamericana de Medios TIC

Copa Mundo Brasil 2014 La reciente Copa Mundo de Fútbol fue un gran ejemplo del uso de grandes datos. El equipo ganador, el alemán utilizó una nueva herramienta de SAP llamada Match Insights que no solamente sirvió para mejorar el rendimiento y la velocidad de los pases de los jugadores alemanes de 3,4 segundos a solamente 1,1 segundos. También fue alimentada por miles de jóvenes universitarios contratados para entrar como dato, la forma como se movía cada jugador en defensa y en ataque, de manera que podían enviarle a cada jugador alemán a su dispositivo, videos exactos del oponente que tendrían al frente. Reporta indicadores de desempeño de cada jugador individualmente. El mes entrante SAP ofrecerá su herramienta Match Insights a todos los entrenadores de equipos de fútbol.

Futuros Grandes Datos Un buen ejemplo de Grandes Datos es la información de operación y facturación de los operadores de telefonía móvil que manejan miles de llamadas por segundo y para cada una de ellas deben almacenar el teléfono que origina la llamada, el teléfono de destino, la hora exacta de inicio de la llamada, la hora exacta de terminación de la llamada, la celda y localización de la llamada de origen, la ruta de la llamada entre las celdas radiobases, asociadas a los datos del cliente como su identificación, nombre y número de cuenta. Hasta ahí son datos para su operación, pero podrían usar datos relacionados como edad, sexo, análisis del lugar desde donde llama, etc, y con eso preparar promociones o venderle esa información a otro tipo de negocio, como centros comerciales o vendedores de ropa. Las posibilidades son infinitas. Ni pensar en la información de cada mensaje en redes sociales.

19


BIG DATA

E N T R E V I S TA

Brian Black

Vicepresidente de EMC para América Latina del Norte

el almacenamiento de archivos crece en forma exponencial En una entrevista con la Alianza, Brian Black, vicepresidente de EMC para América Latina del Norte, la revista Big Data evoluciona con la creciente necesidad de utilizar la información como un diferencial de empresas de valor de negocio. Pero todavía hay un camino a ser recorrido. Tenemos que invertir en el conocimiento y la apuesta de la madurez de la utilización del concepto en las empresas.

Orlando Rojas Pérez

Alianza: ¿cómo redefine emc la nueva Big data? Brian Black: “Big Data ha evolucionado en su proceso. Inicialmente cuando identificamos Big Data era la necesidad de almacenar toda la información relevante –archivos, videos, audio lo que se quiera- que tenía una organización para ayudarse en la toma de decisiones. Esta definición sigue válida. Ahora en la medida que hemos entendido más el poder de Big Data para las empresas, hemos comenzado a incorporar otros conceptos distintos. El inicio de Big Data fueron las bodegas de datos para la toma de decisiones, que eran muy pesadas y poco ágiles, cumplieron su función. En ese proceso de evolución se llegó al concepto de Lagos de Datos, que es la acumulación de esta información pero más compleja. Con estos, Big Data se apoya en los conceptos de este tipo, que permite tener mucho más acceso a más datos que van a llevar a la toma de decisiones pero que requieren también de un análisis de esa información de una manera mucho más ágil, rápida y más inteligente, es allí donde viene la aplicación de nuevos conceptos. Que en

20

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


principio es el mismo pero que ha venido creciendo a medida que el beneficio de esa información es más claro”. Alianza: Me hace recordar la primera presentación de EMC del término Data Lake en el decían “La diferencia entre Lagos de Datos y Bodega de Datos es que en la Bodega de Datos la información es precategorizada en el punto de entrada, lo que puede dictar cómo será analizada” Brian Black: “Nuestro mercado tradicional de almacenamiento estaba apalancado en soluciones en que el almacenamiento era de bloques, de bases de datos, Oracle, cualquiera de ellos. En el pasado el volumen más grande de almacenamiento estaba de ese lado. En la actualidad, el cambio de chip es que el almacenamiento de archivos (files) es el que más crece en forma exponencial. Todo el concepto de Big Data está basado en sacarle provecho a ambos tipos de información, estructurada en bloque o a la no estructurada en archivo. EMC tenía unas soluciones para este tipo de información no estructurada en archivo, como BNX o la versión anterior, que podían almacenar ambos tipos de datos. Pero ninguna lo hacía en forma tan eficiente como lo hace Isilon. Hoy en día, Isilon es la mejor herramienta para almacenar datos no estructurados, de una manera súper eficiente, muy rápidamente a bajo costo y especialmente flexible como nada en el mundo. Se instala y está operativo de inmediato. Incluso cuando un cliente adquiere una actualización, la cantidad de servicio que se vende en mínimo, es muy sencillo agregar capacidad adicional, es muy fácil hacerlo. Yo creo que hasta ahora estamos arañando el principio de Isilon en el mercado”. Alianza TIC: ¿Nos podría dar ejemplos aplicados a diferentes industrias? Brian Black: “En soluciones de industrias por ejemplo en video vigilancia, la cantidad

Nº 2 • 2014

Nuestro mercado tradicional de almacenamiento estaba apalancado en soluciones en que el almacenamiento era de bloques, de bases de datos, Oracle, cualquiera de ellos. En el pasado el volumen más grande de almacenamiento estaba de ese lado. En la actualidad, el cambio de chip es que el almacenamiento de archivos (files) es el que más crece en forma exponencial. Todo el concepto de Big Data está basado en sacarle provecho a ambos tipos de información, estructurada en bloque o a la no estructurada en archivo.

de información almacenada en video es muy grande, para hacer análisis de una forma que no sea muy cara pero que pueda crecer por demanda muy fácilmente. Isilon es perfecta. Las alianzas con empresas que crean programas para darle inteligencia a los sistemas de vigilancia con video, han crecido mucho. En el área de salud, crece enormemente alrededor del mundo, la información que se genera en salud, bien sea por regulación de los países o por práctica de negocios, requiere que el archivo del paciente con todas sus imágenes y toda la información, esté disponible y ubicada, por ejemplo una resonancia magnética que ocupa mucho espacio, la mejor plataforma

Alianza Latinoamericana de Medios TIC

21


Tradicionalmente en la tecnología de la información, la seguridad ha estado orientada al firewall, que no entren a donde yo tengo mi información. Ese primer anillo de protección es importante, no es suficiente. La tendencia en el área de seguridad lógica va más hacia la protección del dato, sin importar donde se encuentre para tenerla es Isilon. Ahora en este mercado estamos sustituyendo equipos y creciendo mucho más. Se abren muchas puertas en este campo. La parte de imagen es muy fuerte. En el sector de Oil & Gas, en este mercado el potencial de Isilon se pierde de vista. Era un mercado controlado con sistemas de archivos de almacenamiento con una solución que fue y es muy buena. A la escala que esta información crece hoy en día, de la necesidad que tienen de hacer data-análisis de esa información viene una solución como Isilon y desplaza por sus facilidades de crecimiento que son mayores, la forma en que maneja la información es más óptima. Isilon es una solución muy completa que cuando la incorporas con otras herramientas nuestras de almacenamiento como Xtrem IO u otras soluciones, se crea una plataforma bien robusta”. Alianza TIC: ¿Qué novedades incluye el nuevo Big Data? Brian Black: “Para la industria las necesidades de información que tiene

22

a la mano para la toma de decisiones es cada vez mayor. Por ejemplo en un aeropuerto cómo predestino el flujo de las personas, dónde están los servicios, cómo se atienden, dónde compran, en el pasado se hacía por experiencia. Ahora con el Big Data, se puede medir y ver cómo es el flujo, detecta el cuello de botella en el sistema, hasta se apoya en los medios sociales, se acumulan todos estos datos, se crean los Lagos de Datos, se analizan y permiten redefinir y tomar decisiones de cómo optimizar los servicios y la operación del aeropuerto. El ejemplo de esta aplicación se puede extrapolar a otras industrias. ¿Qué beneficios trae? Trae muchos beneficios a los usuarios y a las empresas. Es la evolución de la venta de la tecnología que incorpora otros productos, otros servicios que hoy en día son emergentes, son nuevos y trae muchos beneficios para la industria y para todos”. Alianza TIC: ¿Cómo determinan la mejor solución para un cliente? Brian Black: “Ahora tenemos una nueva forma de analizar con nuestros clientes, qué tipo de solución necesita, de acuerdo a las cargas de trabajo. Esta puede ser de mucho desempeño o de mucha capacidad por un lado y de mucha o poca complejidad del otro lado. Antes era unidireccional que rinda lo que rinda. Pero si yo voy a utilizar mucha capacidad mucho volumen y lo guardo en un disco Flash, me cuesta mucho dinero, peor si corro una aplicación de tarjeta de crédito de un banco se justifica el disco Flash. Se analiza de acuerdo a la carga de trabajo. El programa analiza y reporta si la información debe estar en la Nube o en una Nube privada. Tenemos muchas soluciones y algunas se traslapan, pero se aplican de acuerdo a las necesidades del cliente. Se optimizan los costos a la hora de seleccionar la inversión. Es el mejor

Alianza Latinoamericana de Medios TIC

Nº 2 • 2014


Nยบ 2 โ€ข 2014

Alianza Latinoamericana de Medios TIC

23


Entre los retos más grandes no es solamente identificar cuáles son los elementos de Big Data que voy a almacenar y comprarlos, lo que tiene más relevancia y complejidad es cómo le saco más provecho. El análisis de la información es la parte clave de esto. Es importante estructurar bien la información, tener los componentes pero lo clave es cómo se desarrolla el sacarle provecho optimizador de costos a la hora de vender una solución, cuando nos comparan con la competencia al comparar con igualdad de carga de trabajo resultamos más económicos, al analizar cuánto va a ser cada consumo y la velocidad. Este análisis nos está brindando una excelente posición en el mercado”. Alianza TIC: ¿Qué beneficios encuentra una organización (pequeña-mediana y grande) cuando implanta el nuevo Big Data en su operación? Brian Black: “Además de lo dicho antes, una empresa pequeña, mediana o grande, va a depender de su capacidad de acceso a esa fuente de datos, las empresas grandes podrán contar con sus datos “en casa”. Las empresas pequeñas le sacan provecho hoy en día, con plataformas como Google, que tienen muchas aplicaciones basadas conceptualmente en Big Data y que traen como consecuencia un beneficio. Las

24

aplicaciones de rutas de por dónde me voy, son un ejemplo de análisis y de Big Data. Además es información que viene de muchos sitios y permiten un resultado que beneficia a muchos, como a una pequeña empresa de taxis que puede optimizar los recorridos. Los beneficios van a crecer a medida que más empresas las utilicen”. Alianza TIC: ¿Qué infraestructura requiere una organización privada o de gobierno para adoptar y sacar provecho del nuevo Big Data? Brian Black: “Actualmente hay dos maneras de utilizar una solución. O la implementa el usuario adquiriendo todos los componentes o lo contrata como un servicio en la Nube. En el primer caso hay varios componentes que la conforman. La infraestructura tecnológica son los servidores, el almacenamiento, más los componentes que vendemos nosotros, nuestros aliados o nuestra competencia. Poder sacarle provecho de una forma correcta a Big Data requiere desarrollo, un componente aplicativo, es decir además de la infraestructura se necesita invertir en desarrollo que permita sacarle provecho a eso. Esto es importante para nosotros, nuestra propuesta al mercado ha sido y seguirá siendo más todavía es que es muy difícil resolver todos los problemas el mismo día. Nuestra propuesta de federación incluye componentes de almacenamiento, de virtualización, de programas de manejo de centros de datos de manera ágil, plataforma para desarrollo de aplicaciones, Big Data y seguridad, eso conforma nuestra propuesta de federación. Cuando se buscan estos proyectos es difícil encontrar todo esto en un único sitio. Nosotros podemos en un grupo de empresas y con algunas alianzas adicionales ofrecer un mapa de ruta de qué se necesita, es un gran beneficio para nosotros que es respuesta para necesidades

Alianza Latinoamericana de Medios TIC

Nº 2 • 2014


de la industria con todos los componentes que se requieren. Existen diferentes soluciones y cada una es la mejor en cada necesidad de Big Data”. Alianza TIC: ¿Cuáles son los retos más comunes que encuentran las empresas al implementar soluciones de Big Data? ¿Cómo superarlos? Brian Black: “Entre los retos más grandes no es solamente identificar cuáles son los elementos de Big Data que voy a almacenar y comprarlos, lo que tiene más relevancia y complejidad es cómo le saco más provecho. El análisis de la información es la parte clave de esto. Lo importante es conseguir los proveedores de soluciones, el personal capacitado, para poder hacer los análisis de datos correctos para sacarle provecho a la información. Es importante estructurar bien la información, tener los componentes pero lo clave es cómo se desarrolla el sacarle provecho”. Alianza TIC: ¿Ofrecen Ustedes un modelo de negocio emergente típico para comenzar Big Data en las empresas y en el día a día? Brian Black: “Hay soluciones que permitirán aprovechar mejor alrededor de Big Data. Una es VCE la alianza entre EMC, Cisco, Intel y VMware, con la que ofrecemos un paquete listo para Big Data, la plataforma de VBlock que puede venir en una versión preparada para Big Data de una manera eficiente y rápida que evita comprar los componentes por separado. Viene todo el combo, la red, la virtualización, el almacenamiento adecuado, es decir todo lo que se necesita, que se compra fácilmente y con una administración y mantenimiento muy sencillo”. Alianza TIC: ¿Cuáles son las tendencias de Big Data en Colombia y en la región? Brian Black: “Yo pienso que aunque hay

Nº 2 • 2014

conciencia y concepto de mercado de las necesidades que comienzan a crearse de como Big Data puede ayudar a solucionar las necesidades que tenemos, todavía no está tan definida en la tecnología de las empresas. Si preguntamos en las empresas cuáles son sus cinco prioridades para el año entrante, posiblemente no incluirán Big Data, así lo incluyan bajo otro nombre sin saberlo. El tema avanza porque es inevitable, peor no existe el nivel de conocimiento y madurez para que se tenga una explosión de crecimiento. Todos debemos educar al mercado de cómo sacarle provecho. A mediano plazo se verá esa explosión”. Alianza TIC: ¿Qué nos puede comentar a la necesidad privada y de los Estados a la encriptación? Brian Black: “Tradicionalmente en la tecnología de la información, la seguridad ha estado orientada al firewall, que no entren a donde yo tengo mi información. Ese primer anillo de protección es importante, no es suficiente. La tendencia en el área de seguridad lógica va más hacia la protección del dato, sin importar donde se encuentre. La encriptación es uno de los mecanismos importantes y necesarios para la protección. Vamos a ver cada día más tendencia a encontrar soluciones y aplicaciones que cumplen inclusive con regulaciones sobre el nivel de encriptación que se debe tener. La tendencia del mercado va hacia allá por qué las necesidades de seguridad son cada mayores.. Generalmente las soluciones buscan evitar que se roben la información, pero no indica quién se quiere robar la información y cómo lo puede evitar. La verdadera protección del dato debe asegurar que no pasará nada y entregar los correctivos para no ser atacado. Eso es parte del análisis de Big Data, del comportamiento normal y anormal de los datos”.

Alianza Latinoamericana de Medios TIC

25


BIG DATA

Mão na massa

Nunca se produziu tanta informação como atualmente. Para os especialistas, o momento é de ruptura. A maior parte das empresas não sabe lidar com a informação tratada. Estruturar aplicações até então inimagináveis desafia não apenas os gestores de TI, mas também quem define a estratégia do negócio. Lapidar o dado, agora, é obrigação. É fazer ou morrer.

26

Ana Paula Lobo *

O

big data não é um projeto convencional para as áreas de Tecnologia da Informação. A frase, que pode até soar como arrogante, parte de um dos maiores especialistas no tema, o gerente sênior de Consultoria em Analíticas e Big Data da EMC, Pedro Desouza. Em entrevista concedida ao portal Convergência Digital, ele ponderou que a maioria das empresas ainda não sabe como usar a informação tratada. “Na área de TI, há uma corrida para substituir tecnologias antigas. O modelo é novo. É antever o problema, e não correr para resolvê-lo. As provas de conceito são cruciais para a elaboração de uma boa estratégia”, sustenta o especialista da EMC. Não por acaso,

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


extrair valor do big data lidera o ranking das preocupações atuais das empresas. Pesquisa feita pelo Gartner este ano revela que o assunto está na agenda da maioria das companhias. “Os desafios que envolvem big data são importantes. E estamos vivendo um momento de mudança”, diz Donald Feinberg, analista Distinto e Vice-Presidente do Gartner. Se o momento é de ruptura, as dúvidas aparecem. Business Intelligence morrerá por conta do uso do big data? Para o analista do Gartner João Tapadinhas, a resposta ultrapassa a barreira do departamento de TI. “Metade dos gastos com BI e analíticos será impulsionada pelas áreas de negócios, e outra parte virá das exigências de recuperação de dados. Além disso, muitas organizações irão considerar a implantação de BI na Nuvem, ao menos taticamente”, sustenta o especialista. Sobre o melhor modelo de adoção do big

Nº 2 • 2014

data, Tapadinhas é direto: “Recomenda-se começar pequeno, mas pensar grande.” O conselho está respaldado em números. Dados da Intel apontam que haverá 50 bilhões de dispositivos conectados até o final da década, sendo dois bilhões deles no Brasil. Especialistas como o Presidente da IBM Brasil, Rodrigo Kede, garantem que os dados serão o petróleo do século 21. Lapidar e tirar valor da informação – estruturando aplicações antes inimagináveis – são as missões imediatas dos gestores de TI. Os projetos de big data analisam gigantescos volumes de dados estruturados e não estruturados, os quais – ao contrário do Business Inteligence, que lida com panoramas do passado – permitem extrair conhecimento para a tomada de decisão em cenários futuros. Mas, para isso, é preciso vencer os desafios dos chamados quatro “Vs”, ou seja, das variáveis a serem superadas:

Alianza Latinoamericana de Medios TIC

27


BIG DATA

volume, variedade, velocidade e valor. O volume é crescente, a variedade de informações, cada vez maior e a velocidade de expansão dos dados, assustadora. Saber lidar com essas três variáveis é imprescindível para se extrair valor. fAZendo e Aprendendo O big data cresce e aparece com ações efetivas também na esfera pública. A prefeitura do Rio de Janeiro, por exemplo, conta com diversas iniciativas. Entre elas está o projeto conduzido com a Fundação Getúlio Vargas e operadoras celulares para mapear o deslocamento urbano da população a partir dos registros anônimos (os chamados

CDRs, ou Call Detail Records) dos celulares. O mapeamento dos deslocamentos das pessoas, desde que elas saem de casa para trabalhar ou outros compromissos até o momento em que retornam, será cruzado com os dados do Bilhete Único. As informações serão úteis para definir políticas públicas de mobilidade urbana, como um melhor roteiro das linhas de ônibus. A EMC é uma das fornecedoras que poderá aderir ao projeto, tendo fechado com a prefeitura, em maio, um acordo de cooperação pelo qual utilizará a Plataforma Inteligente para Integração de Bases de Dados, em desenvolvimento. Segundo Fred Arruda, diretor

Hábitos dos clientes ganham atenção mais que especial Rastrear em tempo real o desempenho das atividades impõe um uso diferente da TI.

O banco de dados estruturados conta com informações de consumo, curva ABC de peças, ticket médio, ticket por peça, sazonalidade de até cinco anos atrás etc. Os não estruturados incluem dados

Não são apenas grandes empresas e governos

econômicos, informações de blogs de moda, redes

que podem se beneficiar de projetos de big data.

sociais, revistas e jornais. Segundo Sérgio de Souza

A rede de lavanderias 5àsec usa o big data para

Carvalho Júnior, diretor de Marketing, TI e CRM/

rastrear, em tempo real, o que acontece em suas

SAC da 5àsec, a metodologia permitiu dividir a rede

400 lojas espalhadas por todos os estados do país

em 18 clusters de lojas por localização geográfica

– uma iniciativa que elevou em 15% o faturamento.

ou tipos de consumidores. E realizar campanhas

Com a análise dos dados, a prestadora de serviços

dedicadas para cada grupo.

consegue avaliar os hábitos dos clientes loja a

Na área de consumo, a massificação das redes

loja, além de realizar pesquisas que influenciam o

sociais também impôs um uso diferente da TI. É

negócio, como sazonalidade e tendências de clima

o caso da Avon, que contratou a Algar Tech para

e de moda, que determinam a entrada de tipos

identificar os principais gaps nos processos que

de peças de acordo com a estação, assim como a

envolvem reclamações dos clientes e evoluir de 3

variação de preços.

para 7 a nota média atribuída à empresa pelo site

28

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


de Operações do Centro de Pesquisa da EMC, a empresa venceu um edital da Finep, órgão de fomento à inovação e à pesquisa do Ministério da Ciência, Tecnologia e Inovação, no valor de R$ 3 milhões, dos quais R$ 1,3 milhão são de responsabilidade dela e R$ 1,7 milhão, da instituição governamental. De acordo com o modelo de negócios do Centro de P&D da EMC, localizado no Parque Tecnológico da Universidade Federal do Rio de Janeiro, os projetos são desenvolvidos sem custo para os clientes, que ao final se constituem em casos de sucesso reais. Cada cliente pode usar a solução resultante do

Reclame Aqui, num prazo de 7 meses.

(Sobre o melhor modelo de adoção do big data)

Recomenda-se começar pequeno, mas pensar grande

João Tapadinhas . Gartner

papel estratégico. A ordem será usar o big data para

Todas as informações foram consolidadas em um relatório analítico das reclamações com dados

evitar perdas. Para antever os problemas”, completa. Setor que puxa os investimentos no Brasil, a

relevantes, que retroalimentam os processos

área de agronegócios também começa a se apoiar

de negócio. “Apesar do volume de reclamações

no big data. Maior cooperativa agrícola da América

registradas ter se mantido, nossa tarefa foi de

Latina, com sede em Campo Mourão, no Paraná,

melhorar a experiência do cliente neste canal,

a Coamo Agroindustrial Cooperativa simplificou

gerando reputação positiva para a empresa.

seus processos de gestão orçamentária com uma

Fizemos ajustes de processos e passamos a ter

solução da IBM Brasil. Implementado em novembro

mais autonomia para tratar as reclamações de

de 2013, o sistema simplificou o processo e reduziu

forma mais rápida”, afirmou a gerente da Operação,

o período de planejamento e análise do orçamento

Patrícia Araújo.

de 60 para 30 dias.

O gerente de Portfólio e Parcerias da Algar Tech,

Segundo Antonio Sergio Gabriel, Superintendente

Aléssio Rodrigues, admite que há muita confusão

Administrativo da Coamo, os grandes ganhos do

entre big data e BI, especialmente, na parte da

uso da plataforma são as simulações de diferentes

precisão do que pode acontecer a partir da análise

cenários, que permitem calcular o impacto na

da informação. “Big data não é tecnologia. É um

rentabilidade, precificação, fluxo de caixa, recursos

meio para se aplicar o conceito de tratamento de

humanos e outros elementos do orçamento em

dados”, sustenta o especialista.

cada caso, de acordo com as oscilações dos preços

Para Rodrigues, o gestor de tecnologia está

mundiais, possibilitando avaliar a melhor opção

num processo de entendimento do que é big data

para maximização do resultado em suas projeções.

e do valor a ser gerado pelo dado analisado. E abre

Outros pontos de destaque são a entrada de

frente para o desembarque do Chief Data Officer,

informações mais consistentes e transparentes e a

o responsável pela área digital. “Esse executivo vai

demonstração de resultados imediatamente após a

ficar entre a TI e as áreas de negócio. Ele vai ter um

consolidação das mesmas.

Nº 2 • 2014

Alianza Latinoamericana de Medios TIC

29


BIG DATA

desenvolvimento, e o produto gerado passa a ser comercializado pela EMC. Trata-se do mesmo modelo utilizado com a Petrobras, para a qual a EMC vem desenvolvendo projetos de big data que envolvem a extração de dados de 30 mil fontes de informação diferentes. Um desses projetos é voltado para a área de equipamentos e vai permitir prever, com precisão, quando um deles vai necessitar de manutenção, reduzindo custos e aumentando a segurança. “Com a prefeitura, ainda estamos analisando em qual projeto a plataforma de big data que estamos desenvolvendo poderá ser aplicada. Isto porque ela conta com uma série de projetos nas áreas de

mobilidade urbana, saúde, defesa civil e educação, conduzidos pelo Centro de Operações e pelo Iplan Rio. Para validar a nossa plataforma, precisamos de um caso real, que poderá ser o de mobilidade urbana ou outro que interesse a ela”, explica Arruda. Outro projeto em pauta é do Operador Nacional do Sistema (ONS). No ano passado, o órgão realizou uma prova de conceito de um projeto que visa coletar, em tempo real, dados de tensão, corrente e frequência, por meio de sensores instalados em linhas de transmissão e sistemas de geração de energia, para refletir a saúde do sistema elétrico brasileiro. * Com reportagens de Carmen Lucia Nery e Suzana Liskauskas

Inteligência no combate ao crime no Rio de Janeiro Criado em 1995, o Disque-Denúncia, um projeto voltado a receber em um call center informações anônimas sobre as atividades criminosas no Rio de Janeiro, possui um banco de dados com mais de dois milhões de denúncias. Com análise de dados, o tempo de diagnóstico das informações caiu de 15 dias para duas horas. No Rio de Janeiro, a TI é um das aliadas mais

Adriana nunes . Disque-Denúncia

distribuição geográfica de incidência de crimes,

importantes no combate ao crime. Desde 2012, a

garantindo uma resposta mais rápida às equipes

equipe do Disque-Denúncia – projeto de Cooperação

que trabalham em Batalhões da Polícia Militar e

Social criado em 1995, destinado a receber

Delegacias da Polícia Civil, é a tarefa da equipe

informações sobre atividades criminosas no Rio de

técnica do serviço. Atualmente, o Disque-Denúncia

Janeiro em um call center – tem o reforço da tecnologia

tem um banco de dados com informações de dois

para acelerar a análise dos casos e visualizar as

milhões de denúncias e, de acordo com Adriana

tendências da atividade criminal.

Nunes, coordenadora Técnica do órgão, o processo

Gerar relatórios sofisticados com detalhes sobre

30

de extração de dados dos relatos, que demorava

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


Na área de TI, há uma corrida para substituir tecnologias antigas. O modelo é novo. É antever o problema, e não correr para resolvê-lo. As provas de conceito são cruciais para a elaboração de uma boa estratégia Pedro Desouza . EMC

quinze dias, hoje acontece em duas horas, já com

extração de dados possibilitou, inclusive, um reforço

um diagnóstico.

no policiamento naquelas localidades.

A executiva conta ainda que o uso da solução

Outro segmento que o Disque-Denúncia vem

tem sido fundamental em três situações: análise

priorizando é a ligação de menores infratores com

de dados sobre migração de criminosos; relação de

o tráfico de drogas. Adriana conta que muitas

delitos de menores infratores e o tráfico de drogas; e

denúncias dizem respeito à atuação de menores

mapeamento e identificação de crimes ambientais.

infratores em diversos tipos de crimes, assim como

“A ferramenta, que tem diversas possibilidades, nos

as denúncias de tráfico de drogas incluem vários

ajuda muito, diariamente, no monitoramento das UPPs

elementos. “Com o Tableau, ficou mais ágil identificar

(Unidades de Polícia Pacificadora) e na migração dos

informações sobre menores infratores em denúncias

criminosos. Conseguimos gerar relatórios sob demanda

referentes ao tráfico e vice-versa. Com isso, geramos

da Secretaria de Segurança Pública do Estado do

relatórios inteligentes em um prazo muito mais curto,

Rio de Janeiro, dos batalhões da Polícia Militar e

o que é fundamental para o combate ao crime.”

das Delegacias de Polícia Civil. Também agimos

Uma terceira atividade em que os investimentos

proativamente, quando verificamos um dado relevante.

em TI têm papel fundamental é a análise de

Enviamos imediatamente o relatório.”

informações sobre crimes ambientais. Adriana comenta que os delitos nessa área variam

Ação e reação

de acordo com as regiões. De acordo com a

A coordenadora Técnica do Disque-Denúncia

coordenadora, o Tableau ajuda a mapear os

revela que, conforme as comunidades foram

diferentes delitos ambientais em relatórios

ocupadas, os criminosos migraram para outros

geográficos, mostrando incidência e índices. ”Em

locais. Esta informação tinha que chegar de forma

todas as nossas frentes de trabalho, quanto mais

rápida à Polícia e, com o uso do software Tableau,

rápido você traz um diagnóstico ou uma análise,

foi possível identificar para onde eles estavam

mais rápido pode ter o resultado”, completa a

mudando. Adriana conta que esse sistema de

coordenadora Técnica do Disque-Denúncia.

Nº 2 • 2014

Alianza Latinoamericana de Medios TIC

• 31


BIG DATA

E N T R E V I S TA

manoj suvarna

Vicepresidente de Sistemas Convergentes HP Big Data

“El tipo de infraestructura necesaria para gestionar Big Data no cambia si es una empresa particular o una entidad pública. Lo que sí cambia es el tipo de datos recogidos, analizados, procesados y compartidos con su comunidad de usuarios”, dice en una entrevista exclusiva con la revista Alianza, Vicepresidente de Sistemas Convergentes HP Big Data, Manoj Suvarna

en el año 2020, el 90% de todos los datos serán no estructurados Orlando Rojas Pérez

Alianza tic: ¿cómo definiría Big data? manoj suvarna: “Big Data es una combinación de datos estructurados (datos tradicionales, CRM, SCM, ERP) semi-estructurados (web logs, sensores, clickstreams) y no estructurados (redes sociales, audio, video, texto, imágenes) los cuales las organizaciones de hoy deben manejar. La mayoría de las organizaciones cuentan con la infraestructura para manejar datos estructurados los cuales son también el negocio de datos más pequeño y de crecimiento más lento. Se espera una cantidad significativa de crecimiento en las áreas de datos semi-estructurados y no estructurados, los cuales están creciendo por encima del 70% año a año. De hecho, los analistas de la industria predicen que para el año 2020, casi el 90% de todos los datos serán no estructurados o semi-estructurados”. Alianza tic: ¿Qué novedades ofrece Hp para Big data? manoj suvarna: “HP tiene varias opciones para soportar Big Data. Desde una perspectiva

32

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


de software, existen aplicaciones líderes en la industria tales como Vertica (pilar en análisis de bases de datos) y Autonomy (búsqueda y reconocimiento contextual utilizando IDOL intelligent Data Operating Layer). Recientemente, HP ha promovido su visión a largo plazo para Big Data que abarca un 100% de todos los requerimientos de datos por cualquier organización independientemente de su tamaño o industria bajo el paraguas de HAVEn lo cual significa H: Hadoop, A: Autonomía; V: Vertica, E: Seguridad Empresarial y n: aplicaciones. La visión de HP para Big Data se ilustra de la siguiente manera:

Adicionalmente, HP ofrece soluciones integradas para soportar ambientes Big Data bajo su portafolio ConvergedSystems. El CS300 para Vertica ofrece una solución de objetivo incorporado que puede proporcionar 50-100x más de rendimiento que entornos EDW, con hasta un 70% de ahorro en Costo Total de Propiedad –TCO- y puede ser usado e implementado en días en contra de meses. HP también ofrece plataformas de infraestructura autónomas para dar soporte a Hadoop (Cloudera, Hortonworks o distribuidores MapR) para controlar el crecimiento de Big Data así como plataformas para implementar soluciones Autonomy IDOL. Las prácticas de Consultoría de Tecnología Big Data de HP ofrecen talleres y perspectivas para guiar a nuestros clientes a través del mundo Big Data y ayudarlos a trazar mapas para adoptar soluciones Big Data dentro de sus entornos de datos existentes”.

Nº 2 • 2014

Alianza TIC: ¿Cuáles son los beneficios que pueden tener las pequeñas, medianas y grandes empresas al implementar proyectos Big Data? Manoj Suvarna: “Los beneficios varían no sólo en relación al tamaño o sector de la empresa, sino también al manejo que se de en la implementación de Big Data. Todos sabemos que los datos (pequeños o grandes) existen hoy en día en todas las empresas, ya sea que se trate de la historia de compra del cliente, el inventario de productos, reportes financieros, facturación, etc. A medida que las empresas crecen, estos datos se siguen manteniendo y almacenando en sus archivos durante un periodo de tiempo, ya sea para efectos de regulación o de conformidad. Con el crecimiento de las redes sociales, muchas empresas han empezado a capturar información sobre sus productos / servicios directamente de los clientes a través de transacciones en línea, encuestas de satisfacción del cliente, Twitter, Facebook, etc. Sin embargo, muy pocas empresas han buscado la relación entre estos dos diversos conjuntos de datos que permita establecer patrones o buscar respuestas a los potenciales problemas empresariales antes de que estos surjan. Por ejemplo, una tienda que tiene acceso a los datos geoespaciales y de clima para predecir la próxima tormenta y abastecer su punto de venta con todos los suministros de emergencia mucho antes que esta ocurra o una pequeña clínica dental comparando sus registros de pacientes (radiografías, limpiezas anteriores, notas médicas, etc.) para luego hacer predicciones sobre futuros problemas dentales y qué precauciones podrían tomar sus pacientes para evitar mayores problemas. Las herramientas de Big Data, incluyendo Handcoop y Analytics pueden ayudar a las empresas que están sentadas en montones y montones de datos en reposo (quizás incluso archivados) para analizarlos y luego diferenciarse aún más de sus competidores. Las empresas que han implementado proyectos de Big Data hoy son pioneras, ya que tienen una ventaja en

Alianza Latinoamericana de Medios TIC

33


Este año 2014 el mercado mundial de Big Data llegará a hacer de 16.000 millones de dólares. El Mercado crecerá 27% en promedio durante los próximos 5 años.

comparación al resto del mercado, así como una mayor probabilidad de usar estos datos para tomar decisiones empresariales rápidamente e impulsar una mayor rentabilidad. Las empresas con una larga historia de consumidores, productos al por menor, finanzas y manufactura (más de 100 años) que han dependido durante mucho tiempo de estructuras de datos altamente automatizados ahora están adoptando rápidamente al nuevo entorno empresarial de Analytics 3.0 aprovechando estas herramientas para la obtención de beneficios para el negocio igual a empresas modernas tales como Facebook, Twitter, LinkedIn, Google, etc”. Alianza TIC: ¿Qué infraestructura requiere una organización privada o de gobierno para adoptar y sacar provecho de un nuevo Big Data? Manoj Suvarna: “El tipo de infraestructura necesaria para gestionar Big Data no cambia si es una empresa particular o una entidad pública. Lo que sí cambia es el tipo de datos recogidos, analizados, procesados y compartidos con su comunidad de usuarios. Dependiendo del tipo de decisiones de negocios que necesitan ser impulsadas, las empresas impulsarán los proyectos Big Data, ya sea para una línea específica del negocio o para resolver un problema empresarial. Por ejemplo, ¿Cómo regular el uso del agua en una comunidad afectada por la sequia o cómo reducir al mínimo los retrasos de vuelos, cancelaciones y clientes insatisfechos debido a retrasos relacionados con el clima, etc? Por naturaleza Big Data es muy ágil, dinámico e impredecible con el volumen, la variedad y la velocidad de datos que se generan en una organización y la mayoría de las empresas

34

no cuentan con la infraestructura óptima para implementar, aplicar y aprovechar el potencial. Los centros de datos hoy en día tienen estructuras demasiado lentas para manejar grandes cargas de trabajo en constante cambio, cada vez mayores, ya que están construidas para soportar entornos de datos “estructurados” y pueden impactar el rendimiento general, así como el Costo Total de Propiedad –TCO-. Big Data necesita una estructura basada en estándares de la industria y que ofrezca la última tecnología para soportar el nuevo entorno de análisis, así como la capacidad de escalar sin problemas basado en la velocidad de crecimiento. Por último, se requiere conocimiento y experiencia especial, no sólo para implementar, sino también soportar el entorno integrado con las actualizaciones automáticas para mantener los indicadores de rendimiento”. Alianza TIC: ¿Cuáles son los mayores retos para implementar proyectos Big Data? ¿Cómo pueden superarse estos retos? Manoj Suvarna: “Los proyectos Big Data toman tiempo, es por esto que entre mas rápido se empiece a trabajar, mejor será a largo plazo. Existen 3 áreas cruciales que se deben tener en cuenta antes de hacer una inversión en un proyecto Big Data. 1 - Gestión de compra: Mientras que Big Data se ha convertido en una palabra de moda y cada CIO / CMO se emociona hablando de sus proyectos, todas las organizaciones que pretendan incursionar en esto deben revisar su estrategia a largo plazo sobre cómo se gestionarán los datos dentro de la empresa a medida que esta crece. Pueden ser datos operativos, datos de clientes o datos financieros. Las empresas tendrán que actualizar sus procesos, sus fuentes de datos y tomar algunas decisiones difíciles sobre qué preguntas hacer o qué líneas de negocios deben tener prioridad para hacer el análisis de Big Data”. 2 - Problema de habilidades: Ésta es una brecha crítica que está surgiendo al ver que los pioneros hacen uso de nuevas tecnologías para solucionar problemas de Big Data. Por ejemplo: La familiaridad con No-SQL, Hadoop, MapReduce,

Alianza Latinoamericana de Medios TIC

Nº 2 • 2014


Splunk HILO etc., es cada vez más importante a medida que más y más organizaciones están siguiendo este camino. Ahora las empresas están contratando “Científicos de datos” y “Analistas de datos” para ayudar a satisfacer las necesidades de las empresas que requieren de inteligencia humana para formular las preguntas adecuadas y empezar a funcionar en un periodo de tiempo razonable. 3 - Seguridad y encriptación: Como los datos se mueven de aislados contenedores de tapa hermética a un entorno más amplio, donde la transparencia de datos dentro de la organización se vuelve más frecuente, el mantenimiento de la integridad de los datos y la prevención de infracciones es de suma importancia. Hay varias herramientas disponibles para Hadoop y No-SQL que buscan profundizar en los diferentes tipos de datos con diferentes parámetros de sensibilidad. Trabajar con el socio adecuado que ofrezca soluciones para abordar cada una de estas áreas es absolutamente crítico para el éxito o fracaso de cualquier proyecto de Big Data. HP ha ayudado a clientes con servicios de consultoría y soluciones lideres de la industria en análisis y gestión de Big Data que se pueden implementar en 30 días o menos”. Alianza TIC: ¿Cuáles son las tendencias de Big Data en Latino América? Manoj Suvarna: “Big Data en Latino América es un área que está generando bastante atención entre los clientes principalmente en las industrias de consumo, banca y telecomunicaciones. Estas compañías entienden la importancia de conocer en tiempo real el comportamiento de sus clientes y poder tomar acciones efectivas que les brinde una mejor atención y mayores ingresos. HP con sus socios de negocios ha llevado a cabo proyectos exitosos en México, Brasil, Colombia y Chile implementado soluciones de Vertica, Microsoft Analytics Platform, Hadoop e incluso implementaciones de Analytics con SAP. Este año 2014 el mercado mundial de Big Data llegará a hacer de 16.000 millones de dólares. El Mercado crecerá 27% en promedio durante los próximos 5 años.

Nº 2 • 2014

Los proyectos Big Data toman tiempo, es por esto que entre mas rápido se empiece a trabajar, mejor será a largo plazo. Existen 3 áreas cruciales que se deben tener en cuenta antes de hacer una inversión en un proyecto Big Data: - Gestión de compra, Problema de habilidades, Seguridad y encriptación

Alianza TIC: ¿Qué nos puede decir sobre la necesidad de privacidad y encriptación del flujo de datos en los proyectos Big Data? ¿Por ejemplo para los gobiernos? Manoj Suvarna: “Como se mencionó anteriormente, la privacidad es una de las mayores preocupaciones entre muchas organizaciones, independientemente si se encuentran en ambientes públicos o privados. Con las nuevas fuentes de datos que entran constantemente en los ambientes corporativos y la variedad de datos que se encuentran compilados en las bases de datos, las empresas tienen que protegerse de la exposición a posibles violaciones a la privacidad. Con frecuencia esto es una combinación de los procesos de seguridad que se han incorporado dentro de una organización y las herramientas que se utilizan para administrar los datos. Tanto HP Vertica como Autonomy tienen varios cientos de conectores para ayudar a que los datos se migren sin fisuras, y así evitar que los datos que se transfieren estén en riesgo. Además, HP ofrece varias herramientas de seguridad para empresas como ArcSight Logger que analiza los datos del sensor y de la máquina para detectar posibles discrepancias e informar sobre esto. Por otra parte el análisis de las aplicaciones en sí están reforzadas para asegurarse de que estas sean compatibles con el gobierno o con las agencias de defensa reguladoras”.

Alianza Latinoamericana de Medios TIC

35


BIG DATA

el cliente no requiere una infraestructura costosa Para el tema Big Data de este número de la revista Alianza, consideramos muy importante conocer la opinión sobre este tema de un operador de telecomunicaciones, para conocer cómo operan ellos con Big Data y como manejan ellos los Big Data de sus clientes, incluso la privacidad de esta información. Nuestro invitado fue Movistar, que fortaleció: Big Data no es algo solo de IT, es un trabajo de toda la compañía

Alianza tic: ¿Qué novedades incluye movistar al nuevo Big data para sí misma y para sus clientes? movistar: Para Movistar, Big Data es una de las grandes prioridades. Por ello, para poner más foco, ha creado una unidad global de Business Intelligence & Big Data al más alto nivel. Comenzamos con un trabajo exhaustivo sobre el dato, para asegurar que esté disponible en tiempo y forma. A su vez, estamos incorporando nuevas fuentes de información (tanto internas como externas), que somos capaces de explotar con técnicas de Big Data. Procesamos información en tiempo real, siendo capaces de realizar campañas más segmentadas que ayudan a cubrir mejor las necesidades de nuestros clientes a la vez que traen mejoras en el negocio.

Orlando Rojas Pérez

Alianza tic: ¿Qué beneficios encuentra una organización (pequeña-mediana y grande) cuando implanta el nuevo Big data de movistar en su operación? movistar: Ayuda a reducir de forma significativa los costos de almacenamiento, a la vez que genera nuevas oportunidades de negocio. Las telcos tenemos información de gran utilidad, que abre un sinfín de oportunidades de soluciones B2B. Trabajando con información anónima y agregada, que garantice siempre la privacidad de nuestros clientes; información valiosa para varios sectores.Por mencionar sólo un ejemplo, conocer los flujos agregados de personas entre los distintos barrios de una ciudad, con perfiles de clientes (edad y nivel sociodemográfico), separado por horas o días de la semana, es muy valioso para empresas de los sectores transporte, infraestructura y retail, entre otros.

Alianza tic: ¿cómo redefine movistar la nueva Big data? movistar: Vemos Big Data como un medio con el que podemos analizar muchas más variables para dar respuesta a oportunidades de negocio tanto interno como externo. La visión clásica de Big Data es el de las 4V´s que deben existir: volumen, variedad, velocidad y veracidad. Además, son muy importantes la tecnología, los procesos y las personas. Tenemos herramientas que permiten explotar volúmenes de información que hace años no podíamos imaginar. Para optimizar el uso de estas herramientas, debemos readecuar algunos procesos internos, y reforzar la capacitación de nuestras personas.

36

ALIANZA Latinoamericana de Medios TIC

Nº 2 • 2014


estas tecnologías. Es el caso por ejemplo de los administradores de entornos Hadoop o los especialistas en explotación avanzada de información (Data Scientists).

Alianza TIC: ¿Qué infraestructura requiere una organización privada o de gobierno para adoptar y sacar provecho del nuevo Big Data? Movistar: Antes de pensar en infraestructura, es necesario comenzar por la base, tener el dato disponible a tiempo y con calidad. Para poder trabajar sobre el dato, se debe cumplir con exhaustivas políticas de privacidad que aseguren la privacidad de los clientes. A partir de ahí, toda organización puede montar su propia infraestructura Big Data o buscar a un tercero que pueda ayudarle. No es necesario montar una infraestructura muy costosa, se puede utilizar hardware “commodity” de bajo costo. Lo más importante y complicado por el nivel de conocimiento necesario, es el software que se utiliza para trabajar, existiendo múltiples alternativas “open source” en el mercado. Alianza TIC: ¿Cuáles son los retos más comunes que encuentran las empresas al implementar soluciones de Big Data? ¿Cómo superarlos? Movistar: Big Data no es algo solo de IT, es un trabajo de toda la compañía. En función de cada organización, puede exigir un cambio cultural para fomentar la toma de decisiones basada en datos. Big Data debería ser vista como un medio, no como la solución en sí misma. Se debe comenzar por el caso de uso que el negocio requiera, y a partir de ahí ver qué datos necesitamos, cómo debemos analizarlos y ponerse a trabajar. Por otra parte, existe escasez de personal especializado para el desarrollo y la explotación de

Nº 2 • 2014

Alianza TIC: ¿Modelos de negocios emergentes a partir de la llegada e introducción de Big Data en las empresas y en el día a día de los usuarios? Movistar: Big Data supone un cambio significativo a la forma de trabajar. Por poner dos ejemplos, podemos tomar decisiones en tiempo real basadas en eventos de cliente, de una manera mucho más segmentada. También podemos cruzar la información con fuentes externas, de otros sectores, lo que dan una riqueza mayor a nuestros modelos analíticos. Alianza TIC: ¿Cuáles son las tendencias que Movistar detecta al implementar Big Data en Latinoamérica? Movistar: Se está avanzando muy rápido en el entorno Big Data, con diferentes distribuciones de Hadoop. Entendemos que, en líneas generales, la mejor alternativa es contar con un software lo más abierto y flexible posible, y no ir a productos cerrados. Puede resultar un poco más lento al principio, pero dará la flexibilidad que vamos a necesitar a futuro. Alianza TIC: ¿Qué nos puede comentar a la necesidad privada y de los Estados a la encriptación dentro de Big Data? Movistar: El tratamiento de los datos debe realizarse de forma muy meticulosa, puesto que la privacidad de los datos de las personas es innegociable para nosotros. Movistar, a diferencia de otras empresas, se posiciona como un garante de la privacidad de nuestros clientes. La confianza que depositan en nosotros nuestros clientes hace que no podamos correr riesgos en este sentido. Debemos mantener un diálogo franco y constante con el cliente sobre la utilización de su información, explicándole las ventajas de compartir información. De ese modo, el cliente percibe el valor añadido que recibe y puede decidir qué información desea compartir.

Alianza Latinoamericana de Medios TIC

37


BIG DATA

ARTÍCULO

J aime Ern esto Dueñ as M on ta ñ o

Big data para ‘small users’ Big data es uno de esos conceptos que, por grandes, no caben en la cabeza de un usuario común y corriente. Por definición, se refiere al “tratamiento y análisis de enormes repositorios de datos, tan desproporcionadamente grandes que resulta imposible tratarlos con las herramientas de bases de datos y analíticas convencionales”, dice el experto Enrique Dans en su blog.

Periodista, nacido en Bogotá. Durante sus primeros años en el oficio se especializó en temas de Tecnología, pero hizo aportes importantes en publicaciones de Cultura y Entretenimiento, entre otros temas. Ha participado en proyectos de implantación tecnológica, así como en procesos de implementación y puesta en marcha de estrategias multimedia en medios importantes de Colombia. Como miembro de equipos interdisciplinarios de trabajo ha ganado premios de Periodismo y Tecnología. Actualmente es columnista de Evaluamos.com y de Enter.co.

38

La descripción se ajusta, resume y contiene los elementos que utilizan los grandes jugadores de la industria que utilizan el término, aunque a la gran cantidad hay que agregarle una gran variedad. Pero ¿qué es “desproporcionadamente grande” para nosotros, para quienes cada vez usamos más la tecnología, pero seguramente no tenemos una colección de datos más grande que una enorme biblioteca o un gran disco duro lleno de música? Hagamos el ejercicio: “Se podría decir que si todos los bits y bytes de datos del último año fueran guardados en CD, se generaría una gran torre desde la Tierra hasta la Luna y de regreso”, enuncia IBM en su descripción de big data. Para un ser humano común y corriente, “desproporcionadamente grande” puede ser King Kong junto a Chita o un Tiranosaurio Rex junto a

ALIANZA Latinoamericana de Medios TIC

Barney; pero en materia de datos, esas comparaciones se quedan cortas frente a una pila de discos compactos que va hasta la Luna y vuelve… Hagamos memoria: los primeros computadores personales que recuerdo tenían una memoria de 64 kilobytes… de 128, de 256, ¡de 512! En la era de los kilobytes (miles de bytes) era irreal pensar en gigabytes (miles de millones de bytes); pero hoy, la memoria estándar de un computador es de unos 4 de ellos. Y muchos de ustedes ya deben tener unidades de almacenamiento que se miden en terabytes (millones de millones de bytes). Para no ir muy lejos, su celular inteligente seguramente puede almacenar unas 250 veces la cantidad de datos que le cabían a la memoria principal de su primer computador personal (claro, si usted y yo tenemos más o menos la misma edad). Pero en el mundo de los datos, de las cantidades desproporcionadamente grandes de ellos, se habla de petabytes y de exabytes (ustedes vayan multiplicando cada cifra anterior por mil para seguir la secuencia). Y más allá de ellos están los zettabytes y los yottabytes (ya vamos por un uno con 24 ceros). “En otras palabras – añade IBM –, todas aquellas actividades que la mayoría de nosotros realizamos varias veces al día con nuestros ‘smartphones’, estamos hablando de que se generan alrededor de 2,5 quintillones de bytes diariamente en el mundo” (un quintillón es un uno seguido de 30 ceros). Bajo el concepto de big data una sola persona o institución no debe procesarlos todos ella sola, pero la misma empresa ofrece un par de cifras muy ilustrativas: “en Twitter son cerca de 12 terabytes de tweets creados diariamente y Facebook almacena alrededor de 100 petabytes de fotos y videos”. ¿Y de dónde salen esos datos?

Nº 2 • 2014


De documentos de texto, hojas de cálculo, archivos de música, de video, censos de población, transacciones bancarias o comerciales, sistemas de geolocalización como los que utiliza su GPS para evitar que usted se pierda; equipos médicos que registran y almacenan sus pulsaciones, la cantidad de azúcar en su sangre y las variaciones de anticuerpos antinucleares. Recuerde: la palabra clave junto a cantidad es variedad de datos, de manera que al listado que acabo de comenzar se le pueden agregar cientos o miles de tipos de información. Usted escoja. Seguramente, los seres humanos convencionales no procesamos a diario (ni en una semana, un mes o un año) una cantidad y variedad de datos tan grande como a la que se refiere big data; pero tal vez sí sacaremos mucho provecho de los datos (incluso los nuestros) que otros procesan por nosotros. Pero antes de llegar a las grandes ligas del big data, empresas e instituciones que proveen servicios nos harían un gran favor si aprendieran a manejar sus volúmenes actuales de información, que seguramente no pasan de un ‘medium data’. Así nos evitaríamos que cuatro o cinco empleados del mismo banco o del mismo proveedor de televisión por suscripción nos llamaran en sendos días diferentes para ofrecernos el mismo servicio que rechazamos desde la primera vez. O nos evitaríamos tener que llenar exactamente la misma información cada vez que vamos a realizar un trámite en una entidad del Estado, cuyas bases de datos deberían estar cruzadas para facilitarnos la vida a los ciudadanos. No hay que desconocer los avances que se han hecho en Colombia para que cada una de esas entidades avance en materia de uso de la

Nº 2 • 2014

Yo confío en las bondades que ofrece big data, pero todavía creo que a muchas empresas e instituciones de nuestro país les falta terminar el curso de ‘small data’, antes de meterse en las grandes ligas.

tecnología, pero todavía falta bastante para que la usen e intercambien entre ellas de manera eficiente. Y en materia de salud… ¿no sería ideal que en lugar de tener que recoger los exámenes de laboratorio y llevárselos a cada uno de los médicos que siguen un caso, simplemente quedaran en una base de datos a la que tuvieran acceso el paciente, el médico tratante y aquellos que pudieran tomar decisiones a partir de los resultados? ¡Ah! Porque ese es el otro elemento clave de big data: esa gran cantidad y variedad de datos (estructurados o no estructurados, dicen los expertos) bien procesados sirven para tomar decisiones. Médicas, en el ejemplo anterior; de mercadeo, para alegría de las empresas que ponen a cuatro o cinco empleados diferentes a llamar al mismo usuario con la misma oferta; y no sé si en el futuro también judiciales, académicas o de qué otros tipos. Big data en el microcosmos Mi colección de música tiene cerca de 50 gigabytes y se tocaría completamente en 17 días de reproducción continua… no está ni cerca de considerarse big data. Pero resulta frustrante que cada vez que voy a importar un CD a la colección, el sistema recurre a una base de datos de un tercero, que no con poca frecuencia tiene información errada y, en la mayoría de los casos, incompleta. Los productores deberían incluir dentro de su esquema de lucha contra la piratería la creación de una gran base

Alianza Latinoamericana de Medios TIC

de datos a la que los usuarios podamos acceder para tener información correcta y completa sobre los títulos de nuestra colección. Creo que el término big data no le quedaría grande a un repositorio que tuviera y permitiera utilizar de manera adecuada toda la información de todas las piezas musicales producidas en el mundo, desde lo más básico del reguetón hasta lo más elaborado de Beethoven, en todas sus versiones. Extrapolemos eso al mundo de las películas o de cualquier otro placer coleccionable. Pero lo siento, soy un usuario común y corriente, de esos que todavía tienen problemas para imaginarse la torre de discos compactos que va hasta la Luna y vuelve, por gráfico que resulte el ejemplo, de manera que no tengo un catálogo de ejemplos concretos sobre cómo los seres humanos convencionales podremos aprovechar las ventajas del big data. IBM, Oracle, Cisco y muchas empresas e instituciones más, todas ellas al alcance de Google, son más creativas en eso. Yo confío en las bondades que ofrece big data, pero todavía creo que a muchas empresas e instituciones de nuestro país les falta terminar el curso de ‘small data’, antes de meterse en las grandes ligas. Confío, eso sí, en que las decisiones que tomen las personas e instituciones que logren sacar máximo provecho del concepto me beneficien, y no solo les sirvan para encontrar la manera de venderme cosas que no necesito; eso ya lo hacen los comerciantes de San Andresito, sin mucho más que una calculadora y un poco de empatía.

39


40

Alianza Latinoamericana de Medios TIC

Nยบ 2 โ€ข 2014


Alianza Latinoamericana de Medios TIC . nº 2 . 2014