Big Data
Se entiende como Big Data a las cantidades de datos a gran escala que sobrepasan la
capacidad del software convencional para ser capturadas, procesadas y almacenadas en un
tiempo razonable.
Big Data es un término que describe el gran volumen de datos, tanto estructurados como no
estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es
importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los
datos. Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y
movimientos de negocios estratégicos
El concepto de Big Data también engloba las infraestructuras, tecnologías y servicios que
han sido creados para poder gestionar esta gran cantidad de información.
Según IDC, la cantidad de datos almacenados en el mundo se está duplicando cada dos
años. La explosión de datos a la cual estamos asistiendo es una consecuencia de la
revolución digital y de la gran adopción por parte de los ciudadanos y de las empresas de
herramientas y tecnologías como las redes sociales, los dispositivos móviles, la geo
localización, y los objetos y sensores conectados a la Red – el Internet de las Cosas.
Para que hacerse una idea, cada día utilizamos muchos dispositivos mediante los cuales se
emite una cantidad ingente de información: cada vez que hacemos clic en una página web,
pagamos con tarjeta de crédito, publicamos imágenes en las redes sociales, encendemos el
GPS, etc. Todas estas (y muchas más) acciones producen datos masivos que deben ser
tratados.
En definitiva, cuando hablamos de Big Data no nos referimos únicamente a los datos, sino
sobre todo a la capacidad de poderlos explotar para extraer información y conocimiento de
valor y así poder sacar provecho de dicha información. La finalidad del Big Data es poder
diseñar nuevos productos y servicios basándose en los nuevos insights que adquirimos
sobre nuestros clientes, sobre nuestra competencia o el mercado en general.
Una vez recogida y almacenada la información, se deben extraer indicadores que puedan
ser útiles para tomar decisiones, incluso en tiempo real. Por lo tanto, la verdad sobre qué es
Big Data y para qué sirve va mucho más allá de solo pensar en «datos masivos».
Las cinco “Vs” del Big Data
La primera pregunta que nos viene a la mente al considerar qué es Big Data y para qué
sirve, está relacionada con cuánto de “grande” tienen que ser los datos para ser
considerados “Big”. Finalmente, el enfoque correcto está en no establecer un tamaño en
absoluto, sino relativo. Lo que ahora puede parecernos un gran tamaño de datos, en dos o
tres años puede ser normal o hasta irrelevante. La mayoría de expertos definen el Big Data
en términos de las cinco “V”:
1. Volumen: como hemos visto, la cantidad de datos se define “Big” no cuando supera
un tamaño definido, sino cuando su almacenamiento, procesamiento y explotación
empieza a ser un reto para una organización.
2. Velocidad: la segunda característica del Big Data está relacionada con el ritmo a los
cuales los datos se están generando, que suele aumentar constantemente y que
necesita una respuesta en tiempo real por parte de las empresas.
3. Variedad: sin embargo, el reto principal del Big Data reside en la gran diferencia
de formatos distintos en los cuales encontramos los datos y que pueden ir desde
texto sencillo, a imágenes, videos, hojas de cálculos y enteras bases de datos.
4. Veracidad: además, los datos tienen que ser confiables y han que ser mantenidos
limpios. Una gran cantidad de datos no tiene valor si son incorrectos y puede ser
altamente perjudicial, sobre todo en la toma de decisión automatizada.
5. Valor: finalmente, los datos y su análisis tienen que generar un beneficio para las
empresas.
Para entender de modo práctico qué es Big Data y para qué sirve, veamos algunos ejemplos
reales de su uso:
Marketing: segmentación de clientes. Muchas empresas usan datos masivos para
adaptar sus productos y servicios a las necesidades de sus clientes, optimizar
operaciones e infraestructuras, y encontrar nuevos campos de negocio.
Deportes: optimización del rendimiento. Dispositivos como los smart watches
registran automáticamente datos como el consumo de calorías o los niveles de
acondicionamiento físico.
Salud pública: codificación de material genético. Por ejemplo, existen plataformas
de análisis del Big Data que se dedican a descodificar cadenas de ADN para
comprender mejor las enfermedades y encontrar nuevos tratamientos.
Nuevas tecnologías: desarrollo de dispositivos autónomos. El análisis de datos
masivos puede contribuir a mejorar máquinas y dispositivos, y hacerlos más
autónomos. Un ejemplo son los coches inteligentes.
Seguridad: detección y prevención de crímenes. Los cuerpos de seguridad usan el
Big Data para localizar a criminales o prevenir actividades delictivas como los
ataques cibernéticos.
Historia de big data
Si bien el concepto "big data" en sí mismo es relativamente nuevo, los orígenes de los
grandes conjuntos de datos se remontan a las décadas de 1960 y 1970, cuando el mundo de
los datos acababa de empezar con los primeros centros de datos y el desarrollo de las bases
de datos relacionales.
Alrededor de 2005, la gente empezó a darse cuenta de la cantidad de datos que generaban
los usuarios a través de Facebook, YouTube y otros servicios online. Ese mismo año, se
desarrollaría Hadoop, un marco de código abierto creado específicamente para almacenar y
analizar grandes conjuntos de datos. En esta época, también empezaría a adquirir
popularidad NoSQL.
El desarrollo de marcos de código abierto tales como Hadoop (y, más recientemente,
Spark) sería esencial para el crecimiento del big data, pues estos hacían que el big data
resultase más fácil de usar y más barato de almacenar. En los años transcurridos desde
entonces, el volumen de big data se ha disparado. Los usuarios continúan generando
enormes cantidades de datos, pero ahora los humanos no son los únicos que lo hacen.
Con la llegada del Internet de las cosas (IoT), hay un mayor número de objetos y
dispositivos conectados a Internet que generan datos sobre patrones de uso de los clientes y
el rendimiento de los productos. El surgimiento del aprendizaje automático ha producido
aún más datos.
Ventajas de big data
El big data le permite obtener respuestas más completas, ya que dispone de mayor
cantidad de información.
La disponibilidad de respuestas más completas significa una mayor fiabilidad de los
datos, lo que implica un enfoque completamente distinto a la hora de abordar
problemas.
Descubra más soluciones de big data Pruebe a explorar y visualizar sus datos de
forma gratuita
Según la capacidad de obtención y análisis que se tenga del Big Data, la empresa obtendrá
grandes ventajas con relación a una empresa que no use el análisis de grandes conjuntos de
datos para su beneficio.
Mejor toma de decisiones: al disponer de un gran tamaño de información, esta se
tomaría como referencia. Con un correcto análisis, ayudará a tomar más
rápidamente y con seguridad las decisiones más acertadas.
Conocer los intereses del público: al recoger mucha información de las búsquedas
o interacciones de personas en la red, tu empresa puede hacerse una buena idea de
lo que tu audiencia busca. Esto le permitirá adaptar su oferta y negocio a los
intereses de los clientes y los nuevos tiempos.
Feedback al instante: aunque la cantidad de datos que se puede llegar a recoger es
enorme, es posible analizarlos al instante para obtener la opinión del cliente acerca
de un producto, pudiendo influir de manera positiva en la mejora del mismo.
Empresas de todo el mundo usan el Big Data para siempre estar al día, adaptando sus
negocios al público en general. Así pueden ofrecer servicios y productos acorde a las
necesidades actuales y los nuevos tiempos.
Desventajas
El Big Data tiene muchas ventajas. No obstante, cuando esta información no es tratada y
analizada por expertos o profesionales en esta materia, puede traer consigo algunos
inconvenientes como:
El alto volumen de datos puede ralentizar el análisis: Aunque su gran tamaño
sirve para tener una apreciación más real acerca de algo, también es un gran
inconveniente. Ello puede ralentizar el análisis de la información. Aunque los
profesionales en la materia conocen como seleccionar y omitir grandes patrones de
datos.
Seguridad virtual: En los últimos años los ciberataques han centrado su atención
en el Big Data, debido a la vulnerabilidad de los datos. Esto hace necesario el uso de
herramientas y normas para un trabajo tanto eficaz como responsable del Big Data.
La tecnófobia: Algunas personas consideran que el uso de Big Data es una
violación a su privacidad, ya que utiliza sus interacciones en la red para generar
datos, aunque estos terminen resultando en un producto en su beneficio.
Las desventajas del big data pueden ser minimizadas al disponer de profesionales en la
materia para su análisis. Ten presente que, aunque existan estas desventajas, el uso de big
data no disminuye al contrario crece día con día.
Desafíos de big data
Si bien es cierto que el big data promete mucho, también se enfrenta a desafíos.
En primer lugar, el big data se caracteriza por su gran tamaño. Aunque se han desarrollado
nuevas tecnologías para el almacenamiento de datos, el volumen de datos duplica su
tamaño cada dos años aproximadamente. Las organizaciones continúan esforzándose por
mantener el ritmo de crecimiento de sus datos y por encontrar formas de almacenarlos
eficazmente.
Pero no basta con almacenar los datos. Para ser de algún valor, los datos deben poder
utilizarse, y esto depende de su conservación. Disponer de datos limpios —es decir, datos
relevantes para el cliente y organizados de tal modo que permitan un análisis significativo
— requiere una gran cantidad de trabajo. Los científicos de datos dedican entre un 50 y un
80 por ciento de su tiempo a seleccionar y preparar los datos antes de que estos puedan
utilizarse.
Por último, la tecnología de big data cambia a un ritmo rápido. Hace unos años, Apache
Hadoop era la tecnología más conocida utilizada para gestionar big data. Más tarde, en
2014, entraría en juego Apache Spark. Hoy en día, el enfoque óptimo parece ser una
combinación de ambos marcos. Mantenerse al día en cuanto a tecnología de big data
supone un desafío constante.
Funcionamiento del Big data big data
El big data le aporta nuevas perspectivas que abren paso a nuevas oportunidades y modelos
de negocio. Iniciarse en ello requiere de tres acciones clave:
1. Integrar
El big data concentra datos de numerosas fuentes y aplicaciones distintas. Los mecanismos
de integración de datos convencionales, tales como ETL (extract, transform, load [extraer,
transformar, cargar]), generalmente no están a la altura de dicha tarea. Analizar conjuntos
de big data de uno o más terabytes, o incluso petabytes, de tamaño requiere de nuevas
estrategias y tecnologías.
Durante la integración, es necesario incorporar los datos, procesarlos y asegurarse de que
estén formateados y disponibles de tal forma que los analistas empresariales puedan
empezar a utilizarlos.
2. Gestionar
El big data requiere almacenamiento. Su solución de almacenamiento puede residir en la
nube, on premises o en ambos. Puede almacenar sus datos de cualquier forma que desee e
incorporar los requisitos de procesamiento de su preferencia y los motores de
procesamiento necesarios a dichos conjuntos de datos on-demand. Muchas personas eligen
su solución de almacenamiento en función de dónde residan sus datos en cada momento. La
nube está aumentando progresivamente su popularidad porque es compatible con sus
requisitos tecnológicos actuales y porque le permite incorporar recursos a medida que los
necesita.
3. Analizar
La inversión en big data se rentabiliza en cuanto se analizan y utilizan los datos. Adquiera
una nueva claridad con un análisis visual de sus diversos conjuntos de datos. Continúe
explorando los datos para realizar nuevos descubrimientos. Comparta sus hallazgos con
otras personas. Construya modelos de datos con aprendizaje automático e inteligencia
artificial. Ponga sus datos a trabajar.
Tipos de Big Data
Para profundizar en qué es Big Data y para qué sirve, es necesario saber también que
existen distintos tipos de datos asociados a esta técnica.
A la hora de clasificar los “grandes datos” podemos hacerlo según dos criterios:
procedencia y estructura. Así, según su procedencia, los datos pueden llegar desde distintas
fuentes, entre otras:
Web y Redes Sociales: información disponible en Internet como contenido Web,
generada por los usuarios en su actividad en las redes sociales o información de
búsquedas en buscadores.
Machine-to-Machine (M2M): datos generados a partir de la comunicación entre
sensores inteligentes integrados en objetos de uso cotidiano.
Transacciones: incluye registros de facturación, llamadas o transacciones entre
cuentas.
Biométricos: datos generados por tecnología de identificación de personas
mediante reconocimiento facial, de huellas dactilares o mediante información
genética.
Generados por personas: a través de correos electrónicos, servicios de mensajería
o grabaciones de llamadas.
Generados por organizaciones tanto públicas como privadas: datos relacionados
con el medioambiente, estadísticas gubernamentales sobre población y economía,
historiales clínicos electrónicos, etc.
Por otro lado, según su estructura, los datos pueden ser:
Estructurados: datos que tienen definidos su formato, tamaño y longitud, como las
base de datos relacionales o Data Warehouse.
Semiestructurados: datos almacenados según una cierta estructura flexible y con
metadatos definidos, como XML y HTML, JSON, y las hojas de cálculo (CSV,
Excel).
No estructurados: datos sin formato específico, como ficheros de texto (Word,
PDF, correos electrónicos) o contenido multimedia (audio, vídeo, o imágenes).
Importancia del Big Data
El Big Data resulta muy útil para las empresas ya que proporciona respuestas a preguntas
que ellas mismas desconocen. Es un punto de referencia. Con tanta información, los datos
pueden ser probados de la manera que la empresa considere. Así pueden ser capaces de
identificar los problemas de manera más comprensible. La recopilación de los datos y la
búsqueda de tendencias dentro de ellos, permiten que las empresas reaccionen rápidamente
ante los problemas.
El análisis del Big Data ayuda a las organizaciones a aprovechar sus datos y utilizarlos para
identificar nuevas oportunidades. A su vez, esto lleva a movimientos de negocios más
inteligentes, operaciones más eficientes, mayores ganancias y clientes más felices. Las
empresas más exitosas que utilizan Big Data consiguen valor de tres formas: reduciendo los
costes, las grandes tecnologías de datos y el análisis basado en la nube, aportan importantes
ventajas en términos de costes cuando se trata de almacenar grandes cantidades de datos.
Además, identifica las maneras más eficientes de hacer negocios.
Otra es la velocidad, que mejora la toma de decisiones. Gracias a la velocidad de las
tecnologías y la analítica en memoria, combinada con la capacidad de analizar nuevas
fuentes de datos, las empresas pueden analizar la información inmediatamente y tomar
decisiones basadas en lo que han aprendido. Y por último con nuevos producto y servicios.
La capacidad de medir las necesidades de los clientes y la satisfacción a través de análisis
viene el poder de dar a los clientes lo que quieren. Por lo tanto, con la analítica de Big Data,
más empresas están creando nuevos productos para satisfacer las necesidades de los
clientes.