Big Data es
un término o un concepto que últimamente ha comenzado a escucharse muchísimo,
básicamente hace un tiempo que existe como tal pero con la
evolución del software, las comunicaciones (internet, telefonía celular), la
inserción de los microprocesadores y sensores en vehículos, etc. Se generan
grandes volúmenes de datos, existe una famosa infografía que muestra lo que
ocurre en internet en un minuto es inimaginable.
Al disponer
de grandes volúmenes de datos los análisis pueden ser mucho más precisos y por
ende pueden ayudar a tomar mejores decisiones. Y mejores decisiones pueden
significar mayores eficiencias operacionales, reducción de costos y la
reducción del riesgo.
En 2001 un
analista de la industria llamado Doug Laney (Actualmente Gartner),
definió a Big Data con 3 V’s: Volumen, Velocidad y Variedad.
En la actualidad se considera una V
adicional para Veracidad, tal como publica IBM en su infografía.
- Volumen: Muchos factores contribuyen al aumento de volumen de datos. Datos basados en transacciones almacenados a través de los años o datos no estructurados La disminución de los costos de almacenamiento influyen de forma positiva para contar con gran cantidad de información.
- Velocidad: Los datos se transmiten en a velocidad sin precedentes y debe ser tratado de manera oportuna. Las etiquetas RFID, sensores y contadores inteligentes están impulsando la necesidad de hacer frente a los flujos de datos en tiempo casi real.
- Variedad. Contamos con datos en todo tipo de formato. Los datos estructurados, numéricos en bases de datos tradicionales. Información creada a partir de las aplicaciones de línea de negocio. Documentos no estructurados de texto, correo electrónico, vídeo, audio, datos de valores de cotización y las transacciones financieras.
- Veracidad. Es un punto importante en el análisis de grandes volúmenes de información dado que se debe estar muy seguro de que tipo de información estamos analizando, básicamente la veracidad de la misma, los profesionales de IT deben trabajar para colaborar con la misma.