TIC

¿Qué sabes de Big Data?

Big Data para principiantes

big-data

No es una moda pasajera ni una tecnología del futuro; Big Data es real y ya forma parte de nuestra rutina, aunque no seamos conscientes de ello.

Los medios de comunicación se hacen eco de su utilidad e, incluso, es posible que escuchemos que la empresa en la que trabajamos se quiere “subir al carro” del Big Data, pero, ¿sabemos realmente de qué se trata y para qué sirve?

Términos como M2M, zetabytes, Data Mining o Clustering, nos suenan a chino y lo más seguro es que si preguntamos a nuestros amigos o colegas de trabajo no nos arrojen ninguna luz al respecto.

Con este post intentaremos acercarnos un poco más a esta tecnología dando respuestas sencillas a preguntas que seguro muchos nos hacemos.

¿Cuándo aparece?

Parece que su origen se remonta a 1998, año en que el informático John Mashey publicó un estudio llamado “Big Data and the Next Wave of Infrastress” en el que avanzaba que la cantidad de información que se generaría en el futuro exigiría el uso de nuevas tecnologías.

¿Qué significa?

Big data o datos masivos es un concepto que hace referencia a la transformación de grandes cantidades de datos, que no pueden ser procesados o analizados utilizando las herramientas tradicionales, en información de utilidad que facilite la toma de decisiones, incluso en tiempo real.

¿Qué es lo que diferencia a Big Data de los sistemas analíticos tradicionales?

La respuesta está en las 3 Vs: la necesidad de procesar un inmenso Volumen de datos con la mayor Velocidad posible y teniendo en cuenta su gran Variedad. Recientemente se ha añadido dos más, Veracidad y Valor del dato (5Vs)

¿En qué campos es útil?

Todos utilizamos Big Data a diario. Cuando nos metemos en un buscador es también esta tecnología la que proporciona los resultados de dicha búsqueda. Del mismo modo, con ese mismo clic ya estamos dejando una huella y proporcionando una información sobre nosotros y nuestros intereses. De hecho, ya es posible predecir no sólo el comportamiento de una persona, sino de los habitantes de una ciudad.

Pero esta tecnología se está utilizando ya en ámbitos muy diversos que trascienden el uso doméstico, como los coches autónomos, la seguridad, ayudando en la captura de criminales y la prevención de ataques terroristas, o para predecir desastres naturales como tsunamis, tormentas o terremotos.

Asimismo, se ha mostrado de gran utilidad en el mundo de la política, buen ejemplo de ello es el uso de Big data en las elecciones presidenciales en Estados Unidos cuando el equipo de Obama ya marcó el camino que posteriormente también han seguido otros políticos. También en el campo científico y de salud ha probado ser una herramienta muy eficaz en la prevención de pandemias.

En el ámbito empresarial su objetivo es convertir los datos en información que ayude a las empresas a entender a sus clientes y a comprender mejor sus necesidades y, de este modo, facilitar la toma de decisiones, ayudando a incrementar su productividad y competitividad. Es lo que se llama Inteligencia Empresarial (business intelligence),

Por ejemplo, en el sector retail es muy utilizado ya que ayuda a detectar patrones de consumo y a mejorar la experiencia de compra. Empresas tan conocidas como el Corte Inglés, Ikea o Inditex llevan tiempo sacándole partido.

En el ámbito deportivo, existen camisetas inteligentes que miden las calorías quemadas o las pulsaciones. En este sentido, NIKE es una muestra de cómo sacar la mayor rentabilidad a sus productos.

¿De dónde provienen los datos?

La respuesta es muy extensa, pero intentaremos resumirla al máximo. En primer lugar, los datos pueden ser generados por las propias personas. Anualmente creamos 2,8 zetabytes de datos, de los cuales la mayoría son generados por internautas. Cada día se realizan más de dos millones de consultas en Google, más de 250 millones de tuits, 800 millones de actualizaciones en Facebook, y cada minuto se suben a YouTube 60 horas de vídeos.

Los datos pueden provenir también de las transacciones bancarias, (cada segundo se producen 10.000 transacciones mediante tarjeta de crédito). Cuando navegamos por internet también generamos gran cantidad de datos y a través del tracking todos estos movimientos quedan grabados (qué páginas vemos, a qué hora, que días, etc.).

Cuando hablamos de Machine to Machine (M2M) nos referimos a las tecnologías que comparten datos con dispositivos como Wi-Fi, Bluetooth o GPS de los vehículos.

Por último, están los datos biométricos que provienen de seguridad, defensa, servicios de inteligencia como los escáneres de retina o de huellas digitales.

Una vez recopilados los datos tanto estructurados como no estructurados, el siguiente paso es recogerlos y darles un formato. Las plataformas ETL (Extract, Transform and Load) extraen los datos de las diferentes fuentes y los transforman y limpian para posteriormente cargarlos en una base de datos (Data Warehouse).

¿Dónde se guardan?

Los almacenes de datos relacionales no son capaces de abordar este volumen ingente de datos que además crece exponencialmente. Por ello, resulta necesario recurrir a otros sistemas de almacenamiento masivo como Hadoop o NoSQL.

¿Cómo se analizan?

Existen diferentes metodologías de análisis como la asociación, la agrupación y el análisis de textos o la minería de datos.

La Asociación, permite encontrar relaciones entre diferentes variables. La Minería de datos (Data Mining) utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos, Podemos encontrar dos tipos de minería de datos: la descriptiva, que ofrece información sobre datos existentes; y la predictiva, que realiza pronósticos basados en los datos. La Agrupación (Clustering) es un tipo de minería de datos que se enfoca en dividir el conjunto completo de datos en subgrupos homogéneos para encontrar similitudes entre ellos. La metodología de Análisis de texto (Text Analytics), por su parte, permite extraer información de datos como  e-mails o búsquedas en webs.

¿Cómo se visualizan los datos?

El objetivo final es conseguir información valiosa a partir de los datos y que su visualización sea lo más amigable posible con el uso de gráficos o mapas y no con tablas, más difíciles de comprender. Cada vez se utilizan más las infografías que muestran los resultados de los diferentes análisis sobre los datos y resultan más atractivas y sencillas.

La evolución de esta tecnología es imparable y parece que la inteligencia artificial, el aprendizaje de las máquinas, la adopción de la nube, la demanda de científicos de datos y la creciente importancia del Internet de las Cosas marcarán las tendencias en 2017. Lo seguiremos muy de cerca…

 

 

branding

Tres años de innovación, esfuerzo y atrevimiento

Parece mentira, pero ya han pasado tres años desde que Bitaminia+ comenzó a dar sus primeros pasos. Durante este tiempo hemos dedicado todo nuestro esfuerzo a hacer crecer las marcas de nuestros clientes.

La innovación, la experiencia, las ganas y, sobre todo, buenas dosis de atrevimiento han sido las claves para conseguirlo.

Pero, sobre todo, nos hemos divertido mucho, desarrollando proyectos que nos han llevado a vivir experiencias increíbles, y seguimos haciéndolo. Hemos podido sentir los nervios previos a un desfile de moda en el backstage, hemos compartido con Eli, de seis años, sus historias cotidianas para niños con dermatitis atópica, hemos acompañado a pacientes con artritis reumatoide en unas jornadas de arte en la Casa Encendida, y estos son sólo algunos ejemplos.

 03_google_profile_imagebitaminia
Llevamos tres años trabajando en el entorno digital y es ahora cuando damos un nuevo paso publicando nuestro propio blog y abriéndonos camino en las redes sociales.
Son muchos los retos alcanzados, pero aún nos queda mucho por hacer y, sobre todo, mucho que aportar.