La Big Data ha llegado para quedarse, dado al incremento en la producción y análisis computacional. Aunque entendemos que es un término impreciso, es usado cuando nos referimos a los datos que la sociedad crea y procesa de manera digital, datos que cada vez crecen con más velocidad y abarcan más volumen y variedad. Para estudiar y analizar todo lo que nos puede ofrecer la Big Data, tenemos la Ciencia de datos la cual es un paso evolutivo en campos interdisciplinarios: el análisis de negocios que incorpora la informática, el modelado, las estadísticas, la analítica y las matemáticas en uno solo proceso.
En la ciencia de datos encontramos roles o perfiles de quienes la trabajan, ya que no hay una persona que pueda ser experta universal de la Big Data. Como lo mencionamos en nuestro articulo Perfil de los científicos de datos y su papel en la 4° revolución industrial
(…) un científico de datos debe aprender diferentes disciplinas que van desde la matemática a la estadística, pasando por la programación, comunicación y visión de negocio. Sin embargo, aunque se debe tener como noción todas, lo mejor que se puede hacer es especializarse en una de las ramas que la competen.
Sin embargo, no es solo el Científico de datos (Data Scientists) el encargado de realizar todo el trabajo. Es recomendable que estos equipos estén conformados también principalmente por un Ingeniero de datos (Data Engineer), Analista de negocio. (Business Data Analyst), Administrador de datos (Data Steward) y un Data Artis. A continuación, desglosaremos las características e importancia de cada uno:
- Científico de datos – Data Scientists: Son los que permiten extraer información valiosa de los datos, lo que los convierte en los miembros clave del equipo. Combinan una serie de habilidades multidisciplinarias que van entre matemáticas, informática, estadística, comunicación y negocios. Su mayor responsabilidad es extraer conocimiento y ayudar con él a diseñar productos basados en el análisis de los datos obtenidos, todo esto lo logra explorando, creando y experimentando con modelos y visualizaciones.
- Ingeniero de datos – Data Engineer: Estas personas son expertas en la estructura de la Big Data, por tal motivo son las encargadas de proporcionarle al equipo de trabajo, los datos de una manera más accesible y apropiada. Teniendo en cuenta lo anterior, es tarea del Data Engineer preparar todo el ecosistema para que los demás puedan obtener sus datos limpios y preparados para el análisis. En su día a día debe conocer cómo se modelan los datos y además tener un amplio conocimiento de SQL y BBDD.
- Analista de negocio – Business Data Analyst: Un analista de negocios realiza tareas muy similares a las de un Analista de datos. Sin embargo, el primero posee un conocimiento especializado en el dominio de algún problema del negocio para luego aplicar ese análisis y conocimiento para recomendar mejoras en el proceso. En otras palabras, es quien recoge las necesidades de negocio de los usuarios para mostrárselas al equipo e igualmente es quien presenta los resultados obtenidos del análisis y modelado de los datos. En conclusión su rol es mucho más singular, ya que debe combinar el conocimiento de negocio con una competencia técnica suficiente para comprender los problemas y enfoques de la ciencia de datos y así ser un interfaz eficaz entre el equipo y las expectativas del negocio.
- Administrador de datos – Data Steward: Su rol principalmente está relacionado con el monitoreo, operación y mantenimiento de la base de datos. Se encarga de mantener la calidad, disponibilidad, seguridad y mejorar el almacenamiento y presentación de los datos al usuario. En sus funciones encontramos: Comprender las necesidades del usuario, monitorear el desempeño de la base de datos, redefinir el diseño, instalar y probar programas, planificar y conservar un sistema de respaldo, otorgar permiso a los usuarios, supervisar la labor de personas encargadas de subir información a la base de datos, entre otros.
- Data Artist: Es un profesional con un alto desarrollo innovador, ya que debe ser capaz de ver las cosas desde una perspectiva muy distinta a la de sus compañeros. Son los responsables de crear gráficos y herramientas visuales para lograr que todas las personas de la organización comprendan los datos de una manera más fácil. Lo cierto es que su papel es muy importante ya que son los que peinan los datos y ven cosas que los demás no son capaces de ver y es capaz de plantear preguntas que a los demás no se les ha ocurrido plantear.
Sabemos que el Big Data es una revolución tecnológica y es un ecosistema en constante evolución. Con su avance se va componiendo de nuevas mejoras, conceptos y herramientas que logra que no pare la complejidad de éste y por esa misma razón está la diversidad y de los roles que mencionamos anteriormente, roles principales de los muchos que pueden haber en este gran universo de los datos.