Resultados de aprendizaje y criterios de evaluación:
1. Gestiona soluciones a problemas propuestos, utilizando sistemas de almacenamiento y herramientas asociadas al centro de datos.
Criterios de evaluación:
-
- a) Se ha caracterizado el proceso de diseño y construcción de soluciones en sistemas de almacenamiento de datos.
- b) Se han determinado los procedimientos y mecanismos para la ingestión de datos.
- c) Se ha determinado el formato de datos adecuado para el almacenamiento.
- d) Se han procesado los datos almacenados.
- e) Se han presentado los resultados y las soluciones al cliente final en una forma fácil de interpretar.
2. Gestiona sistemas de almacenamiento y el amplio ecosistema alrededor de ellos facilitando el procesamiento de grandes cantidades de datos sin fallos y de forma rápida.
Criterios de evaluación:
-
- a) Se ha determinado la importancia de los sistemas de almacenamiento para depositar y procesar grandes cantidades de cualquier tipo de datos rápidamente.
- b) Se ha comprobado el poder de procesamiento de su modelo de computación distribuida.
- c) Se ha probado la tolerancia a fallos de los sistemas.
- d) Se ha determinado que se pueden almacenar tantos datos como se desee y decidir cómo utilizarlos más tarde.
- e) Se ha visualizado que el sistema puede crecer fácilmente añadiendo módulos.
3. Genera mecanismos de integridad de los datos, comprobando su mantenimiento en los sistemas de ficheros distribuidos y valorando la sobrecarga que conlleva en el tratamiento de los datos.
Criterios de evaluación:
-
- a) Se ha valorado la importancia de la calidad de los datos en los sistemas de ficheros distribuidos.
- b) Se ha valorado que a mayor volumen de tratamiento de datos corresponde un mayor peligro relacionado con la integridad de los datos.
- c) Se ha reconocido que los sistemas de ficheros distribuidos implementan una suma de verificación para la comprobación de los contenidos de los archivos.
- d) Se ha reconocido el papel del servidor en los procesos previos a la suma de verificación.
4. Realiza el seguimiento de la monitorización de un sistema, asegurando la fiabilidad y estabilidad de los servicios que se proveen.
Criterios de evaluación:
-
- a) Se han aplicado herramientas de monitorización eficiente de los recursos.
- b) Se han recogido métricas, procesamiento y visualización de los datos.
- c) Se han generado alertas para detectar un riesgo o mal funcionamiento.
- d) Se ha comprobado que las herramientas usadas ofrecen un rendimiento elevado con rapidez.
- e) Se ha comprobado la fiabilidad de los datos según respuestas.
- f) Se ha analizado la estabilidad de servicios.
5. Valida las técnicas de Big Data para transformar una gran cantidad de datos en información significativa, facilitando la toma de decisiones de negocios.
Criterios de evaluación:
-
- a) Se han seleccionado gran cantidad de datos estructurados y no estructurados para reforzar la función de BI.
- b) Se ha realizado la limpieza y transformación de datos en base a los objetivos predeterminados.
- c) Se ha comprobado que el Big Data multiplica la relevancia y la utilidad del BI para el negocio.
- d) Se han conjugado dentro de un modelo de empresa datos de clientes, financieros de ventas, de productos, de marketing, de redes sociales, de la competencia, entre otros, para extraer un análisis valioso y efectivo para el negocio.
- e) Se ha evaluado e interpretado la información extraída de los datos y su influencia en el triunfo de diferentes negocios.
- f) Se ha simulado la implantación de un modelo de Inteligencia de negocios BI.
Contenidos:
- Gestión de soluciones con sistemas de almacenamiento y herramientas del centro de datos para la resolución de problemas:
- Almacenamiento de datos masivo.
- Procesamiento de datos.
- Analítica de Big Data en los ecosistemas de almacenamiento.
- Big Data y Cloud.
- Gestión de sistemas de almacenamiento y ecosistemas Big Data:
- Computación distribuida. Computación paralela.
- Sistemas de almacenamiento distribuidos. Tolerancia a fallos.
- Herramientas:
- Map Reduce.
- Pig, Hive, Flume.
- Sqoop, Oozie.
- Automatización de Jobs.
- Consultas Pig y Hive.
- Otras herramientas.
- Generación de mecanismos de Integridad de los datos. Comprobación de mantenimiento de sistemas de ficheros:
- Calidad de los datos.
- Comprobación de la integridad de datos de los sistemas de ficheros distribuidos. Sumas de verificación.
- Movimiento de datos entre clusters. Actualización y migración. Metadatos.
- Monitorización, optimización y solución de problemas:
- Herramientas de monitorización: Interfaz web del Jobtracker y Namenode, entre otras.
- Análisis de los históricos.
- Monitorización del clúster: Ganglia, entre otros.
- Validación de técnicas Big Data en la toma de decisiones en Inteligencia de negocios BI:
- Modelos de Inteligencia de negocios.
- Proceso del modelo KDD (Knowledge Discovery in Databases).
- Etapas: Selección, limpieza, transformación de datos, minería de datos, interpretación y evaluación de datos.
- Implantación de modelos de inteligencia de negocios BI.
- Técnicas de validación de modelos BI.