En esta fase del proyecto, a partir de análisis requeridos, de fuentes de datos proporcionadas, del modelo multidimensional propuesto inicialmente, Infraestructura Visible le solicita realizar el proceso ETL que permite cargar las fuentes de datos que ellos proveen, a la base de datos construida con el modelo multidimensional que usted propone. El detalle de los productos esperados está detallado en la sección entregables.

A continuación, se presentan los análisis propuestos por ellos y los datos requeridos para que usted seleccione los que requiera y logre los objetivos de esta tarea.

Tema analítico

Análisis requeridos o inferidos

Categoría del análisis - Tablero de control, análisis OLAP, Minería de datos

Procesos de negocio

Fuentes de datos y datos

Cobertura y comportamiento de vuelos y aeropuertos en Colombia

Visualizar el número de pasajeros transportados en un rango de fechas de aeropuertos Internacionales a Colombia

Tablero de control

Cobertura, Tráfico y capacidad de carga aérea en aeropuertos de Colombia

Aeropuertos, Aeropuertos Histórico

Visualizar la carga transportada en un rango de fechas de aeropuertos Internacionales a Colombia

Tablero de control

Cobertura, Tráfico y capacidad de carga aérea en aeropuertos de Colombia

Aeropuertos, Aeropuertos Histórico

Visualizar la carga desaprovechada en un rango de fechas de aeropuertos Internacionales a Colombia

Tablero de control

Cobertura, Tráfico y capacidad de carga aérea en aeropuertos de Colombia

Aeropuertos, Aeropuertos Histórico

Visualizar el número de puestos desaprovechados en un rango de fechas de aeropuertos Internacionales a Colombia

Tablero de control

Cobertura, Tráfico y capacidad de carga aérea en aeropuertos de Colombia

Aeropuertos, Aeropuertos Histórico

Visualizar el porcentaje de cobertura Internacional, por rango de fechas, nacional o regional por departamentos de Colombia

Tablero de control

Cobertura, Tráfico y capacidad de carga aérea en aeropuertos de Colombia

Aeropuertos, Aeropuertos Histórico, Cobertura por centro poblado

Visualizar el número de pasajeros transportados en un rango de fechas de aeropuertos Nacionales de Colombia

Tablero de control

Cobertura, Tráfico y capacidad de carga aérea en aeropuertos de Colombia

Aeropuertos, Aeropuertos Histórico

Visualizar la carga transportada en un rango de fechas de aeropuertos Nacionales de Colombia

Tablero de control

Cobertura, Tráfico y capacidad de carga aérea en aeropuertos de Colombia

Aeropuertos, Aeropuertos Histórico

Visualizar la cantidad de pasajeros salientes y entrantes a través del tiempo por departamentos de Colombia

Tablero de control

Cobertura, Tráfico y capacidad de carga aérea en aeropuertos de Colombia

Aeropuertos, Aeropuertos Histórico

Visualizar la cantidad de carga aérea saliente y entrante a través del tiempo por departamentos de Colombia

Tablero de control

Cobertura, Tráfico y capacidad de carga aérea en aeropuertos de Colombia

Aeropuertos, Aeropuertos Histórico

Visualizar la relación entre las características de infraestructura de cada aeropuerto y el número de vuelos

Tablero de control

Tráfico y capacidad de carga aérea en aeropuertos de Colombia

Aeropuertos cambios infraestructura

Con estos análisis ellos quieren respuestas para:

1. El número de pasajeros transportados en un rango de fechas de aeropuertos Internacionales a Colombia.

2. La carga transportada en un rango de fechas de aeropuertos Internacionales a Colombia.

3. La carga desaprovechada en un rango de fechas de aeropuertos Internacionales a Colombia.

4. El número de puestos desaprovechados en un rango de fechas de aeropuertos Internacionales a Colombia.

5. El número de pasajeros transportados en un rango de fechas de aeropuertos Nacionales de Colombia.

6. La carga transportada en un rango de fechas de aeropuertos Nacionales de Colombia.

7. La cantidad de pasajeros salientes y entrantes a través del tiempo por departamentos de Colombia.

8. La cantidad de carga aérea saliente y entrante a través del tiempo por departamentos de Colombia.

En el siguiente repositorio puede encontrar los archivos de datos requeridos para el desarrollo de esta tarea, los datos de vuelos comprenden los periodos de tiempo entre 2010 y 2013 y la información de aeropuertos es de todos aquellos construidos antes de 2013

https://github.com/MIAD-Modelo-Datos/Recursos/tree/main/Infraestructura%20visible/Etapa%201

Datos suministrados

Tecnología

Recuerde que está el tutorial de "Construcción de ETL sin historia", que será de utilidad para el desarrollo de esta tarea. Este tutorial utiliza la tecnología Pyspark.

Adicionalmente, se le sugiere utilizar una herramienta como GenMyModel para dibujar el modelo y generar las sentencias de creación de la base de datos. Este tipo de herramientas facilita el mantenimiento de los modelos de datos.

Usted debe crear una sección en su wiki, en la cual incluya:

  1. Entregable1. El modelo multidimensional que permite realizar los análisis propuestos y justificar sus decisiones. Suponga como procesos: RegistroDeVuelos.
  1. Parte1. Diagrama del modelo multidimensional
  2. Parte2. Descripción del modelo multidimensional
  3. Parte3. Los scripts de creación de las tablas
  1. Entregable2. Proceso ETL
  1. Parte1. Definir, desarrollar y justificar un proceso de ETL para cargar la información al modelo propuesto.
  2. Parte2. Mostrar el estado final de la base de datos, con estadísticas sobre filas y columnas de las dimensiones y tablas de hecho y, con ejemplos de los registros insertados en cada una de ellas.
  3. Parte3. Código asociado al proceso ETL
  1. Entregable3. Generar y mostrar la nueva versión del tablero de control, que toma los datos de la base de datos creada con su modelo multidimensional.
  1. Parte1. Incluir imágenes del tablero de control adaptado, indicando los cambios realizados.
  2. Parte2. Publicar el tablero (si puede hacerlo desde Power BI e indicar la Url donde se pueda consultar). En caso contrario exportar el tablero construido y los datos finales utilizados para el tablero. Estos datos pueden estar en un csv o como un backup de la base de datos cargada.

Criterios de evaluación