alt text Photo by Esther Ann on Unsplash

1. Introducción

En este artículo analizaremos la previsión de jubilaciones entre el personal de la Universidad. Para ello, identificaremos el año en el que cada empleado cumple la edad teórica que permite la jubilación (65 años, si bien en el caso de los docentes, la jubilación puede retrasarse hasta los 70).

El análisis lo haremos para la Universidad Complutense de Madrid (UCM), utilizando para ello los datos abiertos que la UCM ha publicado en UniversiDATA.

1.1 Objetivos

Lo primero que debemos hacer es marcarnos el destino: ¿A dónde queremos llegar? ¿Qué tipo de preguntas queremos responder? En el caso que nos ocupa las preguntas son:

  • ¿Cómo son las distribuciones de edad de los distintos tipos de personal de la Universidad?

  • ¿Cuántas jubilaciones se esperan en los próximos años? ¿Qué impacto representan?

1.2 Recursos de datos a utilizar

Es esencial, antes de plantear cualquier análisis de datos, conocer bien la estructura y semántica de los datasets que se van a utilizar.
En este caso, para llevar a cabo nuestro análisis utilizaremos los siguientes recursos, que nos proporcionan toda la información de base que necesitaremos para hacer nuestro análisis:

2. No tan deprisa: el pre-análisis de los datos de partida

Tras informarnos de la estructura y semántica de los datasets, es necesario hacer un análisis exploratorio de los contenidos en los mismos, con el fin de conocer la realidad de los datos a los que nos enfrentamos, sobre todo para poder detectar posibles peculiaridades, consideraciones o errores que pudieran afectar a la calidad de los resultados de nuestro análisis. Salvo en datasets muy muy sencillos, lo habitual es que siempre haya peculiaridades que hay que tener en cuenta.

2.1 ¿Tiene impacto la anonimización para este estudio?

Es muy importante tener en cuenta que - para poder ser ofrecidos al máximo nivel de detalle - estos datasets están anonimizados, lo cual tiene ciertas implicaciones que hay que conocer para poder hacer un análisis correcto. En concreto, hay que consultar cual es el “diferencial de privacidad”, es decir, las posibles pérdidas que los datos hayan podido sufrir como consecuencia de los procesos de anonimizacion. Consultando la documentación, vemos que en nuestro caso:

  1. Las dos variables que vamos a necesitar relacionar ( “Año de nacimiento” y “Unidad responsable”, para realizar agrupaciones en el caso de los PDI) conservan su relación intacta, puesto que la segunda pertenece a las variables “pivote” del dataset. Ningún problema en este aspecto entonces.

  2. En los datasets se reporta tanto personal “en servicio activo” como personal en otras situaciones administrativas (excedencias, suspensiones de contrato, licencias de estudios, etc.). Lo ideal sería incluir en este análisis sólo al personal en servicio activo, pero debido a que los campos que contienen el año de nacimiento y la situación administrativa pertenecen a grupos de coherencia diferentes (como se puede observar en la documentación), no podemos utilizar uno de ellos para filtar el otro, ya que al anonimizar su relación se ha perdido: en la mayoría de los casos estos dos datos perteneceran a individuos distintos para garantizar la anonimidad. Por tanto, el análisis incluirá al 7,2% de empleados PAS y al 2,7% de los empleados PDI que aparecen en los datasets pero no estaban en servicio activo a 31 de diciembre de 2018.

  3. Como resultado de los procesos de anonimización, en 127 de los 6.092 empleados PDI reportados (un 2,1%) no aparece el dato de unidad responsable.

Consideración 1

Impacto de los procesos de anonimización en nuestro estudio:

  • En los análisis de PDI y de PAS se van a considerar todos los empleados recogidos en los datasets, independientemente de su situación administrativa, y por tanto se incluyen en el análisis al 7,2% de empleados PAS y al 2,7% de empleados PDI que no estaban en servicio activo a 31 de diciembre de 2018.
  • En el análisis del PDI, a 127 de los 6.092 empleados (un 2,1%) no se les puede asignar unidad responsable, y por tanto se excluirán de los análisis que requieran este dato.

2. ¿Cómo son las distribuciones de edad de los distintos tipos de personal de la Universidad?

A continuación vamos a hacer un primera representación gráfica usando diagramas de cajas para hacernos una idea de las distribuciones de edades de cada tipo de personal, y poder compararlas entre sí. El dato que se representa es la edad de los empleados en el año 2020:

El diagrama de cajas ya nos muestra con claridad y en un primer vistazo nuestro primer hallazgo :

HALLAZGO 1:

El personal PAS y PDI tienen distribuciones de edad bastante similares - centradas en torno a los 54/55 años - mientras que el personal de Investigación (PI) presenta una población mucho más joven - centrada en torno a los 30 años.


En los siguientes apartados, analizaremos más en detalle a cada uno de los tres tipos de personal.

2.1 Personal de Administración y Servicios

Analizemos con detalle la previsión de jubilaciones en el PAS mostrando un histograma que muestra el nº de empleados que cumplen 65 años en cada año natural:


El histograma nos muestra un incremento abrupto y generalizado de jubilaciones a partir del año 2020, alcanzando el máximo en el año 2028, con 195 empleados que alcanzan la edad de jubilación ese año, lo cual constituye nuestro segundo hallazgo:

HALLAZGO 2:

En el año 2020 el PAS inicia un periodo de varios años en los que se produce un incremento generalizado en el número de jubilaciones previstas.


2.2 Personal Docente e Investigador

Analizemos con detalle la previsión de jubilaciones en el PDI mostrando un histograma que muestra el nº de empleados que cumplen 65 años en cada año natural:

Al igual que en el caso del PAS, el histograma nos muestra un incremento abrupto y generalizado de jubilaciones a partir del año 2020, alcanzando el máximo en el año 2031, con 235 docentes que alcanzan la edad de jubilación ese año, lo cual constituye nuestro tercer hallazgo:

HALLAZGO 3:

En el año 2020 el PDI inicia un periodo de varios años en los que se produce un incremento generalizado en el número de jubilaciones previstas.


2.2.1 ¿Cuál es la incidencia por Departamentos?

En el caso del PDI es interesante analizar la incidencia de las jubilaciones en los departamentos. Para ello mostraremos un mapa de calor en el que el eje vertical representa los distintos departamentos (ordenados alfabéticamente de abajo a arriba), y el eje horizontal los años naturales. El color de cada recuadro representa el número docentes que alcanza la edad de jubilación en ese departamento y ese año. La línea vertical naranja representa el año 2020. Podemos ver los datos de cada recuadro pasando el cursor del ratón por encima de la gráfica (el valor “x” representa el año, el valor “y” el departamento, y el valor “z” el número de empleados de ese departamento que alcanzan la edad de jubilación ese año):


En la gráfica podemos observar, por ejemplo, cómo destaca el Departamento de Medicina con un número de jubilaciones continuado y muy por encima del resto de departamentos a partir de 2019. Sin embargo, no es de extrañar, al ser el departamento más numeroso de toda la Universidad.

Para valorar correctamente la incidencia de las jubilaciones en cada departamento, es necesario tener en cuenta el tamaño de cada uno de ellos. Para ello mostraremos un nuevo mapa de calor en el que el eje vertical representa los distintos departamentos, y el eje horizontal los años naturales. El color de cada recuadro representa el porcentaje de docentes que habrán alcanzado la edad de jubilación ese año o años anteriores, respecto al total de empleados que no la habían alcanzado aún en el año 2018 (recordemos que el dataset elegido refleja la situación a 31/12/2018). En este caso los departamentos están ordenados de mayor a menor porcentaje de jubilaciones en el horizonte temporal de 5 años (año 2025). Al igual que en la gráfica anterior, podemos ver los datos de cada recuadro pasando el cursor del ratón por encima de la gráfica (el valor “x” representa el año, el valor “y” el departamento, y el valor “z” el porcentaje de docentes de ese departamento que ya habrán alcanzan la edad de jubilación ese año o años anteriores):


En la gráfica podemos observar cómo el departamento que menos incidencia de jubilaciones previstas tendrá en el plazo de 5 años es el Departamento de Arquitectura de Computadores y Automática (apenas un 2% del personal existente en 2018 habrá alcanzado la edad de jubilación en 2025), y que el departamento con mayor incidencia de jubilaciones previstas en el plazo de 5 años es el Departamento de Derecho Romano e Historia del Derecho, con el 50% del personal existente en 2018 habiendo alcanzado la edad de jubilación en 2025.

2.3 Personal exclusivamente Investigador (PI)

Analizemos con detalle la previsión de jubilaciones en el PI mostrando un histograma que muestra el nº de empleados que cumplen 65 años en cada año natural:

En este caso, el histograma confirma lo que ya anticipábamos al examinar el diagrama de cajas: la edad del colectivo de Personal Investigador es muy inferior a la de los colectivos de PAS y PDI, lo cual constituye nuestro cuarto hallazgo:

HALLAZGO 4:

En el colectivo de Personal Investigador no hay apenas volumen de jubilaciones ni a corto ni a medio plazo.


5. Para terminar…

En este análisis hemos utilizado los datasets con información detallada del personal de la UCM en el año 2018 para calcular y analizar un dato relevante como es la edad prevista de jubilación.

No olvide que puede plantearnos cualquier duda, corrección, comentario, petición, etc. en los comentarios a continuación, para los cuales no es necesario registro previo

¡Gracias por su atención!