Preguntas Frecuentes

A continuación aparecen las preguntas más frecuentemente planteadas por los usuarios, junto con sus respuestas. Si su pregunta no aparece, no dude en plantearla en los comentarios al final de la página (son anónimos y no requieren registro) o escribiéndonos directamente.

¡Gracias!

FAQs: 
No puedo acceder a UniversiDATA desde mi institución, pero sí desde fuera: ¿Por qué?

Lo más probable es que su institución esté bloqueando internamente la IP 23.185.0.1.

Con ello estarán bloqueando no sólo UniversiDATA, sino algo más de 40.000 webs lícitas de distintas organizaciones que comparten esa misma IP (por poner un ejemplo, la universidad de Harvard - harvard.edu - ), al ser todos clientes del mismo proveedor de hosting.

Cuando esto ocurre el motivo suele ser que esa IP ha aparecido temporalmente en alguna "lista negra" de envío de spam, y hay sistemas de seguridad de algunas Universidades que cuando detectan esto, bloquean automáticamente la IP. En ese caso es necesario que los administradores de red habiliten manualmente una excepción para permitir el acceso a la IP 23.185.0.1 .

¿Cómo puedo saber cuándo será la próxima actualización de datos de un determinado dataset?

La frecuencia de actualización es uno los metadatos publicados en la página de cada dataset. En el portal de documentación del Núcleo Común se incluye además, en la descripción detallada de cada dataset, el periodo concreto de actualización (el mes concreto, por ejemplo, si se trata de frecuencia anual), y adicionalmente, publicamos un calendario que se actualiza cada mes y que muestra visualmente las actualizaciones que van a tener lugar en los próximos 12 meses.

He escrito un comentario en una de las páginas pero no aparece: ¿Por qué?

El comentario está seguramente a la espera de ser revisado por los moderadores; para facilitar la participación al máximo, en UniversiDATA se permiten los comentarios anónimos. Esto implica que todos los comentarios deban ser moderados, es decir, revisados y autorizados explícitamente por un administrador, para evitar el abuso de esta funcionalidad con fines ajenos al portal y a sus usuarios legítimos. Tras enviar su comentario (botón "Guardar"), ud. ha debido ver un mensaje como el siguiente:

Habitualmente, durante horario de oficina y dependiendo del volumen, los comentarios son revisados y, en su caso, publicados antes de una hora desde su envío. Si ud. no ve publicado su comentario en un plazo razonable puede ponerse en contacto con nosotros para que analicemos el motivo.

Estoy analizando un dataset anonimizado y no sé si llego a entender bien el proceso de anonimización. ¿Es mi análisis correcto?

El proceso de anonimización está descrito en esta página. Para entender el impacto concreto del proceso en un dataset determinado debe conocer dos datos clave respecto a las columnas/variables del dataset:

  1. Cuáles son las variables pivote en ese dataset
  2. Cuáles son los bloques de coherencia en ese dataset

Esa información se muestra en el apartado 4 (Anonimización del dataset) de la definición de cualquier dataset anonimizado (ejemplo), como se muestra en la siguiente captura (resaltado en rojo), obtenida de la definición del dataset de personal PAS:

Captura de la pantalla de definición de un dataset
Definición de un dataset: apartado relativo a los datos de anonimización

Las reglas a tener en cuenta para interpretar correctamente los datos de una fila determinada son las siguientes:

  • Para una fila, el dato en cualquier variable pertenece al mismo individuo que los datos en las variables pivote
  • Para una fila, los datos en variables que pertenezcan al mismo bloque de coherencia se garantiza que pertenecen al mismo individuo
  • Para una fila, los datos en variables que pertenezcan a distintos bloques de coherencia NO se garantiza que pertenezcan al mismo individuo

Por tanto, el error fundamental a chequear en su análisis es si ud. está utilizando en algún cómputo (cálculo, agregación, etc.) columnas que no sean pivote y que pertenezcan a bloques de coherencia distintos, ya que en ese caso estará mezclando datos que pertenecen a individuos distintos. Ejemplos típicos de errores:

  • Hacer un cálculo usando variables no pivote de dos bloques de coherencia distintos. Ejemplos: 
    • usar dos datos de fechas que están en bloques de coherencia distintos para calcular una duración
    • usar dos datos numéricos que están en bloques de coherencia distintos para calcular una ratio
  • Agrupar por una variable no pivote y aplicar un cálculo agregado sobre otra variable no pivote que pertenece a un bloque de coherencia distinto. Ejemplo:
    • Calcular la media de la variable 1 agrupando por la variable 2, siendo ambas no pivote y perteneciendo a bloques de coherencia distintos.

En cualquier caso, si tiene dudas sobre si un determinado cálculo sobre un dataset anonimizado es correcto o no, puede ponerse en contacto con nosotros o plantear su duda en los comentarios del dataset correspondiente, y atenderemos su caso concreto.

Comentarios:

Hola, enhorabuena por la iniciativa, que me parece de un gran interés.
Mi duda tiene que ver con el proceso de anonimización, ya que en la documentación se hace referencia tanto a "grupos de coherencia" como a "bloques de coherencia"; intuyo que hacen referencia a lo mismo, pero me gustaría que me lo confirmaran y, si es posible, que usaran una terminología unificada para evitar confusiones.

Gracias.

Muchas gracias por su apreciación y por su pregunta.
Efectivamente: "bloque de coherencia" y "grupo de coherencia" se refieren a lo mismo: las agrupaciones de variables dentro de las cuales podemos estar seguros de que los valores de cualquiera de ellas pertenecen al mismo individuo.
Tomamos nota de su sugerencia e iniciamos un proceso de revisión de la documentación para unificar el término.

Gracias,

Equipo UniversiDATA.

Buenos días, simplemente informar de que hemos terminado el proceso de revisión y toda la documentación ya hace sólo referencia a "Bloques de coherencia".

Gracias de nuevo por ayudarnos a mejorar.

Equipo UniversiDATA.

¿Le han sido útiles los datos? ¿Tiene alguna duda?

Plain text

  • Saltos automáticos de líneas y de párrafos.

Importante

Para acceder al portal UniversiDATA y sus contenidos es imprescindible que usted conozca y esté de acuerdo con los siguientes puntos:

  1. Que cada uno de los conjuntos de datos publicados a través de esta plataforma está asociado a una licencia que especifica los términos bajo los cuales se permite su acceso y utilización. En la página de cada conjunto de datos la licencia asociada por el publicador está claramente especificada y enlazada en la columna izquierda, bajo la descripción de la Universidad publicadora, tal y como se muestra en la siguiente captura:

  2. License block screenshot
  3. Que es su responsabilidad como reutilizador consultar y cumplir los términos de la licencia especificada en cada caso.