Los datos de paro de los que nadie habla

Madrid,

J. E. Villarino*.- Como todos sabemos, la EPA (Encuesta de Población Activa) es la herramienta estadística que mide trimestralmente la evolución de las principales magnitudes del mercado de trabajo: paro o desempleo, población ocupada, población activa, inactivos, etc. a nivel nacional, autonómico, provincial, por sectores de actividad, sexo, etc.

El pasado jueves 24 de octubre, el INE ha hecho públicos los resultados de esta encuesta relativos al tercer trimestre de este año, poniendo de manifiesto que la cifra de paro ha sido en dicho trimestre de 5.904.700 desempleados, lo que supone un descenso de 72.800 parados menos. La tasa de paro baja, respecto de la encuesta anterior, en 28 centésimas hasta el 25,98% del total de la población activa.

En esta ocasión no se trata de traer a colación el ya manido fenómeno de la estacionalidad que afecta a datos cuya naturaleza está sujeta a cambios con una cierta periodicidad como son los datos del empleo, a los que es necesario despojar del efecto estacional, si queremos hacer comparaciones y evaluar en su justa medida la evolución de los mismos. Hoy nos vamos a referir a otra cuestión a tener en cuenta, dada la naturaleza de los datos que maneja la EPA, que, como hemos dicho, son datos muestrales.

Como encuesta que es, los datos se obtienen preguntando a un elevado número de familias de toda España y, por tanto, sus resultados están sujetos a las características y limitaciones que tienen todos los datos que, sin ser la totalidad de los posibles, pretenden representar a esa totalidad. Es decir, cuando los datos son una muestra y de las características de esa muestra pretendemos inferir características representativas de la totalidad.

El organismo encargado de confeccionar ésta y otras muchas estadísticas, la mayoría de las que se realizan en España, ya adelantamos que es el INE (Instituto Nacional de Estadística) que es un organismo serio y riguroso en el que trabajan excelentes estadísticos y especialistas.

Ahora bien, que en el INE haya excelentes estadísticos no quiere decir que la EPA no esté, efectivamente, sujeta a errores, precisamente porque es una encuesta, y toda encuesta está sometida al imperio del error estadístico. De hecho, el INE publica cada trimestre los errores de muestreo relativos para las principales magnitudes de la encuesta, si bien es cierto que no se prodiga mucho en hacerlos evidentes para el lector y los publica más bien, digamos, algo de tapadillo.

Como se demuestra en la teoría estadística, existen tres niveles de estimación, según distintos intervalos de confianza:

a) estimación ± 1 vez el error de muestreo = intervalo de confianza del 67,8%.

b) estimación ± 2 veces el error de muestreo = intervalo de confianza del 95,5%.

c) estimación ± 3 veces el error de muestreo = intervalo de confianza del 99,7%.

errores-epa-septiembre-2013-2

Si la estimación del INE del total de parados en el tercer trimestre del año ha sido de 5.904.700, con un error global de muestreo relativo del 0,87%, el doble para un intervalo de confianza, en términos de probabilidad del 95%, ello quiere decir que dos veces el error de muestreo es de 102.472 personas y 5.904.700*2*0,0087 el valor verdadero del total de parados, se encuentra en el intervalo comprendido entre 5.802.228 y 6.007.172 (esto es, 5.904.700 ± 102.472).

errores-epa-septiembre-2013-1

Pues bien, como la encuesta también nos dice que el descenso del paro global ha sido de 72.800 personas, en realidad no podemos saber si el paro real ha subido o ha descendido, ya que la cifra estimada de 72.800 parados menos es inferior a +-dos veces el error muestral, que como vimos, ha sido de +- 102.472 personas y este descenso se encuentra dentro de la horquilla del error muestral admisible.

Dicho lo anterior, si hubiésemos entrevistado y contado a todos los parados, o si alguien nos preguntase cómo ha ido el resultado del número de parados, deducidos de la última EPA publicada, le diríamo,s en plan coloquial: pues mira, con un grado de confianza del 95% en lo que te voy a decir, el número de parados se encontrará, con toda seguridad, en una cifra entre 5.802.228 y 6.007.172 personas, o lo que es lo mismo, el paro puede haber descendido hasta en -175.272 (102.472+72.800), o haber subido en 29.672 (102.472-72.800). En el bien entendido, que cabe pensar que es más probable que haya descendido el paro a que haya aumentado, ya que 72.800 está más próximo a 102.472 que a 29.672. Y estadísticamente, esto es así, ni más, ni menos.

A su vez, cuanto más desagreguemos los datos: por comunidades autónomas o provincias, o sexo, o sexo y CCAA, etc, mayor será el error muestral y mayor la incertidumbre respecto de la estimación que hagamos.

Conclusión: ¿podemos decir, entonces, como alegremente ha pregonado el Gobierno y recogido muy alegremente la mayoría de los medios, que ha descendido el paro? Pues, según lo dicho, puede que sí, puede que no. En esta ocasión, la respuesta de la ciencia estadística a nuestra pregunta, más a la gallega, imposible.

* José Enrique Villarino es economista y consultor, especialista en Transporte, y miembro del Foro del Transporte y el Ferrocarril (FTF).

Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *