miércoles, 27 de mayo de 2020

los cuarentena principales (34)

El otro día, en pleno confinamiento, se me ocurrió hablar del EGM a través de la curva de evolución del coronavirus en España. Porque claro, de repente los datos subían, bajaban, volvían a subir, que en tal comunidad han cogido mal los datos pero han añadido en otro lado los de otro día... Todas esas cosas. 

También ha sido sorprendente eso de que cuando estuviéramos de bajada, de repente hubiera un dato mucho más alto que los anteriores y se dijera que eso era un repunte cuando en realidad no lo era... Y claro, esto es muy parecido a lo que ocurre con el EGM, solo que con el EGM son datos que se cogen y escogen cada 3 meses... Pero lo que pasa, aunque realmente no es igual, podemos jugar a que son cosas homólogas. 

Vamos a ver cómo estaba la curva del virus, más concretamente de los muertos, a día 22 de mayo. Pillo la gráfica que salía en la página de SER: 

¿Veis? De alguna manera en vuestras cabezas veis una subido muy rápida y un decaimiento más o menos lento. 

Imaginad que esto fueran datos del EGM y en vez de 5 días seguidos fueran 5 oleadas seguidas. Imaginad que pasáis de un subidón tremendo a un bajón tremendo. ¿Eso quiere decir que haya pasado algo necesariamente para que los datos suban o bajen? No. Podremos decir que los datos están por esas cantidades de manera segura, y sabemos la tendencia que dibujan: si van para arriba, para abajo, a qué velocidad, o si se mantienen. 

Por eso yo hace mil trillones de años en el blog no pongo líneas que engarcen este tipo de datos. Sé que queda muy raro, que la gente no está acostumbrada, y parece como si fueran datos a los que les falta algo. Bueno... Pues vamos a ver este gráfico y, en vez de líneas unidas, que no se entiende muy bien por mucho que lo hagan en los medios de comunicación, lo vamos a hacer igual que pongo los datos del EGM en las distintas oleadas. Nos quedaría esta otra imagen. 

¿Veis? Los datos son exactamente los mismos, pero vuestra mente dibuja más claramente la línea. Sabéis que la línea es la que atraviesa la nube de puntos, y sabéis que es exactamente la realidad es la que pasa entre ellos. 

Si lo ponemos así, empezamos a no cuestionarnos cómo es que en plena bajada, un día eran 288, al día siguiente 331, al otro 301 y al otro 325 y podemos seguir diciendo que estamos de bajada. 

Lo mismo pasa con el EGM... Que dan un par o tres datos consecutivos y hay veces que podemos saber que eso está de subida o bajada... ¿Cómo es posible? Porque pasa como con estos datos. Es como cuando dicen que tal cadena por fin sube, cuando realmente sigue fatal. Como pasaba con Máxima FM o con Radio Marca. Yo entiendo a los profesionales de la radio que tienen la sensación de que un programa sube o baja y luego el dato no coincide con su percepción. Si miras los datos de lejos queda mucho más claro y se dejan de ver esos puntos y pasan a ser simples puntos que se acercan a la gráfica real. Lo que suelo hacer una vez tenemos esos puntos, es que yo dibujo la línea con la ecuación matemática que más se acerca a todos los puntos a la vez. Unos puntos se van por arriba y otros por abajo. 

Mucha gente se queja porque de repente un programa sube, de repente baja... Que si justo les da tal oleada porque no sé qué, que si menos porque no sé cuál... Y al final simplemente tenemos una distribución de datos que, obviamente, como son datos experimentales tienen un error, pero que dibujan lo que hay. 

He escogido los datos de muertos oficiales, dado que están cogidos con un mismo criterio. Pero para el radiochip de hoy, del «A Vivir...», es de cuando a mitad de abril estuvieron hablando de datos de contagiados por el virus y de su controversia, de matemáticas... Radiochip vírico: 



Así que si con datos tan claros y tangibles como el número de muertos por tal razón tenemos una curva cuyos datos puntuales están por encima o debajo de una determinada curva, imaginaos con una encuesta... ¿Quiere decir eso que por que los datos bailen está mal la curva o está mal el número aproximado que esperamos? No. ¿Que existe un error? Por supuesto. Pero si vemos los datos desde fuera, en conjunto, nos parece todo muy lógico. Pues eso. 

2 comentarios:

  1. Y otra cosa: sin ser yo un talibán anti-gráficos no empezados en 0 (ni mucho menos), se han echado mucho de menos en esta pandemia. Solo el Financial Times, que yo sepa, los ha dibujado. Los datos oficiales, ni de broma; aunque dado el despiporre de estos últimos días, como para pedirles empezar un gráfico en 0.

    ResponderEliminar
    Respuestas
    1. Se han echado de menos los gráficos empezados en 0, que con tanta negación me lío.

      Eliminar