La portada de mañana
Acceder
La falta de control de los poderes del Estado sobre la Corona favorece el hermetismo de los movimientos del rey emérito
Entrevista - Ian Gibson: "Es lamentable que Juan Carlos I nunca condenara el régimen franquista"
Opinión - Los dueños de los datos, por Ignacio Escolar

Sobre este blog

Ciencia Crítica pretende ser una plataforma para revisar y analizar la Ciencia, su propio funcionamiento, las circunstancias que la hacen posible, la interfaz con la sociedad y los temas históricos o actuales que le plantean desafíos. Escribimos aquí Fernando Valladares, Raquel Pérez Gómez, Joaquín Hortal, Adrián Escudero, Miguel Ángel Rodríguez-Gironés, Luis Santamaría, y Silvia Pérez Espona

¿Sabemos cómo ha cambiado el número de afectados por la COVID-19 en España a lo largo del tiempo?

Un profesional sanitario realiza su trabajo con enfermos de la COVID -19 en la UCI del hospital del Mar de Barcelona

En la Gran Barrera de Coral australiana, las diferentes islas están habitadas por distintas especies. El anteojillos dorsigrís (Zosterops lateralis chlorocephalus), un pequeño paseriforme, colonizó Heron Island desde el continente australiano hace unos tres o cuatro mil años. Hoy en día, los individuos de mayor tamaño viven más tiempo y tienen más crías que los más pequeños, por lo que los individuos de esa población son cada año más grandes – existe lo que en ecología evolutiva llamamos un 'gradiente de selección positivo' para el tamaño corporal.

Al comparar las poblaciones de una misma especie, podemos encontrar que su tamaño medio es mayor en islas que en el continente. Este fenómeno, conocido como gigantismo insular, suele achacarse a la ausencia de predadores y a la mayor importancia de la competencia intraespecífica en las islas, y parece ajustarse bien al patrón encontrado en Heron Island. Lo sorprendente es que, tras tres o cuatro mil años, el tamaño medio de los individuos siga aumentando. Si hubiera aumentado al ritmo actual todo este tiempo, hoy día este pajarillo debería ser más grande que una paloma. ¿Cómo resolvemos esta paradoja? ¿Acaso cambios ambientales recientes favorecen un tamaño corporal algo mayor y han vuelto a poner en marcha un proceso que llevaba miles de años latente?

Los investigadores han podido concluir que no es éste el caso. La población de anteojillos dorsigrís de Heron Island es objeto de estudio desde los años sesenta. Desde entonces, el tamaño corporal medio sigue un patrón en dientes de sierra: aumenta lentamente año tras año, para descender bruscamente de vez en cuando. El aumento gradual es probablemente resultado de la competencia intraespecífica. Las caídas bruscas son consecuencia de ciclones, que diezman la población, ensañándose particularmente con las aves de mayor tamaño. Al volver a crecer la población, vuelve a iniciarse el ciclo.

Las series temporales de datos son de enorme importancia en ecología y evolución. Una plétora de fenómenos, muchos de ellos de gran importancia práctica en la conservación de biodiversidad y la gestión de los recursos naturales, sólo pueden entenderse a través de estudios longitudinales en los que se monitorean ciertos indicadores o variables clave (a menudo, una especie o población) año tras año. El caso más claro son los fenómenos cíclicos, como los ciclos poblacionales de topillos y lemmings, los ciclos de producción sincrónica de semillas ('masting'), o los brotes de plagas forestales - por citar los más conocidos. Estos fenómenos, que a menudo tienen consecuencias muy importantes sobre los ecosistemas, la producción agraria y forestal, o la salud animal y humana, sólo pueden estudiarse, por la naturaleza misma del fenómeno, a partir de series largas de datos.

Las series temporales de datos resultan esenciales, también, en epidemiología. No siempre tienen que ser muy prolongadas. Muchos parásitos y patógenos tienen ciclos de vida muy cortos, que les permiten comprimir varias generaciones en un solo día, por lo que los fenómenos demográficos y evolutivos más relevantes para entender el curso de una enfermedad pueden revelarse en el curso de semanas o meses. En contrapartida, necesitamos mucha mayor resolución temporal. No podemos tomar una medición al año, sino que debemos aumentar la frecuencia de las observaciones.

En epidemiología, las series temporales de datos tienen distintos usos, entre los que mencionaremos dos. En primer lugar, pueden usarse para crear modelos que nos ayuden a predecir el desarrollo de futuros brotes de la enfermedad: un modelo incapaz de reproducir el desarrollo de epidemias pasadas tendrá, probablemente, escaso valor predictivo. En segundo lugar, pueden usarse para inspeccionar el desarrollo de un brote activo, evaluando la efectividad de las medidas implementadas. Comparando el transcurso de la enfermedad antes y después de implementar una medida, es posible determinar hasta qué punto la medida ha contribuido a frenar la expansión de la enfermedad, si será efectivo prolongarla en el tiempo, y cuándo podrá cesar su aplicación. Obviamente, esto sólo es posible si los datos son representativos y coherentes.

Para que los datos resulten útiles no es necesario que sean completos. Ni siquiera es necesario tener datos sobre la mayoría de la población (aunque cuanto más completos son los datos, más fácil es trabajar con ellos). Lo que sí es esencial es que los datos sean representativos – si la enfermedad afecta a todos los individuos y sólo tenemos datos para niños de menos de siete años, difícilmente vamos a poder entender lo que ocurre en la población – y que tengan coherencia interna: es decir, el dato para el día tres desde el comienzo de la epidemia debe significar lo mismo que el dato para el día catorce. Si el método utilizado para tomar datos cambia a lo largo del tiempo, sin que podamos saber qué datos habríamos obtenido manteniendo el criterio inicial, los datos resultan incomparables y la serie de datos carece de valor – aunque el método utilizado para tomar datos haya ido mejorando a lo largo del tiempo.

Los ecólogos se dieron cuenta de este problema hace tiempo, y por eso hicieron un esfuerzo importante para conseguir registrar datos a largo plazo, en una red amplia y representativa – que comenzó en EEUU, y se extendió desde allí a Europa y al resto del mundo. Se trata de la red de Seguimiento Ecológico a Largo Plazo (conocida por su acrónimo en inglés, LTER). Está formada por nodos que aportan mediciones de al menos una década, se comprometen a mantenerlas y ofrecerlas públicamente durante muchos años más, y trabajan de forma conjunta para estandarizarlas y asegurar su coherencia.

Redes similares, aunque mucho más estrictas y mejor organizadas (y financiadas), dada la importancia vital que tienen, existen también para el seguimiento médico y epidemiológico. Un excelente ejemplo es la red de vigilancia y seguimiento de la gripe (Global Influenza Programme, GIP), coordinada a nivel global por la OMS. La coordinada en todo EEUU por el CDC, que es modélica, recopila datos de forma estandarizada y los ofrece de forma rápida y didáctica a través de su página web.

Todos estos precedentes hacen más sorprendentes si cabe las limitaciones, retrasos – y, sobre todo, los bandazos que ha experimentado el seguimiento actual de la pandemia de la COVID-19. La serie inicial de datos en España, centralizados por el gobierno a partir de la información recopilada por las comunidades autónomas, era sencilla pero cumplía razonablemente su función. El número de casos detectados subestimaba claramente el número total, ya que por motivos logísticos (la capacidad de realizar tests era limitada) y médicos (el objetivo principal de los tests realizados no era epidemiológico, sino diagnóstico), no se realizaban tests a todos los potenciales infectados. Pero, mientras se mantuvo un criterio razonablemente estable, podía esperarse que la proporción de infecciones que llegaban a detectarse fuera constante, y que la evolución del número de casos detectados fuera un buen indicador de la del número de infecciones totales. Un razonamiento similar podía hacerse sobre el número de casos activos, una variable clave para evaluar el potencial de infección en cada momento.

De forma similar, el número de fallecimientos tenía problemas de representatividad, ya que no había recursos para realizar tests confirmatorios a todos los fallecidos, pero no necesariamente de consistencia. El registro de los fallecidos que habían sido testados a su llegada al hospital, complementado por el registro de los fallecidos que presentaban sintomatología coherente con la COVID-19, debería ser suficientemente consistente para representar adecuadamente la evolución (aunque no la extensión exacta) de la pandemia.

En las últimas semanas, sin embargo, se ha producido un desbarajuste en la toma, centralización y presentación de los datos descritos. La adquisición de tests de PCR adicionales, así como la inclusión de tests rápidos (basados en la detección de antígenos del virus) con distintas funciones y significados, ha hecho que se generalice mucho el número de personas a las que se les aplica, de forma que la detección ha dejado de estar restringida a poco más que los enfermos severos u hospitalizados. A esto se suma la aplicación de un nuevo sistema de detección (los tests serológicos, basados en la detección de anticuerpos IgM e IgG en sangre) de carácter totalmente distinto a los anteriores, ya que sirven principalmente para detectar individuos que ya están cursando el pico de la infección (IgM), la están superando o han superado por completo (IgG). Esto no debería ser un problema si se hubiera organizado la adquisición, tratamiento y presentación de datos de forma que quedaran bien diferenciadas las tres categorías de casos detectados. Pero esta diferenciación no sucedió desde el principio, y sólo sucede parcialmente a día de hoy.

Más sorprendente aún es la aparición de inconsistencias graves en la serie de datos de fallecimientos. De repente, varias comunidades han reconocido que habían sido incapaces de reportar al gobierno central los fallecimientos fuera de hospitales, en residencias y domicilios – y han presentado de golpe cifras agregadas que sumaban miles de nuevos fallecimientos a los conocidos hasta entonces. O el cambio de criterio en la forma de reportar los hospitalizados e ingresados en UCIs en varias Comunidades Autónomas, que pasaron de proporcionar el número de personas ingresadas en ese día a proporcionar el número de casos acumulados a partir del 11-12 (Castilla La Mancha), 17 (Castilla León), 26 (Madrid) y 28 (Galicia) de abril.

Una de las principales causas de estos problemas es la inconsistencia continuada en la forma de reportar los datos de la Comunidad Madrid. Aunque está siendo la comunidad que más casos diarios aporta todavía, realiza un truco contable para aparentar que estos son muchos menos - una argucia que el médico y vicepresidente de Castilla-León, Francisco Igea, ha calificado de 'hacerse trampas al solitario'. El truco consiste en reportar tan solo parte de esos casos en el boletín sanitario correspondiente a esa fecha (el del día siguiente), que es además el utilizado por el Ministerio para ofrecer las cifras oficiales. Esa cifra se aumenta paulatinamente, en cantidades pequeñas, en los boletines de los días siguientes - de forma que la única manera de poder obtener el valor real del número de casos de Madrid es obtener dichos boletines y sumar los datos aparecidos durante los 2-3 días que siguen a cada fecha. Este problema se ve agravado por la actitud del Ministerio que, en lugar de obligar a la Madrid a estandarizar sus datos como el resto de las comunidades, ha decidido limitarse a incluir en su informe diario los datos que le envía la Comunidad de Madrid cada día indicar con un * y una anotación técnica que, en esencia, los datos de la Comunidad de Madrid son incorrectos.

El resultado es el que se puede apreciar en la gráfica. Las series temporales, que presentaban una tendencia bastante estable a lo largo de los últimos días, cambian a partir del 14-15 de abril – fecha en la que se decide, precisamente, suavizar el confinamiento decretado el 30 de marzo. Aunque algunos de los datos (como los casos activos y las recuperaciones) sugieren un repunte puntual que se estabiliza después, y que podría deberse sobre todo a la detección de casos ya resueltos, también se aprecia un repunte persistente de los casos totales y fallecimientos – para el que sería muy importante aclarar la causa.

Todo esto es más grave aún porque, como indican las fechas, hay un retraso en la respuesta a los cambios en las normas de confinamiento (debido al período de incubación del virus, puede ser de 10 días para las detecciones y 21 para los fallecimientos, en promedio), lo que hace que las decisiones actuales de relajar el distanciamiento social se estén tomando antes de poder evaluar el impacto de las medidas anteriores (tanto la finalización del confinamiento severo el 13A, como las medidas de relajación posteriores del 25A, o el desconfinamiento progresivo que empieza esta semana). Y que vayamos a tardar entre dos y tres semanas en apreciar sus consecuencias. Si no corregimos el ruido que se ha introducido en las series de datos, estaremos decidiendo a ciegas. En el peor de los casos estaríamos yendo hacia atrás en la lucha por el control de la epidemia.

En esta imagen (Figura 1), se puede observar la evolución del número de casos detectados (por PCR y por PCR+serología), recuperaciones (enfermos dados de alta), fallecimientos y casos activos en España. Las flechas indican el momento en el que los casos correspondientes a la fecha de infección (indicada sobre la flecha) se han observado, en promedio, en forma de detecciones, fallecimientos o recuperaciones. La línea discontinua indica el cambio abrupto en las series de datos que tuvo lugar el 14-15A. Los círculos representan datos reales, las líneas continuas representan la evolución esperada previamente al cambio abrupto de las series de datos (esto es, en base a curvas ajustadas con los datos anteriores al 14A).

Datos procedentes los informes diarios del Ministerio de Sanidad, recopilados parcialmente por eldiario.es.

En la elaboración de este artículo han participado Luis Santamaría, Raquel Pérez Gómez y Joaquín Hortal junto al autor principal, Miguel Ángel Rodríguez-Gironés.

Sobre este blog

Ciencia Crítica pretende ser una plataforma para revisar y analizar la Ciencia, su propio funcionamiento, las circunstancias que la hacen posible, la interfaz con la sociedad y los temas históricos o actuales que le plantean desafíos. Escribimos aquí Fernando Valladares, Raquel Pérez Gómez, Joaquín Hortal, Adrián Escudero, Miguel Ángel Rodríguez-Gironés, Luis Santamaría, y Silvia Pérez Espona

    Autores

Etiquetas
Publicado el
19 de mayo de 2020 - 23:10 h

Descubre nuestras apps

stats