• 03/08/2019 02:02

Métricas compuestas y engaño científico

 No sé usted, pero para mí esta última métrica es bastante elocuente, ¿o quizás deba decir evolocuente?

Usted llega a casa y quiere saber quién ganó el partido de fútbol que no pudo ver en el día. Enciende el televisor para ver el resumen del partido y se entera de que terminó con marcador: Azules 1 - Rojos 6. Usted se dispone a apagar la tele cuando escucha al comentarista decir ‘hoy los Azules han demostrado ser los mejores'. Seguramente –piensa usted— el comentarista se ha confundido y ha querido decir ‘Rojos' en vez de ‘Azules', pero en eso el otro comentarista toma la palabra y añade: ‘los Azules hoy demostraron gran contundencia. En la métrica compuesta de goles anotados, porcentaje de posesión del balón, pases completados, tiros de esquina y grandes atajadas del portero, los Azules superaron a los Rojos de forma estadísticamente significativa'. Usted escucha y se pregunta a quién se le ocurre semejante barbaridad de meter todas esas métricas poco relevantes en el mismo saco que la métrica ‘goles' (la más relevante de todas) para determinar quién fue mejor.

Ahora veamos un ejemplo real de esto mismo en Biomedicina. Hay un nuevo chico en la cuadra de los agentes para reducir lipoproteínas de baja densidad (LDL) en sangre, y es la clase de fármacos llamados inhibidores de PCSK9. Uno de ellos, evolocumab, ha sido sometido a ensayos clínicos, y en ellos no ha demostrado reducir muertes cardiovasculares, ni muertes por cualquier otra causa. Usted pensaría que la razón para someterse a un reductor de LDL por riesgo cardiovascular, es precisamente mitigar su riesgo de morir por causa cardiovascular, y que si el fármaco no sirve para ese propósito, pues no sirve y punto. Del mismo modo que un portero que no ataje disparos al marco no sirve. En el ensayo clínico FOURIER, el más grande e importante a que se ha sometido evolocumab, no solo no hubo reducción de mortalidad, sino que de hecho hubo más muertes en el grupo sometido al fármaco que en el de placebo (aunque la diferencia no fue estadísticamente significativa). Recuerde: no estamos hablando de un analgésico u otro fármaco que puede tener utilidad en mejorar calidad de vida, sino de un fármaco cuya razón de ser es reducir muerte cardiovascular.

Sin embargo, en el artículo correspondiente al ensayo, publicado en The New England Journal of Medicine (N Engl J Med 2017;376:1713-22), se anuncia en el resumen (el ‘abstract') en primera página que ‘comparado con placebo, el tratamiento con evolocumab redujo significativamente el riesgo primario'. La métrica primaria fue definida para dicho estudio como una métrica compuesta por ‘muerte cardiovascular, infarto de miocardio, ictus, hospitalización por angina estable o revascularización coronaria'.

El que solo lea el resumen puede llevarse la falsa impresión de que el fármaco es casi un elixir milagroso. El tratamiento con dicho elixir cuesta en EUA la friolera de casi $6mil/año. Pero no ha demostrado salvar vidas, no ha marcado más goles que el rival, de hecho anotó menos goles que el rival, sin embargo los comentaristas llenan de halagos al equipo, basándose en un compuesto de métricas en que se mezcla dos métricas altamente relevantes –mortalidad por causa cardiovascular y mortalidad por cualquier causa— en las que no hubo beneficio alguno, con otras métricas con mucha menor importancia clínica pero en las que sí hubo beneficio.

El problema con esto es descrito por los autores del artículo ‘Problemas con el uso de métricas compuestas en ensayos cardiovasculares: revisión sistemática de ensayos clínicos controlados' (BMJ 2007;334:786): ‘una interpretación ingenua de las métricas compuestas puede llevar a los médicos a sobreestimar el impacto de tratamientos en la prevención de los eventos adversos que más importan a los pacientes… el uso común de métricas compuestas reportadas inadecuadamente con altos gradientes de importancia para los pacientes, en que las métricas de menor importancia contribuyen la mayoría de los eventos, y en que el tratamiento afecta fundamentalmente dichas métricas [de poca importancia], es problemático… los ensayistas deberían reportar la data completa sobre cada componente individualizado para facilitar la correcta interpretación; los médicos deben ver con cautela los resultados de ensayos cardiovasculares que utilicen métricas compuestas para reportar sus hallazgos'. Los autores de esta revisión sistemática hallaron que en los ensayos en que se reporta métricas compuestas que combinan métricas de alto impacto (como mortalidad) con métricas de poco impacto, ‘los efectos agregados de los resultados fatales y críticos fueron modestos, y las métricas de menor importancia estuvieron asociadas con efectos más grandes'.

En lenguaje llano: si el equipo Azul hubiera ganado, sus simpatizantes no hablarían tanto de la posesión del balón, del porcentaje de pases completados, tiros de esquina, tarjetas amarillas ni otras cosas de menor importancia, sino que hablarían directamente de los goles, que usualmente son bastante elocuentes. Allí lo tiene: combinar resultados de métricas de alta relevancia con otras métricas de poca relevancia clínica en una métrica compuesta es truco para inflar resultados y hacerlos parecer más impresionantes de lo que realmente son. El médico lee el resumen y ve que redujo la métrica primaria que incluyó mortalidad y es muy fácil que mentalmente concluya, falazmente, que la intervención reduce mortalidad, y no es el caso.

Quizás usted considere relevante saber que el mencionado ensayo FOURIER -en que se presenta como gran logro unos resultados que en realidad indican fracaso del fármaco— fue patrocinado por la compañía que mercadea evolocumab. El artículo citado de NEJM tiene doce autores. De estos, siete declararon haber recibido recientemente honorarios de la compañía farmacéutica que fabrica evolocumab. Otros dos son empleados de la compañía en cuestión. De los tres restantes, uno declaró recibir honorarios de otras compañías farmacéuticas, aunque no de la que fabrica evolocumab. Fíjese que no hablo de fondos para investigación, sino de honorarios personales. Es decir, de 12 autores, 9 reciben pagos personales de parte de la compañía que se beneficia del fármaco que ellos estaban evaluando, seguramente con total imparcialidad y sin sesgo alguno. No sé usted, pero para mí esta última métrica es bastante elocuente, ¿o quizás deba decir evolocuente?

La fiscalía descansa, señores del jurado.

ABOGADO

Lo Nuevo