Anales RANF
Santiago Cuéllar Rodríguez @Real Academia Nacional de Farmacia. Spain 6 bibliografía científica correspondiente. De forma sintética, son: • Cuanto menor sea el tamaño de la muestra estudiada , menos probable será que los resultados de la investigación sean ciertos. Es decir, los resultados de la investigación son más probables con estudios amplios, como los ensayos clínicos controlados y aleatorizados, en los que se llega a incluir varios miles de sujetos, que con estudios con pequeño tamaño muestral. • Cuanto más pequeño sea el tamaño del efecto – la magnitud de la medida del cambio esperado como resultado de una intervención experimental – menos probable será que los resultados de la investigación sean ciertos. Por ello, los hallazgos más relevantes de la investigación son más probables en los estudios donde se esperan grandes efectos, como el impacto del hábito de fumar en el cáncer o en las enfermedades cardiovasculares, que en aquellos donde los efectos postulados son pequeños, como los factores de riesgo genético para enfermedades multigénicas. Por este motivo, si los tamaños del efecto real son muy pequeños – por ejemplo, con riesgos relativos menores a 1,05 – en un estudio, es probable que éste esté plagado de falsas afirmaciones, como es habitual encontrar en trabajos que estudian los determinantes genéticos o nutricionales de enfermedades complejas. • Cuanto mayor sea el número y menor la selección de relaciones probadas en un campo científico, menos probable será que los resultados de la investigación sean ciertos. Por eso, los hallazgos de la investigación son más probables en los estudios con diseños confirmatorios, como los grandes ensayos clínicos controlados aleatorios de fase III, o los metanálisis de los mismos, que en los experimentos que generan hipótesis. • Cuanto mayor sea la flexibilidad en los diseños, definiciones, resultados y modos analíticos en un campo científico, menos probable será que los resultados de la investigación sean ciertos. La flexibilidad aumenta el riesgo – o el potencial – para transformar resultados negativos en positivos, mientras que los hallazgos veraces son más comunes cuando los resultados o variables son inequívocos y universalmente aceptados y contrastados – es decir, robustos, como por ejemplo la supervivencia global en un periodo o la tasa de muerte por cualquier motivo – en lugar de diseños que incluyen escalas de valoración subjetiva, como las empleadas frecuentemente en neurología y psiquiatría. • Cuanto mayores sean los intereses y prejuicios financieros y de otro tipo en un campo científico, menos probable será que los resultados de la investigación sean veraces. Los conflictos de intereses son muy comunes en la investigación biomédica y, en general, se informan de forma inadecuada y escasa, aunque no necesariamente tiene raíces financieras; a veces, los científicos pueden tener prejuicios en torno a una teoría científica o un compromiso con sus propios hallazgos, o están relacionados con la promoción académica o profesional de los investigadores. Asimismo, algunos científicos de prestigio pueden suprimir, a través de los procesos de revisión por pares , la aparición y difusión de hallazgos que refuten sus propios hallazgos, condenando así su campo a perpetuar el falso dogma. En este sentido, la evidencia empírica sobre la opinión de los expertos muestra que ésta es muy poco fiable (6). • Cuanto más activo sea un campo científico (con más equipos científicos involucrados), menos probable será que los resultados de la investigación sean ciertos. Este corolario aparentemente paradójico se debe a que, el valor predictivo positivo (VPP) de los hallazgos aislados disminuye cuando muchos equipos de investigadores participan en el mismo campo. Esto puede explicar por qué ocasionalmente vemos grandes emociones seguidas rápidamente por graves decepciones en campos que atraen una gran atención pública. Cuando muchos equipos de investigación trabajan en el mismo campo, dando lugar a una producción masiva de datos experimentales y ya que la rapidez es esencial para vencer a la competencia, cada equipo puede priorizar la búsqueda y difusión de sus resultados positivos más impresionantes, mientras que los resultados negativos quedan relegados, salvo que otro equipo haya encontrado una asociación positiva en la misma cuestión. El fenómeno de Proteus es el término acuñado para describir este fenómeno de alternancia rápida de afirmaciones y refutaciones opuestas (7). 4. REPRODUCIBILIDAD Y REPRESENTATIVIDAD (SIGNIFICACIÓN) ESTADÍSTICA La base de datos PubMed ( US National Library of Medicine; National Institutes of Health) comprende más de 29 millones de referencias de literatura científica biomédica. En el año 2018 se registraron 1.312.059, frente a “tan solo” 531.744 en el 2000, lo que implica que el número de registros anuales se ha multiplicado por 2,5 y esto se refiere únicamente a la literatura biomédica publicada mayoritariamente en inglés y en revistas de cierto nivel de impacto bibliográfico. ¿Toda esta información es relevante científica y clínicamente? Desde luego, no faltan expertos que consideran que toda esta información es en su mayoría ruido, por más científico que resuene su eco, ya que buena parte de esta producción es clínicamente irrelevante, cuando no preliminar, redundante o simplemente sesgada o falsa (8). Sin embargo, la mayoría de los profesionales de la salud desconocen esta auténtica superinflación de evidencia clínica de baja calidad y cómo ella contribuye sustancialmente a un deterioro de la investigación biomédica y de la medicina clínica (9). Gran parte de la investigación médica publicada no es fiable o es, al menos, incierta, ni ofrece beneficios a los pacientes o no es útil para quienes toman decisiones sanitarias o financieras, sin que la mayoría de los profesionales sanitarios sean conscientes de este problema e incluso ni siquiera disponen, en su mayoría, de las habilidades necesarias para evaluar la fiabilidad y utilidad de la evidencia médica
RkJQdWJsaXNoZXIy ODI4MTE=