Los sistemas de decisiones sustentadas en el aprendizaje automatizado poseen un gran potencial en la medicina actual, pero se debe cuidar que su disponibilidad no influya negativamente en el entrenamiento de los médicos
Introducción y objetivos |
El aprendizaje automatizado (AA) es un campo de la ciencia informática que explora y estudia técnicas para dotar a los sistemas de computación de la capacidad de aprender a través de la entrada de datos. El interés global en el potencial de aprendizaje de los sistemas de computación ha aumentado en forma sostenida en los últimos años y, consecuentemente, las técnicas de AA han hecho importantes avances en muchas áreas.
Las ciencias de la salud se han mostrado especialmente interesadas en modelos automatizados capaces de brindar decisiones diagnósticas y de establecer predicciones, basadas en el análisis de la información aportada. Los algoritmos de AA ya han demostrado una alta exactitud para el diagnóstico de ciertas enfermedades, como la retinopatía diabética.
Existe una convicción generalizada de que el AA producirá cambios importantes en las ciencias de la salud en los próximos años, especialmente en las disciplinas médicas que requieren modelos pronósticos de alta precisión (por ej., oncología) o que se basan en el reconocimiento de patrones (por ej., radiología y patología).
Sin embargo, son prácticamente inexistentes los estudios comparativos que investiguen la efectividad de los sistemas de decisiones sustentadas por AA (SDS-AA) sobre la morbimortalidad de diversas enfermedades.
Tampoco existen estudios sobre los efectos indeseables o las consecuencias adversas no intencionales producidas por la utilización de SDS-AA en la práctica clínica. El objetivo de los autores de esta revisión fue considerar los aspectos relacionados con los efectos adversos de los SDS-AA.
Reducción de las destrezas médicas |
El desentrenamiento puede afectar la capacidad del médico para brindar una opinión informada sobre la base de los síntomas presentes, de los signos detectables y de los datos disponibles
La confianza excesiva en las capacidades de los procesos automatizados es un tema central relacionado con la incorporación de los SDS-AA a la práctica clínica, y se asocia con el concepto más amplio de la dependencia excesiva de la tecnología en las ciencias de la salud.
Si bien la eficiencia de la introducción de sistemas de automatización es innegable en el corto plazo, a largo plazo estas herramientas pueden conducir al fenómeno del “desentrenamiento” (reducción en el operador del nivel de destreza requerido para una tarea, cuando parte de sus componentes, o todos ellos, son automatizados). Este fenómeno puede ser la causa de graves perturbaciones o de ineficiencias en el desempeño cuando ocurre una falla de los sistemas tecnológicos. |
El desentrenamiento puede afectar la capacidad del médico para brindar una opinión informada sobre la base de los síntomas presentes, de los signos detectables y de los datos disponibles. Un estudio realizado sobre interpretación de mamografías por parte de médicos radiólogos mostró una disminución de 14% en la sensibilidad diagnóstica ante imágenes detectadas por una computadora.
Otro estudio sobre médicos residentes de medicina interna observó que la precisión diagnóstica de los médicos disminuía de 57% a 48% cuando se les presentaban electrocardiogramas con un diagnóstico automatizado incorrecto.
Los autores de la revisión sostienen que es necesario efectuar en el futuro más investigaciones para definir si los SDS-AA, que pueden realizar tareas con la misma eficacia, o incluso con mayor eficacia, que las personas, pueden llevar a la pérdida de la autoconfianza del médico y afectar su disposición para proporcionar interpretaciones diagnósticas.
Predominio del texto sobre el contexto |
Sin contexto y sin considerar la incertidumbre implícita a la clínica, los algoritmos no pueden reemplazar a la experiencia humana
Las tecnologías de AA pueden llevar a poner mayor énfasis en lo que puede considerarse como “texto” (por ej., datos brutos), a expensas de otros elementos que ofrecen mayor dificultad para ser descriptos simplemente («contexto»).
La confianza en los SDS-AA se basa en la premisa de que los datos digitales proporcionan representaciones completas y confiables del fenómeno al cual se espera que describan con precisión.
Esto puede representar un problema cuando el contexto clínico no es tenido en cuenta, particularmente si el médico no mantiene un grado de alerta sobre la existencia de elementos clínicos que no están explícitamente incluidos en la historia clínica. Esta información faltante puede desembocar en interpretaciones parciales o equivocadas de los SDS-AA.
Por otra parte, el hecho de basarse exclusivamente en decisiones diagnósticas, terapéuticas o pronósticas generadas por SDS-AA puede conducir a los médicos a un menor interés y a una menor habilidad para llevar a cabo evaluaciones holísticas de los pacientes, con una pérdida concomitante de aspectos valiosos e irreemplazables de la experiencia humana, tales como los aspectos psicológicos, relacionales, sociales y organizacionales.
Estos factores son difíciles de incorporar a cualquier SDS-AA, a causa de su naturaleza compleja y cualitativa; sin embargo, son fundamentales para personalizar el tratamiento médico más allá de categorías diagnósticas.
Un ejemplo que mostró que el contexto era importante y que su exclusión daba por resultado un modelo pronóstico técnicamente válido, pero erróneo, fue un estudio clínico sobre 14199 pacientes con neumonía.
Se utilizó un SDS-AA para que tomara la decisión de administrar el tratamiento a los pacientes en forma ambulatoria o en internación, basado en la predicción del riesgo de mortalidad. En ese contexto, el SDS-AA consideró que los pacientes con neumonía y asma concomitante tenían menor riesgo de muerte por neumonía que los pacientes sin asma. Esta conclusión sorprendió a los investigadores, que descartaron el concepto de que el asma pudiera ser un factor protector en pacientes con neumonía.
Los investigadores avanzaron en el análisis de las causas por las cuales un algoritmo correcto había producido un resultado contradictorio, con consecuencias potencialmente peligrosas.
En primer lugar, en los hospitales donde se realizó el estudio la norma era que los pacientes con neumonía y asma fueran internados directamente en las unidades de cuidados intensivos, para prevenir complicaciones. Esto llevó a que los pacientes con esta combinación de diagnósticos tuvieran menor morbimortalidad que los pacientes con neumonía, pero sin asma. La reducción del riesgo de mortalidad fue de aproximadamente 50% (tasa de mortalidad: 5.4%, frente a 11.3%).
En segundo lugar, la información contextual no pudo ser incorporada en el SDS-AA, que malinterpretó “correctamente” que la presencia de asma era un factor protector. Los modelos de AA identifican patrones sutiles entre los datos que reciben, pero no pueden integrar fácilmente los factores contextuales, lo que puede llevar a este tipo de errores.
Incertidumbre intrínseca en medicina |
Los SDS-AA integran datos empíricos a interpretaciones categóricas. En la práctica médica, los observadores a menudo no concuerdan entre ellos respecto de la relación entre los hallazgos diagnósticos y la evaluación de los resultados.
Esta variabilidad no se debe solamente a deficiencias interpretativas, sino a una ambigüedad intrínseca del fenómeno observado. Esta incertidumbre intrínseca no es considerada habitualmente como parte de la información entrante que requieren los modelos de AA, lo que afecta su confiabilidad y su precisión.
Los autores sostienen que tanto los diseñadores de SDS-AA como los usuarios deben tomar conciencia de estas limitaciones originadas en la incertidumbre intrínseca que contiene la ciencia médica.
La investigación en el futuro debe desarrollar algoritmos validados de aprendizaje, capaces de adaptar la incorporación de datos que reflejen la verdadera naturaleza de la información médica, más que imponer la idea de una exactitud y de una integridad que no se condice con la realidad de los registros médicos, frecuentemente de baja calidad.
La caja negra del aprendizaje automatizado |
Los algoritmos del AA son a menudo llamados “modelos de caja negra”, ya que los fundamentos a través de los cuales generan sus conclusiones son con frecuencia desconocidos, no solo por los médicos, sino por los mismos ingenieros que los diseñan.
El caso descripto del error en la predicción del riesgo en pacientes con neumonía y asma es un ejemplo. La identificación de la internación en la unidad de cuidados intensivos como un factor de confusión pudo ser considerado porque el sistema poseía algoritmos explícitos de clasificación del riesgo. Otros modelos de AA no permiten un análisis post hoc de ese tipo.
La tendencia actual al desarrollo de modelos artificiales de redes neuronales, orientados a un desempeño basado en la precisión, puede no tomar en cuenta los obstáculos sutiles que presenta la interpretación de datos.
Los autores recomiendan que la investigación esté dirigida a dotar a los SDS-AA con explicaciones automáticas de sus decisiones, para brindar a los médicos la posibilidad de explorar la presencia de potenciales variables de confusión.
Conclusiones |
Los sistemas de AA van a transformar en el futuro cercano muchas áreas de los servicios de salud. Esta contribución será seguramente valiosa, pero puede acarrear consecuencias no deseadas.
Los SDS-AA deben ser diseñados no solamente en función de la precisión, sino que deben ser capaces de incorporar la realidad de la incertidumbre intrínseca de las observaciones médicas. A pesar de la utilidad que aportan estos sistemas, su disponibilidad no libera a los médicos de la necesidad de adquirir destrezas para evaluar el valor del AA en la práctica médica.
SIIC- Sociedad Iberoamericana de Información Científica