Previsão de Lesão Renal Aguda real time e Inteligência Artificial
A lesão renal aguda (LRA) é uma das principais complicações em pacientes hospitalizados, principalmente os pós-operatórios e internados em Unidade de Terapia Intensiva (UTI). É um fator de risco independente para mortalidade precoce e de longo prazo e está fortemente associado a maiores custos hospitalares e tempo de internação. A LRA é definida como um grande aumento da creatinina sérica ou um forte declínio no débito urinário. O fluxo sanguíneo renal comprometido e a circulação extracorpórea desempenham um papel crítico no desenvolvimento da LRA, mas em geral sua etiologia é altamente multifatorial.
A detecção precoce de pacientes com alto risco de desenvolver LRA permite uma intervenção terapêutica precoce antes do início da anúria e suas complicações, como acidose, hipercalemia ou sobrecarga de volume, bem como complicações de longo prazo, como lesão pulmonar, sepse e doença renal crônica. Em um estudo piloto (DOI 10.1053/j.ajkd.2010.08.026) em 2011, foi demonstrado que em pacientes com LRA estágio I, a consulta precoce com o nefrologista pode evitar a progressão para estágios superiores de LRA. Também foi demonstrado que o envolvimento tardio do nefrologista (48 h após o início da LRA) em pacientes criticamente enfermos foi associado a um aumento da mortalidade e dependência de diálise (DOI 10.1371/journal.pone.0070482). Um “pacote de cuidados KDIGO” no pós-operatório imediato (otimização do status volêmico e da hemodinâmica, evitar uso de drogas nefrotóxicas e hiperglicemia) em pacientes de alto risco demonstrou reduzir a IRA associada à cirurgia cardíaca (DOI 10.1007/s00134–016–4670–3).
Embora existam vários escores de risco clínico clássico para a previsão da LRA pós-operatória, nenhum deles é especificamente recomendado por diretrizes existentes. Com poucas exceções, eles dependem dos dados demográficos do paciente, do histórico da doença e do tipo de cirurgia e exigem coleta e cálculo manual de dados demorados. Além disso, eles geralmente são baseados em propriedades estáticas ou medições pontuais únicas que não podem se adaptar às mudanças frequentemente rápidas e dramáticas que ocorrem no pós-operatório.
O aumento da digitalização de informações médicas abre novas alternativas para a previsão precoce de complicações pós-operatórias que podem ser potencialmente integradas ao software de registro eletrônico de saúde (PEP) existente. Uma grande quantidade de dados com alta resolução temporal é coletada durante a internação. O processamento eficaz desses dados de alta dimensão de forma paralela, entretanto, vai muito além das capacidades do cérebro humano. O aprendizado de máquina (Machine Learning — ML) oferece uma solução potencial para esse problema.
Apesar de alguns papers que investigaram o desempenho do ML na previsão da LRA produzirem resultados interessantes, um estudo preditivo relacionando ML e médicos experientes na previsão de LRA ainda permanece necessário. Um grupo formado por hospitais da Alemanha, Suíça e Estados Unidos e sob supervisão de Dra Nina Rank (DOI 10.1038/s41746–020–00346–8) desenvolveram uma rede neural recorrente (RNN) que permite previsões em tempo real da LRA nos primeiros 7 dias de pós-operatório após cirurgia cardiotorácica com base em variáveis coletadas rotineiramente durante a internação hospitalar e, em seguida, validada retrospectivamente em um conjunto de teste independente. Esse modelo foi então comparado ao desempenho de profissionais de saúde experientes.
Para testar a significância clínica, foi realizado uma comparação lado a lado do modelo com médicos experientes. Essas comparações diretas são altamente necessárias, mas raramente são realizadas em estudos clínicos de ML. Surpreendentemente, o modelo superou significativamente os médicos experientes em termos da média de métrica de desempenho S (S indica o quão próxima uma previsão está do resultado observado). Além disso, o modelo alcançou uma AUC significativamente maior do que os médicos (0,901 vs. 0,745, p <0,001, teste de DeLong) e foi globalmente bem calibrado (Teste de Hosmer-Lemeshow: p = 0,37 vs. p <0,001 para médicos).
Os médicos mostraram uma baixa sensibilidade geral de 0,594 na previsão de LRA. Eles previram probabilidades de risco mais baixas em geral. Eles alcançaram uma sensibilidade máxima de 0,793 para o intervalo de 2–6 horas antes do evento e uma sensibilidade mínima de 0,387 para o intervalo de 24–48 horas antes do evento. Assim, eles subestimaram sistematicamente o risco de LRA. Isso sugere que os médicos reconhecem principalmente o estágio 3 da LRA ou diálise e que os estágios inferiores são erroneamente considerados não problemáticos. Foi demonstrado, entretanto, que mesmo pequenos aumentos na creatinina sérica após cirurgia cardíaca estão associados a um risco aumentado de mortalidade.
Os médicos participantes tinham, cada um, pelo menos um ano de experiência de trabalho em UTI cardiotorácica, mas não eram especialistas em nefrologia. Isso reflete um cenário clínico realista em uma UTI, onde os nefrologistas geralmente não estão disponíveis 24 horas por dia. Em contraste com os médicos, o modelo rendeu uma alta sensibilidade geral de 0,851 com uma sensibilidade máxima de 0,971 no intervalo de 2–6 h antes do evento e uma sensibilidade mínima de até 0,750 no intervalo de 48–168 h antes do evento. Em resumo, o modelo desenvolvido foi superior a médicos experientes na previsão de LRA após cirurgia cardiotorácica.
O modelo permite previsões personalizadas, bem como a identificação e intervenção precoce em pacientes de alto risco e, assim, contribuir para uma melhoria do atendimento e segurança do paciente. No entanto, a transferência de tal modelo retrospectivo da pesquisa para a implementação real levanta desafios adicionais. Barreiras técnicas, segurança de dados ao exportar dados pessoais para sistemas de software externos e considerações de negócios podem ser diversas e entrar em conflito entre si.
O modelo proposto não gera carga de trabalho adicional para os médicos, pois utiliza apenas dados coletados rotineiramente do PEP. Como tal, ele emprega apenas dados que estão disponíveis no momento da previsão e todas as transformações de dados são implementadas de forma programática. É importante notar que o modelo teve um desempenho muito bom, embora tenha sido construído em uma amostra relativamente pequena de 2.224 internações.
Diversos outros trabalhos assumem uma perspectiva interessante sobre o mesmo tema, podendo ser facilmente encontrado no artigo que criou o modelo, o qual recomendo fortemente a leitura. Consegue ponderar muito bem limitações do seu modelo, bem como de outros. Um ponto interessante, que poderia aumentar a perspectiva do paciente, é o acréscimo de todo histórico individual do paciente. Essa abordagem requer que os pacientes já sejam conhecidos no hospital de internação, o que muitas vezes não é o caso. Não está claro como o algoritmo funcionaria em pacientes sem histórico médico anterior. A compatibilidade dos dados entre os milhares de PEPs existentes dificulta. O protocolo FHIR/HL7 surge com a proposta de melhorar exponencialmente tal dificuldade.
Muitas ponderações são passíveis neste modelo, uma vez que os dados clínicos reais podem ser muito ruidosos, levando à redução do desempenho e maior carga de implantação de sistemas totalmente automatizados. Isso reforça mais uma vez o fato de que a inteligência artificial deve ser utilizada em sistemas de apoio ao médico e não como seu substituto.
Para leitura: Rank, N., Pfahringer, B., Kempfert, J. et al. Deep-learning-based real-time prediction of acute kidney injury outperforms human predictive performance. npj Digit. Med. 3, 139 (2020). https://doi.org/10.1038/s41746-020-00346-8