MACHINE LEARNING EM LABORATÓRIOS DE ANÁLISES CLÍNICAS
À medida que a demanda por assistência médica de qualidade continua a acender exponencialmente, o mesmo ocorre com o volume de testes de laboratório. Semelhante a outros setores, as pesquisas no campo da medicina laboratorial começaram a investigar o uso do Machine Learning (ML) para gerir com sucesso o aumento da demanda por serviços e melhorar a qualidade e a segurança. Na última década, o desempenho do ML em tarefas estatísticas de benchmark melhorou significativamente devido ao aumento da disponibilidade da computação de alta velocidade em unidades de processamento gráfico, integração de redes neurais convolucionais, otimização do Deep Learning e conjuntos de dados cada vez maiores. O consenso atual é que o desempenho geral do ML supervisionado, ou seja, algoritmos que dependem de conjuntos de dados rotulados, atingiu um ponto de inflexão onde os laboratórios clínicos devem procurar aplicativos de missão crítica.
Nos últimos anos, as publicações de pesquisa relacionadas ao ML aumentaram significativamente em patologia e medicina laboratorial. No entanto, apesar dos recentes avanços tecnológicos e do crescente corpo de literatura, existem poucos exemplos de ML implementados na prática clínica de rotina. De fato, alguns dos exemplos mais proeminentes de ML na prática atual foram desenvolvidos antes da inflexão recente em publicações relacionadas a ML. À medida que a medicina laboratorial continua passando pela digitalização e automação, os laboratórios clínicos provavelmente serão confrontados com os desafios associados à avaliação, implementação e validação de algoritmos de ML, dentro e fora de seus laboratórios. Compreender para que serve o ML, onde pode ser aplicado e o estado da arte e as limitações do campo do ML serão úteis para a prática de profissionais de laboratório.
Como o ML continua a ser adotado e integrado à complexa infraestrutura da Tecnologia de informação em saúde (TIS) e pode influenciar a prática de medicina laboratorial permanece uma questão em aberto. Em particular, é importante considerar barreiras à implementação e identificar as partes interessadas para governança, desenvolvimento, validação e manutenção. No entanto, os laboratórios clínicos devem considerar primeiro o contexto: a aplicação de ML está dentro ou a jusante de um laboratório?
Métodos robustos de ML, como convolução de imagem, redes neurais e deep learning aceleraram o desempenho do ML baseada em imagem nos últimos anos. As imagens digitais, no entanto, não são tão abundantes em laboratórios clínicos quanto em outras especialidades de diagnóstico, como radiologia ou patologia anatômica, possivelmente limitando futuras aplicações futuras da ML baseada em imagens na medicina laboratorial.
Alguns desses autores que realizaram trabalhos nesse campo, desenvolvem os vieses das pesquisas, alguns consideram o próprio teste imperfeito, e assinalam que o contexto clínico deve ser considerado ao se tomar decisões sobre seu uso e interpretação. É o caso de Waljee, em 2019, com amostra de 401, que teve como objetivo identificar características dos pacientes com doença de Crohn e a terapia com ustekinumabe, usando proteína C reativa (PCR) como biomarcador da atividade da doença e avaliar a vantagem incremental do uso desses preditores em comparação com o nível do medicamento isoladamente. Foi utilizado a Random Forest, método de previsão de ML que utiliza um conjunto de árvores de decisão para classificar as observações. Os preditores mais importantes foram o PCR, albumina e a relação do ustekinumabe/PCR sérico.
Além do número limitado de aplicações comerciais, a pesquisa de ML em medicina laboratorial também tem aumentado, embora o número total de publicações permaneça relativamente baixo. Nos últimos anos, os pesquisadores investigaram a utilidade do ML para uma ampla gama de conjuntos de dados, como a análise da morfologia dos eritrócitos, morfologia das colônias bacterianas, painéis da tireoide, perfis de esteroides na urina, citometria de fluxo e revisão dos relatórios de resultados dos testes para garantir a qualidade.
Um estudo de Bhosale em 2018, com 43 amostras para cada grupo, um fenótipo foi encontrado para assinalar o grupo de risco, utilizando análise de ML, foi então identificado um painel de biomarcadores. Foi avaliado a presença de biomarcadores de proteínas séricas associados às fases iniciais da formação de placas ateroscleróticas carotídeas, sob análises proteômicas quantitativas sem rótulo para amostras de soro coletadas como parte do Estudo de Risco Cardiovascular em Jovens Finlandeses. Com base em ML e no pacote R glmnet, em um painel de três proteínas (FBLN1C, APOE e CDH13) foi observado que consegue fornecer melhor discriminação entre os casos e controles, particularmente com a inclusão de APOE e CDH13.
O estudo de Ko, ainda em novembro de 2018, com 1742 amostras, obteve uma visão mais positiva. Foi aplicado algoritmo de ML validado clinicamente para a detecção de doenças residuais com análise por citometria de fluxo (CMF) multicolor na leucemia mieloide aguda (LMA) e síndrome mielodisplásica (SMD). Utilizaram duas técnicas de inteligência artificial (IA) para desenvolver um algoritmo de interpretação da citometria de fluxo para detecção de doença residual mínima usando uma coorte no mundo real de mais de 1000 pacientes com LMA e SMD com mais de 5000 dados de CMF em amostras de medula óssea. Foi demonstrado que os algoritmos desenvolvidos via IA poderiam realizar a tarefa de classificação em um tempo muito curto (apenas 7 segundos), com cerca de 90% de acurácia na detecção de doença residual em Leucemia mieloide aguda e síndrome mielodisplásica. Além disso, os resultados da previsão de resultados no cenário pós-indução demonstraram um alto significado prognóstico dos algoritmos de IA.
À medida que os prontuários eletrônicos de pacientes (PEPs) continuam evoluindo e acumulando mais dados, os fornecedores comerciais de PEP procuram expandir seus recursos analíticos e de acesso a dados. Começando a oferecer modelos de ML projetados para uso em seus sistemas e, em alguns casos, estão permitindo o acesso a modelos de terceiros. Os fornecedores geralmente empacotam o software de ML no suporte à decisão clínica (CDS), um local cada vez mais popular para misturar ML e medicina clínica — como no caso do trabalho de Dobaños, em 2019, com amostra de 195, que procurou ajuda no ML para medir os níveis de anticorpos por tecnologia quantitativa de conjuntos de suspensões e modelos de regressão aplicados, para analisar fatores que afetam seus níveis e correlatos de proteção. Foram realizadas análises multimarcas por análise de componentes principais, matrizes de correlação e análise discriminante de mínimos quadrados parciais de aprendizado de máquina usando os pacotes R FactoMineR, Corrplot e DiscriMiner, respectivamente. Dessa forma, forneceu evidências de um efeito positivo da imunização com RTS,S nas respostas de anticorpos a certos antígenos que estão associados à proteção.
Embora algumas instituições tenham integrado com sucesso sistemas de ML locais em seus fluxos de trabalho, poucas fizeram a transição para a prática clínica. Apesar do desenvolvimento de modelos com melhor desempenho, os pesquisadores, por várias razões, costumam encontrar dificuldades com a proverbial última milha da integração clínica. Em particular, a literatura oferece pouca ou nenhuma orientação sobre métricas de desempenho estatístico pelas quais avaliar modelos de ML, o design de experimentos de validação clínica ou sobre como criar modelos de ML mais modulares que se integram às infraestruturas atuais de tecnologia da informação em medicina de laboratório (TI) e fluxos de trabalho.
Com toda a probabilidade, o motivo da lenta adoção de ML pelos laboratórios clínicos, tanto de fontes comerciais quanto de pesquisa, é multifatorial e, sem dúvida, emana de mais do que apenas as limitações intrínsecas da própria tecnologia principal. Semelhante a outras tecnologias que recebem muita atenção, como Big Data ou blockchain, o ML continua sendo uma ferramenta que requer uma arquitetura de sistema de suporte. Embora a tecnologia principal esteja demonstrando resultados promissores, é provável que sua prevalência na prática diária permaneça limitada até que desenvolvedores e engenheiros de software ofereçam sistemas clínicos de TI que permitam fácil integração com os fluxos de trabalho existentes.
Em seu estado atual, os algoritmos de ML geralmente dependem de dados estruturados para treinamento e subsequente geração de previsões. Embora uma parte significativa dos PEPs contenha dados não estruturados e semiestruturados, as informações de laboratório continuam sendo uma das maiores fontes de dados estruturados, e não é incomum que as ferramentas baseadas em ML confiem fortemente nos dados do laboratório como entrada. À medida que as ferramentas proliferam, o papel da medicina laboratorial no desenvolvimento, validação e manutenção desses modelos permanece importante, porém pouco definida.
Referências para leitura:
Bhosale, Santosh D. et al. Serum proteomic profiling to identify biomarkers of premature carotid atherosclerosis. Scientific reports, v. 8, n. 1, p. 1–9, 2018.
Dobaño, Carlota et al. RTS, S/AS01E immunization increases antibody responses to vaccine-unrelated Plasmodium falciparum antigens associated with protection against clinical malaria in African children: a case-control study. BMC medicine, v. 17, n. 1, p. 157, 2019.
Ko, Bor-Sheng et al. Clinically validated machine learning algorithm for detecting residual diseases with multicolor flow cytometry analysis in acute myeloid leukemia and myelodysplastic syndrome. EBioMedicine, v. 37, p. 91–100, 2018.
Waljee, Akbar K. et al. Development and Validation of Machine Learning Models in Prediction of Remission in Patients With Moderate to Severe Crohn Disease. JAMA network open, v. 2, n. 5, p. e193721-e193721, 2019.