Paper Of The Day
TEXT MINING FOR IDENTIFICATION OF BIOLOGICAL ENTITIES RELATED TO ANTIBIOTIC RESISTANT ORGANISMS
K. F. Costa, F. A. Araújo, J. Morais, C. R. L. Frances e R. T. J. Ramos, "Text mining for identification of biological entities related to antibiotic resistant organisms", PeerJ, v. 10, 2022, pp. e13351, doi: 10.7717/peerj.13351.
Autores:
Kelle Fortunato Costa, Fabrício Almeida Araújo, Jefferson Morais, Carlos Renato Lisboa Frances, Rommel T. J. Ramos.
Resumo:
A resistência antimicrobiana é um problema de saúde pública importante em todo o mundo. Nos anos recentes, a comunidade científica vem intensificando esforços para combater este problema; muitos experimentos foram desenvolvidos, e muitos artigos são publicados nessa área. Todavia, o crescente volume de literatura biológica aumenta a dificuldade do processo de biocuração devido ao custo, e tempo requeridos. Ferramentas de mineração de texto modernas com a adoção de tecnologia de inteligência artificial são úteis para dar assistência na evolução das pesquisas. Neste artigo, propomos um modelo de mineração de texto capaz de identificar e hierarquizar/ranquear artigos científicos prioritários no contexto de resistência antimicrobiana. Recuperamos artigos científicos da base de dados PubMed, adotamos técnicas de aprendizado de máquina a fim de gerar a representação vetorial dos artigos científicos recuperados, e identificamos sua similaridade com o contexto. Como resultado deste processo, obtivemos um conjunto de dados rotulados em “Relevante” e “Irrelevante” e usamos este conjunto de dados para implementar um algoritmo de aprendizado supervisionado para classificar novos registros. O desempenho geral do modelo atingiu 90% de acerto e o f-measure (média harmônica entre as métricas) alcançou 82% de precisão para classe positiva e 93% para classe negativa, mostrando qualidade na identificação de artigos científicos relevantes ao contexto. O conjunto de dados, scripts, e modelos estão disponíveis em: https://github.com/engbiopct/TextMiningAMR.
Link: https://peerj.com/articles/13351/
Lattes do docente: lattes.cnpq.br/1274395392752454 (Rommel Ramos)
#ufpa #icen #ppgcc #computação #antimicrobialresistance #biologicalliterature #textmining #machinelearning
Redes Sociais