Notícias
Pesquisadores da UFPB desenvolvem software que classifica moléculas de RNA
Pesquisadores da Universidade Federal da Paraíba (UFPB), em parceria com cientistas da Universidade Federal do Rio Grande do Norte (UFRN) e da Universidade do Chile, desenvolveram um software que utiliza inteligência artificial para classificar moléculas de RNA (ácido ribonucleico) em codificante e não-codificante.
O RNA é um tipo de ácido nucleico, presente no interior das células, que intervém em várias funções biológicas importantes como a codificação genética e a descodificação durante a tradução de proteínas, regulação e expressão dos genes. Nesse sentido, um RNA codificante é qualquer molécula de RNA que é traduzida em proteína. Já o RNA não-codificante é qualquer molécula de RNA que não é traduzida em proteína.
Em biologia, tradução é o processo biológico no qual a sequência nucleótica (bloco construtor de um ácido nucleico) de uma molécula de mRNA (RNA mensageiro) é utilizada para ordenar a síntese de uma cadeia nucleotidica cuja sequência de aminoácidos determina uma proteína, macromolécula biológica constituídas por uma ou mais cadeias de aminoácidos, que, em geral, são compostos de carbono, hidrogênio, oxigênio e nitrogênio.
Enquanto isso, o RNA mensageiro é o ácido ribonucleico responsável pela transferência de informações do DNA (ácido desoxirribonucleico) até o citoplasma de uma célula, espaço intracelular entre a membrana plasmática e o invólucro nuclear em seres eucariontes, enquanto nos procariontes corresponde à totalidade da área intracelular.
Nesse contexto de funcionamento das células, a ferramenta computacional denominada de RNAmining, que inclusive está disponível para download gratuito, permitirá identificar esses RNAs não-codificantes.
Através dessa identificação, será possível compreender o funcionamento, em nível celular, de diversas doenças humanas e um pouco mais sobre a resposta molecular a uma vacina ou até mesmo à exposição a um patógeno.
Os testes para o desenvolvimento do software foram realizados com sequências de RNA de 24 organismos escolhidos de acordo com suas origens evolutivas. Em análise comparativa com outras quatro ferramentas existentes na literatura científica, o da UFPB as superaram.
De acordo com Vinicius Maracaja-Coutinho, professor de bioinformática da Faculdade de Ciências Farmacêuticas da Universidade do Chile, os RNAs não-codificantes (ncRNAs) não são traduzidos em proteínas, mas são atores importantes na regulação celular de organismos de diferentes reinos da vida.
“Sua investigação é rotina em qualquer projeto de transcriptoma/genoma, independente do organismo a ser estudado. Uma desregulação nestes RNAs pode estar associada a uma grande quantidade de doenças, como as neurológicas e cardiovasculares, e diferentes tipos de câncer”, explica o professor da universidade chilena.
No estudo, foi avaliada a performance de sete algoritmos diferentes de aprendizagem de máquina em sequências de 24 organismos diferentes, a fim de classificar se uma determinada sequência era codificante de proteína ou não. Em seguida, foi implementado o algoritmo que obteve os melhores resultados para o desenvolvimento do novo software”, sintetiza o docente.
Escassez de ferramentas
Vinicius Maracaja-Coutinho, professor da Universidade de Chile e um dos colaboradores do estudo, explica que um grande número de trabalhos científicos necessitam dessa identificação de RNAs codificantes e não-codificantes. Segundo ele, hoje, há uma escassez de ferramentas de fácil utilização para pesquisadores e estudantes as operarem em um tempo computacionalmente pequeno e com altas taxas de acertos na identificação.
“Muitos dos programas computacionais disponíveis foram desenvolvidos usando organismos-modelo no seu treinamento, por exemplo, humanos e camundongos. Com isso, o desempenho destes softwares são inferiores quando utilizamos a informação genética de uma outra espécie de interesse. Todos esses aspectos serviram de motivação para a produção deste trabalho”.
No artigo onde os pesquisadores da UFPB, da UFRN e da Universidade do Chile apresentam o novo software, são descritas novas metodologias que conseguiram melhores resultados do que os já encontrados na literatura científica, em especial para o estudo de organismos não-modelo.
“Utilizamos metodologias de aprendizagem de máquina, área da inteligência artificial, como a deep learning (aprendizagem profunda), para, a partir do treinamento da máquina com sequências de RNA previamente conhecidas como codificantes e não-codificantes, ser construído um modelo de previsão, de forma que, com a apresentação de novas sequências, em uma fase de testes, a ferramenta seja capaz de classificar o RNA como sendo de uma dessas classes”.
Também são criadores do software e autores do artigo científico os pesquisadores Thaís Ratis, Nilbson Galindo, Raul Arias-Carrasco, Cecília Flávia e Thaís Gaudêncio. Interessados no estudo devem entrar por um destes e-mails: gaudenciothais@gmail.com, vinicius.maracaja@uchile.cl e thaisratis@gmail.com.
* * *
Reportagem e Edição: Pedro Paz
Ascom/UFPB