Perfil do profissional
De modo sucinto, o bacharel em Ciência de Dados e Inteligência Artificial utiliza técnicas e conhecimentos da Matemática, Estatística e Ciência da Computação para coletar, analisar e interpretar um grande conjunto de dados, além de elaborar modelos preditivos, com base em métodos de inteligência artificial, como machine learning e deep learning. O egresso será capaz de desenvolver ferramentas computacionais e modelos de aprendizagem de máquina para analisar grandes conjuntos de dados, atuando sempre no topo das organizações e influenciando o processo de tomada de decisão.
Por possuir uma formação multidisciplinar, o profissional da área de Ciência de Dados pode assumir vários papéis em uma organização, dentre os quais se destacam: analista de dados, cientista de dados, engenheiro de dados e engenheiro de machine learning.
O analista e o cientista de dados são os responsáveis por analisar e extrair conhecimento dos dados, agregando valor às organizações. Embora também possam atuar na coleta e limpeza de dados internos ou externos às organizações, eles têm como foco as atividades como a de mineração e análise de dados. Apesar não existir um consenso quanto às atividades que os diferenciam, normalmente associa-se ao analista à incumbência de analisar dados pretéritos com a finalidade de suportar o processo de tomada de decisão. Além de realizar esse tipo de tarefa, os cientistas de dados utilizam modelos preditivos baseados em inteligência artificial para projetar cenários futuros, agregando mais valor a produtos e serviços de uma empresa ou instituição.
O engenheiro de dados, por sua vez, tem a missão de gerenciar, otimizar, supervisionar e monitorar a recuperação, o armazenamento e a distribuição de dados em toda a organização. Cabe a ele, por exemplo, desenvolver algoritmos para coletar dados de diversas fontes e estruturá-los da melhor forma para análise posterior. Também lhe compete avaliar se será necessária a utilização de algum serviço de armazenamento em nuvem, se a organização manterá seu próprio parque de armazenamento ou se haverá uma solução que combine as duas abordagens. Caso opte-se por manter algum tipo de infraestrutura de armazenamento local, o engenheiro de dados decidirá sobre quais e quantos equipamentos adquirir, como eles estarão interligados, quais tecnologias para gerenciamento de banco de dados relacionais e não-relacionais utilizar, qual solução de big data adotar, etc. Além disso, ele será o responsável pela manutenção e configuração de tais bases de dados e pela otimização da performance de acesso aos dados.
Por último, o engenheiro de machine learning (ML) é o profissional especialista nas técnicas e métodos envolvendo ML. Com a grande quantidade de dados disponíveis, surge a necessidade de métodos inteligentes, dotados da capacidade de aprender sem a intervenção humana, que sejam aptos a extrair informações valiosas a partir da infinidade de dados existentes. A possibilidade de projeção do futuro a partir do comportamento dos dados ao longo do tempo potencializou a importância de tais técnicas e dos profissionais que as dominam. Por conhecer com profundidade os diversos modelos de aprendizado de máquina, o engenheiro de ML é capaz de adaptar e combinar modelos existentes, bem como criar novos modelos e algoritmos de acordo com as particularidades do problema a ser resolvido.