O
processamento de linguagem natural (PLN) ou linguística computacional é uma das
tecnologias mais importantes da era da informação. As aplicações da PLN estão
em toda parte porque as pessoas comunicam quase tudo em linguagem escrita e
falada: pesquisa na web, publicidade, e-mails, atendimento ao cliente, tradução
de idiomas, agentes virtuais, relatórios médicos, etc.
Nos últimos
anos, as abordagens de rede neural de aprendizagem profunda obtiveram
alcançaram alto desempenho em diferentes tarefas de PLN, usando apenas modelos
neurais de ponta a ponta, dispensando a engenharia de recursos tradicional e
específica para esse tipo de tarefa.
Neste curso,
os alunos terão uma introdução completa ao estado da arte em Aprendizado
Profundo para PLN e realizarão aplicações práticas por meio de aplicações em
Python em atividades Hands-on, utilizando ferramenta comercial (Tornado) e
manipulando as bibliotecas de PLN e ciência dos dados. O Tornado é uma
ferramenta para o processamento automático de grandes volumes de documentos que
transformando dados não-estruturados (word, pdf, email, pptx, excel e imagens)
em dados estruturados ou semiestruturados para a posterior análise e
processamento por modelos de linguagem natural (NLP: Natural Language
Processing). A ferramenta extrai os elementos básicos de qualquer documento,
como textos, imagens, tabelas e equações para criar data lakes e aplicar
modelos de IA para diferentes aplicações
comerciais.