Temas para PEC/TCC (2024.1)
Lista de temas:
[Pesquisa] Avaliação da Segurança de Acesso às Notas Fiscais de Consumidor Eletrônica
[Pesquisa e Desenvolvimento] Classificação de Questões de Múltipla-Escolha com Uso de Machine Learning / IA Generativa
[Pesquisa e Desenvolvimento] Geração Automática de Questões de Múltipla-Escolha Utilizando NLP / IA Generativa
[Pesquisa] Levantamento das Tecnologias Web mais Utilizadas no Setor Público Brasileiro
[Pesquisa] Levantamento das Tecnologias Web mais Utilizadas no Setor Privado Brasileiro
[Desenvolvimento] Aplicativo para Correção Automática de Provas Impressas (IA>Visão Computacional)
1) Tema: Avaliação da Segurança de Acesso às Notas Fiscais de Consumidor Eletrônica (NFC-e)
Categoria de Projeto: Pesquisa e Desenvolvimento (P&D)
Assunto: Segurança em Sistemas Web
Contextualização:
O objetivo deste projeto é investigar dois problemas de segurança relacionados às Notas Fiscais Eletrônicas. O primeiro diz respeito a lacuna de segurança na geração do código numérico da Chave de Acesso, o que permite facilmente obter acesso às informações de outras notas fiscais, facilitanto a prática de diversos tipos de golpes (ex: boleto falso). Outro problema diz respeito ao acesso da Nota Fiscal de Consumidor Eletrônica (NFC-e) nos sites das secretarias das fazendas dos estados. Como cada estado é responsável por fornecer um ambiente de consulta às NFC-e. Ocorre que alguns ambientes são mais seguros que outros. Como exemplo, a consulta às NFC-e do Rio Grande do Norte utiliza o método CAPTCHA, facilmente quebrado por um software, enquanto que a Sefaz da Paraíba utiliza o reCAPTCHA, método mais recente e seguro. Os resultados deste projeto são de extrema importância para alertar as secretarias da fazenda e empresas que desenvolvem sistemas de emissão de nota fiscal.
Objetivos principais:
- Realizar um estudo de caso na cidade de Campina Grande sobre o tipo de código numérico gerado durante a emissão das NFC-e nos estabelecimentos de diversos setores comerciais;
- Realizar um levantamento do nível de segurança utilizado pelas SEFAZ de todos os estados que adotaram a NFC-e;
- Avaliar e utilizar tecnologias/ferramentas open source de ORC (e.g., Tesseract) e/ou aprendizagem de máquina para quebra de captchas;
- Mensurar a eficácia do modelo de quebra de captcha em todos os portais de NFC-e que ainda utilizam CAPTCHA;
- Disponibilizar os artefatos gerados (código/scripts/datasets) no GitHub;
- Submeter artigo para evento/revista nacional na área de segurança;
TIpo de documento a ser entregue: Artigo científico
Quantidade de estudantes: 1 a 2
Leitura Recomendada:
- http://nfce.encat.org/consulte-sua-nota-qr-code-versao-2-0
- A Systematic Survey on CAPTCHA Recognition: Types, Creation and Breaking Techniques
2) Tema: Classificação de Questões de Múltipla-Escolha com Uso de Machine Learning
Categoria de Projeto: Pesquisa e Desenvolvimento (P&D)
Assunto: Aprendizagem de máquina (machine learning)
Contextualização:
Questões de múltipla-escolha são utilizadas em diversos tipos de provas e exames, a exemplo do ENEM, ENADE, concursos públicos, vestibulares, olimpíadas científicas, provas de residência médica, etc. Algumas plataformas de EduTechs brasileiras (e.g., Q-Concursos) contém mais de um milhão de questões de múltipla-escolha. Uma das tarefas realizadas por professores é classificar/rotular uma questão em um determinado assunto e subassunto. Entretanto, essa é uma tarefa árdua e lenta. O que se desejaria seria um modelo de classificação automática que, a partir do enunciado de uma questão, possa, com precisão, classificá-la dentro de uma lista de assuntos/subassuntos pré-definidos.
Objetivos principais:
- Investigar os principais métodos utilizados para classificação de questões de prova na literatura, inclusive usando ferramentas recentes como chatGPT e Bard.
- Conduzir um estudo experimental utilizando questões reais da área de informática;
- Analisar vários algoritmos de classificação, comparando-os e selecionando o de melhor desempenho;
- Mensurar a eficácia do modelo de classificação utilizando métricas de acurácia, recall, F-measure, etc.;
- Disponibilizar os artefatos gerados (código/scripts/datasets) no GitHub;
- Submeter artigo para evento/revista nacional.
TIpo de documento a ser entregue: Artigo científico
Quantidade de estudantes: 1 a 3
Leitura Recomendada:
-
-
3) Tema: Geração Automática de Questões de Múltipla-Escolha Utilizando NLP
Categoria de Projeto: Pesquisa
Assunto: IA > NLP (Processamento de Linguagem Natural)
Contextualização:
Uma das tarefas que pode consumir muito tempo dos professores é de ter que elaborar novas questões a cada semestre para suas provas. Uma das soluções utilizadas é adaptar questões de livros ou concursos. Entretanto, com o recente avanço da IA generativa é possível desenvolver sistemas que sejam capazes de gerar diversos tipos de questões (VF, múltipla-escolha, completar, etc.) a partir de um ou mais documentos.
Objetivos principais:
- Estudar os principais métodos utilizados para geração de questões de múltipla-escolha
- Avaliar as soluções existentes dentro de um contexto de uma matéria específica
TIpo de documento a ser entregue: Artigo científico
Quantidade de estudantes: 1 a 3
Leitura Recomendada:
4) Tema: Perfil de Tecnologias Web Utilizadas no Setor Público Brasileiro
Categoria de Projeto: Pesquisa
Assunto: Sistemas Web
Contextualização:
Quais as tecnologias (frameworks, bibliotecas, linguagens de programação, etc.) mais utilizadas em sistemas web do setor público brasileiro?
Objetivos principais:
- Realizar um levantamento abrangente sobre as tecnologias web utilizadas no setor público brasileiro, considerando os sites/serviços mais acessados pela população;
- Realizar a implantação e configuração de ferramentas de detecção de tecnologias (e.g., Wappalyzer);
- Obter as URLs dos principais sites/serviços do setor público brasileiro (executivo, legislativo e judiciário) das três esferas (municipal, estatural e federal);
- Apresentar estatísticas e dashboards com os resultados encontrados;
- Disponibilizar os artefatos gerados (código/scripts/datasets) no GitHub;
- Submeter artigo para evento/revista nacional.
TIpo de documento a ser entregue: Artigo científico
Quantidade de estudantes: 1 a 2
Leitura Recomendada:
- Thou Shalt Not Depend on Me: Analysing the Use of Outdated JavaScript Libraries on the Web
- A SURVEY OF WEB TECHNOLOGIES USED IN INDONESIA LOCAL GOVERNMENTS
- https://github.com/wappalyzer/wappalyzer
5) Tema: Perfil de Tecnologias Web Utilizadas no Setor Privado Brasileiro
Categoria de Projeto: Pesquisa
Assunto: Sistemas Web
Contextualização:
Quais as tecnologias (frameworks, bibliotecas, linguagens de programação, etc.) mais utilizadas em sistemas web do setor privado brasileiro?
Objetivos principais:
- Realizar um levantamento sobre as tecnologias web utilizadas no portal das 500 maiores empresas brasileiras;
- Apresentar estatísticas e dashboards com os resultados encontrados;
- Realizar a configuração e implantação do Wappalyzer;
- Disponibilizar os artefatos gerados (código/scripts/datasets) no GitHub;
- Submeter artigo para evento/revista nacional.
TIpo de documento a ser entregue: Artigo científico
Quantidade de estudantes: 1 a 2
Leitura Recomendada:
- Thou Shalt Not Depend on Me: Analysing the Use of Outdated JavaScript Libraries on the Web
- A SURVEY OF WEB TECHNOLOGIES USED IN INDONESIA LOCAL GOVERNMENTS
- https://github.com/wappalyzer/wappalyzer
6. Aplicativo para Correção Automática de Provas Impressas
Categoria de Projeto: Desenvolvimento
Assunto: Sistemas Mobile / Visão Computacional
Contextualização:
Ampliação do sistema Questões.PRO mobile (feito em React Native), permitindo a correção automática de provas de múltipla-escolha por meio de gabarito convencional e uso da câmera do celular.
Características princiais:
Apliação do Questões.PRO mobile (React Native);
Uso do OpenCV;
Integração com o backend do sistema Questoes.Pro;
Uso da câmera para leitura do QRcode e das respostas;
Visualizar resultados das provas dos estudantes;
Acurácia > 95%.
TIpo de documento a ser entregue: Artigo
Quantidade de estudantes: 1 a 3
Sistema Open source (para estudo):
OMRChecker (python + OpenCV)
Sistemas comerciais concorrentes: