Temas para PEC/TCC (2024.1)

Lista de temas:

1) Tema: Avaliação da Segurança de Acesso às Notas Fiscais de Consumidor Eletrônica (NFC-e)

Categoria de Projeto: Pesquisa e Desenvolvimento (P&D)

Assunto: Segurança em Sistemas Web


Contextualização:

O objetivo deste projeto é investigar dois problemas de segurança relacionados às Notas Fiscais Eletrônicas. O primeiro diz respeito a lacuna de segurança na geração do código numérico da Chave de Acesso, o que permite facilmente obter acesso às informações de outras notas fiscais, facilitanto a prática de diversos tipos de golpes (ex: boleto falso). Outro problema diz respeito ao acesso da Nota Fiscal de Consumidor Eletrônica (NFC-e) nos sites das secretarias das fazendas dos estados. Como cada estado é responsável por fornecer um ambiente de consulta às NFC-e. Ocorre que alguns ambientes são mais seguros que outros. Como exemplo, a consulta às NFC-e do Rio Grande do Norte utiliza o método CAPTCHA, facilmente quebrado por um software, enquanto que a Sefaz da Paraíba utiliza o reCAPTCHA, método mais recente e seguro. Os resultados deste projeto são de extrema importância para alertar as secretarias da fazenda e empresas que desenvolvem sistemas de emissão de nota fiscal.


Objetivos principais:

- Realizar um estudo de caso na cidade de Campina Grande sobre o tipo de código numérico gerado durante a emissão das NFC-e nos estabelecimentos de diversos setores comerciais;

- Realizar um levantamento do nível de segurança utilizado pelas SEFAZ de todos os estados que adotaram a NFC-e;

- Avaliar e utilizar tecnologias/ferramentas open source de ORC (e.g., Tesseract) e/ou aprendizagem de máquina para quebra de captchas;

- Mensurar a eficácia do modelo de quebra de captcha em todos os portais de NFC-e que ainda utilizam CAPTCHA;

- Disponibilizar os artefatos gerados (código/scripts/datasets) no GitHub;

- Submeter artigo para evento/revista nacional na área de segurança;


TIpo de documento a ser entregue: Artigo científico


Quantidade de estudantes: 1 a 2


Leitura Recomendada:

- https://www.linkedin.com/pulse/voc%C3%AA-conhece-o-novo-golpe-do-boleto-falso-ricardo-martins/?originalSubdomain=pt 

- http://nfce.encat.org/consulte-sua-nota-qr-code-versao-2-0

- A Systematic Survey on CAPTCHA Recognition: Types, Creation and Breaking Techniques

2) Tema: Classificação de Questões de Múltipla-Escolha com Uso de Machine Learning

Categoria de Projeto: Pesquisa e Desenvolvimento (P&D)

Assunto: Aprendizagem de máquina (machine learning)


Contextualização:

Questões de múltipla-escolha são utilizadas em diversos tipos de provas e exames, a exemplo do ENEM, ENADE, concursos públicos, vestibulares, olimpíadas científicas, provas de residência médica, etc. Algumas plataformas de EduTechs brasileiras (e.g., Q-Concursos) contém mais de um milhão de questões de  múltipla-escolha. Uma das tarefas realizadas por professores é classificar/rotular uma questão em um determinado assunto e subassunto. Entretanto, essa é uma tarefa árdua e lenta. O que se desejaria seria um modelo de classificação automática que, a partir do enunciado de uma questão, possa, com precisão, classificá-la dentro de uma lista de assuntos/subassuntos pré-definidos.


Objetivos principais:

- Investigar os principais métodos utilizados para classificação de questões de prova na literatura, inclusive usando ferramentas recentes como chatGPT e Bard.

- Conduzir um estudo experimental utilizando questões reais da área de informática;

- Analisar vários algoritmos de classificação, comparando-os e selecionando o de melhor desempenho;

- Mensurar a eficácia do modelo de classificação utilizando métricas de acurácia, recall, F-measure, etc.;

- Disponibilizar os artefatos gerados (código/scripts/datasets) no GitHub;

- Submeter artigo para evento/revista nacional.


TIpo de documento a ser entregue: Artigo científico


Quantidade de estudantes: 1 a 3


Leitura Recomendada:

3) Tema: Geração Automática de Questões de Múltipla-Escolha Utilizando NLP

Categoria de Projeto: Pesquisa

Assunto: IA > NLP (Processamento de Linguagem Natural)


Contextualização:

Uma das tarefas que pode consumir muito tempo dos professores é de ter que elaborar novas questões a cada semestre para suas provas. Uma das soluções utilizadas é adaptar questões de livros ou concursos. Entretanto, com o recente avanço da IA generativa é possível desenvolver sistemas que sejam capazes de gerar diversos tipos de questões (VF, múltipla-escolha, completar, etc.) a partir de um ou mais documentos.


Objetivos principais:

- Estudar os principais métodos utilizados para geração de questões de múltipla-escolha

- Avaliar as soluções existentes dentro de um contexto de uma matéria específica


TIpo de documento a ser entregue: Artigo científico


Quantidade de estudantes: 1 a 3


Leitura Recomendada:

- questgen.ai

- https://github.com/ramsrigouthamg/Questgen.ai 

4) Tema: Perfil de Tecnologias Web Utilizadas no Setor Público Brasileiro

Categoria de Projeto: Pesquisa

Assunto: Sistemas Web


Contextualização:

Quais as tecnologias (frameworks, bibliotecas, linguagens de programação, etc.) mais utilizadas em sistemas web do setor público brasileiro?


Objetivos principais:

- Realizar um levantamento abrangente sobre as tecnologias web utilizadas no setor público brasileiro, considerando os sites/serviços mais acessados pela população;

- Realizar a implantação e configuração de ferramentas de detecção de tecnologias (e.g., Wappalyzer);

- Obter as URLs dos principais sites/serviços do setor público brasileiro (executivo, legislativo e judiciário) das três esferas (municipal, estatural e federal);

- Apresentar estatísticas e dashboards com os resultados encontrados;

- Disponibilizar os artefatos gerados (código/scripts/datasets) no GitHub;

- Submeter artigo para evento/revista nacional.


TIpo de documento a ser entregue: Artigo científico


Quantidade de estudantes: 1 a 2


Leitura Recomendada:

- Thou Shalt Not Depend on Me: Analysing the Use of Outdated JavaScript Libraries on the Web

- A SURVEY OF WEB TECHNOLOGIES USED IN INDONESIA LOCAL GOVERNMENTS

- https://github.com/wappalyzer/wappalyzer

- https://www.wappalyzer.com/


5) Tema: Perfil de Tecnologias Web Utilizadas no Setor Privado Brasileiro

Categoria de Projeto: Pesquisa

Assunto: Sistemas Web


Contextualização:

Quais as tecnologias (frameworks, bibliotecas, linguagens de programação, etc.) mais utilizadas em sistemas web do setor privado brasileiro? 


Objetivos principais:

- Realizar um levantamento sobre as tecnologias web utilizadas no portal das 500 maiores empresas brasileiras;

- Apresentar estatísticas e dashboards com os resultados encontrados;

- Realizar a configuração e implantação do Wappalyzer;

- Disponibilizar os artefatos gerados (código/scripts/datasets) no GitHub;

- Submeter artigo para evento/revista nacional.


TIpo de documento a ser entregue: Artigo científico


Quantidade de estudantes: 1 a 2


Leitura Recomendada:

- Thou Shalt Not Depend on Me: Analysing the Use of Outdated JavaScript Libraries on the Web

- A SURVEY OF WEB TECHNOLOGIES USED IN INDONESIA LOCAL GOVERNMENTS

- https://github.com/wappalyzer/wappalyzer

- https://www.wappalyzer.com/


6. Aplicativo para Correção Automática de Provas Impressas

Categoria de Projeto: Desenvolvimento

Assunto: Sistemas Mobile / Visão Computacional


Contextualização:

Ampliação do sistema Questões.PRO mobile (feito em React Native), permitindo a correção automática de provas de múltipla-escolha por meio de gabarito convencional e uso da câmera do celular.


Características princiais:


TIpo de documento a ser entregue: Artigo

Quantidade de estudantes: 1 a 3

Sistema Open source (para estudo):

Sistemas comerciais concorrentes: