Journals
Pagano, A.S.; Duran, M.S.; Pardo, T.A.S. (2025). Diving deeper into the waters of “se” as clitic in Brazilian Portuguese. Revista Brasileira de Linguística Aplicada (RBLA), Vol. 25, N. 1, pp. 1-44. link to the paper
Souza, J.W.C.; Cardoso, P.C.F.; Rodrigues, R. (2025). Taxonomy of Discourse Signals for RST Relations: A Study in a News Corpus. Revista Brasileira de Linguística Aplicada (RBLA), Vol. 25, N. 1, pp. 1-31. link to the paper
Felippo, A.D.; Roman, N.T. (2025). DANTEStocks: A Multi-Layered Annotated Corpus of Stock Market Tweets for Brazilian Portuguese. Revista Brasileira de Linguística Aplicada (RBLA), Vol. 25, N. 1, pp. 1-32. link to the paper
Freitas, C.; Pardo, T.A.S. (2025). PropBanks e representações semânticas: o que temos, o que queremos e o que podemos. LinguaMÁTICA, Vol 17, N. 2, pp. 1-29. link to the paper
Souza, J.W.C.; Semcovici, P.; Pardo, T.A.S. (2025). Proposta de algoritmo de classificação automática de papeis semânticos em português no âmbito do modelo Abstract Meaning Representation. Texto Livre, Vol. 18, pp. 1-18. link to the paper
Rodrigues, R.; Di Felippo, A.; Roman, N.T.; Semcovici, P.; Souza, J.W.C.; Pardo, T.A.S. (2024). Termos do mercado financeiro: um estudo do corpus DANTEStocks. Tradterm, Vol. 46, pp. 6-30. link to the paper
Duran, M.S.; Lopes, L.; Pardo, T.A.S.; Nunes, M.G.V. (2023). Construções comparativas em português e sua anotação usando a sintaxe de dependências. Revista Da ABRALIN, Vol. 22, N. 2, pp. 272-307. link to the paper
Di Felippo, A.; Roman, N.T.; Pardo, T.A.S.; Moura, L.P. (2023). The DANTEStocks Corpus: an analysis of the distribution of Universal Dependencies-based Part-of-Speech tags. Revista Da ABRALIN, Vol. 22, N. 2, pp. 249-271. link to the paper
Rodrigues, R.; Vale, O.A. (2023). Falsos Diminutivos do Português Brasileiro e seu Reconhecimento em um Dicionário Computacional de Livre Acesso. Revista do GELNE, Vol. 25, N. 3. link to the paper
Cunha, F.D.; Souza, K.V.M.; Pardo, T.A.S. (2023). Ações para aquisição de conhecimento de matemática e de computação por alunos do ensino médio. Grad+: Revista de Graduação USP, Vol. 7, N. 1, pp. 75-88. link to the paper
Santos, W.R.; Sungwon, Y.; Paraboni, I. (2023). Mental health prediction from social media text using mixture of experts. IEEE Latin America Transactions, Vol. 21, N. 6, pp.723-729. link to the paper
Santos, W.R.; Oliveira, R.L.; Paraboni, I. (2023). SetembroBR: a social media corpus for depression and anxiety disorder prediction. Language Resources and Evaluation. link to the paper
Inácio, M.L.; Sobrevilla Cabezudo, M.A.; Ramisch, R.; Di Felippo, A.; Pardo, T.A.S. (2023). The AMR-PT corpus and the semantic annotation of challenging sentences from journalistic and opinion texts. DELTA: Documentação e Estudos em Linguística Teórica e Aplicada, Vol. 39, N. 3, pp. 1-31. link to the paper
Duran, M.S.; Nunes, M.G.V.; Lopes, L.; Pardo, T.A.S. (2022). Manual de anotação como recurso de Processamento de Linguagem Natural: o modelo Universal Dependencies em língua portuguesa. Domínios de Lingu@gem, Vol. 16, N. 4, pp. 1608-1643. link to the paper
Rodrigues, R.; Lemos-Couto, M.; Coelho, F.L.; Miranda Jr., I.S.; Vale, O. (2022). Bases lexicais verbais do português brasileiro. Domínios de Lingu@gem, Vol. 16, N. 4, pp. 1489-1516. link to the paper
Anchiêta, R.T. and Pardo, T.A.S. (2022). Analise Semântica com base em AMR para o Português. LinguaMÁTICA, Vol. 14, N. 1, pp. 33-48. link to the paper
Silva, R.R. and Pardo, T.A.S. (2022). Building Contrastive Summaries of Subjective Text Via Opinion Ranking. Revista de Informática Teórica e Aplicada (RITA), Vol. 29, N. 2, pp. 11-34. link to the paper
Sobrevilla Cabezudo, M.A. and Pardo, T.A.S. (2022). Low-resource AMR-to-Text Generation: A Study on Brazilian Portuguese. Procesamiento del Lenguaje Natural, Vol. 68, pp. 85-97. link to the paper
Belisário, L.B.; Ferreira, L.G.; Pardo, T.A.S. (2020). Evaluating Richer Features and Varied Machine Learning Models for Subjectivity Classification of Book Review Sentences in Portuguese. Information, Vol. 11, N. 9, pp. 1-14. link to the paper
Anchiêta, R.T.; Sousa, R.F.; Pardo, T.A.S. (2020). Modeling the Paraphrase Detection Task over a Heterogeneous Graph Network with Data Augmentation. Information, Vol. 11, N. 9, pp. 1-12. link to the paper
Silva, R.M.; Santos, R.L.S.; Almeida, T.A.; Pardo, T.A.S. (2020). Towards Automatically Filtering Fake News in Portuguese. Expert Systems with Applications (ESWA), Vol. 146, pp. 1-14. link to the paper
Conferences
Barbosa, B.K.S.; Di Felippo, A. (2025). NounBank.DS: a Lexical Repository of Nominal Frames from Stock Market Tweets in Brazilian Portuguese. In the Proceedings of the XVI Symposium in Information and Human Language Technology (STIL), pp. 29-41. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
*** Award for 3rd best paper in the conference ***
Wanderley, M.G.; Ferraz, L.B.S.; Almeida, T.A.; Silva, R.M. (2025). A Moving Target: Detecting Concept Drift in Brazilian Portuguese Fake News. In the Proceedings of the XVI Symposium in Information and Human Language Technology (STIL), pp. 490-501. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
*** Honorable mention in the conference ***
Lopes, L.; Nunes, M.G.V.; Duran, M.S.; Pardo, T.A.S. (2025). A sintaxe no tribunal: apresentando e explorando um corpus jurídico em português anotado sintaticamente segundo o modelo Universal Dependencies. In the Proceedings of the XVI Symposium in Information and Human Language Technology (STIL), pp. 220-232. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
Lima, G.S.; Silva, D.F.F.; Pardo, T.A.S. (2025). Sumarização de opinião multidocumento para o português: comparando um método baseado em grafo com um LLM. In the Proceedings of the X Scientific Initiation Workshop in Information Technology and Human Language (TILic), pp. 698-702. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
Pereira, M.A.; Souza, J.W.C. (2025). Anotação Enhanced Rhetorical Structure Theory em textos de User-Generated Content. In the Proceedings of the X Scientific Initiation Workshop in Information Technology and Human Language (TILic), pp. 713-717. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
Silva, C.V.C.; Souza, J.C.; Cardoso, P.F. (2025). RST Visualizer: Uma ferramenta para a análise comparativa de anotações da Teoria da Estrutura Retórica. In the Proceedings of the X Scientific Initiation Workshop in Information Technology and Human Language (TILic), pp. 728-732. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
Piai, L.; Di Felippo, A.; Roman, N.T. (2025). Named Entities in Stock Market Tweets: A Fine-Grained and Linguistically-Motivated Annotation. In the Proceedings of the X Portuguese Description Conference (JDP), pp. 654-663. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
Ceregatto, G.; Di Felippo, A. (2025). DANTEStocks-AMR em Construção: Avanços e Desafios na Anotação Semântica de Tweets Financeiros. In the Proceedings of the X Portuguese Description Conference (JDP), pp. 608-617. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
Santos, M.S.; Rodrigues, R.; Souza, J.W.C. (2025). A oposição nas relações de coerência Contrast e Concession. In the Proceedings of the X Portuguese Description Conference (JDP), pp. 664-672. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
Vale, O.A.; Miranda Jr, I.S. (2025). Análise da Anotação de Negação em Corpora sob as Diretrizes da Universal Dependencies. In the Proceedings of the X Portuguese Description Conference (JDP), pp. 627-634. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
Martinez, R.S.; Baptista, J.; Vale, O.A. (2025). Elevação de sujeito e objeto da completiva-sujeito de adjetivos em português do Brasil. In the Proceedings of the X Portuguese Description Conference (JDP), pp. 635-644. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
Munhoz, J.P.G.; Vale, O.A. (2025). O Obstáculo das Ambiguidades Estruturais da Língua para Modelos de Linguagem Linguisticamente Motivados. In the Proceedings of the X Portuguese Description Conference (JDP), pp. 645-653. September, 29 - October, 02. Fortaleza/CE, Brazil. link to the paper
Carvalho, W.C.; Roman, N.T. (2025). Classifying Emotions in Tweets from the Financial Market: A BERT-based Approach. In the Proceedings of Recent Advances in Natural Language Processing (RANLP), pp. 218-226. September, 8-10. Varna, Bulgaria. link to the paper
Duran, M.S.; Souza, E.A.; Nunes, M.G.V.; Pagano, A.S.; Pardo, T.A.S. (2025). Extending the Enhanced Universal Dependencies - addressing subjects in pro-drop languages. In the Proceedings of the Eighth Workshop on Universal Dependencies (UDW), pp. 143-152. August, 26-29. Ljubljana, Slovenia. link to the paper
Duran, M.S.; Lopes, L.; Pardo, T.A.S. (2025). The revision of linguistic annotation in the Universal Dependencies framework: a look at the annotators’ behavior. In the Proceedings of the 19th Linguistic Annotation Workshop (LAW), pp. 60-69. July, 31. Vienna, Austria. link to the paper
Barberia, L.; Schmalz, O.; Roman, N.T.; Lombard, B.; Sousa, T.M. (2025). It’s about What and How you say it: A Corpus with Stance and Sentiment Annotation for COVID-19 Vaccines Posts on X/Twitter by Brazilian Political Elites. In the Proceedings of the 5th International Conference on Natural Language Processing for Digital Humanities, pp. 365-376. May 3-4. Albuquerque, USA. link to the paper
Jorge, G.A.Z.; Bezerra, D.A.; Xavier, C.C.; Pardo, T.A.S. (2025). Multilingual Extractive Summarization: Investigating State-of-the-Art Methods for English and Brazilian Portuguese. In the Proceedings of the 34th Brazilian Conference on Intelligent Systems (BRACIS 2024), pp. 212-223. November 17-21, 2024. Belém-PA, Brazil. link to the paper
Jorge, G.A.Z.; Bezerra, D.A.; Xavier, C.C.; Pardo, T.A.S. (2024). Evaluating State-of-the-Art Extractive Summarization Methods for Brazilian Portuguese. In the Proceedings of the 18th Ibero-American Conference on Artificial Intelligence (IBERAMIA), pp. 510-514. November, 13-15. link to the paper
Lopes, L.; Pardo, T.A.S.; Duran, M.S. (2024). Syntactic parsing: where are we going? In the Proceedings of the 15th Symposium in Information and Human Language Technology (STIL), pp. 67-74. November, 17-21. Belém-PA, Brazil. link to the paper
Freitas, C.; Pardo, T.A.S. (2024). PropBank e anotação de papéis semânticos para a língua portuguesa: O que há de novo? In the Proceedings of the 15th Symposium in Information and Human Language Technology (STIL), pp. 118-128. November, 17-21. Belém-PA, Brazil. link to the paper
Di Felippo, A.; Nunes, M.G.V.; Barbosa, B. (2024). A Dependency Treebank of Tweets in Brazilian Portuguese: Syntactic Annotation Issues and Approach. In the Proceedings of the 15th Symposium in Information and Human Language Technology (STIL), pp. 192-201. November, 17-21. Belém-PA, Brazil. link to the paper
Souza, E.; Duran, M.S.; Nunes, M.G.V.; Sampaio, G.; Belasco, G.; Pardo, T.A.S. (2024). Automatic Annotation of Enhanced Universal Dependencies for Brazilian Portuguese. In the Proceedings of the 15th Symposium in Information and Human Language Technology (STIL), pp. 217-226. November, 17-21. Belém-PA, Brazil. link to the paper
*** Best paper award ***
Cardoso, P.; Souza, J.; Rodrigues, R.; Dantas, E.; Bárbara, L.S.; Araújo, M.; Gama, N.; Almeida, T.; Cruz, G. (2024). A Linguagem em Foco: Anotação de Sinalizadores Discursivos em Textos Jornalísticos. In the Proceedings of the 15th Symposium in Information and Human Language Technology (STIL), pp. 247-256. November, 17-21. Belém-PA, Brazil. link to the paper
Di Felippo, A.; Roman, N.T.; Barbosa, B.; Pardo, T.A.S. (2024). Genipapo - A Multigenre Dependency Parser for Brazilian Portuguese. In the Proceedings of the 15th Symposium in Information and Human Language Technology (STIL), pp. 257-266. November, 17-21. Belém-PA, Brazil. link to the paper
Lopes, L.; Duran, M.S.; Pardo, T.A.S. (2024). Desambiguação de lema e atributos morfolóogicos na anotação do corpus Porttinari-base. In Anais da IX Jornada de Descrição do Português (JDP), pp. 336-345. November, 17-21. Belém-PA, Brazil. link to the paper
Souza, E.; Duran, M.S.; Pagano, A. (2024). An NLP approach to impersonal –se in Brazilian Portuguese. In Anais da IX Jornada de Descrição do Português (JDP), pp. 346-355. November, 17-21. Belém-PA, Brazil. link to the paper
Duran, M.S.; Nunes, M.G.V.; Pardo, T.A.S. (2024). Inferências baseadas em sintaxe: a anotação de sujeitos implícitos. In Anais da IX Jornada de Descrição do Português (JDP), pp. 356-364. November, 17-21. Belém-PA, Brazil. link to the paper
Wick-Pedro, G.; Santos, R.; Vale, O.A. (2024). Linguistic and emotional dynamics in satirical vs. real news: a psycholinguistic analysis. In Anais da IX Jornada de Descrição do Português (JDP), pp. 386-392. November, 17-21. Belém-PA, Brazil. link to the paper
Martinez, R.; Baptista, J.; Vale, O.A. (2024). Complementos de eco de adjetivos com completiva-sujeito em português do Brasil. In Anais da IX Jornada de Descrição do Português (JDP), pp. 393-402. November, 17-21. Belém-PA, Brazil. link to the paper
Almeida, T.; Almeida, P.; Cardoso, P. (2024). Relações Retóricas de List e Sequence em textos jornalísticos. In Anais do IX Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana (TILic), pp. 413-417. November, 18-21. Belém-PA, Brazil. link to the paper
Gama, N.; Souza, J. (2024). Estudo preliminar sobre sinalizadores discursivos para Conteúdo Gerado por Usuário. In Anais do IX Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana (TILic), pp. 418-423. November, 18-21. Belém-PA, Brazil. link to the paper
Bárbara, L.; Rodrigues, R.; Souza, J. (2024). Relações de coerência do português brasileiro: um estudo bibliográfico-documental da RST e seus sinalizadores discursivos. In Anais do IX Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana (TILic), pp. 424-428. November, 18-21. Belém-PA, Brazil. link to the paper
Pereira, M.; Souza, J. (2024). Subsídios Linguísticos para Classificação Automática de Textos de User-Generated Content. In Anais do IX Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana (TILic), pp. 429-433. November, 18-21. Belém-PA, Brazil. link to the paper
Dantas, E.; Rodrigues, R.; Souza, J. (2024). Relações de coerência do espanhol peninsular: Um estudo bibliográfico-documental da Rhetorical Structure Theory. In Anais do IX Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana (TILic), pp. 434-439. November, 18-21. Belém-PA, Brazil. link to the paper
Cruz, G.; Souza, J.; Cardoso, P. (2024). Estratégias Automáticas para Análise da Concordância da Anotação de Sinalizadores Discursivos. In Anais do IX Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana (TILic), pp. 440-444. November, 18-21. Belém-PA, Brazil. link to the paper
Ramos, I.; Souza, J. (2024). Classificação automática de textos de User-Generated Content utilizando Aprendizagem de Máquina Supervisionado. In Anais do IX Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana (TILic), pp. 457-462. November, 18-21. Belém-PA, Brazil. link to the paper
Vargas, F.; Salles, I.; Alves, D.; Agrawal, A.; Pardo, T.A.S.; Benevenuto, F. (2024). Improving Explainable Fact-Checking via Sentence-Level Factual Reasoning. In the Proceedings of the Seventh Fact Extraction and VERification Workshop (FEVER), pp. 192-204. November, 15. link to the paper
Barros, C.D.; Vale, O.A. (2024). Roda Viva: um corpus oral e a Universal Dependencies. In Anais do XVI Encontro de Linguística de Corpus (ELC), pp. 89-94. October, 21-24. pdf
Duran, M.S.; Pardo, T.A.S. (2024). Anotação de córpus, um lugar privilegiado de observação linguística: o estudo das aposições do português brasileiro segundo o modelo Universal Dependencies. In Anais do XVI Encontro de Linguística de Corpus (ELC), pp. 118-123. October, 21-24. pdf
Sobrevilla Cabezudo, M.A.; Inacio, M.L.; Pardo, T.A.S. (2024). Investigating Paraphrase Generation as a Data Augmentation Strategy for Low-Resource AMR-to-Text Generation. In the Proceedings of the 17th International Natural Language Generation Conference (INLG), pp 663-675. September, 23-27. link to the paper
Santos, W.R.; Paraboni, I. (2024). Prompt-based mental health screening from social media text. In the Proceedings of the XIII Brazilian Workshop on Social Network Analysis and Mining (BraSNAM), pp. 186-192. July, 21-25. link to the paper
Silva, D.P.G.; Pardo, T.A.S. (2024). Grammar Induction for Brazilian Indigenous Languages. In the Proceedings of 1st Workshop on NLP for Indigenous Languages of Lusophone Countries (ILLC-NLP), pp. 64-72. May, 12. link to the paper
Silva, N. L. P.; Roman, N.T.; Di Felippo, A. (2024). Bringing Pragmatics to Porttinari - Adding Speech Acts to News Texts. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 137-145. May, 13-15. link to the paper
Zerbinati, M.M.; Roman, N.T.; Di Felippo, A. (2024). A Corpus of Stock Market Tweets Annotated with Named Entities. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 276-284. May, 13-15. link to the paper
Machado, M.; Ruiz, E. (2024). Evaluating large language models for the tasks of PoS tagging within the Universal Dependency framework. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 454-460. May, 13-15. link to the paper
Wick-Pedro, G.; Silva, C.F.; Inácio, M.L.; Vale, O.A.; Caseli, H.M. (2024). Using Large Language Models for Identifying Satirical News in Brazilian Portuguese. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 156-167. May, 13-15. link to the paper
Martinez, R.; Baptista, J.; Vale, O. (2024). Towards a Syntactic Lexicon of Brazilian Portuguese Adjectives. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 532-538. May, 13-15. link to the paper
Lopes, L.; Pardo, T.A.S. (2024). Towards Portparser - a highly accurate parsing system for Brazilian Portuguese following the Universal Dependencies framework. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 401-410. May, 13-15. link to the paper
Silva, M.C.R.; Oliveira, V.A.; Pardo, T.A.S. (2023). A Sentiment Analysis Benchmark for Automated Machine Learning Applications. In the Proceedings of the IEEE 22nd International Conference on Machine Learning and Applications (ICMLA), pp. 1487-1494. December, 15-17. link to the paper
Vargas, F.; Carvalho, I.; Schmeisser-Nieto, W.S.; Benevenuto, F.; Pardo, T.A.S. (2023). NoHateBrazil: A Brazilian Portuguese Text Offensiveness Analysis System. In the Proceedings of the 14th Conference on Recent Advances in Natural Language Processing (RANLP), pp. 1180-1186. September, 4-6. link to the paper
Vargas, F.; Carvalho, I.; Hürriyetoğlu, A.; Pardo, T.A.S.; Benevenuto, F. (2023). Socially Responsible Hate Speech Detection: Can Classifiers Reflect Social Stereotypes? In the Proceedings of the 14th Conference on Recent Advances in Natural Language Processing (RANLP), pp. 1187-1196. September, 4-6. link to the paper
Vargas, F.; Jaidka, K.; Pardo, T.A.S.; Benevenuto, F. (2023). Predicting Sentence-Level Factuality of News and Bias of Media Outlets. In the Proceedings of the 14th Conference on Recent Advances in Natural Language Processing (RANLP), pp. 1197-1206. September, 4-6. link to the paper
Lopes, L.; Fernandes, P.; Duran, M.S.; Inácio, M.L.; Pardo, T.A.S. (2023). Disambiguation of Universal Dependencies Part-of-Speech Tags of Closed Class Words in Portuguese. In the Proceedings of the 12th Brazilian Conference on Intelligent Systems (BRACIS), pp. 241-255. September, 25-29. Link to the paper and data used in the paper
Rodrigues, R.; Souza, J.W.; Cardoso, P.C.F. (2023). Sinalizadores retórico-discursivos: revisitando a anotação RST no córpus CSTNews. In Anais da VIII Jornada de Descrição do Português (JDP), pp. 249-257. September, 25-29. pdf
Duran, M.S.; Nunes, M.G.V. (2023). Aposições anafóricas e catafóricas no português e sua anotação no esquema Universal Dependencies. In Anais da VIII Jornada de Descrição do Português (JDP), pp. 268-277. September, 25-29. pdf
Scandarolli, C.L.; Di Felippo, A.; Roman, N.T.; Pardo, T.A.S. (2023). Tipologia de fenômenos ortográficos e lexicais em CGU: o caso dos tweets do mercado financeiro. In Anais da VIII Jornada de Descrição do Português (JDP), pp. 240-248. September, 25-29. pdf
Martinez, R.M.S.M; Vale, O.A. (2023). Formal features for a syntactic-semantic classification of predicative adjectives in Brazilian Portuguese. In Anais da VIII Jornada de Descrição do Português (JDP), pp. 336-345. September, 25-29. pdf
Silva, D.P.G.; Pardo, T.A.S. (2023). Indução Gramatical para o Português: a Contribuição da Informação Mútua para Descoberta de Relações de Dependência. In Anais da VIII Jornada de Descrição do Português (JDP), pp. 298-307. September, 25-29. pdf
Souza, A.; Ruiz, E.E.S. (2023). Lexical noun phrase chunking with Universal Dependencies for Portuguese. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 422-431. September, 25. pdf
Couto, M.M.L.; Vale, O.A. (2023). Um estudo das construções dar + para + V [infinitivo] nas Universal Dependencies. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 481-490. September, 25. pdf
Barbosa, B.K.S.; Di Felippo, A. (2023). Em Direção à Anotação Sintática - UD de Tweets do Mercado Financeiro. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 499-508. September, 25. pdf
Duran, M.S.; Nunes, M.G.V.; Pardo, T.A.S. (2023). Construções sintáticas do português que desafiam a tarefa de parsing: uma análise qualitativa. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 432-441. September, 25. pdf
Pagano, A.S.; Duran, M.S.; Pardo, T.A.S. (2023). Enhanced dependencies para o português brasileiro. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 461-470. September, 25. pdf
Duran, M.S. (2023). Insights into the UD Tagset: Unveiling its Intricacies. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 491-498. September, 25. pdf
Lopes, L.; Duran, M.S.; Pardo, T.A.S. (2023). Verifica-UD: a Verifier for Universal Dependencies Annotation for Portuguese. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 451-460. September, 25. pdf
Santos, W.R.; Paraboni, I. (2023). Predição de transtorno depressivo em redes sociais: BERT supervisionado ou ChatGPT zero-shot? In the Proceedings of the 14th Symposium in Information and Human Language Technology (STIL), pp. 11-21. September, 25-29. pdf
Barberia, L.G.; Schmalz, P.H.S.; Roman, N.T. (2023). When Tweets Get Viral - A Deep Learning Approach for Stance Analysis of Covid-19 Vaccines Tweets by Brazilian Political Elites. In the Proceedings of the 14th Symposium in Information and Human Language Technology (STIL), pp. 104-114. September, 25-29. pdf
Silva, E.H.; Pardo, T.A.S.; Roman, N.T. (2023). Etiquetagem morfossintática multigênero para o português do Brasil segundo o modelo "Universal Dependencies". In the Proceedings of the 14th Symposium in Information and Human Language Technology (STIL), pp. 63-73. September, 25-29. pdf
*** Best paper award ***
Duran, M.S.; Lopes, L.; Nunes, M.G.V.; Pardo, T.A.S. (2023). The Dawn of the Porttinari Multigenre Treebank: Introducing its Journalistic Portion. In the Proceedings of the 14th Symposium in Information and Human Language Technology (STIL), pp. 115-124. September, 25-29. pdf
Silva, M.C.R.; Oliveira, V.A.; Pardo, T.A.S. (2023). A Sentiment Analysis Benchmark for Automated Machine Learning Applications and a Proof of Concept in Hate Speech Detection. In the Proceedings of the 14th Symposium in Information and Human Language Technology (STIL), pp. 199-206. September, 25-29. pdf
Jorge, G.A.Z. and Pardo, T.A.S. (2023). SteamBR: a dataset for game reviews and evaluation of a state-of-the-art method for helpfulness prediction. In the Proceedings of the XII Brazilian Workshop on Social Network Analysis and Mining (BraSNAM), pp. 210-215. August, 6-11. pdf
Sobrevilla Cabezudo, M.A. and Pardo, T.A.S. (2022). Exploring a POS-based Two-stage Approach for Improving Low-Resource AMR-to-Text Generation. In the Proceedings of the 2nd Workshop on Natural Language Generation, Evaluation, and Metrics (GEM), pp. 531-538. December, 7. pdf
Souza, A. and Ruiz, E. (2022). Investigating Lexical NP-Chunking with Universal Dependencies for Portuguese. In the Proceedings of the 19th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 342-351. November, 28 to December, 01. pdf
Gomes, I.A. and Roman, N. (2022). How aspects of similar datasets can impact distributional models. In the Proceedings of the 19th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 579-590. November, 28 to December, 01. pdf
Nanclarez, R.; Roman, N.; Silva, F. (2022). Generalizing over data sets: a preliminary study with BERT for Natural Language Inference. In the Proceedings of the 19th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 602-611. November, 28 to December, 01. pdf
Machado, M.T. and Pardo, T.A.S. (2022). NILC at ABSAPT 2022: Aspect Extraction for Portuguese. In the Proceedings of the IberLEF Shared Task on Aspect-Based Sentiment Analysis in Portuguese (ABSAPT), pp. 1-10. September, 20. pdf
Lopes, L.; Duran, M.S.; Fernandes, P.H.L.; Pardo, T.A.S. (2022). PortiLexicon-UD: a Portuguese Lexical Resource according to Universal Dependencies Model. In the Proceedings of the 13th Edition of the Language Resources and Evaluation Conference (LREC), pp. 6635‑6643. June, 20-25. pdf
Machado, M.T. and Pardo, T.A.S. (2022). Evaluating Methods for Extraction of Aspect Terms in Opinion Texts in Portuguese - the Challenges of Implicit Aspects. In the Proceedings of the 13th Edition of the Language Resources and Evaluation Conference (LREC), pp. 3819-3828. June, 20-25. pdf
Sousa, R.F. and Pardo, T.A.S. (2022). Evaluating Content Features and Classification Methods for Helpfulness Prediction of Online Reviews: Establishing a Benchmark for Portuguese. In the Proceedings of the 12th Workshop on Computational Approaches to Subjectivity, Sentiment & Social Media Analysis (WASSA), pp. 204-213. May, 26. link to the paper
Oliveira, G.M.; Berlanga Neto, P.; Ruiz, E.E.R. (2022). Shallow parsing of Portuguese texts annotated under Universal Dependencies. In the Proceedings of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 1-8. March, 21. pdf
Duran, M.S.; Oliveira, H.; Scandarolli, C. (2022). Que simples que nada: a anotação da palavra que em córpus de UD. In the Proceedings of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 1-11. March, 21. pdf
Miranda, L.G.M. and Pardo, T.A.S. (2022). UDConcord: A Concordancer for Universal Dependencies Treebanks. In the Proceedings of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 1-10. March, 21. pdf
Miranda, L.G.M. and Pardo, T.A.S. (2022). An Improved and Extended Annotation Tool for Universal Dependencies-based Treebank Construction. In the Proceedings of the PROPOR Demonstrations Workshop, pp. 1-3. March, 21-23. pdf
Anchiêta, R.T. and Pardo, T.A.S. (2022). Abstract Meaning Representation Parsing for the Brazilian Portuguese Language. In the Proceedings of the International Conference on Computational Processing of Portuguese (PROPOR) (LNAI 13208), pp. 429-434. March, 21-23. link to the paper
*** Best PhD dissertation award ***
Machado, M.T.; Pardo, T.A.S.; Ruiz, E.E.S.; Di Felippo, A.; Vargas, F. (2022). Implicit opinion aspect clues in Portuguese texts: analysis and categorization. In the Proceedings of the International Conference on Computational Processing of Portuguese (PROPOR) (LNAI 13208), pp. 68-78. March, 21-23. link to the paper
Mello, H.; Raso, T.; Oliveira Jr, M.; Sardinha, T.B.; Freitas, C.; Aluísio, S.; Pardo, T.A.S.; Duran, M.; Leal, S.; Davies, M.; Galves-Chambelland, C.; (2021). Brazilian Portuguese: Spoken, Written and Diachronic Corpora. In the Proceedings of the 54th Congress of the International Society of Italian Linguistics ''Corpora and Linguistic Studies'' (SLI), pp. 179-187. September, 8-10. link to the paper
Duran, M.S.; Rassi, A.P.; Pagano, A.S.; Pardo, T.A.S. (2021). On auxiliary verb in Universal Dependencies: untangling the issue and proposing a systematized annotation strategy. In the Proceedings of the Sixth International Conference on Dependency Linguistics (Depling), pp. 10-21. March, 22-23, 2022. link
Sousa, R.F. and Pardo, T.A.S. (2021). The Challenges of Modeling and Predicting Online Review Helpfulness. In the Proceedings of the 18th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 727-738. November, 29 to December, 3. pdf
Silva, E.H.; Pardo, T.A.S.; Roman, N.T.; Di Felippo, A. (2021). Universal Dependencies for Tweets in Brazilian Portuguese: Tokenization and Part of Speech Tagging. In the Proceedings of the 18th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 434-445. November, 29 to December, 3. pdf
Lopes, L.; Duran, M.S.; Pardo, T.A.S. (2021). Universal Dependencies-based PoS Tagging Refinement through Linguistic Resources. In the Proceedings of the 10th Brazilian Conference on Intelligent System (BRACIS), pp. 601-615. November, 29 to December, 3. link to the paper and data used in the paper
Di Felippo, A.; Postali, C.; Ceregatto, G.; Gazana, L.S.; Silva, E.H.; Roman, N.T.; Pardo, T.A.S. (2021). Descrição Preliminar do Corpus DANTEStocks: Diretrizes de Segmentação para Anotação segundo Universal Dependencies. In the Proceedings of the VII Workshop on Portuguese Description (JDP), pp. 335-343. December, 1. pdf
Duran, M.S.; Lopes, L.; Pardo, T.A.S. (2021). Descrição de numerais segundo modelo Universal Dependencies e sua anotação no português. In the Proceedings of the VII Workshop on Portuguese Description (JDP), pp. 344-352. December, 1. pdf
Miranda Junior, I.S.; Couto, M.M.L.; Coelho, F.L.; Rodrigues, R.; Vale, O. (2021). A propósito do verbo falar no português brasileiro: uma análise em corpus e em bases de dados verbais. In the Proceedings of the VII Workshop on Portuguese Description (JDP), pp. 315-324. December, 1. pdf
Wick-Pedro, G. and Santos, R.L.S. (2021). Complexidade textual em notícias satíricas: uma análise para o português do Brasil. In the Proceedings of the VII Workshop on Portuguese Description (JDP), pp. 409-415. December, 1. pdf
Belisário, L.B. and Pardo, T.A.S. (2021). Avaliação de parsers na detecção de relações essenciais do modelo Universal Dependencies para o português. In the Proceedings of the VII Student Workshop on Information and Human Language Technology (TILic), pp. 442-446. November, 30. pdf
Machado, M.T.; Pardo, T.A.S.; Di Felippo, A.; Ruiz, E.E.S. (2021). Learning rules for automatic identification of implicit aspects in Portuguese. In the Proceedings of the XIV Symposium in Information and Human Language (STIL), pp. 82-91. November, 29 to December, 3. pdf
Monte-Serrat, D.M.; Machado, M.T.; Ruiz, E.E.S. (2021). A machine learning approach to literary genre classification on Portuguese texts: circumventing NLP’s standard varieties. In the Proceedings of the XIV Symposium in Information and Human Language (STIL), pp. 255-264. November, 29 to December, 3. pdf
Santos, R.L.S. and Pardo, T.A.S. (2021). Structural Characterization and Graph-based Detection of Fake News in Portuguese. In the Proceedings of the XIV Symposium in Information and Human Language (STIL), pp. 199-208. November, 29 to December, 3. pdf
Pardo, T.A.S.; Duran, M.S.; Lopes, L.; Di Felippo, A.; Roman, N.T.; Nunes, M.G.V. (2021). Porttinari - a large multi-genre treebank for brazilian portuguese. In the Proceedings of the XIII Symposium in Information and Human Language (STIL), pp. 1-10. November, 29 to December, 3. pdf
Inácio, M.L. and Pardo, T.A.S. (2021). Semantic-Based Opinion Summarization. In the Proceedings of Recent Advances in Natural Language Processing (RANLP), pp. 624-633. September, 1-3. pdf
Sobrevilla Cabezudo, M.A. and Pardo, T.A.S. (2020). NILC at WebNLG+: Pretrained Sequence-to-Sequence Models on RDF-to-Text Generation. In the Proceedings of the 3rd International Workshop on Natural Language Generation from the Semantic Web (WebNLG+), pp. 131-136. December, 18. pdf
Silva, A.S.R. and Roman, N.T. (2020). No Place For Hate Speech @ HaSpeeDe 2: Ensemble to Identify Hate Speech in Italian. In the Proceedings of the Seventh Evaluation Campaign of Natural Language Processing and Speech Tools for Italian - Final Workshop (EVALITA), pp. 154-158. December, 17. pdf
Silva, A.S.R. and Roman, N.T. (2020). No Place For Hate Speech @ AMI: Convolutional Neural Network and Word Embedding for the Identification of Misogyny in Italian. In the Proceedings of the Seventh Evaluation Campaign of Natural Language Processing and Speech Tools for Italian - Final Workshop (EVALITA), pp. 60-63. December, 17. pdf
Sobrevilla Cabezudo, M.A. and Pardo, T.A.S. (2020). NILC at SR’20: Exploring Pre-Trained Models in Surface Realisation. In the Proceedings of the Third Workshop on Multilingual Surface Realisation (MSR), pp. 50-56. December, 12. pdf
Anchiêta, R.T. and Pardo, T.A.S. (2020). Semantically Inspired AMR Alignment for the Portuguese language. In the Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP), pp. 1595-1600. November, 16-20. pdf
Silva, A.S.R. and Roman, N.T. (2020). Hate Speech Detection in Portuguese with Naïve Bayes, SVM, MLP and Logistic Regression. In the Proceedings of the 17th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 1-12. October, 20-23. pdf
Technical reports
Piai, L.; Di Felippo, A.; Roman, N.T. (2025). Guia de anotação de entidades nomeadas em tweets do mercado financeiro: adaptação da taxonomia hierárquica do segundo HAREM. Relatório Técnico do ICMC 452. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Julho, 24p. pdf
Anchiêta, R.T. (2024). The evaluation of abstract meaning representation structures. Relatório Técnico do ICMC 451. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Dezembro, 17p. pdf
Freitas, C. (2024). Anotação de papéis semânticos no corpus Porttinari-base: procedimentos, resultados e análises. Relatório Técnico do ICMC 450. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Dezembro, 145p. pdf
Duran, M.S.; Freitas, C. (2024). Guia de anotação de papéis semânticos seguindo o modelo propbank no córpus Porttinari-base. Relatório Técnico do ICMC 449. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Novembro, 50p. pdf
Duran, M.S. (2024). Anotação de Enhanced Dependencies: Orientações para Anotação de Relações de Dependência Sintática do Tipo Enhanced em Língua Portuguesa, seguindo as Diretrizes da Abordagem Universal Dependencies (UD). Relatório Técnico do ICMC 448. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Agosto, 89p. pdf
Dantas, E.; Bárbara, L.J.S.; Pereira, M.A.; Gama, N.S.; Almeida, T.J.A.; Souza, J.W.C.; Cardoso, P.C.F.; Rodrigues, R. (2024). Manual de anotação de sinalizadores discursivos em textos jornalísticos. Relatório Técnico do ICMC 447. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Agosto, 29p. pdf
Di Felippo, A.; Nunes, M.G.V.; Barbosa, B.K.S. (2024). Diretrizes de anotação de relações de dependência em tweets do mercado financeiro. Relatório Técnico do ICMC 446. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Abril, 70p. pdf
Silva, N.L.P.; Roman, N.T.; Di Felippo, A. (2023). Manual de Anotação do corpus Porttinari-base com Atos de Fala. Relatório Técnico PPgSI-002/2023. Escola de Artes, Ciências e Humanidades, Universidade de São Paulo. São Paulo-SP, Novembro, 14p. pdf
Lopes, L.; Duran, M. S.; Pardo, T. A. S. (2023). Atribuição de lemas e atributos morfológicos seguindo as decisões adotadas na anotação do córpus Portinari-base dentro das diretrizes da Universal Dependencies (UD). Relatório Técnico do ICMC 445. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Agosto, 34p. pdf
Lopes, L.; Duran, M. S.; Pardo, T. A. S. (2023). Verifica-UD: uma ferramenta online para verificação de textos em português anotados no formato CoNLL-U segundo o padrão Universal Dependencies. Relatório Técnico do ICMC 444. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Agosto, 31p. pdf
Duran, M.S.; Nunes, M.G.V.; Pardo, T.A.S. (2023). Avaliação qualitativa do analisador sintático UDPipe 2 treinado sobre o córpus jornalístico Porttinari-base. Relatório Técnico do ICMC 442. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Abril, 58p. pdf
Duran, M.S. (2022). Manual de Anotação de Relações de Dependência - Versão Revisada e Estendida: Orientações para anotação de relações de dependência sintática em Língua Portuguesa, seguindo as diretrizes da abordagem Universal Dependencies (UD). Relatório Técnico do ICMC 440. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Outubro, 166p. pdf
Lopes, L.; Duran, M.S.; Nunes, M.G.V.; Pardo, T.A.S. (2022). Corpora building process according to the Universal Dependencies model: an experiment for Portuguese. Relatório Técnico do ICMC 439. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Março, 22p. link to the report and to the annotated corpus
Di Felippo, A.; Postali, C.; Ceregatto, G.; Gazana, L.S.; Roman, N.T. (2022). Diretrizes de Anotação de PoS Tags em Tweets do Mercado Financeiro: Orientações para anotação em língua portuguesa segundo a abordagem Universal Dependencies (UD). Relatório Técnico do ICMC 438. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Março, 24p. link
Cunha, F.D.; Souza, K.V.M.; Pardo, T.A.S. (2022). Ações para o desenvolvimento de habilidades de matemática e computação para alunos do ensino médio. Relatório Técnico do ICMC 437. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Fevereiro, 11p. link
Inácio, M.L. and Pardo, T.A.S. (2021). A survey on semantic representations for text summarization. Relatório Técnico do ICMC 436. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Dezembro, 26p. link
Duran, M.S. (2021). Manual de Anotação de Relações de Dependência: Orientações para anotação de relações de dependência sintática em Língua Portuguesa, seguindo as diretrizes da abordagem Universal Dependencies (UD). Relatório Técnico do ICMC 435. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Dezembro, 79p. pdf
Duran, M.S. (2021). Manual de Anotação de PoS tags: Orientações para anotação de etiquetas morfossintáticas em Língua Portuguesa, seguindo as diretrizes da abordagem Universal Dependencies (UD). Relatório Técnico do ICMC 434. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Setembro, 55p. pdf
Undergradudate, MSc and PhD monographs
Ceregatto, G. (2025). Representação formal de significado: o caso dos tweets do mercado financeiro. MSc Dissertation. Universidade Federal de São Carlos, São Carlos/SP, 153p. pdf
Piai, L. (2025). Anotação de corpus: caracterização de Entidades Nomeadas em tweets do mercado financeiro. MSc Dissertation. Universidade Federal de São Carlos, São Carlos/SP, 122p. pdf
Lima, G.S. (2025). Desinformação como Serviço: Análise da Geração Personalizada de Narrativas por Modelos de Língua. Undergraduate monograph. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 33p. pdf
Barbosa, B.K.S. (2024). Descrição sintático-semântica de nomes predicadores em tweets do mercado financeiro em português. MSc Dissertation. Universidade Federal de São Carlos, São Carlos/SP, 208p. pdf
Silva, D.P.G. (2024). Indução gramatical automática para o português. MSc Dissertation. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 160p. pdf
Souza, J.W.C. (2023). Exploração de técnicas de classificação automática de papeis semânticos. MBA monograph (on Artificial Intelligence and Big Data). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 45p. pdf
Machado, M.T. (2023). Methods for identifying aspects in opinion texts in Portuguese: the case of implicit aspects and their typological analysis. PhD Thesis. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 143p. pdf
Santos, K.H.R. (2023). Classificação de textos de petições jurídicas com base em técnicas de Processamento de Línguas Naturais. MBA monograph (on Artificial Intelligence and Big Data). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 114p. pdf
Valença, E.C. (2023). Detecção automática de notícias falsas em português: avaliando técnicas baseadas em redes complexas e classificação via aprendizado de máquina. Undergraduate monograph. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 52p. pdf
Guerreiro, A.F. (2023). Detecção automática de notícias falsas em português: avaliando técnicas baseadas em grafos de conhecimento e classificação a partir de modelos de língua. Undergraduate monograph. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 55p. pdf
Silva, E.H. (2023). Etiquetagem morfossintática multigênero para o português do Brasil segundo o modelo Universal Dependencies. MSc Dissertation. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 139p. pdf
Sousa, R.F. (2023). Classificação da utilidade de opiniões em português brasileiro. PhD Thesis. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 135p. pdf
Sobrevilla Cabezudo, M.A. (2023). Natural Language Generation from Abstract Meaning Representation for Brazilian Portuguese. PhD Thesis. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 197p. pdf
Coelho, F.L. (2022). Uma análise comparativa das construções com verbos psicológicos do português brasileiro e europeu. PhD Thesis. Departamento de Letras, Universidade Federal de São Carlos. São Carlos/SP, 76p. pdf
Wick-Pedro, G (2022). Aspectos linguísticos na descrição de notícias satíricas do português do Brasil: uma proposta tipológica. PhD Thesis. Departamento de Letras, Universidade Federal de São Carlos. São Carlos/SP, 161p. pdf
Jorge, G.A.Z. (2022). Prevendo a utilidade de comentários em Português Brasileiro de jogos no site Steam. MBA monograph (on Artificial Intelligence and Big Data). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 65p. pdf
Ceregatto, G. (2022). Caracterização Morfossintática de um Corpus de Tweets e Análise Preliminar de Erros de Tagging. Undergraduate monograph. Departamento de Letras, Universidade Federal de São Carlos. São Carlos/SP, 46p. pdf
Miranda Jr, I.S. (2022). Não é nada não: uma análise das lexias negativas do português para anotação nas Universal Dependencies. MSc Dissertation. Departamento de Letras, Universidade Federal de São Carlos. São Carlos/SP, 133p. pdf
Santos, R.L.S. (2022). Detecção automática de notícias falsas em português. PhD Thesis. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 240p. link
Silva, A.S.R. (2021). Estudo de modelos distribucionais para detecção de discurso de ódio em português. MSc Dissertation. Escola de Artes, Ciências e Humanidades, Universidade de São Paulo. São Paulo/SP, 77p. pdf
Inácio, M.L. (2021). Sumarização de Opinião com base em Abstract Meaning Representation. MSc Dissertation. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 152p. pdf