Publications
POeTiSA: POrtuguese processing - Towards Syntactic Analysis and parsing
Journals
Di Felippo, A.; Roman, N.T.; Pardo, T.A.S.; Moura, L.P. (2024). O Corpus DANTEStocks: Uma análise da distribuição de etiquetas morfossintáticas de acordo com o modelo Universal Dependencies. Revista da ABRALIN. To appear.
Duran, M.S.; Lopes, L.; Nunes, M.G.V.; Pardo, T.A.S. (2024). Construções comparativas em português e sua anotação usando a sintaxe de dependências. Revista da ABRALIN. To appear.
Rodrigues, R.; Di Felippo, A.; Roman, N.T.; Semcovici, P.; Souza, J.W.C.; Pardo, T.A.S. (2024). Termos do mercado financeiro: um estudo do corpus DANTEStocks. Tradterm, Vol. 46, pp. 6-30. link to the paper
Rodrigues, R.; Vale, O.A. (2023). Falsos Diminutivos do Português Brasileiro e seu Reconhecimento em um Dicionário Computacional de Livre Acesso. Revista do GELNE, Vol. 25, N. 3. link to the paper
Cunha, F.D.; Souza, K.V.M.; Pardo, T.A.S. (2023). Ações para aquisição de conhecimento de matemática e de computação por alunos do ensino médio. Grad+: Revista de Graduação USP, Vol. 7, N. 1, pp. 75-88. link to the paper
Santos, W.R.; Sungwon, Y.; Paraboni, I. (2023). Mental health prediction from social media text using mixture of experts. IEEE Latin America Transactions, Vol. 21, N. 6, pp.723-729. link to the paper
Santos, W.R.; Oliveira, R.L.; Paraboni, I. (2023). SetembroBR: a social media corpus for depression and anxiety disorder prediction. Language Resources and Evaluation. link to the paper
Inácio, M.L.; Sobrevilla Cabezudo, M.A.; Ramisch, R.; Di Felippo, A.; Pardo, T.A.S. (2023). The AMR-PT corpus and the semantic annotation of challenging sentences from journalistic and opinion texts. DELTA: Documentação e Estudos em Linguística Teórica e Aplicada, Vol. 39, N. 3, pp. 1-31. link to the paper
Duran, M.S.; Nunes, M.G.V.; Lopes, L.; Pardo, T.A.S. (2022). Manual de anotação como recurso de Processamento de Linguagem Natural: o modelo Universal Dependencies em língua portuguesa. Domínios de Lingu@gem, Vol. 16, N. 4, pp. 1608-1643. link to the paper
Rodrigues, R.; Lemos-Couto, M.; Coelho, F.L.; Miranda Jr., I.S.; Vale, O. (2022). Bases lexicais verbais do português brasileiro. Domínios de Lingu@gem, Vol. 16, N. 4, pp. 1489-1516. link to the paper
Anchiêta, R.T. and Pardo, T.A.S. (2022). Analise Semântica com base em AMR para o Português. LinguaMÁTICA, Vol. 14, N. 1, pp. 33-48. link to the paper
Silva, R.R. and Pardo, T.A.S. (2022). Building Contrastive Summaries of Subjective Text Via Opinion Ranking. Revista de Informática Teórica e Aplicada (RITA), Vol. 29, N. 2, pp. 11-34. link to the paper
Sobrevilla Cabezudo, M.A. and Pardo, T.A.S. (2022). Low-resource AMR-to-Text Generation: A Study on Brazilian Portuguese. Procesamiento del Lenguaje Natural, Vol. 68, pp. 85-97. link to the paper
Belisário, L.B.; Ferreira, L.G.; Pardo, T.A.S. (2020). Evaluating Richer Features and Varied Machine Learning Models for Subjectivity Classification of Book Review Sentences in Portuguese. Information, Vol. 11, N. 9, pp. 1-14. link to the paper
Anchiêta, R.T.; Sousa, R.F.; Pardo, T.A.S. (2020). Modeling the Paraphrase Detection Task over a Heterogeneous Graph Network with Data Augmentation. Information, Vol. 11, N. 9, pp. 1-12. link to the paper
Silva, R.M.; Santos, R.L.S.; Almeida, T.A.; Pardo, T.A.S. (2020). Towards Automatically Filtering Fake News in Portuguese. Expert Systems with Applications (ESWA), Vol. 146, pp. 1-14. link to the paper
Conferences
Duran, M.S.; Pardo, T.A.S. (2024). Anotação de córpus, um lugar privilegiado de observação linguística: o estudo das aposições do português brasileiro segundo o modelo Universal Dependencies. In Anais do XVI Encontro de Linguística de Corpus (ELC). To appear.
Silva, D.P.G.; Pardo, T.A.S. (2024). Grammar Induction for Brazilian Indigenous Languages. In the Proceedings of 1st Workshop on NLP for Indigenous Languages of Lusophone Countries (ILLC-NLP), pp. 64-72. May, 12. link to the paper
Silva, N. L. P.; Roman, N.T.; Di Felippo, A. (2024). Bringing Pragmatics to Porttinari - Adding Speech Acts to News Texts. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 137-145. May, 13-15. link to the paper
Zerbinati, M.M.; Roman, N.T.; Di Felippo, A. (2024). A Corpus of Stock Market Tweets Annotated with Named Entities. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 276-284. May, 13-15. link to the paper
Machado, M.; Ruiz, E. (2024). Evaluating large language models for the tasks of PoS tagging within the Universal Dependency framework. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 454-460. May, 13-15. link to the paper
Wick-Pedro, G.; Silva, C.F.; Inácio, M.L.; Vale, O.A.; Caseli, H.M. (2024). Using Large Language Models for Identifying Satirical News in Brazilian Portuguese. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 156-167. May, 13-15. link to the paper
Martinez, R.; Baptista, J.; Vale, O. (2024). Towards a Syntactic Lexicon of Brazilian Portuguese Adjectives. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 532-538. May, 13-15. link to the paper
Lopes, L.; Pardo, T.A.S. (2024). Towards Portparser - a highly accurate parsing system for Brazilian Portuguese following the Universal Dependencies framework. In the Proceedings of the 16th International Conference on Computational Processing of Portuguese (PROPOR), pp. 401-410. May, 13-15. link to the paper
Silva, M.C.R.; Oliveira, V.A.; Pardo, T.A.S. (2023). A Sentiment Analysis Benchmark for Automated Machine Learning Applications. In the Proceedings of the IEEE 22nd International Conference on Machine Learning and Applications (ICMLA), pp. 1487-1494. December, 15-17. link to the paper
Vargas, F.; Carvalho, I.; Schmeisser-Nieto, W.S.; Benevenuto, F.; Pardo, T.A.S. (2023). NoHateBrazil: A Brazilian Portuguese Text Offensiveness Analysis System. In the Proceedings of the 14th Conference on Recent Advances in Natural Language Processing (RANLP), pp. 1180-1186. September, 4-6. link to the paper
Vargas, F.; Carvalho, I.; Hürriyetoğlu, A.; Pardo, T.A.S.; Benevenuto, F. (2023). Socially Responsible Hate Speech Detection: Can Classifiers Reflect Social Stereotypes? In the Proceedings of the 14th Conference on Recent Advances in Natural Language Processing (RANLP), pp. 1187-1196. September, 4-6. link to the paper
Vargas, F.; Jaidka, K.; Pardo, T.A.S.; Benevenuto, F. (2023). Predicting Sentence-Level Factuality of News and Bias of Media Outlets. In the Proceedings of the 14th Conference on Recent Advances in Natural Language Processing (RANLP), pp. 1197-1206. September, 4-6. link to the paper
Lopes, L.; Fernandes, P.; Duran, M.S.; Inácio, M.L.; Pardo, T.A.S. (2023). Disambiguation of Universal Dependencies Part-of-Speech Tags of Closed Class Words in Portuguese. In the Proceedings of the 12th Brazilian Conference on Intelligent Systems (BRACIS), pp. 241-255. September, 25-29. Link to the paper and data used in the paper
Rodrigues, R.; Souza, J.W.; Cardoso, P.C.F. (2023). Sinalizadores retórico-discursivos: revisitando a anotação RST no córpus CSTNews. In Anais da VIII Jornada de Descrição do Português (JDP), pp. 249-257. September, 25-29. pdf
Duran, M.S.; Nunes, M.G.V. (2023). Aposições anafóricas e catafóricas no português e sua anotação no esquema Universal Dependencies. In Anais da VIII Jornada de Descrição do Português (JDP), pp. 268-277. September, 25-29. pdf
Scandarolli, C.L.; Di Felippo, A.; Roman, N.T.; Pardo, T.A.S. (2023). Tipologia de fenômenos ortográficos e lexicais em CGU: o caso dos tweets do mercado financeiro. In Anais da VIII Jornada de Descrição do Português (JDP), pp. 240-248. September, 25-29. pdf
Martinez, R.M.S.M; Vale, O.A. (2023). Formal features for a syntactic-semantic classification of predicative adjectives in Brazilian Portuguese. In Anais da VIII Jornada de Descrição do Português (JDP), pp. 336-345. September, 25-29. pdf
Silva, D.P.G.; Pardo, T.A.S. (2023). Indução Gramatical para o Português: a Contribuição da Informação Mútua para Descoberta de Relações de Dependência. In Anais da VIII Jornada de Descrição do Português (JDP), pp. 298-307. September, 25-29. pdf
Souza, A.; Ruiz, E.E.S. (2023). Lexical noun phrase chunking with Universal Dependencies for Portuguese. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 422-431. September, 25. pdf
Couto, M.M.L.; Vale, O.A. (2023). Um estudo das construções dar + para + V [infinitivo] nas Universal Dependencies. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 481-490. September, 25. pdf
Barbosa, B.K.S.; Di Felippo, A. (2023). Em Direção à Anotação Sintática - UD de Tweets do Mercado Financeiro. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 499-508. September, 25. pdf
Duran, M.S.; Nunes, M.G.V.; Pardo, T.A.S. (2023). Construções sintáticas do português que desafiam a tarefa de parsing: uma análise qualitativa. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 432-441. September, 25. pdf
Pagano, A.S.; Duran, M.S.; Pardo, T.A.S. (2023). Enhanced dependencies para o português brasileiro. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 461-470. September, 25. pdf
Duran, M.S. (2023). Insights into the UD Tagset: Unveiling its Intricacies. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 491-498. September, 25. pdf
Lopes, L.; Duran, M.S.; Pardo, T.A.S. (2023). Verifica-UD: a Verifier for Universal Dependencies Annotation for Portuguese. In the Proceedings of the 2nd Edition of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 451-460. September, 25. pdf
Santos, W.R.; Paraboni, I. (2023). Predição de transtorno depressivo em redes sociais: BERT supervisionado ou ChatGPT zero-shot? In the Proceedings of the 14th Symposium in Information and Human Language Technology (STIL), pp. 11-21. September, 25-29. pdf
Barberia, L.G.; Schmalz, P.H.S.; Roman, N.T. (2023). When Tweets Get Viral - A Deep Learning Approach for Stance Analysis of Covid-19 Vaccines Tweets by Brazilian Political Elites. In the Proceedings of the 14th Symposium in Information and Human Language Technology (STIL), pp. 104-114. September, 25-29. pdf
Silva, E.H.; Pardo, T.A.S.; Roman, N.T. (2023). Etiquetagem morfossintática multigênero para o português do Brasil segundo o modelo "Universal Dependencies". In the Proceedings of the 14th Symposium in Information and Human Language Technology (STIL), pp. 63-73. September, 25-29. pdf
*** Best paper award ***Duran, M.S.; Lopes, L.; Nunes, M.G.V.; Pardo, T.A.S. (2023). The Dawn of the Porttinari Multigenre Treebank: Introducing its Journalistic Portion. In the Proceedings of the 14th Symposium in Information and Human Language Technology (STIL), pp. 115-124. September, 25-29. pdf
Silva, M.C.R.; Oliveira, V.A.; Pardo, T.A.S. (2023). A Sentiment Analysis Benchmark for Automated Machine Learning Applications and a Proof of Concept in Hate Speech Detection. In the Proceedings of the 14th Symposium in Information and Human Language Technology (STIL), pp. 199-206. September, 25-29. pdf
Jorge, G.A.Z. and Pardo, T.A.S. (2023). SteamBR: a dataset for game reviews and evaluation of a state-of-the-art method for helpfulness prediction. In the Proceedings of the XII Brazilian Workshop on Social Network Analysis and Mining (BraSNAM), pp. 210-215. August, 6-11. pdf
Sobrevilla Cabezudo, M.A. and Pardo, T.A.S. (2022). Exploring a POS-based Two-stage Approach for Improving Low-Resource AMR-to-Text Generation. In the Proceedings of the 2nd Workshop on Natural Language Generation, Evaluation, and Metrics (GEM), pp. 531-538. December, 7. pdf
Souza, A. and Ruiz, E. (2022). Investigating Lexical NP-Chunking with Universal Dependencies for Portuguese. In the Proceedings of the 19th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 342-351. November, 28 to December, 01. pdf
Gomes, I.A. and Roman, N. (2022). How aspects of similar datasets can impact distributional models. In the Proceedings of the 19th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 579-590. November, 28 to December, 01. pdf
Nanclarez, R.; Roman, N.; Silva, F. (2022). Generalizing over data sets: a preliminary study with BERT for Natural Language Inference. In the Proceedings of the 19th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 602-611. November, 28 to December, 01. pdf
Machado, M.T. and Pardo, T.A.S. (2022). NILC at ABSAPT 2022: Aspect Extraction for Portuguese. In the Proceedings of the IberLEF Shared Task on Aspect-Based Sentiment Analysis in Portuguese (ABSAPT), pp. 1-10. September, 20. pdf
Lopes, L.; Duran, M.S.; Fernandes, P.H.L.; Pardo, T.A.S. (2022). PortiLexicon-UD: a Portuguese Lexical Resource according to Universal Dependencies Model. In the Proceedings of the 13th Edition of the Language Resources and Evaluation Conference (LREC), pp. 6635‑6643. June, 20-25. pdf
Machado, M.T. and Pardo, T.A.S. (2022). Evaluating Methods for Extraction of Aspect Terms in Opinion Texts in Portuguese - the Challenges of Implicit Aspects. In the Proceedings of the 13th Edition of the Language Resources and Evaluation Conference (LREC), pp. 3819-3828. June, 20-25. pdf
Sousa, R.F. and Pardo, T.A.S. (2022). Evaluating Content Features and Classification Methods for Helpfulness Prediction of Online Reviews: Establishing a Benchmark for Portuguese. In the Proceedings of the 12th Workshop on Computational Approaches to Subjectivity, Sentiment & Social Media Analysis (WASSA), pp. 204-213. May, 26. link to the paper
Oliveira, G.M.; Berlanga Neto, P.; Ruiz, E.E.R. (2022). Shallow parsing of Portuguese texts annotated under Universal Dependencies. In the Proceedings of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 1-8. March, 21. pdf
Duran, M.S.; Oliveira, H.; Scandarolli, C. (2022). Que simples que nada: a anotação da palavra que em córpus de UD. In the Proceedings of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 1-11. March, 21. pdf
Miranda, L.G.M. and Pardo, T.A.S. (2022). UDConcord: A Concordancer for Universal Dependencies Treebanks. In the Proceedings of the Universal Dependencies Brazilian Festival (UDFest-BR), pp. 1-10. March, 21. pdf
Miranda, L.G.M. and Pardo, T.A.S. (2022). An Improved and Extended Annotation Tool for Universal Dependencies-based Treebank Construction. In the Proceedings of the PROPOR Demonstrations Workshop, pp. 1-3. March, 21-23. pdf
Anchiêta, R.T. and Pardo, T.A.S. (2022). Abstract Meaning Representation Parsing for the Brazilian Portuguese Language. In the Proceedings of the International Conference on Computational Processing of Portuguese (PROPOR) (LNAI 13208), pp. 429-434. March, 21-23. link to the paper
*** Best PhD dissertation award ***Machado, M.T.; Pardo, T.A.S.; Ruiz, E.E.S.; Di Felippo, A.; Vargas, F. (2022). Implicit opinion aspect clues in Portuguese texts: analysis and categorization. In the Proceedings of the International Conference on Computational Processing of Portuguese (PROPOR) (LNAI 13208), pp. 68-78. March, 21-23. link to the paper
Mello, H.; Raso, T.; Oliveira Jr, M.; Sardinha, T.B.; Freitas, C.; Aluísio, S.; Pardo, T.A.S.; Duran, M.; Leal, S.; Davies, M.; Galves-Chambelland, C.; (2021). Brazilian Portuguese: Spoken, Written and Diachronic Corpora. In the Proceedings of the 54th Congress of the International Society of Italian Linguistics ''Corpora and Linguistic Studies'' (SLI), pp. 179-187. September, 8-10. link to the paper
Duran, M.S.; Rassi, A.P.; Pagano, A.S.; Pardo, T.A.S. (2021). On auxiliary verb in Universal Dependencies: untangling the issue and proposing a systematized annotation strategy. In the Proceedings of the Sixth International Conference on Dependency Linguistics (Depling), pp. 10-21. March, 22-23, 2022. link
Sousa, R.F. and Pardo, T.A.S. (2021). The Challenges of Modeling and Predicting Online Review Helpfulness. In the Proceedings of the 18th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 727-738. November, 29 to December, 3. pdf
Silva, E.H.; Pardo, T.A.S.; Roman, N.T.; Di Felippo, A. (2021). Universal Dependencies for Tweets in Brazilian Portuguese: Tokenization and Part of Speech Tagging. In the Proceedings of the 18th National Meeting on Artificial and Computational Intelligence (ENIAC), pp. 434-445. November, 29 to December, 3. pdf
Lopes, L.; Duran, M.S.; Pardo, T.A.S. (2021). Universal Dependencies-based PoS Tagging Refinement through Linguistic Resources. In the Proceedings of the 10th Brazilian Conference on Intelligent System (BRACIS), pp. 601-615. November, 29 to December, 3. link to the paper and data used in the paper
Di Felippo, A.; Postali, C.; Ceregatto, G.; Gazana, L.S.; Silva, E.H.; Roman, N.T.; Pardo, T.A.S. (2021). Descrição Preliminar do Corpus DANTEStocks: Diretrizes de Segmentação para Anotação segundo Universal Dependencies. In the Proceedings of the VII Workshop on Portuguese Description (JDP), pp. 335-343. December, 1. pdf
Duran, M.S.; Lopes, L.; Pardo, T.A.S. (2021). Descrição de numerais segundo modelo Universal Dependencies e sua anotação no português. In the Proceedings of the VII Workshop on Portuguese Description (JDP), pp. 344-352. December, 1. pdf
Miranda Junior, I.S.; Couto, M.M.L.; Coelho, F.L.; Rodrigues, R.; Vale, O. (2021). A propósito do verbo falar no português brasileiro: uma análise em corpus e em bases de dados verbais. In the Proceedings of the VII Workshop on Portuguese Description (JDP), pp. 315-324. December, 1. pdf
Wick-Pedro, G. and Santos, R.L.S. (2021). Complexidade textual em notícias satíricas: uma análise para o português do Brasil. In the Proceedings of the VII Workshop on Portuguese Description (JDP), pp. 409-415. December, 1. pdf
Belisário, L.B. and Pardo, T.A.S. (2021). Avaliação de parsers na detecção de relações essenciais do modelo Universal Dependencies para o português. In the Proceedings of the VII Student Workshop on Information and Human Language Technology (TILic), pp. 442-446. November, 30. pdf
Machado, M.T.; Pardo, T.A.S.; Di Felippo, A.; Ruiz, E.E.S. (2021). Learning rules for automatic identification of implicit aspects in Portuguese. In the Proceedings of the XIV Symposium in Information and Human Language (STIL), pp. 82-91. November, 29 to December, 3. pdf
Monte-Serrat, D.M.; Machado, M.T.; Ruiz, E.E.S. (2021). A machine learning approach to literary genre classification on Portuguese texts: circumventing NLP’s standard varieties. In the Proceedings of the XIV Symposium in Information and Human Language (STIL), pp. 255-264. November, 29 to December, 3. pdf
Santos, R.L.S. and Pardo, T.A.S. (2021). Structural Characterization and Graph-based Detection of Fake News in Portuguese. In the Proceedings of the XIV Symposium in Information and Human Language (STIL), pp. 199-208. November, 29 to December, 3. pdf
Pardo, T.A.S.; Duran, M.S.; Lopes, L.; Di Felippo, A.; Roman, N.T.; Nunes, M.G.V. (2021). Porttinari - a large multi-genre treebank for brazilian portuguese. In the Proceedings of the XIII Symposium in Information and Human Language (STIL), pp. 1-10. November, 29 to December, 3. pdf
Inácio, M.L. and Pardo, T.A.S. (2021). Semantic-Based Opinion Summarization. In the Proceedings of Recent Advances in Natural Language Processing (RANLP), pp. 624-633. September, 1-3. pdf
Sobrevilla Cabezudo, M.A. and Pardo, T.A.S. (2020). NILC at WebNLG+: Pretrained Sequence-to-Sequence Models on RDF-to-Text Generation. In the Proceedings of the 3rd International Workshop on Natural Language Generation from the Semantic Web (WebNLG+), pp. 131-136. December, 18. pdf
Sobrevilla Cabezudo, M.A. and Pardo, T.A.S. (2020). NILC at SR’20: Exploring Pre-Trained Models in Surface Realisation. In the Proceedings of the Third Workshop on Multilingual Surface Realisation (MSR), pp. 50-56. December, 12. pdf
Anchiêta, R.T. and Pardo, T.A.S. (2020). Semantically Inspired AMR Alignment for the Portuguese language. In the Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP), pp. 1595-1600. November, 16-20. pdf
Technical reports
Di Felippo, A.; Nunes, M.G.V.; Barbosa, B.K.S. (2024). Diretrizes de anotação de relações de dependência em tweets do mercado financeiro. Relatório Técnico do ICMC 446. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Abril, 70p. pdf
Lopes, L.; Duran, M. S.; Pardo, T. A. S. (2023). Atribuição de lemas e atributos morfológicos seguindo as decisões adotadas na anotação do córpus Portinari-base dentro das diretrizes da Universal Dependencies (UD). Relatório Técnico do ICMC 445. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Agosto, 34p. pdf
Lopes, L.; Duran, M. S.; Pardo, T. A. S. (2023). Verifica-UD: uma ferramenta online para verificação de textos em português anotados no formato CoNLL-U segundo o padrão Universal Dependencies. Relatório Técnico do ICMC 444. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Agosto, 31p. pdf
Duran, M.S.; Nunes, M.G.V.; Pardo, T.A.S. (2023). Avaliação qualitativa do analisador sintático UDPipe 2 treinado sobre o córpus jornalístico Porttinari-base. Relatório Técnico do ICMC 442. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Abril, 58p. pdf
Duran, M.S. (2022). Manual de Anotação de Relações de Dependência - Versão Revisada e Estendida: Orientações para anotação de relações de dependência sintática em Língua Portuguesa, seguindo as diretrizes da abordagem Universal Dependencies (UD). Relatório Técnico do ICMC 440. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Outubro, 166p. pdf
Lopes, L.; Duran, M.S.; Nunes, M.G.V.; Pardo, T.A.S. (2022). Corpora building process according to the Universal Dependencies model: an experiment for Portuguese. Relatório Técnico do ICMC 439. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Março, 22p. link to the report and to the annotated corpus
Di Felippo, A.; Postali, C.; Ceregatto, G.; Gazana, L.S.; Roman, N.T. (2022). Diretrizes de Anotação de PoS Tags em Tweets do Mercado Financeiro: Orientações para anotação em língua portuguesa segundo a abordagem Universal Dependencies (UD). Relatório Técnico do ICMC 438. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Março, 24p. link
Cunha, F.D.; Souza, K.V.M.; Pardo, T.A.S. (2022). Ações para o desenvolvimento de habilidades de matemática e computação para alunos do ensino médio. Relatório Técnico do ICMC 437. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Fevereiro, 11p. link
Inácio, M.L. and Pardo, T.A.S. (2021). A survey on semantic representations for text summarization. Relatório Técnico do ICMC 436. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Dezembro, 26p. link
Duran, M.S. (2021). Manual de Anotação de Relações de Dependência: Orientações para anotação de relações de dependência sintática em Língua Portuguesa, seguindo as diretrizes da abordagem Universal Dependencies (UD). Relatório Técnico do ICMC 435. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Dezembro, 79p. pdf
Duran, M.S. (2021). Manual de Anotação de PoS tags: Orientações para anotação de etiquetas morfossintáticas em Língua Portuguesa, seguindo as diretrizes da abordagem Universal Dependencies (UD). Relatório Técnico do ICMC 434. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Setembro, 55p. pdf
Undergradudate, MSc and PhD monographs
Souza, J.W.C. (2023). Exploração de técnicas de classificação automática de papeis semânticos. MBA monograph (on Artificial Intelligence and Big Data). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 45p. pdf
Machado, M.T. (2023). Methods for identifying aspects in opinion texts in Portuguese: the case of implicit aspects and their typological analysis. PhD Thesis. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 143p. pdf
Santos, K.H.R. (2023). Classificação de textos de petições jurídicas com base em técnicas de Processamento de Línguas Naturais. MBA monograph (on Artificial Intelligence and Big Data). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 114p. pdf
Valença, E.C. (2023). Detecção automática de notícias falsas em português: avaliando técnicas baseadas em redes complexas e classificação via aprendizado de máquina. Undergraduate monograph. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 52p. pdf
Guerreiro, A.F. (2023). Detecção automática de notícias falsas em português: avaliando técnicas baseadas em grafos de conhecimento e classificação a partir de modelos de língua. Undergraduate monograph. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 55p. pdf
Silva, E.H. (2023). Etiquetagem morfossintática multigênero para o português do Brasil segundo o modelo Universal Dependencies. MSc Dissertation. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 139p. pdf
Sousa, R.F. (2023). Classificação da utilidade de opiniões em português brasileiro. PhD Thesis. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 135p. pdf
Sobrevilla Cabezudo, M.A. (2023). Natural Language Generation from Abstract Meaning Representation for Brazilian Portuguese. PhD Thesis. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 197p. pdf
Coelho, F.L. (2022). Uma análise comparativa das construções com verbos psicológicos do português brasileiro e europeu. PhD Thesis. Departamento de Letras, Universidade Federal de São Carlos. São Carlos/SP, 76p. pdf
Wick-Pedro, G (2022). Aspectos linguísticos na descrição de notícias satíricas do português do Brasil: uma proposta tipológica. PhD Thesis. Departamento de Letras, Universidade Federal de São Carlos. São Carlos/SP, 161p. pdf
Jorge, G.A.Z. (2022). Prevendo a utilidade de comentários em Português Brasileiro de jogos no site Steam. MBA monograph (on Artificial Intelligence and Big Data). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 65p. pdf
Ceregatto, G. (2022). Caracterização Morfossintática de um Corpus de Tweets e Análise Preliminar de Erros de Tagging. Undergraduate monograph. Departamento de Letras, Universidade Federal de São Carlos. São Carlos/SP, 46p. pdf
Miranda Jr, I.S. (2022). Não é nada não: uma análise das lexias negativas do português para anotação nas Universal Dependencies. MSc Dissertation. Departamento de Letras, Universidade Federal de São Carlos. São Carlos/SP, 133p. pdf
Santos, R.L.S. (2022). Detecção automática de notícias falsas em português. PhD Thesis. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 240p. link
Silva, A.S.R. (2022). Estudo de modelos distribucionais para detecção de discurso de ódio em português. MSc Dissertation. Escola de Artes, Ciências e Humanidades, Universidade de São Paulo. São Paulo/SP, 77p. pdf
Inácio, M.L. (2021). Sumarização de Opinião com base em Abstract Meaning Representation. MSc Dissertation. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos/SP, 152p. pdf