Sobre o minicurso
A disponibilidade crescente de textos em formato digital permite, hoje em dia, realizar um conjunto de estudos e análises que anteriormente se revelava de impossível execução. Recorrendo ao uso de ferramentas informáticas de acesso livre ou à escrita de algumas linhas de código de uma linguagem de programação, hoje é possível responder a questões como: “Qual o léxico/vocabulário utilizado pelo autor X?”, “Quais as colocações/construções mais frequentes?”, “E as estruturas sintáticas mais utilizadas?”, “E quanto à representação semântica?”, “Podemos definir um modelo da linguagem utilizada por esse autor?”
Este curso visa fornecer competências básicas necessárias para ajudar você a responder essas questões, sem necessidade de nenhum conhecimento prévio de informática (para além do conhecimento básico enquanto usuário de computadores pessoais e da internet).
Como caso de estudo, será utilizado um corpus amostral constituído por textos de obras impressas de João Curvo Semedo (1635-1719), médico português do século XVIII. São bem-vindos à atividade outros corpora/textos trazidos pelos participantes – preferentemente em forma de arquivos de texto - que partam de documentos antigos em português.
Este curso tem uma componente essencialmente prática, com exercícios específicos de exploração dos textos médicos de Curvo Semedo, que servem como um exemplo de corpus a explorar. O curso será ministrado em Português no auditório APERS.