Cabral, V. R. (1999). Validade de parâmetros de organização sequencial da linguagem enquanto índices psicolinguísticos. Revista Portuguesa de Psicologia, 34, 149-161.

Resumo

A cadeia verbal é apresentada como um processo estocástico gerado por uma fonte ergódica. Investigações anteriores publicadas sobre redundância sequencial (uma estatística proposta pela teoria da informação) mostram já as virtualidades da análise sequencial incidente sobre as dependências markovianas dos significantes. Decorrem das decisões lexicais e das restricções fonotácticas que emergem das variações estilísticas associadas às particularidades da autoria, época, de composição, conteúdo, estrutura do texto e nível de instrução da fonte. Verificam-se, por outro lado, lacunas quanto à fiabilidade das estimativas obtidas pelo método de Newman e Gerstman no que respeita à extensão do texto e dos blocos contextuais predictivos. Este estudo propõe-se eliminá-las. Analisam-se as tendências da redundância sequencial ao nível dos grafemas no português falado observadas a partir de amostras extraídas do Corpus de Frequência do Português Fundamental em que se faz variar a extensão do texto e do contexto. Sugerem-se valores mínimos para estas duas variáveis com o propósito de estabelecer um limiar de fiabilidade.

Abstract

The verbal chain is treated as a stochastic process generated by an ergodic source. Previous research work on sequencial redundancy (an information theory based statistic) has shown the virtualities of sequence analysis concerning markovian dependencies emerging of lexical decisions and phonotactic restrictions as function of authorship, time of composition, topic, structure, and instruction of the source. There is, however, a lack of evidence about reliability of the estimates according to the method of Newman and Gerstman as to the text and contextual predictive blocks extension level. This study intends to respond to this question. Data on tendencies of letter redundancy in spoken portuguese sampled in the CPF as a function of text length and context are provided and discussed. Minimal values for both these variables are suggested in order to establish a reliable minimum.

Texto integral / Full text