Cabral, V. R. (1993). A relação informação-custo na comunicação verbal. Revista Portuguesa de Psicologia, 29, 141-159.
Resumo
Estuda-se a hipótese sugerida por C. Shannon, B. Mandelbrot e P. Guiraud da existência duma relação de proporcionalidade directa entre a informação das palavras e o seu custo dos vocabulários de frequência.
Considerou-se que esta relação decorre de uma tendência para maximizar a eficácia da codificação linguística, reduzindo, para a mesma quantidade de informação transmitida, o respectivo custo em extensão da mensagem. Sendo, por outro lado, essa tendência geradora de estruturas estatísticas na língua, ela impõe aos seus utilizadores, para garantir uma comunicação satisfatória do ponto de vista adaptativo, um critério de gestão que se traduz por uma regra de proporcionalidade. O objectivo desta investigação consiste em verificar se se pode estabelecer a invariância tendencial da relação informação/custo.
Observou-se, no comportamento dos estimadores construídos para esse efeito, a existência duma flutuação aleatória de fraca amplitude, em torno dum valor central e a propriedade de serem independentes da frequência das palavras do vocabulário extraído do Corpus do Português Fundamental.
Abstract
The author discusses the hypothesis suggested by Shannon, Mandelbrot and P. Guiraud of a constant ratio linking information and cost in current use of vocabulary in the speech. This ratio is considered to express a tendency toward an increase of efficiency in the linguistic coding, by reducing the lenght of messages for equal levels of information transmission. Such a tendency should be particularly clear when statistical constraints are strongly imposed to the selections, as it happens in coloquial communication.
This result has been observed in spoken Portuguese (CPF) where information and length grow with rank, as expected, and the ratio shows a tendency to remain relatively stable. The balance between information values and the estimates of length: a) appeared to be independent from frequency and rank order variables, and b) to present a non-normal, almost symetrical and very leptocurtic distribution.