Linguas da Humanidade

As Línguas da Humanidade

Maurício Carvalho

2003

Apresentação

Introdução

O que é a línguagem humana?

ORTOGRAFIAS ADOTADAS

TRANSCRIÇÃO FONÉTICA

Parte I – A Classificação Genética das Línguas

Informações Gramaticais

A ordem das Famílias

“As Línguas da América”

Família Araucana

Família Chon

Família Mascoiana

Família Aimará

Família Quéchua

Família Macro-Jê

Ramo Jê

Outros Ramos

Família Mataco Guaicuru

Família Nambiquara

Família Tupi

Ramo Tupi-Guarani

Outros Ramos

Família Arauaque

Ticuna

Família Caribe

Família Arauá

Família Katukina

Família Pano

Família Chapakura-Wanham

Família Chibchano

Família Ianomâmi

Família Tucano

Família Oto-Mangueana

Família Maia

Família Uto-Asteca

Ramo Meridional

Ramo Setentrional

Família Sioux

Família Panuto

Família Algonquiana-Wakash

Família Iroquesa

Família Na-Dené

Família Esquimó-Aleuta

Família Chukotko-Kamchatka

Família Yenisei-Ostiak

Yukaghir

Gilyak

Ainu

Família Austronésia

Ramo Formosano

Ramo Malaio-Polinésio

Sub-Ramo Ocidental

Sub-Ramo Central

Sub-Ramo Oriental

Família Australiana

“As Línguas da Nova Guiné”

Família Sepik-Ramu

Família Trans-Neo-Guineana

Pequenas Famílias Neo-Guineanas

Família Austro-Asiática

Ramo Munda

Ramo Mon-Khmer

Família Sino-Tibetana

Ramo Sinítico

Ramo Tibeto-Birmanês

Família Tai-Kadai

“As Línguas da Ásia Central”

Família Altaica

Ramo Túrquico

Ramo Mongólico

Ramo Tungúsico

Família Uraliana

Ramo Samoiédico

Ramo Fino-Úgrico

Coreano

Japonês

Basco

Etrusco

Sumeriano

PARTE 2

3. As Línguas Uralo-Altaicas

3.1 As Línguas Altaicas

3.1.1 As Línguas Túrquicas

3.1.2 As Línguas Mongólicas

3.1.3 As Línguas Tungúsicas

3.2 As Línguas Uralianas

3.2.1 As Línguas Samoiédicas

3.2.2 As Línguas Fino-Úgricas

4. As Línguas Sino-Tibetanas

5. As Línguas Austro-Asiáticas

6. As Línguas Austronésias

7. As Línguas Dravídicas

8. As Línguas Caucasianas

9. As Línguas Khoisan

10. As Línguas Nilo-Saarianas

11. As Línguas Nígero-Cardofânicas

11.1 O Ramo Nígero-Congolês

11.1.1 O Sub-ramo Kwa

11.1.2 O Sub-ramo Banto

12. O Basco

13. Demais Línguas do “Velho Mundo”

14. As Línguas da América

15. As Línguas da Austrália

16. As Línguas da Papua Nova Guiné

17. As Línguas Artificiais

18. As Línguas Não Orais

Apresentação

O propósito desta obra é o de mudar a perspectiva pela qual a diversidade cultural e lingüística do ser humano é vista. Ou não. Pode ser só um trabalho para satisfazer a necessidade de cultura inútil!

Da mesma maneira que cada grupo humano é uma variação de uma espécie única, as línguas que falamos são dialetos de uma língua única. Tradicionalmente, a evolução e classificação das línguas são apresentadas em árvores genealógicas similares às que se usam para explicar a evolução das espécies, mas sempre com a ressalva de que ao contrário das espécies, línguas diferentes podem “cruzar e gerar descendentes”.

A comparação entre a evolução das espécies e das línguas, feita por Darwin já em seu “A Origem das Espécies”, é válida e interessante, mas a ressalva a ser feita em minha opinião é outra. As línguas não divergem entre si como espécies, mas sim como variações de uma mesma espécie, como o ser humano. A distinção nem é suficiente para se falar em raças, muito embora nos extremos haja grandes distinções. E é por isso que elas podem “cruzar”: são estruturalmente muito compatíveis.

Além do mais, a biologia e a língüística se encontram ainda em um outro ponto, mais interessante ainda: o fato de que na natureza, apenas o genoma dos seres vivos e as línguas humanas funcionam como sistemas combinatórios discretos, ou seja, sistemas com número limitado de elementos, que interagem através de regras também limitadas, mas produzem mensagens em número infinito.

A lingüística hoje procura, entre outras coisas, estabelecer o que há de universal nas línguas humanas, e por que esses universais existem. Muito já foi descoberto, mas a maioria das 6.000 línguas do mundo permanece pouco ou nada estudada. Ainda falta bastante para que se confirme a hipótese de Noam Chomsky, um dos fundadores da análise lingüística moderna, de que “para um cientisa marciano, os seres humanos pareceriam falar apenas uma língua”.

Introdução

Uma breve história do homem

A espécie humana descende de uma linhagem de primatas que provavelmente se destacou das demais há cerca de 6,5 milhões de anos. Supondo-se cerca de 15 anos em média entre o nascimento e a maturidade sexual de cada indivíduo, temos 380.000 gerações desde então.

É claro que a inteligência típica das pessoas de hoje não surgiu há tanto tempo. Nossa linhagem, deduz-se, teria sido uma linhagem de primatas físicamente desvantajados, mas já dotados de certa inteligência (não mais do que os primatas e demais mamíferos atuais). Não é coincidência o fato de que as pessoas de hoje são facilmente atacadas por animais de porte até menor que o nosso. Acontece que o ser humano, por ter sido fisicamente medíocre, foi selecionado pela inteligência. A cada geração, os mais burros morriam e os mais inteligentes sobreviviam e se reproduziam. A arma evolutiva dos nossos antepassados era a inteligência.

Certamente uma parte importante da inteligência humana dependia da capacidade de intercâmbio de informações. Os sinais e expressões instintivos, como o dos animais, não era mais suficiente. Quaisquer proto-humanos que tivessem uma capacidade de expressar idéias com mais clareza e riqueza teriam uma probabilidade de sobrevivência maior. Essa capacidade de exprimir idéias pode ter começado com a associação mais simples possível, a de um símbolo mais outro. Talvez com o tempo, a ordem dos símbolos fosse percebida como parte do significado: por exemplo: “eu matar” diferente de “matar eu”. O meio oral de comunicação foi o mais apropriado porque sinalizar com as mãos (uma tática usada pelos surdos modernos) atrapalharia demais. Com o tempo, o número de símbolos combinados foi aumentando e a riqueza de combinações possíveis também.

Não houve apenas uma linhagem ordenada de humanos até nós. As outras todas, contudo, se extinguiram, inclusive o homem de neandertal, não se sabe se uma espécie ou raça diferente, que habitava a Europa até há 30 mil anos e tinha uma capacidade craniana maior que a nossa, indicando possível inteligência maior ou no mínimo igual. Não deve ter havido um momento exato em que a língua surgiu na nossa espécie. Como tudo, foi um processo gradual envolvendo milhares de gerações e evoluindo até hoje. Alguns antropólogos supõem que justamente foi a habilidade lingüística que tenha dado a vantagem decisiva ao homo sapiens sapiens, levando-o a uma superioridade tecnológica e cultural sobre as outras raças e espécies de homens, extintos provavelmente por nossos antepassados. A hipótese de que algumas populações de neandertal tenham se miscigenado com o homem moderno e que nós tenhamos alguns genes neandertais era perfeitamente plausível mas pesquisas genéticas recentes eliminaram a possibilidade.

Põe-se o surgimento do homem moderno no período entre 250 e 200 mil anos atrás, na África Oriental. O homo sapiens sapiens, ou homem moderno, migraria há 150 mil anos da África para a Europa e Ásia e extinguiria 30 mil anos atrás o neanderthal e outros hominídeos asiáticos. Entre estes estava o homo erectus de Java, que habitava a ilha indonésia há mais de 1,5 milhão de anos, provando de já há tanto tempo época o homem era capaz de navegar.

O homem eurasiano, que mais tarde colonizaria o Pacífico duas vezes e a América pelo menos uma, permaneceria isolado do homem africano exceto por estreitas e esporádicas rotas de migração através do Saara e do Mar Vermelho. Um desses contatos espalhou as línguas etíopes conhecidas como semíticas pelo Oriente Médio.

Há 60 mil anos, o homem eurasiano atinge a Austrália e a Nova Guiné, onde permaneceria praticamente isolado do resto da humanidade até tempos recentes. Há 13 mil anos ocorre uma grande migração eurasiana para as Américas através do que é hoje o Estreito de Behring, entre a Sibéria e o Alasca. Não se sabe se antes dessa migração houve algum povoamento nas Américas, mas se hove deve ter sido pequena. Alguns pesquisadores afirmam ter encontrado no nordeste brasileiro provas de povoamento com mais de 35 mil anos.

Logo depois dessa grande ida à América, o ser humano do Iraque, do Paquistão e da China se estabelece em comunidades fixas dependentes da agro-pecuária. O surgimento desse estilo de vida nesses lugares se deveu a uma maior disponibilidade de plantas e animais domesticáveis e ao clima similar que liga a Eurásia de leste a oeste, permitindo um intercâmbio grande de biomassa. Grandes migrações ocorrem, resultantes das conquistas dos agricultores sobre as terras dos caçadores-coletores. A Europa é colonizada por agricultores vindos do sul da Rússia que tinham aprendido a cultivar com os médio-orientais, de língua sumeriana ou semítica. Esses mesmos agricultores invadem a Pérsia e a Índia.

O Oriente, milênios antes da agricultura, já havia sido colonizado por etnias siberianas de pele clara, cabelo escuro liso e dobra epicântica na pálpebra que foram até o sudeste asiático, deslocando e se misturando com os outros povos de pele escura e cabelo encaracolado, que sobreviveram apenas no interior isolado da ilhas indonésias, especialmente na Nova Guiné. Esses neo-asiáticos, há mais de 7 mil anos, iniciariam uma expansão fantástica pelo Pacífico, tornando-se os atuais malaios, indonésios, polinésios, melanésios, micronésios, rapa-nui da ilha da Páscoa, maoris da Nova Zelândia e marioris das ilhas Chatham. Atravessando o oceano Índico, no ano 500 seriam os primeiros habitantes da ilha de Madagascar, na África. Entrando em contato com os bantos da costa do Moçambique, abrem um canal de migração entre Madagascar e o continente, o que resultou na população meio oriental meio africana atual da ilha, cuja língua, contudo, permanece plenamente malaio-polinésia. Os malaio-polinésios seriam também os primeiros a entrar em contato com o ser humano australiano, isolado havia mais de 35 mil anos. Mas jamais colonizariam a Austrália.

Na África ocorreria expansão similar, mas continental. Os africanos negros do Sahel (região entre o Saara e a floresta equatorial africana) desenvoveriam a agricultura há mais de 2000 anos, colonizariam a África equantorial e se expanidiriam até o sul temperado do continente, exterminando outros povos africanos que sobrevivem hoje como os pigmeus e os khoisans do deserto da Kalahari.

A expansão mais recente, há cerca de 2.000 anos, que levou os negros ao sul do equador, daria origem aos povos e línguas bantas, o segundo maior grupo de línguas nitidamente aparentadas do mundo (cerca de 650), depois do malaio-polinésio (cerca de 900 línguas).

Não muito depois das expansões negra e malaio-polinésia, e mais ligada à cavalaria militar do que à agricultura em si, haveria a expansão uralo-altaica. Os mongóis e madchus invadiriam a China, com ou sem muralha. Os turcos, hunos e húngaros entrariam na Europa e Oriente Médio, acelerando a queda do Império Romano do Ocidente e do Oriente. Os turcos adotariam o islã e construiriam o poderoso império Otomano sobre as ruínas do Império Bizantino (ou Romano do Oriente) e sobre a Pérsia e países árabes.

A China, unificada politicamente desde 200 a.C., desenvolve poder naval superior e seus navios chegam à África em 1420. Talvez tenham passado pelo sul da África e atravessado o Atlântico até a América do Sul. Mais de quatrocentos anos antes, os vikings estabeleceriam uma colônia de vida curta na costa nordeste da América do Norte, mencionada em textos escandinavos como Vinland (terra da vinha).

A Europa Ocidental, há 550 anos, quando os turcos tomam a capital bizantina, Constantinopla, vêem as importantes rotas de comércio com o oriente ameaçadas pelo monopólio turco. Buscando uma rota alternativa, portugueses navegam pelo sul da África e estabelecem ligação marítima constante com o Oriente. Em outras tentativas, os Europeus chegam à América, encontrando os povos que haviam chegado lá havia mais de 12 mil anos, a quem chamaram de índios por acharem inicialmente que a América era parte da Índia. Os europeus, expostos por milênios ao contato com animais domésticos e as doenças infecciosas que eles transmitiram, e dotados de escrita, cavalaria e armas de aço, conquistam todo o continente americano em quatrocentos anos dominando os povos americanos.

O que é a línguagem humana?

Matematicamente, a língua é um sistema combinatório discreto, ou seja, é um sistema de comunicação que possui símbolos finitos, regidos por regras finitas, que produz infinitas combinações. Na natureza, apenas um outro sistema funciona de maneira combinatória discreta: o código genético dos seres vivos. As línguas de computador e outras linguagens de máquina inventadas pelo homem também são assim.

A habilidade de aprender e usar línguas é em parte instintiva. Deve haver uma mecanismo mental genético específico para a linguagem, já que as crianças aprendem sua língua nativa sem aprender conscientemente as suas regras e a partir dos 8 anos começam a perder essa capacidade. Além da aquisição infantil da linguagem, há dois outros fenômenos que indicam uma instintividade da língua: a creolização e o surgimento das linguagens gestuais. A creolização ocorre quando populações adultas de diversas origens têm que vivem juntas sem terem uma língua comum. Desenvolvem então uma língua precária baseada nas suas línguas maternas, o que é chamado de pidgin. O pidgin é uma linguagem com poder expressivo inferior e sem regras gramaticais muito claras. Mas quando os filhos dessas pessoas são expostos a um pidgin, dão-lhe consistência gramatical e o pidgin se torna uma língua 100% desenvolvida, chamada de creole ou crioulo. O papiamentu, falado na ilha caribenha de Curaçao, é um exemplo de creole, que evoluiu de um pidgin de base léxica portuguesa. A língua oficial do Haiti é o creole haitiano, de base francesa.

As línguas gestuais, ou de sinais, foram desenvolvidas a partir do século 19, quando se formaram as primeiras comunidades de surdos-mudos. Primeiramente, havia apenas o esforço de ensinar a língua falada a essas pessoas, mas naturalmente os adultos criaram uma linguagem gesticulada, de estrutura um tanto caótica e pobre, uma espécie de pidgin gestual. Mas crianças surdas-mudas, quando postas juntas, ou quando cresciam em famílias que usavam esses pidgins, criaram verdadeiras línguas de complexidade gramatical plena. Hoje em dia praticamente cada país tem uma ou mais línguas gestuais.

A lingüística moderna supõe que haja certas características universais das línguas humanas. Não se chegou a um consenso sobre exatamente quais seriam essas características, mas algumas já estão praticamente estabelecidas. Uma é que todas as línguas tem a estrutura sintática básica com os elementos chamados nome, verbo e advérbio. A categoria sintática de nome inclui os substantivos, os adjetivos, os pronomes, os numerais, os infinitivos e particípios verbais e os artigos (nas línguas que os têm). A categoria verbo inclui apenas as formas finitas do que chamamos de verbo (faço, fiz, farás, etc.), e exclui os infinitivos, particípios e gerúndios. O elemento circunstancial pode ser chamado de advérbio também, mas só no sentido sintático. A categoria inclui, é claro, os advérbios, as preposições (ou posposições) e os gerúndios. As orações humanas podem se ligar umas às outras, neste caso ou a ligação é direta ou há uma palavra de conexão, chamada de conjunção (CJ). As conjunções incluem as conjunções subordinantes propriamente ditas.

Obviamente, só pode haver categorias morfológicas em línguas que têm morfologia, como as indo-européias, uralo-altaicas, afro-asiáticas, no basco, bantas, dravídicas, caucasianas, quéchuas, tupis, uto-astecas, algumas austronésias, etc. Nessas línguas, sempre se observa duas categorias de flexão morfológica: verbal e nominal. A nominal geralmente expressa:

1. gênero ou classe gramatical. Nem sempre há alguma lógica semântica visível na classificação das palavras, mas a morfologia de concordância tem que levar em conta as classes. Mesmo nas línguas em que não há classes, tende a haver alguma distinção entre masculino e feminino e/ou ser vivo e objeto inanimado.

As línguas indo-européias, por exemplo, originalmente tinham três gêneros, hoje essa característica só permanece no alemão, islandês, romeno, grego, nas línguas eslavas, no gujarati e em poucas outras. As línguas uralianas não têm classe gramatical nenhuma. As afro-asiáticas têm os gêneros masculino e feminino. O basco não tem gênero gramatical. As línguas bantas possuem um intrincado sistema de classes morfo-semânticas, geralmente incluindo de quinze a vinte e poucas classes (pessoas, objetos, conceitos abstratos, animais, vegetais, etc.) cada qual com seu prefixo (um singular e outro plural). As línguas caucasianas setentrionais, como o tchetcheno, têm cerca de meia dúzia de classes, sendo que duas reservados ao masculino e ao feminino humano.

2. número: singular, paral, dual, plural.

A maioria das línguas têm alguma distinção de número gramatical. O chamado “singular” abarca em sua semântica o plural também, como na frase “eu não gosto de mentira”, em que “mentira” está no singular mas com certeza não se refere a apenas uma mentira. O plural é um número da não-unidade: tudo que for mais que um. Algumas línguas têm o dual, que é o plural de dois, como em árabe: kitâb (livro) > kitâbayn (dois livros) > kutub (livros). O numeral “dois” fica então desnecessário. O paral, às vezes erroneamente chamado de dual, é o plural específico para objetos, geralmente partes do corpo, que vêm em pares, como os olhos, as orelhas, as mãos. Muitas línguas que têm o paral não têm dual.

3. diminutivos e aumentativos

4. derivação semântica através de uma afixação feita de morfemas totalmente diferentes daqueles que expressam gênero, número e os diminutivos e aumentativos - muitas vezes vindos de elementos circunstanciais (chamados em certas línguas de preposições). A derivação semântica tende a ser:

a) nominalização: transformar uma palavra em um substantivo. Ex.: nominalizar > nominalização

b) adjetivação: transformar em adjetivo: nome > nominal

c) verbalização: nominal > nominalizar;

Claro que um substantivo, um adjetivo ou um verbo podem gerar novas palavras de suas próprias classes: nominalização > renominalização.

A flexão verbal procura exprimir três coisas:

1. relação com os nomes (concordância)

2. variação de tempo e aspecto

3. grau de subjetividade, de discursos diretos e indiretos, etc.

O aspecto verbal é desconhecido da maioria dos falantes das línguas da Europa Ocidental porque essas línguas não têm flexão verbal de aspecto clara. O aspecto verbal independe do tempo e procura especificar o grau de compleção de uma ação: ja delaju em russo é “eu estou fazendo, faço às vezes” e ja sdelaju é “eu terei feito, eu terei começado e terminado a ação de fazer”. Os aspectos mais básicos são denominados imperfectivo (ja delaju) e perfectivo (ja delaju).

Quanto à morfologia, a classificação mais tradicional divide as línguas em:

-línguas isolantes: não há flexão de morfemas

-línguas aglutinantes: a flexão morfológica se dá através da justaposição de afixos pouco ou nada variáveis

-línguas flexivas: a flexão morfológica se dá por metamorfose dos morfemas e das palavras

-línguas polissintéticas ou incorporantes: uma palavra inclui diversas classes morfológicas.

ORTOGRAFIAS ADOTADAS

Quando uma língua utiliza o alfabeto latino, a ortografia original será mantida e as letras terão seu valor explicado sucintamente. A exceção são certas línguas da África, America e outros lugares cujos caracteres não estão disponíveis para computador. Neste caso, as diferenças entre a ortografia corrente e a adotada aqui será explicada, nem que sucintamente. Quando utiliza outro sistema de escrita, algum sistema de transliteração será usado, e explicado.

Caso não haja explicação, é porque:

1) a fonte que eu utilizei não explicava. Isso acontece com o site Numbers in 4,000 Languages.

2) os comentários sobre a língua são breves, e uma explicação sobre o valor das letras usadas seria muitos custoso.

Nesse segundo caso, há contudo alguns universais adotados aqui. Uma parada glotal é transliterada por apóstrofe. Os dígrafos “sh” e “ch” são [š] e [č], mas para línguas da América o “x” é utilizado para [š]. A semivogal [j] via de regra é escrita “y” e a [w] é “w”.

A transcrição fonética virá sempre entre colchetes [ ], apesar de a tradição entre os lingüistas ser usar barras / /. Os colchetes, em lingüística, geralmente servem para a transcrição fonêmica, ou seja, desconsiderando os acidentes fonéticos que transformam os fonemas em seus alofonemas.

TRANSCRIÇÃO FONÉTICA

Os símbolos de transcrição fonética usados aqui não serão os do alfabeto fonético internacional. O símbolo [č] representa o som do “tch” português, o [š] é o “ch” português, o [ž] é o “j” português. O símbolo [ð] ou [dh] representa o som do “th” inglês em “that”. O lambda [λ] é o fonema representado em português pelo dígrafo “lh”. O [ź] representa um fonema entre o [z] e o [ž], ou seja, um [z] semipalatalizado. Outras consoantes com acento agudo representarão semipalatalizados. O beta [ß] transcreve o fonema do “v” em castelhano, ou seja, similar ao nosso “b” mas sem cerramento total dos lábios. Consoantes retroflexas, típicas das línguas do subcontinente indiano e presentes no chinês, serão seguidas de ponto [s.]. As semivogais serão [j] (como “i” em “iate”) e [w] (como em inglês). A oclusiva velar uvular, presente em língua semíticas, quéchuas e outras, pronunciada como um [k] mas com a parte traseira da língua pressionando o topo da garganta, é reprentado, como é tradicional, por [q]. O “e” aberto como em “época” será [ε] e o “o” aberto como em “hora” será [ơ]. Vogal longa é seguida de dois pontos [a:]. A sílaba tônica será precedida por apóstrofe.

Parte I – A Classificação Genética das Línguas

As línguas são classificadas de acordo com o que, baseado na comparação entre as línguas, se supõe seja uma origem comum. Supõe-se que línguas de uma mesma família derivem de uma língua ancestral comum, e essa origem é estabelecida comparando-se o vocabulário e a estrutura morfológica das línguas. Se no vocabulário, as diferenças encontradas forem sistemáticas, e se a estrutura morfológica for obviamente similar, supõe-se que isso se deva a uma origem comum. Na maioria dos casos, a língua-mãe ou proto-língua não foi escrita e portanto podemos apenas imaginar como ela foi. Como nesses casos nem o nome da língua temos, dá-se a ela o nome do ramo prefixado por proto-. Por exemplo, a língua que se supõe tenha dado origem às línguas malaio-polinésias é convencionalmente chamada de proto-malaio-polinésio. Existe ainda uma metodologia de classificação de línguas baseada nas similaridades adquiridas através de longo contato histórico. É que línguas de origens diversas tenham convivido intimamente por muitos séculos tendem a adquirir características gramaticais e léxicas comuns, fenomeno às vezes chamado pelo termo alemão Sprachbund. Esse caso se aplica especialmente a certas famílias como a uraliana e a altaica, cujas línguas devem ter tido origem distinta mas no decorrer da história passaram a conviver na Ásia Central. Muitas línguas da África Ocidental são classificadas assim também.

Dentro de cada família genética pode haver certas línguas que estão mais próximas entre si do que com as demais línguas da família. Isso se deve ao fato de que essas derivam de uma proto-língua que um dia foi uma língua daquela família. As línguas românicas, por exemplo, derivam do latim, que é sua proto-língua. Se não conhecêssemos o latim, poderíamos supor sua existência e chamá-lo de proto-românico. Só que o latim deve ter vindo de outra proto-língua, que originou o grego, o proto-eslavo, o sânscrito, o proto-germânico, etc. Essa proto-língua é chamada de proto-indo-europeu, pois as línguas dessa família estão espalhadas pela Europa e Índia.

Não há um consenso entre os lingüistas históricos sobre a exata classificação genética das línguas do mundo, especialmente as línguas ágrafas (sem escrita) e com curta tradição literária, como as línguas da América, Nova Guiné, Austrália, e de boa parte da África. A classificação apresentada aqui é baseada principalmente no Ethnologue (www.ethnologue.com), publicação que classifica geneticamente todas as línguas conhecidas da humanidade e dá seu número de falantes e localização, além de eventuais outras informações muito superficiais sobre estrutura gramatical e dialetos. O Ethnologue é publicado pelo Summer Institute of Linguistics, entidade evangelizadora que está entre os maiores institutos lingüísticos do mundo. O problema do Ethnologue é que é extremamente detalhado, mas sem sumarização nenhuma, o que torna difícil extrair as informações mais importantes sobre as 6.600 línguas listadas.

Como regra geral ficarão mais próximas uma das outras as famílias que se supõem mais próximas, como as duas famílias caucasianas, bem como o indo-europeu, o afro-asiático e o uralo-altaico. As línguas do extremo oriente, das famílias sino-tibetana, austro-asiática e tai-kadai foram postas juntas porque, mesmo que não tenham afinidade genética comprovada, conviveram por muito tempo e compartilham características, formando um tipo de Sprachbund. Outra adaptação em relação ao Ethnologue é que, especialmente em famílias gigantescas como a austronésia e a nígero-cordofânica, a hierarquização de ramos e sub-ramos será simplificada.

Informações Gramaticais

1) Ordem da Oração

Quando possível e interessante, indicarei a ordem sintática neutra das línguas: SOV significa sujeito-verbo-objeto, VSO significa verbo-sujeito-objeto, etc. É claro que essa ordem varia, mas na maioria das línguas há uma ordem que é a mais neutra. Como a lingüística gerativa postula que há uma correlação entre a ordem sintática e a colocação das preposições, indicarei se na língua há preposições ou posposições. Segundo essa teoria, as línguas SVO tendem a ter preposições e as SOV posposições. Outro postulado do gerativismo é que os elementos verbo e objeto jamais se separam, portanto uma ordem VSO ou OSV são resultado de uma transformação a partir de uma ordem SVO, OVS, VOS ou SOV, as ordens mais comuns nas línguas do mundo. Estima-se que a mais comum seja SOV, seguida de perto pela SVO. A ordem VSO é rara, a OVS também e a ordem OSV talvez só exista em uma língua, falada no norte do Pará, o hixkaryana, da família caribe.

2) Alinhamento

Outra importante classificação sintático-morfológica é quanto ao alinhamento. Existem o alinhamento nominativo, mas comum, e o ergativo, mais raro. O português e a maioria das línguas da Europa são de alinhamento nominativo (ou nominativo-acusativo). Nessas línguas, o sujeito de um verbo transitivo ou intransitivo é marcado da mesma maneira, e o objeto direto é marcado distintamente. O basco, certas línguas do Cáucaso, da Austrália, da Sibéria têm um alinhamento ergativo, em que o sujeito de um verbo transitivo é marcado com um caso especial e o objeto direto é marcado da mesma maneira que um sujeito de um verbo intransitivo, se bem que certas línguas ditas ergativas estão em um estado intermediário entre a ergatividade e a nominatividade. Veja mais explicações em cada língua.

3) Fonética

Quanto à fonética e à fonêmica, há línguas tonais e ou não-tonais. Em relação aos tipos de fonemas que pode haver em uma língua, há principalmente duas classes básicas: os inspirados e os expirados. Os inspirados existem apenas em certas línguas do sudoeste africano, que têm também fonemas expirados. Os sons inspirados são chamados de cliques e são estalos com a língua contra os dentes ou o palato.

4) Locução Nominal

Uma relação interessante dentro da locução nominal posição relativa entre o adjetivo e o substantivo. Certas línguas põem o adjetivo antes e certas línguas põe o adjetivo depois do substantivo. São línguas AS e SA, respectivamente. Há, é claro, outros elementos na locução nominal, como o artigo, os demonstrativos, numerais e classificadores. O português não apresenta classificadores regularmente. E boa parte, se não a maioria das línguas não tem artigo e indicam definição de outros modos. Os artigos podem vir antes (português, inglês), depois (wolof), prefixado (árabe, hebraico) ou sufixado (búlgaro, sueco).

5) Flexão Verbal

Os verbos tendem a variar em tempo e aspecto. Os tempos são presente (estou fazendo), atemporal (faço), futuro (farei), passado (fazia), perfeito (fiz), condicional (faria),

Os modos são subjuntivo (fizesse, faça, fizer), o imperativo (faça!) e outros que há nas diversas línguas.

Os aspectos são o imperfectivo e o perfectivo, que denotam respectivamente ação incompletada e completada. Os verbos em português não especificam o aspecto, mas a maioria dos sistemas verbais do mundo põe até mais ênfase na indicação do aspecto do que do tempo ou modo.

Além disso, os verbos podem concordar com as locuções nominais com que se relacionam. No português, o verbo concorda apenas com o seu sujeito, mas em muitas línguas o verbo concorda com o objeto também. É verdade que formas portuguesas como eu vou trazê-lo parecem concordar com o objeto também.

6) Classe e número nominal

Os substantivos de certas línguas podem possuir uma propriedade chamada classe. Em português temos duas classes, chamadas gênero masculino e feminino. Em tchetcheno há seis classes, em wolof há oito e em zulu dez, mais ou menos. O número se refere a singular, plural e, em certas línguas o dual (plural de dois) e o paral (plural de coisas que sempre vêm em par, como mão, perna, orelha, olho). O singular se refere a qualquer número, o plural se refere a qualquer número exceto a unidade. O português têm dois números: singular e plural. É com essas classes e números que os adjetivos, artigos, demonstrativos, verbos e às vezes numerais concordam.

7) Pessoa

O discurso conhece três pessoas: 1a. (o falante) 2a. (com quem o falante fala) e 3a. (o resto do universo). Essas pessoas variam em número, se a língua apresentar essa variação. Em certas línguas, especialmente na América pré-colombiana e na Polinésia, a 1a. pessoa plural se subdivide em duas sub-pessoas: 1a. pessoa plural inclusiva e 1a. pessoa plural exclusiva. A inclusiva significa “eu/nós e você(s)” e a exclusiva apenas “nós, não você(s)”.

8) Caso

Caso é a função que uma palavra exerce numa oração. O verbo não tem caso, pois é em relação a ele que os casos se definem. Quem tem caso é a locução nominal. As funções em uma oração são principalmente as de sujeito e de objeto direto do verbo. Outras funções, que podem ser chamadas de circunstanciais ou adverbiais, podem ser inúmeras, indicando local, tempo, modo, posse, alvo, benefício, distanciamento, instrumento etc.

Em terminologia lingüística, os casos têm nomes especiais:

sujeito – nominativo (eu dou um presente)

objeto dir. – acusativo (eu dou um presente)

possessivo – genitivo (eu dou um presente de aniversário)

afastamento, origem – ablativo (eu dou um presente do Japão)

alvo de movimento – inessivo ou alativo (eu bebo água que desce para meu estômago)

obj. indireto ou alvo de ação – dativo (eu dou um presente para o meu irmão)

local de repouso – locativo (eu dou um presente de aniversário do Japão para meu irmão na festa)

instrumento – instrumental (eu dou um presente feito a máquina)

beneficiamento – benefactivo (eu dou o presente a ele por você)

A ordem das famílias adotada aqui

A geografia desempenha um certo papel na ordem das famílias lingüísticas apresentada a seguir. Começarei pelo sul da América do Sul, subindo até o ártico americano, seguino para a Sibéria, Pacífico, Austrália, Nova Guiné, Ásia Oriental, Ásia Central, Europa, Oriente Médio, Norte da África, África Equatorial, terminando no sul da África. Não há nenhuma razão para essa ordem específica, mas agrupar as famílias em ordem geográfica tem o benefício de pôr mais próximas umas das outras famílias que conviveram e se influenciaram no decorrer da história. Também é uma maneira de evitar a abordagem tradicional de se começar pela família indo-européia e depois ir dizer algo sobre as línguas “civilizadas” da Ásia e “tribais” do resto do mundo.

Logo após, as línguas do que eu chamo de “Afro-Eurásia”, indicando o contínuo existente entre Eurásia (Europa e Ásia) e África, já que não existe fronteira lingüística definível entre a África e a Eurásia (que dizer então de uma suposta fronteira entre Europa e Ásia). E é verdade que tampouco há lingüisticamente uma fronteira entre Afro-Eurásia e América ou Nova Guiné – ilha do pacífico do tamanho de Minas Gerais mas que lingüisticamente é praticamente um continente, com suas 800 línguas pertencentes a várias famílias. Talvez seja a Austrália o único grande pedaço de terra lingüisticamente isolado do resto do mundo. Quando necessário ou interessante, haverá uma introdução a determinada área geográfica cujas famílias lingüísticas por questões históricas e não necessariamente genéticas devem receber um tratamento especial. É o caso das Américas, da África Ocidental, da Ásia Central e da Nova Guiné.

“As Línguas da América”

A América pré-colombiana apresentava uma panorama lingüístico riquíssimo e extremamente variado, a tal ponto que hoje, séculos depois do genocídio americano, ainda há mais famílias lingüísticas na América do que na Ásia, Europa e África juntas. Portanto o interessado se depara com um problema: por um lado, a vastidão do assunto, por outro, a pobreza de obras de referência devido não só à falta de interesse dos lingüistas mas principalmente à falta de registro escrito das línguas americanas, genericamente também chamadas de “ameríndias”. Essas designações são meramente geográficas, tal como “línguas da Eurásia” ou “linguas africanas”.

Dependendo da fonte, pode-se achar as línguas americanas divididas em um número de famílias entre 50 e 200. Recentemente, o lingüista norte-americano Joseph Greenberg, que ajudou a classificar as línguas da África, afirmou ter conseguido agrupar as famílias americanas em três super-famílias, não baseado numa suposta afinidade genética como as línguas indo-européias, e sim baseado em similaridades de qualquer ordem e origem entre as línguas, mas ou menos como na família uralo-altaica.

Essas três super-famílias americanas seriam mais ou menos correspondentes às três migrações que teriam povoado a América começando há mais de 12 mil anos: a onda migratória mais recente seria a dos esquimós aleutas do Norte do Canadá, Alasca (e Sibéria); a onda anterior seria a dos Na-Dene, que deu origem a alguns povos do noroeste canadense, Alasca, além de outros mais famosos do sudoeste estadunidense como os navarros (navajos, navahos) e os apaches, da Califórnia. A mais antiga das migrações em diração à América teria dado origem às línguas de todos os demais povos americanos, desde o Quebec até a Terra do Fogo. As línguas faladas pelos descendentes desses primeiros americanos formariam então uma família “ameríndia”. Um traço presente em línguas como o nahuatl, quéchua e tupi é a distinção entre uma 1a. pessoa do plural inclusiva e outra exclusiva, além da posposição locativa -pe. Poucos lingüistas históricos concordam com essa classificação, razão pela qual darei aqui as famílias aceitas amplamente, baseado na classificação do Ethnologue.

Essa teoria das três migrações de Greenberg tem o apoio de uma pesquisa genética que também chegou à conclusão de que o nosso continente fora povoado por três correntes migratórias, mais ou menos correspondentes à divisão lingüística acima.

No Brasil são faladas cerca de 170 línguas americanas, a maioria esmagadora das quais possui menos de quatro mil falantes cada (de fato umas sessenta têm cerca de 200 falantes ou menos) e estão todas ameaçadas seriamente de extinção. A média é de 100 falantes por língua. São conhecidas mais de 40 línguas indígenas brasileiras que já se extinguiram. Os falantes de pelo menos uma língua americana no Brasil hoje são cerca de 100 mil, de um total de 250 mil índios. As línguas mais faladas são o kaingang, (família jê, 18 mil falantes), o terena (arauaque, 15 mil), o kaiwá (tupi, 15 mil), o ticuna (isolada, 12 mil), o tenetehara (tupi, 15 mil), o ianomâmi (ianomâmi, 9 mil) e o xavante (jê, 8 mil).

A importância das línguas americanas para o português foi bastante grande. Os empréstimos americanos em nossa língua, vindos especialmente das línguas tupi-guaranis, se referem geralmente a topônimos e a objetos, frutas, árvores e animais desconhecidos dos portugueses. Mas também há termos do léxico geral, como cutucar, pipoca, maracatu de origem americana, no caso, do tupi.

O termo “indígena” deve ser explicado com cuidado. É usado como sinônimo de povo americano pré-colombiano e de “índio”, mas não deveria. Vejamos como surgiram esses termos. Como se sabe, os europeus chegaram à América inicialmente pensando se tratar da Ásia Oriental, cujo país mais famoso para os europeus era a Índia. Chamaram os habitantes desse “novo mundo” portanto de “índios” (o termo português indiano, para os habitantes da Índia, surgiu depois justo para distinguir os dois significados). Na verdade, o termo “Índia” não é usado pelos indianos para seu país. Vem da designação que os persas usavam, e deriva do rio Sindh, no atual Paquistão, que historicamente delimitava o mundo persa e muçulmano do mundo hindu. Em persa e em árabe, o s- inicial de certas palavras virou h-, portanto rio Sindh virou Hind. Os europeus, como só sabiam da Índia através dos mercadores e estudiosos do Oriente Médio, adotaram o termo. Nas línguas da Índia, o país se chama Bhârat.

O termo indígena, por incrível que pareça, não tem nada a ver com índio ou indiano. Deriva do latim “inde” (lá, em tal lugar) mais “gen-”, radical que exprime “gerar, nascer”. Significa portanto “pessoa que nasceu onde está, habitante original”. A similaridade entre “indígena” e “índio” é meramente fortuita, mas ajudou a colar um termo no outro. Na verdade, indígena pode ser usado para qualquer povo original de uma terra. Um russo é um indígena da Rússia, um iraniano é um indígena do Irã, um português é um indígena de Portugal. Mas como ninguém usa esse termo assim, ele se consagrou como sinônimo de “habitante original da América”. Tanto que os indígenas da Austrália receberam até um outro nome, “aborígene”, do latim ab- (a partir de) mais origine- (origem), ou seja, “aquele que está lá desde a origem”. Alguns autores usam aborígenes da América e/ou indígena da Austrália. Mas de novo, por falta de nome melhor, aborígine virou sinônimo de australiano original.

Nesse trabalho, preferirei usar o termo que acho mais correto para os povos originais da América: americanos. É um termo genérico, geográfico, pois há tanta diversidade de línguas e culturas no continente que o ideal seria chamar cada povo pelo seu nome próprio: tupinambás, astecas, navajos, cheroquis, maias, quechuas, caribes, ianomâmis, etc. Os habitantes dos EUA chamarei de estadunidenses ou euro-norte-americanos.

fontes:

The Ethnologue (www.ethnologue.com). Site sobre número de falantes e classificação genética de praticamente todas as seis mil e poucas línguas do mundo.

Línguas Brasileiras (de Aryon Dall’Igna Rodrigues, 1986, Edições Loyola) – o único livro de divulgação dessas línguas, já muito desatualizado. O número de falantes dado abaixo para as línguas brasileiras é desse livro, portanto falam dos anos 80. Esse livro chama de tronco o que eu chamo de família, e de família o que eu chamo de ramo. Muito pouca informação sobre a morfologia e sintaxe das línguas é dado, o autor se limita a curtas listas de palavras, que reproduzo abaixo. Mas o autor está de parabéns por ter sido a única alma caridosa a escrever um livro decente com um panorama científico das línguas do País. Só se encontra esse livro em bibliotecas e cebos.

Introdução às Línguas Indígenas Brasileiras – serve mais de introdução à lingüística geral do que especificamente às línguas brasileiras. Não fala da gramática dessas línguas.

As Línguas Amazônicas Hoje (coletânea) – não é uma descrição das línguas, e sim uma coletânea de textos sobre situação da pesquisa lingüística americana e alguns textos sobre a situação em outros continentes: um texto sobre o catalão, outro sobre a matemática moçambicana e um outro, excelente, em que um lingüista australiano faz uma auto-crítica sobre os erros dos métodos de pesquisa e divulgação que ele e diversos lingüistas cometeram no campo da australianística.

Apresenta também o número de falantes das línguas nos diversos países amazônicos, esclarece quais línguas estão perto da extinção (a maioria) e quais já se extinguiram, além de chamar atenção para o perigo dos lingüistas-missionários que prestam realmente um grande serviço pesquisando línguas mas tendem a destruir as culturas através da evangelização.

Para o tupinambá, ou tupi antigo, utilizei como fonte nada menos que a primeira gramática dessa língua, do padre jesuíta José de Anchieta, chamada “Artes de Gramática da Língua Mais Usada na Costa do Brasil”, escrita no Brasil em 1590 e pouco e publicada em Lisboa em 1595. A minha edição comprei por R$30 na Livraria Cultura, uma versão em fac-símile do original com apêndice resumido moderno no final. É verdade que a gramática de Anchieta está longe de ser uma descrição fiel da língua tupinambá, pois visava somente fazer a língua compreensível para os esforços de catequese, mas apresenta sim uma descrição útil e, ao contrário do que dizem certos críticos, surpreendentemente livre dos preconceitos latinistas que prevaleceram até tempos recentes.

Para o nahuatl moderno, utilizei uma gramática de 270 páginas em pdf que baixei do site do SIL. A gramática do quéchua moderno que utilizei é a do site Curso de Lengua Quechua (www.yachay.com.pe/especiales/quechua).

Família Araucana

Falada nas extremidades meridionais da América do Sul, principalmente no centro dos Andes chilenos e adjacências argentinas. A única língua viva dessa família é o mapudungun, falada por 400 mil pessoas no Chile e por 40 mil na Argentina. SVO.

Família Chon

No sudeste da Patagônia.

Família Mascoiana

Cinco línguas no Paraguai: emok, guana, lengua, sanapaná (6.900) e taba-mascoy (2.100).

Família Aimará

Três línguas na Bolívia e Peru. Contém muito vocabulário em comum com a família quéchua, mas talvez isso seja fruto de contato e não de origem comum. O aimará é falado por mais de um milhão de pessoas.

Para os numerais de um a dez em aimará, veja o final da seção Família Quéchua.

O aimará é uma língia SOV, flectiva e sufixante, de alinhamento nominativo. Não há classes ou gênero gramaticais. O plural pode ser marcado com o sufixo -naka, opcionalmente. Não há artigos. O caso acusativo é marcado pela perda da vogal final do substantivo. Os demais casos são marcados por sufixos.

Markar sarasktwa – (lit. cidade-r/vou) vou para a cidade

T’ant’amp manq’āwa – (lit. pão-mp/comerei) vou comer com pão

Ururut jutta – (ururu-t venho) – venho de Ururu

Taykaxatakiw alta – (minha mãe-taki-foco/comprei-o) – comprei-o para minha mãe

Observe que o sufixo –xa é o possessivo de 1a pessoa singular: tayka (mãe) > taykaxa (minha mãe)

Abaixo, a tabela de pronomes pessoais em aimará.

Note que a primeira pessoa singular também discerne inclusividade de exclusividade. A 1a. pessoa singular inclusiva significa “eu e você”. O plural dos pronomes é opcional.

Há apenas uma posposição não sufixal, manqha (dentro de), e nenhuma preposição. Os demonstrativos distinguem três graus de distância, como em português: aka (este), uka (esse), khaya (aquele).

Os sufixos individuais tendem a representar pessoa e tempo simultaneamente, como o -i, do português “comi”, mas concordam com o objeto do verbo também. Esses sufixos personal-temporais não indicam número, que é expresso por um sufixo separado -px(a)-, posto entre o tema verbal e o sufixo personal-temporal.

É de se notar que o verbo “falar” em aimará tem raiz parlā, numa bizarra coincidência com certas línguas latinas (italiano parlare, catalão parlar, francês parler, do latim parabolare)

Família Quéchua

O quéchua é a língua dos incas e de seus descendentes modernos. A família quéchua inclui apenas a língua quéchua, que contudo é dividida em mais de vinte dialetos, espalhados pelo Peru, Bolívia e Equador, onde há 8 milhões de falantes da língua, 30% dos quais falam apenas quéchua. Há alguns poucos falantes no Chile, na Argentina e no Brasil. É a língua americana mais falada atualmente. Talvez aparentada às línguas da família aimará.

Os dois grupos dialetais principais são o central e o periférico, nem sempre mutuamente inteligíveis. Os dialetos centrais, falados na espinha central dos Andes peruanos, são os que apresentam as maiores diferenças entre si, indicando talvez que a terra original dos incas seja lá. A língua descrita aqui é o dialeto ayakucho, bem próximo ao dialeto de Cuzco (Qosqo em quéchua), este considerado o dialeto principal, que pra variar é chamado por seus falantes de “puro”. No Equador, a língua é chamada que “quíchua”.

O quéchua é uma língua aglutinante, de morfologia extremamente regular e rica. Em quéchua, há apenas três vogais básicas, a-i-u, mas que dependendo da posição assumem valores diferentes, como em árabe clássico. Há também o fonema representado pela letra q, como nas línguas semíticas, que é uma parada uvular, similar ao k mas pronunciada o mais atrás possível, quase na garganta. Não há consoantes sonoras em quéchua, apenas surdas, representadas pelas letras q, k, t, ch (como [č]), p, f, s, h (como em inglês), além das consontes nasais m, n e ñ (como em castelhano). O dígrafo ll representa o mesmo som que o lh português, mas há variação dialetal. O acento é dinâmico e a sílaba tônica é sempre a penúltima da palavra, incluindo sufixos. É bem verdade que a ortografia do quéchua não está plenamente estandardizada.

A morfologia verbal do quéchua, como é típico entre as línguas aglutinantes, além de indicar tempo e pessoa do sujeito, indica uma série de derivações como causativo, sugestivo, subjetivo, etc. O quéchua tem posposições sufixadas aos nomes: Lima > Limapi (Lima > em Lima); Luwis > Luwiswan (Luís > com Luís). O objeto direto é indicado pelo sufixo -ta, e o tópico da sentença pelo sufixo -qa. Os adjetivos precedem o substantivo: hatun wasi (grande casa) e substantivos podem qualificar substantivos como em inglês: alqo wasi (“cachorro casa” = casa de cachorro). Não há artigos definidos nem indefinidos nem gênero gramatical, e o plural pode ser formado com -kuna, apenas se a pluralidade não estiver clara a partir do contexto. O possessivo (genitivo) é expresso pelo sufixo -(h)pa, em alguns dialetos apenas -h. O ordem sintática básica em quéchua é sujeito-objeto-verbo (SOV).

Como é típico de tantas línguas da América, o quéchua tem um pronome “nós” inclusivo (meu grupo e você(s) a quem estou falando) e um exclusivo (eu e meu grupo, não você(s)). Os pronomes pessoas em quéchua são:

eu – nuqa (no dialeto ayakucho, ñuqa)

tu – qan

ele – pay (não há gêneros em quéchua, assim pay significa “ela” também)

nós (incl.) – nuqanchis

nós (excl.) – nuqayku

vós – qankuna

eles – paykuna (significa “elas” também)

Adiciona-se o sufixo –(h)pa para formar os pronomes possessivos pessoas: nuqahpa (meu, minha, meus), qanpa (teu, tua, etc.). Mas os adjetivos possessivos pessoais são expressos por sufixos, iguais aos sufixos verbais de pessoa (ver abaixo).

Os verbos em quéchua têm infinitivo, terminado em -y. Eliminando esse -y, tem-se a raiz verbal à qual são adicionados os sufixos pessoa, tempo, etc. Veja a conjugação no presente simples do verbo “rimay” (falar):

O objeto pronominal é expresso por um infixo logo após o radical verbal e antes dos sufixos de tempo e pessoa: rikuwanki (riku = ver, wa = sufixo de 1a.p.sg. objeto, nki = sufixo de 2a.p.sg. sujeito), ou seja, “você me viu”. Os objetos substantivos vêm entre o sujeito e o verbo, normalmente, já que se trata de uma língua SOV:

Alqoqa qarita kachuran (lit. “cachorro-qa homem-ta mordeu”) = o cachorro mordeu o homem

Observe que “alqo” (=cachorro) recebeu a partícula de tópico -qa, porque no exemplo escolhido é o assunto discutido. O verbo “kachuy” (morder) está conjugado normalmemente na terceira pessoa singular do passado e o objeto “qari” (homem) recebeu o sufixo de objeto direto -ta.

O verbo “ser” (kay) tem uma conjugação própria mas não é necessário em frases equacionais no presente: nuqa karpintiru = eu sou carpinteiro.

Além disso, o quéchua tem uma série de partículas frasais sufixadas que expressam nuances relativas ao tipo de informação e à opinião do falante. Por exemplo, a partícula -m expressa que a informação foi obtida de outros, de ouvir falar, e não expressa conhecimento do próprio falante: pay karpintirum = ele é carpinteiro (eu ouvi falar). Já a partícula -s exprime fato conhecido de primeira mão pelo falante, ou sua opinião: pay karpintirus = ele é carpinteiro (eu sei por que o conheço).

Os numerais de uma a dez em quéchua e, por comparação inter-familair, em aimará, são:

As similaridades com o aimará podem ser fruto de contato e não de origem comum.

O quéchua nos legou várias palavras, não só através do castelhano mas também diretamente, por ter atingido o Brasil com o trabalho de missionários vindos dos Andes e do chaco. Aliás chaco e charque são algumas das palavras quéchuas que nós temos, ambas de “ch’arki”. O termo “gaúcho” (gaucho [gawcho] em castelhano) vem do quéchua “wakcha” e significa “pobre”. Condor vem do quéchua “kuntur” e coca de “kuka”. Outras são lhama, inca, mate, pampa, puma, quinino, alpaca e vicunha.

Família Macro-Jê

Exceto por uma língua na Bolívia, esta família está localizada totalmente no Brasil, originalmente no interior do Sudeste, do Sul, Bahia, Piauí, Goiás e Tocantins e Mato Grosso. Havia povos jês também na costa sul da Bahia e Espírito Santo. Em São Paulo, ocupavam boa parte das terras entre o Rio Grande e o Tietê. Hoje restringem-se ao Mato Grosso, sul do Pará, Maranhão e sudoeste do Tocantins. A única língua americana ainda falada hoje em São Paulo é o kaingang, língua macro-jê do ramo jê.

Ramo Jê

É o ramo principal, que inclui os seguintes sub-ramos:

timbira: canela apaniekra, canela ramkokamekra, kreye (MA), krinkrati, krahó (TO) e pukobyé (ou gavião do maranhão)

kayapó: kubenkrangnoti, kubenkrankegn, menkragnoti, gorotire, mebengokré, kokraimoro (PA), e txukahamãe (Parque do Xingu). Todas muito parecidas, a ponto de poderem ser consideradas dialetos de uma língua kayapó.

akwén: xavante (MT), xerente (TO), kaingang (SP, PR, SC, RS) e xokleng (SC).

A língua mebengokré é a língua falada por ambas as nações kayapó e xikrin. O kaingang é provavelmente a língua americana mais falada no Brasil, com 18 mil falantes. O xavante tem 8 mil falantes.

As línguas, kreen-akahore, suyá ou tapayuna (Alto Xingu), apinayé (TO) são geralmente associadas ao ramo kayapó, mas a classificação não é segura. De qualquer forma, estão no ramo jê.

Como se pode ver, as línguas jê são muito ricas em vogais nasais.

Outros Ramos

As demais línguas da família macro-jê são o maxakalí, o bororo, o karajá, o guató, o rikbaktsá e o ofayé. Talvez ainda haja meia dúzia de falantes das línguas do ramo botocudo, como o krenak e o nakrehé. O ramo karirí se extinguiu. As línguas karirí eram o kipeá (nordeste da Bahia e Sergipe) e o dzubukuá (grandes ilhas do São Francisco), documentado desde o séc. 17. Outros ramos extintos são o kamakã, do sul da Bahia e Espírito Santo, e o ramo purí (línguas coroado, purí e koropó).

O seguinte excerto do livro “Línguas Brasileiras” (pág. 49) dá uma noção da geografia e da classificação das línguas macro-jê (do texto original, só troquei o “tronco” por família e “família” por ramo, para encaixar na minha terminologia):

“Podemos distinguir nos componentes da família macro-jê um conjunto a leste do ramo jê, formado pelos ramos purí (coroado), botocudo, maxakalí, kamakã e pelas línguas masakará e yatê (fulniô) e outro conjunto a oeste daquele ramo, formado pelo ramo bororo e pelas línguas ofayé, guató e rikbaktsá. A família karajá, no Araguaia, situa-se entre dois sub-ramos do ramo jê, o kayapó a oeste e o akwén a leste. Esta é, entretanto, uma distribuição puramente geográfica; não temos até agora evidências de que as línguas mais a leste ou mais a oeste apresentam todas maior afinidade entre si.”

Família Mataco Guaicuru

No Brasil, representada pela língua kadiwéu, falada por cerca de 1.500 pessoas no Mato Grosso do Sul, próximo à serra da Bodoquena. Existem outras dez línguas dessa família, oito na Argentina, uma no Paraguai e outra na Bolívia. A mais falada é o chulupí, do Paraguai, com 18 mil falantes. As outras têm de algumas centenas a dois mil falantes. A família se divide em dois ramos: o mataco e o guaicuru. O chulupí é do mataco e o kadiwéu do guaicuru.

O kadiwéu é uma língua em que predomina a ordem SVO. Os verbos variam em pessoa, número, aspecto e modo, mas não há voz passiva. Não há a distinção entre 1a. pessoa plural exclusiva e inclusiva. A conjugação verbal em kadiwéu segue paradigmas muito complexos. Enquanto varia em pessoa e número, o verbo kadiwéu ganha uma série de prefixos e sufixos através de conjuntos de regras interdependentes difíceis de explicar. Abaixo, a conjugação verbal dos cinco tipos principais de verbos transitivos:

Os verbos iligice e omoke pertencem ao primeiro tipo e só variam quanto à vogal inicial, que faz com o que o prefixo de 3a. y- apareça antes de qualquer vogal menos [i]. O verbo eemite é do tipo 2, que ganha d- na terceira pessoa, o verbo alita é do tipo 3, (w-) e nibatoo é do tipo 4, sem prefixo de 3a. Veja que o prefixo de 2a. pessoa também varia de tipo para tipo, e nos dois primeiros tipos o verbo ganha o sufixo -ni na 2a. As regras exatas da conjugação verbal são muito mais complexas.

Quanto ao aspecto, há três principais em kadiwéu.

Os pronomes pessoas objetos são prefixados aos verbos em kadiwéu. Suas formas livres são:

Os prefixos possessivos dados acima não se ligam ao nome possuído, como seria de se esperar. Ligam-se, em vez disso, a uma raiz possessiva que vai indicar o gênero e o número do possuidor, caso este seja animado (pessoa, animal). Essas raízes sãp wag’adi (m) e wikate (f), cujo plural é wikatedi para ambos os gêneros.

jelicg’a liwig’adi nigidagiwaga

{comemos/ dele/ porco}

comemos o porco dele

O verbo “ser” não precisa ser indicado: ee nelegi {eu/ grande} = eu sou grande.

Família Nambiquara

Duas línguas, apenas no Brasil: o nambiquara e o sabanê, faladas entre Rondônia e oeste do Mato Grosso

Família Tupi

A família tupi, especialmente seu maior ramo, o tupi-guarani, foi a família lingüística americana mais importante na formação do Brasil, e a mais extensamente espalhada na América do Sul.

Ramo Tupi-Guarani

É o principal ramo da família tupi, compreendendo cerca de 30 línguas bem próximas entre si e faladas principalmente no Brasil, Paraguai e Argentina, e uma importante língua extinta, o tupinambá ou tupi antigo, língua geral do Brasil colonial que desapareceu em meados do século 19. O tupi era falado por toda a costa do Brasil desde o Rio Grande do Sul até o Maranhão. O tupi se extendia ainda pelo interior e pelas bacias do Tocantins e Amazonas, onde se intercalava com línguas de outras famílias e de outros ramos tupis.

A língua tupi-guarani moderna mais importante sem sombra de dúvida é o guarani, falado como língua materna por três milhões de pessoas (90%) no Paraguai, onde é oficial ao lado do castelhano, e em adjacências brasileiras (5 mil) e argentinas. Em segundo lugar, fica o chiriguano, falado na Bolívia por 50.000 pessoas. O guarani é portanto a única língua americana oficial em um Estado moderno. Essa língua não era nativa da maior parte do atual Paraguai, mas se estabeleceu no país devido à ação jesuítica.

No Brasil há 21 línguas tupi-guarani vivas, faladas por cerca de 33.000 pessoas. As mais faladas são o kaiwá, no MS, com 15 mil falantes, e o tenetehára, no MA e PA, com 10 mil falantes (dados do Ethnologue).

Os primeiros textos em tupi antigo datam de 1575, traduções do pai-nosso, da ave-maria e do credo. Um pouco depois, o pastor calvinista francês Jean de Léry publica texto que procurava reproduzir conversas reais em tupi antigo. Sua primeira descrição gramatical é de 1595, feita pelo padre José de Anchieta.

A extensão terrotorial original do ramo tupi-guarani era enorme, a maior da América do Sul. Incluía o litoral brasileiro do Rio Grande do Sul até Alagoas, além do interior do Sul e Sudeste, Centro-Oeste, parte da Bolívia, sul da Amazônia e a bacia do rio Paraná (Paraguai e nordeste argentino).

Nos tempos da colônia e do Império, o tupi antigo foi levado pelos colonizadores até o norte do Amazonas, onde se transformou na língua conhecida como nheengatu, que serviu de língua geral do Amazonas até meados do século 19, e existe por lá até hoje, com 2 mil falantes no Brasil. Essa língua tomou e legou palavras a línguas de outras famílias faladas no norte Amazônia, como as línguas caribe e arauaque, e chega a ser falada até na Venezuela e Colômbia.

Nas transcrições usadas aqui, as letras se pronunciam como em português, exceto: a apóstrofe indica parada glotal, o “w” é como em inglês, o “g” é sempre oclusiva, “x” é sempre como o nosso “ch” e o “y” indica a vogal central como em polonês, pronunciada numa posição entre a o [i] e a do [u] mas sem ser arredondada.

RN: Rio Negro

Para termos uma noção da gramática das línguas tupi-guaranis, podemos pegar o tupi antigo, ou tupinambá.

Os fonemas [f], [h], [q], [z], e [v] não existiam em tupi antigo. As vogais todas podem ocorrer tanto não-nasais quanto nasais, sendo que as nasais, ao contrário do que ocorre em português, nunca servem de alofones das não-nasais. As vogais são seis: [a], [ε], [i], [ơ], [u], [y]. O [y] é pronunciada como o “erý” (ы) russo ou o “y” polonês, ou seja, com a ponta da língua na posição do [i] mas o meio na posição do [u]. Como dito acima, todas essas vogais ocorrem anasaladas também. Não há encontros consonantais exceto [mb], [nd] e [ng]. O acento em tupi é dinâmico, ou seja, há sílabas tônica e átona, e não há tons. A sílaba tônica pode ocorrer na última ou na penúltima sílaba da raiz da palavra, e pode haver um acento secundário em afixos plurissílabos. A ortografia do tupi jamais foi verdadeiramente padronizada. Aqui utilizarei uma grafia geralmente aceita entre os lingüistas.

O livro “Método Moderno de Tupi Antigo” utiliza “û” e “î” em vez de “ŭ” e “ĭ”. A utilização do “y” para a “sexta vogal” data já dos primeiros textos, mas havia a grafia “ig” na época colonial também. O hífen será usado aqui para didaticamente separar certos morfemas. As vogais nasais serão indicadas com til. O acento tônico cai na última sílaba se a palavra terminar com consoante, “u”, “y”, “i” ou qualquer vogal nasal. Palavras terminadas com outras vogais podem ser tanto paroxítonas quanto oxítonas, neste caso a vogal receberá um acento agudo.

Os tupis do Rio de Janeiro para o sul, como os da Capitania de São Vicente, segundo Anchieta e outras fontes do século 16, tendiam a não pronunciar consoantes finais dos verbos afirmativos: apáb (eu me acabo) viarava apá; asem (eu saio) virava asé.

Em tupinambá não há artigos definidos ou indefinidos. Não há gêneros gramaticais nem nos pronomes, mas há distinção morfológica entre seres inferiores (coisas, animais) e superiores (gente), feita através de prefixos postos em palavras de um tipo chamado pluriforme.

Existe uma característica que divide verbos, adjetivos, substantivos e até posposições em “uniformes” e “pluriformes”. Os pluriformes, quando dizem respeito a pessoas ou coisas relacionadas a humanos, ganham prefixos característicos chamados prefixos de relação (t-, r-, s-). A palavra “-era”, por exemplo, que significa “nome”, é um substantivo pluriforme. O prefixo t- é posto para se obter a forma absoluta, que é a básica, usada quando a palavra é independente, como sujeito ou objeto, sem exigir uma outra palavra para lhe completar o sentido: t-eraporanga – nome bonito, t-era nd’aĭkuabi – não sei o nome.

Mas se quisermos relacionar esse substantivo a um possessivo ou a outro substantivo, poremos os prefixos s- e r-: xe r-era (meu nome), kunumĩ r-era (o nome do menino), s-era (o nome dele). As formas s-era e r-era chamam-se formas relacionais ou formas construtas. O prefixo r- serve quando o termo pluriforme é imediatamente precedido por um possessivo de 1a. ou 2a. pessoa, ou por um substantivo com o qual ele esteja em relação genitiva ou do qual ele dependa gramaticalmente. O prefixo s- serve para indicar possessivo de 3a. pessoa sem substantivo presente.

Os pronomes pessoais em tupinambá são:

Note a presença, típica nas línguas americanas, da distinção entre uma 1a. pessoa inclusiva e outra exclusiva, como em quéchua, nahuatl e muitas outras. A inclusiva inclui a(s) pessoa(s) a quem se fala e a exclusiva a(s) exclui. Os pronomes como objeto direto em tupi também são prefixos.

Todos os pronomes objetivos ede 1a. e 2a pessoa fazem cair os prefixos número-pessoais sujeito do verbo, menos os reflexivos (jo-). Note que os pronomes objetivos de 2a. pessoa variam de acordo com qual é a pessoa do sujeito do verbo: ixé orokuab(eu te conheço), nde kuab Pedro (Pedro te conhece). O verbo “kuab” é dissílabo, não confundir com o verbo “kwab” (passar).

Veja um verbo com objeto de 3a. pessoa: aĭkutuk, ereĭkutuk, oĭkutuk, oroĭkutuk, ĭaĭkutuk, peĭkutuk, oĭkutuk (eu o furo, tu o furas, ele o fura, nós o furamos, etc.). O prefixo objeto de 3a. pessoa é requisitado sempre que o verbo tiver um objeto direto:kunumĩ aĭkuab (o menino eu-o-conheço).

kunhã ĭandé kutuk – a mulher nos fura (já que o objeto é de 1a pessoa, o verbo não leva o prefixo o-)

kunhã xe kutuk – a mulher me fura

kunumĩ nde kutuk – o menino te fura

ixé orokutuk – eu te furo

ixé opokutuk – eu vos furo

ixé ndopokutuki – eu não vos furo

kunumĩ pe kutuk – o menino vos fura

nde kutuk ĭuatĩ –o espinho te fura

O possessivo é o pronome pessoal sujeito anteposto ao nome possuído: xe r-oka (minha casa). A construção possessiva com substantivo também ocorre assim: Pedro ĭara (o senhor de Pedro). Veja a conjugação no tempo simples indicativo do verbo cujo infinitivo é “ĭuká” (matar).

O prefixo de terceira pessoa é ĭa- caso o termo em ênfase da oração for o objeto direto: abá ĭagŭareté oĭuká (o homem matou a onça), mas abá ĭagŭareté ĭaĭuká (a onça, o homem matou).

Todo verbo oxítono terminado no simples em vogal forma o infinitivo removendo apenas os prefixos verbais, mas os que são paroxítonos ou oxítonos terminados em consoante ganham um -a.

A ordem normal dos elementos sintáticos é SOV (sujeito-objeto-verbo), mas é flexível. O objeto direto normalmente fica incorporado entre o prefixo verbal e a raiz: a-nambi-kutuk (eu-orelha-furo = eu furo as orelhas), do verbo kutuk (“furar”, donde nosso verbo “cutucar”); nda-nambi-kutuki (eu não furo as orelhas). Mesmo um objeto direto já modificado por um prefixo pessoal possessivo (igual ao verbal?) pode ficar dentro do verbo opcionalmente: aĭpokutuk ou aĭkutuk ipó “eu furo a mão dela/dele” (po = mão; ipó = mão dela). Note que mesmo com o objeto separado, o verbo ganha um prefixo de concordância com a 3a. pessoa (-i-).

O indicativo simples do verbo tupinambá serve de passado, e o algumas partículas extras esclarecem de qual tempo ou aspecto se trata. No caso do exemplo acima, o verbo sem partículas geralmente se refere a uma ação no passado, e o presente é especificado com a partícula -ã ou -biã.

O futuro se obtém pospondo-se -ne no afirmativo e -xoe ou -xone no negativo. Há um subjuntivo formado pelo prefixo t- ou, se o verbo começa com consoante, com ta-, e negado não com -i mas com -umé. O imperativo é eĭuká (afirm.), eĭuká-umé (neg.) para a 2a. pessoa singular e peĭuká, peĭuká-umé para a 2a. pessoa plural.

O causativo dos verbos é feito com mo- prefixado à raiz: aĭebýr (eu volto) > aĭmoĭebyr (eu o faço voltar). Note que a- indica sujeito 1a. p.s. e -ĭ- indica objeto de 3a. pessoa s. ou pl. Existe ainda um causativo verbal com ro-: este indica que a ação será feita com o sujeito, o chamado “causativo-comitativo”: aĭroĭebyr (eu o faço voltar comigo). Uma outra construção curiosíssima é o causativo indireto, feito com o causativo normal mais o sufixo -ukar após a raiz verbal: aĭmondó (eu o faço sair) > aĭmondó-ukar (eu o faço fazê-lo sair). Essa pessoa que se faz fazer algo pode vir expressa, no caso leva a posposição supé: aĭmondóukar Pedro supé (eu faço Pedro fazê-lo sair).

O verbo pode se tornar reflexivo com o afixo -ĭe-, para todas as pessoas e números, posto entre o prefixo de sujeito e a raiz: aĭeĭuká, ereĭeĭuká (eu me mato, tu te matas).

Existe um indicativo circunstancial, que substitui a forma básica do verbo quando a expressão verbal é precedida por uma frase adverbial, exceto para a 2a. pessoa: asyk ko’yr (chego agora), mas ko’yr xe syki (agora chego). A sua formação é simples: pega-se o tema do verbo e acrescenta-se -i se terminar em consoante ou -w se terminar em vogal. O sujeito fica expresso pelo pronome independente série II.

Expressões com verbo modal mais verbo principal como “eu quero dormir” fazem-se aĭpotar xe kera; “eu quero o meu dormir” ou “eu quero que você durma” fica aĭpotar nde kera “eu quero o teu dormir”. Ou seja, substantiva-se o verbo principal, que vira objeto direto do verbo modal. Todos os verbos podem ser substantivados, basta pegar a forma raiz e, se esta terminar em consoante, acrescentar -a átono: aker = eu durmo; kera = o dormir.

Quando o sujeito dos dois verbos é o mesmo, pode ocorrer a incoroporação do tema verbal principal no verbo auxiliar: akepotar (ker + potar) = eu quero dormir; anhe’ẽnguab (nhe’eng + kuab) = eu sei falar; eresepĭapotar nde sy (ere + s + epĭak + potar) você quer ver sua mãe.

Há uma partícula interrogativa que geralmente segue o verbo, sufixada, -pe, ou -ype depois de tema em consoante. Essa partícula não altera o acento tônico da palavra.

Os adjetivos tupinambás vêm depois dos substantivos, mas se juntam a eles formando uma palavra só. Se terminam em consiante, ganham –a: ’y (rio) porang (belo), ‘yporanga = “rio belo”. Mas, como em coreano ou japonês, os adjetivos são ao mesmo tempo verbos que incluem a noção de “ser”. Por exemplo, “katu” (bom): okakatu (casa boa), mas oka katu (a casa é boa); ‘y porang (o rio é belo).

A negação desses adjetivos verbais se dá similarmente à dos verbos normais: xe katu (eu sou bom) > nda xe katui (eu não sou bom). Com substantivos, junta-se o sujeito e o predicado, muitas vezes este antes daquele: abaré ixé (eu sou padre). A negativa da frase “ser” com substantivos é feita com a partícula “ruã”: abaré ruã ixé (eu não sou padre).

O tupinambá tem posposições em vez de preposições, ou seja, preposições que seguem as palavras que modificam. As principais posposições são:

-ramo: como, por

-pe: em, a, em busca de

-bo: em, por, através de

supé: a, por, para

suí: de, além de, dentre

sosé: sobre, acima de

tobaké, sobaké: diante de

ĭanondé: antes de, antes que

supí: por, através, conforme

koty: para (lugar), ao lado de

posé, mosé: com

pupé: com (instrumento)

pabê: com (companhia)

As três primeiras estão com hífen porque vêm sufixadas às palavras que modificam. Com a preposição locativa -pe, os nomes que terminam em -ba perdem essa sílaba: taba (aldeia) > tape (na aldeia). Os demais que terminam em -a têm essa -a transformado em -y (ou às vezes em -u ou -e): oka (casa) > ókype (na casa). E se o nome têm uma nasal na última sílaba, essa posposição muda para -me: ‘anga (alma) > ‘ángeme (na alma).

O tupi antigo sobrevive hoje apenas no nheengatu, língua geral da Amazônia desenvolvida no Pará e Maranhão no século 17 e ainda falada pelos cursos dos rios Solimões, Negro e outros.

Abaixo, reproduzo o início do texto original da gramática de tupi escrita por José de Anchieta por volta de 1595.

ARTE DE GRAMMATICA DA LINGVA MAIS VSADA NA COSTA DO BRASIL

Feita pelo P. Ioseph de Anchieta Theologo et Prouincial que foy da Companhia de IESV, nas partes do Brasil.

Das Letras Cap. I.

Nesta lingoa do Brasil não ha f. l. s. z. rr. dobrado nem muta com liquida, vt cra, pra, &c. Em lugar do s. in principio, ou medio dictionis serue, ç. com zeura, vt Açô, çatâ.

-Algũas partes da oração se acabão em til, o qual não he, m. nem b. ainda q na pronunciação diffirão um pouco, vt, , Ainupa ^), rua ^).

-Não ha hũa consoante continuada com outra na mesma dição excepto, mb. nd. ng. vt Aimombôr,Aimondô, Aimeêng.

-Acrecentandose algũa particula depois da vltima consoante, em que se acaba o verbo, o qual se fas no futuro, do Indicatiuo, no Optatiuo, nos Pręteritos impęrfeitos do Côiunctiuo; ha algũa differença na pronunciação, & o vso de diuersas partes do Brasil sera o milhor mestre. Porque des dos Pitiguáres do Paraîba atê os Tamôyos do Rio de Ianeiro pronuncião inteiros os verbos acadabos [sic] em consoante, vtApâb, Acêm, Apên, Aîur.

E assi additas as particulas dos tempos sobre ditos interpoem i. aspero, vt in futuro “ne Apâbine,Acêmine, Apênine, Aiûrine.

E ainda que pareção pronunciar Apábne, &c. he pella delicadeza com que tocão o i.& ainda no mesmo presente o exprimem as vezes vt Apábi. O mesmo he de, temo, meímo mo, meémo que se acrecẽtão aos outros, optatiuo, &c. vt Apâbitemomã, Apâbimo, &c.

E tambem com a interrogatiua, Pè, vt Ereiuripê?

-Os Tupis de sam Vicente, que são alem dos Tamoyos do Rio de Ianeiro, nunqua pronuncião a vltima consoante no verbo affirmativo, vt pro Apâb, dizem Apâ, pro Acêm dizem Acê, & Apên, Acê^), Ap^)e, pronunciando o til somente, pro Aiúr, Aiú.

Outros Ramos

As demais línguas tupi se localizam inteiramente dentro do Brasil, todas ao sul do Amazonas e ao norte do paralelo 14. Quatro dessas línguas estão no estado de Rondônia: arikém, mondé, ramaráma e tuparí. O ramo mundurukú, que anteriormente se extendia desde a bacia do Xingu até a do Madeira, hoje se restringe a alguns afluentes do Tapajós e do Madeira. O ramo jurúna, antes presente no baixo e médio Xingu e seu afluente Iriri, está hoje limitado a apenas uma língua, o jurúna, no alto Xingu. Duas outras línguas jurúna eram o manitsawá e o xipáya, extintas no começo do século 20. Além destes ramos, existem outros que contém apenas uma língua. São o awetí, no alto Xingu, o mawé ou sateré, no baixo Tapajós, e o poruborá, em Rondônia, que talvez já se encontre extinto.

(entre parênteses abaixo do nome da língua está o ramo a que ela pertence, caso haja dúvida)

espaços em branco: não disponível nas fontes consultadas

O gavião é a terceira língua mondé mais falada, com 220 falantes. A primeira é o cinta-larga (950) e depois vem o suruí (340). As demais línguas do ramo são o mondé, o aruá (número de falantes dessas duas é desconhecido, provavelmente menos de 30), o mekém (40), o zoró (175). No ramo mundurukú, temos o mundurukú (1460 falantes) e também o karuáya, com 50 falantes.

O ramo ramaráma conta com o com o arara e o itogapúk, cada uma com 90 falantes. No ramo tuparí, temos o tuparí (56), o makuráp (215) e o wayoró (?).

O mawé conta com 3.000 falantes, o awetí com 35 e o puruborá tem um número desconhecido de falantes. O karitiána, do ramo arikém, tem 110 falantes, e a outra língua desse ramo talvez já esteja extinta.

A família tupi talvez tenha alguma afinidade com as famílias caribe e arauaque, não se sabe se fruto de origem comum ou contato histórico.

Família Arauaque

Grafado também arawak. Tem cerca de sessenta Línguas no Brasil, Colômbia, Guianas, Peru e Bolívia e ainda espalhadas em outros países. Encontram-se geralmente intercaladas com as línguas da família caribe, na região guianesa. A relação precisa entre as línguas dessa família ainda é pouco conhecida.

No Brasil, A mais falada é o terena, com 15.000 falantes, 20% dos quais alfabetizados em terena. Está entre as três línguas americnas mais faladas no Brasil. O terena é uma língua VOS.

Outras são o wapixana (5.100), o baníwa do içana (4.600), o apurinã (3.000), o palesí (600) e o palikúr (540).

Quatro palavras dessa lista têm significados peculiares: kyba em wapixaba é “pedra de amolar”; weni em apurinã é “rio”; kapi em yawalapití é “unha” e kamo em terena é “cavalo”.

Em palikúr, a conjugação verbal é aspectual e há cinco aspectos.

Ticuna

Língua isolada falada por 12 mil pessoas no Amazonas ocidental.

Família Caribe

Ou karib. Norte do Brasil, Guiana, Suriname e Venezuela. Anteriormente também falada no Caribe, a que deu o nome, pois no início do séc. 16, quando os espanhóis chegaram ao norte na América do Sul e Antilhas, a tribo que mais encontraram eram os karib. Nas Antilhas, a exploração da agricultura colonial foi tamanha que qualquer vestígio de comunidade ou de língua americana desaparecera já no século 19. Os falantes de línguas caribes hoje estão no continente sul-americano, exceto pela língua garifuna da América Central. Quando os europeus aportaram no litoral norte da América do Sul, havia também os povos aruaque, que haviam acabado de chegar à região (ver Família Aruaque). A língua caribe mais falada é o garifuna, de Honduras, Belize e Guatemala, com mais de 150 mil falantes.

No Brasil, as línguas caribe são faladas no Amapá, ao norte do Rio Amazonas e ao longo do Xingu. O quadro abaixo compara as línguas caribe brasileiras ao norte do Rio Amazonas:

O hixkaryana é talvez a única língua do mundo que tem a ordem OSV, ou seja, objeto-sujeito-verbo: toto yahosiye kamara {homem pegou onça} = “a onça pegou o homem”. Mas alguns lingüistas disputam essa afirmação, dizendo que não há línguas OSV, e que na verdade essa ordem resulta de uma transformação a partir de uma ordem SOV ou SVO.

Família Arauá

Línguas no Brasil e em outros países. No Brasil, a família é representada pelas línguas banawa, deni, jarawara, kanamanti, kulina, paumarí, iamanadi e zarauhá, bastante próximas entre si e localizadas no sudoeste do Amazonas e no Acre, além de na margem sul do Amazonas, próximo aos rios Tefé e Juruá. A mais falada é o kulina, com 2.500 falantes.

Família Katukina

Três línguas: katukina (extinta, ou talvez com dois ou três falantes vivos), o katawixi, com menos de 15 falantes e o kanamarí, com 650 falantes. Faladas no Amazonas ocidental.

Família Pano

No extremo oeste do estado do Amazonas e no Acre, além de no Peru e norte da Bolívia.

Família Chapakura-Wanham

Falada no Brasil (Rondônia) e na Bolívia. A mais falada é o pakaás novos, com 1850 falantes.

Família Chibchano

Línguas da Colômbia, Panamá, Costa Rica e Honduras.

Família Ianomâmi

Quatro línguas em Roraima, Amazonas e na Venezuela, faladas por cerca de 20 mil pessoas. No Brasil, a língua principal é o yanomámi (SOV), com 9 mil falantes, seguida do ianomám ou yanomamö, com 1.500 (14 mil na Venezuela). As duas outras duas são faladas no Brasil apenas e não têm 500 falantes cada. As línguas ianomâmi são muito próximas umas das outras, geralmente mutuamente inteligíveis. Os ianomámis em geral são monolíngües e constituem um dos povos nativos menos contaminados pelas culturas dos países onde se encontram.

Família Tucano

Brasil, Colômbia, Peru e Equador. A mais importante se chama tucano mesmo e tem 2.500 falantes no Brasil.

Família Oto-Mangueana

O misteca ou mixteco e inúmeras outras do México.

Família Maia

Mais de cinquenta línguas faladas no México e Guatemala por cerca de 2 milhões de pessoas. A mais importante é o maia moderno, hoje com 270 mil falantes, descendente do maia clássico, que no Império Maia (desaparecido ainda na Idada Média) era escrito com um sistema hieroglífico apenas recentemente decifrado, talvez o único sistema de escrita da América pré-colombiana. “Talvez” porque em 2002 alguns arqueólogos disseram ter descoberto hieróglifos olmecas, datando de 2000 anos atrás.

Uma língua proximamente aparentada ao maia moderno é o tzotzil, falado na região de Chiapas (estado do sul do México) e Guatemala. O tzotzil moderno é, como o nahuatl, o quéchua, o guarani e tantas línguas da América, uma língua de morfologia aglutinativa com características fusionais. A posse de 1a. e 2a. pessoas é expressa por prefixos:

na = casa

jna = minha casa

ana = tua casa

sna = sua casa

E quando um possuidor específico é citado, como em “a casa de João”, usa-se a construção “a casa dele de João” (sna li Xun). Para exprimir o que nós exprimimos com o verbo “ter”, usa-se a mesma construção mais a partícula de existência “e”: “sna li Xun-e” (lit. “casa-dele de João é” = “João tem uma casa”). A derivação morfológica é feita às vezes com prefixos: ‘abtel (trabalho) > j’abtel (trabalhador).

Família Uto-Asteca

Falada na Califórnia, Novo México, Idaho e no México e América central.

Ramo Meridional

Se localiza no México central e em El Salvador. Seu principal sub-ramo é o asteca.

Sub-Ramo Asteca

A língua mais importante desse ramo, de fato da família uto-asteca inteira, é o nahuatl, nahua ou asteca, falado no centro-sul do México por mais de 1,5 milhão de pessoas. É a língua americana mais falada no México, dividida em alguns dialetos. A única outra língua desse ramo é o pipil, bastante parecido com o nahuatl moderno, falado em El Salvador. No total, 5,2 dos 100 milhões de mexicanos falam uma língua americana.

O nahuatl clássico, falado no Império Asteca e em boa parte do México antigo como língua franca, está extinto. O nahuatl moderno não difere tanto assim do clássico e é dividido em uns trinta dialetos. O dialeto descrito aqui é o da região de Veracruz, cerca de 75% similar lexicamente ao nahuatl clássico.

O nahuatl hoje se escreve com o alfabeto latino, derivado da variante castelhana. O “j” se pronuncia como o “h” inglês e quase some em final se sílaba. O “x” soa como o nosso [š] e o “ch” soa como o [č]. O dígrafo “hu” representa a semivogal [w]. A vogal sublinhada na ortografia da fonte que utilizei representa vogal longa, mas aqui aparecerá com circunflexo. A parada glotal (“saltillo” em castelhano) é indicada com apóstrofe. O “c” soa como [k] e os sons [ke] e [ki] são escritos “que” e “qui”. O acento do nahuatl é dinâmico e a acentuação gráfica é igual à do castelhano.

O nahuatl moderno é uma língua SVO (sujeito-verbo-objeto) e não possui gênero gramatical. O plural se forma com -mej. Quando o substantivo termina com parada glotal (‘) ou -‘ti, esses ‘ ou -‘ti caem no plural.

cajli > cajlimej (casa > casas)

ajahuil > ajahuilmej (brinquedo > brinquedos)

a’ti > amej (água, arroios > arroios)

ama’ > ama’ (papel > papéis)

xochi’ > xochi’ (flor > flores)

Em três substantivos, o plural se faz mudando a consoante final para -t e acrescentando então -quej.

huehuej > huehuetquej (velho > velhos)

ilamah > ilamatquej (velha > velhas)

sihua’ > sihuatquej (mulher > mulheres)

Há ainda um tipo de formação de plural por reduplicação prefixal da primeira sílaba da palavra, seguida de -j.

tâga’ > tajtâga’ (homem > homens)

noyîx > nojnoyîx (meu olho > meus olhos)

O plural de conê’ (criança) é côconê’.

O plural dos adjetivos se dá de maneira similar a esta reduplicação, com repetição da primeira sílaba seguida de -j-.

Os verbos em nahuatl têm o curioso sistema prefixal-sufixal, em que o prefixo indica a a pessoa do sujeito e o sufixo o número do sujeito. Existem cinco conjugações verbais em nahuatl moderno. Como em tantas línguas americanas, existem duas primeiras pessoas plurais: uma exclusiva (nós e não você) e outra inclusiva (nós todos). Veja a seguir a conjugação do verbo “sair”, que em nahuatl tem o radical “quis” [kis] e que pertence à primeira conjugação:

A vogal temática -a- indica o presente. Para formar outros tempos da primeira conjugação, têm-se as vogais temáticas seguintes:

O pretérito transitório é uma curiosidade da língua nahuatl, ele indica uma ação completada mas cujo resultado não permanece até o presente. Portanto “niquisaca” significaria “eu saí (mas já voltei)”.

O que caracteriza a 1a. conjugação é o -a do presente do indicativo e o -as do futuro do indicativo.

A segunda conjugação é caracterizada pela vogal temática -i no presente do indicativo e por -is no futuro, de resto bastando trocar o -a- da 1a. por -i-. É muito similar à primeira e juntas elas formam o Grupo A de conjugação verbal. Exemplo: nesi = aparece; nesis = aparecerá.

O grupo B de conjugações inclui a 3a. a 4a. e a 5a. conjugações. Em comum, todas elas terminam no perfeito com -j, no futuro com -j (opcionalmente o menos freqüente -s) e têm vogal temática longa no futuro.

3a. conjugação (iá/îj): mosehuiá (descansa); mosehuîj (descansará)

4a. conjugação (ohua/ôj): tajtohua (fala); tajtôj (falará)

5a. conjugação (a/âj): tacua (come); tacuâj (comerá)

Existem, ao contrário do que se dá em muitas língua aglutinativas, vários verbos irregulares.

Os pronomes pessoais são:

Não existem pronomes de tratamento em nahuatl. Portanto “tej” significa tanto “tu” quanto “você” ou “o senhor”.

Os pronomes afixados de sujeito vem antes dos de objeto em um verbo. O de 3a. pessoa objeto vira c- depois de prefixo de sujeito: ticmati (tu o sabes) < ti (prefixo 2a. p.sg. sujeito) + -c- (afixo 3a. pessoa objeto) + -mati (raiz do verbo “saber”).

A voz reflexiva é feita com o infixo -mo-, para todas as pessoas e números, e é encaixado entre a raiz verbal e o prefixo de sujeito. O modo imperativo-subjuntivo é feito com o prefixo ita- logo antes da raiz, mas essa regra varia em certas conjugações e outras circunstâncias. Outro modo é o desiderativo (-nequi-). Existem ainda uma série de formas indicando aspecto verbal, geralmente formadas por uma raiz de um verbo modal (ir, estar) que vem numa forma especial afixada ao verbo principal.

A forma aplicativa dos verbos se forma com o afixo -li-, que faz com que o verbo expresse ação feita em benefício de alguém. Os verbos das línguas bantas têm algo similar, essa forma benefactiva existe de resto em várias línguas aglutinantes. A forma causativa, também comum na morfologia de outras línguas aglutinativas como as bantas e túrquicas, se forma com -tiá e transforma um verbo normal como “comer” em “fazer comer”.

Observe que com os afixos possessivos o -mej indica plural do possuidor, não do possuído. O possuído permanece morfologicamente no singular quando modificado por afixos de posse. Existem maneiras outras de indicar plural do possuído. Um fato curioso do nahuatl moderno é que certos substantivos de parentesco não existem sem um afixo possessivo, e quando não há nenhum possuidor a ser expresso usa-se o prefixo tê-: têtaj (pai), têyê’ (mãe), têpiltzîn (filho), têcôco (irmão mais velho). Inúmeros outros substantivos perdem sílabas finais ou sofrem outras alterações no final quando recebem afixos possessivos. A palavra “cajli”, por exemplo, de reduz a “cal” (mocal = tua casa). O diminutivo se forma com -tzîn.

O verbo “ser” é indicado pelo prefixo sujeito + a coisa que se é (substantivo ou adjetivo): tagâ’ = homem; nitagâ’ = eu sou um homem. Os tempos levam as terminações de tempo dadas na seção de verbos: nitagâ’ya (eu era um homem).

O nahuatl moderno usa geralmente os numerais do castelhano, mas existe um conjunto original de um a quatro ainda encontrado em certas expressões: , ôme, êyi, nâhui.

Existem uma série de sufixos para derivar adjetivos, verbos e substantivos a partir das palavras: naca’ (carne); nonacayo (meu corpo); nacayoj (corpulento, forte); nacayohui (engorda – intransitivo); quinacayôtiá (engorda – transitivo). O sufiuxo -tajtransforma uma raiz num verbo de estado: tiahua’ (chuva); tiahuataj (está chuvoso).

Em nahuatl há posposições sufixadas, além de – em casos especiais – preposições. Em alguns casos, preposições independentes se desenvolveram. A posposição locativa -pan, por exemplo, pode também vir com o prefixo de 3a. pessoa i- e ser posta então antes do substantivo modificado: ipan ojti (no caminho) ou ojtipan (no caminho). Pode ainda ser usada puramente como preposição se estiver modificando um pronome pessoal: pan nêj, pan têj, pan yêh, etc.

Outras posposições são -huan (com), -co (dentro de), -yacapan (sobre), -tzâlân (entre), -tajco (no meio de), -ijti’ (dentro de), -tampa (sob), -nacastan (ao lado de), -tepotztaj (atrás de), -îxtaj (em frente de).

É curioso notar a similaridade de -pan e -huan com seus quase-sinônimos em quéchua (língua da família quéchua) -pi e -wan. Em tupi e em guarani também há uma posposição sufixal -pe. Mas, ao contrário do quéchua, não há sufixo marcador de objeto direto em nahuatl.

Ramo Setentrional

O hopi, a língua mais famosa deste ramo, é falado no sudoeste dos EUA, principalmente no Arizona por 5.250 pessoas, e teve um papel importante na lingüística. Foi estudando esta língua que o lingüista Benjamin Whorf chegou à hipótese de que o mundo mental de uma pessoa é limitado pela estrutura da língua que ele fala. Essa hipótese, conhecida como Hipótese Sapir-Whorf ou da Relatividade Lingüística, é hoje rejeitada pela maior parte dos lingüistas.

Outras línguas desse ramo são o comanche, o panamint, o shoshoni, o kawaiisu, o paiute e o serrano.

Família Sioux

Várias línguas desde o Mississípi até a Guatemala, entre elas o o dakota (ou sioux) e o omaha-ponca. O dakota é a mais falada, com 15 mil falantes nos Estados Unidos (Nebraska, Dakota Sul e Norte, Montana) e uns 5 mil no Canadá.

Em omaha ponca, língua falada por 80 pessoas no vale do Mississipi, há a distinção entre primeira pessoa plural inclusiva e exclusiva. O omaha-ponca tem os seguintes fonemas:

Família Panuto

Várias da Califórnia e do Oregon.

Família Algonquiana-Wakash

Também chamada de família álgica. São setenta línguas conhecidas na América do norte.

O ramo central desta família inclui o algonquino (Quebec, Ontário), o cree, o ojibwa, o miami, o potawatomi, o mesquakee, o kickapoo e outras.

O ramo oriental inclui o abnaki, o unami, o micmac e outras.

O ramo das planícies tem as famosas línguas blackfoot e cheyenne.

Família Iroquesa

Mohawk, cheroqui, cayuga, seneca, onondega, wyandot-huron, tuscarora e oneida.

Os cheroquis, hoje confinados a reservas e com uma população de 40 mil (dos quais não mais de 12 mil falam a língua), estavam originalmente espalhados pelos estados do Alabama, Georgia, Carolina do Norte, Carolina do Sul, Virgínia, Virginia Ocidental, Kentucky e Tennessee. Foram o primeiro povo com que os ingleses entraram em contato na América do Norte. Em 1838, cerca de 20 mil cheroquis foram expulsos das suas terras mais orientais pelos Estados Unidos, no que foi chamado de nu-na-hi du-na tlo-hi-lu-i, ou “trilha onde se chorou”. Quatro mil pessoas morreram. Alguns escaparam de ser expulsos fugindo para as montanhas da Carolina do Norte, onde depois foi criada a reserve Qualla, onde muitos cheroquis ainda vivem.

O cheroqui (ou cherokee em inglês e tsalagi ou yunwiya em cheroqui, ainda chalaque pelos espanhóis) teve um sistema de escrita silábico desenvolvido para si durante o século 19, por um mercador cheroqui chamdo Sequoya (ou George Gist) que via os euro-norte-americanos estranhamente rabiscando símbolos em papel. Desconhecendo o valor e o funcionamento do alfabeto inglês, mas de posse de alguns livros, o cheroqui começou a tentar escrever sua língua. Primeiro, tentou um desenho para cada palavra. Muito complicado. Progressivamente, foi desenvolvendo um sistema silábico, em que letras do alfabeto latino modificadas ou letras inventadas foram arbitrariamente usadas para sílabas da língua cheroqui. Terminado em 1821, o silabário de 85 caracteres criado era completo e eficiente, mesmo que o valor das letras latinas fosse totalmente ignorado pelo seu inventor. A confederação cheroqui, que resistia bravamente à expansão dos Estados Unidos devido a seu tino para o comércio, adotou o silabário como oficial e jornais e livros foram publicados, até que no final do século 19 a nação cheroqui foi conquistada e dizimada pelos Estados Unidos. Hoje ainda há alguns milhares de falantes do cheroqui em Oklahoma. Infelizmente os cheroquis são mais conhecidos por darem nome ao Jeep Cherokee da Chrysler do que pela invenção do único alfabeto americano.

o silabário cheroqui

O cheroqui era originalmente dividido em três dialetos, oriental, central e ocidental. O oriental se extinguiu, o central ainda é falado na reserva de Qualla na Carolina do Norte e o oriental é falado na Nação Cheroqui, no oeste americano, e é o dialeto menos influenciado pelo contato com os europeus.

A seguinte descrição fonética usa a transliteração padrão do silabário cheroqui para o alfabeto latino.

O cheroqui tem seis vogais: a, e, i, o, u e v (esta pronunciada como o nosso “ã”). Os fonemas representados pelas letras portuguesas b f p r t v x z não existem em cheroqui, que em compensação tem um fonema representado pelas letras “ts” que é pronunciado como “dj” mas com a ponta da língua voltada para baixo. Os fonemas transliterados como “tla, tle” etc. são pronunciados com a ponta da língua no palato e trazendo para baixo. O dialeto oriental tinha o som igual ao “r” em “caro”, mas nos dialetos sobreviventes esse som corresponde a “l”.

Família Na-Dené

Inclui línguas como o navaho (Arizona, Novo México, Utah) e o apache (Califórnia), que são razoavelmente parecidas entre si. O navaho (ou navajo) tem hoje 150 mil falantes, dos quais 7.700 se declaram monolíngües. É a língua americana mais falada nos EUA. A etnia navajo tem 220.000 indivíduos. Durante a Segunda Guerra, a inteligência americana usou a língua navajo como código cifrado para comunicações que os alemães e japoneses não pudessem decifrar. Não decifraram. Os navahos se denominam “diné”. O atabasco é falado nos arredores do lago Atabasco.

Família Esquimó-Aleuta

O inuit (língua dos esquimós), o aleuta, o inuktitut groenlandês e o yupik da Sibéria e do Alasca. O inuktitut é a única língua nativa da Groenlândia, falada por 40 mil pessoas, que convivem com alguns milhares de falantes do dinamarquês, já que o país pertence à Dinamarca. O inuktitut também é falado por 7 mil groenlandeses na Dinamarca. Tanto o inuktitut quanto o dinamarquês são oficiais na Groenlândia (Kalaalit Nunaat em inuktitut) e são ensinados nas escolas do país. O inuit em algumas comunidades é escrito com o silabário desenvolvido para a língua cree no início do século 19.