A língua humana (V)

fev 02, 2015 | por Sandra Merlo | Fisiologia, Língua humana

SonrisaEste texto da série analisa diversos formatos que a superfície da língua pode adquirir durante a produção da fala. A fonoaudióloga Maureen Stone e sua equipe já publicaram vários estudos de imagem do trato vocal, principalmente da língua. Neste texto, vou citar um estudo importante na área [1] (artigo disponível na íntegra aqui). Este artigo foi a primeira reconstrução em 3D da superfície da língua para diversas configurações articulatórias.

 

Visualização da língua por ultrassom

Vamos falar especificamente sobre imagens da língua obtidas com ultrassom. Os aparelhos de ultrassom emitem ondas sonoras com frequências muito altas (na escala de MHz), que não são ouvidas pelo sistema auditivo humano [2]. Quando as ondas chegam aos tecidos do corpo humano (pele, músculo, ossos), são refletidas e absorvidas de formas diferentes por esses tecidos, tendo em vista que cada tecido possui sua própria densidade e sua própria impedância para a propagação do som [2]. As imagens são geradas pelas reflexões das ondas e são produzidas em tons de cinza [1, 2]. As imagens são bidimensionais, ou seja, possuem altura e largura. A profundidade pode ser construída pela união de dezenas de imagens bidimensionais por softwares específicos [1]. No caso da língua, as bordas anterior e laterais não são bem captadas devido à presença de ar logo abaixo delas. Isso ocorre porque a impedância acústica do ar e do músculo são muito diferentes. Quando há uma grande diferença de impedância acústica entre duas interfaces, a reflexão sonora é dificultada [2]. O ultrassom possui as grandes vantagens de ser uma técnica não invasiva e também mais segura do que a radiação [2].

Para a captação de imagens da língua, o sujeito precisa estar sentado e com a cabeça imóvel. O transdutor é posicionado no assoalho bucal e se move lentamente do mento em direção ao osso hioide. Veja imagem da aparelhagem aqui.

Nesta página, é possível ter acesso a alguns vídeos da língua produzidos por ultrassom. Após a união das imagens pelo software e a geração do esquema tridimensional, o resultado final é muito mais palatável: veja aqui a modelagem da vogal [i].

O estudo relatado aqui [1] utilizou a produção de fala de um único sujeito: uma mulher de 26 anos, falante nativa do inglês americano. Ela produziu 18 fones de forma contínua (por pelo menos 10 s). A produção contínua era necessária, porque leva tempo para as imagens em sequência serem captadas. A superfície da língua para cada fone foi recomposta com 42 a 55 imagens de plano coronal. De todos os fones produzidos, vamos nos ater aos mais semelhantes ao português brasileiro, que são: as vogais [i, e, ɛ, ͻ, o, u] e as consoantes [s, ʃ, l, n, ŋ].

A superfície da língua foi segmentada em cinco porções: anterior, média, dorsal, posterior e raiz. Veja a Fig. 3 do artigo.

Para a ilustração dos resultados, serão cruzados dados acústicos e articulatórios. Para os dados acústicos, veja os formantes listados na Tabela 1 do artigo. Sem entrar em detalhes quanto à teoria acústica, apenas quero ressaltar o significado do primeiro e do segundo formantes vocálicos (F1 e F2, respectivamente):
– F1 é inversamente proporcional à altura da língua, ou seja, quanto mais baixa a língua, maior o valor de F1.
– F2 é diretamente proporcional ao avanço da língua, ou seja, quanto mais anteriorizada a língua na cavidade oral, mais alto o valor de F2.

Vamos utilizar como parâmetro de comparação a vogal [æ] do inglês americano, a mais próxima do nosso [a] em português:

  • [æ] é uma vogal aberta, ou seja, a língua está baixa (boca mais aberta). Por isso, seu F1 é de 950 Hz.
  • [æ] é uma vogal anteriorizada, ou seja, a língua está mais avançada na cavidade oral. Por isso, seu F2 é de 1850 Hz.

Para uma visão global do posicionamento da língua para todas as vogais, veja aqui o quadrilátero vocálico disponibilizado pela International Phonetic Association. No esquema, estão representadas as 28 vogais das línguas naturais e não apenas as do português.

 

Padrão de elevação anterior (“front raising”)

O padrão de elevação frontal é encontrado em vogais como [i] e [e] e em consoantes como [ʃ] e [n]. Os fones que se valem desta configuração são todos alveolares ou pós-alveolares, portanto.

Para a vogal [i]:

  • O F1 é de 310 Hz, indicando que a língua está bastante elevada na cavidade oral em comparação ao [æ].
  • O F2 do [i] é de 2780 Hz, indicando que a língua está ainda mais avançada na cavidade oral em comparação ao [æ].

O modelamento 3D do [i] pode ser visto aqui. A imagem mostra que as regiões anterior, média e dorsal da língua ficam bastante elevadas (convexas). Observe a margem superior dos planos A e B: a superfície da língua está tão elevada que quase chega ao limite dessas margens. Por outro lado, a região posterior está abaixada (côncava), no limite inferior dos planos A e B.

A vogal [e] apresenta padrão similar, porém menos intenso: a língua não está tão elevada (F1 de 550 Hz) e nem tão avançada (F2 de 2400 Hz). Veja o modelamento 3D do [e] aqui. A imagem mostra as regiões anterior, média e dorsal elevadas, mas menos do que o [i] (observe a margem superior dos planos A e B).

O modelamento 3D do [ʃ] pode ser visto aqui. A imagem mostra elevação das regiões anterior e média, mas não tão elevado quanto na vogal [i] (veja o eixo A). Observe também o maior afinamento das regiões anterior e média provoca maior alargamento das regiões dorsal e posterior no [ʃ] em relação ao [i] (veja o eixo C).

O modelamento 3D do [n] pode ser visto aqui. Também ocorre elevação da região anterior, mas não na mesma intensidade do [i]. Para a articulação do [n], toda a língua está posicionada mais anteriormente na cavidade oral e com grande alargamento de todas as porções.

A combinação de elevações e depressões (convexidades e concavidades) está sempre presente nos movimentos da língua. Isso ocorre porque a língua é um hidróstato muscular, ou seja, um sistema de volume constante. Assim, se uma determinada região está elevada e concentrando volume, outra região estará abaixada e reduzindo volume. Da mesma forma, se uma região está afinada, outra região estará alargada. Para maiores informações, veja o texto anterior desta série.

 

Padrão de concavidade completa (“complete groove”)

O padrão de concavidade completa ocorre para a vogal [ɛ] e para consoantes como o [s]. Os fones que se valem desta configuração são alveolares.

Para a vogal [ɛ]:

  • O F1 é de 750 Hz, ou seja, a língua está bem mais baixa na cavidade oral em comparação ao [i] e ao [e], mas mais alta em comparação ao [æ].
  • O F2 é de 1950 Hz, ou seja, a língua está bem mais recuada do que no [i] e no [e], mas um pouco mais avançada em comparação ao [æ].

(A Tabela 1 do artigo indica que a média do F2 do [ɛ] é 949 Hz, mas isso é impossível. Então certamente o valor adequado é 1949 Hz, tendo havido um erro de digitação).

O modelamento 3D do [ɛ] pode ser visto aqui. O abaixamento da língua pode ser percebido pelos planos A e B. Para o [ɛ], existe um padrão de movimento diferente: a linha média longitudinal da língua está totalmente abaixada (côncava), enquanto as laterais estão elevadas (convexas).

O modelamento 3D do [s] pode ser visto aqui. Pelo eixo A, é possível perceber que a língua não está tão elevada para o [s] quanto está para o [ɛ]. A menor elevação também é acompanhada pelo maior alargamento das laterais (veja o eixo C).

Em relação à musculatura, sabe-se que a contração do genioglosso é necessária para produzir o abaixamento de toda a linha média longitudinal da língua ou em regiões localizadas [1].

 

Padrão de elevação posterior (“back raising”)

Ocorre em vogais como [o], [ͻ] e [u] e em consoantes como [ŋ]. Os fones que se valem desta configuração são velares.

Para a vogal [o]:

  • O F1 é de 590 Hz, ou seja, língua está elevada (similar ao [e]), mas menos do que o [æ].
  • O F2 é de 1240 Hz, ou seja, a língua está recuada na cavidade oral em comparação ao [i] e ao [æ].

O modelamento 3D do [o] pode ser visto aqui. Pela imagem, vemos uma elevação da região dorsal e um abaixamento das regiões anterior e média. Também vemos um alargamento da língua em relação às vogais anteriores.

O modelamento 3D do [ŋ] pode ser visto aqui. Vemos uma grande elevação (eixo A) das regiões média e dorsal. Devido à intensa elevação, ocorre redução da largura da língua (eixo C) em comparação à vogal [o].

 

Padrão de dupla elevação (“two-point displacement”)

Até o momento, este padrão só foi observado na consoante [l].

O modelamento 3D do [l] pode ser visto aqui. Ocorre elevação da região anterior, abaixamento da região média e elevação da região dorsal.

O modelamento 3D de outras vogais e consoantes do inglês americano, podem ser vistos nesta página.

 

O estudo de Maureen Stone mostrou que a língua usa um repertório pequeno de configurações para produzir uma gama variada de fones. Esse pequeno repertório é complementado por mudanças na altura e no avanço da língua dentro da cavidade oral.

Além dos conhecimentos já disponíveis sobre os movimentos da língua durante a articulação da fala, Maureen Stone e sua equipe estão desenvolvendo um atlas dos movimentos de língua em sujeitos com e sem distúrbios da comunicação.

 

Referências

[1] Stone, M. & Lundberg, A. (1996). Three-dimensional tongue surface shapes of English consonants and vowels. Journal of the Acoustical Society of America, 99 (6), 3728-3737.

[2] Okuno, E.; Caldas, I. & Chow, C. (1982). O ultra-som aplicado à medicina. In: Física para ciências biológicas e biomédicas (pp. 238-250). São Paulo: Harper & Row do Brasil.