Gagueira e voz

ago 20, 2019 | por Sandra Merlo | Gagueira, Musculatura de fala

A fala humana impõe um uso limitado da laringe. Isso pode estar na origem dos distúrbios funcionais da voz, inclusive daqueles vistos na gagueira.

É sabido que a gagueira também envolve alterações vocais (veja aqui e aqui, por exemplo). Essas alterações não são as chamadas “alterações orgânicas”, nas quais se identifica uma lesão estrutural na laringe. São as “alterações funcionais”, nas quais há limitação de desempenho vocal, mas sem lesão laríngea aparente. O cientista da voz Ingo Titze, em um artigo publicado em 2017, propõe que as alterações funcionais da laringe podem ser decorrentes do uso limitado da laringe imposto pela fala humana. Esta é uma hipótese que pode ser muito importante na fonoterapia da gagueira.

 

Uso restrito da laringe imposto pela fala humana

O autor inicialmente faz uma comparação da comunicação no reino animal com a comunicação humana, no intuito de mostrar como o surgimento da fala limitou o uso da laringe. Ele explicitamente admite que sua intenção é desenvolver um raciocínio e que, para isso, reúne dados científicos de forma inédita.

Mamíferos, aves, anfíbios e répteis se comunicam através de sons, os quais são produzidos na via aérea através do acionamento da laringe ou da siringe. A fonte sonora, portanto, é sempre uma laringe ou uma siringe. Os sons produzidos por esses animais nem sempre estão na escala percebida pelo ouvido humano: alguns estão, mas outros não (no caso destes últimos, são infra ou ultrassons). A vibração do ar que gera o som decorre da interação entre a corrente de ar que flui na via aérea e um segmento colapsável (ou seja, de tecido mole) que se encontra em alguma região da parede da via aérea. O tecido mole vibrante perturba a corrente de ar, tendo a capacidade de gerar uma frequência fundamental e um espectro de frequências acima da fundamental. As ondas sonoras se propagam ao longo da via aérea, sendo que uma pequena fração dessas ondas se irradia pelas narinas, boca ou bico. Uma fração maior dessas ondas permanece na via aérea, gerando múltiplas reflexões, as quais produzem ondas estacionárias. Modulações de frequência e amplitude permitem diferentes padrões melódicos pela fonte sonora.

Um tom único, com frequência e intensidade constantes, revela a presença de um animal (pela própria existência do som), sua localização (se perto ou longe) e provavelmente seu tamanho (se mais grave, um animal maior; se mais agudo, um animal menor). Modulações de frequência, amplitude e duração são necessárias para criar um inventário de tons para a comunicação animal. Tendo em vista que a comunicação animal pode envolver grandes distâncias, as modulações do tom ocorrem de maneira contínua, ou seja, sem interrupção da produção sonora. Desta forma, tons contínuos, com modulações de frequência, intensidade e duração, são utilizados pelos animais que vocalizam.

Há cerca de 100.000 anos, a espécie humana aprendeu que a comunicação não precisava se restringir à fonte sonora e suas modulações de frequência, amplitude e duração: o inventário poderia ser expandido através do uso de estruturas localizadas acima da fonte (ou seja, língua, lábios e palato mole). Foi o surgimento da fala. A movimentação da língua, dos lábios e do palato mole permitiu filtrar os diversos tons produzidos pela fonte. Esta dupla modulação do som (pela fonte e pelo filtro) deu origem às vogais e às consoantes. Segundo o autor, a produção gerada pelo filtro se tornou inclusive mais importante do que a produção gerada pela fonte. Ele cita o caso da fala sussurrada (que é produzida apenas pelo filtro, sem participação da fonte) e que permite comunicação efetiva a curta distância.

O argumento do autor une exatamente as características da laringe de mamíferos e o uso restrito que a fala humana impõe à laringe como origem das alterações funcionais da voz, dentre elas as alterações laríngeas vistas na gagueira. Segundo o autor, a laringe de mamíferos é própria para comunicação de longas distâncias. Mas a nossa fala perverteu o uso desta estrutura, tendo em vista que a fala é própria para comunicação a curtas distâncias. Um dos fatos que indicam que nossa fala é para curtas distâncias é justamente a perda da importância da fonte em relação ao filtro (como exemplificado acima, com a fala sussurrada). Outro fato é a presença de consoantes não-vozeadas, que interrompem a produção do tom (da voz), algo que não existe na comunicação animal. O autor aposta, portanto, que o uso restrito da fonte pela espécie humana predispõe a alterações funcionais da voz. Formas de usar mais ativamente a fonte envolveriam o grito (com sua forte modulação de intensidade) e o canto (com suas grandes modulações de frequência e duração).

 

Requisitos acústicos para a fala

O som ideal para a articulação da fala possui frequência fundamental baixa. A inteligibilidade fônica aumenta quando os diversos harmônicos estão mais próximos, porque as frequências de ressonância específicas de cada fone podem ser estimadas com um maior número de harmônicos. Com maior informação sonora, mais facilmente se decodifica a que fone específico corresponde àquela produção. Por exemplo, as vogais são identificadas apenas pelas duas primeiras frequências de ressonância do trato supraglótico, as quais se situam em torno de 500 Hz para o primeiro formante e em torno de 1500 Hz para o segundo formante. Uma frequência fundamental que não está bem abaixo de 500 Hz teria poucos harmônicos em torno de 500 Hz e de 1500 Hz para gerar as frequências de ressonâncias supraglóticas. Por isso é mais difícil compreender a voz infantil quando esta é muito aguda ou a voz feminina durante o canto, por exemplo. Devido à inteligibilidade, a necessidade de manter a frequência fundamental da voz em um tom baixo é imperativa.

Além disso, frequências fundamentais baixas impedem o acoplamento sonoro entre a fonte e o filtro, tendo em vista que o filtro tende a amplificar harmônicos mais altos do que o fundamental. Desta forma, a fonte e o filtro tendem a operar em regiões espectrais diferentes, reduzindo as sobreposições entre as modulações da fonte e do filtro.

 

Morfologia das pregas vocais

As pregas vocais de mamíferos são constituídas por múltiplas camadas de tecido: um epitélio envolve uma estrutura de tecido mole (a lâmina própria), o qual possui ainda outras três camadas (superficial, intermediária e profunda). A lâmina própria consiste em uma matriz de colágeno e elastina, com fluidos intersticiais (glicoproteínas e proteoglicanos). Em posição lateral à camada profunda da lâmina própria, está o músculo tireoaritenoideo.

A arquitetura histológica das pregas vocais é altamente funcional. A camada superficial é flexível, absorvendo a energia proveniente da vibração do ar e possibilitando, assim, a aproximação e o afastamento das pregas vocais em cada ciclo vibratório. Ou seja, deformações na camada superficial são necessárias para as oscilações do ciclo vibratório.

Por outro lado, as camadas intermediária e profunda da lâmina própria formam um ligamento, com grande quantidade de fibras de colágeno e elastina. Entretanto, este ligamento é organicamente produzido pelo próprio ato de falar. Assim, crianças que jamais produziram voz (devido à paralisia cerebral) ou adultos que deixaram de produzir voz há anos (devido a acidente vascular encefálico) não apresentam o ligamento vocal. Portanto, o estresse tecidual da vocalização é necessário para produzir e manter o ligamento.

O ligamento e o músculo tireoaritenoideo podem ser tensionados em diferentes graus (a fim de produzir uma gama maior de frequências fundamentais), enquanto a camada superficial se mantém flexível para absorver a energia vibratória e sustentar a oscilação. Desta forma, a vantagem de pregas vocais com múltiplas camadas de tecido está em poder combinar tensão interna e flexibilidade externa em uma mesma estrutura. A existência de pregas vocais com três camadas permite à espécie humana vocalizar a longas distâncias, falar alto, gritar, imitar vozes e cantar. Entretanto, a cultura contemporânea tende a suprimir manifestações vocais mais intensas (como o grito) ou mesmo suprimir manifestações vocais para além da fala (como o canto), fazendo com que a estrutura tecidual multicamada adquirida ao longo da evolução seja subutilizada.

 

Movimentos da laringe

Os músculos geralmente atuam em pares: enquanto um músculo aproxima, o outro afasta; enquanto um músculo alonga, o outro encurta. Para que o controle motor e a força sejam ideais, os dois músculos do par precisam trabalhar próximos a sua máxima capacidade de alongamento e encurtamento. Entretanto, na fala, existe a tendência de permanentemente encurtar as pregas vocais para manter a frequência fundamental baixa. As cartilagens aritenoideas tem um papel importante no encurtamento das pregas vocais, tendo em vista que sua ação encurta as pregas vocais de 10 a 30% em relação a seu comprimento de repouso. Embora as pregas vocais também possam ser alongadas em cerca de 30% em relação ao repouso, a fim de tensionar o tecido, isso raramente ocorre na fala.

Os músculos tireoaritenoideo e cricotireoideo formam um par funcional, sendo que o encurtamento do cricotireoideo é capaz de alongar o tireoaritenoideo. As frequências fundamentais típicas da voz masculina adulta (entre 100 e 130 Hz) ativam apenas minimamente os músculos tireoaritenoideo e cricotireoideo. Além disso, nesta faixa, a frequência fundamental é tipicamente controlada pelo tireoaritenoideo, o qual se encurta. Contrações mais vigorosas dos dois músculos iniciam somente a partir de 200 Hz e são máximas em 400 Hz. Somente contrações mais vigorosas do cricotireoideo seriam capazes de alongar o tireoaritenoideo, mas, tendo em vista que essas faixas mais altas de frequência não ocorrem durante a fala, o tireoaritenoideo tende a permanecer encurtado.

A adução forçada das pregas vocais também envolve desequilíbrio entre músculos agonistas e antagonistas (no caso, cricoaritenoideo lateral e tireoaritenoideo para adução e cricoaritenoideo posterior para abdução). A adução forçada ocorre quando o cricoaritenoideo posterior permanece pouco ativo no início da fonação. Em frequências fundamentais mais altas, devido à necessidade de alongamento das pregas vocais, a ativação do cricoaritenoideo posterior é favorecida, porque ele auxilia a estabilizar a posição das cartilagens aritenoideas.

Assim, Ingo Titze propõe que os músculos cricotireoideo e cricoaritenoideo posterior sejam intensamente ativados para que eles possam efetivamente atuarem como antagonistas dos músculos tireoaritenoideo e cricoaritenoideo lateral. A forma de ativar intensamente o cricotireoideo e o cricoaritenoideo posterior envolve a produção de frequências fundamentais em toda a extensão fisiológica da laringe humana.

 

Fonoterapia e treino vocal

Nas alterações funcionais da voz, o sistema motor produz movimentos anormais de pregas vocais. Até o momento, não há relação direta entre essas anormalidades de movimentos com contraturas musculares laríngeas, mas muitas técnicas terapêuticas para as alterações funcionais da voz se baseiam no alongamento das pregas vocais com estacatos ou glissandos, na redução da adução forçada das pregas vocais e no alongamento muscular através da massagem laríngea. A contratura muscular em membros superiores e inferiores, por exemplo, é resultado do desequilíbrio entre músculos agonistas e antagonistas (por paralisia, por exemplo) ou resultado do alongamento ou encurtamento excessivo por longos períodos. Clinicamente, tem-se a impressão de que o movimento de pregas vocais em distúrbios funcionais é restrito ou paradoxal. Massagem laríngea, exercícios de trato vocal semiocluído, fala salmodiada e canto são vistos como atividades que destravam essa musculatura.

 

Referência

Titze, I. R. (2017). Human speech: A restricted use of the mammalian larynx. Journal of Voice, 31(2), 135-141.