Difusão

O áudio e o vídeo

Publicado em 05/06/2018, às 18h07 | Atualizado em 05/06/2018, às 18h14

Por Marcelo Sampaio de Alencar

O ouvido humano é sensível a sons na faixa de 20 a 20 mil ciclos por segundo (20 Hz a 20 kHz) / Foto: Pixabay

O ouvido humano é sensível a sons na faixa de 20 a 20 mil ciclos por segundo (20 Hz a 20 kHz) Foto: Pixabay

O som pode ser definido como uma oscilação na pressão do meio, como o ar, que se propaga em função de forças internas, que podem ser, tipicamente, elásticas ou viscosas. Mas o som também pode ser descrito como a sensação subjetiva causada, ou estimulada, por essa oscilação.

A fala humana, por seu turno, é produzida a partir da pressão exercida pelos pulmões, que cria uma vibração nas cordas, ou pregas, vocais, e produz a fonação na glote, a porção final da laringe. Essa fonação é modificada pelo trato vocal e pela boca, para produzir os distintos sons vocálicos e consonantais. O som pode ser, assim, considerado a portadora da informação da fala.

O ouvido humano é sensível a sons na faixa de 20 a 20 mil ciclos por segundo (20 Hz a 20 kHz). Uma sensibilidade superior à faixa espectral da fala, que praticamente não tem energia acima de 5 kHz. Provavelmente, um resultado da evolução, como precaução contra predadores, ou fenômenos da natureza, ou alerta sobre presas e ocorrência de água, no passado longínquo da espécie humana.

A fonação, ou vozeamento, é então o processo pelo qual as cordas vocais produzem determinados sons, a partir de uma vibração quase periódica, causada pela passagem de ar vindo dos pulmões, que provoca um conjunto de pequenas explosões, gerando uma série de impulsos ciclo-estacionários.

A passagem do ar pelas pregas vocais abertas é usada para a geração de fonemas sibilantes ou surdos, por exemplo, com características ruidosas, integrantes da fala.

Sons vocálicos da fala

Apesar da fala, em sua gênese, ser formada por pulsos discretos, emitidos a intervalos quase regulares pelas cordas vocais, os sons vocálicos da fala são geralmente percebidos como sinais contínuos, em um processo análogo à percepção da sequência de fotogramas de um filme, ou de quadros de um vídeo, como um movimento contínuo.

Isso se deve, no caso do vídeo, à limitação natural da capacidade de excitação da retina, associada ao tempo de processamento do cérebro, que, no caso dos quadros de um vídeo, não permite perceber as imagens individuais, caso elas sejam passadas a uma taxa superior a dez a 15 imagens por segundo. Assim, a sucessão de imagens é percebida pelo cérebro como o movimento contínuo de um filme.

O sistema auditivo tem uma limitação similar, e a sucessão de pulsos gerados com a abertura abrupta das cordas vocais, pela pressão do ar produzida nos pulmões, acaba sendo percebida como um áudio contínuo, quando ocorre a uma taxa superior a dez a 15 pulsos por segundo, a depender do ouvinte. Esse som, percebido como contínuo, é apenas o resultado da sucessão discreta de pulsos, que a mente não consegue acompanhar.

Dessa maneira, o movimento ritmado dos pulsos que emergem da glote, com sua marcação de intervalos, passa, à medida em que a frequência de vibração das pregas vocais aumenta, a adquirir um sentido de harmonia, com a percepção da altura, ou frequência, do som. Esses pulsos, modulados pelo timbre específico conferido pelo trato vocal, produzem as melodias características da voz humana.

*As colunas assinadas não refletem, necessariamente, a opinião do NE10

PALAVRAS-CHAVE: difusão notícias áudio

Difusão Marcelo S. Alencar Marcelo Sampaio de Alencar é professor titular da UFCG e presidente do Instituto de Estudos Avançados em Communicações (Iecom).. Email: sampaio.alencar@gmail.com e no twitter: @marcelosalencar

Continue Lendo

COMENTE ESTA MATÉRIA

Nome:
E-mail
Mensagem

O comentário é de total responsabilidade do internauta que o inseriu. O NE10 reserva-se o direito de não publicar mensagens com palavras de baixo calão, publicidade, calúnia, injúria, difamação ou qualquer conduta que possa ser considerada criminosa.

Vitrine NE10
Fechar vídeo