Llindar d'emmascarament
De Viquipèdia
El llindar d'emmascarament està íntimament relacionat tant amb la freqüència com amb les característiques del so emmascarador i l'emmascarat. El llindar d'emmascarament és el mínim nivell de pressió sonora (SPL) que haurà de tenir un senyal acústic per tal que sigui audible en presència d'un so emmascarant.
Això comporta diversos avantatges en el camp de les transmissions, així com en el del processat de senyal. Per exemple, aquest fenomen s'empra en codificació d'àudio on la idea principal resideix en evitar codificar informació no perceptible per la oïda humana assolint una major compressió i, consegüentment un estalvi de memòria i de recursos en transmissió. És el que s'anomena codificació perceptual.
El llindar d'emmascarament es determina, per tant, mitjançant un processador perceptual, que calcula una sèrie de coeficients. Aquests depenen de les característiques d'emmascarament temporal i d'emmascarament freqüencial de les mostres processades.
Val a dir que realment ens trobarem que fent un anàlisi per bandes de freqüència tindrem diversos tons en un mateix instant de temps. Això vol dir que per a un mateixa freqüència, tindrem més d'una possible senyal emmascaradora. Això dona peu a l'estudi del que es coneix com llindar d'emmascarament global.
Aquest es quantifica en base a un espectre d'alta resolució del senyal (habitualment d'àudio) a partir d'una Transformada Ràpida de Fourier (FFT) DE 512 ó 1024 punts. En primera instància es calculen els llindars individuals tenint en compte el nivell de senyal, el tipus d'emmascarador (ja sigui senyal o soroll) i la banda de freqüències (tenint en compte les limitacions en freqüència de l'oïda humana, que només percep estímuls sonors entre els 20 Hz y 20 kHz aproximadament). Posteriorment es sumen tots els llindars, tot afegint el llindar de tranquil·litat o de silenci, assegurant-se d'aquesta forma que el llindar d'emmascarament total no estigui mai per sota d'aquest últim. Finalment es pot calcular el SMR (Relació senyal·llindar d'emmascarament). Aquesta darrera operació és la que es du a terme en la codificació d'àudio.
La següent figura mostra el cas de tenir un to a 1kHz. Podem observar el llindar de tranquil·litat o silenci sota del qual cap so serà perceptible. Ara bé, al sobreposar el to, aquest nivell varia al voltant de la freqüència central de l'emmascarador, tot fent que sigui més difícil percebre els possibles estímuls amb una freqüència propera a la d'aquest.
[edita] Aplicació. El model psicoacústic
Una aplicació del llindar d'emmascarament es troba en el camp de la codificació d'àudio. Un exemple és el que utilitza MPEG. En aquests esquemes s'inclou el bloc denominat Model Psicoacústic. Aquest està comunicat amb el banc de filtres i el bloc de quantificació. El model psicoacústic és l'encarregat d'analitzar les mostres que provenen del banc de filtres tot calculant, per a cada banda de freqüències, el nivell d'emmascarament. El procediment, com ja s'ha comentat en el paràgraf anterior, es porta a terme mitjançant una FFT. Segons la capa de MPEG en la que estiguem treballant s'utilitzen més o menys punts. A partir de tots els diferents nivells es calcula el SMR, que passa al quantificador. Aquest últim és l'encarregat d'assignar més o menys bits a cadascun dels blocs freqüencials, tenint en compte l'SMR. El bloc amb una màxima relació senyal-emmascarament es codificarà amb el màxim nombre de bits possible, mentre que el que tingui la pitjor relació es codificarà amb el mínim.
En definitiva, el càlcul del llindar d'emmascarament és tingut en compte per certs còdecs d'àudio per tal de no codificar mostres que, al cap i a la fi, si es codifiquessin, serien igualment inaudibles per l'oïda humana. D'aquesta manera s'utilitzen menys bits, i en conseqüència, es redueix la mida de l'arxiu d'àudio, aconseguint així una millor compressió.