

We now offer a subscription for just 10 cents a day**h1>
You will always enjoy the full version of Mp4Gain with all its features and benefits.
For just 10 cents a day*
*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).
All other payments will be just $3.12 per month, billed quaterly.
That's only 10 cents per day!
CLICK TO PURCHASE
THIS PRICE ONLY LASTS FOR A FEW DAYS
For just 10 cents a day*
Geluidscodering

Geluid is fysiek van aard. Elk geluid zijn trillingen in de ruimte (in dit geval in de lucht), die worden opgevangen door onze oren. De oscillaties zijn continu en kunnen worden beschreven door wiskundige modellen. We zullen dit natuurlijk niet doen, maar we zullen de vraag stellen: hoe kunnen trillingen van continue aard worden geschreven naar een machine die alleen met nullen en enen werkt?

1.1. Geen compressie, geen verlies
Het WAV (WAVE) -formaat behoudt de audiotrack in zijn ware kwaliteit, zonder enige manipulatie van het audiobestand zelf.
Om geluid op te nemen, moeten we het converteren naar een reeks nullen en enen. In het geval van het WAV-formaat gebeurt dit op de stomste manier: de inkomende audiostream wordt opgedeeld in de kleinste segmenten (hoeveel, vandaar de termen “sample rate”, “sample rate” of “sample rate”). sampling ‘) en in elk tijdsinterval wordt de huidige waarde van het analoge signaal in binair geschreven. te vormen. WAV-bestanden kunnen worden opgenomen met samplefrequenties van bijvoorbeeld 8 kHz tot 192 kHz, maar de de facto standaard is 44,1 kHz.
Opgemerkt moet worden dat WAV, als een container, ook andere manieren ondersteunt om audio-informatie op te slaan: bijvoorbeeld ADPCM die, afhankelijk van de bandbreedte, audiogegevens kan coderen met een variabele samplefrequentie.
De 44,1 kHz-frequentie was geen toeval. Als we onnauwkeurigheden in de beschrijving toegeven, is dit cijfer geproduceerd als een verklaring van de stelling van Kotelnikov: om de meest correcte golfvorm te behouden bij frequenties tot 20 kHz (de theoretische limiet van hoorbaarheid van het menselijk oor), een frequentie van Twee keer zo hoge bemonstering: 40 kHz. Eigenlijk is de frequentie bij 44,1 kHz te wijten aan technische aspecten, waarvan de details hier kunnen worden gelezen.
In elk segment van dit type wordt de werkelijke spanning van het analoge signaal in binaire vorm gecodeerd: het hoogste niveau kan worden weergegeven als “1111”, het laagste als “0000”. En hier komt de tweede parameter om de hoek kijken: de diepte van het geluid, die bepaalt hoe nauwkeurig de golfwaarde over een bepaalde periode wordt gedigitaliseerd. WAV-bestanden worden vaak in 16 of 32 bit geschreven. Een grotere bitdiepte betekent een nauwkeurigere opname.
Over PCM trouwens. Wat is branden op een gewone cd, zo populair na audiocassettes? Dat wil zeggen, een reeks niet-gecomprimeerde nullen en enen in PCM-indeling. Bitdiepte: 16 bits, Bemonsteringsfrequentie: 44,1 kHz. Wat is dan de bitsnelheid van die opname?
Een 16-bits nummer wordt 44.100 keer per seconde geschreven. 44100 * 16 = 705600 bps voor één kanaal;
voor stereo-opname wordt deze waarde vermenigvuldigd met 2 – 1411200 bps of onze ~ 1411 kbps;
voor 32-bits opnamen is deze waarde twee keer zo hoog: ~ 2822 kbps.
Conclusie: vandaar de gulzigheid van deze bestanden voor vrije ruimte op de harde schijf, maar als voordeel: de totale afwezigheid van verliezen bij het opnemen en beluisteren van een audiobestand.
1.2. Lossless compressie
Ik zal niet veel schrijven over compressie zonder verlies. Deze term is hier te vinden. In feite bestaat deze methode in het algemeen uit het archiveren van audio-opnamen met behulp van algoritmen die in de codec zijn ingebouwd, maar de gegevens gaan niet verloren en de mogelijkheid om de audio-opname met bit-voor-bit precisie te herstellen, blijft behouden. Door deze formaten te decoderen, krijgen we eigenlijk hetzelfde WAVE-formaat, alleen neemt het minder schijfruimte in beslag; compressie is ongeveer tweemaal en hangt af van de aard van de gecodeerde compositie. Als je naar de opname luistert, “decomprimeert” de codec de compositie en stuurt een reeks niet-gecomprimeerde nullen en enen naar de geluidskaart om te verwerken.
Er zijn veel codecs van dit type: dit is FLAC (Free Lossless Audio Codec), ontwikkeld door de Xiph-organisatie (ook ontwikkeld Opus), ALAC (Apple Lossless) van het bedrijf met dezelfde naam, APE (Monkey’s audio), WV (WavPack) en andere minder bekende verliesvrije audiocompressieformaten.
1.3. Lossy-compressie: onze oren voor de gek houden
Wetenschappers begonnen te denken dat het in principe vaak geen zin heeft om volledige informatie over een audio-opname op te slaan, omdat ons gehoor niet perfect is. U hoort mogelijk geen zachte geluiden na harde geluiden, u hoort mogelijk geen frequenties die te hoog of te laag zijn, enz. Deze verschijnselen worden het maskerende effect genoemd.
Het resultaat was dat we het begrepen: je kunt het tenslotte hier gooien, daar knippen, en de luisteraar zal praktisch niets merken – een onvolmaakt oor geeft de luisteraar gewoon de kans om zichzelf voor de gek te houden. Daarom is het mogelijk om de psychoakoestische redundantie in het bestand te verwijderen.
In feite bestaat psychoakoestiek als een discipline en bestudeert het de psychologische en fysiologische kenmerken van de menselijke waarneming van geluiden.






