

We now offer a subscription for just 10 cents a day**h1>
You will always enjoy the full version of Mp4Gain with all its features and benefits.
For just 10 cents a day*
*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).
All other payments will be just $3.12 per month, billed quaterly.
That's only 10 cents per day!
CLICK TO PURCHASE
THIS PRICE ONLY LASTS FOR A FEW DAYS
For just 10 cents a day*
Audio compressie

Er kunnen beproefde datacompressiemethoden zoals RLE, statistische en woordenboekmethoden worden gebruikt om verliesvrije audiobestanden te comprimeren, maar het resultaat is sterk afhankelijk van de specifieke audiogegevens. Sommige geluiden zullen goed comprimeren met RLE, maar slecht met statistische algoritmen. Statistische compressie is geschikter voor andere geluiden, maar bij een woordenboekbenadering kan juist expansie optreden. Hier is een kort overzicht van de effectiviteit van deze drie methoden voor het comprimeren van audiobestanden.
RLE werkt goed met geluiden die een lange reeks herhalende geluidsblokken bevatten – samples. Bij 8-bit sampling kan dit vrij vaak gebeuren. Onthoud dat het spanningsverschil tussen twee 8-bit samples n en n – 1 ongeveer 4 mV is. Een paar seconden homogene muziek, waarin de geluidsgolf met minder dan 4 mV verandert, genereert een reeks van duizenden identieke samples. Bij 16-bits sampling zijn lange herhalingen duidelijk minder gebruikelijk en daarom zal het RLE-algoritme minder efficiënt zijn.
Statistische methoden wijzen codes met variabele lengte toe aan audiomonsters op basis van hun frequentie. Met 8-bit sampling zijn er slechts 256 verschillende samples, dus de samples kunnen gelijkmatig in een groot audiobestand worden verdeeld. Een bestand van dit type kan niet goed worden gecomprimeerd met de Huffman-methode. Met 16-bits sampling zijn meer dan 65.000 soundbites toegestaan. In dit geval kunnen sommige monsters vaker voorkomen en andere minder. Met een sterke waarschijnlijkheidsverschuiving kunnen goede resultaten worden bereikt met behulp van rekenkundige codering.
Op woordenboek gebaseerde methoden gaan ervan uit dat sommige zinnen vaak in het hele bestand zullen voorkomen. Dit gebeurt in een tekstbestand waarin afzonderlijke woorden of reeksen daarvan vele malen worden herhaald. Het geluid is echter een analoog signaal en de waarden van de specifiek gegenereerde samples zijn sterk afhankelijk van de werking van de ADC. Met 8-bits bemonstering wordt een 8 mV-golfvorm bijvoorbeeld een numerieke sample van 2, maar een nabije golf van bijvoorbeeld 7,6 mV of 8,5 mV kan worden geconverteerd naar een ander getal. Om deze reden kunnen spraakfragmenten die overlappende zinnen bevatten en voor ons hetzelfde klinken, enigszins verschillen wanneer ze worden gedigitaliseerd. Vervolgens komen ze het woordenboek binnen in de vorm van verschillende zinnen, die niet de verwachte compressie geven. Daarom zijn woordenboekmethoden niet erg geschikt voor audiocompressie.
U kunt betere resultaten behalen bij audiocompressie met verlies door compressietechnieken te ontwikkelen die rekening houden met de perceptie van geluid. Ze verwijderen het deel van de data dat onhoorbaar blijft voor het publiek. Het is als het comprimeren van afbeeldingen, waarbij informatie wordt weggegooid die onzichtbaar is voor het oog. In beide gevallen gaan we ervan uit dat de oorspronkelijke informatie (beeld of geluid) analoog is, dat wil zeggen dat een deel van de informatie al verloren is gegaan tijdens kwantisering en digitalisering. Als u voorzichtig iets meer verlies toestaat, heeft dit geen invloed op de kwaliteit van de ongecomprimeerde geluidsweergave, die niet veel zal verschillen van het origineel. We zullen in het kort twee benaderingen beschrijven: onderdrukking van stilte en verdichting.
Het idee achter het onderdrukken van stilte is om kleine monsters te behandelen alsof ze er niet zijn (dat wil zeggen, ze zijn nul). Zo’n nulstelling zal een reeks nullen genereren, dus de methode om pauzes te onderdrukken is in feite een variant van RLE die is aangepast aan audiocompressie. Deze methode is gebaseerd op de eigenaardigheid van geluidsperceptie, die bestaat uit de tolerantie van het menselijk oor om nauwelijks hoorbare geluiden uit te sluiten. Audiobestanden die lange stukken zacht geluid bevatten, worden beter gecomprimeerd met behulp van de methode voor het onderdrukken van stilte dan bestanden vol harde geluiden. Deze methode vereist de deelname van de gebruiker, die de parameters bestuurt die de luidheidsdrempel voor de samples bepalen. Dit vereist nog twee parameters, die niet noodzakelijkerwijs door de gebruiker worden beheerd. Eén parameter wordt gebruikt om de kortste reeksen van stille samples te bepalen, meestal 2 of 3. En de tweede stelt het kleinste aantal opeenvolgende sterke samples in, wanneer stilte of pauze optreedt. Zo kunnen 15 stille monsters worden gevolgd door 2 sterke en dan 13 stille,
Consolidatie is gebaseerd op de eigenschap dat het oor veranderingen in de amplitude van zachte geluiden beter kan onderscheiden dan harde geluiden. Een typische ADC voor computergeluidskaarten gebruikt een lineaire conversie om de spanning om te zetten in een numerieke vorm. Als de amplitude a n werd, dan wordt de amplitude 2 a 2 n.
