Audiocompressie, hoe het werkt Deel 4

Free Download Mp4Gain

We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE

THIS PRICE ONLY LASTS FOR A FEW DAYS

Audiocompressie, hoe het werkt Deel 4

Audio compression

Andere onderverdelingen van compressiemethoden.

Audio compression

Op het gebied van audiocompressie zijn er twee compressiemethoden, lossy compressie en lossless compressie. Vaak gezien worden MP3, WMA, OGG lossy-compressie genoemd. Zoals de naam al doet vermoeden, verlaagt lossy-compressie de audiosamplefrequentie en bitsnelheid, en het uitvoeraudiobestand zal kleiner zijn dan het originele bestand. Een andere audiocompressie wordt lossless compressie genoemd, en dat is waar we het over hebben. Compressie zonder verlies kan het volume van het audiobestand tot een kleiner formaat comprimeren met als uitgangspunt dat 100% van alle gegevens in het originele bestand wordt opgeslagen, en na het herstellen van het gecomprimeerde audiobestand kan het dezelfde grootte en dezelfde bitrate bereiken als de bron het dossier. Compressie-indelingen zonder verlies zijn APE, FLAC, WavPack, LPAC, WMALossless, AppleLossless, La, OptimFROG, Shorten, terwijl gewone en conventionele compressie-indelingen zonder verlies alleen APE en FLAC zijn. [1]
Belangrijkste classificaties en typische vertegenwoordigers van audiocompressie-algoritmen.streaming bewerken
Over het algemeen kunnen audiocompressietechnieken worden onderverdeeld in twee categorieën: compressie zonder verlies en compressie met verlies, en volgens verschillende compressieschema’s kunnen ze worden onderverdeeld in tijddomeincompressie, transformatiecompressie en tijddomeincompressie. hybride compressie waarbij meerdere technologieën met elkaar worden gecombineerd. Verschillende compressietechnieken hebben grote verschillen in algoritmecomplexiteit (inclusief tijdcomplexiteit en ruimtecomplexiteit), audiokwaliteit, algoritme-efficiëntie (dwz compressieverhouding) en codecvertraging. Ook de toepassingen van verschillende compressietechnieken zijn verschillend.
Tijddomeincompressietechnologie (of golfvormcodering)
Het verwerkt direct de voorbeeldwaarden van de audio PCM-codestroom en comprimeert de codestroom met behulp van stiltedetectie, niet-lineaire kwantisering en verschil. Gemeenschappelijke kenmerken van dit type compressietechnologie zijn lage algoritmecomplexiteit, gemiddelde geluidskwaliteit, kleine compressieverhouding (cd-kwaliteit > 400 kbps) en de kortste codecvertraging (ten opzichte van andere technologieën). Dit type compressietechnologie wordt over het algemeen gebruikt voor spraakcompressie, toepassingen met een lage bitsnelheid (kleine bronsignaalbandbreedte). Tijddomeincompressietechnologie omvat voornamelijk G.711, ADPCM, LPC, CELP en blokcompressietechnologie die op deze technologieën is ontwikkeld, zoals NICAM, Subband ADPCM (SB-ADPCM)-technologie.
Subbandcompressietechnologie
Subbandcoderingstheorie werd voor het eerst voorgesteld door Crochiere et al. in 1976. Het basisidee is om het signaal te ontleden in de som van componenten in verschillende subbanden en vervolgens verschillende compressiestrategieën toe te passen voor elke subbandcomponent volgens de verschillende lay-outkenmerken om de codesnelheid te verminderen . De gebruikelijke subbandcompressietechnologie en transformatiecompressietechnologie die hieronder worden beschreven, zijn gebaseerd op het menselijke waarnemingsmodel (psycho-akoestisch model) van het geluidssignaal en de kwantisatievolgorde van de subbandsamples of de samples Het frequentiedomein wordt bepaald door analyse van het spectrum van het signaal . andere parameters worden geselecteerd, dus het kan ook perceptuele compressiecodering (Perceptual) worden genoemd. In vergelijking met tijddomeincompressietechnologie zijn deze twee compressiemethoden veel gecompliceerder.Tegelijkertijd worden de coderingsefficiëntie en de geluidskwaliteit ook aanzienlijk verbeterd en wordt de coderingsvertraging dienovereenkomstig verhoogd. Over het algemeen is de complexiteit van subbandcodering iets minder dan die van transformatiecodering en is de coderingsvertraging relatief kort.
Standaardisatie van audiocompressietechnologie en MPEG-1-uitzendingen
Omdat digitale audiocompressietechnologie een breed toepassingsgebied heeft en goede marktvooruitzichten heeft, doen sommige onderzoeksinstituten en bedrijven er alles aan om hun eigen gepatenteerde technologieën en producten te ontwikkelen. De standaardisatie van deze audiocompressietechnieken is erg belangrijk. Een groot succes bij het standaardiseren van audiocompressie is MPEG-1 Audio (ISO/IEC11172-3). In MPEG-1 zijn drie modi gespecificeerd voor audiocompressie, namelijk Layer I, Layer II (dwz MUSICAM, ook bekend als MP2) en Layer III (ook bekend als MP3). de drie modi

Free Download Mp4Gain

Audiocompressie, hoe het werkt Deel 3

mp3 masking

Maskeren in een mp3

mp3 masking

Bovendien, volgens de fysiologische en psycho-akoestische verschijnselen van het menselijk oor, wanneer een sterk signaal en een zwak signaal tegelijkertijd bestaan, wordt het zwakke signaal gemaskeerd door het sterke signaal en kan het niet worden gehoord, dus het zwakke signaal kan worden beschouwd als een redundant signaal. Niet verzenden. Dit is het maskerende effect van het menselijk gehoor, dat zich voornamelijk manifesteert in het spectrale maskeringseffect en het tijddomeinmaskeringseffect, die hieronder worden weergegeven:
Spectrale maskerende effecten.
Nadat de geluidsenergie van een frequentie onder een bepaalde drempel is gekomen, wordt deze niet door het menselijk oor gehoord, en deze drempel wordt de minimale hoorbare drempel genoemd. Wanneer er een ander geluid met hogere energie is, zal de drempelwaarde dicht bij de frequentie van het geluid aanzienlijk toenemen, wat bekend staat als het maskeringseffect.

Albums samenvoegen
Gecombineerde atlas (2)
Maskeereffecten in het tijdsdomein.
Wanneer sterke en zwakke signalen tegelijkertijd verschijnen, is er ook een maskerend effect in het tijdsdomein. Dat wil zeggen, wanneer de twee zich zeer dicht in de tijd voordoen, zal het maskerende effect ook optreden. Maskering in het tijddomein is verdeeld in drie delen: pre-masking, simultane masking en post-masking. Pre-masking verwijst naar de korte tijd voordat het menselijk oor een sterk signaal hoort, het reeds bestaande zwakke signaal wordt gemaskeerd en kan niet worden gehoord. Gelijktijdige maskering betekent dat wanneer een sterk signaal en een zwak signaal tegelijkertijd bestaan, het zwakke signaal wordt gemaskeerd door het sterke signaal en niet kan worden gehoord. Post-masking houdt in dat wanneer het sterke signaal verdwijnt, het lang duurt voordat het zwakke signaal weer wordt gehoord, dit wordt post-masking genoemd. Deze zwakke gemaskeerde signalen kunnen als redundante signalen worden beschouwd.

compressiecoderingsmethodedit stream
Volgens verschillende compressieprincipes wordt de audiosignaalcodering onderverdeeld in golfvormcodering, parametercodering en coderingsvormen die verschillende technologieën integreren.
(1) Golfvormcodering bemonstert direct de tijddomein- of frequentiedomeingolfvorm van het audiosignaal met een bepaalde snelheid, en kwantiseert vervolgens de amplitudemonsters hiërarchisch, transformeert ze in digitale codes en voert een signaalcoderingssysteem uit dat is gereconstrueerd uit de golfvormgegevens . , de golfvorm is zo consistent mogelijk met de originele geluidsgolfvorm, met behoud van gedetailleerde signaalveranderingen en verschillende overgangskenmerken.
(2) Parametrische codering Eerst wordt een kenmerkmodel op basis van verschillende signaalbronnen, zoals taalsignalen, natuurlijke geluiden, enz. tot stand gebracht door middel van kenmerkparameterextractie en coderingsverwerking, waarbij wordt geprobeerd het gereconstrueerde geluidssignaal zo luid mogelijk te maken. om de semantiek van het originele geluid te behouden, maar gereconstrueerd. De golfvorm van het signaal kan behoorlijk verschillen van de golfvorm van het originele geluidssignaal. Kenmerkende parameters die algemeen worden gebruikt, zijn onder meer formant, lineaire voorspellingscoëfficiënt, frequentiebandverdelingsfilter en andere parametercoderingstechnieken, die codering van geluidssignalen met lage snelheid kunnen realiseren, en de bitsnelheid kan worden gecomprimeerd met 2 Kbit/s – 4,8 Kbit/s, maar de geluidskwaliteit kan slechts Matig bereiken, vooral de lage mate van natuurlijkheid, alleen geschikt voor taaloverdracht en expressie.
(3) Hybride codering De coderingswijze die golfvormcodering en parametercodering combineert, overwint de zwakheden van de oorspronkelijke golfvormcodering en parametercodering, en streeft naar een hoge kwaliteit van de codering van golfvormen en de lage parametercodering, met een snelheid van 4-16Kbit /s Er kan een synthetisch geluidssignaal van hoge kwaliteit worden verkregen. De basis van hybride codering is lineaire voorspellende codering (LPC), veelgebruikte coderingsmethoden zoals puls-excited lineaire voorspellingscodering (MPLPC), geplande puls-excited lineaire voorspellingscodering (KPELPC), voorspellende codering Codebook Excited Linear (CELPC), enz. .

Audiocompressie, hoe het werkt Deel 4

Audio compression

Andere onderverdelingen van compressiemethoden.

Audio compression

Op het gebied van audiocompressie zijn er twee compressiemethoden, lossy compressie en lossless compressie. Vaak gezien worden MP3, WMA, OGG lossy-compressie genoemd. Zoals de naam al doet vermoeden, verlaagt lossy-compressie de audiosamplefrequentie en bitsnelheid, en het uitvoeraudiobestand zal kleiner zijn dan het originele bestand. Een andere audiocompressie wordt lossless compressie genoemd, en dat is waar we het over hebben. Compressie zonder verlies kan het volume van het audiobestand tot een kleiner formaat comprimeren met als uitgangspunt dat 100% van alle gegevens in het originele bestand wordt opgeslagen, en na het herstellen van het gecomprimeerde audiobestand kan het dezelfde grootte en dezelfde bitrate bereiken als de bron het dossier. Compressie-indelingen zonder verlies zijn APE, FLAC, WavPack, LPAC, WMALossless, AppleLossless, La, OptimFROG, Shorten, terwijl gewone en conventionele compressie-indelingen zonder verlies alleen APE en FLAC zijn. [1]
Belangrijkste classificaties en typische vertegenwoordigers van audiocompressie-algoritmen.streaming bewerken
Over het algemeen kunnen audiocompressietechnieken worden onderverdeeld in twee categorieën: compressie zonder verlies en compressie met verlies, en volgens verschillende compressieschema’s kunnen ze worden onderverdeeld in tijddomeincompressie, transformatiecompressie en tijddomeincompressie. hybride compressie waarbij meerdere technologieën met elkaar worden gecombineerd. Verschillende compressietechnieken hebben grote verschillen in algoritmecomplexiteit (inclusief tijdcomplexiteit en ruimtecomplexiteit), audiokwaliteit, algoritme-efficiëntie (dwz compressieverhouding) en codecvertraging. Ook de toepassingen van verschillende compressietechnieken zijn verschillend.
Tijddomeincompressietechnologie (of golfvormcodering)
Het verwerkt direct de voorbeeldwaarden van de audio PCM-codestroom en comprimeert de codestroom door stiltedetectie, niet-lineaire kwantisering en verschil. Gemeenschappelijke kenmerken van dit type compressietechnologie zijn lage algoritmecomplexiteit, gemiddelde geluidskwaliteit, kleine compressieverhouding (cd-kwaliteit > 400 kbps) en de kortste codecvertraging (ten opzichte van andere technologieën). Dit type compressietechnologie wordt over het algemeen gebruikt voor spraakcompressie en toepassingen met een lage bitsnelheid (kleine bronsignaalbandbreedte). Tijddomeincompressietechnologie omvat voornamelijk G.711, ADPCM, LPC, CELP en blokcompressietechnologie die op deze technologieën is ontwikkeld, zoals NICAM, Subband ADPCM (SB-ADPCM)-technologie.
Subbandcompressietechnologie
Subbandcoderingstheorie werd voor het eerst voorgesteld door Crochiere et al. in 1976. Het basisidee is om het signaal te ontleden in de som van componenten in verschillende subbanden en vervolgens verschillende compressiestrategieën toe te passen voor elke subbandcomponent volgens de verschillende lay-outkenmerken om de codesnelheid te verminderen . De gebruikelijke subbandcompressietechnologie en transformatiecompressietechnologie die hieronder worden beschreven, zijn gebaseerd op het menselijke waarnemingsmodel (psycho-akoestisch model) van het geluidssignaal en de kwantisatievolgorde van de subbandsamples of de samples Het frequentiedomein wordt bepaald door analyse van het spectrum van het signaal . andere parameters worden geselecteerd, dus het kan ook perceptuele compressiecodering (Perceptual) worden genoemd. In vergelijking met tijddomeincompressietechnologie zijn deze twee compressiemethoden veel gecompliceerder.Tegelijkertijd worden de coderingsefficiëntie en de geluidskwaliteit ook aanzienlijk verbeterd en wordt de coderingsvertraging dienovereenkomstig verhoogd. Over het algemeen is de complexiteit van subbandcodering iets minder dan die van transformatiecodering en is de coderingsvertraging relatief kort.

Audiocompressie, hoe het werkt Deel 3

Audio compression

Compressie coderingsmethode:

Audio compression

Volgens verschillende compressieprincipes wordt de audiosignaalcodering onderverdeeld in golfvormcodering, parametercodering en coderingsvormen die verschillende technologieën integreren.
(1) Golfvormcodering bemonstert direct de tijddomein- of frequentiedomeingolfvorm van het audiosignaal met een bepaalde snelheid, en kwantiseert vervolgens de amplitudemonsters hiërarchisch, transformeert ze in digitale codes en voert een signaalcoderingssysteem uit dat is gereconstrueerd uit de golfvormgegevens . , de golfvorm is zo consistent mogelijk met de originele geluidsgolfvorm, met behoud van gedetailleerde signaalveranderingen en verschillende overgangskenmerken.
(2) Parametrische codering Eerst wordt een kenmerkmodel op basis van verschillende signaalbronnen, zoals taalsignalen, natuurlijke geluiden, enz. tot stand gebracht door middel van kenmerkparameterextractie en coderingsverwerking, waarbij wordt geprobeerd het gereconstrueerde geluidssignaal zo luid mogelijk te maken. om de semantiek van het originele geluid te behouden, maar gereconstrueerd. De golfvorm van het signaal kan behoorlijk verschillen van de golfvorm van het originele geluidssignaal. Kenmerkende parameters die algemeen worden gebruikt, zijn onder meer formant, lineaire voorspellingscoëfficiënt, frequentiebandverdelingsfilter en andere parametercoderingstechnieken, die codering van geluidssignalen met lage snelheid kunnen realiseren, en de bitsnelheid kan worden gecomprimeerd met 2 Kbit/s – 4,8 Kbit/s, maar de geluidskwaliteit kan slechts Matig bereiken, vooral de lage mate van natuurlijkheid, alleen geschikt voor taaloverdracht en expressie.
(3) Hybride codering De coderingswijze die golfvormcodering en parametercodering combineert, overwint de zwakheden van de oorspronkelijke golfvormcodering en parametercodering, en streeft naar een hoge kwaliteit van de codering van golfvormen en de lage parametercodering, met een snelheid van 4-16Kbit /s Er kan een synthetisch geluidssignaal van hoge kwaliteit worden verkregen. De basis van hybride codering is lineaire voorspellende codering (LPC), veelgebruikte coderingsmethoden zoals puls-excited lineaire voorspellingscodering (MPLPC), geplande puls-excited lineaire voorspellingscodering (KPELPC), voorspellende codering Codebook Excited Linear (CELPC), enz. .