PCM-audiocodering deel 3

Free Download Mp4Gain

We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE

THIS PRICE ONLY LASTS FOR A FEW DAYS

PCM-audiocodering deel 3

PCM

bemonsteringsfrequentie:

Het herkenningsbereik van de menselijke frequentie is 20HZ – 20000HZ. Als er 20.000 geluidssamples per seconde kunnen worden gesampled, kan dit tijdens het afspelen voldoen aan de behoeften van menselijke oren.

8000 Hz voor telefonische bemonstering.
Meestal wordt een bemonsteringsfrequentie van 22050 gebruikt.
44100 is al cd-kwaliteit, en samples van meer dan 48000 zijn zinloos voor het menselijk oor
Bij het decoderen van AAC-audio (Advanced Audio Coding) met een bemonsteringsfrequentie van 44,1 kHz, moet de decoderingstijd van één frame binnen 23,22 milliseconden worden geregeld. Meestal is het een frame met 1024 meetpunten.

Waarom moeten we het hier hebben over audioframes?
Het concept van audioframes is niet zo duidelijk als dat van videoframes. Bijna alle videocoderingsindelingen kunnen een frame eenvoudigweg zien als een gecodeerde afbeelding. Maar het audioframe is gerelateerd aan het coderingsformaat, dat door elke coderingsstandaard wordt geïmplementeerd. Want als het PCM is (ongecodeerde audiogegevens), heb je het concept van frames helemaal niet nodig, en het kan worden afgespeeld volgens de samplefrequentie en sampleprecisie. Voor audio met een samplefrequentie van 44,1 kHz en een sampleprecisie van 16 bits, kunt u bijvoorbeeld berekenen dat de bitsnelheid 44100 16 kbps is en dat de audiogegevens per seconde vastliggen op 44100 16/8 bytes.
Maar we willen niet dat alle monsters naar ons worden teruggestuurd voor verwerking, we willen alle gegevens die over een bepaalde periode zijn bemonsterd, retourneren. De audiobox hier is hoeveel voorbeeldgegevens er elke keer aan ons worden geretourneerd en in het algemeen worden 2048 voorbeeldgegevens geretourneerd.
Dus wat is de grootte van 2048 voorbeeldgegevens met 16-bits bemonsteringsbits voor mono?2048*16/8 = 4096 bytes.

Bemonsteringsbits
Elke bemonsterde gegevens registreren de amplitude en de bemonsteringsprecisie hangt af van de grootte van de opslagruimte (bemonsteringsbits):

1 byte (dwz 8 bits) kan slechts 256 nummers registreren, dat wil zeggen dat alleen de amplitude in 256 niveaus kan worden verdeeld
2 bytes (dwz 16 bits) kunnen zo klein zijn als 65536 getallen, wat al de cd-standaard is;
4 bytes (d.w.z. 32 bits) kunnen de amplitude onderverdelen in 4294967296 niveaus, wat echt niet nodig is
Als het stereo is, worden de samples verdubbeld en wordt het bestand bijna verdubbeld.

Free Download Mp4Gain

PCM-audiocodering deel 2

PCM Audio Coding

codering

PCM

Het gekwantiseerde bemonsterde signaal wordt omgezet in een reeks decimale digitale codestromen die zijn gerangschikt volgens de bemonsteringsvolgorde, dwz een decimaal digitaal signaal. Een eenvoudig en efficiënt datasysteem is een binair codesysteem. Daarom moet de decimale digitale code worden omgezet in een binaire code. Op basis van het totale aantal decimale digitale codes kan het aantal benodigde binaire codebits worden bepaald, dat wil zeggen de woordlengte (samplingbits). Het proces van het transformeren van het gekwantiseerde samplesignaal in een binaire codestroom met een gegeven woordlengte codering genoemd.

Voorbeeld
Vervolgens komt de bovenstaande 1,65 V overeen met een kwantiseringsniveau van 128. Het corresponderende binaire systeem is 10000000. Dat wil zeggen, het gecodeerde resultaat van het monsterpunt is 10000000. Dit is natuurlijk een coderingsmethode zonder positieve en negatieve waarden in overweging te nemen, en er zijn veel soorten coderingsmethoden die een specifieke analyse van specifieke problemen vereisen. (PCM-audioformaatcodering is A-law 13 polyline-codering)

PCM-audiocodering
PCM-signalen zijn niet onderhevig aan codering of compressie (verliesloze compressie). In vergelijking met analoge signalen is het minder gevoelig voor rommel en vervorming van het transmissiesysteem. Het dynamisch bereik is breed en de geluidskwaliteit is redelijk goed. De codering neemt de A-law 13 polyline-codering over.

A-klasse 13-voudige lijn
De A-wet is een vorm van logaritmische metgezel in niet-uniforme PCM-kwantisatie. Digital Pulse Code Modulation (PCM) is tegenwoordig de basismethode voor het digitaliseren van analoge signalen. PCM omvat drie stappen: bemonstering, kwantisering en codering. Onder hen is de kwantisering de discrete waarde van de bemonsteringswaarden. Uniforme kwantisering en niet-uniforme kwantisering kunnen de kwantiseringssignaal-ruisverhouding van het signaal effectief verbeteren. Kwantisering van spraaksignalen heeft vaak twee logaritmische vormen van niet-uniforme kwantisering en door de ITU aanbevolen compressiekenmerken: A-law en Mu-law. A-law-codering wordt voornamelijk gebruikt in 30/32-kanaals groepssystemen, en A- De PCM wet wordt gebruikt in Europa en China.

Zie het artikel voor meer details

kanaal
Kanalen kunnen worden onderverdeeld in PCM mono en stereo (twee kanalen)
Elke samplewaarde is opgenomen in een geheel getal i waarvan de lengte het minimum aantal bytes is dat nodig is om de gespecificeerde samplelengte te accommoderen.
De laag significante byte wordt eerst opgeslagen en het bit dat de monsteramplitude vertegenwoordigt, wordt in de hoge significante bit van i geplaatst en de overige posities zijn 0, dus het gegevensformaat van de PCM-golfvormmonsters 8 en 16 bit is als volgt.

PCM-audiocodering

Pulscodemodulatie PCM is een afkorting voor Pulscodemodulatie.

PCM AUDIO ENCODING

Pulscodemodulatie is een van de coderingsmethoden van digitale communicatie. Het belangrijkste proces is om de spraak-, beeld- en andere analoge signalen met regelmatige tussenpozen te samplen om ze te discretiseren, en tegelijkertijd wordt de gesamplede waarde afgerond en gekwantiseerd volgens de hiërarchische eenheid, en de gesamplede waarde wordt weergegeven door een set. van binaire codes waarde.

Principes van spraakcodering
Iedereen met enige elektronische achtergrond weet dat het door de sensor verzamelde audiosignaal een analoge hoeveelheid is, en dat wat we in het eigenlijke transmissieproces gebruiken een digitale hoeveelheid is. En dit omvat het proces van het omzetten van analoog naar digitaal. En de digitalisering van analoge signalen moet drie processen doorlopen, namelijk bemonstering, kwantisering en codering, om de pulscodemodulatie (PCM, pulscodemodulatie) technologie van spraakdigitalisering te realiseren.

Converteer analoog signaal naar digitaal signaal
bemonstering
Sampling is het proces waarbij monsterwaarden worden geëxtraheerd uit een analoog signaal met een frequentie die twee keer of meer van de signaalbandbreedte is en dit wordt gewijzigd in een discreet gesampled signaal op de tijdas.

Sampling rate (sample): Het aantal samples per seconde geëxtraheerd uit een continu signaal om een discreet signaal te vormen, uitgedrukt in Hertz (Hz).

Voorbeeld: bijvoorbeeld
de samplefrequentie van het audiosignaal is 8000 Hz.
Het is duidelijk dat de curve van de spanningsverandering met de tijd die overeenkomt met de bemonstering in de bovenstaande afbeelding 1 seconde is, dus de volgende 1 2 3 … 10 moeten 1-8000 punten hebben, dat wil zeggen, 1 seconde is verdeeld in 8000 delen, en op zijn beurt genomen De spanningswaarde die overeenkomt met de tijd van 8000 punten.

kwantiseren
Hoewel het gesamplede signaal een discreet signaal op de tijdas is, is het nog steeds een analoog signaal en ligt de gesamplede waarde binnen een bepaald waardenbereik en kan een oneindig aantal waarden hebben. Het is duidelijk dat het onmogelijk is om een groep digitale code te geven die overeenkomt met een oneindig aantal monsters één voor één. Om de steekproefwaarde door een digitale code uit te drukken, moet de “afrondingsmethode” worden gebruikt om de steekproefwaarde naar graad “naar boven af te ronden”, zodat de steekproefwaarde binnen een bepaald waardenbereik kan worden gewijzigd van een oneindig aantal waarden. tot een eindig aantal waarden. Dit proces wordt kwantisatie genoemd.

Vergeleken met het bemonsterde signaal vóór kwantisatie, is het gekwantiseerde bemonsterde signaal natuurlijk vervormd en is het niet langer een analoog signaal. Deze kwantiseringsvervorming verschijnt als ruis wanneer het analoge signaal aan de ontvangende kant wordt hersteld en wordt kwantiseringsruis genoemd. De grootte van de kwantiseringsruis hangt af van hoe u de samplewaarde “afrondt”.

Sampling bits: verwijst naar het aantal bits dat wordt gebruikt om het digitale signaal te beschrijven.
8 bits (8 bits) vertegenwoordigen 2 tot de 8e macht = 256, en 16 bits (16 bits) vertegenwoordigen 2 tot de 16e macht = 65536; hoe hoger het bemonsteringsgetal, hoe hoger de precisie.

Het aantal samples wordt hier aangegeven om de minimale scheiding tussen analoge signalen te beschrijven.
Ervan uitgaande dat ons bemonsteringsnummer 8 is en het bereik van het analoge signaal 2, 0 is, dan is het minimuminterval tussen digitale signalen 2/2^8 = 2/256 = 1/128;
op dezelfde manier is het monsternummer 16, dus het minimale interval tussen digitale signalen is 2/256/256=1/(128*256)

Bijvoorbeeld
, het spanningsbereik dat door de audiosensor wordt verzameld, is 0-3,3 V en het bemonsteringsnummer is 8 bit (bit)
, dat wil zeggen, we nemen 3,3 V / 2 ^ 8 = 0,0128 als kwantisatieprecisie.
We verdelen 3,3v in 0,0128 als de Y-asstap, zoals weergegeven in figuur 3, 1 2 … 8 wordt 0 0,0128 0,0256 … 3,3 V. Door
De spanningswaarde van een bemonsteringspunt is bijvoorbeeld 1,652V (128 * 0,128 en 129 * 0,128), we ronden deze af op 1,65V, wat overeenkomt met een kwantisatieniveau van 128.

Audiocoderingsformaat deel 2

audio encoding

In 1950 vroeg Bell Labs een patent aan op Differential Pulse Code Modulation (DPCM). In 1973 introduceerden P. Cummiskey, Nikil S. Jayant en James L. Flanagan van Bell Labs Adaptive DPCM (ADPCM).

AUDIO ENCODING

Perceptuele codering werd voor het eerst gebruikt voor compressie van spraakcodering met lineaire voorspellende codering (LPC). Het oorspronkelijke concept van LPC dateert uit het werk van Fumitada Itakura (Nagoya University) en Saito Saito (Telegraph and Telephone in Japan) in 1966. In de jaren zeventig ontwikkelden Bishnu S. Atal en Manfred R. Schroeder van Bell Labs een vorm van adaptieve voorspellende codering (APC) genaamd LPC, een perceptueel coderingsalgoritme dat gebruikmaakte van de maskerende eigenschappen van het menselijk oor, en later in 1980 verscheen het Code Excited Linear Prediction (CELP)-algoritme in het begin van de jaren negentig, dat destijds opmerkelijke compressiesnelheden bereikte . Perceptuele codering wordt gebruikt door moderne audiocompressieformaten zoals MP3 en AAC.

Discrete Cosine Transform (DCT) door Nasir Ahmed, T. Ontwikkeld door Natarajan en KR Rao in 1974, vormt de basis voor de Modified Discrete Cosine Transform (MDCT) die wordt gebruikt door moderne audiocompressieformaten zoals MP3 en AAC. TCMD door JP Princen, A.W. Johnson en AB Bradley in 1987, volgend op eerder werk van Princen en Bradley in 1986. MDCT wordt gebruikt door moderne audiocompressieformaten zoals Dolby Digital, MP3 en Advanced Audio Coding (AAC).

lijst met formaten met verlies
algemeen
Audio Coding Standard Basic Compression Algorithm afkorting introductie Marktaandeel (2019) Verwijzen naar:
Gemodificeerde discrete cosinustransformatie (MDCT) Dolby Digital (AC-3) AC3 1991 58%
ATRAC 1992 Onbekend Adaptive Transformation Vocoding
MPEG-laag 3 MP3 1993 49%
Geavanceerde audiocodering (MPEG-2/MPEG-4) CAA 1997 88%
Windows Media Audio WMA 1999 onbekend
Ogg Vorbis-vijzel 2000 7%
Celtic Restricted Power Overlay Transformation 2011 is niet van toepassing
werk werk 2012 8%
digitaal naar analoog converter digitaal naar analoog converter 2015 onbekend
Adaptieve differentiële pulscodemodulatie (ADPCM) aptX / aptX-HD aptX 1989 onbekend
DTS digitaal bioscoopsysteem 1990 14%
Master of Quality Certification Quality Management Association 2014 onbekend
Subbandcodering (SBC) Audiolaag MPEG-1 II MP2 1993 onbekend
musepack MPC 1997
praat
Nadere informatie: Spraakcodering
Lineaire voorspellende codering (LPC)
Adaptieve voorspellende codering (APC)
Code opgewonden lineaire voorspelling (CELP)
Algebraïsche code opgewonden lineaire voorspelling (ACELP)
Ontspanningscode opgewonden lineaire voorspelling (RCELP)
Lage latentie CELP (LD-CELP)
Adaptief Multitarief (voor GSM en 3GPP)
Codec2 (beroemd vanwege het ontbreken van patentbeperkingen)
Speex (beroemd vanwege het ontbreken van octrooibeperkingen)
Gemodificeerde discrete cosinustransformatie (MDCT)
AAC-LD
Contrained Energy Superposition Transformation (CELT)
Opus (voornamelijk voor realtime toepassingen)