Digitale audiocodering

Free Download Mp4Gain

We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE

THIS PRICE ONLY LASTS FOR A FEW DAYS

Digitale audiocodering

Digital audio encoding

In feite is deze of gene digitale vorm van weergave van analoge audiosignalen al een coderingsmethode. – een reeks cijfers die een analoog audiosignaal beschrijft, is zelf een digitale code.

Digitl Audio Encoding

De codering waarover we het nu gaan hebben, is echter iets anders. Laten we nu eens kijken naar de methoden voor het coderen van digitale audiosignalen.
Een gedigitaliseerd audiosignaal “in zijn pure vorm” (bijvoorbeeld in de vorm van een van de PCM-variaties die hierboven zijn besproken) is een redelijk nauwkeurige, maar niet de meest compacte manier om het originele analoge signaal op te nemen.

Oordeel zelf. Om volledige informatie te krijgen over het originele analoge signaal in het frequentiebereik 0-20 kHz (in het hoorbare frequentiebereik), moet het analoge signaal worden bemonsterd met een frequentie van minimaal 40 kHz. Zo stelt de CD-DA-standaard (de standaard voor het opnemen van gegevens op audio-cd’s die iedereen kent) de volgende coderingsparameters vast: opname van twee of één kanaal in PCM-formaat met een bemonsteringsfrequentie van 44,1 kHz en een diepte 16-bits kwantiseringsbits. Een uur muziek in dit formaat kost ongeveer 600 MB (60 minuten * 60 seconden * 2 kanalen * 44100 samples per seconde * 2 bytes per sample = ongeveer 605 MB). Als je bedenkt dat de muziekcollectie van een gewone muziekliefhebber bijvoorbeeld 5000 nummers heeft met een gemiddelde lengte van ongeveer 3 minuten, is de hoeveelheid geheugen die nodig is om het in zijn oorspronkelijke digitale vorm op te slaan erg indrukwekkend. . Daarom vereist het opslaan van relatief grote hoeveelheden audiogegevens, waardoor een redelijk goede geluidskwaliteit wordt gegarandeerd, het gebruik van verschillende “trucs” om de gegevens te comprimeren.

In het algemeen kunnen alle bestaande methoden voor het coderen van audio-informatie voorwaardelijk worden onderverdeeld in slechts twee typen.

1. Lossless datacompressie (‘Lossless encoding’) is een methode voor het coderen (comprimeren) van digitale audio-informatie, waarmee honderd procent herstel van de originele data uit de gecomprimeerde stream (de term ‘data Origineel ‘betekent hier de oorspronkelijke vorm van de gedigitaliseerde audiogegevens). Deze methode van datacompressie wordt gebruikt in gevallen waarin honderd procent absoluut behoud van de kwaliteit van de originele audiogegevens vereist is. Lossless compressie-algoritmen die tegenwoordig bestaan, kunnen het datavolume dat wordt ingenomen met 20-50% verminderen en tegelijkertijd een 100% herstel van het originele digitale materiaal van de gecomprimeerde data garanderen. De bedieningsmechanismen van dergelijke encoders zijn vergelijkbaar met de bedieningsmechanismen van algemene gegevensarchiveerders, zoals ZIP of RAR, maar tegelijkertijd zijn ze speciaal aangepast om audiogegevens te comprimeren … Lossless codering Hoewel het ideaal is om de kwaliteit van audiomateriaal te behouden, kan het geen hoog compressieniveau bieden.

2. Er is nog een modernere vorm van gegevensverdichting. Deze zogenaamde lossy datacompressie (Engl. “Lossy encoding”) Het doel van codering is om met alle middelen de hoogste datacompressiesnelheid te bereiken terwijl de geluidskwaliteit op een acceptabel niveau wordt gehouden. Het idee achter lossy-codering is gebaseerd op twee eenvoudige onderliggende overwegingen:

originele digitale audiogegevens zijn overbodig: ze bevatten veel onnodige informatie die nutteloos is voor het oor, die kan worden verwijderd, waardoor de compressieverhouding toeneemt;
Vereisten voor de geluidskwaliteit van audiomateriaal kunnen variëren en zijn afhankelijk van specifieke doeleinden en toepassingsgebieden.
Lossy-codering wordt daarom “lossy” genoemd, wat resulteert in het verlies van een deel van de audio-informatie. Een dergelijke codering leidt ertoe dat het gedecodeerde signaal, wanneer het wordt gereproduceerd, hetzelfde klinkt als het origineel, maar in werkelijkheid niet langer identiek is. De meeste coderingsmethoden met verlies zijn afhankelijk van het gebruik van psycho-akoestische eigenschappen van het menselijke gehoorsysteem, evenals van verschillende trucs die verband houden met het opnieuw bemonsteren en opnieuw bemonsteren van het signaal. In frequentie analyseert de encoder tijdens het compressieproces de audiogegevens om verschillende details van het geluid te identificeren die kunnen worden genegeerd. Verkapte frequenties, onhoorbare en onhoorbare geluidsdetails kunnen worden opgeofferd voor een hogere compressieverhouding. Daar waar alleen de verstaanbaarheid belangrijk is in geluid (bijvoorbeeld in telefonie, waar de aanwezigheid van frequenties boven 4 kHz niet nodig is), wordt de audio-informatie in het coderingsproces ernstig “vereenvoudigd”.

Free Download Mp4Gain

Waarom kan het verschil in bitrate het geweldig laten klinken (hoog, gemiddeld, laag)?

Waarom kan het verschil in bitrate het geweldig laten klinken (hoog, gemiddeld, laag)?

Bit Depth vs. Bit Rate

Antwoord:
Om er zeker van te zijn dat dit duidelijk is, laten we differentiëren

BIT RATE BIT DEPTH

samplefrequentie versus bitdiepte

zoveel als

Bitsnelheid

hoe ze zich verhouden tot audio in het digitale domein …

Bemonsteringsfrequentie:

De samplefrequentie wordt gespecificeerd als een frequentie (samples per seconde), bijvoorbeeld 44,1 kHz voor CD. Andere veelgebruikte waarden zijn 48, 88,2, 96, 176,4 en 196 kHz, hoewel sommige indelingen (zoals DSD) bemonsteringsfrequenties hebben die hoger zijn dan 2,8 MHz. De bemonsteringsfrequentie geeft aan

hoe vaak het audiosignaal wordt gemeten

Hoewel sommige mensen lagere waarden zien als een gelaagde staafdiagram, bekijk ik ze liever als een onderliggende bitmap. Als je de omtrek van een paard neemt en het vereenvoudigt tot 20 punten zodat het kind verbinding kan maken, is het niet zozeer dat je met stappen eindigt (het gebruik van rechte en gebogen lijnen om 20 correct geplaatste punten te verbinden kan leiden tot een fatsoenlijk figuur), maar dat zal niet gebeuren zonder subtiliteit. Terwijl je met 200 (of 2000) punten de golvende strengen langs de manen van het paard zou kunnen benaderen.

Bij audio maakt een lagere samplefrequentie het geluid niet “slecht” (bijv. Vaag, vaag of vervormd), maar beperkt eerder de maximale frequentie (toonhoogte) die kan worden opgenomen / afgespeeld zoals bedoeld.

Formule van de Nyquist-stelling

, De bemonsteringsfrequentie van 44,1 kHz is gekozen voor CD omdat het frequenties tot 20 kHz kan opnemen en afspelen. Om een gesproken woord op te nemen (zoals een toespraak, een preek of een audioboek), zou het moeilijk zijn om een veel lagere samplefrequentie te detecteren, aangezien de menselijke stem steeds minder harmonische informatie heeft boven 10 kHz.

Dieptebits:

Gezien het feit dat de bemonsteringsfrequentie bepaalt hoe

vaak

audiosignaal wordt gemeten, bitdiepte geeft aan

schaal nauwkeurigheid

Omdat we het hebben over digitale audio, beschrijven we deze meetschaal in bits, waarbij elke bit 0 of 1 is, en we voegen een bepaald aantal ervan samen om de waarde weer te geven. Als we 8 bits hebben, zijn er 256 mogelijke numerieke waarden, inclusief nul. Met 16 bits zijn er 65.536 mogelijke waarden. Een 24-bits register kan 16.777.216 waarden gebruiken.

Wanneer we analoge audio converteren naar digitale weergave (A-naar-D) en vice versa (D-naar-A), vinden we interessante wiskundige verbanden. Elke bit (digitaal) verdubbelt het aantal mogelijke waarden … En een verdubbeling van de amplitude (ongeveer 4 keer het vermogen) van de geluidsgolf (analoog) komt overeen met + 6 dB luidheid. Daarom kunnen we het maximale dynamische bereik * van een digitale opname schatten op 6 dB / bit. Daarom heeft 8-bits opname ~ 48 dB dynamisch bereik, 16-bits opname (zoals een cd) heeft ~ 96 dB en 24-bits opname heeft ~ 144 dB.

* Voor degenen onder u die niet bekend zijn met deze term: dynamisch bereik beschrijft in feite het verschil tussen de zachtste en luidste geluidsgolven die kunnen worden opgenomen / afgespeeld. De cd heeft een verschil van ongeveer 96 dB, wat kan worden gebruikt om de meest subtiele pauze weer te geven in vergelijking met de ongelooflijk luide uitbarsting van het kanon op de climax van Tsjaikovski.

1812 Ouverture

Drie korte opmerkingen voor diegenen die geïnteresseerd zijn in het verdiepen van het ritme …

Er is een formule voor het werkelijke dynamische bereik van een digitale opname die enigszins kan afwijken van de vorige schatting, maar het is een vrij minimale afwijking, dus een schatting van 6 dB / bit is wat je normaal tussen aanhalingstekens ziet.
De nieuwste 32-bits drijvende-kommaweergave combineren een 24-bits getal en een 8-bits exponent om veel meer mogelijke waarden te vertegenwoordigen dan 24-bits registers. De schatting van het dynamische bereik wordt een beetje dubieus, maar het is voldoende om te zeggen dat het ruim boven de 144 dB ligt.
Als je een lagere bitdiepte gebruikt, terwijl je misschien denkt in termen van warp-plug-ins met namen als “bit-grinder”, hoeft het niet “slecht” te klinken (bijv. Vaag, vaag of vervormd), maar vertegenwoordigt een verminderd dynamisch bereik. Maar aangezien een 16-bits opname met een dynamisch bereik van 96 dB (65.536 numerieke waarden) niet kan worden weergegeven in 8 bits (48 dB en 256 numerieke waarden), om de bitdiepte van de reeds gedigitaliseerde audio te verminderen, wiskundige correctie van de cijfers naar beneden. (bijvoorbeeld 65535 wordt 255) met behulp van een compressor of limiter, waardoor de zachtste opnamebits verloren kunnen gaan, zodat het verschil tussen zachte en luide delen <48 dB is. Zonder een dergelijk schema zal de transformatie leiden tot clipping (numerieke waarden boven het maximum),
Bitsnelheid:

Bij digitale audio is de bitsnelheid een maat voor

hoeveel bits worden per seconde verzonden / verwerkt

Voordelen van “digitale audio”

Voordelen van “digitale audio”

Digital Audio

Het gedigitaliseerde audiosignaal heeft de volgende voordelen:

DIGITAL AUDIO

-de mogelijkheid van oneindig lange opslag zonder verlies van originele kwaliteit,

-de mogelijkheid om lange tijd te reproduceren zonder de originele kwaliteit te verliezen,

-de mogelijkheid tot oneindige reproductie zonder verlies van originele kwaliteit,

-eenvoud en brede mogelijkheden van verwerking met moderne middelen,

– Weerstand tegen interferentie in signaaltransmissielijnen.

Van cd tot super audio-cd en dvd-audio

CD (Compact Disk) is een soort verwijderbare plastic schijf waarop informatie optisch wordt gelezen.

In 1979 stelden Sony en Philips de Red Book-standaard voor digitale audio-opnamen voor.

Analoog geluid wordt gedigitaliseerd en opgenomen als een spiraalvormig spoor van afwisselend nullen en enen (micron gaatjes en een glad oppervlak) op een 12 cm dikke polycarbonaat schijf, iets dikker dan een millimeter, bedekt met de dunnere laag goud (later aluminium).

De laser van de speler verlicht de schijf en detecteert binaire “nullen” en “enen”, die na verwerking weer worden omgezet in geluid. Het is bijna onmogelijk om nul voor één te verwarren. Mogelijke problemen in verband met leesfouten en krassen op het schijfoppervlak werden gecompenseerd met digitale foutcorrectie.

Als gevolg hiervan namen niet alleen de fysieke afmetingen van de platenhouder af in vergelijking met vinylplaten, maar nam ook de muzikale capaciteit aanzienlijk toe: tot 74 minuten (de toenmalige eigenaar van Sony wilde dat zijn favoriete Beethoven Negende Symfonie in een schijf).

In 1982 begon in Langenhagen (Duitsland) de massaproductie van compact discs (cd’s) met de “Alpine Symphony” van I. Strauss.

Echt

Hoogwaardige audio wordt nu opgenomen in Super Audio CD- en DVD-audioformaten, die:

gebruik een dvd-media,

gebruik meerkanaals opname (tot 5.1),

bemonsteringsfrequentie tot 192 kHz,

kwantisatieniveau: tot 24 bits (elke bit verdubbelt de precisie van de geluidsoverdracht en bij een dergelijke kwantisatiediepte kan het dynamische bereik van de gereproduceerde geluiden meer dan 130 dB bedragen).

De nieuwe opnameformaten bieden de hoogste kwaliteit, zijn duur ($ 15 per schijf) en zijn niet populair omdat de meeste luisteraars helaas niet al te veel geven om de geluidskwaliteit.

Digitale audio-opties

De belangrijke parameters van de digitale weergave van geluid zijn de samplefrequentie van de audiosignalen en de kwantisering van bits.

Kwantiseringssnelheden geven aan hoeveel keer per seconde een signaal wordt bemonsterd (gemeten in amplitude) voor conversie naar digitale code.
Voor CD-standaard is dit 44 KHz (44 duizend keer per seconde), voor SACD 192 KHz

De kwantiseringsbit karakteriseert het aantal signaalstappen en wordt gemeten door de macht van 2.

Voor de cd-standaard worden 16-bits audioadapters gebruikt, die 65.536 kwantiseringsstappen hebben (2 tot de 16 vermogens), zoals bij een audio-cd. Voor standaard en 24-bits SACD.

Digitale audio-opslag

Over het digitaliseren van geluid heeft een reeks signaalamplitudewaarden die met regelmatige tussenpozen worden genomen en kunnen worden weggeschreven naar bestandsvolgnummers (amplitudewaarden).

Twee methoden worden veel gebruikt om audio-informatie te coderen:

PCM (pulscodemodulatie)

ADPCM (Adaptive Relative Pulse Code Modulation)

PCM (Pulse Code Modulation) is een methode om een signaal digitaal te coderen door de absolute waarden van de amplitudes op te nemen. Dit is hoe gegevens worden opgenomen op alle audio-cd’s.

ADPCM (Adaptive Delta PCM) – Registreert signaalwaarden in relatieve amplitudeveranderingen (incrementen), waardoor u gegevens kunt vereenvoudigen om minder geheugen in te nemen.

Lossless-codering (voor verliesvrije gegevens odirovanie) maakt gegevensherstel mogelijk van een volledig gecomprimeerde (20-50%) stream.

Populaire L ossless coderingsalgoritmen:

Windows Wave (WAV) is het primaire audiobestandsformaat voor Windows.
Het Audio Interchange File Format (AIFF) is het primaire audioformaat voor de Macintosh.

L ossy-codering (lossy data-codering) stelt u in staat om een klankgelijkenis te bereiken van het gereconstrueerde signaal met het origineel met de hoogst mogelijke datacompressie (10-1 5 keer).

De basis van lossy-encoders is het gebruik van psychoakoestische modellen: bepaalde delen van het signaal, in bepaalde frequentiebereiken die onhoorbaar zijn voor het menselijk oor, nuances (gemaskeerde of onhoorbare frequenties) en treden op om ze uit het oorspronkelijke signaal te elimineren.

Analoge audio en digitale audio

Analoge audio en digitale audio

Analog vs Digital Audio

Een geluidsgolf is een soort complexe functie, de afhankelijkheid van de amplitude van een geluidsgolf in de tijd.

Analog Audio vs. Digital Audio

De informatie in de akoestische golf wordt niet bepaald door de parameters van het medium waarin de elastische golf zich voortplant, en de oscillatieparameters (amplitude en frequentie, toon en harmonischen).

Elke vorm van opname (mechanisch en Skye, magnetisch, optisch, laser) is gebaseerd op de eerdere omzetting van de geluidsgolf in een elektrische wisselstroom met dezelfde parameters van de oscillaties (via microfoon).

Analoog geluid wordt op het apparaat weergegeven als een continu elektrisch signaal.

De geluidskwaliteit is afhankelijk van de getrouwheid van de golfvorm, die erg moeilijk te handhaven is.

Tot 1982 consumeerde de wereld ‘ingeblikte muziek’ alleen van analoge media: vinylplaten en magneetbanden.

Goede vinylplaten, gespeeld met goede apparatuur, boden een uitstekende geluidskwaliteit, die helaas bij elke luisterbeurt een beetje verslechterde als gevolg van mechanische slijtage toen de stylus langs de geluidsgroef en in de stof dat alles doordrong.

Bandrecorders vereisten nauwkeurige leeskoppen en hoge banddoorvoersnelheden om soepel te kunnen reproduceren. Na verloop van tijd werd de tape gedemagnetiseerd, de magnetische laag brokkelde af.

Maar het grootste nadeel van analoge audio-opnames is het onvermijdelijke kwaliteitsverlies bij het kopiëren.

Het mysterie van trigonometrie

Volgens de theorie van de wiskundige Jean Baptiste Fourier kan een geluidsgolf worden weergegeven als een spectrum van frequenties die erin zijn opgenomen.

De frequentiecomponenten van het spectrum zijn sinusvormige oscillaties (zuivere tonen), die elk hun eigen amplitude en frequentie hebben.

Volgens de stelling van Kotelnikov kan elke trilling, zelfs de meest complexe vorm (bijvoorbeeld een menselijke stem), ondubbelzinnig en zonder verlies worden hersteld van de afzonderlijke monsters die zijn genomen met een frequentie die gelijk is aan de verdubbelde maximale frequentie.

Vladimir Aleksandrovich Kotelnikov (1908-2005) – een prominente Sovjet- en Russische wetenschapper op het gebied van radiotechniek, radiocommunicatie en radioastronomie.

Observatie. Het signaal van eindige duur heeft een oneindig breed spectrum. Wanneer een signaal met een eindige duur wordt bemonsterd, is het daarom onmogelijk om het uit de monsters te herstellen zonder kwaliteitsverlies.

Digitalisering van audio-informatie

De digitalisering van geluid is de registratie van de amplitude van het signaal met bepaalde intervallen en de registratie van de verkregen amplitudewaarden in de vorm van afgeronde digitale waarden.
Elke computer heeft een moederbord, een audio-adapter (geluidskaart).

Geluidskaarten zijn onder meer: ADC (analoog naar digitaal converter), synthesizer, mixer, DAC (digitaal naar analoog converter) versterkers, MIDI-interfacepoort voor spelapparaten.

Om digitaal geluid op te nemen, produceert de ADC:

tijdelijke bemonstering van een continu signaal (bepaalt de waarde van de amplitude van het signaal met de frequentie die nodig is om de oorspronkelijke vorm opnieuw te creëren = tweemaal de maximale frequentie van de geluidsgolf);

kwantisering door de niveaus van de gemeten signaalwaarden (bepaalt het aantal vaste waarden (niveaus, gradaties) van de amplitude van het signaal);

signaalcodering (schrijven in een binair getalsysteem).

De omgekeerde bewerking wordt uitgevoerd door de DAC (digitaal naar analoog omzetter).

Bitrate

Bitsnelheid (bitsnelheid): letterlijk stukjes informatie over de transmissiesnelheid.

De bitsnelheid is de effectieve transmissiesnelheid van informatie via het kanaal (de transmissiesnelheid van “nuttige informatie”, naast de service-informatie) uitgedrukt in kilobits per seconde (kilobits per seconde, kbps).

In compressie-video- en audiotransmissieformaten met verlies, drukt de bitrate-parameter de mate van compressie van de stream uit en bepaalt dus de grootte van het kanaal waarvoor de datastroom wordt gecomprimeerd.

P-modus compressie datastroom:

met constante bitsnelheid (constante bitsnelheid, CBR) – De vereiste bitsnelheid is aanvankelijk ingesteld, maar verandert niet in het hele bestand. Het maakt het mogelijk om de uiteindelijke bestandsgrootte vrij nauwkeurig te voorspellen, maar het biedt geen optimale verhouding tussen grootte en kwaliteit voor muziekwerken, waarvan het geluid in de loop van de tijd dynamisch verandert.

met variabele bitsnelheid (VBR): de codec verandert de waarde van de bitsnelheid op basis van het gewenste kwaliteitsniveau volgens het psychoakoestische model. Het biedt de beste kwaliteit van het uitvoerbestand, maar de grootte is onvoorspelbaar (het kan verschillende keren verschillen).

met een gemiddelde bitsnelheid (ABR): een hybride van constante en variabele bitsnelheden: de gebruiker stelt de bitsnelheid in kbit / s in en het programma varieert deze binnen bepaalde grenzen.