Audiocodering deel 3

Free Download Mp4Gain

We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE

THIS PRICE ONLY LASTS FOR A FEW DAYS

Audiocodering deel 3

Audio Coding

stromingskenmerken:

Met de ontwikkeling van internet hebben mensen eisen gesteld om online naar muziek te luisteren, dus het is ook vereist dat het audiobestand tijdens het lezen kan worden afgespeeld, zonder het hele bestand te hoeven lezen en vervolgens af te spelen, zodat luisteren is kan bereiken zonder te downloaden. Het kan ook worden gedaan tijdens het coderen en spelen. Het is deze functie waarmee u live online kunt uitzenden en het opzetten van uw eigen digitale radiostation een realiteit is geworden.
Transmissie classificatiecode:
Volgens verschillende coderingsmethoden worden audiocoderingstechnieken onderverdeeld in drie typen: golfvormcodering, parametrische codering en hybride codering. Over het algemeen heeft golfvormcodering een hoge spraakkwaliteit, maar de coderingssnelheid is ook hoog; parametrische codering heeft een zeer lage coderingssnelheid en de kwaliteit van de resulterende gesynthetiseerde spraak is niet hoog; hybride codering maakt gebruik van parametrische coderingstechnologie en golfvormcoderingstechnologie, coderingssnelheid en geluidskwaliteit onder hen.
1. Golfvormcodering:
Golfvormcodering verwijst naar het direct omzetten van het tijddomeinsignaal in een digitale code zonder gebruik te maken van parameters van het gegenereerde audiosignaal, zodat de gereconstrueerde spraakgolfvorm zo consistent mogelijk is met de golfvorm van het oorspronkelijke spraaksignaal. Het basisprincipe van golfvormcodering is om het analoge spraaksignaal met een bepaalde snelheid op de tijdas te bemonsteren en vervolgens de amplitudemonsters hiërarchisch te kwantiseren en ze met codes weer te geven.
De golfvormcoderingsmethode is eenvoudig, gemakkelijk te implementeren, sterk in aanpassingsvermogen en goed in spraakkwaliteit. Omdat de compressiemethode echter eenvoudig is, heeft deze ook enkele problemen: de compressieverhouding is relatief laag, wat resulteert in een hogere coderingssnelheid. Over het algemeen is de complexiteit van golfvormcodering relatief laag en is de coderingssnelheid relatief hoog. Over het algemeen is de audiokwaliteit vrij hoog wanneer de coderingssnelheid hoger is dan 16 kbit/s. Wanneer de codeersnelheid lager is dan 16 kbit/s, wordt de geluidskwaliteit drastisch verminderd.
De eenvoudigste golfvormcoderingsmethode is PCM (Pulse Code Modulation), die alleen het spraaksignaal bemonstert en kwantiseert. De voordelen zijn dat de coderingsmethode eenvoudig is, de vertragingstijd kort is, de geluidskwaliteit hoog is en het gereconstrueerde spraaksignaal bijna niet te onderscheiden is van het originele spraaksignaal. Het nadeel is dat de codeersnelheid relatief hoog is (64 kbit/s) en gevoeliger is voor fouten in het transmissiekanaal.
2. Parametercodering:
Parametrische codering bestaat uit het extraheren van de parameters van de gegenereerde spraak uit het spraakgolfvormsignaal en het gebruiken van deze parameters om de spraak te reconstrueren via het spraakgeneratiemodel, zodat het gereconstrueerde spraaksignaal de semantiek van het oorspronkelijke spraaksignaal zoveel mogelijk kan behouden. . Dat wil zeggen, de parametercodering is gebaseerd op het digitale model dat wordt gegenereerd door het spraaksignaal, en dan worden de modelparameters verkregen uit het digitale model, en dan wordt het digitale model hersteld volgens deze parameters, en dan de gesprekken.
De coderingssnelheid van parametrische codering is laag, die 2,4 kbit/s kan bereiken. Het gegenereerde spraaksignaal wordt hersteld met behulp van het gevestigde digitale model. Daarom kan de golfvorm van het gereconstrueerde spraaksignaal behoorlijk verschillen van de golfvorm van het oorspronkelijke spraaksignaal. De vervorming zal groter zijn EN vanwege de beperkingen van het spraakgeneratiemodel zal het verhogen van de datasnelheid de kwaliteit van de gesynthetiseerde spraak niet verbeteren. Hoewel de geluidskwaliteit van de parametercodering relatief laag is, is de vertrouwelijkheid erg goed en wordt deze in het leger gebruikt. Een typische parametercoderingsmethode is LPC (Linear Predictive Coding).
3. Gemengde codering
Hybride codering verwijst naar het gelijktijdige gebruik van twee of meer coderingsmethoden voor codering. Deze coderingsmethode overwint de zwakte van golfvormcodering en parametrische codering, en combineert de hoge kwaliteit van golfvormcodering en de lage coderingssnelheid van parametrische codering, en kan betere resultaten behalen.

Free Download Mp4Gain

Audiocodering deel 2

Audio Coding

Redenen om audiocompressietechnologie te gebruiken.

audio coding

Het is heel eenvoudig om de bitsnelheid van een PCM-audiostream te berekenen, de waarde van de samplefrequentie × de waarde van de samplegrootte × het aantal bps van het kanaal. Een WAV-bestand met een samplefrequentie van 44,1 KHz, een samplegrootte van 16 bits en tweekanaals PCM-codering heeft een datasnelheid van 44,1 K×16×2 = 1411,2 Kbps. Meestal zeggen we dat 128K MP3, de bijbehorende WAV-parameter , is dit 1411,2 Kbps, deze parameter wordt ook wel databandbreedte genoemd, het is een begrip met de bandbreedte in ADSL. Deel de bitsnelheid door 8 om de gegevenssnelheid voor deze WAV te krijgen, die 176,4 KB/s is. Dit betekent het opslaan van een samplefrequentie van 1 seconde van 44,1 KHz, een 16-bits samplegrootte en een tweekanaals PCM-gecodeerd audiosignaal, waarvoor 176,4 KB aan ruimte nodig is, wat ongeveer 10,34 M in 1 minuut is, wat onaanvaardbaar is . Voor de meeste gebruikers, vooral vrienden die graag naar muziek luisteren op de computer, zijn er slechts twee manieren om het schijfgebruik te verminderen of te comprimeren. Het verlagen van de index is niet aan te raden, daarom hebben experts verschillende compressieschema’s ontwikkeld. Vanwege verschillende toepassingen en doelmarkten zijn de geluidskwaliteit en compressieverhouding die worden bereikt door verschillende audiocompressiecoderingen verschillend, en we zullen ze één voor één vermelden in de volgende artikelen. Eén ding is zeker, ze zijn allemaal gecomprimeerd.
Frequentie versus bemonsteringsfrequentie
De bemonsteringsfrequentie vertegenwoordigt het aantal keren dat het oorspronkelijke signaal per seconde wordt bemonsterd. De samplefrequentie van de meeste audiobestanden die we regelmatig zien is 44,1 KHz. Wat betekent dit? Stel dat we 2 segmenten sinusgolfsignalen hebben, respectievelijk 20 Hz en 20 KHz, die elk een seconde duren, om overeen te komen met de laagste en hoogste frequenties die we kunnen horen, en we nemen monsters van deze twee signalen op respectievelijk 40 KHz. , dan kunnen we krijgen wat soort resultaat? Het resultaat is: het 20 Hz-signaal wordt 40K/20=2000 keer per trilling gesampled, terwijl het 20K-signaal slechts 2 keer per trilling wordt gesampled. Het is duidelijk dat bij dezelfde samplefrequentie de laagfrequente informatie veel gedetailleerder is dan de hoogfrequente informatie. Dit is ook de reden waarom sommige audiofielen cd’s ervan beschuldigen dat digitaal geluid niet echt genoeg is, en 44,1 kHz cd-sampling kan niet garanderen dat hoogfrequente signalen goed worden opgenomen. Om hoogfrequente signalen beter op te nemen, lijkt een hogere samplefrequentie nodig te zijn, dus sommige mensen gebruiken een 48KHz-samplefrequentie bij het opnemen van audiotracks van cd’s, wat ongewenst is! Eigenlijk is dit niet goed voor de geluidskwaliteit. Voor de ripsoftware is het behouden van dezelfde samplefrequentie als de 44,1 KHz die door de cd wordt geleverd, een van de garanties voor de beste geluidskwaliteit, in plaats van deze te verbeteren. Een hogere samplefrequentie is alleen nuttig voor analoge signalen. Als het signaal dat wordt gesampled digitaal is, probeer dan niet de samplefrequentie te verhogen.

Audiocodering

Audio Coding

Bemonsteringsfrequentie en steekproefomvang
Geluid is eigenlijk een soort energiegolf, dus het heeft ook de kenmerken van frequentie en amplitude, waarbij de frequentie overeenkomt met de tijdas en de amplitude overeenkomt met de niveau-as.

Advanced Audio Coding

De golf is oneindig glad en de ketting kan worden beschouwd als opgebouwd uit ontelbare punten. Omdat de opslagruimte relatief beperkt is, moeten in het proces van digitale codering de punten van de keten worden bemonsterd. Het bemonsteringsproces bestaat uit het extraheren van de frequentiewaarde van een bepaald punt. Het is duidelijk dat hoe meer punten er in één seconde worden geëxtraheerd, hoe rijker de frequentie-informatie die kan worden verkregen. Om de golfvorm te herstellen, moeten er twee bemonsteringspunten in één trilling zijn. De hoogste frequentie die kan worden gevoeld is 20 kHz, dus om aan de gehoorvereisten van het menselijk oor te voldoen, zijn ten minste 40k monsters per seconde vereist, uitgedrukt in 40 kHz, en deze 40 kHz zijn de bemonsteringsfrequentie. Onze gewone cd heeft een samplefrequentie van 44,1 kHz. Het is niet voldoende om alleen frequentie-informatie te hebben, we moeten ook de energiewaarde van deze frequentie verkrijgen en kwantificeren om de sterkte van het signaal weer te geven. Het aantal kwantisatieniveaus is een geheel getal van 2, en de steekproefomvang van onze gewone CD-bit is 16 bits, dat wil zeggen 2 tot de macht 16. De steekproefomvang is moeilijker te begrijpen dan de frequentie. het lijkt abstract. Stel bijvoorbeeld dat een golf 8 keer wordt gesampled en de energiewaarden die overeenkomen met de steekproefpunten A1-A8 zijn, maar gebruik alleen een steekproefomvang van 2 bits, met als resultaat dat we alleen de waarden van 4 punten kunnen behouden in A1 -A8 en gooi de andere 4 weg. Als we de steekproefomvang van 3bit gebruiken, wordt alle informatie van 8 punten geregistreerd. Hoe hoger de bemonsteringsfrequentie en de bemonsteringsgrootte, hoe dichter de opgenomen golfvorm bij het oorspronkelijke signaal ligt.
lossy en lossless
Volgens de samplefrequentie en samplegrootte kan het bekend zijn dat in vergelijking met het natuurlijke signaal, de audiocodering hoogstens oneindig dichtbij kan zijn, althans de huidige technologie kan dit alleen doen. In vergelijking met het natuurlijke signaal is elk digitaal audiocoderingsschema verliesgevend omdat het niet volledig kan worden hersteld. In computertoepassingen kan PCM-codering het hoogste niveau van betrouwbaarheid bereiken, dat veel wordt gebruikt voor materiaalbehoud en muziekwaardering. Het wordt gebruikt op cd’s, dvd’s en onze gewone WAV-bestanden. Daarom is PCM volgens afspraak lossless codering geworden, omdat PCM het beste niveau van getrouwheid in digitale audio vertegenwoordigt, het betekent niet dat PCM de absolute getrouwheid van het signaal kan garanderen, en PCM kan in grotere mate alleen oneindig dichtbij zijn. Meestal nemen we MP3 op in de categorie van audiocodering met verlies, wat relatief PCM-codering is. Het doel van het benadrukken van de relativiteit van lossy en lossless codering is om iedereen te vertellen dat het moeilijk is om echte lossless te bereiken, net zoals het uitdrukken van pi met getallen, hoe hoog de precisie ook is, het is oneindig dichtbij, niet echt gelijk aan pi-waarde.
Redenen om audiocompressietechnologie te gebruiken
Het is heel eenvoudig om de bitsnelheid van een PCM-audiostream te berekenen, de waarde van de samplefrequentie × de waarde van de samplegrootte × het aantal bps van het kanaal. Een WAV-bestand met een samplefrequentie van 44,1 KHz, een samplegrootte van 16 bits en tweekanaals PCM-codering heeft een datasnelheid van 44,1 K×16×2 = 1411,2 Kbps. Meestal zeggen we dat 128K MP3, de bijbehorende WAV-parameter , is dit 1411,2 Kbps, deze parameter wordt ook wel databandbreedte genoemd, het is een begrip met de bandbreedte in ADSL. Deel de bitsnelheid door 8 om de gegevenssnelheid voor deze WAV te krijgen, die 176,4 KB/s is. Dit betekent het opslaan van een samplefrequentie van 1 seconde van 44,1 KHz, een 16-bits samplegrootte en een tweekanaals PCM-gecodeerd audiosignaal, waarvoor 176,4 KB aan ruimte nodig is, wat ongeveer 10,34 M in 1 minuut is, wat onaanvaardbaar is . Voor de meeste gebruikers, vooral vrienden die graag naar muziek luisteren op de computer, zijn er slechts twee manieren om het schijfgebruik te verminderen of te comprimeren.

AAC-beschrijving:

AAC

AAC is een afkorting voor Advanced Audio Coding, dat in 1997 verscheen en oorspronkelijk een technologie voor audiocodering was op basis van MPEG-2. Mede ontwikkeld door Fraunhofer IIS, Dolby Laboratories, AT&T, Sony en andere bedrijven om het MP3-formaat te vervangen.

AAC - Advanced Audio Codec

In 2000 werd de MPEG-4-standaard geïntroduceerd en AAC re-integreerde andere technologieën (PS, SBR) Om het te onderscheiden van de traditionele MPEG-2 AAC, wordt AAC met SBR- of PS-functies ook wel MPEG-4 AAC genoemd.

AAC is een nieuwe generatie lossy audiocompressietechnologie. Het leidt drie hoofdcoderingen af, LC-AAC, HE-AAC en HE-AACv2 via enkele aanvullende coderingstechnologieën (zoals PS, SBR, enz.). LC-AAC is in vergelijking met traditionele AAC, relatief gezien, voornamelijk gebruikt voor gemiddelde en hoge codesnelheid (>= 80 Kbps), HE-AAC (gelijk aan AAC+SBR) wordt voornamelijk gebruikt voor medium en lage code ( <= 80 Kbps), en de recent uitgebrachte HE-AACv2 (gelijk aan AAC+SBR+PS) wordt voornamelijk gebruikt voor lage bitsnelheden (<=48 Kbps); in feite zijn de meeste encoders ingesteld op <=48 Kbps om automatisch PS-technologie in te schakelen, en >48 Kbps voegt geen PS toe, wat gelijk staat aan gewone HE-AAC.

2. Korte beschrijving van de AAC-specificatie:

AAC heeft in totaal 9 specificaties om aan de behoeften van verschillende gelegenheden te voldoen:

MPEG-2 AAC LC Specificatie lage complexiteit (lage complexiteit): relatief eenvoudig, geen versterkingsregeling, maar verbeterd

Coderingsefficiëntie, u kunt een evenwichtspunt vinden in de coderingsefficiëntie van gemiddelde bitsnelheid en geluidskwaliteit

Hoofd Hoofdspecificatie MPEG-2 AAC

Schaalbare samplefrequentie MPEG-2 AAC SSR

MPEG-4 AAC LC Specificatie lage complexiteit (lage complexiteit) —— de huidige mobiele telefoon komt vaker voor in het MP4-bestand

Het audiogedeelte van het bestand bevat het audiobestand van deze specificatie

Belangrijkste Hoofdspecificatie MPEG-4 AAC —— Het bevat alle functies behalve versterkingsregeling, en de geluidskwaliteit is de beste

Schaalbare samplefrequentie MPEG-4 AAC SSR

MPEG-4 AAC LTP Langetermijnvoorspelling

Specificatie lage vertraging MPEG-4 AAC LD (lage vertraging)

MPEG-4 AAC HE (High Efficiency) High Efficiency-specificatie —- Deze specificatie is geschikt voor codering met een lage bitsnelheid, met

Nero ACC-encoderondersteuning

Momenteel zijn de meest gebruikte LC en HE (geschikt voor lage bitsnelheden). Het populaire Nero AAC-coderingsprogramma ondersteunt alleen de drie specificaties van LC, HE en HEv 2. Voor gecodeerde AAC-audio worden de specificaties weergegeven in LC. HE is eigenlijk AAC(LC)+SBR-technologie, HEv2 is AAC(LC)+SBR+PS-technologie;

Hev1 en HEv2 worden eenvoudig weergegeven door dit diagram:

(AAC in de afbeelding verwijst naar de originele AAC-LC)

HIJ: “Hoog rendement.” HE-AAC v1 (ook bekend als AACPlusV1, SBR) implementeert AAC(LC)+SBR-technologie door middel van een wrapper. SBR staat eigenlijk voor Spectral Band Replication. Beschrijf kort, het hoofdspectrum van muziek is geconcentreerd in de laagfrequente band en de hoogfrequente band heeft een kleine maar belangrijke amplitude, die de geluidskwaliteit bepaalt. Als de hele frequentieband is gecodeerd, om de hoge frequentie te beschermen, wordt de lage frequentieband te nauwkeurig gecodeerd en wordt het bestand enorm; als de belangrijkste laagfrequente component behouden blijft en de hoogfrequente component verloren gaat, gaat de geluidskwaliteit verloren. SBR snijdt het frequentiespectrum af, de lage frequentie wordt afzonderlijk gecodeerd om de hoofdcomponenten op te slaan, en de hoge frequentie wordt afzonderlijk versterkt en gecodeerd om de geluidskwaliteit op te slaan. Het is “ingebouwd” en de geluidskwaliteit blijft ook behouden in de geval van het verkleinen van de bestandsgrootte, wat deze tegenstrijdigheid perfect oplost.