Audioformaat: vergelijking en implementatie van MP3 en WAV


Free Download Mp4Gain
picture



We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE



THIS PRICE ONLY LASTS FOR A FEW DAYS




Audioformaat: vergelijking en implementatie van MP3 en WAV

WAV vs MP3

Een mp3 is 320kbps, 44100hz, wat betekent dit?

mp3 vs wav

44100Hz vertegenwoordigt de samplefrequentie van het signaal. De zogenaamde bemonstering bestaat uit het elke tijdseenheid verkrijgen van de waarde y van de geluidsgolf op het huidige moment. Sampling is het proces van het discretiseren van continue gegevens (het omzetten van een analoog signaal naar een digitaal signaal).
afbeeldingsbron

De hierboven genoemde bemonsteringsmethode wordt PCM (Pulse Code Modulation) genoemd. Volgens de bemonsteringswet van Nyquist-Shannon moet de bemonsteringsfrequentie ten minste tweemaal de hoogste doelfrequentie zijn. Het gehoorbereik van het menselijk oor is ongeveer 20 Hz-20.000 Hz (als je benieuwd bent hoe hard je kunt horen, kun je hier klikken om je oren te testen), hoewel opnamesoftware vaak een 48.000 optie Hz heeft, maar we kunnen veilig concluderen : 44100Hz kan aan bijna al onze behoeften voldoen, hoger is gewoon een verspilling van je geheugen en CPU. Meer dan 48.000 samples zijn zinloos voor het menselijk oor, wat vergelijkbaar is met 24 frames per seconde in een film. 44100Hz is toevallig de standaard samplefrequentie voor bijna alle uitgebrachte muziek. In feite zijn hoogfrequente geluiden voor zang en veel instrumenten ruis, dus hoge samplefrequenties kunnen de geluidskwaliteit soms verslechteren (daarom moeten we de equalizer aanpassen).

320 kbps staat voor uw bitrate/bitrate, wat een afkorting is voor kilobits per seconde, wat de grootte weergeeft van de gegevens die worden gebruikt om geluid te beschrijven. Op cd (niet-gecomprimeerd audiobestand) is de bitsnelheid 1411,2 kbps, en de mp3-geluidskwaliteit om cd-kwaliteit te bereiken moet hoger zijn dan 128 kbps/44100 Hz (128 kbps kan de meest voorkomende bitsnelheid zijn). Over het algemeen betekent een hoger aantal een betere kwaliteit. De kwaliteit is afhankelijk van veel factoren (zoals het coderingsalgoritme). Vaak hebben we geen te hoge bitrate nodig: ons apparaat kan mp3 en cd afspelen zonder verschil (geluid/geluidskaart is normaal).

Een wav is 44100 Hz 16-bit stereo of 22050 Hz 8-bit mono, wat betekent dit? stereo/mono verwijst naar dual/mono. Voor monofone geluidsbestanden zijn de voorbeeldgegevens een 8-bits kort geheel getal (korte int 00H-FFH); voor tweekanaals stereogeluidsbestanden is elke voorbeeldgegevens een 16-bits geheel getal (int) en de bovenste acht bits (linkerkanaal) en onderste acht bits (rechterkanaal) vertegenwoordigen respectievelijk de twee kanalen.


Free Download Mp4Gain
picture

Mp3-formaat en de verschillen tussen VBR en CBR, WAT IS BETER?

Mp3-formaat en de verschillen tussen VBR en CBR, WAT IS BETER?

CBR & VBR

Er is nog een nadeel van VBR-technologie. Bij het afspelen van een audiobestand zal er onvermijdelijk een bewerking zijn om naar de positie van de gespecificeerde afspeeltijd te springen (dwz de zogenaamde zoekbewerking).

CBR vs VBR

Op dit moment is het noodzakelijk om de tijdpositie van het doel te converteren naar de positie van het bestand. Spring dan naar deze offset van de bestandspositie om te lezen en te decoderen. Als het een download- en afspeelmodus voor netwerkweergave is, moet u tijdens het zoeken eerst de positie van het bestand berekenen. Spring naar deze positie en download een paragraaf voordat je verder gaat met spelen. . Voor CBR-codering is de conversie naar offset van de bestandspositie ook heel eenvoudig, met behulp van de volgende formule:

bestandspositie (byte) = doeltijdpositie ( s ) * bitsnelheid (kbps) * 1000/8 + id3v2-veldgrootte (indien aanwezig)
Maar voor VBR-codering is het natuurlijk onmogelijk om deze formule te gebruiken om de bestandspositie te converteren. De reden is ook heel eenvoudig: de bitsnelheid van elk frame staat niet vast en de gegevenslengte per seconde is niet gemiddeld. Daarom zijn, net als het berekenen van de duur, andere gegevensvelden nodig.

De methode om de duur van de audio te berekenen en de zoekbewerking te implementeren met VBR-codering:
Om de bovenstaande twee problemen op te lossen, voegt VBR-codering enkele gegevensvelden toe. Op dit moment zijn er hoofdzakelijk twee soorten VBR-coderingstechnologieën: de ene is de Xing-specificatie die is voorgesteld door de Xing Company en de andere is de VBRI-specificatie van de Fraunhofer-encoder. Dit artikel laat alleen zien hoe de Xing-specificatie de berekening van de audioduur en de implementatie van de zoekbewerking oplost.

De belangrijkste inhoud van de Xing-specificatie is de Xing-header, wat betekent dat het eerste audioframe aan het begin van de VBR-gecodeerde mp3 niet wordt gebruikt om specifieke audiogegevens op te slaan, maar om aanvullende audio-informatie op te slaan. Deze informatie is gemarkeerd met de vier karakters van “Xing” als het begin van het veld (sommige bestanden gebruiken ook de vier karakters van “Info” als het begin van de Xing-header).

De positie van de Xing-header in het eerste audioframe is na de standaard 4-byte mp3-audioframeheader. Tussen de frameheader en de Xing-header bevindt zich een blanco gedeelte waar de gegevensinhoud allemaal 0 is. Deze blanco De lengte van de sectie is opgegeven. Nadat de decoder de frameheader van het eerste audioframe heeft geparseerd, slaat hij het lege deel van de opgegeven lengte over en beoordeelt vervolgens of de volgende inhoud de vier tekens van ‘Xing’ of ‘Info’ is om de audio te beoordelen. Als de VBR-codering .

Mp3, verschillen tussen CBR en VBR

Mp3, verschillen tussen CBR en VBR

CBR vs VBR

Verschillen in gegevensinhoud tussen CBR- en VBR-mp3-bestanden. Het kan worden gezien dat de bitsnelheid van de VBR-gecodeerde mp3 niet noodzakelijk hetzelfde is vanwege het verschil in gegevensinhoud tussen frames. Over het algemeen zal VBR-technologie comprimeren en coderen in het bereik van 8 ~ 320 kbps, dus de bitsnelheid van het hele bestand is hoger dan die van het hele bestand.Constante CBR-codering, VBR-codering heeft een variabele bitsnelheid van de bitsnelheid door het hele bestand, vandaar de naam VBR (variabele bitrate).

CBR & VBR

Naast de twee coderingen CBR en VBR, is er ook een codering van het type ABR (Average Bit Rate, Average Bit Rate), die in principe hetzelfde is als CBR. De meeste audioframes worden gecodeerd met de opgegeven bitsnelheid, maar ze zullen worden De inhoud is gecodeerd met een hogere bitsnelheid dan gespecificeerd, maar meestal is deze inhoud kort, dus er is niet veel verschil in bestandsgrootte in vergelijking met CBR, dus dit type is niet gebruikelijk.

Nadelen van VBR-technologie ten opzichte van CBR-technologie
Het gebruik van VBR-technologie voor het coderen en comprimeren van mp3-bestanden kan de bestandsgrootte zeker optimaliseren, maar tegelijkertijd brengt het ook enkele nieuwe problemen met zich mee bij het verkrijgen van audio-informatie en het bewaken van de voortgang van het afspelen.

De eerste is de berekening van de duur van de audio. Als het CBR-codering is en de bitsnelheid constant is, is de gegevensgrootte van alle audioframes vast, dus de gegevensgrootte die nodig is om te decoderen voor elke seconde afspelen is hetzelfde, dus het is heel eenvoudig om de audiotijdsduur te berekenen. Gebruik gewoon de volgende formule:

timelength ( s ) = (totale bestandslengte (byte) – totale id3-veldgrootte (indien aanwezig)) * 8 / (bitrate (kbps) * 1000)
In de formule verwijst het veld id3 naar het veld met basisinformatie dat aan het begin of het einde van het mp3-bestand wordt geplaatst en dat over het algemeen wordt gebruikt om de naam van het audiobestand, de naam van de zanger en de albumnaam op te nemen. De id3 is verdeeld in twee versies, v1 en v2, en alleen v1-records. De bovenstaande drie soorten informatie, en de grootte is vast, worden meestal aan het einde van het bestand geplaatst; v2 is flexibeler dan v1, het type opgenomen informatie is niet beperkt tot de bovenstaande drie, en de grootte is niet vast, het wordt meestal aan het begin van het bestand geplaatst. Het id3-veld is een optioneel veld en het mp3-bestand heeft het niet noodzakelijkerwijs, dus om de audiotijd van de mp3 te berekenen, moet u het eerst lezen om te zien of de id3 bestaat.

Voor VBR-gecodeerde mp3-bestanden, aangezien de bitsnelheid van elk frame niet vast is, is de gegevensgrootte van elk frame willekeurig. Het is duidelijk dat de grootte van de gegevens die per seconde worden gereproduceerd, anders is. Op deze manier kan de duur van alle audio niet worden berekend met de bovenstaande formule en zijn andere gegevensvelden nodig, wat een van de tekortkomingen is van de VBR-technologie: het is relatief moeilijk en ingewikkeld om de duur van de audio te berekenen.

Basisverschillen tussen VBR en CBR in mp3-bestanden

Basisverschillen tussen VBR en CBR in mp3-bestanden

CBR vs VBR

Vanuit het perspectief van bitrate-codering kan een van de meest voorkomende audiobestandsindelingen, MP3, worden onderverdeeld in twee typen: de ene is CBR met constante bitrate (constante bitrate).

CBR & VBR

De bitsnelheid van een frame is constant en uniek. ; de andere is VBR met variabele bitsnelheid, wat het tegenovergestelde is van CBR. De bitsnelheid van elk frame staat niet vast. De bitrate kan wel of niet hetzelfde zijn. Vanwege het bestaan ​​van deze twee typen, moeten sommige taken die moeten worden uitgevoerd bij het afspelen van mp3-bestanden, zoals het verkrijgen van audio-informatie en het regelen van de voortgang van het afspelen, afzonderlijk worden afgehandeld.

Inleiding tot enkele basisconcepten.
Om de specifieke verschillen tussen CBR en VBR goed te begrijpen, moet u een belangrijk kenmerk van audiobestanden begrijpen: bitrate, ook wel bitrate of bitrate genoemd, verwijst naar het aantal bits dat per seconde wordt verzonden. De eenheid is bps (bits per seconde). Hoe hoger de bitrate, hoe hoger de datatransmissiesnelheid. Bitrate in audio verwijst naar de hoeveelheid binaire gegevens per tijdseenheid na het converteren van een analoog geluidssignaal naar een digitaal geluidssignaal, wat een indirecte maatstaf is voor de audiokwaliteit.

De bitrate-eenheid van audiobestanden is over het algemeen kbps, 1 kbps = 1000 bps. De standaardbitsnelheid van mp3 is 128 kbps, maar de mp3 die van het internet is gedownload, komt vaker voor bij 192 kbps, en als je high-definition mp3 met een betere geluidskwaliteit wilt, bereikt de bitsnelheid meestal 320 kbps. Hoe hoger de bitrate, hoe beter de geluidskwaliteit, maar hoe meer schijfruimte het in beslag neemt.

Over het algemeen geldt: hoe hoger de toonhoogte van de geluidsclip, hoe meer ruimte deze nodig heeft om op te slaan en hoe hoger de bitsnelheid. Het traditionele mp3-bestand is gecodeerd met CBR, dat wil zeggen dat de bitsnelheid van elk frame hetzelfde is, wat een probleem met zich meebrengt: als de bitsnelheid van elk frame hetzelfde is, dan is de gegevensgrootte van elk frame op dezelfde manier, ongeacht de toonhoogte van dit frame hoog of laag is, de opslagruimte van het audioframe met de hoogste toonhoogte in alle audio wordt gebruikt om dit frame op te slaan, maar voor het audioframe met lage toonhoogte is niet veel opslagruimte nodig. Dit zal resulteren in een verlies van opslagruimte en zal de grootte van het mp3-bestand virtueel vergroten.

Het verschijnen van VBR-coderingstechnologie is om het probleem van deze verspilling van ruimte op te lossen. VBR-technologie selecteert de meest geschikte bitsnelheid voor elk audioframe. Voor audioframes met een lagere toonhoogte zal de bitsnelheid lager zijn en de gegevensgrootte kleiner. Als de toonhoogte hoger is, zal de bitsnelheid hoger zijn. De maat is groter. Op deze manier kan de opslagruimte van de audiogegevens worden bespaard en kan de grootte van het mp3-bestand verder worden gecomprimeerd zonder de audiokwaliteit te verliezen.