CODERINGSPRINCIPES VAN HET MP3-FORMAAT.


Free Download Mp4Gain
picture



We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE



THIS PRICE ONLY LASTS FOR A FEW DAYS




CODERINGSPRINCIPES VAN HET MP3-FORMAAT.

Mp3 Encoding

Mp3, of volledig MPEG-1, 2 en 2.5 Layer 3, is een van de meest populaire en wijdverspreide standaarden voor het opslaan van audiogegevens.

MP3 ENCODING

In dit artikel gaan we niet in op de geschiedenis van creatie en verdere ontwikkeling, maar kijken we naar de basisprincipes van de standaard en voorbeelden van de implementatie ervan.

De mp3-standaard legt geen specifiek compressie-algoritme vast om de brongegevens te “coderen”, maar beschrijft eerder de essentie van de mogelijke methoden.

De kwaliteit van het verkregen resultaat hangt af van de wijziging van het gebruikte algoritme, ingebed in elk coderingsprogramma van de “codec”, en van de kwaliteit van de originele audiogegevens.

Er zijn 3 meest voorkomende wijzigingen van het mp3-formaat, die verschillen in de compressieverhoudingparameters van de originele audiogegevens.

Naam
Wijziging van de regel
Gegevenssnelheid per seconde (bitsnelheid) Mogelijke samplefrequenties
MPEG-1-laag 3
32-320 kbps 32000 Hz
44100 Hz
48000 Hz
MPEG-2 Layer 3 16 – 160 kbps 16000 Hz
22050 Hz
24000 Hz
MPEG-2.5 Layer 3 8 – tot 160 kbps 8000 Hz
11025 Hz

De verwerking begint met het verdelen van het originele audiosignaal in gelijke tijdsintervallen: gelijke frames, bijvoorbeeld 0,05 of 0,26 seconden, waarna elk frame wordt geanalyseerd en gecomprimeerd volgens algemene of individuele parameters gebaseerd op de gegevens van de vorige en volgende frames.

De meeste gebruikte compressie-algoritmen zijn gebaseerd op de perceptuele kenmerken van het menselijk oor. Laten we eens kijken naar de belangrijkste opties, die in de regel op een complexe manier worden toegepast.

Het is de moeite waard om te beginnen met het feit dat de gemiddelde persoon op het gehoor in staat is om een ​​frequentiebereik van ongeveer 10 Hz tot 20.000 Hz waar te nemen. Met de groei treden veranderingen op in het hoortoestel en, voor de meesten, de gevoeligheid het hogere frequentiebereik neemt af, waardoor bij sommige mp3-aanpassingen tijdens compressie alle frequenties boven de 16.000 hertz worden afgesneden, wat de hoeveelheid informatie aanzienlijk kan verminderen.

Audio-opnamen kunnen worden gecodeerd in stereo (een surroundgeluidseffect dat afzonderlijke kanalen gebruikt voor de linker- en rechterluidsprekers) of mono (het tegenovergestelde van stereo). In mp3-formaat worden niet voor elk van uw luidsprekers verschillende tracks opgenomen, maar informatie over de verschillen tussen de linker- en rechterkanalen.

In de akoestiek is er een concept als “harmonischen”, dit zijn de frequenties van de “geluiden” die samen klinken met de belangrijkste en meest prominente toon. Als u bijvoorbeeld op een drum slaat, is het luidste geluid de toon en het kleine, zwakkere, de harmonischen.

Na zo’n hard geluid treedt de zogenaamde “periode van doofheid” op, gedurende een periode waarin het gehoor praktisch niet reageert op veranderingen.

Als in de intervallen van de “doofheidsperiode” alle frequenties worden verwijderd, zullen de waarnemingsfouten praktisch hun afwezigheid niet opmerken, daarom worden tijdens compressie de zwakste harmonischen afgesneden, dicht bij de meeste geluiden gelegen sterk: tonen.

Er wordt een methode gebruikt om de bijna-piekwaarden van de signaal “pieken” (in termen van volume) te vervangen door een gemiddelde waarde.

Er is een concept als bitsnelheid: dit is een waarde die het aantal verzonden bits van informatie “eenheden” karakteriseert gedurende een tijdsperiode, meestal een seconde.
Hoe hoger de bitsnelheid, hoe beter het audiodetail zal zijn, zolang de originele, niet-gecomprimeerde audiogegevens van hoge kwaliteit zijn.

Zoals u kunt raden, bestaan ​​digitale formaten uit bepaalde codereeksen, met andere woorden uit de reeksen 0 en 1.
Om ruimte te besparen, krijgen frequente joins binnen een bestand unieke ID’s toegewezen die lange reeksen vervangen.

Dankzij dergelijke complexe invloeden is het mogelijk om het originele audiosignaal te comprimeren tot een van de populaire formaten met kwaliteitsverlies – het mp3-formaat.

Verschillende experimenten zijn vele malen uitgevoerd om te laten zien hoe significant de verschillen zijn voor en na compressie in mp3. Zoals tests hebben aangetoond, waren verschillen, sommige vergelijkbare momenten niet altijd mogelijk, snel en te onderscheiden, zelfs niet wanneer ze werden gereproduceerd op apparatuur met een hogere betrouwbaarheid.

Voor degenen die nog nooit de gelegenheid hebben gehad om de originele en gecomprimeerde audio-opname rechtstreeks te vergelijken, zal het in de meeste gevallen enige tijd duren of zelfs duidelijke verschillen vinden.


Free Download Mp4Gain
picture

Verbeterde efficiëntie van algoritmen voor digitale audiogegevenscompressie.

Verbeterde efficiëntie van algoritmen voor digitale audiogegevenscompressie.

audio compression

De relevantie van het werk. Methoden voor het coderen van audiosignalen van hoge kwaliteit (HS) zijn het laatste decennium zeer wijdverspreid geworden op het gebied van uitzendingen, digitale geluidsopname en audio- en videoapparatuur voor thuisgebruik. Er is zelfs een snelgroeiende nieuwe klasse consumentenelektronica: draagbare mp3-spelers.

Audio Compression:

Er worden digitale televisie- en radiotransmissienetwerken ontwikkeld die de consument hoogwaardige beeld en geluid bieden met een groot dekkingsgebied. De populariteit van radio- en televisie-uitzendingen via internet en mobiele telefoonnetwerken neemt toe. Al deze technologische innovaties zijn economisch levensvatbaar geworden, en in sommige gevallen zelfs technisch mogelijk, dankzij het gebruik van zeer efficiënte digitale video- en audiogegevenscompressie-algoritmen, zoals MPEG-1 ISO / IEC 11172, MPEG-2 TSO / IEC 13818, MPEG-4 ISO / IEC FCD 14496, ATSC Dolby AC-3. Tegelijkertijd is het vanwege de economische voordelen van het gebruik van deze algoritmen, die het mogelijk maken om de bandbreedtevereisten van de transmissiekanalen of de capaciteit van de informatiedragers met een orde van grootte te verminderen, noodzakelijk om te compenseren met een zekere afname van de geluidskwaliteit. Tijdens het tijdperk van de dominantie van digitale audio-cd’s, hebben consumenten een vereiste gecreëerd voor een hoge geluidskwaliteit van alle geluidsreproductieapparatuur. De inspanningen van algoritme-ontwikkelaars voor het coderen van audiosignalen zijn er altijd op gericht geweest ervoor te zorgen dat de kwaliteit van gedecodeerd audiomateriaal niet slechter is dan die van een cd. Geluidskwaliteit is vaak de bepalende factor voor het economische succes van digitale omroepdiensten of digitale geluidsdistributiediensten zoals iTunes). Verder,

Het is duidelijk dat het probleem van het verbeteren van de kwaliteit van audiocodering tegenwoordig een van de belangrijkste problemen is voor de geluidsopname-industrie, de audio-omroepindustrie en de fabrikanten van verschillende multimediasystemen.

Het basisprincipe van de werking van zeer efficiënte audiocoderingssystemen is het gebruik van de eigenschappen van het menselijke gehoorsysteem, voornamelijk het fenomeen van maskering. Het fenomeen van psychoakoestische maskering is te wijten aan de biofysische en neuronale verwerking van geluidssignalen door het menselijke gehoorsysteem [173]. Tegelijkertijd heeft een deel van de geluidsinformatie geen invloed op de akoestische perceptie van het geluidssignaal door de aanwezigheid van componenten met een grotere intensiteit erin. Daarom vormen de sterkste componenten van het audiosignaal de zogenaamde maskeringsdrempels. Geluidsinformatie met een signaalenergieniveau onder de maskerdrempel wordt niet waargenomen door het gehoorsysteem. In de traditionele digitale weergave van audiosignalen met behulp van pulscodemodulatie (PCM), worden in de tijd gesamplede samples van het originele signaal weergegeven met behulp van een specifiek aantal bits in het codewoord. De eindige precisie van de momentane waarden van een continu analoog signaal introduceert een fout in het signaal, de zogenaamde kwantiseringsruis. Het idee van het coderen van audiosignalen met het elimineren van psycho-akoestische redundantie is om psycho-akoestische analyse en het kwantiseringsmechanisme van audiosignalen te combineren [112]. In dit geval wordt het digitaal gecodeerde signaal omgezet in een tijd-frequentie weergave, zo dicht mogelijk bij de tijd-frequentie resolutie van het menselijke gehoorsysteem. Psychoakoestische analyse bepaalt de maskerdrempels op elk punt in de tijd-frequentieweergave van het gecodeerde signaal, en de kwantisator herkwantiseert het signaal met het minimaal mogelijke aantal bits per sample, waarbij de toenemende kwantiseringsruis optreedt. nog steeds onder de maskerdrempels. Aldus kan een compacte weergave van audiosignalen worden bereikt zonder subjectieve verslechtering van de geluidskwaliteit. Het is duidelijk dat de efficiëntie en kwaliteit van dergelijke systemen voornamelijk afhangen van de precisie van de psychoakoestische analyse. een compacte weergave van audiosignalen kan worden bereikt zonder subjectieve verslechtering van de geluidskwaliteit. Het is duidelijk dat de efficiëntie en kwaliteit van dergelijke systemen voornamelijk afhangen van de precisie van de psychoakoestische analyse. een compacte weergave van audiosignalen kan worden bereikt zonder subjectieve verslechtering van de geluidskwaliteit. Het is duidelijk dat de efficiëntie en kwaliteit van dergelijke systemen voornamelijk afhangen van de precisie van de psychoakoestische analyse.

Verschillen tussen analoge en digitale audio

Verschillen tussen analoge en digitale audio

Analog and Digita

Heel vaak horen we definities zoals “digitaal” of “discreet” signaal, hoe verschilt het van “analoog”?

Actual] Difference between Analog and Digital Signal with Examples -  ETechnoG

Het verschil is dat het analoge signaal continu in de tijd is (blauwe lijn), terwijl het digitale signaal bestaat uit een beperkte set coördinaten (rode stippen). Als alles is teruggebracht tot coördinaten, bestaat elk segment van een analoog signaal uit een oneindig aantal coördinaten.

Voor een digitaal signaal bevinden de coördinaten langs de horizontale as zich op regelmatige intervallen, volgens de bemonsteringsfrequentie. In het populaire audio-cd-formaat is dit 44.100 punten per seconde. Verticaal komt de precisie van de coördinaathoogte overeen met de cijfercapaciteit van het digitale signaal, voor 8 bits is dit 256 niveaus, voor 16 bits = 65536 en voor 24 bits = 16777216 niveaus. Hoe groter de bitdiepte (het aantal niveaus), hoe dichter de verticale coördinaten bij de oorspronkelijke golf zullen zijn.

Analoge bronnen zijn cassettebandjes en vinyl. Digitale bronnen zijn: CD-Audio, DVD-Audio, SA-CD (DSD) en bestanden in WAVE- en DSD-formaten (inclusief die afgeleid van APE, Flac, Mp3, Ogg, enz.).

Voordelen en nadelen van het analoge signaal

Het voordeel van het analoge signaal is dat het in de analoge vorm is dat we geluid waarnemen met onze oren. En hoewel ons gehoorsysteem de waargenomen geluidsstroom op deze manier omzet in digitale vorm en deze naar de hersenen stuurt, hebben wetenschap en technologie nog niet de mogelijkheid bereikt om spelers en andere geluidsbronnen rechtstreeks op deze manier met elkaar te verbinden. Momenteel wordt dit onderzoek actief uitgevoerd voor mensen met een handicap en genieten we uitsluitend van analoog geluid.

Het nadeel van een analoog signaal is de mogelijkheid om het signaal op te slaan, te verzenden en te repliceren. Bij het opnemen op tape of vinyl hangt de kwaliteit van het signaal af van de eigenschappen van de tape of vinyl. Na verloop van tijd zal de band demagnetiseren en de kwaliteit van het opgenomen signaal verslechteren. Elke lezing vernietigt geleidelijk het medium en herschrijven introduceert extra vervorming, waarbij extra afwijkingen worden toegevoegd door het volgende medium (tape of vinyl), apparaten voor het lezen, opnemen en verzenden van een signaal.

Het maken van een kopie van een analoog signaal is als het maken van een andere foto om een ​​foto te kopiëren.

Voordelen en nadelen van een digitaal signaal

De voordelen van een digitaal signaal zijn onder meer precisie bij het kopiëren en verzenden van een audiostream, waarbij het origineel niet verschilt van de kopie.

Het belangrijkste nadeel is dat het digitale signaal een tussenstadium is en dat de precisie van het uiteindelijke analoge signaal afhangt van hoe gedetailleerd en nauwkeurig de coördinaten van de geluidsgolf zijn. Het is heel logisch dat hoe meer punten er zijn en hoe nauwkeuriger de coördinaten, hoe nauwkeuriger de golf zal zijn. Maar er is nog steeds geen consensus over hoeveel coördinaten en gegevensprecisie voldoende is om te zeggen dat de digitale weergave van het signaal voldoende is om het analoge signaal nauwkeurig te reconstrueren, dat voor onze oren niet te onderscheiden is van het origineel.

In termen van datavolume is de capaciteit van een conventionele analoge audiocassette slechts 700-1,1 MB, terwijl een normale cd 700 MB is. Dit geeft een indicatie van de behoefte aan media met een hoge capaciteit. En dit resulteert in een aparte oorlog van compromissen met verschillende vereisten voor het aantal beschrijvende punten en voor de precisie van de coördinaten.

Tegenwoordig wordt het voldoende geacht om een ​​geluidsgolf weer te geven met een bemonsteringsfrequentie van 44,1 kHz en een bitdiepte van 16 bits. Met een bemonsteringsfrequentie van 44,1 kHz kunt u tot 22 kHz oproepen. Zoals uit psychoakoestische onderzoeken blijkt, is een verdere toename van de samplefrequentie onopvallend, maar een toename van de bitdiepte zorgt voor een subjectieve verbetering.

Hoe DAC’s de golf bouwen

Een DAC is een digitaal-naar-analoog-omzetter, een item dat digitaal geluid omzet naar analoog. We zullen snel de basis bekijken. Indien uit de commentaren interesse blijkt om verschillende punten nader te beschouwen, zal apart materiaal worden gepubliceerd.

Multibit DAC

Meestal wordt de golf gepresenteerd in de vorm van stappen, wat te wijten is aan de architectuur van de eerste generatie R-2R multi-bit DAC’s, die op dezelfde manier werken als een relaisschakelaar.

Digitaal geluid: DSD versus PCM

Digitaal geluid: DSD versus PCM

DSD vs. PCM: Myth vs. Truth | Audiofiles

Digitaal geluid. Hoeveel mythen draaien er om deze zin. Hoeveel geschillen zijn er ontstaan ​​tussen liefhebbers van comfort en digitale kwaliteit en voorstanders van “live luchtig” vinylgeluid vermenigvuldigd met “warm buis” -geluid. Daarnaast is er veel controverse onder liefhebbers van “getallen”: is 16×44,1 genoeg of is 24×192 nodig? Wat is beter: multibit of delta sigma? CDDA of SACD? PCM of DSD? In dit artikel zal ik proberen de basisprincipes van digitaal geluid in eenvoudige taal uit te leggen en zal ik ook dieper ingaan op het vergelijken van twee soorten codering van een analoog naar digitaal signaal: DSD en PCM.

DSD Vs PCM - Real Competitors? | Headfonics Audio Reviews

Laten we eerst de vraag beantwoorden: wat is digitaal geluid? Hoe verschilt het van analoog? Kortom, in wiskundige termen is een analoog audiosignaal een continue functie, een digitaal audiosignaal een discrete functie. Wat betekent dat?

Analoog signaal

Als je in je verbeelding een grafiek van een sinusoïde tekent (dit is hoe een geluidsgolf het vaakst wordt weergegeven): hoe we het ook vergroten, we proberen alle details te zien, we zullen altijd een vloeiende, vloeiende lijn zien – dit is een analoog audiosignaal (Afb. 1).

analoog Analoog (opname) geluid heeft veel parameters die kunnen worden gebruikt om de kwaliteit te evalueren. Beschouw de drie belangrijkste: frequentiebereik, dynamisch bereik, vervorming.

frequentiebereik – een reeks frequenties in geluid. Het is algemeen aanvaard dat het frequentiebereik van het menselijk gehoor 20 … 20.000 Hz is (soms wordt 16 tot 22.000 Hz aangegeven). Het frequentiebereik van de muziek zelf is niet van belang in termen van kwaliteitsbeoordeling (het frequentiebereik van hetzelfde opstijgende vliegtuig zal bijvoorbeeld erg breed zijn en het vocale gedeelte van de tenor zal veel smaller zijn). Een kwalitatieve parameter van bijvoorbeeld een oortelefoon is het potentiële frequentiebereik en wordt geschat met behulp van de amplitude-frequentiekarakteristiek (AFC). De ideale frequentierespons, een rechte lijn over het hele bereik van gehoorfrequenties, betekent dat de geluidsbron geen individuele frequenties versterkt of verzwakt, wat betekent dat het geëxtraheerde geluid overeenkomt met het origineel.

Dynamic Range (DD) is het verschil tussen het laagste en hoogste geluid. Loudness wordt gemeten in decibel (dB). Het is algemeen aanvaard dat het maximale volume dat geen letsel bij een persoon veroorzaakt 130 dB is, het geluid van een opstijgend vliegtuig en het minimale hoorbare volume, 5 … 10 dB, op het niveau van het ritselen van de bladeren in lage windomstandigheden. Het is natuurlijk onmogelijk om het ritselen van bladeren te onderscheiden tegen de achtergrond van een opstijgend vliegtuig, en naar muziek luisteren met een niveau van 130 dB is buitengewoon onaangenaam. Daarom wordt algemeen aangenomen dat een comfortabele DD voor het luisteren naar muziek 80 … 100 dB is.

De vervorming is niets meer dan een afwijking van het signaal van het origineel.