Mp3-compressie (Huffman)

Het is een destructieve compressiemethode.

Destructieve compressie is compressie die wordt bereikt door informatie te verliezen. Dit betekent dat als u het gecomprimeerde signaal met deze techniek uitpakt, u het startsignaal niet zult vinden.
Het is mogelijk omdat het de eigenschappen van het menselijk oor exploiteert.

Huffman Mp3

Het frequentiespectrum van het menselijk oor ligt tussen 20 Hertz en 20 kilohertz. Als een geluid frequenties buiten dit bereik bevat, kunnen we ze elimineren zonder verlies van audiokwaliteit omdat het oor ze niet hoort.

In werkelijkheid is het menselijk oor niet even gevoelig voor alle frequenties in het theoretische audiospectrum. de maximale gevoeligheid ligt tussen 2 kilohertz en 5 kilohertz. Buiten dit bereik moet u het vermogen van de bron vergroten om dezelfde geluidssensatie te hebben.

Huffman compressionj mp3

Om de grootte van de opnamebestanden te verkleinen, kan men besluiten om alle hoge frequenties boven de 15 kilohertz te elimineren.

De mp3-techniek gebruikt de zogenaamde gemaskeerde frequentietechniek die bestaat uit het niet opnemen van geluiden met een laag geluidsniveau in vergelijking met de andere.

De MP3 gebruikt aan het einde van de verwerking het Huffman-algoritme (1952).

Het Huffman-algoritme wordt gebruikt in alle compressie-algoritmen (compressie van tekstbestanden, compressie van afbeeldingen, compressiegeluiden). Het is gebaseerd op het gebruik van een code met variabele lengte en de waarschijnlijkheid dat een gebeurtenis plaatsvindt (in dit geval een frequentie). Hoe vaker een frequentie verschijnt, hoe korter de code (laag aantal bits om deze weer te geven). Het bestand wordt voor het eerst gelezen en er wordt een tabel opgesteld met de frequenties die verschijnen en het aantal keren dat ze verschijnen. We leiden de juiste code af. Deze codering wordt het laatst gebruikt. Dit is de laatste compressiefase. Het is een niet-destructieve codering.

In totaal gebruikt MP3 eerst de eigenschappen van het oor om de grootte van een nummer te verkleinen, daarna verwerkt het het stereo-aspect (als de twee kanalen van een stereogeluid vergelijkbare sequenties hebben, in plaats van twee sequenties te dupliceren, slaan we er maar één op, aangezien de informatie voor het rechterkanaal en het linkerkanaal zijn identiek) en we eindigen met Huffman-codering.

Het gebruik van alle mogelijkheden van informatiereductie hangt af van de plaats die u 1 minuut vanaf uw tablet wilt geven en dus van de toe te passen compressiesnelheid.

Voor het coderen van MP3-geluidsbestanden wordt er meer gesproken over bitsnelheid dan over compressiesnelheid.

Bitrate is het aantal bits dat in 1 seconde is toegestaan: hoe meer je een nummer wilt comprimeren (om zo min mogelijk ruimte in beslag te nemen), hoe meer bitrate er moet zijn om uit te kiezen.

P meer compressie en minder geluidskwaliteit is goed.

Een gecomprimeerd signaal met een bitsnelheid van 64 kbit / s heeft een bandbreedte van 11 kHz (alle frequenties boven 11 kilohertz worden onderdrukt).

Om deze compressieverhouding te verkrijgen zijn, naast het onderdrukken van de frequenties, de hoge frequenties ook omgevormd tot een monosignaal in plaats van ze in stereo te houden. Het MP3-geluid van bestanden die zijn gecomprimeerd met een bitsnelheid van 64 kbit / s heeft niets te maken met het origineel (we gebruiken het alleen om naar draagbare muziekspelers te luisteren).

FLAC, WAV, MP3, DSD, ALAC … Welk audioformaat moet ik gebruiken?

U kent waarschijnlijk het beroemde MP3-audioformaat. Er is zelfs een grote kans dat je hem alleen dagelijks gebruikt. Maar wist je dat het dankzij andere audioformaten mogelijk is om je muziek naar een hoger niveau te tillen? Als de termen FLAC, DSD, samplefrequentie of zelfs verliesloos niets voor u betekenen, dan bent u hier aan het juiste adres. Deze gids is speciaal ontworpen voor nieuwkomers en vertelt je alles wat je moet weten over de basis van digitale audio.

soundwave

FLAC, DSD, ALAC … Luisteren naar een debat tussen audiofielen kan moeilijk lijken als je dit universum en de vele acroniemen die ernaar verwijzen niet kent. Maar als je het avontuur probeert, zul je er geen spijt van krijgen. Zeg maar dag tegen je saaie en levenloze mp3’s en hallo tegen kwaliteitsmuziek. Vertrouw ons, je oren zullen je bedanken!

Samplefrequentie en bitdiepte: de basis van digitale muziek
Voordat we je knock-out slaan (we beloven dat we niet te hard zullen slaan) met barbaarse acroniemen op alle mogelijke manieren, laten we ons eerst concentreren op twee essentiële begrippen van moderne audio, namelijk samplefrequentie en bitdiepte. Deze twee elementen geven een idee van de opnameprecisie van een nummer.

but depth

Zoals u weet, draaien computers op bits, die sets zijn van 0 en 1. Tijdens een passage in de studio moet muziek geproduceerd door een artiest worden gedigitaliseerd en daarom worden omgezet in 0 en 1 om op cd te worden opgenomen of naar via transmissiediensten. Dit is waar de samplefrequentie en bitdiepte in het spel komen.

Neem het voorbeeld van een cd. Onze geliefde empanadas zijn opgenomen in 16-bit / 44,1 kHz. De bemonsteringsfrequentie van 44,1 kHz betekent dat de muziek die door onze muzikant wordt geproduceerd, 44.100 keer per seconde wordt geanalyseerd door studio-opnameapparaten. Wat betreft de bitdiepte, het geeft een indicatie van het aantal informatie dat in dezelfde periode is geregistreerd. Hoe groter de diepte, hoe meer informatie aan het einde wordt gecodeerd.

De cd-kwaliteit is echter niet de beste ter wereld, ook al overschrijdt deze de MP3-kwaliteit ver. We vinden dus 24-bit / 192 kHz-opnames. De DSD gaat zelfs nog verder met een frequentie die oploopt tot meerdere MHz, maar onthoud voor de eenvoud dat hoe hoger de hierboven beschreven waarden, des te nauwkeuriger de opname zal zijn in uw geluidsweergave.

Verliesformaten: MP3, AAC, OGG

Over het algemeen zijn er twee soorten indelingen in de audiowereld: lossy, lossy in het Engels en lossy, of lossless. Als je de beste geluidskwaliteit wilt, blijf dan weg van gecomprimeerde formaten.

De bekendste is mp3. Echte dinosaurus in de audiowereld, dit type bestand werd ontwikkeld in een tijd waarin de capaciteiten van onze harde schijven werden bepaald in MB en niet in TB. Daarom moesten we de opnames zoveel mogelijk comprimeren, ook als dat betekende dat we de kwaliteit opzij moesten zetten.

Het is waar dat MP3-gecodeerde muziek slechts een paar megabytes weegt. Maar het toegepaste algoritme is erg agressief, het snijdt gewoon de frequenties af die door het menselijk oor als onhoorbaar worden beschouwd. MP3 verliest zelfs veel hoorbare delen. Om een ​​idee te krijgen, klik op de onderstaande link, u zult deze beroemde afgeknotte delen horen. De stukken lijken plat, verstoken van leven. Luisteren kan zelfs na enkele tientallen minuten onaangenaam worden. Het volstaat om te zeggen dat, afgezien van het kleine formaat, MP3 niet echt interessant meer is in onze tijd als we op zoek zijn naar kwaliteitsmuziek.

Om het nog beter te maken, heeft Apple ondertussen een ander audioformaat uitgebracht, AAC, voor geavanceerde audiocodering. Dit is ook een verlieslatend formaat dat daardoor details verliest tijdens datacompressie. Het gebruikte algoritme is echter efficiënter en snijdt minder belangrijke frequenties af, althans op papier. In absolute termen is het verschil met mp3 niet per se groot en in de audiofiele omgeving woedt al jaren het debat of het AAC-formaat echt beter is dan mp3.

Ten slotte is er ook de OGG Vorbis, een ander gecomprimeerd formaat met verlies. Net als AAC zou het beter moeten werken dan MP3. Dit is het type bestand dat Spotify gebruikt. Zijn interesse is om efficiënte transmissie mogelijk te maken en de kwaliteit te verminderen. De nummers die in dit formaat zijn gecodeerd, zijn echter niet fantastisch. Het ideaal is om verliesloos te worden.

MP3-indeling (nadelen en coderingsmethoden)

Onthoud allereerst dat “MP3” slechts een afkorting is voor de term “Audio MPEG-1/2 Layer 3 Compression”, een formaat voor het coderen van audiogegevens waarmee u het gewicht van een computerbestand kunt delen door meer dan tien.

Compression

Het woord MP3 verwijst ook bij uitbreiding naar draagbare audiospelers die het audiobericht in MP3-formaat afspelen.
De belangrijkste rol van het MP3-formaat is het comprimeren van muziek zodat deze lichter is (om meer in onze speler op te slaan) zonder dat de luisteraar de verschillen niet waarneemt.
Daarom zullen we alles wat als “overbodig” wordt beschouwd uit het geluidssignaal verwijderen, maar dit is de hele controverse: wat is werkelijk overbodig of onbelangrijk of overbodig in het te coderen geluid?
Sommige mensen die tegen deze manier van opslaan zijn, spreken van signaalverminking. Anderen beschrijven deze operatie met een leuke vergelijking: “Hoe meer aardappelen in een pan doen? Het is eenvoudig, we maken er puree van!

‘In feite is het niet zo eenvoudig, de compressiemethode is veel complexer dan je denkt.

 

Mp3 Compression

Muziekcompressie

Om MP3-muziek lichter te maken, wordt deze gecomprimeerd, maar zonder dat de gebruiker het verschil hoort of waarneemt. Het principe is om geluiden te elimineren die niet hoorbaar zijn voor het menselijk oor, zoals echografie (hoge tonen) of infrageluid (bas). Maar wees voorzichtig, deze “lichte” muziek (12 keer minder zwaar dan de muziek in standaardformaat) moet “van goede kwaliteit” blijven om de luisteraars tevreden te stellen.

Om dit te bereiken, codeert MP3 niet alle gegevens die nodig zijn voor een volledige geluidsweergave, maar alleen wat door het menselijk oor wordt waargenomen. Zo bereiken we wat we de “magere” noemen.

1e fase: de eerste skimming vindt plaats in alle geluiden die niet door het oor worden waargenomen. Ze worden gewoon verwijderd.

Door compressie kunnen de spectrometrische componenten van een audiosignaal worden geanalyseerd en kan er een psychoakoestisch model op worden toegepast, zodat alleen “hoorbare” geluiden worden behouden.

Het menselijk oor kan gemiddeld geluiden tussen 0,02 kHz en 20 kHz onderscheiden, wetende dat de gevoeligheid maximaal is voor frequenties tussen 2 en 5 kHz, volgens een curve gegeven door de wet van Fletcher en Munson. Daarom bestaat deze eerste compressiefase uit het bepalen van de geluiden die we niet horen en het elimineren ervan, daarom is het een destructieve compressie, dat wil zeggen met verlies van informatie.

2e stap: Vervolgens zullen we de geluiden waarvoor het oor het meest gevoelig is (die tussen 2 en 5 kilohertz) nauwkeuriger coderen. De rest van de geluiden bevatten de frequenties die minder door het oor worden waargenomen en zullen met minder precisie worden gecodeerd. Dan zullen ze van mindere kwaliteit zijn, en, en dat is het doel, ze zullen minder plaats innemen omdat ze bijna niet worden waargenomen. De luisteraar zal deze “aantasting” van het oorspronkelijke geluid niet opmerken omdat dit frequenties zijn waarvoor het oor niet gevoelig is.

In deze zelfde fase wordt een tweede behandeling toegevoegd: dynamische compressie. Dynamische compressie bestaat uit het verhogen van de zwakke niveaus en de lage niveaus om ze lager te houden, om de contrasten die de muziek heeft te wissen.
Deze twee fasen zullen muziek lichter maken zonder de perceptie van geluid te veranderen.

Geluidsmaskering

Na het geluid zwaar te hebben gecomprimeerd, gaat de MP3 verder door gebruik te maken van het maskeerfenomeen. Wanneer een geluid een bepaalde intensiteit bereikt, maskeert het de geluiden met de laagste intensiteiten die er het dichtst bij zijn. Het oor neemt het zwakste geluid niet waar en MP3 zal daarom deze zogenaamde “gemaskeerde” geluiden eenvoudig verwijderen.

Als je naar de zon kijkt en een vogel langs zijn as gaat, zie je hem niet omdat het licht van de zon te belangrijk is. In de akoestiek is het hetzelfde. Als er harde geluiden zijn, kun je de zwakste niet horen. Bijvoorbeeld: als een geluid van 80 dB en waarvan de frequentie 1000 Hz is, wordt gevolgd door een geluid van 20 dB en dat dezelfde frequentie heeft, wordt bij het formatteren in MP3 het geluid van 80 dB behouden en wordt de andere verborgen

Daarom wordt het blauwe geluid gemaskeerd door het zwarte geluid.

Het gevaar van dit formaat

Het MP3-formaat levert twee soorten gevaar op voor ons gehoor: – Het eerste is dat het de luisteraar aanmoedigt om het volume van het geluid van zijn speler te verhogen.

Ten tweede wennen onze oren aan dit type geluid, dat we zouden kunnen omschrijven als “gedematerialiseerd”, en het wordt traag.

Speciale gehoorstoornissen met betrekking tot MP3-formattering. Het menselijk oor is gewend aan het waarnemen van sterke dynamische contrasten en is niet gemaakt voor gecomprimeerde signalen in MP3-formaat. De compressie van de muziek zal in feite fungeren als optische illusie. Als we naar deze gecomprimeerde muziek luisteren, zullen we onbewust he