Vaarwel mp3?

Free Download Mp4Gain

We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE

THIS PRICE ONLY LASTS FOR A FEW DAYS

Vaarwel mp3?

MP3 is dead

Ons internetonderwerp van de dag: bijna 20 jaar geleden veroverde MP3 het internet. Nu is het compressieproces dat de muziek naar het netwerk bracht, verbroken.

MP3 Format Dead

Wat gebeurt er?

Het is bijna 20 jaar geleden dat de eerste digitale hackers zich bij “Napster” aanmeldden met 65k piepmodems en geduldig wachtten tot een enkel nummer na eindeloze minuten op hun eigen harde schijf belandde. Een paar jaar later was de iPod een ware rage – duizend nummers op één apparaat! MP3 was de toekomst van muziek.

Nu is MP3 dood: de Duitse Fraunhofer Society heeft aangekondigd dat er geen licenties meer zullen worden uitgegeven voor MP3-codering.

Dit is in de eerste plaats een symbolische handeling. MP3-bestanden en spelers zullen blijven werken. De Fraunhofer Foundation erkent eigenlijk alleen wat al lang een feit is: de dagen van mp3 zijn voorbij.

MP3-compressie werd eind jaren tachtig uitgevonden in het Fraunhofer Institute for Integrated Circuits en vervolgens verder ontwikkeld en gecommercialiseerd.

Omdat het interessant is?
MP3 speelt tegenwoordig nauwelijks een rol – wanneer u tegenwoordig een muziekbestand downloadt, is het meestal niet in MP3-formaat. Apple is bijvoorbeeld lang geleden overgestapt op een ander bestandsformaat.

Met de iPod had het bedrijf een belangrijke bijdrage geleverd aan het succes van het bestandsformaat. En streamingdiensten zoals Spotify gebruiken ook verschillende compressiemethoden. Omdat tegenwoordig andere compressiemethoden een aanzienlijk betere geluidskwaliteit bieden met een nog kleinere bestandsgrootte.

Het is niet duidelijk of MP3 volledig zal verdwijnen. Het feit dat de Fraunhofer Foundation haar licentieprogramma beëindigt, betekent dat iedereen vrij kan werken met mp3-codering. Wellicht krijgt het format daardoor zelfs een kleine opleving te zien.

Free Download Mp4Gain

MP3 Basics: Psychoakoestiek

MP3 Basics: Psychoakoestiek

Psychoacoustics

Tien uur muziek op één cd. En dat zonder hoorbaar kwaliteitsverlies. MP3 maakt het mogelijk. maar hoe werkt het?
De kern van MP3 is een compressieproces dat onnodige informatie eruit filtert. Bij MPEG-audio betekent het wegfilteren van overtollige informatie het verminderen van de gegevens die het menselijk oor niet of nauwelijks kan waarnemen. De basis hiervoor is psychoakoestiek. Deze wetenschap gaat over hoe het menselijk oor geluid waarneemt en is de sleutel tot MP3-technologie.

Psychoacoustics

Stel je voor dat je in de disco bent. Muziek klinkt uit enorme dozen. Dit is hard werken aan het oor, aangezien geluidsniveaus van 110 dB en meer worden bereikt. Vanwege het extreme volume is het bijna onmogelijk om te spreken, tenzij je tegen jezelf schreeuwt. In de akoestiek wordt dit maskering genoemd. Om maskering te voorkomen, moet het geluidsniveau van de spraak zo hoog worden verhoogd dat het storende signaal (in dit geval luide muziek) het niet langer dekt.

Psychoakoestiek is slechts een onderdeel van MP3-codering. Het audiosignaal gaat door veel meer stations. In figuur 2 zie je de basisstructuur van een mp3-encoder.

Een audiosignaal gaat door een filterbank die het signaal in afzonderlijke gebieden (subbanden) verdeelt. Tegelijkertijd gaat het audiosignaal door het psychoakoestische model. Hier wordt de maskeerdrempel voor elke component bepaald met behulp van de discrete Fourier-transformatie (DFT). Het psychoakoestische model specificeert onder meer de maximaal toelaatbare kwantisatiefout waarmee codering nog kan worden uitgevoerd zonder dat het menselijk oor wordt waargenomen. Om dit te doen, specificeert u het aantal coderingsbits dat nodig is om de kwantiseringsruis zodanig te verminderen dat deze (bijna) onhoorbaar wordt. In de laatste stap worden de data, de eerder verdeelde subbanden, zo verwerkt (geformatteerd) dat een stroom bits wordt verkregen die een decoder kan ontcijferen.

MP3-CODERING

MP3-CODERING

Mp3 encoding

De eerste stap bij het coderen door de gebruiker is het specificeren van een bitsnelheid. Dit geeft de kwaliteit en tegelijkertijd de opslagbehoefte van een mp3-bestand aan.

COMPRESSIE TARIEVEN

Bij de meeste opnameprogramma’s kan de kwaliteit van een mp3-bestand vrij worden gekozen voordat de opname begint. Volgens het Fraunhofer Instituut is de cd-kwaliteit van een mp3-bestand een bitsnelheid van 112 tot 128 kbit per seconde, andere metingen stellen de cd-kwaliteit op tot 160 kbit per seconde. De meest gebruikte en voldoende voor de meeste luisteraars is echter 128 kbit.

Ter vergelijking: een overeenkomstige cd-kwaliteit voor Layer 1 is 384 kbit / s en 256 kbit / s voor Layer 2. Een wave-bestand werkt met een bitsnelheid van 1,4 Mbit / s en werkt daarom met ongeveer dezelfde ruimtevereisten. als een cd-audiotrack (CDA).

74 of 80 minuten muziek kan op een cd worden gezet (afhankelijk van de grootte van de geluidsdrager), in mp3-formaat met een bitsnelheid van 128 kbit / s zou 11,5 of 12,4 uur mogelijk zijn.

PSYCHO-AKOESTIEK

MP3-audiocompressie is afhankelijk van het wegfilteren van onnodige informatie. Psychoakoestiek is een wetenschap die zich bezighoudt met de perceptie van geluid door het menselijk oor.

Bijv: je bent in een disco. Harde muziek schiet door enorme luidsprekers en je probeert met elkaar te praten. Dit is bijna onmogelijk, tenzij je schreeuwt. In de akoestiek wordt dit maskering genoemd. Om maskering te voorkomen, moet het geluidsniveau van spraak zodanig worden verhoogd dat het stoorsignaal (in dit geval muziek) het niet langer dekt.

Dergelijke processen behoren tot de fundamentele gebieden van de psychoakoestiek.

Tonen onder deze drempel zijn niet hoorbaar en worden daarom ruis tijdens MP3-opname (overgeslagen).

De overlays werken als volgt: je hebt bijvoorbeeld (foto 2) een toon met 1 kHz (1) en een andere toon met 1,1 kHz, die ongeveer 18 dB lager is (2). De tweede tint is volledig over de eerste heen gelegd. Dit werkt ook voor andere zwakkere tonen (zie afb. 2). Een andere toon met een frequentie van 2 kHz, die ook 18 dB zachter is dan de eerste, zou niet overlappen omdat hij net buiten de drempel van de eerste toon valt.

Ruis kan een andere compressie-optie zijn voor MP3-opnames. Het feit dat wanneer een geluid wordt gedigitaliseerd, het niet met een oneindige frequentie kan worden bemonsterd, wordt een geluid gegenereerd dat niet waarneembaar is voor het menselijk oor (kwantiseringsruis). Het wordt gebruikt als model voor de MPEG-audiolaag en verhoogt zo de ruis rond een toon. Bovenal maskeren harde en korte tonen een bepaald bereik in het frequentiebereik voor en na zichzelf, waar de zwakste signalen niet hoorbaar zouden zijn. Met MP3-codering neemt het ruisniveau in dit gebied toe, alsof het met een lagere resolutie is gedigitaliseerd.

Er is ook maskering in het slaapgebied: het gehoor heeft een zogenaamde “hersteltijd” nodig voor harde en zachte geluiden totdat het weer volledig functioneel is. Dit is vooral merkbaar bij sterke, korte en snel stijgende tonen. Na een vertraging van ongeveer 5 ms zakt de gehoordrempel weer en na ongeveer 200 ms bereikt het het normale niveau, de zogenaamde rusthoordrempel. Dit effect wordt postmaskering genoemd. Het effect van voormaskeren is minder belangrijk, maar nog indrukwekkender: het is gebaseerd op het feit dat de hersenen harde geluiden sneller verwerken dan zachte. Tot op zekere hoogte weegt de sterke impuls zwaarder dan de stille op weg naar de hersenen. Dit resulteert in een voormaskeringstijd van maximaal 20 ms.

Het bovenstaande psycho-akoestische algoritme wordt gebruikt in de volgende stappen:
– Audio-informatie is onderverdeeld in subbanden
– Subbands worden verminderd
– Er worden 16-bits samples gegenereerd
– Monsters zijn gecomprimeerd
– Gecomprimeerde samples worden gecombineerd tot blokken
– Codering volgens Huffmann-procedure
: samenvatting in tabellen

VERDEELD IN ONDERBANDEN

Afhankelijk van de frequentie van de akoestische informatie is deze onderverdeeld in 32 subbanden. De banden hebben verschillende maten door aanpassing aan het menselijk oor volgens een psychoakoestisch model.

De verdeling gebeurt met behulp van een meerfasig filter. Dit betekent dat de samples tegelijkertijd worden gedecimeerd en gefilterd.

In de lagen 1 en 2 hadden de banden dezelfde grootte met een bandbreedte van elk 625 Hz. De reden voor deze indeling is om het algoritme een beter doel te geven.

ONDERBAND VERMINDERING

De MP3-encoder onderzoekt nu elk van de subbanden volgens het psycho-akoestische model voor vervangbare frequenties. Hier wordt de maskerdrempel bepaald, waarna de subbanden waarvan het niveau onder deze maskeerfunctie ligt, worden verwijderd. Een andere reden om een hele subband te laten vallen, kan zijn dat deze onhoorbaar is vanwege de toonhoogte, vergelijkbaar met het fluitje van een hond.

CONVERSIE IN 16-BIT MONSTERS

De frequentiebanden worden bemonsterd en geconverteerd naar 16-bits samples. Tonen worden opgesplitst in digitale signalen en verder verwerkt als numerieke waarden. De samplefrequentie bepaalt de lengte van de sample-intervallen. Noch de meting van de amplitude, noch de grootte van de bemonsteringsintervallen kunnen echter oneindig nauwkeurig zijn. Om deze reden wordt bij analoog-digitaalconversie een waarde afgerond tussen twee monsterpunten. Dit resulteert in afrondingsfouten die worden opgemerkt in wat bekend staat als kwantiseringsruis. Met de hoogst mogelijke resolutie kan dit onhoorbaar worden gehouden: met 8 bit kunnen maximaal 256 niveaus worden weergegeven, met 12 bit al 4096 en met 16 bit 65536 individuele stappen, zodat er geen ruis te horen is.

Sommige samples worden echter ook gedigitaliseerd met een lagere samplefrequentie. In de achtste subband is er bijvoorbeeld een toon met 1 kHz en 60 dB. De MPEG-audio-encoder berekent nu de maskeerdrempel en herkent dat deze 36dB lager is. De acceptabele signaal-ruisverhouding is hier 24 dB, wat overeenkomt met een 4-bits resolutie, aangezien de twee waarden direct gerelateerd zijn. Als u een bit uit resolutie laat, neemt het ruisniveau toe met 6dB. Aangezien een audio-cd doorgaans met 16 bits wordt gedigitaliseerd, kan hier een aanzienlijke datareductie worden toegepast.

VOORBEELD COMPRESSIE

De volgende stap is om de samples verder te comprimeren. Dit proces heeft echter niets meer te maken met de originele tinten. Vanaf nu is compressie alleen gegevensgestuurd.

Elke sample bestaat uit 16 bits, maar ze zijn niet allemaal absoluut noodzakelijk om een niveau weer te geven. Zo kunnen voorloopnullen worden weggelaten. Als voor een sample bijvoorbeeld de waarde 0000011101010101 wordt verkregen, kapt het algoritme het resultaat af tot 11101010101. Om de oorspronkelijke 16 bits uit deze informatie te reconstrueren, heeft de decoder twee stukjes informatie nodig: de schaalfactor en de bittoewijzing. De schaalfactor geeft aan waar de resterende bits van de sample zich in hun oorspronkelijke staat bevonden. De bitmapping bevat de informatie over hoeveel bits er nog over zijn in de sample, aangezien je niet meer kunt rekenen met een vast 16-bit getal. Als u deze waarden echter voor elk monster afzonderlijk zou opslaan, zou u niet veel winnen,

GROEPEREN VAN DE MONSTERS

De 16-bits samples die zojuist zijn gemaakt, worden nu gecombineerd in blokken. Hiervoor zijn er twee verschillende bloklengten: de korte blokken met twaalf samples en de lange blokken met 36 samples.

Voor lage frequenties worden lange blokken gebruikt. Lange blokken zouden echter niet voldoende resolutie bij hogere frequenties mogelijk maken; hier worden korte blokken gebruikt. In de zogenaamde mixed block-modus worden lange blokken gebruikt voor de twee frequentiebanden met de laagste frequenties. Voor de overige 30 frequentiebanden is het de beurt aan de korte blokken. Deze modus maakt een betere frequentieresolutie in de lage frequenties mogelijk zonder hulde te brengen aan de bemonsteringsfrequentie in de hoge frequenties.

HUFFMANN CODERING

De laatste stap in MP3-compressie is Huffmann-codering. Dit algoritme wordt bijvoorbeeld ook gebruikt in verpakkingsprogramma’s zoals WinZip. De frequentie van bepaalde waarden is hierbij belangrijk. De subbanden zijn echter van tevoren georganiseerd. Subbands met lagere frequenties bevatten doorgaans aanzienlijk meer waarden dan die met hoge frequenties. De subbanden zijn op basis van hun frequentie onderverdeeld in drie groepen. Elk gebied heeft zijn eigen Huffmann-boom (afb. 3) om de optimale compressiefactor te bereiken.

Als eerste stap sluit de encoder hoge frequenties uit; codering is hier niet nodig, aangezien de grootte kan worden afgeleid uit die van de andere twee regio’s. Het middenfrequentiebereik wordt behandeld zoals het is, en de lage frequenties worden weer onderverdeeld in drie regio’s, die elk een eigen Huffmann-boom krijgen. Het uiterlijk van een Huffmann-boom wordt opgeslagen in het mp3-bestand.

De structuur van een Huffmann-boom werkt als volgt: vaak voorkomende waarden krijgen een korte reeks bits, terwijl zeldzame waarden een lange krijgen, dus het algoritme bepaalt eerst de verdeling van waarden binnen de gegevens die moeten worden gecomprimeerd.

Om te bepalen wat bekend staat als de Huffman-boom, begin je met de twee zeldzaamste waarden. Ze krijgen een “0” of een “1” toegewezen. De twee waarden worden samengevat, in de volgorde waarin ze nu worden weergegeven door de som van hun frequentie. Hetzelfde geldt voor de volgende twee zeldzamere waarden. Dit proces eindigt wanneer er nog maar één waarde overblijft. Het resultaat van deze procedure is een boomstructuur. De codering is gebaseerd op deze structuur. Elke tak aan de linkerkant krijgt een 0, elke tak aan de rechterkant wordt aangeduid met een “1”. In ons kleine voorbeeld zou het minst voorkomende zijn

Waarde 4 weergegeven door de reeks bits 010. Aan de meest voorkomende waarde 6 wordt daarentegen een eenvoudige 1 toegewezen.

SAMENVATTING VAN HET KADER

Het resultaat van bovenstaande compressie wordt samengevat in zogenaamde frames. Elk van deze frames bevat 1152 samples (32 subbanden x 36 samples). Een frame bestaat uit een header, een checksum check, de eigenlijke audiogegevens en in bepaalde gevallen een zogenaamde bit repository. Een dergelijke afzetting ontstaat wanneer de monsters binnen het frame zodanig kunnen worden gecomprimeerd dat niet het volledige theoretische aantal bits in een frame nodig is. De encoder kan op deze buckets terugvallen als de beschikbare bits onvoldoende zijn voor een volgend frame. Er moet onderscheid worden gemaakt tussen twee termen: framemaat en framelengte.

De grootte van het frame wordt bepaald door het aantal samples en is constant binnen een laag. In Layer 1-formaat zijn dit altijd 384 samples per frame, in Layers 2 en 3 1152 per frame. De lengte van het frame kan echter verschillen op laag 3 vanwege de verandering in bitsnelheid of het deponeren van niet-gevulde bits. Het frame bevat ook de eerder genoemde informatie over de schaalfactor en bittoewijzing om alle samples opnieuw te kunnen reconstrueren.

Een bestandskop, zoals bekend van andere bestandsindelingen, bestaat niet in een mp3-bestand. In het geval van een afbeeldingsbestand zou een koptekst informatie bevatten over de hele afbeelding (bijv. Grootte, kleurdiepte, resolutie

Codeer MP3 correct

Codeer MP3 correct

encode mp3

Als de audiobestanden worden opgeslagen in mp3-formaat, worden signalen die voor mensen onhoorbaar zijn, onderbroken. We zullen u vertellen hoe u MP3 correct codeert om de best mogelijke kwaliteit te bereiken.

Wat is mp3

Om een MP3 optimaal te coderen, is het belangrijk om een idee te hebben hoe MP3 werkt:
MP3 is een audiocodec die is ontwikkeld door het Fraunhofer Instituut, in het bijzonder Karlheinz Brandenburg, voor de MPEG I-standaard.
MP3 is een compressiemethode die Psychoakustig gebruikt: Het audiosignaal wordt opgedeeld in smalle frequentiebanden. Spectrale componenten die mensen gedeeltelijk of volledig horen, worden met minder precisie opgeslagen.
Hoe lager de gespecificeerde bitsnelheid, hoe onnauwkeuriger de afbeelding is, en hoe waarschijnlijker het is dat frequenties boven de maskerdrempel ook onnauwkeurig worden opgeslagen.

Codeert MP3 optimaal

Afhankelijk van of u muziek extraheert van een cd, spraakopnamen of analoge media-opnamen, worden die records gecodeerd, het zijn deels verschillende instellingen. Anderen zijn altijd logisch. U kunt alle instellingen doen, bijvoorbeeld in XMedia Recode, die CHIP Online gratis aanbiedt.
In het algemeen is het zinvol om de samplefrequentie van het te coderen bestand te behouden. Met audio-cd is dit 44100Hz. Voor opnames op schijven of cassettes is 32000Hz voldoende, spraak is zelfs op 22050Hz nog goed verstaanbaar.
Voor pure spraakopnamen is mono voldoende; voor muziek is joint stereo meestal efficiënter dan single stereo, aangezien sommige bits zonder verlies kunnen worden opgeslagen via mid-side codering.
Als bitrate-modus is VBR-ABR (Variable Bit Rate – Average Bit Rate) altijd de voorkeursmethode: in regio’s waar de frequentiebereiken duidelijk zijn gemaskeerd of waar absolute stilte heerst, er wordt een extreem grote hoeveelheid data opgeslagen die ergens anders zinvol is. Het kan gebruikt worden. Afhankelijk van het type signaal kan een mp3 met een gemiddelde VBA-ABR-bitsnelheid van 128 kbps aanzienlijk nauwkeuriger zijn dan een bestand met constante bitsnelheid (kBR) van 160 kbps. In ieder geval is het met dezelfde bestandsgrootte altijd minstens zo goed als een KBR-bestand met dezelfde bitsnelheid.
Om van dit potentieel te profiteren, moet u de VBR-kwaliteit instellen op het maximum, de minimale bitsnelheid op 32 kbps en het maximum op 224.
Afhankelijk van de nuances van je muziek is een gemiddelde bitsnelheid van 128 tot 192 kbps meestal ideaal. Monobestanden hebben natuurlijk maar de helft van de bitsnelheid nodig. Voor spraak zijn 32 tot 48 voldoende voor begrip, tot 64 kbps voor iets helderder geluid. Hier kun je ook een hoogdoorlaat van ongeveer 90 Hz gebruiken.
De beste kwaliteit krijg je natuurlijk als je de kwaliteit op “hoog” zet. Het coderen duurt iets langer, maar met de huidige processorprestaties is dit niet significant.
Het is volkomen nutteloos om later een MP3 met betere kwaliteit te coderen of om een monobestand in stereo op te slaan.