Stap voor stap compressie naar mp3.


Free Download Mp4Gain
picture



We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE



THIS PRICE ONLY LASTS FOR A FEW DAYS




De MP3 Encoder is dat programma dat het ongecomprimeerde digitale bestand (bijvoorbeeld een Wav-bestand) analyseert en het omzet in een MP3-bestand.

Het audiosignaal wordt gefilterd en verdeeld in 576 gebieden (subbanden genoemd) via een proces dat gebruik maakt van DCT (Discrete Cosine Transformation) en dat erin slaagt alle onnodige frequenties te elimineren. Het menselijk oor neemt, zoals reeds vermeld, geluiden alleen over een bepaalde drempel waar, zodat alle onderstaande audio niet wordt gecodeerd.

Auditory Perception

Op dit punt gaat het resulterende signaal door het psychoakoestische model waarin de maskerdrempels waarvan we eerder hebben gesproken, worden geïdentificeerd. Dit wordt gedaan met behulp van de discrete Fourier-transformatie (DFT, Discrete Fourier Transform).

Tijdens het maskeren van de 576 subbanden worden de te maskeren frequenties bepaald en kunnen daarom worden verwijderd.

Auditory perception

Na het maskeren wordt het gedefinieerde Stereo Ensemble-proces toegepast. Onder een bepaalde frequentie kan het oor de ruimtelijke positie van de geluiden niet waarnemen, dus kunnen ze met een aanzienlijke ruimtebesparing op een enkel kanaal (dus in mono-formaat) worden opgenomen.

Zodra het bestand gereed is, worden de gegevens verder geanalyseerd en gecomprimeerd met behulp van Hufmann-codering, wat een gegevensreductie (zonder verlies van informatie) van ongeveer 20% mogelijk maakt.

Op dit punt, nadat alle gegevens zijn verzameld, gaat de encoder verder met het maken van de bitstream die het uiteindelijke MP3-bestand zal vormen.

Compressiecriteria

Om een ​​dergelijke compressie uit te voeren, is het MP3-formaat gebaseerd op een eenvoudig concept: filter een digitaal muziekstuk en verwijder alle onnodige informatie, waardoor de ruimte wordt verminderd.

Het menselijk oor is een bijna perfect instrument, maar heeft ook zijn grenzen. De menselijke oordoorlaatband strekt zich uit van 20 Hz tot 20.000 Hz, maar is veel gevoeliger voor die in het middenbereik, 700 tot 6.000 Hz, waar de meeste informatie geconcentreerd is.
De studie van auditieve perceptie is een kwestie van psychoakoestiek die voornamelijk 2 factoren analyseert die later worden gebruikt bij MP3-codering:

Auditieve perceptie

Op het gebied van geluiden zijn er maar een paar te horen door het menselijk oor. De volgende afbeelding toont deze gebieden die de verschillende geluidsfrequenties vertegenwoordigen. Alleen degenen in het witte gebied zijn hoorbaar vanuit ons oor.

Maskeren

Maskeren is niets meer dan het superponeren van zwakke geluiden met harde geluiden. Het komt bijna altijd voor dat de klanken van verschillende instrumenten elkaar overlappen. In gevallen waar het hardste geluid het laagste volledig bedekt, is er een zogenaamde maskering. In MP3-bestanden kunt u met maskeren informatie verwijderen van de zwakste geluiden, die echter, omdat ze niet door het oor worden waargenomen, vrijwel irrelevant zijn.


Free Download Mp4Gain
picture

DIGITAL AUDIO uitgelegd

Audio is de elektronische informatie die geluid vertegenwoordigt, of beter gezegd, het hebben van geluid van tijdelijke aard is de stroom van informatie die het vertegenwoordigt.

Geluid bestaat uit drukgolven die door de ruimte reizen en wordt daarom voorgesteld door een sinusoïdaal.

Digital Audio

De kenmerken van een geluid zijn:

Amplitude: gemeten in Hertz (Hz) en bepaald door de frequentie van een geluid, hoe hoger de frequentie, hoe luider het geluid, hoe lager het is, hoe lager het geluid.

Intensiteit: het wordt gemeten in decibel (db) en wordt bepaald door de kracht van een geluid, hoe intenser een geluid is, hoe groter het volume.

Duur: Het wordt gemeten in seconden en dermaal hoe lang een geluid na verloop van tijd duurt.

Timbre: Het is niet direct meetbaar, maar het is die geluidsparameter waarmee we een trompet van een drum kunnen onderscheiden. Het vormt het spoor van een geluid en wordt gekenmerkt door harmonischen.

digital audio

ANALOOG EN DIGITAAL

Geluid kan op twee verschillende manieren worden weergegeven als elektronische, analoge en digitale informatie.

Analoge audio was de eerste, in chronologische volgorde, die werd ontwikkeld.

De informatie varieert op dezelfde manier als de informatie die ze vertegenwoordigt en kan (in theorie) elke waarde aannemen.

Als we de sinusgolf die een analoog geluid beschrijft enorm uitbreiden, zouden we zien dat het een doorlopende lijn is zonder onderbrekingen.

In plaats daarvan wordt digitale audio gecodeerd met een getallensysteem dat discretisatie mogelijk maakt (overgang van analoog naar digitaal), tijdens deze stap gaat informatie verloren, maar zodra het geluid is geschreven als een reeks getallen (digitale informatie) is het mogelijk om het te reproduceren. , verzend en wijzig het zonder kwaliteitsverlies, wat onmogelijk is met analoge informatie.

Als we de sinusgolf die een digitaal geluid vertegenwoordigt enorm uitbreiden, zouden we ons realiseren dat het geen doorlopende lijn is zoals in het vorige geval, maar een reeks punten die heel dicht bij elkaar liggen.

Het aantal van deze punten in een seconde aan informatie bepaalt de “bemonsteringsfrequentie”.

De hoeveelheid informatie die elk punt kan bevatten, wordt “bitdiepte” genoemd.

DE KENMERKEN VAN DIGITAAL GELUID

Bemonsteringsfrequentie

Bepaal het aantal monsters in één seconde aan informatie.

Het wordt uitgedrukt in Hertz (Hz) en neemt in het algemeen de volgende waarden aan in het muzikale veld: 22050Hz, 44100Hz, 96000Hz.

Volgens de stelling van Nyquist kan elke bemonsteringsfrequentie geluiden opnemen en reproduceren met een maximale frequentie die gelijk is aan de helft van de gekozen bemonsteringsfrequentie, wat betekent dat een stuk gesampled met 44 MHz alleen waarden tot 22 MHz kan aannemen

Beetje diepte

Bepaal de hoeveelheid informatie in elk monster.

Het wordt uitgedrukt in Bit (bit) en neemt in het algemeen de volgende waarden aan in het muzikale veld 8Bit, 16Bit en 24Bit.

Dit is vooral de parameter die afhangt van de kwaliteit van een geluid.

Overdrachtssnelheid (bitsnelheid)

Het is een kenmerk van codecs, dat wil zeggen van de “machinetaal” die wordt gebruikt om een ​​geluid te beschrijven.

Stelt de totale hoeveelheid informatie in die nodig is om een ​​seconde van een geluid af te spelen.

Het wordt uitgedrukt in Bit / s.

AUDIO VERWERKING

Of je het nu hebt over studio-opname of live optredens, het audiosignaal wordt nooit rechtstreeks van de microfoon naar de luidsprekers / opnamemedium gestuurd, maar wordt altijd eerst verwerkt via tools waarmee je verschillende interventies. in het geluid

Deze instrumenten kunnen analoog zijn, daarom hebben ze het instrument fysiek in de studio (die meestal in een plank wordt geplaatst), die moet worden aangesloten tussen de microfoon en de mixer of tussen de mixer en de luidsprekers / opnamemedium.

Of u kunt ze simuleren via enkele plug-ins voor uw computer.

Het is noodzakelijk om een ​​Daw (Digital Audio Workstation) te hebben, dit is de werkruimte waarin alle bewerkingen worden uitgevoerd. (Ableton, Cubase, Fruitloops, Logic, Reaper).

Binnen deze software is het mogelijk om kleinere te installeren, genaamd VST (Virtual Studio Technology), die de circuits van de studioapparatuur simuleren en het effect nabootsen.

(Er zijn ook andere propriëtaire plug-ins met andere extensies dan de klassieke VST zoals .component of .au).

Sommige tools zijn essentieel en worden gebruikt in alle audio-opnames, andere worden alleen gebruikt in bepaalde situaties of om bepaalde effecten te verkrijgen / vermijden.

De belangrijkste zijn:

Equalizer, wordt gebruikt om bepaalde frequenties te benadrukken of te verzwakken, op deze manier krijg je een schoner geluid en een minder “gemengde” mix waarbij alle instrumenten alleen de juiste frequenties bezetten, zonder elkaar te overlappen.

De compressor dient, zoals de naam al doet vermoeden, om het dynamische bereik te comprimeren, zodat het geluid consistenter en minder verspreid wordt.

Versterker, wankelend van verschillende soorten, wordt gebruikt om de intensiteit van een geluid te verhogen.

Limiter werkt op een vergelijkbare manier als de compressor, maar in plaats van alle frequenties te comprimeren, verzwakt het de frequenties die een vooraf bepaalde drempel (drempel) overschrijden, waardoor fouten worden voorkomen.

Reverb voegt een lichte nagalm toe die een geluid dat in een geluiddichte studio is opgenomen veel natuurlijker maakt dan dat het te “droog” zou zijn.

Met filters (high / low cut) kunt u een aantal nutteloze en weelderige frequenties te laag of te hoog knippen. (Het zijn slechts parametrische equalizers van 1 band).

Mp3 de winnaar

In het tijdperk van breedbandverbindingen, glasvezel en HD-video’s op YouTube blijft MP3 het referentieformaat voor audiobestanden. We zijn nu zo gewend om naar muziek in gecomprimeerde formaten te luisteren, en vaak via afspeelsystemen van slechte kwaliteit, dat het moeilijk voor ons is om te onthouden wat het luisteren naar muziek eigenlijk betekent. De recente evolutie van downloaden naar hit-and-run-streaming heeft de situatie alleen maar verergerd door de waarde van muziek verder te devalueren. Wanneer hebt u voor het laatst zonder onderbreking naar een plaat geluisterd en hebt u die 30-40 minuten besteed aan “eenvoudige” luisteractiviteit?

Audio formats

Uitgangspunt: dit bericht is geen kruistocht tegen Spotify omdat ik het zelf gebruik voor nieuwe releases of om wat achtergrondmuziek op het werk te hebben, het is niet eens een analoog versus digitaal (of vinyl versus cd versus mp3) bericht omdat over dit onderwerp nl Er is al veel gezegd. Mijn doel is om je te laten begrijpen wat je mist, in kwalitatieve termen, als je naar muziek luistert in gecomprimeerde formaten.

Audio formats

Bemonstering en theoretische aspecten.

Audio-opname op een computer of digitaal medium gaat ervan uit dat het signaal door een analoog> digitaal (AD) -omvormer gaat, zodat het door elektrische microfoons of muziekinstrumenten gegenereerde continue elektrische signaal wordt omgezet in een digitaal signaal (reeks van 0 en 1) dit proces wordt bemonstering genoemd. De uiteindelijke kwaliteit van de opname hangt af van verschillende factoren: kwaliteit van de converter, samplefrequentie en bitdiepte.

Om een ​​gemakkelijk te begrijpen vergelijking te maken: bij het opnemen van een film wordt de “analoge” realiteit die door ons oog wordt waargenomen, opgeslagen in een film die 24 frames per seconde in beslag neemt. Als we kijken naar de standaard van de audio-cd (44,1 kHz, 16 bits), worden voor elke seconde muziek 44100 foto’s gemaakt van de computer naar het continue elektrische signaal. Als we met de bemonsteringsfrequentie eenvoudig hebben vastgesteld hoeveel keer per seconde de golfvorm zal worden geanalyseerd, geven we aan de bitdiepte aan elk monster een numerieke waarde toe: 2 ^ 16 = 65.536 mogelijke waarden.

Als je je afvraagt ​​hoe het tot 44.100 is gekomen, verwijs ik je naar de stelling van Nyquist-Shannon.

Wanneer we op de opnameknop op onze computer drukken, via het hierboven beschreven PCM-proces (pulscodemodulatie), worden de bestanden opgeslagen in ongecomprimeerd WAV- of AIFF-formaat.

Lossless-bestanden en lossy-bestanden

PCM-bestanden nemen veel ruimte in op onze harde schijven omdat, zoals we hebben gezien, er gegevens nodig zijn om de analoge golfvorm zo gedetailleerd mogelijk te beschrijven. Ter indicatie: een WAV- of AIFF-bestand als audio-cd neemt 10 MB in beslag voor elke minuut muziek.

Om dit probleem te verhelpen, onthoud dat opslagruimte in het begin van de jaren 2000 ongeveer $ 10 / GB kostte, terwijl de prijs vandaag ongeveer $ 0,03 / GB is (bron): er zijn audioformaten geïntroduceerd die reduceert de grootte van het bestand door middel van een algoritme dat informatie codeert en decodeert. Deze codecs vallen in twee categorieën: formaten met compressie zonder verlies en formaten met compressie zonder verlies.

Zoals de naam al aangeeft, duidt verliesloze compressie op een vermindering van het bestandsgewicht (meestal rond de 50%) zonder verlies van informatie. ZIP- en RAR-bestanden laten de audiowereld even buiten beschouwing en zijn duidelijke voorbeelden van dit type compressie: we kunnen op elk moment een dergelijk bestand “uitpakken” en hebben zonder deze toegang weer toegang tot de originele informatie. geen enkele manier is veranderd.

De meest voorkomende bestandsindelingen zijn: FLAC (Free Lossless Audio Codec) en ALAC (Apple Lossless Audio Codec).

Lossy-compressie houdt daarentegen in dat een deel van de originele audio-informatie op de een of andere manier wordt verwijderd om een ​​bestand te verkrijgen dat zelfs 90% minder weegt dan de PCM.

Op basis van welke criteria wordt informatie verwijderd zonder de originele audio te veel in gevaar te brengen? Aangezien ons gehoor een onvolmaakt instrument is, maken codecs gebruik van twee principes van psychoakoestiek: de minimumdrempel van hoorbaarheid (het menselijk oor neemt niet alle frequenties in het bereik tussen 20 Hz en 20 kHz gelijkmatig waar) en maskeren (een zwakker geluid). wordt gemaskeerd, waardoor het onhoorbaar wordt, door een luider geluid.)

Compressiealgoritmen, hoe geavanceerd ook, introduceren een aantal artefacten in audiobestanden die, als ze worden afgespeeld in audiosystemen van discrete kwaliteit, gemakkelijk kunnen worden herkend of op zijn minst kunnen worden opgemerkt, zelfs door een onervaren oor. Verschillende onderzoeken hebben aangetoond dat een ongetraind oor het verschil niet onderscheidt tussen een ongecomprimeerd bestand en een MP3 met een bitsnelheid van 256 kb / s of meer.

De meest voorkomende lossy-formaten zijn: MP3, OGG Vorbis, AAC.

De overwinning van MP3

Sinds de introductie halverwege de jaren negentig is MP3 uitgegroeid tot het industriestandaard consumentenformaat dat wordt gevoed door het delen van bestanden via peer-to-peer-kanalen, waar, met langzame verbindingen, het zwaarste bestand het bestand was het werd gedownload, hoe langer het duurde om het te verkrijgen, en sinds de marktintroductie van mp3-spelers waarin we probeerden zoveel mogelijk muziek op te slaan, namen we daarom onze toevlucht tot zeer gecomprimeerde bestanden.

In de overgang van het downloadtijdperk naar dat van kleine transmissiebestanden zorgen ze voor een vlottere en vlottere datatransmissie.

Ondanks de evolutie die de afgelopen jaren heeft plaatsgevonden in de snelheid van internetverbindingen en de verlaging van de prijs van opslagsystemen, zijn er echter pas de laatste jaren diensten gecreëerd om bestanden te kopen van Hoogwaardige online audio (HD-tracks) of HD-streamingdiensten (Tidal).

Voorbeelden en audiobestanden.

De belangrijkste services die we gebruiken om muziek te kopen of te beluisteren, gebruiken deze compressieniveaus (alle informatie is afkomstig van de officiële websites van elke service op het moment dat deze publicatie werd geschreven).

Spotify: OGG Vorbis-bestanden met 96 kb / s (normale mobiele kwaliteit), 160 kb / s (normale desktop- en webspelerkwaliteit, hoge mobiele kwaliteit), 320 kb / s (premiumgebruikers: hoge desktopkwaliteit, zeer hoge kwaliteit mobiel).
iTunes: cd’s worden standaard geïmporteerd in AAC-bestanden van 128 kb / s. Bestanden in de iTunes Store zijn van deze kwaliteit, behalve “iTunes Plus” -nummers die zijn geconverteerd naar AAC met 256 kb / s.
Pandora: 64 kb / s AAC (gratis gebruikers), 192 kb / s AAC (premium gebruikers).
YouTube: HD-video’s (720 of 1080p) hebben een geluidskwaliteit van 384 kb / s, SD-video’s (360, 480p) hebben een geluidskwaliteit van 128 kb / s.

Multimedia-indelingen: digitale audio

Geluid is een continu signaal. Te bewaren met computersystemen
het moet worden bemonsterd, waardoor een digitaal signaal wordt verkregen.
De parameters die de steekproef kenmerken, zijn in feite drie:
 De samplefrequentie
 Beetje diepte
 Het aantal kanalen
deze parameters beïnvloeden zowel de ingenomen ruimte als de kwaliteit van het audiobestand
digitaal verkregen.

Digital Audio

Bemonsteringsfrequentie

De bemonsteringsfrequentie is de meting uitgedrukt in Hertz (Hz) van het getal
keer per seconde waarin een analoog signaal wordt gemeten en opgeslagen
in digitale vorm.

Sampling rate
Hoe hoger de samplefrequentie, hoe meer de volgorde van de samples
digitaal zal in de buurt komen van die van de originele analoge golfvorm.
Lage bemonsteringsfrequenties beperken het frequentiebereik dat is
kan opnemen, wat op zijn beurt een opname kan genereren die
reproduceert slecht het originele geluid.
Twee bemonsteringsfrequenties:
A. lage bemonsteringsfrequentie,
wat de golf van het originele geluid vervormt
B. hoog bemonsteringspercentage,
die de golf van perfect reproduceert
origineel geluid
Om een ​​bepaalde frequentie te reproduceren, de samplefrequentie
het moet minstens het dubbele zijn (stelling van Nyquist).
Audio-cd’s hebben bijvoorbeeld een samplefrequentie van 44.100 Hz,
zodat ze frequenties tot 22.050 Hz kunnen reproduceren, die nauwelijks worden gevonden
boven de menselijke perceptie van 20.000 Hz.
In de volgende tabel staan ​​de meest voorkomende bemonsteringsfrequenties voor
digitaal geluid.

Beetje diepte

De bitdiepte vertegenwoordigt het aantal bits dat wordt gebruikt om a op te slaan
enkele digitale sample.
Wanneer een geluidsgolf wordt gesampled, wordt elke sample toegewezen
de amplitudewaarde die het dichtst bij de oorspronkelijke golfamplitude ligt. Een diepte
in hoge bits levert het zoveel mogelijk amplitudewaarden op, wat resulteert in een
groter dynamisch bereik (het verschil in decibel tussen het maximale volume dat de component zonder kan volhouden)
vervorm de golven en het achtergrondgeluid dat het produceert), lager en hoger achtergrondgeluid
trouw.
Als u bijvoorbeeld 8 bits gebruikt, heeft u 256 mogelijke waarden (28
) dat betekent
relatief weinig, bieden minder geluidskwaliteit dan een
plakband; als in plaats daarvan 16 bits per sample worden gebruikt, worden 65536 waarden verkregen
mogelijk (216).
De meest voorkomende voorbeelden zijn de audio-cd, opgenomen in 16 bit, en de dvd, die
ondersteunt tot 24 bit diepte.

Compressie-indelingen

Hand in hand met de komst van digitalisering hebben multimediatoepassingen
ze komen steeds vaker voor totdat ze gemeengoed worden. Een van de
multimediafuncties is zeker het gebruik van digitale audio
klinker en geluid. Het grootste obstakel bij het digitaliseren van audio is
de grote omvang van de bestanden die worden geproduceerd, waardoor ze op staan
sectorale operatoren (vooral die met betrekking tot internet) het probleem van
verminder de ruimte die door de gegevens wordt ingenomen om het dubbele voordeel te verkrijgen van:
 besparen in termen van geheugenbezetting;
 bespaar op overdrachtstijd op het netwerk.
5
Om deze reden, sprekend over het digitaliseren van de audio, is het noodzakelijk om te spreken
ook van datacompressietechnieken. De compressietechnieken van de
gegevens, van welke aard dan ook, zijn onderverdeeld in:
 verliesvrij: gegevens comprimeren via een verliesloos proces
van informatie die gebruik maakt van redundantie in gegevenscodering
 verliesgevend: comprimeer de gegevens via een verliesgevend proces
van informatie die gebruik maakt van overtolligheden in het gebruik van gegevens

Lossless formaten

Lossless compressie formaten zijn eerder geschikt voor archivering dan voor
reproductie, omdat de meeste van hen volledig vereisen
decompressie voordat ze kunnen worden afgespeeld.
Een van de meest voorkomende compressieformaten zonder verlies is FLAC (Free Lossless
Audiocodec).

Lossy formaten

Lossy compressieformaten gebruiken compressiealgoritmen die in staat zijn
de hoeveelheid gegevens die nodig is om een ​​geluid op te slaan drastisch verminderen,
Dit garandeert echter een acceptabele en getrouwe reproductie van het originele bestand
ongecomprimeerd.