Audiocodering


Free Download Mp4Gain
picture



We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE



THIS PRICE ONLY LASTS FOR A FEW DAYS




Audiocodering

AUDIO CODING

Er zijn veel verschillende manieren om digitale audio op te slaan.

Advanced Audio Coding

Het gedigitaliseerde geluid is een reeks signaalamplitudewaarden,
regelmatig genomen.

PULSCODE-MODULATIE
Laten we apart zetten om één waarde van de signaalamplitude in het geheugen op te nemen
computer N bits. Daarom kan men met behulp van één N-bit-woord beschrijven
2
𝑁 verschillende betekenissen. Laat de amplitude van het gedigitaliseerde signaal naar binnen fluctueren
binnen het bereik van 0 tot 1 van sommige conventionele units. Stel je dit bereik voor
amplitudeveranderingen in de vorm van 2
Gelijke intervallen. Nu, voor ieders record
afzonderlijke amplitudewaarde, moet deze naar het dichtstbijzijnde worden afgerond
kwantisatieniveau (zie kwantisatieruis). Dit proces heet
kwantisering in amplitude (niveau). Amplitudekwantisering – proces
vervanging van reële waarden van de signaalamplitude door waarden die benaderd worden
enige precisie. Elk van 2
𝑁 mogelijke niveaus wordt een niveau genoemd
kwantisatie, en de afstand tussen de twee dichtstbijzijnde kwantiseringsniveaus
genaamd de kwantiseringsstap. Als de amplitudeschaal is opgedeeld in niveaus
lineair, dan is de kwantiseringsstap ∆ =
1
2𝑁
… Deze manier om een ​​signaal te digitaliseren –
bemonstering van het signaal in de tijd in combinatie met de homogene methode
kwantisatie – zogenaamde lineaire pulscodemodulatie (PCM)
(Linear Pulse Code Modulation – LPCM) of gewoon PCM (PCM).
Om geluid op digitale media op te nemen of via communicatiekanalen te verzenden (zie.
SPDIF-interface) gegevens in parallelle code worden gecodeerd wanneer
schuifregister, geklokt door een hulpgenerator. Bij de uitgang
schuifregister worden pakketten met gecodeerde pulsen gevormd in
sequentiële code.
2
Standaard audio-cd (cd-da) sinds begin jaren 80
jaren van de 20e eeuw, slaat informatie op in PCM-formaat met een frequentie
44,1 kHz bemonstering en 16-bits kwantisering.
Er zijn verschillende soorten PCM die ongelijkmatig gebruiken
kwantisatiestap (niet-uniforme PCM). Niet-uniforme (niet-lineaire) methode
kwantisering voorziet in het verdelen van de amplitudeschaal in niveaus, volgens
niet-lineaire (meestal logaritmische) wet. Op deze manier
kwantisering wordt logaritmische kwantisering genoemd. Gebruik makend van
logaritmische amplitudeschaal, in het gebied van zwakke amplitude blijkt
een groter aantal kwantiseringsniveaus dan in het gebied met sterke amplitude (in dit geval
het totale aantal kwantiseringsniveaus blijft hetzelfde als in het geval van een uniform
kwantisering). De relatieve fout is const.
Een alternatieve A / D-conversiemethode is
differentiële (verschil) pulscodemodulatie DPCM
(Differentiële PCM). In het geval van DPCM wordt niet de amplitude zelf gekwantiseerd,
en het verschil tussen de huidige en de vorige gemeten. In volledige analogie met
PCM, verschil PCM kan worden gecombineerd met zowel uniforme als
en ongelijke kwantisering. Voor audiogegevens, dit type modulatie
vermindert het vereiste aantal bits per telling met ongeveer 25%.
3
Verschilcodering heeft veel verschillende opties. Adaptief bijvoorbeeld
DPCM (ADPCM, ADPCM) – een soort DPCM met variabele toonhoogte
kwantisering. Door de toonhoogte te wijzigen, kunt u de bandbreedtevereisten verminderen
transmissie bij een gegeven signaal-ruisverhouding.
Een blok met gedigitaliseerde audio-informatie kan naar een bestand worden geschreven zonder
veranderingen, dat wil zeggen, een reeks amplitudewaarden die beschrijft
audiogolfvorm, d.w.z. ongecomprimeerd. Hiervoor wordt het meestal gebruikt
.WAV-indeling. Waveform Audio File Format (WAVE, WAV, van waveform) –
een containerbestandsformaat voor het opslaan van een opname van een gedigitaliseerde audiostream,
RIFF-ondersoorten. Deze container wordt meestal gebruikt om ongecomprimeerd op te slaan
geluid in pulscodemodulatie. De container legt er echter geen op
beperkingen op het gebruikte coderingsalgoritme


Free Download Mp4Gain
picture

Geluidsopname

Geluidsopname

Phonograph Thomas Alva Edison

Het tijdperk van mechanische geluidsopname begon in 1877, toen Thomas Alva Edison de grammofoon uitvond.

Gramophon

In feite zijn grammofoons, grammofoons en zelfs moderne vinylspelers verbeterde grammofoons; het principe van het opnemen van geluid in een spiraalvormige groef op een medium is immers ongewijzigd gebleven.

In 1900 demonstreerde de Deense ingenieur W. Paulsen op de Wereldtentoonstelling in Parijs een werkend model van een magnetisch opnameapparaat dat was gemaakt als alternatief voor de uitvinding van Edison. Voor het eerst in de geschiedenis van de mensheid klonk een menselijke stem op een magnetische opname: de verbaasde Parijzenaars hoorden de stem van de Oostenrijks-Hongaarse keizer Franz Joseph het fluiten breken. Vanaf dit moment begon misschien de ware geschiedenis van geluidsopname, waarvan de theorie werd gecreëerd in de jaren 30 van de 20e eeuw.

Geluid is een complex analoog signaal. Voor de analyse van dergelijke signalen wordt een techniek gebruikt die veel wordt gebruikt in de radio-elektronica. Met behulp van de Fourier-transformatie wordt een complex signaal omgezet in een harmonische reeks bestaande uit sinusoïden met verschillende frequenties en amplitudes. Maar in de praktijk is het signaal waar we mee te maken hebben natuurlijk heel anders dan het sinusvormige signaal.

Muzikanten noemen de eerste harmonische in dit spectrum de grondtoon, en harmonischen met hogere frequenties worden harmonischen genoemd. De hoofdtoon bepaalt de toonhoogte en de harmonischen geven het een bepaalde kleur, waardoor het timbre van een stem of muziekinstrument ontstaat.

Om de spectra van audiosignalen te bestuderen, worden complexe en dure instrumenten gebruikt – spectrumanalysatoren.

Met behulp van dergelijke apparaten kan worden vastgesteld dat sommige muziekinstrumenten, zoals een viool, een relatief uniform spectrum hebben en sommige windspectra met uitgesproken maxima en minima, formanten genaamd.

Er zijn geen termen die de kleuring van het timbre van een menselijke stem of muziekinstrumenten rechtstreeks beschrijven, dus het is noodzakelijk om toevlucht te nemen tot verschillende metaforen zoals “diep timbre”, “hard timbre”, “metaalachtig” geluid of zelfs “transistor”.

Pogingen om digitale informatieverwerkingsmethoden te gebruiken in verband met geluidsopname werden vele malen gedaan, maar de eerste serieuze resultaten werden bereikt in het begin van de jaren tachtig van de 20e eeuw en vielen samen met de snelle ontwikkeling van computers en de succesvolle microminiaturisatie van radiocomponenten. Het gebruik van digitale geluidsverwerkingstechnieken heeft opwindende nieuwe mogelijkheden geopend.

Om geluid op een computer te verwerken, moet het eerst worden geconverteerd naar een digitaal, gecodeerd formaat. Een analoog signaal wordt gecodeerd door apparaten die analoog-naar-digitaal converters (ADC’s) worden genoemd. De belangrijkste methode voor het coderen van een analoog signaal is pulscodemodulatie, die uit drie bewerkingen bestaat: bemonstering, kwantisering en codering.

We zullen nu niet ingaan op de coderingstheorie, vooral omdat het vrij ingewikkeld is en hogere wiskundige vaardigheden vereist. Het is belangrijk voor ons om te begrijpen dat de kwaliteit van het gedigitaliseerde geluid en de grootte van het resulterende bestand afhankelijk zijn van de samplefrequentie en bitdiepte.

De samplefrequentie is de frequentie waarmee de karakteristieken van een audiosignaal worden gemeten. Uit Kotelnikovs bemonsteringsstelling volgt dat om een ​​niet-vervormd digitaal signaal te verkrijgen, de bemonsteringsfrequentie ten minste tweemaal de hoogste frequentie van het gecodeerde signaal moet zijn. Daarom moet bij het coderen van een audiosignaal de samplefrequentie ten minste 40 kHz zijn. In digitale communicatiesystemen is de bemonsteringsfrequentie 32 kHz, in laser-cd-spelers en digitale bandrecorders voor consumenten – 44,1 kHz. Bij digitale studioapparatuur is de samplefrequentie zelfs nog hoger: 48 kHz.

De bitdiepte van het opgenomen geluid is het aantal geheugenbits dat is toegewezen om elke waarde van de amplitude van het geluidssignaal op te nemen op het moment van de meting. Moderne geluidskaarten gebruiken 8 of 16 bits geheugen per dimensie en er zijn 32-bits kaarten van hogere kwaliteit beschikbaar. Hoe hoger de bitdiepte, hoe hoger de kwaliteit van het gedigitaliseerde geluid.

Zoals eerder vermeld, hangt de grootte van een audiobestand af van de samplefrequentie en bitdiepte van het geluid. Dus met een samplefrequentie van 44 kHz en een geluidsdiepte van 16 bits, vereist een minuut geluid een bestandsgrootte van 5,3 MB en met een samplefrequentie van 11 kHz en 8 bits, 660 Kb.

Het is duidelijk dat een dergelijke verspilling van schijfruimte onaanvaardbaar bleek en er zijn speciale algoritmen en formaten gemaakt voor goedkopere opslag van audiobestanden.

Parameters die de kwaliteit van digitale audio beïnvloeden. (Deel 3)

Parameters die de kwaliteit van digitale audio beïnvloeden. (Deel 3)

digital audio

De kwaliteit van het verkregen digitale geluid hangt af van het aantal metingen van het geluidsvolume per tijdseenheid, dat wil zeggen de bemonsteringsfrequentie.

DIGITAL AUDIO

Audio sample rate is het aantal metingen van het audiovolume in één seconde.

Hoe meer metingen er in één seconde worden gedaan (hoe hoger de bemonsteringsfrequentie), hoe nauwkeuriger de “ladder” van het digitale audiosignaal de curve van het analoge signaal herhaalt.

Elke “stap” van de grafiek krijgt een bepaalde waarde voor het geluidsvolume. Loudness-niveaus kunnen worden gezien als een reeks mogelijke N-toestanden (gradaties), waarvoor een bepaalde hoeveelheid I-informatie nodig is om te coderen, wat audiocoderingsdiepte wordt genoemd.

De diepte van de audiocodering is de hoeveelheid informatie die nodig is om de discrete volumeniveaus van digitale audio te coderen.

Als de coderingsdiepte bekend is, kan het aantal digitale audiovolumeniveaus worden berekend met de algemene formule N = 2 I.

Als de audiocoderingsdiepte bijvoorbeeld 16-bits is, is het aantal audiovolumeniveaus:

N = 2 ik = 2 16 = 65536.

Tijdens het coderingsproces krijgt elk geluidsvolume zijn eigen 16-bits binaire code toegewezen, het laagste geluidsniveau komt overeen met de code 0000000000000000 en het hoogste – 1111111111111111.

Gedigitaliseerde audiokwaliteit

Hoe hoger de samplefrequentie en de diepte van de audiocodering, hoe beter het gedigitaliseerde geluid zal klinken en hoe beter u het gedigitaliseerde geluid dichter bij het originele geluid kunt brengen.

De hoogste kwaliteit van gedigitaliseerd geluid, overeenkomend met de kwaliteit van een audio-cd, wordt bereikt met een bemonsteringssnelheid van 48.000 keer per seconde, een bemonsteringssnelheid van 16 bits en de opname van twee audiotracks (stereomodus) .

Houd er rekening mee dat hoe hoger de kwaliteit van het digitale geluid, hoe groter het informatievolume in het audiobestand.

In een digitaal stereogeluidsbestand met een duur van 1 seconde met een gemiddelde geluidskwaliteit (16 bits, 24.000 metingen per seconde) kun je gemakkelijk een schatting maken van het volume aan informatie. Hiervoor moet de coderingsdiepte worden vermenigvuldigd met het aantal metingen per seconde en vermenigvuldigd met 2 kanalen (stereogeluid):

16 bits × 24.000 × 2 = 768.000 bits = 96.000 bytes = 93,75 KB.

Er zijn drie hoofdtypen audiocijfers:

formaat – geen compressie;
formaat (lossy) – compressie met verlies;
formaat (zonder verlies): compressie zonder verlies.
Lossy-compressie: technologie waarbij het gecodeerde bestand aanzienlijk wordt verkleind in vergelijking met het origineel, doordat informatie wordt verwijderd die niet door het menselijk oor wordt waargenomen.

De keerzijde van deze technologie is het feit dat het gecomprimeerde bestand nooit identiek zal zijn aan het origineel.

Lijst met de meest voorkomende verliesformaten:

AAC (.m4a, .mp4, .m4p, .aac): geavanceerde audiocodering (vaak in MPEG-4-container)
MP2 (MPEG-laag 2)
MP3 (MPEG-laag 3)
MPC (bekend als Musepack, voorheen MPEGplus of MP + genoemd)
Ogg Vorbis
WMA (Windows Media Audio)

Lossless – Lossless gecomprimeerde audioformaten, waaronder:

FLAC (gratis verliesloze audiocodec)
APE (mono audio)
WV (WavPack)
Deze formaten zijn in staat CD om te zetten naar digitaal formaat met behoud van kwaliteit. U kunt bijvoorbeeld een cd nemen, deze naar WAV converteren, vervolgens WAV naar FLAC, dan teruggaan van FLAC naar WAV en deze vervolgens op een lege cd branden en u hebt een absoluut identieke kopie van uw broncode.

Welk formaat klinkt de muziek met de beste kwaliteit?
De meest populaire is het verliesvrije FLAC-formaat en een van de meest gebruikte conversieprogramma’s van CD naar FLAC is EAC (Exact Audio Copy).

Van alle parameters van digitale audio moet in de eerste plaats aandacht worden besteed aan de volgende indicatoren:

bemonsteringssnelheid (precisie van het digitaliseren van een analoog signaal in de tijd),
bitsnelheid (hoeveelheid informatie in een bestand uitgedrukt in één seconde).

De samplefrequentie is de frequentie waarmee digitale audio wordt verwerkt. De meest gebruikelijke samplefrequentie voor audioformaten van hoge kwaliteit is 44,1 kHz.

Het is algemeen aanvaard dat een hoge bitsnelheid de beste kwaliteit garandeert; dit is waar, maar alleen als het bronbestand van goede kwaliteit is. Een MP3 van hoge kwaliteit moet een bitsnelheid van 320 kbps hebben, maar een FLAC-indeling van hoge kwaliteit heeft over het algemeen een bitsnelheid van 900 kbps en hoger.

Wat is het muziekformaat van de beste kwaliteit?
Naast de audioformaten zelf is voor muziekgeluid van hoge kwaliteit ook hoogwaardige reproductieapparatuur nodig: luidsprekers, versterkers, koptelefoons.

Parameters die de kwaliteit van digitale audio beïnvloeden. (Deel 2)

Parameters die de kwaliteit van digitale audio beïnvloeden. (Deel 2)

digital audio

Het formaat wordt ook wel het aantal kanalen genoemd in meerkanaals geluidssystemen (5.1; 7.1). In eerste instantie werd zo’n systeem ontwikkeld voor bioscopen, maar later verspreid door Software Codec

DIGITAL SOUND

Audiocodec op softwareniveau

§ G.723.1 – een van de basiscodecs voor IP-telefonietoepassingen

§ G.729 – eigen smalbandcodec die wordt gebruikt voor digitale weergave van spraak

§ Internet Low Bit Rate Codec (iLBC) – een populaire gratis codec voor IP-telefonie (in het bijzonder voor Skype en Google Talk)

Audio Codec (Audio Codec; Audio Encoder / Decoder) – Een computerprogramma of hardware ontworpen om audiogegevens te coderen of decoderen.

Software codec

Een audiocodec op softwareniveau is een gespecialiseerd computerprogramma, een codec die digitale audiogegevens comprimeert (comprimeert) of decomprimeert (decomprimeert) volgens een audiobestandsformaat of streaming audioformaat. De taak van een audiocodec als compressor is om een ​​audiosignaal te leveren met een bepaalde kwaliteit / precisie en de kleinst mogelijke grootte. Compressie vermindert de hoeveelheid ruimte die nodig is om audiogegevens op te slaan, en het is ook mogelijk om de bandbreedte te verkleinen van het kanaal waardoor de audiogegevens worden verzonden. De meeste audiocodecs zijn geïmplementeerd als softwarebibliotheken die communiceren met een of meer audiospelers, zoals QuickTime Player, XMMS, Winamp, VLC media player, MPlayer of Windows Media Player.

Populaire software-audiocodecs per applicatie:

§ MPEG-1 Layer III (MP3) is een eigen audio-opnamecodec (muziek, audioboeken, enz.) Voor computerapparatuur en digitale spelers

§ Ogg Vorbis (OGG) – het op één na populairste formaat, veel gebruikt in computerspellen en bestandsuitwisselingsnetwerken om muziek over te dragen

§ GSM-FR is de eerste digitale spraakcoderingsstandaard die wordt gebruikt in GSM-telefoons

Adaptive Multispeed (AMR): opname van menselijke stem op mobiele telefoons en andere mobiele apparaten

Afhankelijkheid van de luidheid, evenals de toon van het geluid van de intensiteit en frequentie van de geluidsgolf.

Hertz (aangeduid met Hz of Hz) is een meeteenheid voor de frequentie van periodieke processen (bijv. Oscillaties).
1 Hz betekent een uitvoering van genoemd proces in één seconde: 1 Hz = 1 / s.

Als we 10 Hz hebben, betekent dit dat we tien uitvoeringen van genoemd proces in één seconde hebben.

Het menselijk oor kan geluid waarnemen met frequenties variërend van 20 trillingen per seconde (20 Hertz, laag geluid) tot 20.000 trillingen per seconde (20 KHz, hoog geluid).

Bovendien kan een persoon geluid waarnemen in een breed scala aan intensiteiten, waarbij de maximale intensiteit 1014 keer groter is dan het minimum (honderdduizend miljard keer).

Om het volume van geluid te meten, werd een speciale eenheid van “decibels” (dB) uitgevonden en gebruikt.

Een afname of toename van het geluidsvolume met 10 dB komt overeen met een afname of toename van de geluidsintensiteit met 10 keer.

Geluidsvolume in decibel

Om computersystemen geluid te laten verwerken, moet een continu audiosignaal worden omgezet in een discrete digitale vorm door middel van tijdbemonstering.

Hiervoor wordt een continue geluidsgolf opgedeeld in afzonderlijke kleine tijdsecties, voor elke sectie wordt een bepaalde waarde van de geluidsintensiteit ingesteld.

Daarom wordt de voortdurende afhankelijkheid van de luidheid van het geluid op tijdstip A (t) vervangen door een discrete reeks luidheidsniveaus. Op de grafiek lijkt dit een vloeiende curve te vervangen door een reeks “stappen”.

Synchroniseer audiosampling

Een microfoon die op de geluidskaart is aangesloten, wordt gebruikt om analoge audio op te nemen en om te zetten naar digitaal formaat.

Hoe dichter de discrete franjes zich in de grafiek bevinden, hoe beter het uiteindelijk mogelijk is om het originele geluid te reproduceren.