Basisconcepten van digitale geluidstheorie

Free Download Mp4Gain

We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE

THIS PRICE ONLY LASTS FOR A FEW DAYS

Basisconcepten van digitale geluidstheorie

Digital Sound

Geluid is in het algemeen de trillingen van een elastisch medium. Het geluid wordt veroorzaakt door mechanische trillingen van een voorwerp (dit kan een snaar, stembanden enz. Zijn) in contact met de omgeving. De trillingsfrequentie (gemeten in Hertz) bepaalt de toonhoogte. Hoe hoger de frequentie, hoe harder het geluid. Het menselijk oor kan geluidstrillingen uit de lucht waarnemen met een frequentie van 20 Hz tot 20 kHz. Het oor neemt de amplitude van de trilling waar als volume. Hoe hoger de amplitude, hoe harder het geluid.

Digital Sound

Elektromagnetische golven zijn een directe analoog van geluidsgolven. Deze laatsten zijn minder vatbaar voor verspreiding door de omgeving, de informatie die ze bij zich dragen is gemakkelijker op te slaan en te verwerken. Elektromagnetische golven zijn de belangrijkste secundaire drager van geluid. De transformatie van akoestische golven in elektromagnetische golven (evenals de omgekeerde werking) wordt uitgevoerd vanwege het gebruikelijke inductie-effect, dat bestaat uit het verschijnen van een stroom in een geleider wanneer deze in een wisselend magnetisch veld wordt geplaatst.

Simpel gezegd, de oscillatie van de luidsprekermembraanmagneet nabij de spoel induceert er een wisselstroom in. Als deze stroom wordt toegepast op een andere luidspreker, zal de magneet op zijn membraan bewegen en een overeenkomstig geluid creëren.

Dit is hoe de telefoon en de radio werken.

Geluid dat is omgezet in een elektromagnetische golfvorm, kan eenvoudig worden opgeslagen. Hiervoor moet een parameter van de drager worden vergeleken (de diepte van het plaattraject of de mate van magnetisatie van de film) met de amplitude van de oscillaties (dat wil zeggen de sterkte van de geïnduceerde stroom in de luidsprekerspoel) . Geluid dat rechtstreeks in elektromagnetische golven wordt omgezet, wordt analoog geluid genoemd. Het belangrijkste kenmerk is de directe overeenkomst van de uitgezonden of geregistreerde elektromagnetische golven met de akoestische.

Digitaal geluid is relatief nieuw. Het belangrijkste verschil met analoog is discretie. Bij het digitaliseren meet een speciaal apparaat, een analoog-naar-digitaal-omzetter (ADC), met regelmatige tussenpozen (ongeveer 0,001-0,0001 seconden) de grootte van de amplitude van een elektromagnetische golf die overeenkomt met een analoge geluidsvorm en schrijft de waarde ervan naar een bestand met een gespecificeerde precisie. Deze waarde wordt over het algemeen sample genoemd, of in jargon sample (van de sample in het Engels, sample). Dezelfde digitalisering wordt vaak sampling of sampling genoemd.

Door geluid van digitaal naar analoog om te zetten (dit wordt gedaan door een apparaat dat een digitaal-naar-analoog-omzetter (DAC) wordt genoemd).

De interpolatie (benadering) van de tussenliggende waarden van de amplitude wordt uitgevoerd volgens de bekende. Aangezien de bemonsteringsfrequentie meestal hoog is, kunt u met deze handeling redelijk nauwkeurig het originele analoge signaal reconstrueren.

De digitale vorm van geluid wordt gekenmerkt door vijf parameters.

1. De bemonsteringssnelheid;
2. Bitgrootte van de monsters.
3. Het aantal kanalen of tracks.
4. Compressie / decompressie-algoritme (codec).
5. Opslagformaat.

Omdat elk van deze parameters vrij specifiek is, zullen we ze afzonderlijk bekijken.

Bemonsteringssnelheid
De samplefrequentie bepaalt hoeveel samples per seconde worden genomen bij het digitaliseren. Als we digitaal geluid vergelijken met digitale beelden, komt de samplefrequentie overeen met de resolutie (een meer “realistische” analogie is de framesnelheid in de bioscoop). Hoe hoger de bemonsteringsfrequentie, hoe beter het mogelijk is om het analoge signaal te reconstrueren op basis van de digitale vorm van het geluid (preciezer gezegd, hoe hoger de bemonsteringsfrequentie, hoe breder het spectrum van frequenties dat tijdens de digitalisering kan worden opgenomen).
De beroemde stelling van Nyquist-Kotelnikov stelt dat voor de juiste reconstructie van een analoog signaal uit de digitale opname, het noodzakelijk is dat de bemonsteringsfrequentie ten minste tweemaal de maximale geluidsfrequentie is.

Aangezien de bovenste luisterlimiet 20 kHz is, moet de samplefrequentie idealiter ten minste 40 kHz zijn. Daarom is de standaard bemonsteringsfrequentie die wordt gebruikt voor het opnemen van cd’s 44,1 kHz (de zogenaamde cd-kwaliteit). De samplefrequentie kan echter hoger zijn, maar deze geluidskwaliteit wordt alleen gebruikt door opnamestudio’s en vooral veeleisende muziekliefhebbers.

Een samplefrequentie van 44,1 kHz is niet altijd ideaal. Bij het verzenden van gegevens over een netwerk met lage bandbreedte moet de geluidskwaliteit worden opgeofferd ten gunste van de grootte, in de praktijk worden vaak bemonsteringsfrequenties van twee, vier en acht keer lager dan 44,1 kHz gebruikt.

Free Download Mp4Gain

Geluidsinformatie op de computer

Geluidsinformatie op de computer

Geluid is een continu signaal, een geluidsgolf met variabele amplitude en frequentie.

digital wave sound

Hoe groter de amplitude van het signaal, hoe sterker het zal zijn voor een persoon.

Hoe hoger de frequentie van het signaal, hoe hoger de toonhoogte.

De frequentie van een geluidsgolf wordt uitgedrukt in een aantal trillingen per seconde en wordt gemeten in Hertz (Hz, Hz).

Het menselijk oor kan geluiden waarnemen in het bereik van Hz tot 20 kHz, wat geluid .2020 wordt genoemd
Het aantal bits per audiosignaal wordt de audiocoderingsdiepte genoemd.
Moderne geluidskaarten bieden 16-, 32- of 64-bits audiocoderingsdiepte.163264

Bij het coderen van audio-informatie wordt een continu signaal vervangen door een discreet signaal, dat wil zeggen dat het wordt omgezet in een reeks elektrische impulsen (binaire nullen en enen).
Het proces van het omzetten van audiosignalen van een continue representatievorm naar een discrete digitale vorm wordt digitalisering genoemd.
Een belangrijk kenmerk bij het coderen van audio is de samplefrequentie, het aantal signaalniveaumetingen in seconden: 1
– (één) meting per seconde komt overeen met een frequentie van Hz; 11
– metingen per seconde komen overeen met een frequentie van kHz.10001
Audio sample rate is het aantal metingen van het audiovolume in één seconde.
Het aantal metingen kan in het bereik van kHz tot kHz liggen (van de radiozendfrequentie tot de frequentie die overeenkomt met de geluidskwaliteit van muzikale media) .848

Hoe hoger de bemonsteringsfrequentie en de diepte van het geluid, hoe beter het geluid van het gedigitaliseerde geluid. De laagste kwaliteit van gedigitaliseerd geluid, overeenkomend met de kwaliteit van telefooncommunicatie, wordt verkregen met een bemonsteringssnelheid van keer per seconde, een bemonsteringssnelheid van bits en door het opnemen van een audiotrack (“mono” -modus). De hoogste kwaliteit gedigitaliseerde audio, die overeenkomt met de kwaliteit van een audio-cd, wordt bereikt met een bemonsteringsfrequentie van keer per seconde, een bemonsteringssnelheid van bits en de opname van twee audiotracks (stereomodus). 8000 848000 16
Houd er rekening mee dat hoe hoger de kwaliteit van het digitale geluid, hoe groter het informatievolume in het audiobestand.
Het volume van de informatie in een mono audiobestand () kan als volgt worden geschat: VV = N⋅ f⋅ k, waarbij de totale duur van het geluid (seconden) is, is de bemonsteringsfrequentie (Hz), is de coderingsdiepte (bit) .norteFk

Bijvoorbeeld met een geluidsduur van één minuut en een gemiddelde geluidskwaliteit (bits, kHz): 11624
V = 60 ⋅ 24000 ⋅ 16 bits = 23040000 bits = 2.880.000 bytes = 2812,5 kB = 2,75 MB.

Bij het coderen van stereogeluid, wordt het bemonsteringsproces afzonderlijk en onafhankelijk uitgevoerd voor de linker- en rechterkanalen, waardoor de grootte van het audiobestand verdubbelt in vergelijking met monogeluid.

Laten we bijvoorbeeld het informatievolume schatten van een digitaal stereogeluidsbestand met een duur van één seconde met een gemiddelde geluidskwaliteit (bits, metingen per seconde). Voor deze codering moet de diepte worden vermenigvuldigd met het aantal metingen per seconde en vermenigvuldigd met (stereo): 11624 00012
V = 16 bits ⋅ 24000⋅2 = 768000 bits = 96000 bytes = 93,75 KB.

Er zijn verschillende methoden om audio-informatie met binaire code te coderen, waarvan twee hoofdgebieden kunnen worden onderscheiden: de FM-methode en de Wave-Table-methode.

De FM-methode (Frequency Modulation) is gebaseerd op het feit dat, theoretisch, elk complex geluid kan worden opgesplitst in een reeks van de eenvoudigste harmonische signalen met verschillende frequenties, die elk een gewone sinusoïde zijn en daarom Het kan worden beschreven door een code. De ontleding van audiosignalen in harmonische reeksen en weergave in de vorm van discrete digitale signalen wordt gedaan door speciale apparaten – analoog-naar-digitaal converters (ADC).

Omzetting van een audiosignaal in een discreet signaal: naar – audiosignaal aan de ADC-ingang; b – discreet signaal aan de ADC-uitgang.

Digitaal-naar-analoog converters (DAC’s) voeren een omgekeerde conversie uit om geluid te reproduceren dat is gecodeerd met een numerieke code. Het geluidsconversieproces wordt getoond in Fig. Hieronder. Deze coderingsmethode levert geen goede geluidskwaliteit op, maar wel compacte code.

Omzetting van een discreet signaal in een audiosignaal: naar – discreet signaal aan de DAC-ingang; b – audiosignaal aan de DAC-uitgang.

De tafelgolfmethode (de Wave, de Table) is gebaseerd op het feit dat de eerder voorbereide tafels geluidssamples uit de wereld, muziekinstrumenten, etc. opslaan.

Geluidsniveau, volume, normalisatie

Geluidsniveau, volume, normalisatie

Normalize Audio

Dit artikel geeft een korte uitleg van de termen Geluidsvolume, Geluidsniveau, Normaliseren, Versterking en enkele anderen, en hun relatie en gebruik in relatie tot het Digispot-uitzendautomatiseringssysteem.

Volume normalization

Geluidsniveau
De term geluidsniveau verwijst naar het amplitudeniveau van het geluidssignaal. Met betrekking tot een programmeeritem, MDB-item of een ander stuk geluid hebben we het over het piek (maximale) signaalniveau in het hele stuk. Dit niveau wordt gemeten in eenheden van dBFS en is bijna altijd negatief. Dit niveau is belangrijk omdat het afhangt van hoeveel het niveau kan worden verhoogd, en dus het volume van het geluid, zonder de theoretische drempel van 0 dBFS te overschrijden.

De signaalniveau-indicatoren zijn bedoeld voor visuele waarneming van het huidige signaalniveau in werkelijk niveau.

Een diagram van de verandering van het signaalniveau in de tijd wordt een signaalgram genoemd en wordt gebruikt om fonogrammen en andere geluidselementen weer te geven in verschillende vensters van het Digispot-systeem, bijvoorbeeld het venster voor het bewerken van splitsingen, bij het bewerken van audio, enz.

In het Digispot-systeem wordt het maximale niveau van het programmeeritem en CDM eenmalig berekend en opgeslagen voor later gebruik, bijvoorbeeld voor normalisatie.
De bepaling van het pieksignaal wordt gecombineerd met de gelijktijdige bepaling van de luidheid, deze waarden worden altijd samen berekend.

Echt geluidsniveau
De term True Sound Level verwijst naar het hypothetische amplitudeniveau van een analoog geluidssignaal, dat een interpolatie is van een bestaande gedigitaliseerde soundtrack. Het verschil met alleen “Level” is dat bij het samplen de samplepunten op de tijdas mogelijk niet de maximale punten van het analoge signaal bereiken. Als we bijvoorbeeld een sinusvormig signaal hebben met een frequentie van 11025 Hz en we digitaliseren het met een frequentie van 44100, dan kan de piekwaarde van het gedigitaliseerde fonogramniveau een waarde hebben van -3dBFS tot 0dBFS, afhankelijk van de faseverschuiving van de bemonstering op de tijdas. voer het bord in. Bij hogere signaalfrequenties kunnen de pieken verder worden onderschat.

ITU-R BS.1770-3 (bijlage 2) definieert het algoritme om het “True Peak Level” te berekenen. De voorgestelde procedure wordt gereduceerd tot het 4 keer verhogen van de bemonsteringsfrequentie en filteren, waarna de maximale amplitude wordt bepaald door de interpolatie van het verkregen signaal.

In het Digispot-systeem hebben de piekindicatoren in de editor, eigenschappenvensters en splitsingen de mogelijkheid om het werkelijke geluidsniveau weer te geven.

Geluidsvolume
Loudness is een schatting van de intensiteit waarmee de luisteraar het materiaal waarneemt. Deze waarde wordt berekend met behulp van een speciaal algoritme dat rekening houdt met de perceptie van menselijk geluid, ontwikkeld door ITU \ ITU-BS.1770.

Loudness wordt gemeten in LUFS-eenheden, die fysiek identiek zijn aan decibel. Het volume is direct gerelateerd aan het niveau van het signaal: hoe hoger het niveau van het signaal, hoe hoger het volume.
Numeriek is deze relatie lineair: als het signaalniveau met 6 dB toeneemt, neemt het volume ook toe met 6 LU. (Om wiskundig precies te zijn, de relatie is niet lineair, maar voor de meeste praktische toepassingen kan de afwijking van de lineaire relatie worden verwaarloosd.)

De luidheidscontrole in realtime wordt uitgevoerd door volume-indicatoren, er zijn er twee: M – kortstondig en S – kortstondig, ze verschillen in de meetintervallen: respectievelijk 0,4 sec en 3 sec.

Om de luidheid van een geluidsbereik te evalueren, is een speciale techniek ontwikkeld die de waarde van de luidheid van het bereik berekent, aangegeven met de waarde I en genaamd geïntegreerde luidheid. Dit is de waarde waarnaar u verwijst als u praat over de luidheid van een programmeeritem of MDL.

In het Digispot-systeem wordt de integrale luidheid van het programmeeritem en MDB eenmalig berekend en opgeslagen voor later gebruik, bijvoorbeeld voor normalisatie.

In Rusland wordt de methodologie voor het meten van het volume van programma’s bepaald door het bevel van de federale antimonopoliedienst van 22 mei 2015 nr. 374/15. De luidheid van de programma’s wordt gereguleerd door federale wet 338.

Relaties tussen piekniveau van digitale audio, werkelijk piekniveau, volume en notatie
Wanneer we het hebben over het signaalniveau (meer precies, het piekniveau), wordt de notatie dBFS – dB Full Scale gebruikt. Deze schaal heeft een 0dB-punt dat is gekoppeld aan het volledige bereik van het signaal dat wordt weergegeven in de gebruikte bitbreedte. Met 16-bits audiomonsters zijn de representeerbare waarden bijvoorbeeld -32768 tot +32767, dus de signaalniveauwaarde in dBFS wordt berekend als 20 lg (s / 32768), waarbij s de waarde is van het monster in deze weergave of de maximale absolute waarde van de monsters in het interval van interesse.

Comprimeer mp3 zonder kwaliteitsverlies

Comprimeer mp3 zonder kwaliteitsverlies

Over verlieslo Mp3 ze muziekcompressie, theorie, praktijk, conclusies.
Met dit materiaal wil ik een reeks artikelen openen met alles wat te maken heeft met het luisteren naar muziek op een computer. Het is tijd om ervaringen uit te wisselen en verschillende artikelen op internet in één samen te vatten, hoewel ze niet bedoeld zijn om precies te zijn, maar relatief kort. In het eerste deel zullen we de audioformaten zien. Wat is FLAC, WavPack, TAK, Monkey’s Audio, OptimFROG, ALAC, WMA, Shorten, LA, TTA, LPAC, MPEG-4 ALS, MPEG-4 SLS, Real Lossless? Weet u hoeveel soorten audiobestanden er vandaag zijn geregistreerd? Tot nu toe hebben we te maken met verliesvrije compressie-indelingen voor audiomateriaal, en het antwoord op de vraag over het aantal audio-extensies staat aan het einde van het artikel. Veel leesplezier!

mp3

Laten we dus eerst de termen definiëren:

“Een algoritme is een nauwkeurig recept dat het rekenproces definieert dat van variabele invoer naar het gewenste resultaat gaat.”

“Codec (codec in het Engels, van encoder / decoder – encoder / decoder – encoder / decoder of compressor / decompressor) is een apparaat of programma dat gegevens of signalen kan omzetten. Codecs kunnen een stream / signaal coderen (vaak voor verzending, opslag of codering) of decoderen om deze bewerkingen te bekijken of te wijzigen in een meer geschikt formaat. Codecs worden vaak gebruikt bij digitale video- en audioverwerking. De meeste codecs voor audio- en visuele gegevens gebruiken compressie met verlies om een acceptabele uiteindelijke (gecomprimeerde) bestandsgrootte te verkrijgen. Er zijn ook codecs zonder verlies ”.

“Lossless datacompressie. – methode van datacompressie, waarbij gebruik wordt gemaakt van gecodeerde informatie die in één bit kan worden hersteld. Hierdoor worden de originele data volledig hersteld van de gecomprimeerde staat. In de regel heeft elk type digitale informatie zijn eigen eigen verliesloze compressie-algoritmen “.

Lossless datacompressie wordt gebruikt wanneer de identiteit van de gecomprimeerde data met het origineel belangrijk is. Veelvoorkomende voorbeelden zijn uitvoerbare bestanden, documenten en broncode. Programma’s die compressie-indelingen zonder verlies gebruiken, worden archiveringsprogramma’s genoemd, iedereen kent de meest populaire ZIP- of RAR-bestandsindelingen, het Unix Gzip-hulpprogramma, enz. Al deze programma’s verschillen in de toegepaste algoritmen (een of meer) en dus in verschillende compressie-eigenschappen van verschillende bestanden.

Deel I. – THEORIE:

Compressiemethoden of verliesloze compressiealgoritmen kunnen worden geclassificeerd op basis van het type gegevens waarvoor ze zijn gemaakt. Er zijn drie hoofdtypen gegevens: tekst, afbeeldingen en geluid. In principe kan elk multifunctioneel verliesloos datacompressie-algoritme (multifunctioneel betekent dat het elk type binaire data aankan) worden gebruikt voor elk type data, maar de meeste zijn inefficiënt voor alle basistypen. Audiogegevens kunnen bijvoorbeeld niet goed worden gecomprimeerd met een tekstcompressie-algoritme en vice versa.

Compressiemethoden omvatten de volgende: entropiecompressie, woordenboekmethoden, statistische methoden. Elke methode is geschikt voor een specifiek type gegevens en bevat verschillende algoritmen.

Entropie-compressie: Huffman-algoritme Adaptief Huffman-algoritme Rekenkundige codering (interval Shannon-Fano-algoritme) Golomb-codes Universele Delta-code (Elias Fibonacci)

Woordenboekmethoden: RLE Deflate LZ (LZ77 / LZ78 LZSS LZW LZWL LZO LZMA LZX LZRW LZJB LZT)

Statistische algoritmemodellen voor tekst (of tekstuele binaire gegevens als uitvoerbaar bestand) omvatten: Burrows-Wheeler-transformatie (voorverwerking van bloksortering die compressie efficiënter maakt) LZ77 en LZ78 (gebruikt door DEFLATE) LZW.