Hoe wordt geluid digitaal weergegeven?

Free Download Mp4Gain

We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE

THIS PRICE ONLY LASTS FOR A FEW DAYS

Hoe wordt geluid digitaal weergegeven?

Digital representation of the sound

De oorspronkelijke vorm van een audiosignaal (een continue verandering in amplitude in de tijd) wordt digitaal weergegeven door “cross-sampling”, in tijd en niveau.

digital sound representation

Volgens de stelling van Kotelnikov kan elk continu proces met een beperkt spectrum volledig worden beschreven door een discrete reeks van zijn momentane waarden, gevolgd door een frequentie die ten minste tweemaal de frequentie van de hoogste harmonische van het proces is; de bemonsteringsfrequentie Fd van momentane waarden (monsters) wordt de bemonsteringsfrequentie genoemd.

Uit de stelling volgt dat een signaal met een frequentie Fa alleen met succes in de tijd kan worden bemonsterd met een frequentie van 2Fa als het een zuivere sinusoïde is, omdat elke afwijking van de sinusvormige vorm ertoe leidt dat het spectrum voorbij de frequentie Fa gaat. . Daarom, voor tijdbemonstering van een willekeurig audiosignaal (dat over het algemeen, zoals bekend, een spectrum heeft dat soepel valt), ofwel de selectie van de bemonsteringsfrequentie met een marge of de geforceerde beperking van het spectrum van het ingangssignaal onder de helft van de bemonsteringsfrequentie.

Gelijktijdig met tijdbemonstering wordt amplitudebemonstering uitgevoerd: meting van momentane amplitudewaarden en hun weergave in de vorm van numerieke waarden met enige precisie. De precisie van de meting (binaire breedte N van de verkregen discrete waarde) bepaalt de signaal-ruisverhouding en het dynamisch bereik van het signaal (theoretisch zijn dit wederkerige waarden, maar elk reëel pad heeft ook zijn eigen niveau van ruis en interferentie).

De resulterende stroom getallen (een reeks binaire cijfers) die een audiosignaal beschrijft, wordt Pulse Code Modulation (PCM) genoemd, aangezien elke puls van een tijdbemonsterd signaal wordt gerepresenteerd door zijn eigen digitale code.

Lineaire kwantisering wordt meestal gebruikt als de numerieke waarde van het monster evenredig is met de amplitude van het signaal. Vanwege de logaritmische aard van het gehoor, zou logaritmische kwantisering, wanneer de numerieke waarde evenredig is met de grootte van het signaal in decibel, geschikter zijn, maar dit is beladen met problemen van puur technische aard.

Tijdsampling en amplitudekwantisering van het signaal introduceren onvermijdelijk ruisvervormingen in het signaal, waarvan het niveau in het algemeen wordt geschat met behulp van de formule 6N + 10lg (Fdiscr / 2Fmax) + C (dB), waarbij de constante C varieert voor verschillende soorten signalen: voor een zuivere sinusoïde is dit 1,7 dB, voor geluidssignalen – van -15 tot 2 dB. Het kan dus worden gezien dat een afname van de ruis in de werkfrequentieband 0..Fmax niet alleen leidt tot een toename van de bitdiepte van de sample, maar ook tot een toename van de samplefrequentie ten opzichte van 2Fmax, aangezien de kwantiseringsruis over de band wordt “uitgewassen” tot aan de samplefrequentie, en de audio-informatie slechts het kleinste deel van deze strip beslaat.

De meeste moderne digitale geluidssystemen gebruiken standaard bemonsteringsfrequenties van 44,1 en 48 kHz, maar het frequentiebereik van het signaal is doorgaans beperkt tot ongeveer 20 kHz om het binnen de theoretische limiet te houden. De meest voorkomende is ook de 16-bits niveaukwantisering, die een limietsignaal-ruisverhouding van ongeveer 98 dB oplevert. In studioapparatuur worden hogere resoluties gebruikt: 18, 20 en 24 bit kwantisering bij samplefrequenties van 56, 96 en 192 kHz. Dit wordt gedaan om de hogere harmonischen van het geluidssignaal te behouden, die niet direct door het oor worden waargenomen, maar de vorming van het algehele geluidsbeeld beïnvloeden.

Om smalbandige signalen van lagere kwaliteit te digitaliseren, kunt u de samplefrequentie en bitdiepte verlagen; Telefoonlijnen gebruiken bijvoorbeeld 7 of 8 bit digitalisering met frequenties van 8..12 kHz.

De weergave van een analoog signaal in digitale vorm wordt ook wel Pulse Code Modulation (PCM) genoemd, aangezien het signaal wordt weergegeven als een reeks pulsen met constante frequentie (tijdbemonstering), waarvan de amplitude digitaal is gecodeerd (amplitudesampling). ). Een PCM-stroom kan parallel zijn, wanneer alle bits in elk monster gelijktijdig over meerdere lijnen met één bemonsteringsfrequentie worden verzonden, of sequentieel, wanneer de bits na elkaar met een hogere frequentie op een lijn worden verzonden.

Digitaal geluid zelf en gerelateerde elementen worden vaak aangeduid met de algemene term digitale audio; De analoge en digitale delen van een geluidssysteem worden het analoge domein en het digitale domein genoemd.

Wat is ADC en DAC?

Analoog-naar-digitaal en digitaal-naar-analoog converters. De eerste zet het analoge signaal om in een digitale amplitudewaarde, de tweede voert de inverse conversie uit.

Free Download Mp4Gain

Audiocodering en -verwerking

Audiocodering en -verwerking

Audio processing

Geluidsinformatie. Geluid is een golf die door lucht, water of ander medium reist met een continu veranderende intensiteit en frequentie.

Audio processing

Een persoon neemt geluidsgolven (luchttrillingen) waar met behulp van gehoor in de vorm van geluid met een ander volume en toonhoogte. Hoe hoger de intensiteit van de geluidsgolf, hoe harder het geluid, hoe hoger de frequentie van de golf, hoe hoger de toonhoogte van het geluid

Het menselijk oor neemt geluid waar met een frequentie van 20 trillingen per seconde (laag geluid) tot 20.000 trillingen per seconde (hoog geluid).

Een persoon kan geluid waarnemen in een breed scala aan intensiteiten, waarbij de maximale intensiteit 10 14 keer groter is dan het minimum (honderdduizend miljard keer). Om het volume van geluid te meten, wordt een speciale eenheid “decibel” (dbl) gebruikt (tabel 5.1). Het verlagen of verhogen van het geluidsvolume met 10 dB komt overeen met een 10 keer afnemen of verhogen van de geluidsintensiteit.

Tabel 5.1. Geluidsvolume
Geluidsvolume in decibel
Ondergrens van gevoeligheid van het menselijk oor 0
Bladfluister tien
Gesprek 60
Hoorn 90
Straalmotor 120
Pijngrens 140
Geluidstijd bemonstering. Om een computer geluid te laten verwerken, moet een continu audiosignaal worden geconverteerd naar een discrete digitale vorm met behulp van tijdbemonstering. Een continue geluidsgolf is opgedeeld in afzonderlijke kleine tijdsecties, voor elke sectie wordt een bepaalde waarde van de geluidsintensiteit ingesteld.

Daarom wordt de voortdurende afhankelijkheid van de luidheid van het geluid op tijdstip A (t) vervangen door een discrete reeks luidheidsniveaus. Op de grafiek lijkt dit een vloeiende curve te vervangen door een reeks ‘stappen’

Bemonsteringsfrequentie. Een microfoon die op de geluidskaart is aangesloten, wordt gebruikt om analoog geluid op te nemen en om te zetten naar digitaal formaat. De kwaliteit van het verkregen digitale geluid hangt af van het aantal metingen van het geluidsvolume per tijdseenheid, dat wil zeggen de bemonsteringsfrequentie. Hoe meer metingen er in 1 seconde worden gedaan (hoe hoger de bemonsteringsfrequentie), hoe nauwkeuriger de “ladder” van het digitale audiosignaal de curve van het dialoogsignaal herhaalt.

Audio sample rate is het aantal metingen van het audiovolume in één seconde.

De audiofragmentfrequentie kan variëren tussen 8000 en 48000 geluidsvolumemetingen per seconde.

Diepte audiocodering. Elke “stap” krijgt een specifieke waarde voor het geluidsvolume toegewezen. Loudness-niveaus van geluid kunnen worden gezien als een reeks mogelijke toestanden N, waarvoor een bepaalde hoeveelheid informatie I vereist is, die audiocoderingsdiepte wordt genoemd.

De diepte van de audiocodering is de hoeveelheid informatie die nodig is om de discrete volumeniveaus van digitale audio te coderen.

Als de coderingsdiepte bekend is, kan het aantal digitale audiovolumeniveaus worden berekend met de formule N = 2 I. Laat de audiocoderingsdiepte 16 bit zijn, dan is het aantal geluidsvolumeniveaus:

N = 2 ik = 2 16 = 65536.

Tijdens het coderingsproces krijgt elk geluidsvolume zijn eigen 16-bits binaire code toegewezen, het laagste geluidsniveau komt overeen met de code 0000000000000000 en het hoogste – 1111111111111111.

De kwaliteit van gedigitaliseerd geluid. Hoe hoger de bemonsteringsfrequentie en de diepte van het geluid, hoe beter het geluid van het gedigitaliseerde geluid. De laagste kwaliteit van gedigitaliseerd geluid, overeenkomend met de kwaliteit van telefooncommunicatie, wordt verkregen met een bemonsteringsfrequentie van 8000 keer per seconde, een bemonsteringssnelheid van 8 bits en door het opnemen van een audiotrack (“mono” -modus). De hoogste kwaliteit van gedigitaliseerd geluid, overeenkomend met de kwaliteit van een audio-cd, wordt bereikt met een bemonsteringssnelheid van 48.000 keer per seconde, een bemonsteringssnelheid van 16 bits en de opname van twee audiotracks (stereomodus) .

Houd er rekening mee dat hoe hoger de kwaliteit van het digitale geluid, hoe groter het informatievolume in het audiobestand. Het is mogelijk om het informatievolume van een digitaal stereogeluidsbestand met een duur van 1 seconde met een gemiddelde geluidskwaliteit (16 bits, 24.000 metingen per seconde) te schatten. Hiertoe moet de coderingsdiepte worden vermenigvuldigd met het aantal metingen in 1 seconde en vermenigvuldigd met 2 (stereogeluid):

16 bits × 24.000 × 2 = 768.000 bits = 96.000 bytes = 93,75 KB.

Geluidsbewerkers. Met geluidseditors kunt u niet alleen geluid opnemen en afspelen, maar ook bewerken.

MP3 van binnenuit: psychofysiologie van geluid

MP3 van binnenuit: psychofysiologie van geluid

psychophysiology of sound

Dit formaat maakt gebruik van een buitengewoon complex coderingsalgoritme. In tegenstelling tot conventionele archiefkasten, die informatie zo moeten comprimeren dat na het extraheren van bestanden geen enkele bit wordt gewijzigd, heeft MP3 iets andere doelen.

psychophysiology of sound

Naast wiskundige compressie-algoritmen bevat dit formaat ook een zeer complex algoritme voor het verwijderen van onnodige audio-informatie, gebaseerd op de psychologische en fysiologische kenmerken van het menselijk lichaam. Ik zal proberen op dit punt in meer detail te stoppen.

Zoals gezegd is MP3 een streamingformaat. Dit betekent dat de audio-informatie tijdens het coderen wordt verdeeld in gelijke lengtedelen, die frames worden genoemd. Alle frames zijn onderling onafhankelijk. Elk van deze frames is afzonderlijk gecodeerd met zijn eigen parameters en heeft een header waarin deze parameters worden beschreven. Bij het afspelen wordt een reeks frames gedecodeerd en produceert een continu geluid van de opgenomen audio.

Wat zijn de voordelen van deze aanpak? Allereerst de mogelijkheid om terug te spoelen, omdat je gemakkelijk naar een willekeurig frame kunt springen en het geluid vanaf dit punt kunt afspelen. Ten tweede is het deze structurele eigenschap die MP3 tot een echt netwerkformaat maakt. Zodra de eerste frames in het RAM-geheugen of de schijfcache zijn geladen, begint de speler ze af te spelen, terwijl tegelijkertijd nieuwe frames worden geladen, waardoor continuïteit wordt bereikt. En tot slot, als je niet het hele MP3-bestand van internet kunt downloaden, dan is dat oké, je kunt nog steeds naar muziek luisteren, alleen de speler komt op het punt waarop de verbinding werd verbroken en stopt.

Dus laten we teruggaan naar onze lijsten. Bij MP3 van hoge kwaliteit, en dit is een bitsnelheid van ~ 320 kbs, worden alleen wiskundige compressie-algoritmen gebruikt om frames te coderen. Tegelijkertijd lijdt de kwaliteit er helemaal niet onder, maar de grootte wordt slechts vier keer verkleind, dat wil zeggen dat de compressieverhouding dezelfde is als die van een normale archiefkast; daarom worden mp3-bestanden praktisch niet gecomprimeerd door normale archiefkasten. Wanneer de bandbreedte (bitrate) wordt teruggebracht tot 256 kbs en minder, komen dezelfde algoritmen in beeld om “onnodige” geluiden te elimineren die zijn gebaseerd op de kenmerken van de perceptie van geluid door het menselijk oor, het zogenaamde “psychoakoestische model”. “Onnodige” eliminatieprocessen kwantificering. Hoe lager de bitsnelheid, hoe moeilijker de kwantisering zal zijn.

Wat zijn de criteria voor het evalueren van de “noodzaak” en “nutteloosheid” van geluiden? De overgrote meerderheid van codecs zendt geluiden uit die worden beschouwd als buiten de drempel van het menselijk gehoor. In dit geval wordt de drempelwaarde, om zo te zeggen uit fakto, genomen als een waarde gelijk aan 16 kHz. Ondanks dat deze drempel als elementaire waarde wordt erkend en in alle natuurkundeboeken voorkomt, is deze benadering onjuist. Mensen zijn erg divers in hun fysiologische kenmerken. Daarnaast moet er rekening mee worden gehouden dat de gehoordrempel van jongeren veel hoger is dan die van ouderen en deze gemiddelde waarde gemakkelijk kan overschrijden. Veel hangt ook af van de sterkte van het signaal. Daarom

Een ander criterium waarmee de ‘futiliteit’ van geluid wordt beoordeeld, is een toestand die is gebaseerd op een kenmerk van het menselijk gehoor, zoals het onvermogen van de meeste mensen om signalen te onderscheiden die onder een bepaald vermogensniveau liggen, en dit niveau is verschillend voor verschillende frequentiebereiken. Bij gebruik van het psychoakoestische MP3-coderingsmodel voert CODEC automatisch onhoorbare lage vermogensfrequenties uit. Helaas zijn mensen opnieuw niet hetzelfde en degenen die deze frequenties nauwkeurig kunnen onderscheiden, klagen vaak over verlies van geluidskwaliteit tijdens het coderen, terwijl de gemiddelde meerderheid dit niet opmerkt.

Maar het belangrijkste kenmerk van het psychoakoestische coderingsmodel MP3 is het zogenaamde maskerende effect. Dankzij dit effect is het mogelijk om zowel de originele audiogegevens te comprimeren. De essentie van dit effect is dat een zwak signaal uit een frequentiebereik vaak wordt gemaskeerd door een sterker signaal uit een aangrenzend bereik, indien aanwezig in een audio-opname, of door een sterk signaal uit het vorige frame. Dit sterke signaal zorgt ervoor dat het oor het huidige framesignaal tijdelijk ongevoelig maakt. In feite doet zich het fenomeen “tijdelijke bedwelming” voor. Voor elk geluidsbereik wordt de hoeveelheid maskeringseffect bepaald, gegenereerd door het signaal van aangrenzende bereiken en het signaal van het vorige frame.

De beste muziekformaten voor geluidskwaliteit

De beste muziekformaten voor geluidskwaliteit

Sound quality

Er zijn drie hoofdtypen audiocijfers: formaat – niet-gecomprimeerd; formaat (lossy) – compressie met verlies; formaat (zonder verlies): compressie zonder verlies. Lossy compressie:

Sound Quality Formats

technologie waarbij het gecodeerde bestand aanzienlijk wordt verminderd in vergelijking met het origineel, vanwege de eliminatie van informatie die niet door het menselijk oor wordt waargenomen. Het nadeel van deze technologie is het feit dat het gecomprimeerde bestand nooit identiek zal zijn aan het origineel. Lijst met de meest voorkomende formaten met verlies: AAC (.m4a, .mp4, .m4p, .aac):

geavanceerde audiocodering (vaak in MPEG-4-container) AC3 DTS MP2 (MPEG Layer 2) MP3 (MPEG Layer 3) MPC (bekend als Musepack, voorheen MPEGplus of MP + genoemd) Ogg Vorbis WMA (Windows Media Audio)

KWANTIFICATIE-FORMAAT, BEMONSTERINGSFREQUENTIE BIT, KHZ DE GROOTTE VAN DE SCHIJFGEGEVENSSTROOM, KBIT / S COMPRESSIE / VERPAKKINGSVERHOUDING DTS 20-24 48; 96 tot 1536 ~ 3: 1 met zwevend MP3-verlies tot 48 tot 320 11: 1 met zwevend CAA-verlies tot 96 tot 529 met Ogg Vorbis-verlies tot 32 tot 192 tot 1000 met WMA-verlies tot 24 tot 96 tot 768 2: 1, er zijn een lossless versie Lossless:

Lossless gecomprimeerde audioformaten, waaronder: FLAC (Free Lossless Audio Codec) APE (Mono Audio) WV (WavPack) Deze formaten kunnen CD converteren naar digitaal formaat met behoud van kwaliteit. U kunt bijvoorbeeld een cd nemen, deze naar WAV converteren, vervolgens WAV naar FLAC, dan teruggaan van FLAC naar WAV en deze vervolgens op een lege cd branden en u hebt een absoluut identieke kopie van uw broncode.

Welk formaat klinkt de muziek met de beste kwaliteit? De meest populaire is het verliesvrije FLAC-formaat en een van de meest gebruikte conversieprogramma’s van CD naar FLAC is EAC (Exact Audio Copy).

Van alle parameters van digitale audio moet vooral aandacht worden besteed aan de volgende indicatoren: samplefrequentie (precisie van het digitaliseren van een analoog signaal in de tijd), bitsnelheid (hoeveelheid informatie in het bestand in termen van één seconde) .

De samplefrequentie is de frequentie waarmee digitale audio wordt verwerkt. De meest gebruikelijke samplefrequentie voor audioformaten van hoge kwaliteit is 44,1 kHz. Het is algemeen aanvaard dat een hoge bitsnelheid de beste kwaliteit garandeert; dit is waar, maar alleen als het bronbestand van goede kwaliteit is.

Een MP3 van hoge kwaliteit zou een bitsnelheid van 320 kbps moeten hebben, maar een FLAC-indeling van hoge kwaliteit heeft meestal een bitsnelheid van 900 kbps of meer. Wat is het muziekformaat van de beste kwaliteit? Naast de audioformaten zelf, heb je voor hoogwaardig muzikaal geluid ook hoogwaardige reproductieapparatuur nodig: luidsprekers, versterkers, koptelefoons.

Met andere woorden, als u goedkope desktopluidsprekers en koptelefoons gebruikt, kunt u niet volledig genieten van geluid van hoge kwaliteit en het volledige potentieel van verliesvrije formaten ontketenen. Zonder in technische details in te gaan, kunnen de volgende formaten worden geadviseerd: Om thuis te luisteren, raad ik naar mijn mening het beste FLAC-formaat aan.

Voor een audiospeler zou het mp3-formaat met een bitsnelheid van minimaal 320 kbps een goede oplossing zijn. Persoonlijk gebruik ik alleen het FLAC-formaat op alle apparaten, aangezien je met het volume van de microSD-kaarten voldoende gegevens op de speler kunt opslaan.

Wat betreft apparatuur voor het afspelen van muziek van hoge kwaliteit, raad ik u aan om op de volgende merken te letten: Ik raad aan om een hoofdtelefoon van Sennheiser en AKG te kiezen, de producten van deze fabrikanten hebben zichzelf bewezen in termen van prijs-kwaliteitverhouding.

Voor een pc raad ik aan om akoestiek te kiezen van de volgende bedrijven: Microlab en Sven met een nuance, het luidsprekersysteem moet een subwoofer hebben voor een goede weergave van lage frequenties. Als goedkope akoestiek niet bij je past en je bent een fan van hoogwaardige geluidsapparatuur (Hi-Fi of Hi-End), dan ligt alles in jouw handen en wordt je alleen beperkt door je budget, ik zal geen aanbevelingen doen.