Gerelateerd audiokenmerk deel 2


Free Download Mp4Gain
picture



We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE



THIS PRICE ONLY LASTS FOR A FEW DAYS




Gerelateerd audiokenmerk deel 2

Sampling

 

Hoe hoger de sampling, hoe realistischer en natuurlijker het geluid zal zijn.

Sampling

 

Het frequentieherkenningsbereik voor mensen is 20 HZ – 20.000 HZ. Als er 20.000 samples per seconde kunnen worden gesampled, is dit voldoende om te voldoen aan de behoeften van het menselijk oor tijdens het afspelen. Dus 22050 De sample rate wordt veel gebruikt, 44100 is al cd-kwaliteit en samplen van meer dan 48000 is niet langer zinvol voor het menselijk oor. Dit is vergelijkbaar met een beeld van 24 frames per seconde uit een film.

 

Bemonsteringsbits
Na het samplen van de audio voor een sample, moeten er twee stappen worden uitgevoerd voor de sample:

1. Kwantificeer. De kwantiseringsbits die gewoonlijk worden gebruikt voor audiokwantisering zijn:

8 bits (dat wil zeggen 1 byte) kunnen slechts 256 getallen registreren, dat wil zeggen dat alleen de amplitude in 256 niveaus kan worden verdeeld;

16 bits (dwz 2 bytes) kunnen zo klein zijn als 65536 getallen, wat al de cd-standaard is;

32 bits (dwz 4 bytes) kunnen de amplitude onderverdelen in 4294967296 niveaus, wat eigenlijk niet nodig is.

Het aantal kwantiseringsbits wordt ook wel het aantal bemonsteringsbits, bitdiepte en resolutie genoemd, en verwijst naar hoeveel niveaus de continue intensiteit van het geluid kan worden verdeeld nadat het digitaal is weergegeven. N-bit betekent dat de intensiteit van het geluid gelijkelijk wordt verdeeld in 2^N niveaus. 16 bits, het is niveau 65535. Dit is een zeer groot aantal en mensen kunnen het verschil in geluidsintensiteit van 1/65.535 misschien niet zien. Je kunt ook zeggen dat het de resolutie van de geluidskaart is. Hoe hoger de waarde, hoe hoger de resolutie en hoe groter het vermogen om geluid te produceren. Het bemonsteringsveelvoud hier richt zich voornamelijk op de sterkte-eigenschappen van het signaal, en de bemonsteringssnelheid richt zich op de tijd- (frequentie) kenmerken van het signaal, wat twee verschillende concepten zijn.

2. Binaire codering. Dat wil zeggen, het resultaat van de kwantisering, dat wil zeggen het enkelkanaals monster, wordt opgeslagen in een binair sleutelwoord. Er zijn twee opslagmethoden:

Sla het resultaat van de kwantisering direct op in de cast, dat wil zeggen de twee-complementcode;

Het resultaat van de kwantisering wordt opgeslagen in het type drijvende komma, dwz coderingscode met drijvende komma.

De meeste PCM-voorbeeldgegevensindelingen gebruiken gehele getallen om op te slaan, en voor sommige toepassingen die hoge precisie vereisen, gebruikt u drijvende komma om PCM-voorbeeldgegevens weer te geven.

kader
Nadat de audio is gekwantiseerd tot een binair codewoord, moet het worden getransformeerd en de transformatie (MDCT) wordt gedaan in blokeenheden, en een blok bestaat uit meerdere (120 of 128) samples. Een frame zal een of meer blokken bevatten. Veelgebruikte framematen zijn 960, 1024, 2048, 4096, enz. Een frame neemt een geluidseenheid op waarvan de duur het product is van de sampleduur en het aantal kanalen. De nb_samples in de AVFrame-structuur in FFmpeg vertegenwoordigen het aantal enkelkanaals audiosamples in een frame.


Free Download Mp4Gain
picture

Gerelateerd audiokenmerk

Gerelateerd audiokenmerk

Sample Rate

kanaal, samplefrequentie, samplebits, sampleformaat, bitrate

Sample Rate

De PCM die wordt verkregen uit audiosampling bevat drie elementen: kanaal, samplefrequentie en samplefrequentie.

kanaal
Wanneer mensen het geluid horen, kunnen ze de geluidsbron lokaliseren. Door de geluidsbron op verschillende standen te zetten kan een betere luisterervaring worden gecreëerd. Als de positie van de audio wordt aangepast met het beeld, wordt een betere audiovisuele ervaring verkregen. Effect. Veelvoorkomende kanalen zijn:

aap aap
Twee kanalen, stereo, het meest voorkomende type, inclusief linker- en rechterkanalen
2.1 kanalen, een baskanaal toevoegen op basis van twee kanalen
5.1 kanalen, waaronder een voorkanaal, een linksvoorkanaal, een rechtsvoorkanaal, een surround linkskanaal, een surround rechtskanaal en een baskanaal, voor het eerst gebruikt in vroege theaters
7.1-kanaals, op basis van 5.1-kanaals, zijn de linker- en rechtersurroundkanalen verdeeld in linker- en rechtersurroundkanalen en links- en rechtsachterkanalen, voornamelijk gebruikt in BD en moderne theaters
Het volgende is een tweekanaals audiosysteem.

 

 

Bemonsteringsfrequentie:
Audiosampling is de omzetting van geluid van een analoog signaal naar een digitaal signaal. De samplefrequentie is het aantal keren dat het geluid per seconde wordt verzameld en is ook het aantal samples per seconde van het resulterende digitale signaal. Bij het samplen van geluid zijn de gebruikelijke samplefrequenties:

8.000 Hz – bemonsteringsfrequentie van de telefoon, voldoende voor menselijke spraak
11.025 Hz – samplefrequentie voor AM-radio
22.050 Hz en 24.000 Hz – samplefrequentie voor FM-radio
32.000 Hz – sampling voor miniDV digitale camcorder, DAT (LP-modus)
44.100 Hz – Audio-cd, ook vaak gebruikt in MPEG-1-audio (VCD, SVCD, MP3) Sample rate 47 250
Hz – Bemonsteringsfrequentie
48.000 Hz voor commerciële PCM-recorders – voor miniDV, digitale TV, DVD, DAT, films en pro-audio Bemonsteringsfrequentie 50.000 Hz voor 2.000 – 96.000 of 192.000 Hz digitaal geluid
voor commerciële digitale geluidsrecorders
– DVD-Audio, sommige LPCM DVD-soundtracks, BD-ROM (Blu-ray Disc) en HD-DVD (High Definition DVD) soundtracks De samplefrequentie die wordt gebruikt door de audiotrack
2,8224 MHz: de samplefrequentie die wordt gebruikt door het 1-bit sigma-delta-modulatieproces van Direct Stream Digital.

Audio-intro deel 3

Audio-intro deel 3

Audio Intro

WAV

Audio Intro

 

structuur
bestandskop
Het WAV-formaat volgt het RIFF Resource Interchange-bestandsformaat, dus het WAV-formaat is eigenlijk een relatie met drie lagen, wat hier vereenvoudigd wordt. Het bestandsheaderformaat is als volgt:

Adres Carving type inhoud
00H-03H 4 tekens * 4 RIFF-vlag voor uitwisseling van bronbestanden
04H-07H 4 unsigned int Het aantal bytes vanaf het volgende adres tot het einde van het bestand.
08H-0BH 4 karakters * 4 WAV-bestand WAVE-logo
0CH-0FH 4 karakters * 4 fmt wave-bestandsvlag, het laatste cijfer is 0x20 spatie
10H-13H 4 unsigned int De grootte van de subchunk-bestandskop. Voor het WAV-subfragment is de waarde 0x10.
14H-15H 2 korte niet-ondertekende Formaattype, wanneer de waarde 1 is, betekent dit dat de gegevens lineaire PCM-codering zijn;
16H-17H 2 kort niet-ondertekend aantal kanalen
18H-1BH 4 int unsigned Sampling rate
1CH-1FH 4 int unsigned Wave file bytes per seconde = sample rate Bitdiepte PCM / 8 kanalen
20H-21H 2 korte unsigned DATA data block unit lengte = aantal kanalen * PCM bitdiepte / 8
22H-23H 2 kort unsigned Bitdiepte PCM
24H-27H 4 karakters * 4 gegevensstempelgegevens
28H-2BH 4 unsigned int Totale lengte van datadeel (bytes)
struct WAVHeader
{ char RIFF [ 4 ]; ///Resource bestandsuitwisselingsvlag RIFF niet-ondertekende LEN; ///Aantal bytes vanaf het volgende adres tot het einde van het bestand char WAV [ 4 ]; ///WAV-bestandsvlag WAVE char FMT [4]; ///Wave fmt-bestandsaanwijzer, laatste cijfer is 0x20 spatie unsigned SubchunkSize; ///De grootte van de sub-chunk bestandsheader, voor WAV deze sub-chunk is de waarde 0x10 DATATYPE short unsigned; / //Formaattype, wanneer de waarde 1 is, betekent dit dat de gegevens niet-ondertekende lineaire PCM-codering kort CH zijn; ///Aantal niet-ondertekende kanalen F; /// Niet-ondertekende samplefrequentie BYTERATE; ///Aantal bytes per seconde van wave-bestand = sample rate*PCM bit depth/8*Aantal niet-ondertekende kanalen

korte DATAUNITLEN; ///DATA block unit length=kanaalnummer*Bitdiepte PCM/8 unsigned short BITDEPTH; /// Bitdiepte karakter PCM DATA [ 4 ]; ///Data flag data unsigned DATALEN ; ///Gegevens gedeeltelijke totale lengte (bytes)};

gegevensorganisatie
Na de bestandskop staat het gegevensgedeelte van het WAV-bestand. De gegevensorganisatie is: de linkerkanaalwaarde van het eerste monsterpunt, de rechterkanaalwaarde van het eerste monsterpunt, …, de linkerkanaalwaarde van het laatste monsterpunt, de rechterkanaalwaarde van de laatste monsterpuntwaarde. Elke waarde heeft een bitdiepte van bits.

Genereer een eenvoudige wav
Vul eerst de Wav-header in.

WAVHeader getHeader ( int nummer )
{
WAV Header res; memcpy (res.RIFF, “RIFF” , sizeof (res.RIFF)); memcpy (res.WAV, “WAVE” , sizeof (res.WAV)); memcpy (res.FMT, “fmt”, grootte van (res.FMT)); res.SubchunkSize= 0x10; res.DATATYPE=1; res.CH= 2 ; res.F=F; res.BITDEPTH=DIEPTE; res.BYTERATE=res.F*res.BITDEPTH/ 8 *res.CH; res.DATAUNITLEN=res.CH*res.BITDEPTH/8 ; memcpy(res.DATA, “gegevens”

 

 

 

, grootte van ( res.DATA ));
res.DATALEN=num*res.DATAUNITLEN;
res.LEN=res.DATALEN+ 44 -8 ; terugkeerders; }

Definieer eerst de sleutelnaam – frequentievergelijkingstabel.

const dubbele toetsf[]=
{ 27.5 , 29.1352 , 30.8677 , 32.7032 , 34.6478 , 36.7081 , 38.8909 , 41.2034 , 43.6535 , 46.2493 , 48.9994 , 51.9131 , 55 , 58.2705 , 61.7354 , 65.4064 , 76978.2957 ,

103.826 , 110 , 116.541 , 123.471 , 130.813 , 138.591 , 146.832 , 155.563 , 164.814 , 174.614 , 184.997 , 195.998 , 207.652 , 220 , 233.082 , 246.942 , 261.626 , 277.183 , 293.665, 329.1628 , 440

, 466.164 , 493.883 , 523.251 , 554.365 , 587.33 , 622.254 , 659.255 , 698.456 , 739.989 , 783.991 , 830.609 , 880 , 932.328 , 987.767 , 1046.5 , 1108.73 , 1344229864 , ,

1975.53, 2093, 2217.46, 2349.32, 2489.02, 2637.02, 2793.83, 2959.96, 3135.96, 3322.44, 3729.31, 3951.07, 4186.01; ___ { “A-0”, “A#0”, “B-0”, “C-1”, “C#1”, “D-1”, “D#1”, “E-1”, “F-1”, “F#1”

 

, “G-1”, “G#1”, “A-1”, “A#1”, “B-1”, “C-2”, “C#2”, “D-2″, ” D#2″, “E-2”, “F-2”, “F#2”, “G-2”, “G#2”, “A-2”, “A#2”, “B- 2”, “C-3”, “C#3”, “D-3”, “D#3”, “E-3”, “F-3”, “F#3”, “G-3” , “zon#3” ,

Audio-intro deel 2

Audio-intro deel 2

Audio Intro

 

Een wav is 44100 Hz 16-bit stereo of 22050 Hz 8-bit mono, wat betekent dat? stereo/mono verwijst naar dual/mono.

Audio Intro

 

Voor monofone geluidsbestanden zijn de voorbeeldgegevens een 8-bit kort geheel getal (korte int 00H-FFH); voor tweekanaals stereogeluidsbestanden is elke voorbeeldgegevens een 16-bits geheel getal (int) en de bovenste acht bits (linkerkanaal) en onderste acht bits (rechterkanaal) vertegenwoordigen respectievelijk de twee kanalen.

Geluid is een mechanische golf, geproduceerd door de trilling van een object, en heeft een medium nodig om zich voort te planten. Dus in wezen is een geluid een golfvorm op een as in de tijd.

Geluid heeft drie elementen: toonhoogte, volume en timbre:

De toonhoogte wordt bepaald door de frequentie van de geluidsgolf, hoe hoger de frequentie, hoe hoger de toonhoogte.
Het volume wordt bepaald door de amplitude van de geluidsgolf, hoe groter de amplitude, hoe luider het geluid.
Het timbre wordt bepaald door de “vorm” van de golfvorm (geluiden als vierkant, driehoek en zaagtand worden impulsgolven genoemd en klinken individueel).
Een audiobestand is een bestand dat wordt verkregen door een analoog signaal om te zetten in een digitaal signaal. Over het algemeen zijn er vijf belangrijke parameters: coderingsmethode, aantal kanalen, bemonsteringssnelheid, bitdiepte en bitsnelheid.

Codering: hoe dit formaat binaire gegevens organiseert en hoe het wordt gecomprimeerd.
Aantal kanalen: mono, dual of 5.1 kanalen, etc.
Sampling rate: Het aantal samples per seconde.
Bitdiepte: Het aantal binaire bits dat wordt gebruikt om de y-waarde van het monsterpunt op te slaan.
Bitrate – Het gewenste aantal bits per seconde voor het bestand.
We weten dat er geen compressie is in het WAV-formaat, dus de coderingsmethode is om alle gesamplede punten direct in volgorde naar het bestand te schrijven.

WAV-bestandsgrootte (B) = aantal kanalen * samplefrequentie (Hz) * bitdiepte (bit) / 8 + bestandskopgrootte (B, het is 44B)

Implementatie
Wanneer je een mp3- of wav-bestand opent met een teksteditor, zie je getallen als deze:

4944 3303 0000 0000 3d48 5459 4552 0000
0006 0000 0032 3031 3800 5444 4154 0000
0006 0000 0032 3230 3300 5449 4d45 0000
0006 0000 0031 3430 3600 5052 4956 0000
168e 0000 584d 5000 3c3f 7870 6163 6b65
7420 6265 6769 6e3d 22ef bbbf 2220 6964
3d22 5735 4D30 4D70 4365 6869 487A 7265
537A 4E54 637A 6B63 3964 223F 3E0A 3A78
6D70 6D65 7461 2078 6D6C 6E78 3D22
6F62 653A 6574 612F
5249 4646 2e3d 0e05 5741 5645 666d 7420
1200 0000 0300 0200 44ac 0000 2062 0500
0800 2000 0000 6461 7461 a026 0e05 8089
00bc 00e8 f0bb c09e 8dbc 00c2 87bc 80f1
d3bc 8063 ccbc c030 fcbc 8012 f4bc 20bb
13bd e051 0fbd c0b0 2dbd 6079 28bd 4012
46bd 6032 40bd c0e3 5dbd 6040 57bd c015
7cbd e035 74bd b058 8dbd 50e2 88bd f0a7 9dbd e0dd 98bd 70d3 acbd e0a9 a7bd
d043 b8bd b0da b2bd
00e3 c4bd 605c bfbd

Deze hierboven is het mp3/wav-formaat van hetzelfde nummer. Wat is het verschil tussen hen?