Principe van mp3- en bestandsformaatanalyse. Deel 4


Free Download Mp4Gain
picture



We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE



THIS PRICE ONLY LASTS FOR A FEW DAYS




Principe van mp3- en bestandsformaatanalyse. Deel 4

MP3

De drie bytes die beginnen bij 1397H zijn 54 41 47, waarin het “TAG”-teken is opgeslagen, wat aangeeft dat dit bestand ID3 V1.0-informatie bevat.

MP3

De 30 bytes die beginnen bij 139AH slaan de naam van het nummer op, de eerste 4 bytes die geen 00 zijn, zijn 54 45 53 54, wat “TEST” betekent;
de 4 bytes beginnend bij 13F4H zijn 04 19 14 03 en het jaar van opslag is “25-04-2003” ”;
de laatste byte is 4E, die de muziekcategorie vertegenwoordigt, en de codenaam is 78, dat wil zeggen “Rock&Roll”; de
andere bytes zijn allemaal 00 en er wordt geen informatie opgeslagen.

4. Conclusies
Als belangrijk multimedia-gegevenstype zijn mensen altijd op zoek naar efficiëntere compressiemethoden en nieuwe geluidsbestandsindelingen. In het MP3-bestand wordt de MDCT-transformatie gebruikt, wat een quasi-optimale transformatie is met een eenvoudige structuur en eenvoudige programmering, waardoor het probleem wordt vermeden dat de optimale transformatie (KL) moeilijk op te lossen is voor de eigenwaarden en eigenvectoren van de covariantie. Matrix.

Door de analyse van het MP3-bestandsformaat is het niet moeilijk om de tekortkomingen ervan te vinden. Elk frame van een MP3-bestand heeft dezelfde 4-byte frameheader, wat wat extra ruimte vereist voor een MP3-bestand met een groot aantal frames. ID3 slaat de muziekbeschrijvingsinformatie op. De eigendoms-, copyright- en andere informatie in de framekop is ook beschrijvingsinformatie. De informatie over de muziekbeschrijving is een beetje rommelig.

De ontwikkeling van MP3 is in ieder geval niet te stoppen. MP3 is een erkend formaat voor geluidsgegevens geworden. MP3 wordt een hotspot op het gebied van multimedia-informatieverwerking, samen met JPEG-afbeeldingen en PDF-documenten.


Free Download Mp4Gain
picture

Principe van mp3- en bestandsformaatanalyse. Deel 3

Principe van mp3- en bestandsformaatanalyse. Deel 3

Mp3tag

De ID3-standaard MP3-frameheader houdt geen rekening met het opslaan van complexe informatie zoals songtitel, auteur, albumnaam, jaar, enz., behalve enkele eenvoudige muziekbeschrijvingsinformatie zoals privacy, copyright en origineel, die zeer noodzakelijk zijn in MP3-toepassingen.

mp3 tag

In 1996, in het “Studio 3”-project, stelde FricKemp voor om beschrijvingsinformatie toe te voegen om nummers op te slaan aan het einde van het MP3-bestand en vormde de ID3-standaard. Tot nu toe zijn ID3 V1.0, V1.1, V2 .0, V2, .3 en V2.4 normen geformuleerd. Hoe hoger de versie, hoe rijker en gedetailleerder de relevante informatie wordt vastgelegd.
De ID3 V1.0-standaard is niet compleet en de opgeslagen informatie is te klein om songteksten, albumhoezen, afbeeldingen enz. op te slaan. V2.0 is een redelijk complete standaard, maar het brengt problemen met het schrijven van software met zich mee, hoewel er veel mensen zijn die voorstander zijn van dit formaat, zijn er maar weinig die daadwerkelijk in software worden geïmplementeerd. De overgrote meerderheid van de MP3’s gebruikt nog steeds de ID3 V1.0-standaard. Deze standaard gebruikt de laatste 128 bytes aan het einde van het MP3-bestand om ID3-informatie op te slaan. Zie Tabel 3 voor instructies over het gebruik van deze 128 bytes.
Tabel 3 Final ID3 V1.0 Bestandsbeschrijving
lengte in
byte (byte) Beschrijving
1-3 3 Slaat het “TAG”-teken op, dat de ID3 V1.0-standaard aangeeft, gevolgd door de nummerinformatie.
4-33 30 Nummernaam
34-63 30 Auteur
64-93 30 Albumnaam
94-97 4 jaar
98-127 30 Opmerkingen
128 1 MP3-muziekcategorie, in totaal 147 soorten.

3.3 Bestandsvoorbeeld
Open een bestand met de naam test.mp3 in VC++ met de volgende inhoud:
000000 FF FB 52 8C 00 00 01 49 09 C5 05 24 60 00 2A C1
000010 19 40 A6 00 00 05 96 41 34 18 20 80 08 26 48 29
000020 83 04 00 01 61 41 40 50 04 00 C1 2 41 50 64

0000d0 Fe FF FB 52 80 01 EE 90 65 6E 02 30
0000E0 32 0C CD CD CD CD 46 16 41 89 B8 408 89 300 408
0000F0 33 B7 00 00 01 02 FF FF FF F4 E1 2F FF FF FF FF
……
0001A0 DF FF FF FF FB 52 8C 12 00 E 01 FE 90 58 6E 09 A0 02
000150 8513 B0 AC 45 F6 19 61 26 26
0001C0 05 AC B4 20 28 94 FF FF FF FF FF FF FF FF FF FF

001390 7F FF FF FF FD 4E 00 54 41 47 54 45 53 54 00 00
0013A0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
001400
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00 00 00 00
001410 00 00 00 00 00 00 4E
Bestandslengte is 1416H (5.142K), framekop is: FF FB 52 8C, geconverteerd naar binair:
11111111 11111011
0010010
10001100T

Principe van mp3- en bestandsformaatanalyse. Deel 2

Principe van mp3- en bestandsformaatanalyse. Deel 2

mp3

MP3 gebruikt perceptuele audiocodering (Perceptual Audio Coding) dit vervormingsalgoritme.

mp3

Het frequentiebereik van geluid dat door het menselijk oor wordt waargenomen, is 20 Hz tot 20 kHz. MP3 snijdt veel overbodige signalen en irrelevante signalen weg. De encoder transformeert het originele geluid naar het frequentiedomein via een gemengde filterbank en gebruikt een psycho-akoestisch model. om te schatten dat het misschien alleen het waargenomen ruisniveau is, wordt gekwantiseerd en omgezet in Huffman-codering om een ​​MP3-bitstream te vormen. De decoder is veel eenvoudiger, zijn taak is om het geluidssignaal uit de gecodeerde spectraallijncomponenten te extraheren door middel van inverse kwantisering en inverse transformatie. Het MP3-coderings- en decoderingsproces wordt weergegeven in figuur 1.
2.4 Gewijzigde discrete cosinustransformatie De cosinustransformatie
Modified Discrete CT (MDCT) verwijst naar het converteren van een tijddomeingegevensset naar frequentiedomeingegevens om de veranderingen in het tijddomein te kennen. MDCT is een verbetering van het DCT-algoritme. Het eerste snelle algoritme is snelle Fourier-transformatie (FFT), maar FFT heeft complexe bewerkingen, MDCT zijn echte bewerkingen, gemakkelijk te programmeren.
Bij het comprimeren van audiogegevens verdeelt u eerst de oorspronkelijke geluidsgegevens in vaste blokken en voert u vervolgens directe MDCT (directe MDCT) uit om de waarde van elk blok om te zetten in MDCT-coëfficiënten van 512. De 512-coëfficiënten worden hersteld naar de oorspronkelijke geluidsgegevens en de originele voor en na geluidsgegevens zijn inconsistent omdat overtollige en irrelevante gegevens worden verwijderd tijdens het compressieproces. De FMDCT-transformatieformule is:
k=0, 1,
.
n0=(N/2+1)/2, X(n) is de tijdsdomeinwaarde, X(k) is de frequentiedomeinwaarde. Als N 1024 punten krijgt, worden het 512 frequentiedomeinwaarden.
De IMDCT-transformatieformule is:

n=0, 1, …, N-1
MDCT comprimeert zelf geen gegevens, het wijst het signaal eenvoudig toe aan een ander domein, en kwantisering comprimeert de gegevens. Wanneer bittoewijzing wordt uitgevoerd op de gekwantiseerde getransformeerde monsters, moet het gehele gekwantiseerde blok als het kleinste worden beschouwd, wat compressie met verlies wordt genoemd.
3 Analyse bestandsindeling
MP3 MP3-bestandsgegevens bestaan ​​uit meerdere frames en het frame is de kleinste eenheid van het MP3-bestand. Elk frame bestaat op zijn beurt uit een framekop, aanvullende informatie en geluidsgegevens. De afspeeltijd van elk frame is 0,026 seconden en de duur varieert met de bitsnelheid. Sommige MP3-bestanden hebben aan het einde extra bytes die beschrijvingsinformatie bevatten voor niet-audiogegevens.

Principe van mp3- en bestandsformaatanalyse.

Principe van mp3- en bestandsformaatanalyse.

Principle of mp3 and file format analysis

Principe van mp3- en bestandsformaatanalyse

Principle of mp3 and file format analysis

1. Inleiding
Met de snelle ontwikkeling van bestandscompressietechnologie is MP3 tegenwoordig het populairste muziekformaat geworden. Muziek van hoge kwaliteit verspreidt zich snel over de hele wereld met de opstelling van 0 en 1, die de harten van mensen doet schudden. Wat is MP3? De volledige naam van MP3 is MPEG Audio Layer 3. Dit is een efficiënt coderingsschema voor computeraudio. Het converteert audiobestanden naar kleinere bestanden met een .MP3-extensie met een hogere compressieverhouding, waarbij in feite de geluidskwaliteit van het originele bestand behouden blijft. MP3 maakt deel uit van de ISO/MPEG-standaard, die audiocompressie beschrijft met behulp van een hoogwaardig perceptueel coderingsschema. Deze standaard is voortdurend bijgewerkt om te voldoen aan het streven naar “hoge kwaliteit en lage kwaliteit”, en heeft nu MPEG Layer 1, Layer 2, Layer 3 drie audiocoderings- en decoderingsschema’s gevormd. MPEG Layer 3 compressieverhouding kan 1:10 tot 1:12 bereiken, 1M MP3-bestand kan worden afgespeeld gedurende 1 minuut en 1 minuut van CD-kwaliteit WAV-bestand (44100Hz, 16bit, dual channel, 60 seconden) neemt 10M ruimte in beslag, dus Berekend, zou de speelduur van een 650M MP3-disc meer dan 10 uur moeten zijn, en de speelduur van een CD met dezelfde capaciteit is ongeveer 70 minuten. Het voordeel van MP3 is dat de cd onvergelijkbaar is.
2 Analyse van het principe van MP3
2.1 audiostandaard
MPEG MPEG (Moving Picture Experts Group) is een groep dynamische beeldexperts onder ISO, de MPEG-standaard waardoor het veel wordt gebruikt in verschillende multimedia. De MPEG-standaarden omvatten audio- en videostandaarden, waarvan de audiostandaarden zijn vastgesteld als MPEG-1, MPEG-2, MPEG-2 AAC en MPEG-4.
De MPEG-1- en MPEG-2-standaarden gebruiken dezelfde familie van audiocodecs: Layer 1, 2, 3. Een nieuwe functie van MPEG-2 is het gebruik van een lage samplefrequentie-uitbreiding om de datastroom te verminderen, en een andere functie is meerkanaals uitbreiding, waardoor het aantal hoofdkanalen wordt verhoogd tot 5. De MPEG-2 AAC-standaard (MPEG-2 Advanced Audio Coding) werd in 1997 vrijgegeven door Fraunhofer IIS en AT&T om het dataverkeer aanzienlijk te verminderen. Het door MPEG-2 AAC aangenomen MDCT-algoritme (Modified Discrete Cosine Transform) heeft een bemonsteringsfrequentie tussen 8KHz en 96KHz, het aantal kanalen kan tussen 1-48 liggen.
De drie lagen van MPEG Audio Layer 1, 2 en 3 gebruiken dezelfde filterbank, bitstreamstructuur en headerinformatie, en de bemonsteringsfrequentie is 32KHz, 44,1KHz of 48KHz. Layer 1 is ontworpen voor DCC (Digital Compact Cassette) gecomprimeerde digitale tape, de datasnelheid is 384kbps, Layer 2 heeft een compromis gemaakt tussen complexiteit en prestaties, en de datasnelheid is teruggebracht tot 256kbps-192 kbps. Laag 3 is vanaf het begin ontworpen voor weinig dataverkeer en het dataverkeer is 128 Kbps-112 Kbps. Laag 3 voegt MDCT-transformatie toe om de frequentieresolutie 18 keer die van laag 2 te maken. Laag 3 gebruikt ook gemiddelde informatie die vergelijkbaar is met MPEG-video. Entropy-codering vermindert overtollige informatie. De overgrote meerderheid van de MP3’s gebruikt de MPEG-1-standaard.
2.2 Doel van audiocompressie
Het MP3-formaat begon in het midden van de jaren tachtig, toen het Fraunhofer-instituut in Erlangen, Duitsland, zich toelegde op het coderen van geluid van hoge kwaliteit en lage gegevenssnelheid. Laten we naar een voorbeeld kijken: u wilt een song samplen die u leuk vindt en die ongeveer 4 minuten lang is, deze op een schijf opslaan, deze in CD-kwaliteit WAV-formaat samplen, met een samplefrequentie van 44,1 kHz, dat wil zeggen een waarde ontvangen van 44100 per seconde, stereo, elke gesamplede data is 16 bits (2 bytes), dus de ruimte die dit nummer inneemt is:
44100 x 2 kanalen x 2 bytes x 60 seconden x 4 minuten = 40,4 MB
Als u dit nummer van internet downloadt, aangenomen dat de transmissiesnelheid 56 kbps is, is de downloadtijd:
40.4x106x8/56x103x60=96 minuten
Zelfs een breedbandnetwerk van 1M heeft meer dan 5 minuten nodig, het is duidelijk dat audiocompressie bijzonder belangrijk is om de opslagruimte voor audiogegevens te verminderen.
2.3 Coderen en decoderen
MP3 MP3-audiocompressie bestaat uit twee delen: codering en decodering. Codering zet de gegevens in een WAV-bestand om in een sterk gecomprimeerde bitstream, en decodering neemt de bitstream en reconstrueert deze in een WAV-bestand.