DETECTIE EN ANALYSE VAN COMPRESSIE TRACKS VAN GELUIDSSIGNALEN MET BEHULP VAN MP3-, AAC-, WMA- EN VORBIS-CODES


Free Download Mp4Gain
picture



We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE



THIS PRICE ONLY LASTS FOR A FEW DAYS




DETECTIE EN ANALYSE VAN COMPRESSIE TRACKS VAN GELUIDSSIGNALEN MET BEHULP VAN MP3-, AAC-, WMA- EN VORBIS-CODES

audio signal

DETECTIE EN ANALYSE VAN MP3-, WMA-, OGG- EN VORBIS-CODECS IN AUDIO-SIGNALEN

audio signals

Het artikel beschrijft de methode van MP3-, WMA-, OGG- en Vorbis codec-traceerdetectie in het audiosignaal.

De methode onthult digitale audiobewerking, verandering van samplefrequentie en multi-coderingstraces. Sleutelwoorden: digitale audio- en video-forensisch onderzoek, codec-trace-detectie, psycho-akoestische codecs, MP3, AAC, WMA, Vorbis. Inleiding Tegenwoordig worden digitale fonogrammen of videofonogrammen, waarvan het audiosignaal is gecomprimeerd, vaak onderwerp van onderzoek van video- en geluidsopnamen.

Het doel van compressie is in de regel om spraakverkeer op communicatiekanalen te verminderen of om de hoeveelheid opgeslagen gegevens te verminderen. Apparaten en programma’s die algoritmen implementeren om audio- en videosignalen te comprimeren, worden codecs genoemd.

Verhoogde herkenning op het gebied van digitale opname en opslag van audiosignalen ontvangen de zogenaamde psychoakoestische codecs, die zorgen voor compressie van het signaal door er spectrale componenten uit te verwijderen die onhoorbaar zijn voor mensen (frequentie- en tijdmaskering). Het gebruik van dergelijke codecs vermindert aanzienlijk de hoeveelheid geheugen die nodig is om het signaal weer te geven, waardoor de geluidskwaliteit op een aanvaardbaar niveau blijft voor dagelijks gebruik. Daarom worden psycho-akoestische codecs veel gebruikt in de media-industrie.

De meest bekende en wijdverbreide vertegenwoordiger van de psychoakoestische codec-familie is MPEG 1/2 / 2.5 Layer 3, beter bekend als de MP3-codec. De mp3-codec werd meer dan 20 jaar geleden ontwikkeld en wordt nu in bijna elk apparaat geïmplementeerd met de functie van het opnemen en reproduceren van fonogrammen of videofonogrammen op software- of hardwareniveau.

In het afgelopen decennium zijn psychoakoestische codecs steeds gebruikelijker geworden, waarbij meer geavanceerde psychoakoestische modellen worden gebruikt: Advanced Audio Codec (AAC), WMA (Windows Media Audio) en Ogg Vorbis (OGG). Theoretische achtergrond Bij het analyseren van het dynamische spectrogram van een signaal dat is gecodeerd met psychoakoestische codecs, is het vaak gemakkelijk om rechthoekige uitschieters op te merken (Fig. 1), wat een van de tekenen is van het gebruik van een van de psychoakoestische codecs. Figuur 1. Dynamisch spectrogram met coderingssporen van MP3-codecs. Deze dropouts zijn het resultaat van het coderen van het signaal met behulp van de psychoakoestische codec, waarvan de werking hieronder wordt beschreven met de MP3-codec als voorbeeld.

In de eerste fase van MP3-codering wordt het spectrum van het signaal berekend met behulp van de Modified Discrete Cosine Transform (MDCT). Bovendien worden op basis van een psychoakoestisch frequentie- en tijdmaskeringsmodel de onhoorbare componenten van het MDCT-spectrum teruggezet op nul. Het spectrum van het signaal wordt vervolgens gekwantiseerd en gecodeerd met behulp van de Huffman-methode. Om de verdere beschrijving te vereenvoudigen, wordt de beschrijving van de coderingsstap behorende bij banddoorlaatfiltering en verminderde bemonstering van de signaal “banden” weggelaten voordat de MDCT-spectra worden berekend, aangezien dit niet relevant is in de context in overweging. In verband met deze vereenvoudiging in het werk zullen de afmetingen van de analysevensters worden aangegeven voor het oorspronkelijke signaal, en niet voor de “banden” van signalen, zoals aangegeven in de specificaties.

Gemakshalve worden MP3-spectra MDKP-spectra genoemd, die op dezelfde manier worden berekend als bij MP3-codering. De berekening van MP3-spectra kan worden uitgevoerd met behulp van vier soorten analysevensters: met een standaardvenster van 1152 counts groot (aangegeven in blauw), een klein window van 384 counts groot (aangegeven in rood) en twee soorten vensters overgang (aangegeven in groen) kleur).

In dit geval zijn de venstergroottes niet afhankelijk van de samplefrequentie van het originele signaal. Tijdens het coderingsproces wordt het originele signaal verdeeld in fragmenten die elkaar kruisen met een stap van 576 samples (stap van het MP3-coderingsvenster). De grootte van het fragment, afhankelijk van het type venster, kan variëren van 1152 samples voor het standaardvenster, 960 voor het transitievenster en 768 voor het kleine venster (drie kleine vensters met een kruising van 50%), maar de stap tussen de “centra” van de fragmenten zijn in alle gevallen 576 monsters.


Free Download Mp4Gain
picture

Wat is een codec precies?

Wat is een codec precies?

Codec

Tegenwoordig zijn er ongeveer drie dozijn gangbare digitale audioformaten. Waarom u zoveel soorten geluidsbestanden moet maken om één type inhoud op te slaan en hoe u dit allemaal kunt beheren, leert u van dit materiaal.

Codecs

Veel gebruikers geven er zeker de voorkeur aan om hun thuiscomputer niet alleen als werkpaard te gebruiken, maar ook als multimediacentrum, waar ze films of familiefoto’s kunnen bekijken en naar hun favoriete muziek kunnen luisteren. Hoewel compacte digitale spelers of mobiele telefoons zeker geschikter zijn om naar muzikale composities te luisteren, kan een computer in tegenstelling tot hen niet alleen muziek afspelen.

Hoe groot het ingebouwde geheugen van uw muziekspeler ook is, het zal hoogstwaarschijnlijk moeilijk zijn om uw volledige muziekbibliotheek erop op te slaan. Bovendien kunt u met uw pc muziek maken, bewerken, ordenen en ernaar zoeken. Vergeet ook niet dat er tegenwoordig ongeveer drie dozijn gangbare digitale audioformaten zijn, en de meeste spelers zijn verre van omnivoor en kunnen er maar een paar afspelen.

Dus waarom moet je zoveel muziekindelingen maken om één type inhoud op te slaan? Feit is dat in de overgrote meerderheid van de gevallen het geluid in “gecomprimeerde” vorm wordt opgeslagen, aangezien een minuut niet-gecomprimeerde compositie ongeveer 10 MB op de harde schijf in beslag neemt. Enerzijds lijkt dit niet veel te zijn, maar anderzijds, als je een muziekliefhebber bent en je verzameling bestaat uit honderden of zelfs duizenden nummers, dan is het duidelijk dat het geluid moet worden gecomprimeerd om de ruimte die het inneemt te verkleinen. elektronische media.

Er worden verschillende speciale algoritmen gebruikt om muziekbestanden te comprimeren, die vervolgens de structuur en presentatie van de audiogegevens bepalen, de zogenaamde digitale audiobestandsformaten. Alle audioformaten kunnen worden onderverdeeld in drie groepen: ongecomprimeerde audioformaten, verliesloze compressie en verliesvrije compressie.

Geen compressie
Een van de meest voorkomende formaten die aan dit type gerelateerd zijn, is de bekende WAV. Het geluid van bestanden met deze extensie wordt opgeslagen zonder compressie of wijzigingen. Het is waar dat er veel meer ruimte nodig is om niet-gecomprimeerde bestanden op te slaan en daarom wordt WAV op grotere schaal alleen gebruikt in professionele audio- en videotoepassingen, waar het geluid geen kwaliteitsverlies mag hebben voordat het wordt verwerkt. Gewone muziekcomposities in deze vorm houden is een ongerechtvaardigde verspilling.

Om WAV-bestanden af ​​te spelen heeft u geen speciale software nodig, aangezien alle mediaspelers dit formaat begrijpen, inclusief de standaard Windows Media-audiospeler die in het Windows-systeem is ingebouwd.

Een ander formaat dat wordt gebruikt om niet-gecomprimeerde audio op te slaan en dat het vermelden waard is, is de ontwikkeling van Apple genaamd AIFF (Audio Interchange File Format). Zoals je misschien al geraden hebt, wordt het het meest gebruikt op Macintosh-computers met Mac OS X.

Lossless compressie (lossless)
Lossless compressie-algoritmen voor audiobestanden werken volgens het principe van conventionele archiefkasten. Ze bieden niet het hoogste compressieniveau (40 tot 60%), terwijl ze praktisch geen effect hebben op de geluidskwaliteit. Het is ook vermeldenswaard dat in dit geval de gecodeerde gegevens volledig in hun oorspronkelijke vorm kunnen worden hersteld. Daarom wordt het gebruik van verliesloze compressie meestal gebruikt in gevallen waarin het belangrijk is om de identiteit van de gecomprimeerde gegevens te behouden ten opzichte van het origineel.

De meest populaire audioformaten in deze groep zijn FLAC (Free Lossless Audio Codec), APE (Monkey’s Audio), WMA (Windows Media Lossless) en ALAC (Apple Lossless Audio Codec). Elk heeft zijn eigen voor- en nadelen. De APE-codec biedt bijvoorbeeld iets betere compressiewinst, terwijl FLAC vaker voorkomt. Over het algemeen slaan alle echte muziekliefhebbers hun muziekcollecties op in formaten zonder verlies, aangezien ze geen gegevens uit de audiostream verwijderen en bestanden die met deze codecs zijn gemaakt, zelfs op stereo’s van hoge kwaliteit kunnen worden beluisterd.

Om verliesvrije gecomprimeerde formaten af ​​te spelen, worden in de regel spelers van derden (behalve WMA) gebruikt, zoals MPlayer, foobar, AIMP, Winamp, VLC en andere, aangezien alle benodigde codecs al in hen zijn ingebouwd. Een andere optie is om apart een extra codec pack te installeren (bijvoorbeeld K-Lite), waarna je bestanden in lossless formaat kunt beluisteren vanaf vrijwel elke audiospeler.

Lossy compressie
Dit is de meest populaire groep algoritmen die de maximale audiocompressieverhouding biedt (tot 10 keer of meer). In tegenstelling tot eerdere formaten verliest het audiobestand echter aan kwaliteit.

Wat zijn videocodecs en audiocodecs?

Wat zijn videocodecs en audiocodecs?

Video Codecs

Bijna elke computergebruiker luistert er periodiek naar muziek, die elektronisch wordt opgeslagen. Er zijn veel formaten voor het opslaan van muziek, elk ervan is ontwikkeld voor specifieke taken:

Video Codec

Bitsnelheid is de hoeveelheid informatie die wordt gebruikt tijdens het coderen voor afspelen van 1 seconde. Hoe hoger het is, hoe minder de vervorming en het geluid komt zoveel mogelijk overeen met het origineel.
Lossless – Lossless audiocodering. Door te converteren naar verliesvrije formaten en vice versa, krijgen we exact hetzelfde geluid.
Lossy: compressie-indelingen die zijn ontworpen voor het feit dat een persoon eenvoudigweg bepaalde frequenties niet fysiek kan horen die tijdens de conversie worden overgeslagen. Tegelijkertijd kan het de hoeveelheid schijfruimte aanzienlijk besparen.

Audio CD
Het formaat dat het tijdperk van digitaal geluid inluidde na de overgang van vinylplaten. Het werd in 1979 als standaard aangenomen door Philips en Sony. In de audio-cd-indeling kan muziek alleen fysiek worden opgeslagen op optische media; bij het opnemen op een harde schijf, moet de audiotrack worden geconverteerd.

Vanwege de hoogste geluidskwaliteit en de mogelijkheid om op elke speler af te spelen, is het formaat nog steeds erg populair, ook al is het vrij oud.

Flac
Misschien wel het meest gebruikte formaat voor het opslaan van muziek zonder verlies. In vergelijking met andere lossless audiocompressiecodecs, is flac ontwikkeld door xiph.org volledig gratis en biedt het de kleinste uitvoerbestandsgrootte.

Mp3
Het meest populaire muziekformaat dat wordt geaccepteerd als een onofficiële standaard voor elk afspeelapparaat. Zijn populariteit is gebaseerd op het feit dat een mp3-bestand 30% van het originele verliesvrije bestand is, omdat het frequenties die voor het oor onhoorbaar zijn met praktisch dezelfde geluidskwaliteit, vermindert.

De eerste audiotrack in mp3-formaat verscheen in 1994. Een van de redenen voor zijn populariteit is de mogelijkheid om een ​​verscheidenheid aan aanvullende informatie over tags voor audiobestanden op te slaan en het gemak van het organiseren van een muziekbibliotheek.

Ogg
Een nieuw lossy-formaat dat in 2002 werd gelanceerd als een gratis alternatief voor betaalde formaten. In tegenstelling tot zijn voorgangers, met name mp3, biedt het de mogelijkheid van meerkanaals codering en meerkanaals audio-opslag. Het wordt het meest gebruikt in videogames.

De term “audio” betekent tegenwoordig alles wat op de een of andere manier met geluid te maken heeft. Dit is het verwerken, afspelen, mixen en gewoon luisteren naar audio-opnames. Weinig mensen weten dat tijdens hun bestaan ​​alle populaire audioformaten belangrijke veranderingen hebben ondergaan, soms ten goede en soms zelfs ten kwade.

Het probleem is dat wanneer de makers probeerden de opnamekwaliteit te verbeteren door het nieuwe formaat te gebruiken, de grootte van het resultaat aanzienlijk toenam. Het verkleinen van het uiteindelijke bestand resulteerde in een aanzienlijk kwaliteitsverlies. Maar dit was niet altijd het geval.

De eerste vermelding van computergeluid houdt verband met het maken van verschillende primitieve videogames. Vervolgens werd het geluid afgespeeld via de luidspreker van het systeem. Omdat de softwareontwikkelaars van die tijd het niet probeerden, slaagden ze er niet in het kwaliteitsniveau te bereiken dat compatibel zou zijn met tape- en reelrecorders. Dit is wat veel ontwikkelaars ertoe heeft aangezet na te denken over hoe ze het audioformaat kunnen wijzigen om het geluid natuurlijker en natuurlijker te maken. Het is dit probleem dat heeft geleid tot de huidige concurrentie op de audiomarkt. Als resultaat hebben de gebruikte formaten een sterke invloed op de kwaliteit van het gereproduceerde materiaal en de configuratie van de basis afspeelparameters.

WAV-indeling

De eerste volledige kwaliteit van audioformaten is gekoppeld aan dit specifieke formaat. De WAV-extensie-aanduiding is afgeleid van het Engelse woord “wave”, wat in het Russisch wave betekent. Het was dit formaat dat het eerste audioformaat werd dat werd verwerkt met computerprogramma’s op een zeer professioneel niveau. Bestanden met een WAV-extensie hadden de volgende kenmerken:

– diepte van geluid;
– bemonsteringsfrequentie;
– bitsnelheid, etc.

Dit formaat was zelfs compatibel met het geluid dat kon worden verkregen na het verwerken van een audio-cd met een equalizer en andere tools. De bestandsgrootte was in dit geval echter volledig ongegrond. De meest gebruikelijke track van 3 minuten kan bijvoorbeeld maximaal 50 megabyte lang zijn.

Vorbis

Vorbis

OGG Vorbis

Vorbis is een gratis en lossy audiocompressieformaat dat officieel werd uitgebracht in de zomer van 2002. Qua functionaliteit en kwaliteit is het vergelijkbaar met codecs zoals AAC, AC3 en VQF, superieur aan MP3. Het psychoakoestische model dat in Vorbis wordt gebruikt, is in principe vergelijkbaar met MP3 en dergelijke, maar de wiskundige verwerking en praktische implementatie van dit model zijn significant verschillend, waardoor de auteurs het formaat volledig onafhankelijk van alle voorgangers konden verklaren.

ogg vorbis

Container

Voor het opslaan van audiogegevens in Vorbis-formaat wordt de Ogg-mediacontainer het meest gebruikt, een dergelijk bestand heeft meestal de extensie .ogg en wordt genoemd met de dubbele naam “Ogg / Vorbis” [1] of ” Ogg Vorbis “[2]. “Ogg Vorbis” wordt op zichzelf echter ook een codec genoemd zonder container, aangezien het deel uitmaakt van het Ogg-project [1].

Verzoek

In 2020 is het veel minder wijdverspreid dan mp3. Gebruikt in computerspellen, voor podcasts.

Vorbis is ideaal voor gebruik als soundtracks van films, aangezien de duur niet verandert wanneer de bitsnelheid variabel is, zodat u synchroon kunt blijven met de videotrack en geschikt is voor meerkanaals geluid (bijvoorbeeld 6 kanalen).

Het wordt gebruikt voor de audiotrack van WebM-bestanden in combinatie met de VP8-videocodec (sinds VP9 is ondersteuning voor de nieuwe gratis Opus-codec aan het formaat toegevoegd).

Metadata

Het formaat is oorspronkelijk ontworpen met streamingmogelijkheden. Dit geeft het formaat een vrij handig neveneffect: meerdere nummers kunnen in één bestand worden opgeslagen met hun eigen tags. Bij het laden van een dergelijk bestand in de speler, zouden alle nummers eruit moeten zien alsof ze uit verschillende bestanden zijn geladen.

Het formaat heeft een flexibel labelsysteem. De tag-header kan eenvoudig worden uitgebreid met songteksten van elke lengte en complexiteit (zoals songteksten), afgewisseld met afbeeldingen (zoals albumhoezen). Tekstlabels worden opgeslagen in UTF-8, waardoor schrijven in meerdere talen tegelijkertijd mogelijk is en mogelijke coderingsproblemen worden geëlimineerd.

Bitrate
Ogg Vorbis gebruikt standaard een variabele bitrate, terwijl de laatste niet beperkt is tot harde waarden en zelfs met 1 kbps kan variëren. Opgemerkt moet worden dat de maximale bitsnelheid niet strikt wordt beperkt door het formaat, en met de maximale coderingsinstelling kan deze variëren van 500 tot 1000 kbps. De samplefrequentie heeft dezelfde flexibiliteit: gebruikers kunnen kiezen tussen 2 en 192 kHz.

Ontwikkelingsdoelstelling
Vorbis is ontwikkeld door de Xiph.Org-gemeenschap om alle betaalde eigen audioformaten te vervangen. Ondanks dat Ogg Vorbis de jongste van alle mp3-concurrenten is, biedt het volledige ondersteuning op alle populaire platforms (Microsoft Windows, Linux, Apple Mac OS, Android [3], PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS en etc.), evenals een groot aantal hardware-implementaties.