Lossy-compressie: comprimeer audio en video


Free Download Mp4Gain
picture



We now offer a subscription for just 10 cents a day*

You will always enjoy the full version of Mp4Gain with all its features and benefits.

For just 10 cents a day*

*Unlimited FULL version of Mp4Gain, billed $US12.50 Quarterly (+ $5 USD one time subscription payment JUST in the first payment).

All other payments will be just $3.12 per month, billed quaterly.

That's only 10 cents per day!

CLICK TO PURCHASE



THIS PRICE ONLY LASTS FOR A FEW DAYS




Lossy-compressie: comprimeer audio en video

Lossy cmpression

Voor gedigitaliseerde audio van hoge kwaliteit is veel schijfruimte nodig. Pogingen om de bestandsgrootte te verkleinen met behulp van standaard archiefkasten leveren geen significante voordelen op vanwege de specificiteit van de audiogegevens. Het is echter mogelijk om een ​​redelijk significant compressieniveau van de audio-informatie te bereiken met behulp van speciale methoden die zijn gebaseerd op de analyse van de gegevensstructuur en daaropvolgende compressie met enig verlies.

Lossy Compression

De reële mogelijkheid van geluidsverwerking die qua kwaliteit vergelijkbaar is met bestaande analoge voorbeelden, kwam pas aan het eind van de jaren 80. In 1988 vormde de Internationale Organisatie voor Standaardisatie (ISO) de MPEG-commissie (Moving Image Experts Group). , met als hoofdtaak het ontwikkelen van standaarden voor het coderen van bewegend beeld, geluid en hun combinatie. De commissie heeft in de tien jaar van haar bestaan ​​een reeks normen op dit gebied ontwikkeld. Als gevolg hiervan, samenvattend het uitgebreide onderzoek op dit gebied, werden verschillende specifieke formaten aanbevolen voor het opslaan van gegevens, die uitstekend zijn in kwaliteit van resultaten en gegevensstroom.

Momenteel zijn de drie meest gebruikte standaarden voor video-opslag MPEG-1, MPEG-2 en MPEG-4. Binnen de eerste twee formaten zijn er ook formaten voor het opslaan van audio-informatie: Layer-1, Layer-2 en Layer-3. Deze drie audioformaten zijn gedefinieerd voor MPEG-1 en kleine extensies worden gebruikt in MPEG-2. De drie indelingen lijken op elkaar, maar gebruiken verschillende niveaus van compromis tussen compressie en complexiteit. Laag-1 is het eenvoudigste niveau, het vereist geen aanzienlijke compressiekosten, maar het biedt ook een verwaarloosbare compressieverhouding. Laag-3-niveau: het meest tijdrovend en biedt de beste compressie. Onlangs is dit formaat enorm populair geworden. Het wordt vaak mp3 genoemd. Deze naam is gekoppeld aan de extensie van de audiobestanden die in deze indeling zijn opgeslagen.

Opgericht idee, waarbij alle compressiemethoden voor audiosignaalverlies – de subtiele details van het originele geluid negeren, die buiten wat het menselijk oor waarneemt. Hier kunnen verschillende punten worden benadrukt.

Geluidsniveau. Geluidscompressie is gebaseerd op een simpel feit: als een persoon in de buurt van een luide sirene is, is het onwaarschijnlijk dat hij het gesprek van de mensen in de buurt zal horen. Dit gebeurt ook niet omdat een persoon veel aandacht besteedt aan een hard geluid, maar in grotere mate omdat het menselijk oor daadwerkelijk geluiden mist die in hetzelfde frequentiebereik liggen als een luider geluid. Dit effect wordt maskering genoemd, het verandert met het verschil in volume en frequentie van het geluid.

Het tweede punt is de verdeling van de audiofrequentieband in subbanden, die elk afzonderlijk verder worden verwerkt. Het coderingsprogramma extraheert de luidste geluiden in elke band en gebruikt deze informatie om een ​​aanvaardbaar ruisniveau voor die band te bepalen. De beste coderingsprogramma’s houden ook rekening met de invloed van aangrenzende banden. Een erg hard geluid in één band kan het maskerende effect en nabijgelegen banden beïnvloeden.

Een ander punt van de codificatie is het gebruik van een psychoakoestisch model gebaseerd op de eigenaardigheden van de menselijke waarneming van geluid. Compressie Het gebruik van dit model is gebaseerd op het verwijderen van duidelijk onhoorbare frequenties met een zorgvuldiger behoud van geluiden die duidelijk te onderscheiden zijn door het menselijk oor. Helaas kunnen hier geen exacte wiskundige formules zijn. De menselijke perceptie van geluid is een complex proces dat niet volledig wordt begrepen, dus de keuze van compressiemethoden is gebaseerd op het analyseren van luisteren en het anders vergelijken van gecomprimeerde geluiden door teams van experts. Maar hier zijn er praktisch onbegrensde mogelijkheden op het gebied van het verbeteren van psychoakoestische modellen. De meeste van de bestaande algoritmen om de menselijke stem te coderen zijn gebaseerd op de hoge voorspelbaarheid van genoemd signaal; Universele MPEG-compressie-algoritmen hebben geprobeerd deze techniek met wisselend succes toe te passen.

Een andere compressietechniek is het gebruik van zogenaamde joint stereo. Het is bekend dat het menselijk gehoorapparaat alleen de richting van de middenfrequenties, het hoge en lage geluid als het ware los van de bron kan bepalen. Dit betekent dat deze achtergrondfrequenties kunnen worden gecodeerd in een monosignaal. Naast dit alles maakt compressie gebruik van het verschil in complexiteit van de stromen in de kanalen. Als er bijvoorbeeld enige tijd totale stilte is op het rechterkanaal, wordt deze “gereserveerde” plaats gebruikt om de kwaliteit van het linkerkanaal te verbeteren.


Free Download Mp4Gain
picture

HET HOOFDTELEFOONSTEKKER IS IN ZIJN LAATSTE DAGEN

HET HOOFDTELEFOONSTEKKER IS IN ZIJN LAATSTE DAGEN

Ficha Conector Mini Plug Stereo 3.5 Trs La Roca Envio

In de afgelopen vijftien jaar hebben elektronische apparaten een dramatische sprong gemaakt naar een volledig digitale interface. Kijk eens – er zijn praktisch geen analoge aansluitingen, zelfs niet in het dagelijks leven! Schermen, digitale communicatie met een printer en muis, digitale opslagapparaten zijn digitaal geworden. Niet alles is echter vervangen. Pak een smartphone en je zult direct merken dat dit praktisch het enige is dat nog niet is vervangen. Een “analoog gat”, letterlijk: een koptelefoonaansluiting of gewoon een aansluiting. Maar zijn tijd is gekomen.

Jack is niet eens een uitvinding van de 20e eeuw, maar de 19e eeuw. Volgens de legende verscheen het gelijktijdig met grote telefooncentrales in het laatste kwart van de 19e eeuw. Op dat moment was er geen automatische omschakeling van abonnee naar abonnee, het probleem werd opgelost door live operators, waarbij de vereiste kanalen handmatig werden verbonden. Later, halverwege de 20e eeuw, met de komst van draagbare audioapparatuur, begon de connector te krimpen: de diameter van 1/4 inch werd teruggebracht tot 1/8 (van 6,35 naar 3,5 mm, respectievelijk), en vervolgens tot 2,5 mm. En in het digitale tijdperk diversifieerde het ook in termen van het aantal contacten: in plaats van de gebruikelijke twee of drie (voor stereo) verscheen een vierde voor de microfoon, bovendien begonnen fabrikanten de locatie van de contacten op de pin te veranderen naar believen. Het belangrijkste is echter dat het werkingsprincipe al die tijd ongewijzigd is gebleven: een klassieke connector is een eenvoudige bedrade verbinding van een elektrische spanningsbron naar een luidspreker die daadwerkelijk geluid genereert. En hoe verder, hoe meer kritiek het opriep.

Nee, normale gebruikers zijn er nog steeds redelijk tevreden over. Analoge audio-uitgang is eenvoudig, betrouwbaar en mechanisch robuust, goedkoop en, met een paar kanttekeningen, veelzijdig. Maar fabrikanten zien het anders.

Jack is te groot naar de huidige maatstaven. In moderne elektronica lijkt zelfs een 3,5 mm-aansluiting met slechts drie contacten te groot (ter vergelijking: er zijn 8 contacten op de Lightning-connector en maximaal 24 op de USB-C-connector). En van binnen zijn er nog meer problemen. Aangezien dit een analoge interface is, moet deze worden beschermd tegen parasitaire pickups (d.w.z. correct geplaatst, ontworpen en geïnstalleerd in het elektrische circuit), anders zal de geluidskwaliteit eronder lijden. Het is relatief “dom”: het geeft bijna geen feedback, dus een smartphone kan bijvoorbeeld niets leren over een headset die via een connector is aangesloten, behalve dat het wel is aangesloten. In een tijdperk van “slimme” dingen, in een tijd waarin ontwerpers vechten voor elke kubieke millimeter en streven naar universaliteit, zijn dergelijke verspilling en anachronisme onaanvaardbaar!

De beslissing doet zich voor en je begrijpt wat, maar het was echt moeilijk om over deze stap te beslissen. Alleen al de verkoop van koptelefoons wordt gemeten in miljarden dollars per jaar. Stel je voor hoeveel er beschikbaar zijn! En al deze mensen vertellen dat de connector verouderd is, dat ze met nieuwe apparaten nieuwe koptelefoons / oortelefoons nodig hebben, heb je gegarandeerd problemen. Maar de tijd is gekomen.

De afgelopen maand werd duidelijk dat er een aanval op analoge audio in de maak was. Niet zo gecoördineerd als we zouden willen, maar er zijn nog steeds elektronicaleiders bij betrokken: onafhankelijk van elkaar zijn Intel en Apple van plan om de connector te vervangen door digitale interfaces. Apple bevindt zich nog in de geruchtenfase. Uit de lekken blijkt dat de iPhone 7 / 7S, die naar verwachting dit najaar uitkomt, een krik mist. In plaats daarvan zal vermoedelijk de Lightning-poort worden gebruikt. Intel stelt officieel voor om de aansluiting te vervangen door USB-C (die in de meeste gevallen kan worden beschouwd als het equivalent van USB 3) en werkt al aan de bijbehorende standaard, met de belofte de resultaten in het tweede kwartaal te presenteren.

Wat betekent dit allemaal? Allereerst hebben gebruikers voor digitale apparaten van model 2017 en hoger nieuwe hoofdtelefoons / oortelefoons of ten minste één adapter nodig. Dit betekent dat de prijs van de “oren” zal stijgen: de digitale interface heeft een eigen audioversterker en communicatiechip nodig. Maar dit betekent zowel een hogere geluidskwaliteit (op zichzelf digitaal-naar-analoog conversie direct op het punt van consumptie, dit garandeert) als hogere “intelligentie” (in “slimme” hoofdtelefoons kunt u afspeelcontrolefuncties implementeren complexer, van terugspoelen tot het onderdrukken van lawaai; bovendien zullen ze in staat zijn om fundamenteel nieuwe functies uit te voeren, bijvoorbeeld het bewaken van het menselijk lichaam, wat handig is voor mensen die betrokken zijn bij sport) en, in het algemeen, de

Vinyl mythen

Vinyl mythen

Vynil myths

Het idee van een “vinylrenaissance” ontstond na de eerste teleurstellingen met de toen nog onvolmaakte digitale technologieën. Mensen werd geleerd dat het geluid van cd’s slechts een fractie van de informatie over het originele analoge signaal bevat (wat absoluut waar is), en dit zou beledigend moeten zijn in de oren van echte muziekkenners.

The Sound of Vinyl

De audiofiele code zegt: als je echt geluid wilt, vergeet dan het “dode getal” dat het geluid in stukken snijdt, een week lang de versterker opwarmen en massief gouden aansluitkabels gebruiken. Aangenomen wordt dat als je een schijf digitaliseert met een frequentie van enkele megahertz, je de “live analogie” en “geluidswarmte” onbereikbaar kunt houden voor CD’s. Voor meer drama vindt u hieronder een audioselectie van uitspraken van bekende en gerespecteerde mensen over hun ideeën over geluid en over het nu in de mode zijnde “vinyl” -thema.

Akoestiek heeft, net als elk ander kennisgebied, een eigen systeem ontwikkeld om de karakteristieken van geluid te meten, gebaseerd op de wetten van de fysica. Audiofielen vinden dat je naar muziek moet luisteren met je oren, niet met een oscilloscoop. Ik ben het ermee eens dat de “muzikaliteit” van het geluid niet altijd rechtstreeks afhangt van de technische kenmerken. Zo heeft het effect van thermionische emissie in vacuüm, in tegenstelling tot de beweging van elektronen door een halfgeleider, lineaire karakteristieken en een voorspelbaar gedrag van het versterkte signaal. Door verzadiging met uniforme harmonischen krijgt het geluid een uitgesproken kleurtoon, waardoor het “herkenningseffect” van muziekinstrumenten ontstaat. Daarom kan een buizenversterker, ondanks de slechtere eigenschappen vergeleken met een transistor, subjectief beter klinken. Met behulp van moderne technologie is geluid niet alleen te horen, maar ook te zien. Een directe visuele vergelijking van de kenmerken van verschillende formaten helpt bij het beantwoorden van veel vragen.

Wat betreft de verbindingskabels, die twee elektrische geleiders zijn, symmetrisch gelast aan de uiteinden, beweegt de audiofrequente wisselstroom er gelijkmatig in beide richtingen langs. Omdat alle analoge en digitale kabels passieve geleidende elementen zijn, dat wil zeggen dat ze geen signaalversterker hebben, is er geen verschil bij het aansluiten in beide richtingen.

Het formaat van de grammofoonschijf in zijn huidige vorm verscheen in de jaren 50 van de vorige eeuw. Dankzij het gebruik van een nieuw polyvinylchloride (afgekort vinyl) gemaakt van plastic en fijnkorrelig materiaal, werd de rotatiesnelheid van de plaat verlaagd van 78 naar 33 toeren per minuut en de breedte van de baan van 0,14 naar 0,055 mm. Tegelijkertijd is de afspeeltijd achtvoudig toegenomen en is de geluidskwaliteit dramatisch toegenomen. De naam Long Play (LP) is stevig gevestigd voor het nieuwe volledige formaat. Het fonogram wordt voorlopig onderworpen aan amplitudecompressie, zodat het dynamisch bereik overeenkomt met de eigenschappen van het vinyl. Dit proces heet mastering. Vervolgens wordt een master-disc opgenomen, een stevige aluminium basis waarop een dunne laag nitrocellulosevernis wordt aangebracht, waarop met behulp van een saffiersnijder een soundtrack wordt gevormd. Vervolgens worden de platen tijdens tussenstappen onder hoge druk en bij hoge temperatuur bedrukt. Een persmatrijs kan 500 tot 1000 kopieën maken, waarna de geluidskwaliteit afneemt. Niet voor niets bestaat de term “eerste indruk” die, afhankelijk van het standpunt, kan worden geïnterpreteerd als een geslaagde kopie van de schijf, of als een instabiliteit in de reproductie van het eindresultaat.

De aard van geluid is zodanig dat de energie van de lage frequenties veel groter is dan die van de hoge. Om uzelf hiervan te overtuigen, vergelijkt u eenvoudig de grootte van de verplaatsing van de woofer- en tweeterconussen. Tijdens het afspelen is het verschil in geluidsdrukniveaus aan de randen van het frequentiebereik groter dan 50 dB, wat overeenkomt met 400 keer de amplitudeverhouding van de laagste en hoogste geluiden. Rekening houdend met de signaalpieken op korte termijn, kan deze waarde enkele duizenden bereiken. De microscopische soundtrack van de plaat is niet in staat om een ​​groot dynamisch bereik over te brengen, en mastering alleen is hier niet voldoende. Het signaalniveau bij de ondergrens ligt dicht bij het geluid van een vinylbasis, waarvan de korrelstructuur vergelijkbaar is met de hoogfrequente trillingen van de soundtrack, die het geluid kunnen vervormen.

Om de spreiding van amplitudes te verminderen, wordt frequentiecorrectie toegepast tijdens het opnemen van de master-disc: lage frequenties worden verzwakt en hoge frequenties worden versterkt, het crossover-punt is de frequentie van 1 kHz. In dit geval het verschil in drukniveaus

Fysieke en psychoakoestische analyse van digitaal geluid met hoge resolutie

Fysieke en psychoakoestische analyse van digitaal geluid met hoge resolutie

Sample Rate

“De kern van de vraag is:” Waarom constant de samplefrequentie verhogen in moderne audiocommunicatiesystemen (enorme bedragen uitgeven) als de drempels van het gehoorsysteem in frequentie beperkt zijn tot het bereik van 20 Hz. 20 kHz? ”

Sample Rate

De analyse van de verzamelde kennis over dit onderwerp stelt ons in staat te zeggen dat dit niet voldoende is. Gezien de complexiteit van het audiosignaal en de eigenschappen van het gehoorsysteem, kan worden gesteld dat alleen een verhoging van de resolutie van de transmissiesystemen op alle gebieden (temporeel, spectraal, ruimtelijk en dynamisch) dit probleem kan helpen oplossen. Nu lijkt het tenminste duidelijk dat hoge resolutie in het tijdsdomein het belangrijkste is voor geluidstransparantie.

Zoals u weet, moet u de volgende bewerkingen uitvoeren om een ​​analoog (continu) signaal om te zetten in een digitaal (discreet) signaal: bemonstering, kwantisering en codering (Afbeelding 1). Voor de implementatie in alle digitale apparaten (computers, recorders, spelers, enz.), Wordt een ADC analoog-naar-digitaal-omzetter (ADC) gebruikt, waarvan het blokschema wordt weergegeven in figuur 2. Volgens de stelling van Kotelnikov (Nyquist) of de “sampling theorem”, om een ​​analoog signaal met de hogere frequentie f? (Hz) in digitaal zonder verlies van informatie, is het noodzakelijk dat de bemonsteringsfrequentie, dat wil zeggen het aantal monsters (monsters per seconde), niet minder is dan 2 x f? (Hz). Het gebruikte digitale woord, het aantal binaire cijfers waarin het gelijk is aan het aantal geselecteerde M (bits), vertegenwoordigt de momentane waarde van het ingangssignaal,

Daarom vereist het bemonsteringstheorema dat de bemonsteringsfrequentie hoog genoeg wordt gekozen fd> 2fb, terwijl het signaal bijna constant moet blijven op het moment van bemonstering. De verplichting om een ​​laagdoorlaatfilter te gebruiken is niet gespecificeerd, die in alle ADC’s is geïnstalleerd, maar om het optreden van buitensporige frequenties in het spectrum in alle digitale apparaten te voorkomen, is er een anti-aliasingfilter dat het signaal in de frequentie fd / 2.

Het opnemen van signalen in elk systeem begint met een microfoon (figuur 3), een banddoorlaatfilter, dat al bepaalde fase- en voorbijgaande vervormingen heeft, wat leidt tot verspreiding en vervaging van het signaal in het domein van de weer. Gegevens over deze vervormingen worden zelden gegeven in microfooncatalogi, maar dankzij een groot aantal studies die de afgelopen jaren zijn uitgevoerd, is het mogelijk om een ​​significant verschil in deze parameters vast te stellen tussen dynamische microfoons en condensatormicrofoons. Voor condensatormicrofoons werden aanvalswaarden van enkele microseconden verkregen, terwijl het verval van transiënte processen enkele honderden microseconden bereikt. Het belang van de faselineariteit van de microfoons, niet alleen binnen,

Vervolgens wordt het analoge signaal, dat wordt omgezet naar digitaal, verwerkt door een laagdoorlaatfilter op de ADC-ingang (anti-aliasing filter). Dit filter veroorzaakt ook spreiding van de impulskarakteristieken van het ingangssignaal als gevolg van een ongelijkmatige frequentierespons en faserespons in de doorlaatband, de helling van de vervalcurves in de overgangsband en de fase non-lineariteit.

Dergelijke vervormingen leiden tot tijdspreiding van het ingangssignaal en betekenen dat elk momentane monster aan de uitgang informatie-elementen bevat van eerdere monsters (waarvan het aantal afhangt van de karakteristieken van het filter). Aangezien het muzikale signaal een snel veranderende stroom is met korte, scherpe pulsen, hebben dergelijke verstrooiing en vervaging een zeker effect op de gehoorwaarneming, vooral voor de ervaren en aandachtige luisteraar met een goed muzikaal oor.

Akoestische muzieksignalen hebben een niet-stationaire ultrasnelle dynamische en tijdelijke structuur, wat om verschillende redenen te wijten is, met name een snelle aanval op echte muziekinstrumenten, de aanwezigheid van een groot aantal ultrasone componenten in het spectrum van veel instrumenten, het uiterlijk van korte vertragingen in de nagalmtijd in een kamer, enz.

Het opnemen van een echt galmproces zonder gegevensverlies is ook buitengewoon moeilijk. Wanneer een geluidsbron een complex niet-stationair muzikaal signaal afgeeft, “pikt” elke microfoon, geïnstalleerd op verschillende punten in de kamer, de complexe echo op. Bovendien leiden extra inkomende signalen, gewijzigd in amplitude en fase als gevolg van reflecties van verschillende oppervlakken, tot een exponentiële toename van het totale energieniveau dat de microfoon binnenkomt. Als het signaal is uitgeschakeld, neemt het algehele niveau af, wat meestal wordt gekenmerkt door de nagalmtijd.