Math   Science   Chemistry   Economics   Biology   News   Search

> Mp3, an audio compression format Issue: 2003-2 Section: Math

English

 

Il formato di compressione audio MP3 ha rappresentato una vera e propria rivoluzione nella divulgazione della musica: se prima scambiare un file musicale tramite la rete necessitava tempi lunghissimi, ora, grazie a programmi di sharing (condivisione) come Napster, Winmx, Kazaa, bastano pochi minuti per avere a disposizione qualsiasi brano. D’altronde, un programma che riduceva un file audio da 40 MB a 4 MB non si era mai visto prima.

 

Perché Nasce l’MP3?

I file audio di un CD musicale, per poter essere utilizzati sul proprio computer necessitano di specifici programmi per estrapolarne le tracce audio (file in formato *.cda) che li convertano nel formato wave. I file wave però, a fronte della loro ottima qualità, possiedono anche una miriade di informazioni e conseguentemente una dimensione notevole (una sola canzone ha una grandezza media di 50-60 MB, corrispondente all'incirca alla capacità di 43 floppy!). Ne risulta pertanto estremamente difficoltoso il trasporto e l'archiviazione e quasi impossibile la diffusione via Internet. MP3 significa MPEG1 Layer3 ed è essenzialmente un formato di compressione di dati audio che permette di ridurre considerevolmente le dimensioni di un file, senza perdita di qualità. Questo avviene perché l'algoritmo di compressione elimina parte dei suoni "ridondanti", che non vengono percepiti dall'orecchio umano. Attualmente i siti che regalano o vendono brani e i lettori abbondano sulla rete, la scelta musicale è più che vasta e aggiornata e la qualità sonora veramente apprezzabile. Il rapporto dimensioni/qualità è, insomma, quello che ha generato l’enorme successo del formato MP3.

 

Come nasce?

La tecnologia che sta alla base del formato MP3 è un po’ più vecchia di quanto si possa comunemente immaginare. La ricerca scientifica iniziò ne lontano 1987 al Fraunhofer Institut Integrierte Schaltungen (Fraunhofer IIS-A) ad Erlangen, in Germania grazie al professor Dieter Seitzer dell'Università di Erlangen. Dopo quasi tre anni di studio nel 1989 il nuovo formato venne approvato in Germania e nel 1992 venne accettato dall’International Standards Organisation (ISO) e integrato nel "Motion Picture Experts Group's (MPEG) specification" uno standard per la compressione del formato video e audio. È stato proprio nel laboratorio del MPEG, in cui lavora Leonardo Chiariglione (uno degli italiani più conosciuti e più influenti nella rete), che si è dato vita prima all’Mpeg-1 (Mp3), seguito poi dal 2, dall’Mpeg-3, dal Mpeg-4 (video e audio a bassa velocità adatti ad internet). Il laboratorio è passato ora all’evoluzione dell’Mpeg-7, uno standard di descrizione senza compressione che in futuro permetterà di ricercare un’immagine riconoscendo al suo interno forme e colori (v. XLM). Da quel momento la diffusione dell'MP3 è stata velocissima, soprattutto con l'arrivo dell'AMP (Advanced Multimedia Products), il primo player di MP3, ad opera di Tomislav Uzelac che fu successivamente utilizzato come modello per il famosissimo WinAmp e MacAmp.

 

Come Funziona?

È evidente che il funzionamento del formato MP3 si basa sugli studi della nostra percezione sonora umana effettuati dalla Psicoacustica. L’orecchio umano è infatti incapace di percepire la maggior parte delle frequenze presenti in natura ed in particolare quelle che superano i 20 KHz di frequenza. La maggior parte di suoni “utili”, inoltre, si trova al di sotto dei 18 KHz. Per la conversione dei brani musicali da un cd audio al formato Mp3 si utilizzano programmi specifici detti encoders che permettono di impostare il bitrate cioè il numero di bit allocati per ogni secondo di musica. Il bitrate è direttamente proporzionale alla risoluzione sonora: maggiore sarà il numero di bit allocati per ogni secondo, migliore sarà la qualità; possiamo paragonarlo alle pellicole cinematografiche nelle quali un maggior numero di frames (o fotogrammi) migliora la fluidità e la qualità del film.

I suoni vengono divisi in sottobande a seconda della loro frequenza; dopodiché ogni sottobanda, detta anche frame, viene processato da determinati algoritmi, che confrontano il suono coi modelli della psicoacustica, tagliando o eliminando i suoni in relazione al loro grado di percettibilità per l’orecchio umano.

Un passaggio importante della compressione sono inoltre gli effetti intelligenti di mascheramento con i quali vengono eliminati i suoni deboli, che si trovano in sovrapposizione con quelli più forti.

Nelle tracce stereo a X kbps di bitrate ad ogni canale verranno allocati X/2 kbps.

Esempio: un file codificato a 192 Kbps divide il suono, 96 Kbps a destra e altrettanti sinistra.

Per comprimere una traccia audio possiamo scegliere, dal punto di vista del Bitrate, il metodo CBR o il metodo VBR. Il primo (Constant BitRate) manterrà lo stesso bitrate in tutta la traccia; è sconsigliabile, però, usarlo in suoni complessi, poiché i bit a disposizione potrebbero non essere sufficienti. Il secondo (Variable BitRate) codificherà i suoni più semplici con un bitrate minore, utilizzandone uno maggiore nei punti più complicati; in questo modo si risolve intelligentemente al problema del CBR ottenendo, quindi, suoni più definiti.

 

In basso uno schema in cui si evidenziano le frequenze percepibili all’orecchio umano.

 

Per diffidenti e scettici

Gli impianti CD Stereo sono soliti eliminare le frequenze superiori ai 20 KHz (lowpass), spesso costituite da fruscii e suoni inutili, al fine di evitare distorsioni negli amplificatori. Da aggiungere che la musica digitale (in questo caso i CD Audio) contiene una gamma di frequenze da 0 a 22 KHz (N.d.R.: fino a 44,1 KHz, secondo alcune fonti), mentre nei suoni della vita reale e nei Super CD Audio sono presenti anche frequenze più alte. Quindi, non c’è alcuna differenza acustica, percettibile al nostro orecchio, tra Cd Audio ed Mp3.