Leggiti i link che ti ho messo sopra per dare una base tecnica alla discussione e per cortesia non fare come tanti personaggi che a corto di argomenti iniziano subito attaccando l'impianto o l'udito dell'interlocutore, è una cosa che mi fa perdere rispetto nelle persone mooooolto velocemente. ;)
quotone su questo :sisi:
Tempo di mettere in mostra le mie poche e ben confuse nozioni di teoria dei segnali. :asd: (poi sono sicuro che mi correggerai gli strafalcioni)
Se un file presunto lossless, quindi dai 16/44.1 in su, ha un evidente roll off a 19kHz per me è l'upsampling di un MP3 o altro formato lossy, oppure una scelta scellerata di mastering che non ha motivazioni tecniche dietro. Per il teorema di Nyquist-Shannon sappiamo che una frequenza di campionamento X sarà sufficiente per campionare perfettamente un segnale analogico di banda limitata la cui frequenza massima è pari a X/2, per tanto con i 44.1kHz è possibile campionare perfettamente fino ai 22.05kHz, ovvero oltre la banda dell'udibile. Frequenze di campionamento maggiori non apportano nulla se non rumore a causa della distorsione di intermodulazione nel caso che le componenti ultrasoniche non venissero filtrate adeguatamente.
Visualizza allegato 273105
Un eccezione è l'oversampling che eseguono la quasi totalità dei DAC moderni per limitare l'aliasing, ma questa è un'altra storia in quanto non aggiunge nulla al segnale originale.
Ti amo quando tiri fuori questi argomenti perché fai uscire il nerd che c'é in me :love::love:
il ragionamento che dici ha senso, ma non tiene in conto di una cosa... ovvero che il teorema di Nyquist ha un maggiore o uguale, e non un uguale... Se ammettiamo di avere un uguale, le repliche dello spettro del segnale non sarebbero distanziate tra loro, per permettere una riproduzione senza aliasing ci vorrebbe un low pass filter con attenuazione dopo la frequenza di taglio tendente a infinito, e sarebbe irrealizzabile. Nella realtá si lascia una certa fascia di frequenze detta banda di guardia per permettere al filtro di operare, e raggiungere la frequenza di campionamento con ormai una attenuazione di almeno -96dB. Spesso tale banda la si preferisce avere abbastanza ampia, in particolar modo se le frequenze salgono (fare un filtro che taglia in una banda di guardia di 1kHz é sicuramente piú facile per frequenze basse, mentre se parliamo giá di 25kHz, un filtro che tagli in una banda di 1kHz é giá piú difficile da realizzare). A complicare le cose inoltre ci sono altri fattori quali la linearitá del filtro: anche ammettendo di avere un Butterworth, che ha una alta linearitá, un filtro ad elevata pendenza o costa molto in termini di realizzazione, oppure necessariamente in zone prossime alla frequenza di taglio non é lineare, quindi si preferisce avere una banda audio ancora piú restrittiva. Unendo tutti i fattori, un file campionato a 44.1kHz non conterrá mai componenti a 22.05kHz, ma si fermerá ragionevolmente a 21kHz, in alcuni casi alcuni ingegneri del suono a quanto pare hanno deciso di tagliare molto prima a causa probabilmente di attrezzature indegne.
Una completezza, che magari cosí non sembra chiaro... da dove escono l'aliasing e le repliche del segnale? Credo che tutti sanno che campionare un segnale analogico significa prendere un valore ogni tot tempo dettato dalla frequenza di campionamento... Matematicamente come funziona? Si moltiplica il segnale analogico per le delta di Dirac, delle funzioni che sono astrazioni matematiche, chiamate anche impulsi.
Quello che ne esce fuori sará il prodotto del segnale per un treno di delta, che puó essere scritto matematicamente come il segnale x(t) moltiplicato per tante delta. "tante delta" in matematica lo si scrive come la sommatoria per n che va da - infinito a + infinito delle delta di t-nTc, ovvero:
Trasformiamo ora questo segnale con la trasformata di Fourier per ricavarne lo spettro e ragionare d'ora in avanti con lo spettro (visto che parliamo di un range di frequenze da campionare, é giusto parlare di spettri di segnale). La trasformata di una funzione per un treno di delta é la convoluzione di tale segnale con il treno di delta. (l'asterisco é il simbolo della convoluzione)
La convoluzione delle delta con il segnale implica la scomparsa dell’impulso e la traslazione dell’origine della funzione nella posizione in cui è centrato l’ impulso, avendo peró un treno di delta, avremo anche tante repliche quante sono le delta, ciascuna centrata a multipli della frequenza di campionamento. Ecco da dove esce matematicamente fuori Nyquist, se abbiamo tante repliche ciascuna centrata ad esempio a nx44.1kHz, non possiamo campionare frequenze piú alte perché altrimenti sovrapporremmo tali frequenze agli spettri delle repliche, ed ecco da dove nasce l'aliasing. L'oversampling permette tramite una moltiplicazione di aumentare la distanza tra le repliche, permettendo di usare quindi filtri di taglio piú dolci e lineari.
La distanza W é appunto la banda di guardia di cui parlavo prima.
Appurato che i 44.1kHz non sono un limite, passiamo ai bit. Con 16bit si ottiene un range dinamico di 96dB e questo lo sappiamo tutti, quello che effettivamente ignoravo è che aumentando il bit depth non aumenta la "precisione" con cui si campiona un segnale come viene comunemente detto ma solo il range dinamico. In teoria i 16bit potrebbero comportarsi a tutti gli effetti come una coperta corta, ovvero nel momento in cui si vuole aumentare il volume di riproduzione ma non si vuole perdere le informazioni a basso volume si finisce inevitabilmente per tagliare e comprimere il segnale (chi ha detto loudness war?).
aumenta anche la precisione per la veritá. Quando campioni un segnale c'é un "decisore" che poi alla fine altro non é che l'A/D, che ragiona in modulazione di densitá di impulsi nella maggior parte dei casi (delta-sigma: sigma é la distanza tra gli impulsi e delta sono la funzione matematica "delta di Dirac" o impulso per la quale si moltiplica il segnale da acquisire). Siccome il segnale analogico ha infiniti valori il decisore, chiamiamolo cosí, deve decidere in quanti valori suddividere il segnale, nel caso dei 16 bit saranno 65536 valori possibili, nel caso del 24 bit saranno 16'777'216. Metto un disegno tratto dalle dispense di segnali:
dove Xq é la funzione discreta quantizzata, X(kTc) é la funzione originaria campionata a frequenza fc=1/Tc e epsilon é l'errore relativo. Ovviamente piú livelli abbiamo e meno l'errore sará evidente, il problema é: un conto é una trasmissione di dati tra macchine, ma secondo voi, le orecchie umane riescono a distinguere correttamente oltre 65536 valori possibili? Fino ad oltre un milione? Qui non si parla di sfumature, qui si parla di errori matematicamente infinitesimi, qui si parla di pazzia se qualcuno mi dice il contrario.
Se invece il master è eseguito con criterio i 16bit sono più che sufficienti per contenere tutte le informazioni audio, ma non solo, con l'uso intelligente del dithering e del noise shaping è possibile incrementare il range dinamico al punto da coprire l'intera sensibilità dell'orecchio umano.
Da notare che dai test della Boston Audio Society si è appurato che il più alto noise floor del CD (16/44.1) è facilmente riconoscibile rispetto a quello dell'SACD e del DVD-A, ma tralasciando l'assenza di noise shaping nei test della BAS, il vero problema è che per rendersene conto serve riprodurre la sorgente a volumi d'ascolto folli, ovvero passando da una pressione sonora di riferimento di 85-92dB a una di 99-106dB, tanto è vero...
Visualizza allegato 273110
Per concludere in bellezza:
Visualizza allegato 273111
Alla luce di ciò chi sostiene di poter distinguere senza problemi un 16/44.1 da un 24/96 o superiore ignora gli effetti basilari della psicoacustica (io sento perché vedo) o più probabilmente esegue i test in modo errato. ;)
Aggiungo solo una nota di spunto che dovrebbe far riflettere gli afficionados del numerino grosso, perdendo di vista le cose importanti:
Visualizza allegato 273117
PS: Se vedi l'Arcam l'avevo messo, mentre l'Emotiva lo conoscevo già frequentando anche forum a stelle a strisce ma non l'ho aggiunto alla lista perché l'ho trovato in vendita solo dagli USA.
e qui, tutti d'accordo, l'ho sempre detto anche io, psicoacustica.