CD Πρότυπα

Το 1980 η Philips και η Sony δημοσίευσαν από κοινού το «Κόκκινο Βιβλίο» για την καθιέρωση του CD-Audio ως παγκόσμιο standard. Αυτό ήταν το πρώτο από την σειρά των standards των σχετικών με την τεχνολογία των compact disks και ακολούθησαν κι άλλα βιβλία που διακρίνονται από τα χρώματα που αναφέρονται στους τίτλους τους.

Το Κόκκινο Βιβλίο καθόρισε τις βασικές αρχές κατά τις οποίες αναπτύχθηκε το CD. Φυσικές διαστάσεις του δίσκου, εγγραφή των δεδομένων σε ένα μοναδικό ρεύμα από το εσωτερικό προς τα έξω, παρουσίαση των δεδομένων στην κεφαλή ανάγνωσης με μια σταθερή γραμμική ταχύτητα σε σχέση με μια μεταβλητή ταχύτητα περιστροφής κλπ. Προκειμένου τα δεδομένα στο δίσκο να μπορούν να χειριστούν αποτελεσματικά αποφασίστηκε να διαιρεθούν. Το βασικότερο μέρος της πληροφορίας χαρακτηρίστηκε ως frame. Κάθε frame αποτελείται από 588bits (διακριτά δυαδικά ψηφία) από τα οποία τα 192 μπορεί να χρησιμοποιηθούν για μουσική, τα 388 για διαμόρφωση και διόρθωση λάθους και το 1 για έλεγχο.

Μέσα σε ένα frame, αυτά τα 192bits που χρησιμοποιούνται για τη μουσική ομαδοποιούνται σε 24Bytes. Ενα σετ από 98 frames αποτελεί ένα sector. Οι sectors,που ο καθένας περιέχει συνολικά 2352Bytes, ομαδοποιούνται σε tracks (το κόκκινο βιβλίο καθορίζει σα μέγιστο τα 99 tracks).

Σε κάθε CD η επιφάνεια που καλύπτουν τα tracks αναφέρεται ως περιοχή προγράμματος. Σε αυτή την περιοχή η εισαγωγή γίνεται με το lead-in και η έξοδος με το lead-out. Οι πληροφορίες σχετικά με την θέση και το περιεχόμενο του κάθε track αποθηκεύεται στον πίνακα περιεχομένων (TOC), ο οποίος βρίσκεται στο τέλος του lead-in.

Με το κίτρινο βιβλίο, το οποίο εκδόθηκε το 1984, η Philips και η Sony αναγνώρισαν το ρόλο του CD όχι μόνο ως φορέα ανώτερης ποιότητας ήχου, αλλά και ως ένα βολικό μέσο μεταφοράς και αποθήκευσης μεγάλου μεγέθους αναγνώσιμων δεδομένων υπολογιστή.

Το νέο CD-ROM (Compact Disk - Read Only Memory) απαιτούσε κάποιες ανακατατάξεις και αναπροσαρμογές σε σχέση με το πρώτο standard. Τα frames αποτελούσαν μικρή μονάδα για τα δεδομένα και τα tracks (περιορισμένα σε ένα μέγιστο των 99) πολύ μεγάλα για να είναι πρακτικά. Ετσι επιλέχτηκε το sector σα βασική μονάδα διεύθυνσης. Επιπλέον, προκειμένου να υπάρχει αξιόπιστη λειτουργία απαιτούνταν η βελτίωση στους ρυθμούς λαθών bit. Για αυτό το λόγο,το κίτρινο βιβλίο πρόσθεσε στον κάθε sector ένα επιπλέον επίπεδο διόρθωσης με τη μορφή κώδικα ανίχνευσης λαθών και διόρθωσης (EDC/ECC).

Ενα συγκεκριμένο sector ενός CD-ROM περιέχει 12Bytes για συγχρονισμό, 4Bytes για επικεφαλίδα (3 για διεύθυνση, 1 για δείκτη κατάστασης), 2048Bytes για δεδομένα χρήστη και 288Bytes για EDC/ECC. Ενα sector με αυτά τα χαρακτηριστικά λέμε ότι είναι φορμαρισμένο σε mode 1. Είναι όμως δυνατόν να έχουμε το δείκτη της κατάστασης και σε mode 2. Οι sectors της mode 2 θυσιάζουν το επιπλέον επίπεδο για EDC/EEC, όπου αυτό δε χρειάζεται (π.χ. εκεί όπου αποθηκεύονται ηχητικές και οπτικές πληροφορίες), και με τον τρόπο αυτό δίνουν 288Bytes επιπρόσθετα για δεδομένα χρήστη σε κάθε sector.

Τα CD που περιέχουν πληροφορίες και σε mode 1 και σε mode 2 είναι γνωστά και σαν mixed mode και τυπικά προσφέρουν δεδομένα ROM και ήχο προδιαγραφών κόκκινου βιβλίου που μπορεί να ληφθεί άμεσα από κάποια έξοδο ήχου που έχουν τα περισσότερα CD-ROM drives χωρίς την ανάγκη παρουσίας κάρτας ήχου στον υπολογιστή. Τέτοιοι δίσκοι αποθηκεύουν τα δεδομένα και τα περιεχόμενα ήχου σε διακριτές περιοχές (διαφορετικά tracks). Ενας συμβατικός δίσκος CD-ROM σε mode 1 μπορεί τυπικά να περιέχει μέχρι 340000 sectors και συνεπώς προσφέρει χωρητικότητα δεδομένων χρήστη της τάξης των 680ΜΒ. Το κίτρινο βιβλίο καθιέρωσε το μεγαλύτερο μέρος σε σχέση με τη δομή του δίσκου που απαιτούταν ώστε να γίνει ένα διεθνώς επιτυχημένο standard. Ωστόσο, το 1985 προστέθηκε ένα τελευταίο συστατικό. Αυτό έγινε με τη συμφωνία High Sierra (γνωστό αργότερα σαν standard ISO 9660) όπου συμμετείχαν η PhilipsSony και η Microsoft. Αποσκοπούσε στην καθιέρωση ενός κοινού format ή δομής για την παρουσίαση αρχείων δεδομένων χρήστη σε ένα δίσκο CD-ROM. Η προοπτική ήταν να επιβεβαιωθεί ότι κάθε χρήστης χρησιμοποιώντας οποιοδήποτε CD-ROM drive θα μπορούσε,έχοντας εγκαταστήσει ένα οδηγό λογισμικού που ακολουθεί το ISO 9960, να έχει πρόσβαση σε οποιοδήποτε συμβατό δίσκο. Υπό αυτές τις συνθήκες ένας δίσκος θα μπορούσε πάντα να αναγνωριστεί ακόμα και αν τα προγράμματά του δεν μπορούν να εκτελεσθούν λόγω έλλειψης ικανού λογισμικού, μειωμένων προδιαγραφών hardware ή ασυμβατότητας πλατφόρμας (λειτουργικού συστήματος).

Η εισαγωγή του Πράσινου Βιβλίου είχε αφορμή το ότι αρχικά το CD-ROM αντιμετωπιζόταν κυρίως σα μέσο μεταφοράς πληροφοριών κειμένου. Το τελευταίο ήταν συνέπεια του ότι το Κίτρινο Βιβλίο δεν είχε προνοήσει συγκεκριμένα για το χειρισμό εικόνων και ήχου (με εξαίρεση τον ήχο κατά το Κόκκινο Βιβλίο). Σαν αποτέλεσμα, όπου οι εφαρμογές απαιτούσαν τέτοια λειτουργικότητα, οι σχεδιαστές έπρεπε να σχεδιάζουν μηχανικούς αντάπτορες ειδικών γραφικών και τυπικά να συμβιβάζονται με τις απαιτήσεις στη χωρητικότητα αποθήκευσης ήχου του Κόκκινου Βιβλίου και στους περιορισμούς των αργών ρυθμών μεταφοράς των CD-ROM. Το Πράσινο Βιβλίο ήρθε να λύσει τα προβλήματα αυτά με την παρουσίαση του CD-i.

Το Πορτοκαλί Βιβλίο. Ο λόγος που οδήγησε στην ιδέα του Photo-CD ήταν η αποθήκευση ακίνητων φωτογραφικών εικόνων σε διάφορα επίπεδα ανάλυσης στο δίσκο. Κάθε εικόνα αποθηκεύεται σε συμπιεσμένη μορφή (Kodak Image PAC) και υπακούει στο format Form 1, Mode 2 του Πράσινου βιβλίου.

Η πρόσβαση στις εικόνες είναι δυνατή από ένα μεγάλο αριθμό πλατφόρμων συμπεριλαμβανομένων των Photo-CD players, των CD-i players και των υπολογιστών που είναι εφοδιασμένοι με CD-ROM XA drives (στα δύο τελευταία απαιτείται και το κατάλληλο λογισμικό ανάγνωσης).

Μια καθοριστική διαφορά ανάμεσα στο Photo-CD και τα προηγούμενα CD formats είναι ότι ο δίσκος είναι εγγράψιμος, αν και μια μόνο φορά. Αναδρομικά είναι δυνατή η προσθήκη νέων εικόνων στον ίδιο δίσκο. Αυτή η νέα λειτουργία θέτει κάποια συγκεκριμένα προβλήματα, ειδικά σε σχέση με τον πίνακα περιεχομένων του δίσκου (TOC).

Δεδομένης της φύσης του Photo-CD (εγγράψιμο μια φορά),είναι φανερή η δυσκολία που παρουσιάζεται καθώς ο πίνακας περιεχομένων δημιουργείται με την αρχική εισαγωγή εικόνων στο δίσκο. Αν στη συνέχεια προσπαθούσαμε να εισάγουμε νέες εικόνες στο υπόλοιπο άδειο μέρος του δίσκου, τότε η δομή και η θέση του πίνακα περιεχομένων δε θα το επέτρεπε,αφού δε θα μπορούσε να αλλάξει. Ομως, η δυσκολία αυτή ξεπερνιέται με το Πορτοκαλί Βιβλίο.

 

 

 

CD-DA (Compact Disk – Digital Audio)

ΔΕΙΓΜΑΤΟΛΗΨΙΑ

 

Η δειγματοληψία είναι η απαραίτητη διαδικασία για την μετατροπή ενός αναλογικού ηχητικού σήματος σε ψηφιακό. Το θεώρημα Nyquist καθορίζει το πόσο γρήγορα πρέπει να λαμβάνονται τα δείγματα ώστε να είναι ακριβής η αναπαράσταση του αναλογικού σήματος. Το θεώρημα αυτό είναι αρκετά απλό και εκφράζει ότι η συχνότητα δειγματοληψίας πρέπει να είναι μεγαλύτερη ή ίση του διπλάσιου της μέγιστης συχνότητας του αρχικού αναλογικού σήματος:

               

fs>=2f  ή  Ts<=T/2

 

Για να ισχύει το παραπάνω πρέπει το αρχικό σήμα να είναι ζωνοπερατωθεί στο μισό της συχνότητας δειγματοληψίας περνώντας από ένα ιδανικό βαθυπερατό φίλτρο. Επίσης, το σήμα εξόδου πρέπει να περάσει πάλι από ένα ιδανικό βαθυπερατό φίλτρο για να αναπαράγει το αναλογικό σήμα. Αυτοί οι περιορισμοί είναι βασικοί για τη δειγματοληψία γιατί αλλιώς παρατηρείται σε ένα φαινόμενο γνωστό ως aliasing. Πρόκειται για μια λανθασμένη απόκριση του συστήματος η οποία γίνεται φανερή στο ηχητικό σήμα με τη μορφή παραμόρφωσης. Στην οριακή περίπτωση όπου η συχνότητα δειγματοληψίας είναι ίση ακριβώς με το διπλάσιο της μέγιστης συχνότητας του σήματος, θα παραχθούν μόνο δύο δείγματα του σήματος που είναι και η ελάχιστη απαίτηση αναπαράστασης της αρχικής κυματομορφής. Για σήματα μεγαλύτερα του fs/2 η διαδικασία της δειγματοληψίας μπορεί να θεωρηθεί ως διαμόρφωση του σήματος εισόδου.

 

ΚΒΑΝΤΟΠΟΙΗΣΗ

 

Προκειμένου να αναπαραστήσουμε κάθε δείγμα με τη μορφή μιας δυαδικής σειράς από bits πρέπει στο συνεχώς μεταβαλλόμενο πλάτος της τάσης του αναλογικού σήματος να αναθέσουμε μια διακριτή τιμή. Η διαδικασία αυτή ονομάζεται κβαντοποίηση. Είναι σημαντικό να τονίσουμε ότι η δειγματοληψία και η κβαντοποίηση είναι συμπληρωματικές διαδικασίες. Ο συνδυασμός των δύο αυτών διαδικασιών καλείται ψηφιοποίηση. Η κβαντοποίηση παίζει καθοριστικό ρόλο στο σχεδιασμό του συστήματος ψηφιακού ήχου. Ανάλογα με τις στάθμες κβαντοποίησης προσδιορίζεται το format του ψηφιακού ήχου. Περισσότερα bits ψηφιακού ήχου επιτρέπουν πιο ακριβή κβαντοποίηση. Ωστόσο, πάντοτε στην κβαντοποίηση επεισέρχεται κάποιο σφάλμα το οποίο ελαχιστοποιείται όσο πυκνώνουν οι στάθμες κβαντοποίησης. Το σφάλμα αυτό εκφράζεται από το λόγο σήματος προς σφάλμα (signal-to-error ratio)

S/E(dB)=6.02n+176

 

όπου το n στον παραπάνω τύπο αντιπροσωπεύει τον αριθμό των bits της λέξης στο format του ψηφιακού ήχου. Για παράδειγμα, σε ένα 16bit σύστημα η θεωρητική τιμή του λόγου αυτού είναι 98dB. Η παρουσία αυτού του σφάλματος γίνεται εντονότερη όταν έχουμε σχετικά ασθενή σήματα εισόδου. Σε πολλά συστήματα το πρόβλημα αυτό αντιμετωπίζεται με τη μέθοδο του dither. Mε τη μέθοδο αυτή αντιμετωπίζεται και η ενδεχόμενη απώλεια πληροφορίας εξαιτίας πολύ χαμηλών σταθμών σήματος. Το dither συνίσταται στην πρόσθεση αναλογικού θορύβου χαμηλής στάθμης στο αρχικό σήμα.

Οι προδιαγραφές του compact disc audio αναπτύχθηκαν από κοινού από τις εταιρίες Sony, Philips και Polygram και έχουν καταχωρηθεί στο «κόκκινο βιβλίο». Οι προδιαγραφές αυτές φαίνονται συνοπτικά παρακάτω.

ΔΙΣΚΟΣ

 

Χρόνος αναπαραγωγής

74 min 33 sec (μέγιστος χρόνος)

Φορά περιστροφής

αντίθετη της φοράς των δεικτών του ρολογιού

Ταχύτητα περιστροφής

1.2-1.4 m/sec (σταθερή γραμμική ταχύτητα)

Απόσταση ανίχνευσης

1.6μm

Διάμετρος

120mm

Πάχος

1.2mm

Διάμετρος τρύπας κέντρου

15mm

Περιοχή εγγραφής

46mm-117mm

Περιοχή σήματος

50mm-116mm

Υλικό

κάθε αποδεκτό μέσο με δείκτη διάθλασης 1.55

Ελάχιστο μήκος κοιλότητας

0.833μm (1.2m/sec) - 0.972μm (1.4m/sec)

Μέγιστο μήκος κοιλότητας

3.05μm (1.2m.sec) -3.56μm (1.4m/sec)

Βάθος κοιλότητας

~ 0.11μm

Πλάτος κοιλότητας

~ 0.5μm

ΟΠΤΙΚΟ ΣΥΣΤΗΜΑ

 

Βασικό μήκος κύματος

780nm (7800 Ε)

Εστιακό βάθος

m

FORMAT ΣΗΜΑΤΟΣ

 

Αριθμός καναλιών

2 κανάλια (4 δυνατά κανάλια εγγραφής)

Κβαντοποίηση

16bit γραμμική

Συγχρονισμός κβαντοποίησης

ταυτόχρονη για όλα τα κανάλια

Συχνότητα δειγματοληψίας

44.1kHz

Ρυθμός μετάδοσης καναλιού

4.3218 Mb/sec

Ρυθμός μετάδοσης δεδομένων

2.0338 Mb/sec

Λόγος δεδομένων ανά κανάλι

8:17

Κώδικας διόρθωσης λαθών

Cross Interleave Reed-Solomon Code

(με 25% πλεονασμό)

Σύστημα διαμόρφωσης

8-σε-14 διαμόρφωση (EFM)

Μια συσκευή αναπαραγωγής CD audio (compact disk player) αποτελείται από δύο βασικά μέρη, τον επεξεργαστή δεδομένων ήχου και το σύστημα ελέγχου. Το πρώτο ασχολείται με τις διαδικασίες αναπαραγωγής και το δεύτερο με το περιβάλλον του χρήστη, την εστίαση των φακών,το μοτέρ του άξονα, την αυτόματη ανίχνευση.

Από την εμφάνιση των CD players το 1982 παρουσιάστηκαν στην αγορά τρεις γενιές. Χαρακτηριστικό της πρώτης γενιάς ήταν οι ψηφιακοί-σε-αναλογικοί μετατροπείς (DAC) πολλών bits με φίλτρα ανασύνθεσης. Της δεύτερης γενιάς χρησιμοποιούσαν τους ίδιους DAC αλλά και με ψηφιακά φίλτρα υπερδειγματοληψίας. Τέλος, τα σημερινά CD players διαφοροποιούνται κυρίως στο ότι περιέχουν DAC λίγων bits.

Οι DAC των CD players όταν πρωτοπαρουσιάστηκαν ήταν 14bit το οποίο θεωρούταν σημαντική βελτίωση σε σχέση με τις αναλογικές συσκευές. Ωστόσο, εξακολουθούσαν να είναι μέτριας ποιότητας συγκρινόμενοι με τους μετέπειτα 16bit, 18bit και τους σημερινούς 20bit μετατροπείς.

O αριθμός των bits σε ένα DAC μετατροπέα δεν αντικατοπτρίζει απόλυτα την απόδοση και ακρίβειά του. Καλύτερο κριτήριο είναι η ακρίβεια των bits καθαυτών. Θεωρητικά ένας 16bit μετατρέπει ακριβώς και τα 16 ψηφία της λέξης του δείγματος με γραμμικό τρόπο. Πρακτικά όμως, δεν είναι επαρκής για ακριβή μετατροπή. Το σφάλμα σε έναν μετατροπέα πολλών bits γενικά εξαρτάται από την ακρίβεια του πιο σημαντικού ψηφίου (MSB) της λέξης του δείγματος. Μια τέτοια ανακρίβεια θα μπορούσε να αποφέρει λάθος ίσο με το μισό του πλάτους του σήματος. Για να αποφευχθεί κάτι τέτοιο πρέπει να είναι πυκνά τα επίπεδα κβαντοποίησης.

Εχουν χρησιμοποιηθεί δύο μέθοδοι ανασύνθεσης εξόδου με τους DAC πολλών ψηφίων. Η πρώτη κάνει χρήση του φίλτρου «brickwall».Αυτά τα φίλτρα έχουν χαρακτηριστική απότομης αποκοπής και κρατούν το κέρδος του σήματος κοντά στη μονάδα. Αυτό θεωρήθηκε αναγκαίο καθώς αμέσως πάνω από την ηχητική ζώνη παρουσιάζονταν θόρυβος και aliasing. To επακόλουθο πρόβλημα του φίλτρου αυτού ήταν η παρουσία μεγάλης μη-γραμμικότητας και καθυστέρησης ομάδων υψηλών συχνοτήτων.

Η δεύτερη μέθοδος βασίζεται σε ένα ψηφιακό φίλτρο «υπερδειγματοληψίας» τοποθετημένο πριν τον DAC και σε ένα ομαλό αναλογικό φίλτρο. Λέγοντας ομαλό εννοούμε φίλτρο με αποκοπή κλίσης 12dB/οκτάβα και σημείο -3dB στα 30-40kHz. Στην περίπτωση αυτή έχουμε απόλυτη γραμμικότητα στη φάση.

Για την αντιμετώπιση των προβλημάτων που παρουσιάζονταν στους μετατροπείς πολλών ψηφίων αναπτύχθηκαν δύο ανταγωνιστικές τεχνολογίες, μια από τη Matsushita και μια από τη Philips. Και στις δύο τεχνολογίες γίνεται μετατροπή πολύ μικρότερου μήκους λέξεων με υψηλότερο ρυθμό αντί της μετατροπής ολόκληρης της λέξης παράλληλα κατά τη συχνότητα δειγματοληψίας.

Η μέθοδος της Matsushita στηρίζεται σε διαμόρφωση πλάτους παλμού (pulse-width modulation, PWM). Σε αυτή τη σχεδίαση το πλάτος του παλμού του σήματος αναπαριστά  τη μοναδική λέξη,οπότε είναι σημαντικό τα βήματα της διαμόρφωσης PWM να έχουν το ακριβές πλάτος και το ελάχιστο χρονικό τρεμοπαίξιμο,έτσι ώστε να αυξάνει η ακρίβεια και η γραμμικότητα της εξόδου. Ο εμπορικός όρος για αυτή τη διαδικασία λέγεται MASH (Multi-stAge noise SHaping). Ενας MASH μετατροπέας κατασκευάζεται από τετραπλά υπερδειγματοληπτικά ψηφιακά φίλτρα παράλληλα με πρώτης και δεύτερης τάξης μορφοποιητές θορύβου. Η έξοδος από αυτούς οδηγείται σε έναν PWM μετατροπέα, του οποίου η έξοδος φιλτράρεται από ένα βαθυπερατό φίλτρο.

Η μέθοδος της Philips είναι γνωστή σαν διαμόρφωση πυκνότητας παλμού (pulse-density modulation PDM). Σε αυτήν την τεχνική ο λόγος πυκνότητας του παλμού σχετίζεται με την πρότυπη 16bit λέξη. Ο μετατροπέας PDM είναι τεχνολογία ενός bit. Τα δεδομένα του δείγματος από τον αποκωδικοποιητή οδηγούνται πρώτα σε ένα βαθυπερατό, τετραπλής υπερδειγματοληψίας και απλής παρεμβολής φίλτρο. Αυτός ο τύπος φίλτρου δίνει υψηλότερη ποιότητα γιατί είναι γραμμικής φάσης. Η μορφοποίηση πρώτης τάξης θορύβου γίνεται από το συσσωρευτή του πολλαπλασιαστή που περιέχεται στο φίλτρο. Το δεύτερο στάδιο φιλτραρίσματος αποτελείται από ένα 32-τάξης υπερδειγματοληπτικό γραμμικό παρεμβολέα και από ένα κύκλωμα διπλής υπερδειγματοληψίας δείγματος και κράτησης. Σε αυτό το στάδιο με την προσθήκη ενός κατάλληλου dither ψηφιακού σήματος στο δειγματοληπτούμενο σήμα μειώνονται οι μη-γραμμικότητες που προκαλούνται από το θόρυβο κβαντοποίησης. Σε αυτό το σημείο η συνολική υπερδειγματοληψία είναι 256-τάξης και η λέξη έχει αυξηθεί στα 17 bits.Στη συνέχεια, τα δεδομένα οδηγούνται σε ένα μορφοποιητή θορύβου δεύτερης τάξης, σε συχνότητα 11.2896MHz. Αυτός μειώνει τα 17bit δεδομένα σε ρεύμα του ενός bit χρησιμοποιώντας διαμόρφωση Sigma-Delta. Κατά τη διαδικασία αυτή, ο θόρυβος κβαντοποίησης αναδιανέμεται μακριά από την ηχητική συχνότητα. Το ρεύμα των bit τότε μετατρέπεται σε αναλογική μορφή από ένα δίκτυο διακοπτόμενων πυκνωτών.

Μέχρι τώρα δεν συσχετίσαμε την υπερδειγματοληψία με κάποιο θεώρημα, αλλά η χρήση της επιφέρει μεγάλα κέρδη απόδοσης ανεξάρτητα από τον τύπο του μετατροπέα που χρησιμοποιείται. Πολύ απλά υπερδειγματοληψία σημαίνει τη χρήση συχνότητας δειγματοληψίας μεγαλύτερης από αυτή που καθορίζεται από το θεώρημα του Nyquist. Ξεπερνώντας τη συχνότητα Nyquist πολλές από τις απαιτήσεις ακρίβειας που σχετίζονται με το θεώρημα μπορούν να παραβλεφτούν (όπως το «brickwall» φίλτρο). Εκτός των πλεονεκτημάτων που βλέπουμε στην έξοδο του φίλτρου, ο λόγος σήματος προς θόρυβο μεγαλώνει πολύ και ο θόρυβος κβαντοποίησης στην ηχητική ζώνη ελαχιστοποιείται. Το τελευταίο πραγματοποιείται όταν η υπερδειγματοληψία χρησιμοποιείται σε συνδυασμό με μορφοποιητές θορύβου.

Η διαδικασία της υπερδειγματοληψίας γίνεται σε ένα επεξεργαστή ψηφιακού σήματος (DSP) ο οποίος παίρνει δείγματα ήχου,τα επεξεργάζεται και δίνει στην έξοδό του πάλι δείγματα. Καθώς τα δείγματα τροποποιούνται, ο DSP είναι στην πράξη ένα ψηφιακό φίλτρο. Ο DSP χρήσιμος γιατί οι λειτουργίες που επιτελεί είναι ακριβείς και επαναλαμβανόμενες (πράγμα αδύνατο με αναλογικές τεχνικές) και έχει ως αποτέλεσμα χαμηλότερο θόρυβο και παραμόρφωση. Η υπερδειγματοληψία μπορεί να θεωρηθεί ως παρεμβολή μηδενικών μεταξύ κάθε δείγματος. Πρακτικά, αυτά τα καινούργια δείγματα παράγονται με τη χρήση ενός καταχωρητή ολίσθησης (που παίζει το ρόλο γραμμής καθυστέρησης), πολλαπλασιαστές και ενός αθροιστή. Το τελικό αποτέλεσμα αυτής της διαδικασίας είναι ότι νέα δείγματα δημιουργούνται για κάθε ενδιάμεσο μηδενικό. Σαν αποτέλεσμα, η συχνότητα δειγματοληψίας έχει αυξηθεί από το ποσό της υπερδειγματοληψίας που προκύπτει και το μήκος της λέξης έχει μεγαλώσει. Λόγω της αύξησης της συχνότητας δειγματοληψίας,ο θόρυβος στην ηχητική ζώνη εκτοπίζεται κατά πολύ περισσότερο από ότι προηγουμένως. Τότε η μορφοποίηση του θορύβου έρχεται να μειώσει το μέγεθος της λέξης και περαιτέρω να πολλαπλασιάσει το ποσό του θορύβου που τίθεται εκτός της ηχητικής ζώνης.

Οπως είδαμε και προηγουμένως, ο πρωταρχικός σκοπός ενός μορφοποιητή θορύβου είναι να μεταβάλλει το φάσμα συχνοτήτων λαθεμένων σημάτων έτσι ώστε να μετακινήσει τα περισσότερα από τα λάθη κβαντοποίησης έξω από το πεδίο των ηχητικών συχνοτήτων. Η μορφοποίηση θορύβου μειώνει το θόρυβο κβαντοποίησης χρησιμοποιώντας μια τεχνική αρνητικής ανάδρασης. Σαν αποτέλεσμα, ο μορφοποιητής αναλαμβάνει να μειώσει το λάθος κβαντοποίησης αποσπώντας το από το σήμα. Η ισχύς ενός μετατροπέα λίγων bits στηρίζεται σε αυτή ακριβώς την ισχύ της μορφοποίησης θορύβου. Γενικά, όσο πιο περίπλοκος είναι ο μορφοποιητής θορύβου,τόσο λιγότερος είναι και ο θόρυβος στην ηχητική ζώνη. Συνεπώς, η απόδοση ενός μορφοποιητή θορύβου καθορίζεται από την τάξη και τη συχνότητα λειτουργίας του. Η τελευταία παράμετρος είναι συνάρτηση του βαθμού πραγματοποίησης της υπερδειγματοληψίας πριν την μορφοποίηση. Η πρώτη σχέση που μας δίνουν αυτές οι παράμετροι είναι ότι όσο πιο υψηλή είναι η τάξη του μορφοποιητή,τόσο υψηλή είναι η κλήση της αναδιανομής θορύβου και επομένως τόσο χαμηλότερος είναι και ο ηχητικός θόρυβος. Το μειονέκτημα είναι ότι ο θόρυβος πλευρικής ζώνης αυξάνει τόσο πολύ ώστε τα αναλογικά φίλτρα μπορεί να υπερφορτιστούν. Η δεύτερη σχέση που μας δίνουν είναι ότι όσο υψηλότερη είναι η συχνότητα λειτουργίας,τόσο πιο πολύ ολισθαίνει ο θόρυβος στο διάστημα των συχνοτήτων. Σαφώς, το PDM έχει σημαντικά χαμηλότερο θόρυβο και απαιτεί μόνο ένα απλό αναλογικό φίλτρο ανασύν8εσης.

Το compact disk audio υπάρχει εδώ και δύο δεκαετίες περίπου και είναι πολύ πιθανό να υπάρχει για πολλά χρόνια ακόμα. Υπάρχουν επιπλέον περιθώρια ανάπτυξης στο format,πολλά από τα οποία είναι σε ανάπτυξη. Σιγά-σιγά ο ρόλος του αναλογικού σήματος στον ήχο περιορίζεται στο αρχικό στάδιο της εισόδου από κάποιο μικρόφωνο και στο τελικό στάδιο εξόδου από κάποιο μεγάφωνο, ενώ όλα τα ενδιάμεσα στάδια υλοποιούνται με ψηφιακά μέσα.