Idestova majdnem húsz év telt el a CD lemez piaci indulása óta. A világon ma már fél milliárdra teszik a használtban lévõ lejátszók és CD-ROM olvasók számát. Tömeges elterjedtségének oka nemcsak kiváló hátszók hangminõségét mi határozza meg. Pedig ez a technológia képezi alapját a DVD játszóknak, és nagy valószínûség szerint még sok lehetséges jövõbeli audió, vagyis kizárólag hangfelvételt tartalmazó formátumnak, amelyekrõl napjainkban egyre többet írnak. Írásunk technikai részével arra szeretnénk rávilágítani, hogy egy digitális rendszerben mi befolyásolhatja a hangminõséget, és hogy a gyártók hogyan aknázták ki mindazokat a lehetõségeket (sõt még annál is többet), melyeket a CD lemezekben rejlenek. Látni fogjuk, hogy a jangminõsége (amelyet ugyan néhányan még ma is megkérdõjeleznek), nagy adattárolási lehetõsége, de könnyû kezelhetõsége is. Ennek ellenére mûszaki felépítésével nagyon kevesen vannak tisztában, és az még ma is vita tárgyát képezi, hogy a CD jelen technikai lehetõségei hogyan haladták meg egy korábbi rendszer szabványait, és hogy ezekbõl a lehetõségekbõl hogyan lesz talán egy új lemezformátum alapja.
A Compact Disc-nek vagyis a kompakt lemeznek már az elnevezése is arra utal, hogy itt egy kisebb, és egyszerûbben kezelhetõ formátumról van szó, mint a korábbi fekete lemezek. Indulását hatalmas érdeklõdés elõzte meg. Egy olyan rendszer, amely mûszaki paramétereit tekintve olykor nagyságrendekkel "ráver" a korábbi hangrögzítõ és visszaadó berendezésekre, biztos, hogy forradalmasítja a hangtechnika világát - gondolta mindenki. Ez így is lett, bár mint a forradalmak eredményével általában, az emberek most sem voltak mind elégedettek. Ha a lemezek korábbi evolúcióját végigszemléljük, a fejlõdés által hozott elõnyök mindig egyértelmûek voltak. Fonográf lemezbõl 78-as, 78-as lemezbõl mikrobarázdás - a hangminõség és a mûszaki paraméterek folyamatosan javultak. A CD lemez titkolt ígérete az volt, hogy ugyanilyen hangminõségbeli javulást hoz a régebbi rendszer összes problémájának eltörlésével együtt. Ezt sugallta a reklámszlogen is: "Tökéletes hangminõség - örökre."
Érdekes ma végigolvasni azokat az írásokat, amelyek az elsõ CD lemezek meghallgatása utáni véleményeket közlik. Az emberek két végletes véleményre ragadtatták magukat. Az egyik felük azt vallotta, amit a forgalmazó cégek is állítottak, hogy végre itt van minden rendszerek legjobbika, a tökéletes hangzás. A másik csoport viszont nemhogy nem volt lenyûgözve az eredménytõl, de kijelentette, hogy a régebbi rendszer sokkal szebben szólt. Néhányan mintha emlegették volna a túlzott sterilitást és a zavaró zajmentességet, de valójában a gond az aggasztóan kis dinamikával, a fátyolos hangzással, és globálisan azzal volt, hogy egyszerûen a legtöbb embernek jobban tetszett a régi, amelynek hibáit "sikerült kiküszöbölni".
Keresni kezdték az okokat. Többen a hangmérnököket okolták, mondván, hogy az új felvételi eljárások az õ hibáikat tükrözik. Ez az elgondolás logikátlannak tûnik, mert hogy lehet az, hogy egy alapvetõen gyengébb mûszaki jellemzõkkel rendelkezõ analóg rendszer a hibákat elfedte, viszont a jó hangzást átengedte magán? És fordítva, egy mûszakilag jobb rendszer a hibákból enged át többet, és a hangminõségbõl kevesebbet? Mások a digitális átalakítók kiforratlan-ságáról beszéltek. Voltak, akik az analóg kimeneti szûrõkben vélték megtalálni a ludast. Voltak, akik a még kiforratlan digitális stúdiótechnikát hibáztatták. Ebben már inkább lehetett valami, hiszen az elsõ digitális felvételi eljárással készült de még fekete lemezen kiadott zenemûvek tán még a CD lemeznél is csapnivalóbbak voltak. (A régebbi mûszakilag kevésbé korrekt rend-szer átengedte az új, jó rendszer hibáit?) Tény és való, hogy a nyolcvanas évek elejérõl származó DDD-s CD lemezek a rossz hangzás jó néhány mintapéldányát produkálták. Akkoriban azonban az új technoló-giára nem vetett volna jó fényt, ha a régi tökéletlen analóg felvételeket adták volna ki a "tökéletes hangú" CD lemezeken.
Tizenegynéhány év távlatából szemlélve talán kijelenthetjük, mindenkinek volt (egy kis) igaza. Semmi sem volt tökéletes (még ma sem az). A problémát talán az jelentette, hogy a világszerte bevezetett elsöprõ kampányhadjárat és a relatíve magas ár nem állt szemben azzal, amit az akkori közönség a hírverés hallatán várt, és amit az akkoriban már több mint húszéves fekete hanglemez technika kiforrottsága produkálni tudott. Sokan megfeledkeztek arról a tényrõl, hogy itt minden korábbi (analóg) rendszertõl alapvetõen eltérõ új (digitális) rendszer lépett életbe. A digitális technika ma tart ott, mint amikor a fonográfról a 78-as lemezekre tértünk át a század elsõ felében, ugyanis az elsõ generációs CD lemezeket lassan fel fogja váltani egy (remélhetõen) egyértelmûen jobb digitális formátum, légyen az DVD Audio vagy Super Audio CD. Mára mindenesetre mindennapi életünk szerves részévé vált, számítástechnikai adathordozóként, hordozható berendezések elemeként, autóban, "sétáló" kivitelben. A CD lemezjátszó megtalálható a konyhában, a dolgozószobákban, és a High-End termékek között is.
Mi is a digitális technika?
Bár mindennapi életünk szerves részévé vált, és technikailag is sokat fejlõdött indulása óta, a legtöbb ember szinte semmit nem tud arról, hogyan mûködnek a CD lejátszók, sõt arról sem, hogy mitõl is digitális ez az egész. Ha például Önnek feltennék a kérdést, hogy mi is az a "digitális", mit válaszolna rá? Azt, hogy kettes számrendszerben lévõ? Azt, hogy kiváló minõségû? Azt, hogy jobb, mint az analóg? Azt, hogy diszkrét mintákra bontott? A megkérdezett emberek java része hasonlókat szokott felelni. Valójában ezek a válaszok nem a kérdésre felelnek, hiszen nem azt mondják meg, hogy mi, hanem hogy milyen.
Mi tehát a digitális? Ahhoz, hogy megértsük, állítsuk szembe az analóggal. Az analóg szó maga hasonlóságot jelent. A levegõben terjedõ hanghullámot (amelynek frekvenciája, vagyis a váltakozás gyakorisága és amplitúdója, vagyis kitérésének nagysága folyamatosan változik, (1. ábra ) egy mikrofonnal hozzá "hasonlóan" változó elektromos jellé alakítjuk át. A mikrofon jelét egy erõsítõvel egy hozzá "hasonlóan" változó nagyobb jellé alakítjuk (felerõsítjük), majd azt egy mágnesszalagon "hasonlóan" változó mágneses jelként rögzítjük. Ez egy analóg átviteli lánc mûködési elve. Azt, hogy mennyire jó rendszerünk minõsége, az határozza meg, hogy az átalakítás, tárolás, lejátszás után a jel mennyire "hasonlít" az eredetire. Mindennapi életünkbõl is tudhatjuk, hogy hogyan jelennek meg egy analóg átviteli lánc hibái a megszólaló hangban. Készítsünk felvételt, például egy kazettás magnóra. A felvétel zajos lesz. A készülék mûszaki mérései közül ezt az adatot a jel-zaj viszony mutatja (a maximális hasznos jel és a rendszer zajának aránya). Ha nagyon kivezéreljük, torzítani kezd. Ez a torzítás. Kevesebb magas-, és mélyhangot hallhatunk vissza, mint az eredetibõl. Ez a rendszer linearitása, illetve frekvencia-visszaadásának függvénye. Ha közvetlenül mikrofonról veszünk fel, problémát jelenthet, hogy amennyiben a közvetlenül a mikrofon mellett lévõ erõsebb hangforráshoz igazítjuk a felvétel szintjét, akkor nem hallatszanak a halk részletek, ha a halk részletekre állítjuk be a szintet, akkor a magnó túlvezérlõdik. Ez a dinamika problémája: a rendszer nem képes visszaadni a leghalkabb és leghangosabb jel között eredetileg fennálló különbséget.
Maga a digit számot jelent, a latin digitus, azaz ujj szóból ered. A digitális pedig számszerûsítettséget. A digitális jel úgy jön létre, ha a folyamatosan változó jelet meghatározott sûrûséggel megmérjük, és a mérés eredményét rögzítjük. A mérés eredménye numerikusan, vagyis számszerûen kifejezhetõ. A számszerû kifejezés történhet bármely számrendszerben. A kettes számrendszer technikai szempontból azért felel meg leginkább erre a célra, mert így egyrészt csak két különbözõ állapotot kell egymástól megkülönböztetnünk és tárolnunk, az egyet és a nullát, másrészt a digitalizált jellel való matematikai mûveletvégzések, kódolások, hibajavítások, moduláció így sokkal könnyebben elvégezhetõ.
A két rendszer egymás mellett élésére természetesen nem csak a hangtechnikai rögzítésben találhatunk példákat. Mindennapi életünkben bármilyen olyan berendezés, amely mér valamit (mérõmûszerek, sebes-ségmérõk, órák, számlálók, hõmérõk, vér-nyomásmérõ, stb.) lehetnek digitálisak vagy analógok. Ha túlságosan le akarnám egyszerûsíteni a helyzetet, akkor azt mondhatnám, hogy ami számmal jelez ki, az digitális, ami mutatóval, az analóg. (Ez utóbbira a szabályt erõsítõ kivétel az óra). Használati tárgyaink és szórakoztató elektronikai berendezéseink - tetszik vagy nem - lassan digitá-lissá válnak.
A digitális technika elméleti alapjait a negyvenes években fektették le. A gyakorlati megvalósulás az ötvenes évek végén kez-dõdött, nagy távolságra történõ adatátvitel célját szolgáltak. Ekkor dolgozták ki a mai CD technika alapjául szolgáló PCM (Pulse-Code-Modulation, azaz impulzuskód-moduláció) eljárást. A PCM jel egy olyan négyszögjel, ahol a négyszögjel magasabb feszültségnek megfelelõ értéke felel meg a bináris 1-nek, a kisebb feszültségérték pedig a 0-nak. A négyszögjel hossza aszerint változik, hogy hány nulla és egyes követi egymást. A PCM jel lehet soros vagy párhuzamos. Soros jelrõl beszélünk akkor, ha egy szóban elhelyezkedõ biteket egymás után egy kábelen visszük át. Párhuzamos a jel akkor, ha bitenként vagy byte-onként egy csatornát alkalmazva egyszerre visszük át a kódszavak összetevõit. Egy 16 bites rendszerben ilyenkor természetesen 16 csatornára van szükség.
A hetvenes évekre a stúdiókban használt videomagnók technikai színvonala annyira kiforrott, hogy lehetségessé váltak digitalizált hangrögzítésre. Az eljárás alapját egy digitalizáló PCM kódoló képezte, melynek kimenetén a digitális jelet úgy kódolták, hogy azt a videomagnók PAL vagy NTSC videojelként tudják rögzíteni.
Miért volt szükség videomagnók használatára? Az analóg jel átvitelére és tárolására megfelelnek olyan eszközök, melyeknek sávszélessége az emberi hallás fiziológiájához illeszkedõen 20 Hz-tõl 20 kHz-ig terjed. A digitalizálás után létrejött jel sávszélessége azonban több mint 4 MHz, tárolására tehát csak olyan rögzítõeszköz felel meg, amely sávszélességét tekintve akár videojel felvételére is alkalmas. A PCM kódolók kifejlesztése és elõállítása költséges és rendkívül munkaigényes feladat volt, ráadásul az integrált áramköri technika magas fejlettségi színvonalát feltételezte. Milyen elõnyöket biztosít hát a digitális hangtechnika, ha mindezen nehézségek ellenére érdemes volt áttérni rá?
A digitális technika elõnyei és hátrányai
A leglényegesebb, hogy a felvett hanganyag minõségromlás nélkül másolható, tárolható, valamint tetszõleges példányszámban sokszorosítható, ugyanis az átvitel és tárolás során nem lép fel torzulás, jelcsök-kenés, átmágnesezõdés. Emellett sokkal jobb mûszaki paraméterekkel rendelkezik. Egyrészt lényegesen jobb a jel-zaj aránya, mint az analóg rendszereké. Ennek megfelelõen kihasználható dinamikatartománya is nagyobb, akár az analóg rendszerek ezerszerese is lehet. A jelhordozók és a berendezések érzéketlenek a hõmérséklet és feszültségingadozásokkal szemben. Nincs hangmagasságingadozás. A digitális rendszer képes az egyenfeszültségû jelkomponensek átvi-telére is, frekvenciamenete teljesen lineáris.
A fentiek után érthetõ, miért volt annyira fontos, hogy a hangrögzítõ stúdiók világában minél elõbb át tudjanak térni a digitális rendszerekre. A mindennapi életbõl azonban tudhatjuk, hogy mindennek megvan a maga árnyoldala is (vagy ha nincs, akkor nagyon drága). Milyen hátrányai vannak a digitalizálásnak?
A digitális jel érzékeny az adatvesztésre. Már néhány bit elvesztése az eredeti jel re-produkálhatatlanságát jelenti. A probléma kiküszöbölése jelentõs hardver és szoftverráfordítást igényel. A digitális átvitel céljául szolgáló áramkörök rendkívül bonyolultak és összetettek, kifejlesztésük és gyártásuk a tömegtermelés kialakulásáig meglehetõsen drága. A digitális jelfeldolgozó áramkörök túlvezérlése a teljes hangfrekvenciás jel ösz-szeomlásához vezet. A szerkesztési funkciók ellátása digitális rendszerben mechanikusan nem végezhetõ el, elektronikus snittkészítõ berendezésekre van szükség.
Az analóg rendszereknél a mérhetõ mûszaki adatokat és a hangminõséget meghatározó tényezõk általában az alkalmazott kapcsolástechnikától és a felhasznált alkatrészek minõségétõl függenek. De alapvetõen mi határozza meg a digitális rendszerek minõségét?
Az egyik az, hogy az eredeti, folyamatosan változó jelbõl milyen sûrûséggel vesznek mintát. Ez az ún. mintavételi frekvencia, ez határozza meg az átvihetõ legmagasabb frekvenciát. Ugyanis a mintavételezési frekvenciának maximálisan a fele lehet az eredeti hangjel legmagasabb frekvenciájú komponense. A másik lényeges paraméter, hogy a kapott minták átalakítása során hány különbözõ nagyságú jelet tudunk egymástól megkülönböztetni. Ez a rendszer felbontása, ez határozza meg, hogy mekkora lesz a jel-zaj arány, a dinamika és a torzítás. Hogy ez utóbbit jobban megérthessük, képzeljük el, hogy meg akarjuk mérni szobánk egyik falának hosszát. Ha a mérõszalagon, amelyet hasz-nálunk csak a métereket jelölték meg, akkor a kapott eredményt méterre kell kerekí-tenünk. Adott esetben a négyes és az ötös osztás között van a fal hossza, tehát megállapíthatjuk: 4 vagy 5 méter hosszú. Ha a szalagon feltüntették a deciméteres felosztást is, akkor pontosabb eredményt kapunk, illetve a kerekítésnél keletkezett hiba kisebb: 4,4 és 4,5 méter közé esik. Ha a centiméterek is rajta vannak, akkor az eredmény 4,46 és 4,47 méter közé esik, és a fal hosszához mérten alig valamicskét kellett kerekítenünk. A kerekítéskor "leesõ" távolság (a mérés hibája) a kvantálási hiba.
A számokra tekintve láthatjuk, hogy ha egy helyi érték áll rendelkezésünkre a tízes számrendszerben (tízujjú létünkre mi emberek ezt használjuk), akkor tíz különbözõ hosszúságot tudok megkülönböztetni. A mérõszalag beosztásának finomítása a számok hosszának (helyi értékeknek) növeke-dését jelenti. Egy helyi érték növekedés tízszeresére növeli a pontosságot. Logikusan, ha kettes számrendszerben tárolunk adatokat, akkor egy helyi értékkel való növekedés (egy bittel több) kétszeresére növeli a pontosságot.
A digitális rendszereknél általában lineáris kvantálást végeznek. Ez azt jelenti, hogy a jelnagyságok, amelyre a kerekítést elvégzik, vagyis amelynek az analóg jel pillanatnyi nagyságát megfeleltetik, mindig egyforma nagysággal (monoton) nõnek. Fenti példánkban teljesen természetesnek vettük, hogy szobánk falának megmérésére olyan mérõszalagot használunk, amelynek beosztása teljesen egyenletes. Ha a hibaarányt százalékosan fejezzük ki, észrevehetjük, hogy a mérés hibája a mért hosszal változik. Vegyünk egy kézzel fogható példát. Tételezzük fel, hogy van egy 200 m hosszú mérõszalagunk egy méteres beosztással. Ha szobánk falát mérjük vele, amely 4,47 m, akkor a leképzési hiba a mért eredményhez képest 20-25 %. Ha egy sportcsarnok hosszát mérjük meg, akkor a valós 104,57 méterhez képest a kerekítési hibánk kisebb lesz, mint 0,5 %.
Erre mondhatnánk azt, hogy nincs ezzel semmi gond, hiszen nem a halk jeleknek van jelentõsége, mert azok úgyis eltûnnek a környezeti zajban. A hangtechnikánál azonban figyelembe kell venni, hogy az emberi hallás érzékenysége logaritmikusan növekvõ görbével írható le. Ez azt jelenti, hogy a halk hangok között sokkal kisebb különbségeket vagyunk képesek meghallani, mint nagyobb hangerõnél. Vegyünk egy konkrét példát. Ha zenét hallgatunk otthon 0,1 watt hangerõvel, és a zenét felhangosítjuk 0,2 wattra, akkor kétszer olyan hangosnak halljuk. Ha viszont 1 watt teljesítménnyel hallgatjuk a zenét, és 1,1 wattra hangosítjuk fel, akkor szinte észre sem vesszük a különbséget. Ugyanakkora hangerõnövekedéshez itt már 1 wattra van szükség. Ha a fület akarnánk utánozni, olyan mérõszalagra lenne szükség, ahol a kisebb jelek tartományában a beosztás egyre sûrûbb.
Lineáris kavantálás esetén a hangos részeknél alig lesz torzítás, mert az emberi fül léptékeihez képest nagyon kis lépcsõket használtak a leképzésre. Az alacsony jelszinteken viszont durva leképzési hibákat tapasztalhatunk. Az analóg rendszerek általában pont fordítva viselkednek: a kisebb jelek tartományában kisebb a torzítás. Kivétel ott is van, például a B osztályú erõsítõk nullát-meneti torzítása. Ha digitális rendszerünk felbontása jó, akkor ezzel nincs gond, de ha kevés leképzési szint áll rendelkezésre, komoly gondot jelenthet.
A digitális rendszerek hangminõségében kételkedõk véleményét éppen a lineáris kvantálás támaszthatja alá. A fül ugyanis "természetesebbnek" találhatja, hogy a torzítás a kivezérléssel egyenes arányban nõjön, nem pedig fordítva.
Mekkorának kell lennie egy digitális rendszer felbontásának? Egy kompromisszummentes audió lánc átvitelének illeszkednie kell az emberi hallás fiziológiájához. Az emberi fül által még hallható legkisebb zajhoz ké-pest a fájdalomhatár körülbelül 120 dB távolságra helyezkedik el. Ez 1 : 1.000.000 vagyis egy az egymillióhoz arányt jelent. Ezen túl elvben nem érde-mes növelni egy rendszer felbontását. Kettes számrendszerben ekkora dinamika eléréséhez 20 bitre van szükség. A digitális technikában ugyanis jó közelítéssel egy helyi érték, vagyis egy bit 6 dB-nek felel meg (kétszeres értéknek). Az alkalmazott bitek számát a szóhosszúság adja meg.
Az átviteli igények meghatározásának másik kulcseleme a változás gyakoriságára (frekvencia) vonatkozik. (2. ábra) A fül ugyanis a különbözõ frekvenciákat is meg tudja különböztetni egymástól. Egy olyan rendszer, amely (nagyjából) tökéletesnek mondható, torzításmentesen át kell eressze magán a 20Hz-20kHz-es hangfrekvenciás sávot. Ehhez elméletileg minimálisan 40 kHz-es mintavételezésre van szükség, a gyakorlatban pontosan 44,1 kHz-re választották. A mintavételezés és az adatátvitelben alkalmazott szavak hossza adja meg az úgynevezett információ sûrûséget, vagyis azt, hogy egy másodperc alatt mekkora adatmennyiséget kell továbbítanunk. Ez a fenti két példát nézve: 44100x20=882.000 bit/s. A fent már említett adatvesztési érzékenység miatt azonban hibajavító és más információs bitekre is szükség van. Belátható, hogy a minõség ára a lényegesen megnövekedett sávszélesség igény lett. Ekkora felbontást és sebességet a nyolcvanas évek elején a technika még nem tudott biztosítani. A Philips elegendõnek találta volna a 14 bites felbontást, a Sony azonban a stúdiókban alkalmazott PCM kódolóival szerzett tapasztalatai alapján ragaszkodott a 16 bithez. A CD lemezek végleges specifikációja tehát 44,1 kHz mintavételezés, 16 bit felbontás lett.
A CD rendszer létrehozása és alapvetõ jellemzõi
A CD rendszer kifejlesztésére történõ elsõ lépések 1974-ben történtek meg. Ekkor kezdõdtek meg az optikai letapogatással kapcsolatos elsõ kísérletek a Philips-nél. 1979-ben a Sony is bekapcsolódott a munkálatokba.
A kísérletek elsõ eredménye a Laser-Vision képlemez volt. Erre a képjelet még nem digitálisan tárolták, hanem analóg jelként. A Sony-Philips által javasolt végleges CD szabvány 1980 táján látott napvilágot. Az elsõ valóban digitális CD lemezjátszó prototípusokat is ebben az évben mutatták be a nyilvánosságnak.
A CD lényegében egy 12 cm átmérõjû mûanyag lemez, amelyen spirál mentén tárolódik az információ. A spirális sávban az információ belülrõl kifelé rögzített, vagyis pont ellenkezõje a bakelit lemezekének. Az információt parányi bemélyedések, az ún. pitek hordozzák. A pithosszúság, valamint az egyes pitek közötti távolság soros digitális kódot képez, ami végeredményben a tárolt információt reprezentálja.
Egy CD-n maximálisan 99 zeneszám tárolható. A digitalizált zenei információ mellett azonban további információk is találhatók a CD lemezeken. A pitsávban alkalmazott idõosztásos eljárás segítségével minden zeneszám startidejét és a zeneszám idõtartamát is rögzítik. Az idõosztásos eljárás (idõkódolás) teszi lehetõvé azt is, hogy a 99 zeneszám mindegyike 99 szakaszra legyen felosztható (indexelés). Ennek elõnye, hogy az ily módon megjelölt szakaszok külön-külön is elérhetõk.
Ezen túlmenõen a zeneszámokkal kapcsolatos idõadatok, valamint a zenei felvételek száma egyfajta tartalomjegyzék formájában is rögzítve van a pitsáv elején. Ezt a tartalomjegyzéket a CD rendszerben TOC-nak (Table of Content) nevezik. A CD lemezjátszók vezérlõrendszere a CD minden betöltésekor, ill. minden indításnál betölti a tartalomjegyzéket egy számlálóáramkörbe. Az említett információk mellett a TOC a tárolt információ jellegére vonatkozóan - tehát hogy zenei, szöveg- vagy videofelvételekrõl van e szó - is tartalmaz adatokat.
A pitsáv letapogatása érintkezésmentesen, lézersugárral történik. A lézersugarat optikai rendszer fókuszálja és irányítja a spirális alakú pitsáv közepére. A CD forgása, valamint az optikai rendszer egyenletes "elõtolása" következtében a lézersugár a teljes információs sávon végighalad. A letapogatás a CD alsó oldalán folyik. A lézersugár felõl nézve a sáv az óramutató járásával ellentétesen halad. A CD-n tárolt információ a lemez barázdáiról visszavert lézersugárral nyerhetõ vissza. A visszanyert információt hordozó jelsorozatot a digitális jelfeldolgozó áramkörök dolgozzák fel.
A spirális alakú pitsáv letapogatásakor keletkezõ soros digitális jel frekvenciája a lemez fordulatszámától függ. Annak érdekében, hogy a jelfeldolgozó mikroprocesszor számára állandó frekvenciájú jelsorozat álljon rendelkezésre, a lemez fordulatszámát a letapogató rendszer mindenkori pozíciójához illesztik. Ily módon a spirális sáv minden pontján állandó letapogatási sebességet biztosító fordulatszám-szabályozási eljárást CLV (Constant Linear Velocity) szabályozásnak, avagy konstans kerületi sebességû szabályozásnak nevezik. A CLV szabályozás következtében a letapogató-rendszer belsõ (a lemez középpontjához legközelebb esõ) pozíciójában a lemez fordulatszáma kb. 500 ford./percre adódik, ami a lemez külsõ széléhez tartozó pozícióba érve folyamatosan kb. 200 ford./percre csökken. Ez tehát szö-ges ellentétben áll az analóg lemezek fordulatszám-követelményeivel. Ott a konstans fordulatszám a külsõ barázdákban lényegesen nagyobb kerületi sebességet eredményez, mint belül, ennek következtében (is) a bakelit lemezek eleje általában jobb hangminõséget biztosít a végénél.
A CD mûsoridejét a spirális sáv hosszúsága és a letapogatási sebesség határozza meg. A CD rendszerben kétféle letapogatási sebesség terjedt el, ennek következtében két különbözõ maximális mûsoridõrõl beszélhe-tünk. A standard CD rendszerben a maxi-mális mûsoridõ 60 perc, a letapogatási sebesség pedig 1,4 m/s. A letapogatási sebesség 1,2 m/s-ra való csökkentése esetén pedig a maximális mûsoridõ 75 percre növekszik. A gyakorlatban vannak ugyan olyan (elsõsorban komolyzenei) felvételek, melyek mûsorideje több mint 80 perc, de ezek külsõ barázdáinak lejátszásakor (amikor a szabályozókörnek a normál tartományon túl kell lassítania a fordulatszámot) egyes lemezjátszóknál a lejátszás akadozóvá válhat, esetleg le is állhat.
A CD lemez elõállításának folyamata
A CD-t 1,2 mm vastagságú mûanyag lemezbõl alakítják ki. Kiindulási anyagként általában polycarbonátot alkalmaznak, de vannak PVC vagy akril alapú lemezek is. Gyártásánál magas technológiai színvonalú fröccssajtolási eljárást alkalmaznak. A gyártási tolerancia az átmérõre nézve (12 cm) max. 0,5 mm, a lemezvastagságra vonatkozóan pedig max. ± 0,01 mm lehet. Az excentritás mértéke nem lépheti túl a ± 50 µm-t. Egyes megmunkálási folyamatok olyan tisztított levegõs feltételeket igényelnek, amilyenekre eddig csak az integrált áramkör elõállításakor volt szükség.
A konkrét lemez létrehozásának elsõ lépéseként a fotólakkréteggel bevont üveglemezt (glasmaster) állítják elõ. A fotólakkréteget spirális sávban haladva világítja meg a felvevõrendszer által vezérelt lézersugár. A megvilágítás a digitalizált hangjelek 0-1 állapotainak megfelelõen történik.
Következõ lépés a fotólakkréteg elõhívása és a megvilágított helyekrõl való eltávolítása. Ily módon kiemelkedésekbõl és bemélyedésekbõl (pitekbõl) álló struktúra jön létre. Errõl az elsõ üvegmintáról galvanikus eljárással negatív másolatot készítenek, amelynek az alap-anyaga nikkel (ez az ún. nikkel apalemez). Ezzel már lehetne CD-t sajtolni.
Annak érdekében, hogy az egyetlen õssajtolási matricát megkíméljék, egy további munkafázisban - ugyancsak fémbõl - egy vagy több közbensõ matricát is készítenek, ezek az "anyalemezek". A pozitív struktúrájú anyalemezekkel sajtolják a negatív struktúrájú sajtolási matricákat, a "gyermekeket".
Hasonlóan a lakkvágási technikával készített hagyományos analóg hanglemezekhez, a kész CD-k a gyártási folyamatnak már az ötödik generációi. A digitális információtárolási struktúra következtében azonban ezúttal nem lép fel minõségromlás.
A sajtolással elõállított CD pitekkel és bordákkal ellátott felületét mindössze 40 nm vastagságú leheletnyi vékony alumíniumréteggel vonják be, tükrösítik. (1 nm=1x10-9 ) Ez a tükrösített felület az információs sík. A tükrösítés után a CD-t még kb. 6 mm-es védõréteggel is bevonják. Mivel késõbb erre az oldalra kerül a címke, a CD-nek ezt az oldalát címkeoldalnak (labelside) nevezik. A CD lemezen lévõ pitstruktúra annyira sûrû, hogy egyetlen emberi hajszál kb. 40 pitsávot fedne le.
Ahhoz, hogy a CD lemez arányait jobban felfoghassuk, képzeljük el, hogy CD leme-zünket ezerszeresére nagyítjuk. Ekkor vastagsága nem 1,2 mm, hanem 1,2 méter lenne. Átmérõje - 120 méter - teljesen lefedne egy futballpályát. A közepén lévõ lyuk 15 méter átmérõjû lenne. A pitek méretei azonban még ekkor is kicsinek mondhatók: szélességük mindössze 0,5 mm, maximális hosszúságuk 3,56 mm, minimális hosszú-ságuk 0,8 mm, a sávok egymástól való távolsága 1,6 mm, mélységük pedig csak 0,1 mm.
A címke felnyomtatása elõtti utolsó lépés a 15 mm átmérõjû középlyuk elkészítése. A pontos beállítást lézeres pozicionálással végzik, a belsõ sávhorony alapján.
A CD címkeoldalának vékonysága miatt nagyon érzékeny a mechanikai sérülésekre. A legkisebb benyomódások, pl. a címkeoldalra írt golyóstollas felirat is az információs sík megsérüléséhez vezethet.
Valamivel kevésbé érzékeny a mechanikai sérülésekre a transzparens réteg, azonban ez is óvatos bánásmódot igényel. A transzparens réteget mindig tiszta, száraz ronggyal kell tisztítani, sugárirányú mozdulatokkal. Ezáltal megakadályozhatjuk a sávirányú karcolások keletkezését.
Hibajavítás szükségessége a digitális rendszereknél
A CD indulásakor legendák születtek arról, mennyire nem érzékeny a hibákra. A gyakorlati tapasztalatok azonban azt mutatták, hogy bizonyos sérülések ugráshoz, vagy a lemez lejátszhatatlanná válásához vezet-nek, és hogy a karcos lemezek igenis gyengébben szólnak a hibátlan példányoknál.
A digitális hangátvitel adatkiesési érzékenységét, és a CD lemezek sajátosságait figyelembe véve tehát olyan hibajavítási eljárásra van szükség, amelytõl elvárható, hogy akár 10-100 kódszó kiesése esetén is hibátlanul reprodukálni tudja a kimaradt információt. A hibajavítási eljárások rendkívül bonyolult magasabb matematikai mûveletekkel dolgoznak, ezekkel nem akarnám (nem is tudnám, én magam sem értem) az olvasókat untatni, de két alapvetõ eljárást szeretnék megmutatni önöknek. Az egyik a paritásvizsgálat. Ennek során az információs biteket egy paritásbittel egészítjük ki. A korrekciós bit értéke egyrészt attól függ, hogy hány bináris 1 van az eredeti szóban, másrészt, attól, hogy milyen megállapodás szerint végezzük a paritásvizsgálatot. Megkülönböztetünk páros és páratlan paritást. Páros paritás esetén a paritásbit értéke akkor lesz 1, ha az eredeti kódszóban levõ 1-ek összege páratlan. Páratlan paritás esetén a helyzet fordított. Hogy az átvitel so-rán keletkezett-e hiba, azt az adatszó dekódolásánál vizsgáljuk meg. Amennyiben a paritásbit képzésének szabálya ismert (vagyis, hogy páros vagy páratlan paritásról van-e szó) az információs bitek és a paritásbit egyszerû összehasonlításával megállapítható, hogy az átvitel hibás volt-e vagy sem.
Nyilvánvaló, hogy az egyszerû paritásvizsgálatnak komoly korlátai vannak. Abban az esetben ugyanis, ha egy adatszóban egyszerre több hiba is adódik, elõfordulhat, hogy az egyik hiba paritásszempontból kompenzálja a másikat, miáltal a paritásbit hibátlan átvitelt jelez. További hátrány, hogy átvitel során maga a paritásbit is megsérülhet, illetve arról, hogy melyik bit sérült meg, nem ad tájékoztatást, tehát nem állítható vissza az eredeti szó. Ennek ellenére több bonyolultabb módszer alapját képezi.
Annak érdekében, hogy az adatszóban esetlegesen elõforduló hiba ne csak felismerhetõ, hanem javítható is legyen, további eljárásokra van szükség. A legegyszerûbb hibajavítási lehetõség a keresztparitás-vizsgálat. Ennek során az egyes kódszavakat mátrix alakba rendezéssel újra meg kell vizsgálni. A sor-és oszlopparitás ismételt megvizsgálásakor a keresztezési pontban megjelenik a hibás bit. A korrekció egyszerû invertálással elvégezhetõ.
A gyakorlatban a paritást nem egyes bitekbõl, hanem komplex kódstruktúrákból álló redundanciaszakvakból képezik. Ezeknek a kódoknak képzési stratégiája a CD lemezre leginkább jellemzõ hibák fajtájához igazodik.
A CD-n tárolt információ a digitalizált hangjelbiteken kívül a hibajavítás és az idõkódolás adatait, valamint a vezérlõ- és jelzõ-adatokat is tartalmazza. További bitek keletkeznek a forráskódolású jel csatornakódolásúvá való átalakítása során. A felvételi folyamatban valamennyi adatot egyetlen adatfolyamba foglalják is így vezetik a "vágólézerre". Nézzük meg, hogyan jön létre ez az adatfolyam.
A CD lemezek felvételi formátuma
Az analóg hangjelek digitalizálása a sztereó rendszer jobb és bal csatornáira nézve külön-külön történik.
Hasonlóan a normál magnókhoz, a CD rendszerben is elõkiemelést alkalmaznak a hangfrekvenciás spektrum felsõ tartomá-nyában a jel-zaj viszony növelésére. Kétféle idõállandó közül lehet választani: T1=50 ms, T2=15 ms. A választástól függõen a 6 dB/oktáv magashang-kiemelés 10,6 kHz-nél (15 ms), ill. 3,18 kHz-nél (50 ms) kezdõdik. A választott elõkiemelésrõl tájékozató jelzést a kiegészítõ információk tartalmaznak. Kapcsolástechnikailag a magashang-kiemelés a felvételi út analóg szakaszában történik.
Az elõkiemelés után a hangjel frekvencia-tartományát az antialiasing aluláteresztõ szûrõvel 20 kHz-re korlátozzák. Erre a szûrésre azért van szükség, mert a digitalizálás során a mintavételi frekvencia alatt és felett megjelenik az átvitt sáv spektruma ill. annak tükörképe. Amennyiben a digitalizálni kívánt analóg jel a mintavételezési frekvencia felénél magasabb frekvenciájú összetevõket tartalmaz, magasabb tartományban átlapolódás, avagy egy ún. aliasing torzítás jön létre, amely különbségi hangok termelésével a hallható tartományban is megjelenik. Erre a problémára késõbb a digitális szûrõk tag-lalásánál visszatérünk.
Határolás után az analóg jel mintavevõ és -tartó áramkörre kerül a mintavételezéshez (44,1 kHz-es mintavételi frekvenciával). Ezt követõen a mintavett jelet egy 16 bites A/D átalakító lineárisan kvantálja. Ennek korlátairól már beszéltünk. Ennek ellenére a jelenleg alkalmazott digitális rendszereknél szinte kizárólag a lineáris kvantálás terjedt el, kivéve a DAT magnók LP üzemmódjában, ahol nemlineáris kvantálást használnak, ellensúlyozva ezzel a 12 bites felbontást. A linearitás problémájának megoldására késõbb a kisbites jelátalakítóknál még visszatérünk.
A mintavételezéskor kapott diszkrét min-tákat PAM (Pulse Amplitude Modulation, azaz impulzusamplitúdó-modulációs)
jelnek hívják. (3. ábra) Ez azt jelenti, hogy a kapott impulzusok nagysága szimbolizálja az eredeti amplitúdó nagyságát. Ezt a PAM jelet alakítja át az A/D átalakító bináris jellé, majd egy ún. kettes komplemens kódoló egység PCM jellé. Így az A/D átalakító kimenetén minden mintavételi érték egy 16 bites bináris kódszó formájában jelenik meg. Ezután következik a hibajavító és egyéb rendszerkódok elhelyezése.
Hibajavító és rendszer-kódok a CD lemezeken
Nem akarok belebonyolódni a CD rendszer hibajavító blokkjainak sémájába, de azt érdemes megnéznünk, hogy a lemezekre milyen összetevõjû blokkok kerülnek fel, már csak azért is, mert ez képezi az idõosztásos eljárás alapját. Egy adatblokk a jobb és a bal hangcsatorna 6-6 mintavételi értékébõl képzett 12 db 16 bites adatszót tartalmaz. Ezeket 24 db 8 bites kódszóvá, ún. szimbólummá alakítják át. Ezekhez a szimbólumokhoz négy 8 bites paritáskódszót képeznek. Így már 28 db 8 bitbõl álló kódszavunk van. Ezen kódszavak sorrendjét összekeverik (interleaving), hogy az adatok ne a keletkezésük sorrendjében kerüljenek az átviteli csatornára, hanem idõben is és térben is eltolva. Ily módon az átvitel során fellépõ esetleges zavarok (adathibák, jelkimaradások) következtében meghibásodó adatblokkok jobban rekonstruálhatók.
Ezután a 28 szimbólum egy további kódolóra kerül, ahol további 4 db 8 bites paritáskódszóval egészítik ki. Így összesen 32 szimbólumból adatblokkokat kapunk (256 bit). Ezt a 24-rõl 32 kódszóra való átalakítást, beleértve a kódszavak összekeverését CIRC kódolásnak nevezik (Cross Interleave Reed Solomon Code, azaz keresztbehelyezéses Reed Solomon kód). (4. ábra) A Reed-Solomon kód olyan blokk-kód, ami a kódolás elõtt az adatszavakat mátrixformába rendezi, és a sorok és oszlopok alapján keresztszummákat képez. A végleges adatblokkot frame-nek nevezik.Mivel minden keret 6 mintavételi érték információit tartalmazza, és az egyes mintavételi értékek eredetileg 1:44,1=22,67 ms-onként jelennek meg, a keretek ismét-lõdési sebessége könnyen meghatározható: 44100/6=7350 Hz. Ez a CD rendszer keretfrekvenciája. Mivel a keretfrekvencia a CD rendszer valamennyi órajelfrekvenciájának meghatározásában szerepet játszik, igen fontos jellemzõnek számít. Erre késõbb a kiolvasott EFM jel szinkronizálásánál visszatérünk.
Az EFM kódolás
A bonyodalmak azonban még csak ez után kezdõknek. Az így kapott 256 bites frame-et kiegészítik 8 kontroljellel. Ezt az ún. kibõ-vített 264 bites keretet az EFM moduláció végül is 588 csatornabitté duzzasztja. A keretismétlõdési sebesség és a csatornabitek szorzata adja a CD rendszer végleges adatátviteli sebességét: 4,3218 Mbit/s.
Miért van szükség az EFM (Eight to Fourteen Modulation azaz a “Nyolc a tizennégyhez” modulálás) kódolásra? A leglényegesebb szempont, hogy az átvitt adatjel soros, külön órajelet nem tartalmaz. Az adatoknak a dekódoló áramkörbe való beolvasásához azonban szükség van órajelre. Emiatt a csatornakódolást úgy kell kialakítani, hogy idõegységenként elegendõ pitél legyen felismerhetõ, azaz a legnagyobb futási hossznak annyira kicsinek kell lennie, amennyire az csak lehetséges. Ezen túl pedig a CD játszók sávkövetõ és szervó-áramköreinek hibafeszültségei a letapogató-rendszerbõl erednek, frekvenciatartományuk az alacsonyabb (0-20 kHz-es) tartományba esik. A CD szennyezõdései és karcolásai is kisfrekvenciás zavarjel komponenseket hoznak létre. Annak érdekében, hogy ezeket a zavarjeleket felüláteresztõ szûrõ beiktatásával távol tarthassuk az átviteli csatornától, magának az adatjelnek ebben a tartományban nem szabad hasznos komponenseket tartalmaznia.
Látszólag paradox dolog, hogy az átvinni kívánt adatok ilyen módon való felduzzasztására részben pont azért van szükség, hogy ne kelljen túl nagy sávszélességet használni a CD lemezre való írásra. A CD-re készülõ felvétel során ugyanis a bináris értékek (élváltozások) felváltva be-, ill. kikapcsolják a vágólézert. Következésképpen a pitek hossza és a pitek közötti szünetek jelenítik meg a digitális jelfolyamot. Eszerint a bináris 0 értékeknek vagy pit, vagy pedig két pit közötti szünet felel meg, a bináris 1 értékeket ezzel szemben a felfelé vagy lefelé futó pitél reprezentálja. Gyakorlati vizsgálatok azt állapították meg, hogy a CD rendszer által képviselt átviteli csatornához akkor a legkedvezõbb az adatszavak kódolásának illesztése, ha a kódot úgy választják meg, hogy minden bináris 1-et reprezentáló felfutó él közé minimálisan két, maximálisan 10 bináris nulla kerüljön. Ez fogja meghatározni a minimális és maximális pithosszúságot is.
Egy nyolc bites bináris szó 256 különbözõ értéket vehet fel 00000000 és 11111111 között. Logikusan közöttük sok olyan lesz, amely nem felel meg a fenti feltételeknek. Növelve a szükséges bitek számát, a 14 bites kódhosszúság az elsõ, amely a fenti feltételeknek megfelel. A 214=16384 lehetséges kódkombináció között 267 olyan adatszó van, ami eleget tesz a “minimum 2, maximum 10 egymás utáni bináris 0 érték” feltételnek. A felesleges 11 (267-256=11) kódként azokat jelölték meg, amelyek több szó összekapcsolásánál okoztak volna nehézségeket.
Két kódszó egymáshoz illesztése során persze megint felborul a kódstruktúra. Ezért minden kódszó közé három olyan ún. merginbitet illesztenek meg, amelynek értékét úgy választják meg, hogy a kódszavak egymás utáni sorozata is megfeleljen fenti feltételeknek. A valóságban a 8 bites forráskódolású szavakat ROM-ban tárolt 14 bites csatornakódoknak feleltetik meg.
Annak érdekében, hogy a lejátszás során a CD játszók az egyes kereteket ki tudják választani az adatfolyamból, és hogy a szinkronizálást meg lehessen oldani, a végsõ 588 csatornakeret elsõ 24 jelét az ún. szinkronizáló bitek teszik ki. A szinkronjel a következõ: 100000000001000000000010, vagyis két maximális pithosszt jelöl ki az egyesek között 10 nullával.
A CD játszók kiolvasó rendszerének mechanikai felépítése
Miért van olyan nagy jelentõsége a CD játszók mechanikai felépítésének? Hiszen digitálisak, tehát a kiolvasórendszer felépítése nem szabadna, hogy befolyásolja az általa produkált hangot. Vagy mégis lenne a CD játszók futómûvének saját hangja? A feltételezés nevetségesnek tûnik, de amikor a hetvenes években a Linn cég kijött speciális konstrukciójú futómûvével a Sondekkel, és nem kevesebbet állított, mint hogy a futómûnek is van saját hangja, a legtöbb ember hitetlenkedve csóválta fejét. A Linn relatív magas ára ellenére szép karriert futott be, és ma már senki sem vitatja, hogy a lemezjátszók futómûve is jelentõsen befolyásolja az elért hangminõséget.
Mi a helyzet a CD játszókkal? Azt bárki tapasztalhatja, hogy ha a CD játszót közvetlen a hangsugárzó közelében helyezik el, akkor nagyobb hangerõnél elõfordulhat, hogy a CD játszó ugrani, téveszteni fog. Természetesen ez már szélsõséges eset, de kisebb hangerõnél is befolyásolja a lejátszóberendezés mûködését a megszólaltatott zene, illetve tovább gondolva a dolgot, a CD játszót érõ bármilyen rezgés, amely eredhet a hálózati transzformátorból, a mechanikát mûködtetõ szervómotorokból, a környezetbõl, bárhonnan. Érthetõ hát, hogy a CD játszókat is célszerû speciális állványra állítva hallgatni. A nyolcvanas évek végére egyre több cég jött ki speciális felépítésû futómûvel, és úgy látszott, igazuk van. A jelenség látszólag érthetetlen, de a hagyományos lemezjátszóknál alkalmazott módszerekkel is detektálható.
Ilyen méréseket végzett el 1987 környékén forgalmazott CD játszókon az akkor Hifi Magazinból Hifi Mozaikká átalakult folyóirat. Ugyanazt a módszert használták, amely a lemezjátszók hasonló tulajdonságainak tesztelésére szolgál: az akusztikai visszahatás vizsgálatot. A mérési eljárás lényege a következõ: a lemezjátszót elhelyezik egy olyan hangsugárzótól fél méterre, amelynek szélessávú hangszórója koncentrikus, tehát pontszerûen sugároz. A hangsugárzó elé egy mikrofont szerelnek, amellyel úgy vezérlik a meghajtó-erõsítõt, hogy a hangnyomás állandóan 91 dB legyen. A CD játszóba egy olyan lemezt helyeznek, amelyen csend van rögzítve. Lejátszásra kapcsolják, és ezután a hangsugárzóból egy teljes frekvenciatartományt átfogó kúszójelet sugároznak. A CD játszó kimenetét egy szintíróra vezetik, és az itt megjelenõ jelet figyelik.
Teljes joggal gondolhatjuk, hogy egy ilyen vizsgálatnak semmi értelme sincs. Hiszen a lézer pick-up nem érintkezik a lemezzel, az elektronikát pedig hiába rázza az ember. Ehhez képest a mérés felettébb érdekes eredményt mutatott.
Tény, hogy a CD játszók akusztikai visszahatása nagyságrend(ek)kel kisebb a hagyományos lemezjátszókénál, de van nekik. Ami még ettõl is érdekesebb, hogy karaktere éppen ellentéte azoknak. A bakelit lejátszóknál a rezonancia csúcsa a 20-50 Hz-es tartományba esik, innentõl folyamatosan esik, majd 200 Hz környékén beáll egy átlagos szintre. Ezzel szemben a CD játszók akusztikai visszahatásának jelleggörbéje 500 Hz-ig nagyjából egyenletes, majd innen néhány nagyobb csúcs után 7-8 dB/oktáv meredekséggel emelkedik, míg 10 kHz környékén beáll egy szintre. Ez a típusú jelleggörbe inkább a hagyományos lemezjátszók hangkarjában fellépõ strukturális rezgésekre (karrezonancia) hasonlít. Ez utóbbit úgy mérik az analóg lemezjátszóknál, hogy a hangkarra egy gyorsulásérzékelõt szerelnek, és ez után lejátszanak vele egy 20 Hz-20 kHz tartományú jelet tartalmazó lemezt. A CD játszókban erre persze nincs lehetõség.
Még érdekesebb az, hogy a fent említett tesztben három olcsó kategóriás CD játszót vizsgáltak meg, és közöttük az eltérés több nagyságrendnyi volt (nagy kommersz gyártók lemezjátszói között jó, ha néhány dB különbség adódik).
A tesztben akkoriban legjobban szereplõ CD játszó Philips volt, és a holland cég által gyártott lengõkaros mechanikát használta. A dolog pikantériáját az adja, hogy errõl a mechanika-rendszer gyártásáról mára a Philips is leállt. Oka egyszerû. Ma már a CD játszók-ban ugyanazokat a mechanikákat alkalmazzák, amelyeket a CD-ROM olvasókban. Ezeknél pedig a gyorsaság rendkívül fontos.
A mechanikák fejlesztési irányvonalai napjainkban
A kezdet kezdetén két alapvetõen eltérõ mechanikai rendszert alakítottak ki. Az egyiknél (a Sony által használt eljárás) a letapogatórendszer két vezetõsín mentén mozog, a mozgatásról pedig a szánmotor által hajtott csigahajtómû gondoskodik. A másik a Philips nevéhez fûzõdik, itt az optikát egy lengõ karra szerelték, melynek mozgatását mágneses úton tekercsekkel végzik.
Az újabb készülékekben már lineáris motort alkalmaznak a letapogató rendszer mozgatására. A lineáris motoros meghajtás fõ elõnye, hogy az elõtoláshoz lényegesen kevesebb súrlódási energiát kell legyõzni, mint a csigahajtómû esetén. Ezenkívül az egyes zeneszámok hozzáférési ideje is megrövidül (a tipikus hozzáférési idõ kisebb, mint egy mp.).A lineáris motor két mágnesrúdból és egy munkatekercsbõl áll. A munkatekercsen a szánszervó vezérlõárama folyik át. A kialakuló mágneses térben erõhatás jön létre, ami a szánt (és vele együtt a letapogató-rendszert) mozgatja. Ez teszi lehetõvé a CD-ROM olvasók nagyságrenddel nagyobb kiolvasási sebességeit. Ma 1998-ban a 24-32-szeres olvasók vannak a piacon, közülük azonban jó néhány olyan van, amely kiolvasási hibái miatt annyiszor kénytelen ismételni, hogy valójában egy kb. nyolcszoros se-bességû CD-ROM olvasó folyamatos sebességét produkálja. De van néhány, amely valóban képes hibamentesen a 24-szeres kiolvasási sebességre. Ha jobban belegondolunk, itt a kiolvasási frekvencia 4,32 MHz x 24=103,7 MHz.
Több audiofil gyártó használja ezeket a nagy sebességû mechanikákat arra, hogy nagyobb rendszerfrekvenciát alkalmazva többszörös sebességgel olvassák a lemezeket, és nagyobb kapacitású RAM-okat használva biztosítsák a jel jittermentességét, vagy többszörös olvasással próbálják meg kikü-szöbölni a kiolvasási hibákat.
Ezen az elven mûködnek a hordozható vagy autókban használt CD játszókban alkalmazott rázkódásvédõ áramkörök.
Van egy olyan újítás, amelyet azonban kizárólag az asztali CD játszók mechanikájaként hoztak piacra. Ez a Sony egy újabb rendszere, a rögzített lézerfejes mechanika, érdekes felépítésû konstrukció. A lényege az, hogy nem a lézerfejet mozgatják a lemez, hanem a CD-t a mechanikához rögzített lézerfej fölött. Ez látszólag fából vaskarika eljárás, mert miért lenne könnyebb egy lerögzített puska elõtt mozgatni a céltáblát, mint egy mozgó puskával követni egy rögzített célpontot? A Sony mérnökei szerint a mechanikák kiolvasási hibáiért a kis tömegek a felelõsek, elsõsorban a lézer optikáé, amelynek rezonanciája lényegesen magasabb tartományba esik, mint a nála nagyobb tömegû lemezé, és az azt forgató szerkezeté. Az állítást alátámasztja az az észrevétel, amelyet az akusztikai visszahatás vizsgálata közben tapasztaltak, hogy ez a CD játszóknál valóban a magasabb frekvenciákra esik. A rögzített lézerfejes mechanika elõnye, hogy a CD lemezt egy nagyobb súllyal le is lehet terhelni, és ez a lemezek vetemedettségébõl származó hibákat is kompenzálja. A dolog egyetlen hátránya a relatív lassú számelérés lett.
Nézzük meg alaposabban, hogyan épül fel a mechanika rendszer és a szorosan hozzá kapcsolódó szervóáramkörök.
A lézeres letapogatás
A CD lemezek letapogatására lézert alkalmaznak. Eredeti jelentése Light Amplification by Stimulated Emission of Radiation, azaz LASER, amit leginkább “gerjesztett fényerõsítésû sugárzásnak” lehetne fordítani. Nem akarok különösebben belemélyedni az optikai rendszer mûködésébe, különösen, hogy itt én magam sem tudnék többet mondani, mint ami a szakirodalomból kiollózható. A lényeg, hogy az eredeti CD szabvány elõírásai szerint a lemezek letapogatásához 780 nm hullámhosszúságú lézersugárra van szükség. Ez a sugárzás a nem látható, infravörös tartományba esik. A DVD szabványosításánál már rövidebb hullám-hosszú, 650 nm-es lézert használtak. A rövidebb hullámhosszú, több ezer óráig mûkö-dõképes lézerdiódák elõállítása elõfeltételei a nagyobb adatsûrûséggel rendelkezõ lemezek létrehozásának. Ezeknek a kifejlesztésén fáradoznak ma a gyártók.
A CD lemezek kiolvasására használt lézerek kimeneti teljesítménye kb. 1mW. En-nek precíz betartása rendkívül fontos. Ha ugyanis a lézersugár intenzitása lecsökken, akkor csökken a kiolvasás pontossága, ha a teljesítmény tartósan magasabb, rövidebb lesz az élettartama, szélsõségesen nagy teljesítmény esetén pedig a lézerdióda megy tönkre, de elõtte akár át is égetheti a lézerlemez tükrözõ rétegét.
Az információs sík letapogatásánál fontos szerepe van a CD lézer felöli oldalán található átlátszó (transzparens) mûanyag rétegnek. Ugyanis a lézerlemezre esõ fénysugár átmérõje még elég nagy, kb. 0,8 mm. Ennek köszönhetõ, hogy a felületi hibák nem teszik kiolvashatatlanná a lemezt. A mûanyag törésmutatóját úgy választják meg, hogy a lézersugár átmérõje a pitsávokhoz érve már csak 1,7 mm, tehát alkalmas azok letapoga-tására. Ez az átmérõ még mindig kb. háromszorosa a pitsáv szélességének, nagysága inkább a pitsávok egymástól való távolságának felel meg (1,6 mm). Érthetõ ezek után, hogy a transzparens réteg és az információs sík hibamentessége, fénytörésmutatójának egyenletessége mennyire fontos.
A lézerdiódát a fényt irányító, polarizáló, tükrözõ, felfogó elemekkel együtt egy egységbe szerelik. Ennek az egységnek szerves részét képezi a fókuszálást végzõ ún. kéttengelyû elem, amely tulajdonképpen a lézer fókuszálására szolgáló lencsét mozgatja. Ennek egyik tengelyre történõ elmozdulása a fókuszt szabályozza, a másik a pitsávon való haladást biztosítja. A CD lemez vetemedettségének következtében bekövetkezõ fókusztávolság változás dinamikus utánállítása rendkívül fontos, mert az információs síknál a lézer fókuszpontjának mélységélessége mindössze ± 4 mm. Ugyanilyen jelentõs az excentritásból eredõ sávkövetés-hiba kiküszöbölése. A lencse mozgató-rendszerének kialakítása állandó mágnesekbõl és tekercsekbõl áll, mûködési elvét tekintve részben egy hangszóró, részben egy motor mechanizmusára hasonlít. A tekercsek áramát két szervórendszer állítja elõ.
A szervórendszer szabályozását a visszavert fényt érzékelõ fotódiódák szabályozzák. Többfajta eljárás is elterjedt, a részletesebben érdeklõdõ olvasók figyelmébe ajánlanám ismét a szakirodalmat.
Szervórendszerek a CD lejátszókban
Ha a CD játszók komplett felépítését nézzük, összesen négy szervórendszert tartalmaznak. Ebbõl kettõ a fent már említett fókusz és sávkövetõ szervó, és további kettõ közül az elsõ lézeroptika mozgatását, a második a CD lemez forgási sebességét szabályozza.
A sávkövetõszervó szabályozási tartománya legfeljebb 15-20 sávnyi átfogást tesz lehetõvé a kéttengelyû elem számára. Ez a sávátfogás csak keskeny sávban biztosítja a sávutánállítást. A letapogató-egység durva utánállítását a szánszervó végzi.
Ez utóbbi nem különül el teljesen a sáv-követõszervó szabályozó áramkörtõl. A szánszervó azonban csak nagyobb léptékû szabályozásra képes, a nagy tömegû mechanikát nem könnyû finoman indítani és fékezni. Ez a durvább szabályozás a sávugrás funkció. A sávugrás funkció során a letapogató-rendszert spontán kell nagyobb távolságra vezetni. Ehhez a folyamatvezérlõ áramkör egy ún. kickimpulzust küld a szánszervó-áramkör bemenetére. A kickimpulzus polaritása az ugrás irányától függõen negatív vagy pozitív.
Míg a szállítómechanizmus mechanikai felépítésében jelentõs különbségek vannak (lásd feljebb), addig a szánszervó kapcsolástechnikai kialakításában alig mutatkoznak különbségek az egyes CD lemezjátszók között.
Sávugrás a CD lemezen
A CD lemezjátszók egyszerû kezelhetõségét többek között az egyes zeneszámokhoz való tetszõleges hozzáférés és a gyors elõre-hátraléptetés teszi lehetõvé. Ezeket a sajátosságokat a sávugrás funkció biztosítja. A sávugrás funkció a szán-, és a sávkövetõ-szervókkal valósítható meg.
A sávugrást általában az 1-es, 10-es, és 100-as ugrások valamilyen kombinációjaként állítják elõ. A “gyors elõre” és “gyors hátra” üzemmódokban kizárólag 1-es sáv-ugrásokat alkalmaznak. A sávugrás elõidézéséhez a folyamatvezérlõ áramkör kickimpulzust küld a sávkövetõ ill. a szánszervó áramkörre. Az ugrás fajtáját, irányát és a kickimpulzus idõtartamát a folyamatvezérlõ áramkör számítással határozza meg. Az ehhez szükséges információkat a CD betöltésekor beolvasott tartalomjegyzék (TOC) és a kezelõszerveken keresztül bevitt parancsok adják.
Lássuk most egy konkrét példán keresztül, hogy valamely zeneszám kiválasztásakor hogyan jön létre ugrásutasítás.
Az ugrás céljának a CD 3. zeneszámát választjuk. A beolvasott idõkód alapján a folyamatvezérlõ áramkör “tudja”, hogy a kiválasztott cím az 526-os sávon kezdõdik. Az ugrás ennek megfelelõen öt 100-as, két 10-es és hat 1-es kickimpulzusból tevõdik össze.
Az 1-es és 10-es ugrásokat a kickimpulzusok felhasználásával a sávkövetõ-szervó hozza létre. A 100-as ugrásokat ezzel szemben a szánszervó, ugyancsak a kickimpulzusokkal.
A kickimpulzusok elõállítása nem egyszerû feladat. Az idõben történõ lefékezéshez figyelembe kell venni a letapogató-rendszer és a kéttengelyû elem mozgási energiáját, valamint a szánhajtás súrlódási együtthatóját is. Emiatt a kickimpulzusok idõbeli lefolyását ugrási és fékezési szakaszra osztják. A kiválasztott sáv elérése elõtt a kickimpulzus polaritást vált, és megkezdõdik a fékezési szakasz. A sávból még hátralevõ útszakaszt a letapogató-rendszer, ill. a kéttengelyû elem saját mozgási energiájával teszi meg.
Az ugrási és fékezési szakasz idõtartama készülékspecifikus jellemzõ. A stabil ugrásfunkció biztosítása érdekében erre az idõre a sávkövetõ erõsítõ bemenetérõl minden esetben leválasztják a sávkövetõ hibafeszültséget. Az ugrásfunkció befejezése után a folyamatvezérlõ áramkör zárja a sávkövetõ szabályozókört, és a sávkövetõ finomszabályozó áramkör a kiválasztott sávra áll be.
A CD lemez fordulatszám-szabályozása
A lineáris letapogatási sebesség eléréséhez a CD fordulatszámát a letapogató-rendszer aktuális helyzetéhez illesztik. Ezt a mûveletet a diszkszervó végzi, amelyet éppen ezért “CLV-szervó”-nak is neveznek.
A diszkszervó sebességszabályzó és fázisszabályozó áramkörbõl áll. A sebességszabályozó áramkör úgy szabályozza a CD forgási sebességét, hogy a letapogatott információ adatáramlási sebessége mindig 4,32 MHz-es órajelnek feleljen meg.
A lineáris letapogatási sebesség finom-beállítását a fázisszabályozó áramkör végzi. Ugyancsak ez az áramkör biztosítja a CD-rõl leolvasott pitélek (a fõórajellel együtt) és a digitális jelfeldolgozás közötti merev fázis-kapcsolatot. Általánosan a diszkszervókban négy különbözõ üzemmód különböztethetõ meg:
1. A felfutási szakaszban indul meg a CD forgása. A diszkmotor egy kickimpulzus hatására gyorsan eléri a névleges fordulatszámot.
2. A durva szervószabályozás üzemmódban a sebességszabályozó áramkör a név-leges értéken tartja a diszk fordulatszámát. Akkor van erre szükség, ha valamilyen oknál fogva nem áll rendelkezésünkre a keret-szinkronjel.
3. Finom szervószabályozás esetén az adatáramból visszanyert keretszinkronjel szinkronizálja a forgást. Ez a normális lejátszási üzemmód.
4. A fékezési szakaszban történik a CD leállítása. A diszkmotort pontosan mérete-zett, fordított polaritású kickimpulzus fékezi, amíg meg nem áll.
A hangminõség szempontjából a 3. fázisszabályozási szakasznak van jelentõsége, nézzük meg ezt egy kicsit alaposabban.
Fázisszabályozás
Minden szabályozó áramkör úgy mûködik, hogy egy szabályozni kívánt mennyiséget összehasonlítanak egy referenciának választott mennyiséggel, és a különbségnek meg-felelõen a szabályozni kívánt mennyiséget a referenciamennyiséggel egyenlõvé próbálják tenni. Jelen esetben a CD lemezrõl kiolvasható pitstruktúra órajele a szabályozni kívánt mennyiség. Ezt a CD játszókban az ún. WFCK impulzus (Write Frame Clock, azaz írási keretfrekvencia) képviseli. A WFCK impulzust a CD-rõl keretenként beolvasott 24 szinkronizálóbit alapján állítják elõ. A keretismétlõdési frekvencia értéke a CD rendszerben 7350 Hz, tehát megfelelõ letapogatási sebesség esetén 136 ms-onként jelenik meg egy WFCK impulzus.
A fázisszabályozás referenciajelét a CD játszó kvarcoszcillátorából leosztott ún. RFCK (Read Frame Clock, azaz olvasási keretfrekvencia) adja. Ezen két jel szinkronicitását biztosítja a fázisszabályozó áramkör a CD lemez fordulatszámának szabályozásával.
Jittermentesítés
A lézeroptika jelét elõerõsítõre vezetik. Ennek kimenetén szinuszos nagyfrekvenciás jel, a szemábrajel jelenik meg. Azért nevezik így, mert ha a kapott adatjelet egy oszcilloszkóp függõleges (Y) bemenetére vezetjük, a regenerált órajellel pedig a vízszintes (X) bemenetet szinkronizáljuk, az oszcilloszkóp képernyõjén a legkülönbözõbb szint és fázishibájú impulzusok egymásra rajzolódva jelennek meg. A kapott oszcillogram egy nyitott szemre hasonlít. A “szem” nyílása az átvitel minõségének jellemzésére használható. A szemnyílás függõleges nagysága a jel amplitúdójától függ, a fázishibák a vízszintes kiterjedést határozzák meg. Ha az egymás utáni jelek egyetlen vonalként jelennének meg, akkor a kiolvasás hibátlan lenne. Ez azonban a gyakorlatban szinte sohasem valósul meg. (ábra )A digitális áramkörben való további jelfeldolgozáshoz a szemábrajelet úgy kell átalakítani, hogy négyszögjelekbõl álló EFM formátumú csatornakódolt jelnek feleljen meg. Általában egy folyamatosan változó szinuszjelbõl úgy hozhatunk létre impulzus (négyszög) jelet, ha az elõbbit egy Schmitt-triggerre vezetjük. A Schmitt-trigger a bejövõ jel hatására két szélsõérték között kapcsolgat, úgy hogy ha a növekvõ bemenõ jel nagysága elér egy bizonyos szintet, pozitív, ha a csökkenõ jel ugyanazt a szintet eléri, negatív szélsõértékre vált.
A kiolvasott szemábrajel azonban a CD lemez hibáinak következtében gyakori szint-ingadozásokat tartalmaz, melyek eltolják a jel középértékét. (ábra) Az impulzusformáláshoz tehát nem elegendõ a jelet Schmitt-triggerre vezetni, mert annak állandó kapcsolási referenciaszintje a kiolvasott jelet meghamisítaná. Ehelyett egy olyan triggert alkalmaznak, amely a szinuszjel középértékének ingadozását figyelembe véve a kapcsolási szintet folyamatosan utánszabályozza. Az így visszaállított jel elvben már megfelel a vágólézert szabályzó EFM jelnek. Ebbõl az EFM jelbõl elõször is regenerálják az órajelet. Ezután demodulálják a jelet, és visszaállítják az eredeti bitstruktúrát. Ezek után jitterkorrekciót végeznek.
A digitális szakaszban végzett mûveletek közül talán a jitterkorrekció van a legna-gyobb kihatással a hangminõségre. Ugyanis az EFM jel jitterhibája a hallható tartományban futásidõ ingadozást hoz létre. A futásidõ ingadozások megváltoztatják a jel fázisviszonyait, anélkül, hogy a frekvenciamenetben észrevehetõ hatása lenne. Napjainkban egy-re inkább elõtérbe kerül a jitterhiba kiküszö-bölése. Egyre több cég hoz forgalomba ún. jitter-killer-t, amely az órajelek hibáját küszöböli ki. A nyugati hifi magazinok mérései a jetterhibára is kitérnek. Kiküszöbölése érdekében építenek be különbözõ speciális órajeladókat. Ezeknél általában nagyobb pontosságú kvarckristály építenek be, és a jeladó oszcillátort külön stabilizált tápfeszültségrõl járatják. A kvarcoszcillátorok frekvenciájának stabilitása ugyanis általában a tápellátás egyenletességétõl függ. Ezért lehet például eredményes az analóg kimeneti szekció akkumulátorról történõ táplálása.
A jitterhiba kiküszöbölésére egy átmeneti RAM tárolót használnak, amelybõl az adatokat kvarcstabilitású fõórajel ütemében végzik. A korrigálható maximális idõzítési hibát a RAM kapacitása határozza meg. A CD lemezjátszókban e célra alkalmazott RAM kapacitását úgy választják meg, hogy többnyire ± 4 jitteres keret legyen korrigálható.
Hibajavítás a kiolvasott jelben
Ezután következik a hibajavítási és hiba-kompenzálási funkció. Ezeket a bonyolult elektronikákat általában egyetlen integrált áramkör formájában készítik el, mûködé-sének részletezése ennek következtében nem túlságosan lényeges. A hibakompenzálásra akkor van szükség, ha a jel hibáit a deinterleaving eljárás során nem lehet javítani. Ilyenkor több lehetõség van a korrekcióra. A legegyszerûbb esetben az elõzõ kódszót használják fel a hiányzó információ pótlására. Ezt az eljárást a “previous word hold” (elõzõ szó tartása) eljárásnak nevezik. Amennyiben az elõzõ adatszó is hibás, interpolációs eljárással - összekapcsolva az interleaving eljárással - nagyobb adatkiesés is kompenzálható. Amennyiben a hibát az interpolációval nem lehet elfedni, a hibajavító áramkör jelzést ad a folyamatvezérlõ áramkör számára, ami letiltja a hangfrekvenciás kimenetet - azaz némít.
A hibajavítás stratégiája a hibajavító áramkör hardver-, és szoftverráfordításától függ. Ebben a tekintetben jelentõs különbség van a különbözõ típusú CD játszók között. Az egyszerûbb készülékek dekódolójában 4 fajta hiba korrigálására képesek. A komplex hibajavító áramkörök ezzel szemben olyan kialakításúak, hogy 60 különbözõ stratégiával képesek hibajavítást végezni.
A hibajavító áramkörökben a legújabb VLSI áramkörökkel felépített gyors mikroprocesszorokat alkalmazzák. A gyakorlatban tehát nincs lehetõség arra, hogy a jelfeldolgozási folyamatba méréstechnikai módszerekkel beavatkozzunk. A legtöbb készü-léknek azonban van olyan mérõpontja, amelyen az ún. “error flag bit”-ek szintje mérhetõ. Ezek a bitek arról tájékoztatnak, hogy van-e hiba, és hogy a hiba javítható-e vagy sem. A hibajavító áramkörök tesztelésére a nagyobb gyártók speciális mérõlemezeket bocsátanak forgalomba, amelyek a CD lemezeken elõforduló leggyakoribb hibákat preparálják, ezek lehetnek: “ujjlenyomat”, “karcolás”, vagy “szennyezõdés”. A karcolásokból megkülönböztetnek kereszt-, és su-gárirányú karcolásokat, amelyekbõl az utóbbiak általában komolyabb gondot okoznak.
A hibajavító kimenetén jelenik meg - az adott kapcsolástechnikától függõen soros vagy párhuzamos jel formájában - a D/A átalakító által már kiértékelhetõ PCM jel. Ez a PCM jel összekeverve tartalmazza a jobb és bal oldal csatornáinak jelét. A D/A átalakító feladata, hogy a PCM jelbõl ismét PAM jelet képezzen. Ezek a PAM impulzusok a D/A kimenetén 22,7 ms-onként jelennek meg. Az átalakítási folyamat hibái miatt átalakító kimenõjele “glitche”-vel terhelt. (ábra)
A glitche a tranziens jelek felfutó éleinél létrejövõ zavarcsúcsokat jelöli. Ennek megszüntetésérõl egy glitchementesítõ áramkör gondoskodik, amely a PAM jelbõl 44,1 kHz frekvenciával ismét mintát vesz. Ezeknek a mintáknak a hossza valamivel rövidebb, mint az eredeti A/D átalakításé. A PCM jel PAM jellé történõ átalakítása közben ismét járulékos zavaróspektrum jön létre az alapsáv fölött. Annak érdekében, hogy ez a spektrum a további erõsítõfokozatban ne hozzon létre nemkívánatos keveréktermékeket, a felharmonikusokat egy aluláteresztõ szûrõvel leválasztják.
A CD játszók kimeneti szûrõje
Arról már beszéltünk, hogy a digitális átalakítás során a mintavételi frekvenciára “tükrözve” az eredeti jel spektrumának tükörképei is megjelennek. (10. ábra) Ha az eredeti jel a 20 Hz-20kHz tartományban oszlik el, akkor a 44100 Hz-es frekvenciára tükrözve megjelenik ugyanez a tartomány, tehát a 20 kHz-es jel spektrális tükörképe 24100 Hz-nél fog megjelenni. Ha ezeket az összetevõket nem távolítjuk el maradéktalanul a hasznos jel fölül, akkor azok a mintavételi frekvenciával különbségi jelet képezve megjelennek a hallható tartományban és ún. “aliasing” torzítást okoznak. Ennek kiküszöbölésére a digitális technika õskorában analóg szûrõket használtak. Sajnos az a tartomány, amelyben a szûrõnek a digitális rendszerben biztosított 90 dB tartományt le kell vágnia, mindössze 4 kHz, szigorúan véve a határfrekvenciának (20000 Hz) mindössze egy ötöde, vagyis mindössze körülbelül egy terc. Sajnálatos módon nem csak az követelmény, hogy a csillapítás rendkívül meredek legyen, hanem az is, hogy a szûrõ hatását ne éreztesse a hallható tartományban. A szûrõ hatása kétféleképpen nyilvánulhat meg. Az egyik hogy bár a frekvenciamenet -3 dB-es pontja 20 kHz, de a frekvenciamenet lényegesen korábban, akár egy-két oktávval lejjebb már esni kezd. Ezt a problémát olyan többedfokú szûrõk használatával lehet kiküszöbölni, melyek együtthatóit ebbõl a szempontból optimalizáltak. Tipikusan ilyenek a Csebisev szûrõk. A másik gond, hogy az ilyen nagy meredekségû szûrõk a magas frekvenciás fázismenetet, és ezzel a térhatást elrontják. (ábra)
Cikkem írása közben elõszedtem egy 1983-ban megjelentetett cikket a Hifi Magazinból. Ebben egy elsõ generációs, digitális, VHS szalagra dolgozó magnót teszteltek. Fázismenete mindössze néhány kHz-ig lineáris, innentõl a 20 kHz-es határfrekvenciáig fázisforgatása 360 fok. Ráadásul a szûrõ nyilván nem lehetett még benne tökéletes, mert a különbségi hang mérése közben a mintavételi frekvenciával együtt volt hogy 17 %-nál nagyobb torzítási összetevõk is megjelentek a magas frekvenciás tartományban. Ezek után szinte hihetetlennek tûnik, hogy analóg lemezjátszóról felvételt készítve vaktesztben is hosszas kapcsolgatás után tudtak csak különbséget tenni az eredeti és a digitális másolat között, és a térhatás várt romlása nem igazán következett be.
A túlmintavételezés
A nyolcvanas évek közepén a Philips cég vezetett be egy olyan eljárást, amely a bonyolult analóg szûrõk alkalmazását feleslegessé tette. Ezen fejlesztés elsõdleges célja eredetileg azonban nem ez volt. A CD lemez kifejlesztésben résztvevõ Sony és a többi japán gyártó akkoriban már rendelkezett 16 bites D/A átalakítóval. Ezek valóban produkálták a tõlük elvárható 96 dB-es dinamikát és jel-zaj arányt. A Philips cég azonban csak 14 bites processzorok gyártását tudta nagy szériában megvalósítani. Ezek azonban 12 dB-lel kevesebb, azaz 84 dB-es dinamikatartománnyal rendelkeztek. Ez marketingpolitikai szempontokból megengedhetetlen volt. Létre kellett hozni egy olyan eljárást, amely kipótolja a hiányzó két bitet. Erre alkalmas a többszörös mintavételezési eljárás. (ábra)
A bevezetõben említett kvantálás, vagy kerekítés hozza létre a digitális rendszerekben a zajt, ilyenkor ugyanis az eredeti jeltõl eltérõ véletlenszerûen változó hibafeszültség jön létre, melynek spektruma egybeesik a bemenõ jelével. Ha megnöveljük a mintavételezési frekvenciát, akkor ennek a zajnak a spektruma szélesebb lesz, de mivel a zaj mennyisége konstans, ezért a hallható tartományba kevesebb esik belõle. A Philips elsõ generációs készülékeiben négyszeres túlmintavételezést használtak. Ilyenkor a CD lemezre eredetileg rögzített minden egyes diszkrét minta közé további három mintát számolnak ki. Az eredeti analóg jel ismeretének hiányában természetesen nem tudjuk megállapítani, hogy ezeknek az új mintáknak mi lenne a pontos értéke, de a meglévõ mintákat felhasználva interpolációval elõállíthatjuk az új minták becsült értékét. Ha a mintavételezés kétszeres lenne, akkor a köztes mintát egyszerû átlagolással lehetne számolni. Négyszeres mintavételezés esetén geometriai szerkesztéssel lehet megállapítani az új minták nagyságát. Ilyenkor két szomszédos mintát egy képzeletbeli egyenessel össze-kötünk, és megnézzük, hogy ezt az egyenes az új mintavételi idõpontokban mekkora értéket jelöl. Ez az úgynevezett lineáris interpoláció. Természetesen az így kapott jel nem valami pontosan becsüli fel az eredeti jelalakot, hiszen az biztosan nem egyenes szakaszokból állt. Pontosabb becslést akkor kaphatunk, ha nem lineáris, hanem magasabb fokú hatványgörbével közelítjük az eredeti görbét. A magasabb fokú polinommal való számolás lényegesen bonyolultabb, mert távolabbi minták nagyságát is figyelembe veszi. Az elsõ fokú interpoláció két, a másodfokú három, a harmadfokú négy minta értékét veszi figyelembe.
Az interpolációnak van még egy hatalmas elõnye. Az interpolációs polinomok nem csak az amplitúdók (minták) nagyságára tartalmazhatnak elõírásokat, hanem a futási idõ karakterisztikára is. Ebben az esetben az interpoláló olyan digitális aluláteresztõ szûrõként mûködik, amely mentes az analóg szûrõk futásidõ-hibáitól.
Két legyet ütöttünk tehát egy csapásra - csökkentettük a zajt, és ráadásul digitális szûrõ kialakításával megszabadultunk az analóg szûrõk gyakorlati megvalósításának problémájától.
A dolog szép is lenne, ha nem lenne egy további probléma. A digitális szûrõk összeadásokat és szorzásokat végeznek. Ezek a mûveletek az együtthatók hosszúságával megnövelik az eredeti jelek hosszúságát. A példánkban szereplõ Philips eljárásnál a digitális szûrõ 16 bites bemeneti jelét egy 12 bites együtthatóval kell kiegészíteni, így a szóhossz 28 bitre nõ. Az ezzel végzett mûveletek által jelentett további növekedést kerekítéssel levágják, ez megint csak megnöveli a zajt. Ennek eltávolítására a zajspektrum átalakítást használják. Ennek lényege, hogy a bemeneti szûrõben a 14 bites kimeneti jel csonkolásakor keletkezett maradékot az azt követõ mintából kivonják. Ez az eljárás további 7 dB-lel csökkentette a 14 bites jel zajspektrumát, így a CD játszó kimeneti jele mért adatokra már megegyezett a 16 bites nem túlmintavételezõ átalakítókéval.
Mivel, mint már említettük, a túlmintavételezés tulajdonképpen olyan digitális szûrõként mûködik, amelynek nincs futásidõ hibája, és amely eltávolítja a felsõ határfrekvencia és a megnövekedett mintavételi frekvencia közti jelcsomagokat, ezért további elõny, hogy a kimeneti jel szûrésére már harmadfokú aktív szûrõ is megfelel, melynek határfrekvenciáját elegendõ 30 kHz kör-nyékére választani.
A 14 bites konverterek elõállítása olcsóbb volt, így a Philips például egy tokba integrált két jelátalakítót használt. A távol keleti gyártók ezzel szemben már a kezdetben elegendõen gyors (és drága) átalakítót tudtak gyártani ahhoz, hogy egyetlen D/A konvertert használjanak mindkét csatorna jelének átalakítására. A probléma azonban ilyenkor az, hogy a két jel átalakítása egymáshoz képest a mintavételi periódussal eltolódva történik, tehát 20 kHz-es frekvencián a fázisforgatás az egyik csatornán 90 fokra nõ. Ennek, és az alkalmazott analóg szûrõk hibáinak ellensúlyozására a japán gyártók késõbb a dekóder és a D/A átalakító között egy digitális futásidõ korrektort helyeztek el. Ezt szintén kombinálni lehetett a zajspektrum átalakítással. Így a mûszaki paraméterek, és a hang szépen lassan tovább javult.
Az interpolációs eljárásnak megvan az az elõnye, hogy a digitális szûrõ kimenetén a csonkolást úgy is el lehet végezni, hogy a kapott jel nagyobb felbontású legyen, mint az eredeti. Tehát minden további nélkül hozzájuthatunk 18, 20 vagy akár 24 bites hangmintákhoz is, azzal a kegyes csalással, hogy a kisebb lépcsõk mintái nem valóságosak, hanem számítással állnak elõ. Ahhoz azonban, hogy a hangminõség és a mûszaki adatok javuljanak, arra is szükség van, hogy az átalakítók precizitása is nõjön. Hiba lenne azonban azt gondolni, hogy attól, hogy a jel továbbítása és tárolása digitálisan történik, attól a különbözõ D/A konverterek is egyformák. A sokbites jelátalakítók jóságát az határozza meg, hogy a konvertálásnál alkalmazott ellenállások és félvezetõk milyen tûréssel készülnek el. Egy 16 bites átalakítónál ki kell várni, amíg a villamos kiegyenlítõdési folyamatok 1/65536-nyi, azaz 0,00152 % pontossággal be nem állnak. Az alkatrészek tûrésének tehát ettõl egy nagyságrendnyivel jobbnak kell lennie. Ilyen szempontból érthetõvé válik, hogyan lehetséges, hogy amikor a Philips elsõ 16 bites konverterei piacra jöttek, mindenki egyértelmûen kijelentette, hogy a régebbi 14 bites átalakítók jobban szóltak. A további generációk hangja azután már javult.
A hangminõség javulása azonban nem csak a felbontás növelésével érhetõ el.
A D/A konverterek olcsóbbodásával “igényes konstrukciókban” az alkalmazott konverterek számát is növelték. Lehet használni négy párhuzamos konvertert, amikor is két-két konverter szimmetrikus jelet állított elõ. A jelátalakítóban a tápfeszültség ingadozásának hatására létrejövõ hibák ilyenkor közös módusú jelként jönnek létre, így aszimmetrizálás után azok kioltódnak. De még ez sem minden. Vannak olyan gyártók, akik nyolc D/A konvertert használnak. Ilyenkor az elõbbi eljárást még azzal kombinálják, hogy egy konverter a jelalaknak csak egy-egy félperiódusát dolgozza fel.
Különösen a nyolcvanas évek végén terjedt el az a megoldás, hogy a CD játszókhoz külsõ D/A konvertereket ajánlottak. Ezeknek azért volt nagy jelentõsége, mert a jelátalakítók piacán a gyártócégek átlagosan 3 évenként dobtak piacra egy-egy újabb típust, és ezek jóval olcsóbbak voltak egy jól kivitelezett mechanikával rendelkezõ futómûnél. Érdekes, hogy napjainkban a külsõ jelátalakítók szinte teljesen eltûntek. Ennek oka valószínûleg az, hogy napjainkban, a futómûvek hangminõségében nagyobb szórás tapasztalható, mint a jelátalakítókéban, ez elõbbiek viszont sokkal drágábbak, tehát nem érdemes csereberélni õket. Ráadásul itt felmerül a kábelezés problémája is. A berendezéseket összekötõ digitális kábelek ugyanis ugyanúgy éreztetik hatásukat a hangminõségre, mint az analóg szakaszban, sõt az sem mindegy, hogy optikai, vagy koaxiális kábelezést használunk (az általános tapasztalatok szerint az utóbbiak jobban beválnak).
A kevésbites átalakítók
A sokbites D/A konverterek felbontásának növelésének tehát határt szab a mindenkori alkatrésztechnika elérhetõ pontossága. Tehát a konverterek felbontását nem érdemes minden határon túl növelni. Akkor milyen eljárással lehet fokozni a már meglévõ digitális jel pontosságát? Képzeljünk el egy olyan átalakítót, amelynél a túlmintavételezés nagyságát növeljük. A 14 bites átalakítókról leírtakból tudhatjuk, hogy ha növeljük a mintavételezést, csökkenteni lehet a digitális átalakító felbontását. Képzeljük el, hogy a túlmintavételezési frekvenciát olyan nagyra választjuk, amikor már 1 bites átalakítók is elegendõek. Ilyen egybites átalakítókat már korábban is használtak az ún. különbségi pulzuskód modulációban (DPCM: Differential Pulse Code Modulation). Ebben nem a jel nagyágának pillanatnyi értékét, hanem annak változását kódolják. Ha emelkedik a jel, akkor 1, ha csökken, akkor 0 a kód. Ez az egyszerû DPCM akkor lenne egyenértékû a lineáris PCM-mel, ha a mintavételi frekvenciát 216xFm=65536x44100=2890 MHz-re választanánk. Ilyen nagy frekvencián mûködõ áramkör létrehozása nagy nehézségekbe ütközik, de mint a továbbiakban ki fog derülni, megfelelõ eljárással még alacsonyabb mintavételi frekvenciával rendelkezõ 1 bites átalakítók is jobb eredményt képesek szolgáltatni, mint a sokbites rendszerek.
A megnövekedett túlmintavételezés a rendszer zaját nagymértékben csökkenti, de a kis felbontású átalakító elõtti kerekítés igen durva hibát, zajt, torzítást vinne a jelbe, ezért zajspektrum-átalakítással építik egybe. Ennek lényege a következõ:
Építsünk be az átviteli szakaszba a kerekítõ (kvantáló) áramkör elé egy integrátort. Ennek erõsítése kis frekvencián több ezerszeres, nagy frekvenciák felé monoton 6 dB/oktávval csökken. Tulajdonképpen úgy viselkedik, mint egy mûveleti erõsítõ nyílt hurokban, amelynek elsõ töréspontját rendkívül alacsonyra választották. Ez az elsõfokú integrátor. Az eljárás hatásosságát növelhetjük, ha másod-, harmad-, stb. fokú integrátorokat használunk. Mi lesz a jellel egy ilyen erõsen esõ karakterisztikájú erõsítõben? Önmagában természetesen nagy hibát okozna, de a jelet a kerekítõ kimenetérõl visszacsatoljuk az integrátor bemenetére. A visszacsatolás a kimeneti jelet teljes egészében visszavezeti a bemenetre. Ez tehát egy rendkívül erõs visszacsatolás. Az ilyen visszacsatolt erõsítõben az eredõ erõsítést a visszacsatolási tényezõ reciproka határozza meg. Minthogy a visszacsatolás egységnyi, az eredõ erõsítés is egységnyi lesz, vagyis független az integrátor frekvenciafüggõ erõsítésétõl.
Mi a helyzet a zajjellel és a torzítással? A zaj és a torzítás forrása a kvantáló, amely magában a hurokban helyezkedik el. A hibajelre nézve az erõsítést szintén az erõsítés reciproka határozza meg, amely nagyságára nézve az kisfrekvencián ezreléknyi, és csak a hallható tartományon kívül közelíti meg az egyet. Ezért az áramkör az eredetinek töredékére csökkenti a kerekítéssel okozott zajt a fülünk szempontjából érzékeny frekvencia-tartományban.
Van még egy módszer a felbontás javítására, ez pedig a zajmoduláció. A digitális jelátvitelben a kvantálás a kis jelek szintjén durva hibát képez. Ezeket a lépcsõket a kimeneti simító szûrõ ugyan kisimítja, de a torzítás így is megmarad. A torzítás csökkentésére egy nagyjából az elemi lépcsõ méretének megfelelõ zajjelet adnak a hasznos jelhez. Ez ugyan rontja a jel/zaj viszonyt, de véletlenszerû pillanatértékével sûrûbb lép-csõváltozásokat eredményez, így a jel torzítása gyakorlatilag megszûnik. Természetesen ízlés kérdése, hogy kit mi zavar jobban, a torz jelátvitel, vagy az árnyalatnyival magasabb zaj. A gyakorlatban a környezet zaja miatt ez utóbbi kevésbé zavaró. Túlmintavételezõ rendszerekben a moduláló zajjelet úgy is meg lehet választani, hogy az ne tartalmazzon összetevõket a hasznos frekvenciasávban. Ultrahangú zajjellel tehát úgy szüntethetjük meg a digitális jel lépcsõzöttségét, hogy ennek ne legyen hallással érzékelhetõ, hátrányos következménye. Arról ne feledkezzünk meg, hogy ezek az eljárások nem csökkentik az eleve a jellel érkezõ zajt és torzítást.
A Technics MASH
rendszerû átalakítója
A Technics cég MASH fantázianevû D/A átalakítójának neve a Multi-StAge noise Shaping = többfokozatú zajformálás névre hallgat. Az áramkör 44,1 kHz, 16 bit felbontású jelet fogad. Az átalakító bemenetén két fokozatból összeállított négyszeres túlminta-vételezõ szûrõt találunk. Ennek kimenetén 176,4 kHz mintavételi frekvenciájú, 18 bites jel jelenik meg, s azt egy összetett, két fokozatból álló zajspektrum-átalakító dolgozza fel. Az elsõrendû integrátort tartalmazó spektrum-átalakító a 18 bites, azaz 262 144 lépcsõt képezõ jelet további 8 szoros túlmintavételezéssel hétlépcsõs kimenõjellé alakítja át. A kvantálási hibajelet (amely a kis amplitúdójú jeleket szimbolizálja) egy másodrendû (tehát két integrátort tartalmazó) spektrum-átalakítóba vezetik, amely ötlépcsõs kimeneti jelet állít elõ. Ez differenciálás után a hét lépcsõhöz hozzáadva egy összesen 11 lép-csõs kimeneti jelet eredmé-nyez, melynek mintavételi frekvenciája 32x44100=1,412 MHz. A kiadott minta 11 lépcsõje szélességmodulált impulzusként (Pulse Width Modulation) jelenik meg a kimeneten.
Hogyan lesz a hét meg öt lépcsõbõl tizenegy? Ennek magyarázata egyszerû. A lép-csõk egy középértékhez képest képzõdnek, tehát az öt lépcsõ -2, -1, 0, +1, +2 számértékeket jelent, a hét pedig a -3 - +3-as tartományt öleli fel. A tizenegy lépcsõ log(11)= 3,3 bit felbontásnak felel meg.
A MASH konverterekben tehát a kimeneti impulzusok szélességét változtatják. A modulátor egy olvasható memória (ROM) mely a különbözõ szélességû impulzusok létrehozásához szükséges bitsorozatokat tartalmazza. A zajformáló szûrõk összegjele a ROM rekeszeit címzi, aminek hatására a ROM soros adatkimenetén egymás után megjelennek az eredeti analóg jelnek megfelelõ különbözõ szélességû impulzusok. Ha az impulzussorozatot egy ellenállásból és kondenzátorból álló aluláteresztõ (RC) tagra vezetik, akkor a pozitív feszültségû impulzusok növelik a kondenzátor értékét, a negatív értéknek megfelelõ impulzusok közötti szünetek pedig csökkentik a kondenzátor feszültségét. A konverter tehát maga a kimeneti integrátor.
Philips “BitStream”
A belsõ felbontás tekintetében még ennél is szélsõségesebb átalakítóval jelentkezett a Philips 1987-ben. BitStream fantázianévre keresztelt átalakítója mindössze 1 bites volt Ezt az áramkört eredetileg az analóg-digitális átalakítás számára találták fel (még 1962-ben), de tisztán digitálisan is könnyen megvalósítható.
A BitStream átalakító felépítése a következõ. A jelet elõször négyszeresen, majd ezután még hatvannégyszeresen mintavételezik, ennek eredményeképpen egy 11,2896 MHz-es 17 bites jelsor áll elõ. A második túlmintavételezés után digitális zajmodulációt adnak a jelhez, ezzel a visszacsatolt lépcsõfüggvény okozta begerjedési hajlamot szüntetik meg. A másodrendû zajspektrum-átalakítóval megvalósított delta-szigma modulátor állítja elõ az egybites, ellenfázisú kimeneti jelet. Ez utóbbin azt kell érteni, hogy az 1-es jelnél pozitív, a 0-ás jelnél azonos abszolút értékû, de negatív feszültséget ad ki az átalakító. Így lényegében egy impulzussûrûség-modulált jelet kapunk. Ez a kapcsolás tehát pulzussûrûség modulátornak is tekinthetõ (PDM: Pulse Density Modulation)
Ma már többen gyártanak 1 bites jelátalakítókat, szélsõségesebb adatokkal, mint a Philips elsõ generációs “BitStream” konvertere volt. Például a Sony saját szintén delta-szigma modulációs eljárással dolgozó egybites konvertere 45 bites belsõ szóhosszúsággal és 45 MHz-es órajellel dolgozik.
Az egybites konvertereket is kíváncsian tesztelte a szaksajtó. Az elsõ generációs BitStream konverterrõl megállapították, hogy lesz még mit dolgozni rajta: bár az apró részleteket és a térakusztikát nagyon szépen hozta, a multibites konverterek sokkal elevenebbek, dinamikusabbak voltak. Ez a különbség az én tapasztalataim szerint mind a mai napig megmaradt. Az egybites jelátalakítók bár sokat javultak, dinamikában, lendületességben, a jobb minõségû sokbites konvertereket nem érik el. Sokaknak ettõl függetlenül jobban tetszik lágyabb, talán hallgathatóbb karakterük.
Hogyan tovább?
A fenti kérdés a jövõbeli audio CD formátumra utal. Az 1980-ban bevezetett (jelenlegi) CD lemezek tárolókapacitása 650 Mbyte. Az 1995-ben véglegesített DVD (Digital Versatile Disc, azaz sokoldalú digitális lemez) tárolókapacitása ezzel szemben már 4,7 Gbyte, tehát a korábbinak körülbelül hétszerese, adatátviteli sebessége is lényegesen nagyobb. Lehetõség támadt hát egy új szabvány létrehozására, ennek lehetünk tanúi napjainkban. Több lehetõség is fennáll. Szó van arról, hogy a DVD-Audio 96kHz - 24 bites formátumát vezessék be, esetleg ettõl többet, vagy kevesebbet (akár felbontásban, akár mintavételezésben), de az is lehetséges, hogy ismét a két nagy multinacionális cég, a Sony-Philips ajánlása a Super Audio CD fut be.
A DVD-Audio egy olyan lemezformátum, amely a DVD-nél elfogadott formátumot használják ugyanolyan lineáris PCM jelfeldolgozással, mint korábban a CD lemeznél, csak lényegesen jobb felbontással. Bár a DVD lemez is 1,2 mm vastag, de az információs réteg a lézersugár beesési pontjától 0,6 mm-re van. Ez a kisebb hullámhosszú lézerdiódák alkalmazása miatt van így. A kétrétegû lemezeknél a második réteg 1,2 mm-re van, de ilyenkor át kell állítani a lézersugár fókusztávolságát. Egy igen jó minõségû, tömörítetlen audio lemez céljára az egyré-tegû DVD tárolókapacitása is elegendõ lenne. Természetesen felmerül annak lehetõ-sége is, hogy valamilyen több csatornás audio rendszer lehetõségét is megteremtsék.
A Super Audio CD ugyanazon két multinacionális cégtõl származik, akik annak idején a mostani CD lemezeket is szabványo-sították: a Sonytól és a Philipstõl. A Super Audio CD kétrétegû. A lemez középvonalában - 0,6 mm-re - lévõ síkra helyeznék el a nagyobb felbontású anyagot, az 1,2 mm-re lévõ réteg pedig normál CD-ként teszi használhatóvá, ugyanis a középsõ réteg a hosszabb hullámhosszúságú lézer számára átlátszó. Ezzel megoldanák azt a problémát, hogy a frissen megjelenõ lemezeket nem kell külön CD-ként és Super Audio CD-ként is piacra dobni, mert az utóbbit lejátsszák a régebbi (mostani) lejátszók is.
A Super Audio CD középsõ rétegére nem sokbites PCM, hanem 1 bites átalakítóval létrehozott jelet visznek fel. Ezen eljárás alapját a DSD (Direct Stream Digital, azaz közvetlen digitális adatfolyam) technológia jelenti. Ennek a technológiának az alapja sem új. Amikor a Philips elsõ BitStream konverterét bemutatta, létrehozták az egybites Delta-Szigma átalakítóknak egy stúdiókban használható analóg-digitális átalakító változatát is, amellyel mind a mai napig készítenek felvételeket, és amelyekrõl már akkoriban hangsúlyozták, hogy a normál CD játszók egy bites konverterei az így készült felvételekkel tudnák igazán azt a minõséget biztosítani, amelyre képesek. A DSD technológia egy olyan egybites átalakító, amely 64-szeres túlmintavételezéssel dolgozik (2,8224 MHz), de van egy 128-szoros és egy 32 szeres túlmintavételezõ verziója is (5,6448 ill. 1,4112 MHz). A DSD frekvencia átviteli tartománya 0-100 kHz. Ennek alapján egy olyan sokbites rendszer-nek felel meg, amelynek mintavételi frek-venciája 200 kHz. Természetesen ezekben a rendszerekben is alkalmazzák a zajmodulációt és a zajspektrum-átalakítást, ennek következtében a rendszer 120 dB jel-zaj arányt és dinamikatartományt biztosít a 0-20 kHz-es frekvencia tartományban (kivéve a 32-szeres túlmintavételezõ verziót). Ez sokbites rendszerre átszámolva 20 bit felbontást jelent. Az eljárás nagy elõnye, hogy nincs szükség olyan mértékben a bemenõ jel frekvenciájának határolására, mint a sokbites rendszereknél.
A Super Audio CD mellett szól az, hogy a jelenleg forgalomban lévõ CD játszók nagy részében a gyártók amúgy is egybites átalakítókat használnak. Ha a rögzítési formátum nem sokbites, akkor meg lehet takarítani az egybites jelbõl sokbitesbe - és vissza - való alakítás sokszor bonyolult és a hangminõségre is kiható folyamatát.
Természetesen ezeket a dolgokat a piaci viszonyok fogják eldönteni, de azt nyugodtan kijelenthetjük, hogy a digitális hangtechnika visszatarthatatlanul tör elõre, és minõsége is egyre jobb lesz.
Komáromi Zsombor
Ezúton is köszönet a Sony Hungáriának a techni-kai információk, és segédanyagok biztosításáért.