3. Ellenőrző kérdések:
Hol található a CCRMA?
Ki találta föl az FM szintézist?
Mi volt az első hangszintézis céljára készített célszámítógép neve?
Ki volt az IRCAM első vezetője?
Mi a Max?
13. fejezet - A számítógép hatása az elektronikus zenei gyakorlatra I. – Digitális szintézistechnikák és kompozíciók
Bár számítógép alatt ma általában olyan szerkezetet értenek, amelynek a képernyő és a billentyűzet a legszembetűnőbb alkatrészei, a voltaképpeni számítógépnek ezek nem lényegi tartozékai. A szűk értelemben vett számítógép csupán olyan elektronikai egységekből áll, melyek semmi másra nem képesek, mint arra, hogy számokkal különböző matematikai műveleteket végezzenek. E készülék sokoldalú felhasználhatósága abban rejlik, hogy a fizikai világ sok különböző jelenségét le lehet képezni számsorok formájában – így a hanghullámokat alkotó apró légnyomás-ingadozásokat is.
Számsorokká alakított, azaz digitalizált formában egyfelől könnyebben és gyorsabban végezhetőek el a hangokkal azok a műveletek, amelyekre az analóg stúdióberendezések is képesek, másfelől a hangátalakítás és -generálás olyan lehetőségei is feltárulnak, amelyek számítógép nélkül elképzelhetetlenek volnának.
1. Szintézistechnikák
1.1. Az additív szintézis
A számítógép alkalmazása a hangszintézis terén is új lehetőségek megjelenésével járt. Bár az összetett hangokat szinuszhangokból felépítő additív szintézis zenei alkalmazása már a telharmonium óta ismert volt, az új technika azonban lehetővé tette a szinusz-részhangok arányainak gyors, pontosan időzített és tökéletesen összehangolt változtatásait is. Ezzel a lehetőséggel kísérletezve talált rá Jean-Claude Risset a 11. fejezetben már bemutatott, harangra emlékeztető hangokra, melyekben az összetevőket néha elkülönült hangmagasságként, néha pedig egyetlen összetett hangszín-egész részeként érzékeljük – attól függően, hogy erősségük hogyan változik a többi összetevő erősség-ingadozásaihoz képest.
1.2. Szubtraktív szintézis
A nagy pontosságú digitális szűrők segítségével az additív szintézis inverzét, a szubtraktív szintézist is eredményesen lehet alkalmazni az elektroakusztikus zene céljaira. Ennek esetében nem a minimumból, a lehető legelemibb építőkövet jelentő szinuszhangból indulnak ki, hanem a maximumból, a teljes hallástartományt betöltő fehérzajból (vagy más típusú zajból), amelyből aztán szűrőkkel kivonják a nemkívánatos frekvenciákat.
1.3. FM
Egy másik, a számítógép használatával megszületett szintézistechnika elvi alapja a vibrato, a hang magasságának folyamatos föl-le csúszkálással előidézett periodikus változtatása – elektroakusztikus szemlélettel fogalmazva a frekvencia modulációja –, mely a klasszikus zene előadói gyakorlatában legjellemzőbben a vonós hangszerek és az ének esetében használatos. A 12. fejezetben bemutatott John Chowning megfigyelte, hogy ha a klasszikus vibrato esetében használt néhány hertzes moduláló hullámnál jóval magasabb, a hallástartományba eső rezgésszámú hullámokat használ egy állandó magasságú szinuszhang frekvencia-modulációjához, akkor már nem folyamatos csúszkálást észlel, hanem összetett hangokat. Így született az FM-szintézis.
Az eredeti hullámforma torzulása miatt létrejött összetett hangokban olyan részhangokat lehet kimutatni, melyek a spektrumban az eredeti hangmagasság két oldalán jelennek meg, tehát részben mélyebbek, részben magasabbak nála. Egymástól és az eredeti hangtól mért távolságuk attól függ, milyen arányban áll egymással a modulált és a moduláló frekvencia. Ha az arány harmonikus, tehát kifejezhető egész számokkal, akkor a részhangok alkotta spektrum is harmonikus lesz, inharmonikus arányuk pedig inharmonikus spektrumot eredményez. A moduláló hullám frekvenciája és amplitúdója változtatásával, tehát csupán két paraméter módosításával a legkülönfélébb hangszínek hozhatóak létre, melyek ugyanakkor mégis egyfajta közös, az FM-szintézist viszonylag könnyen felismerhetővé tevő jelleget hordoznak.
Az akusztikus forrásból származó hangok egyrészt az ADSR-görbéjük (Attack–Decay–Sustain–Release, azaz felfutás–csillapítás–kitartás–lecsengés) segítségével jellemezhetőek és utánozhatóak: ez a görbe írja le a megszólalás karakteres hangerőváltozásait a hang életének nevezett időszakaiban. Van azonban az akusztikus hangoknak egy másik karaktermeghatározó jellemzőjük: a hang felfutásakor és lecsengésekor történő átmeneti hangszínváltozások mikéntje. Az FM-szintézissel azért könnyű természetes hatású hangzásokat létrehozni, mert a hangerőt befolyásoló ADSR-görbével csupán egy másik görbét kell szinkronizálni, mely a hangszínt meghatározó két paramétert szabályozza. Ennek megfelelő kialakításával imitálhatóak azok a rövid távú hangszínmódosulások, melyek például a húros, fúvós vagy ütős hangszerek, illetve az énekhang megszólalására jellemzőek.
1.4. Beszédszintézis
Tulajdonképpen furcsa, hogy a hangszín kérdése csak a 20. század folyamán vált a zenei alkotótevékenység központi problémájává, hiszen az emberi agynak rendkívül fejlett hangszín-megkülönböztető képessége van, melyet a civilizáció hajnalától kezdve az emberiség alaposan ki is aknázott. Ezen a képességen alapszanak ugyanis legfontosabb kommunikációs rendszereink, a beszélt nyelvek, melynek jelei az emberi hang változatos hangszíneiből épülnek fel. Minderről azért esik szó ebben a fejezetben, mert a számítógépes szintézis egyes fejlett módszerei az emberi hang utánzásával, közvetítésével, rekonstruálásával kapcsolatos kísérletekből nőttek ki.
Az emberi hang működése évszázadok óta foglalkoztatta a tudósokat: Kempelen Farkas (1734–1804) magyar tudós és feltaláló 1770 táján fejlesztette ki beszélőgépét, az első beszéd utánzására képes készüléket, mely azon a felismerésen alapult, hogy a magánhangzók jellegét a fej üregeinek alakja határozza meg. Ezeket az üregeket Kempelen egy olyan fadoboz segítségével utánozta, melynek geometriáját különböző alkatrészeinek mozgatásásával lehetett változtatni, míg a hangszalagokat egy, a doboz bemeneti nyílásához erősített nyelvsíp helyettesítette.
Az emberi fej rezonánsüregei – elsősorban a szájüreg – különböző frekvenciatartományokban rezonáns zónákat, úgynevezett formánsokat hoznak létre. Azok a részhangok, amelyek a formánsok magasságába esnek, a rezonanciának köszönhetően nagyobb hangerővel szólalnak meg, mint a többi részhang. Az emberi hangban akár 10 formánst is meg lehet különböztetni, ám az első kettő – a két legmélyebb – a legfontosabb, bármely magánhangzó majdnem egyértelműen azonosítható csak ezek alapján is. Az első formánst elsősorban a száj nyitottsága határozza meg – minél zártabb a száj, annál mélyebbre esik –, a második formánst pedig a nyelv helyzete – minél hátrébb van a nyelv, annál mélyebbre esik.
A formánsokról szerzett ismeretek fontos gyakorlati jelentőségre tettek szert a 20. század első felének telekommunikációs forradalma során. A beszédhangok kábeles átvitele viszonylag nagy sávszélességet igényelt, így azonos kábelen egyszerre csak kevés beszélgetést lehetett továbbítani. Homer Dudley (1896–1987; 13.1. ábra) elektromérnök 1928-ban kezdett kísérletezni a probléma megoldásával a Bell Labsben, és kifejlesztette (majd 1939-ben szabadalmaztatta) a vocodert, mely lehetővé tette, hogy a beszéd teljes hullámformája helyett annak csak legesszenciálisabb alkotórészeit továbbítsák – nevezetesen a formánsokat –, s ezáltal jóval kisebb sávszélesség is elegendő volt a kommunikációhoz.
13.1. ábra - Homer Dudley
A vocoder az adóállomáson a beszédhangot analizálja a hallástartományt szomszédos frekvenciasávokra bontó sávszűrők segítségével (ezekből általában minimum 8, maximum 20 darab van). Ezután megméri az egyes sávokban megjelenő hangok intenzitását, és az ezt kifejező analóg jelet továbbítja a vevőállomásra, anélkül, hogy az eredeti hangrezgések hullámformájából bármit is megtartana. A vevőállomáson egy fűrészfogjel- és/vagy zajgenerátor működik, melynek hangját az adóállomáséhoz hasonló szűrőkkel szűrnek meg. Ha ezeket a szűrőket a továbbított jelek segítségével szabályozzák, a generátor hangjának hangszínmódosulásaiban felismerhetővé válik az adóállomásról érkező beszéd.
A vocoder adóállomás nélküli változata a voder: a szűrőket – és a szűrendő alaphang magasságát – ennek esetében egy kezelőnek kell szabályoznia billentyűk és egy pedál segítségével. A „hangszer” gyakorlott játékosa érthető gépi beszédet tud produkálni vele (13.2., 13.3. ábra).
13.2. ábra - A voder (1939)
|