LEKTION I RUMSAKUSTIK - Av Morgan Andreason

I december 2001 så höll jag ett kort föredrag om rumsakustik för en liten skara ljudentusiaster som samlats för att provlyssna min fars stereoanläggning inom ramen för den referenskundsverksamhet som bedrivs vid Hifi-punkten i Skövde. Jag antydde då försiktigtvis att jag kanske skulle skriva en kort artikel om rumsakustik där jag sammanställde och underbyggde de resonemang jag förde i mitt föredrag, och denna min antydan bemöttes med så positiva bifall att jag nu känner mig manad att stå för mitt ord. Här följer alltså en snabblektion i rumsakustik anpassad för audiofiler (för att nu inte använda någon av de mindre smickrande termerna för vår åkomma/hobby). Gymnasiekompetens i matematik och fysik är troligen nödvändiga förkunskaper för en genomläsning, men friskt vågat är hälften vunnet! Jag saknar själv formell utbildning inom akustik, och allt som står att läsa i denna artikel är sådant jag har studerat och klurat ut på egen hand. Därför kan det hända att jag har fått saker om bakfoten, och jag svär mig förstås helt fri från ansvar för eventuella sidoeffekter som drabbar läsaren som ett resultat av min text. Huvudvärk är en sådan tänkbar biverkning. Med detta önskar jag trevlig och berikande läsning!

Anechoaphobia - rädslan för ljudabsorbenter

Då man läser svensk och utländsk hifipress möts man inte sällan av varningar för att dämpa ett rums efterklang i för hög utsträckning, eftersom detta skulle ge upphov till en död och livlös ljudåtergivning - ett instängt ljud. Denna rädsla för akustiska ingrepp i lyssningsmiljön skulle jag vilja kalla anechoaphobia, eftersom den är just en fobi - en ogrundad rädsla byggd på fördomar och missförstånd. Den har sin bakgrund i ett av de vanligaste misstag man brukar begå då man försöker åtgärda akustiken i ett rum: att bara dämpa höga frekvenser, utan att alls åtgärda akustikproblem under 250 Hz.

Den ingrodda misstänksamhet mot akustiska ingrepp i lyssningsmiljön som underbyggs av okunniga hifi-journalister och hifihandlare som oreflekterat upprepar de "sanningar" som finns inom paradigmet, är den absolut största anledningen till att så många audiofiler aldrig når målet för sina drömmar om det perfekta ljudet. Den enkla sanningen är nämligen att rumsakustiken i lyssningsrummet är den viktigaste komponenten i hela ljudkedjan. Det spelar ingen roll hur dyr/bra anläggning man införskaffar - i ett rum med dålig akustik kommer den aldrig att kunna uppnå sin välljudspotential.

Denna sanning är någonting som ljudtekniker som sysslar med musikinspelning har vetat om sedan urminnes tider, och redan på 60-talet tillämpade man kunskapen genom att bygga mixningsrum enligt LEDE-konceptet (live end - dead end) - det koncept som varje seriöst lyssningsrum borde utgå ifrån och utveckla ytterligare. Jag ska i denna snabblektion försöka behandla de akustiska begrepp som är nödvändiga för att förstå hur ett välljudande lyssningsrum kan realiseras. (Jag kommer att utgå ifrån och skriva inom det traditionella stereofoniska paradigmet och bortse från andra återgivningstekniker som vågfrontssyntes och ambiophonics, vilka dock mycket väl kan dra nytta av de rumsakustiska principer jag ämnar beskriva)

Akustik och Psykoakustik - trapphuset och gräsmattan

Traditionell akustik handlar om rent fysiska egenskaper hos ljudvågor och ljudvågors interaktioner. Sedan finns ett forskningsfält som främst betraktar hur människor uppfattar och tolkar ljud - psykoakustik. En diskussion om rumsakustik för hifi-ändamål måste ta avstamp inom båda dessa discipliner.

Tänk dig att du befinner dig i en trappuppgång i ett höghus. Väggarna består av målad betong, trappstegen av blankslipad natursten, räcket av metall, dörrarna av trä, förnstren av glas osv. Tänk dig nu att du står där och försöker föra ett samtal med någon. Hur känns det? Är det lätt att höra vad den andre säger? Är det lätt att göra sig förstådd? Behöver du prata högt eller lågt? Är du kanske tvungen att läsa på läpparna för att förstå vad den andre säger?

Tänk dig sedan att du och din kamrat går ut från trappuppgången och ut på den stora gräsmattan utanför huset. Det är kväll och inga störande trafikljud hörs någonstans. Det är vindstilla och tyst i omgivningen. På grund av mörkret kan du knappt se din kamrat, men ändå kan du höra varje nyans i tonfallet, varje subtil förändring i betoning och varje inandning.

Dessa båda miljöer är varandras extrema motsatser. I trapphuset finns många parallella, hårda ytor, men också många oregelbundna, hårda ytor. När din kamrat talar där så nås dina öron av direktljudet, men också av en mängd tidiga reflexer från de närliggande hårda ytorna och en hel mängd av ljud från efterklangen, som blandar sig till ett kaotiskt myller av gammalt och nytt ljud. Att din hjärna lyckas avkoda detta myller av impulser är en enorm bedrift, som dagens forskare i signalbehandling har svårt att upprepa med ens de kraftfullaste av superdatorer till sin hjälp. Ganska snart kommer dock din hjärna - och därmed du - bli mycket trött av att vistas i en sådan miljö, och det kommer att kännas som om ljudet pressar mot öronen på ett mycket obehagligt vis.

I den tysta utomhusmiljön å andra sidan finns det inga närliggande hårda ytor alls. Gräset ni står på är i princip en akustiskt död yta, och alla hårda ytor i omgivningen ligger långt bort. Om du ropar högt skulle du kanske höra ett eko från huset i närheten, men när du talar tyst hörs inget eko. I denna miljö uppfattar du endast direktljudet av din kamrats röst, helt utan reflexer och efterklang. Bortsett från eventuella miljöljud så är denna miljö som att befinna sig i ett ekofritt rum. Är det jobbigt? De flesta skulle nog svara att det är en befriande och angenäm känsla att samtala i denna miljö, inte sant?

Hifi-ljud har mycket att göra med tankeexperimentet ovan. Där skulle vi tänka på talförståelse, vilket i hifi-sammanhang kan översättas till hörförståelse. Det är en ganska revolutionerande upplevelse att för första gången ta med sig sin hifi-anläggning ut på gräsmattan och lyssna till musik utan ett rum som påverkar vad man hör. För de som inte provat vill jag varmt rekommendera experimentet någon varm sommardag! De akustikproblem som finns i ett lyssningsrum har många saker gemensamt med trappuppgången i tankeexperimentet. Jag ska i det följande redogöra för de viktigaste problemområdena, deras konsekvenser för ljudet och vilka vägar man kan gå för att åtgärda problemen.

Signal/Brus och tidsfördröjning

Först vill jag bara ännu en gång fastslå att lyssningsrummet är den absolut viktigaste komponenten i din hifi-kedja, och denna gång skall jag underbygga mitt påstående med ett resonemang om felkällors inbördes storlekar, som kanske kommer att ge dig en helt ny syn på vilka delar som är viktigast i en anläggning:

I den elektroniska delen av hifi-anläggningen brukar man för de olika komponenterna ofta tala om S/N, vilket betyder Signal/Noise, eller på svenska signal/brus-förhållande. Man brukar också ange distorsion som en procentsats, THD+N, vilket betyder "total harmonisk distorsion + bakgrundsbrus". I en modern cd-spelare kan man med översampling, uppsampling, noise-shaping och liknande komma upp i ett S/N-förhållande där signalen är hundra miljoner till en miljard gånger starkare än bruset, eller enklare uttryckt 90-100dB starkare. I en välkonstruerad SACD-spelare kan det bli betydligt bättre än så! Detta är så löjligt bra siffror att en diskussion kring brusets hörbarhet blir rent löjeväckande. Den harmoniska distorsionen mäts ofta i procent, och brukar uppgå till 0.05% eller däromkring i de flesta fall, både för cd-spelare och förstärkare. Möjligen är denna distorsion hörbar under extremt goda betingelser, men ofta handlar de klangliga skillnader man tycker sig höra mellan olika förstärkare om effekter som uppstår i samverkan mellan komplexa högtalarlaster och förstärkarens motkoppling eller liknande. Förstärkare, om de är välkonstruerade, är ofta frekvenslinjära inom 0.1dB över hela det hörbara ljudspektrat, och eventuell fasvridning (att ström och spänning inte är exakt synkroniserade) är oftast försumbart liten - det handlar om miljontedels sekunder.

Om vi istället betraktar högtalare så är dessa inte alls frekvensraka, utan har ofta variationer på omkring 6dB över ett brett frekvensspektra (man anger då +/-3dB). Inte sällan faller de av kraftigt i den djupaste basen, oktaven mellan 16-32 Hz. Den harmoniska distorsionen mäts i hela procent och ligger ofta mellan 1-10%, med variationer vid olika frekvenser. Dessutom har högtalare problem med resonanser som inte är harmoniskt relaterade, utan kan betraktas som "brus". Detta är hundratals gånger kraftigare än bruset i elektroniken. Som om det inte vore nog med detta så har högtalare i allmänhet en olinjäritet i tidsdomänen, vilket yttrar sig i dålig impulsrespons och fasvridning. Värst är problemet i de låga frekvenserna, som tidsfördröjs i förhållande till annat ljud. Denna tidsfördröjning kan mätas i antal tusendels sekunder, att jämföra med de miljontedelars avvikelser som förstärkare kan uppvisa. Om man betänker att ljudets hastighet är ca 331 meter/sekund så kan man förstå vad en tidsavvikelse kan innebära för förmågan att måla upp ett stereosceneri framför lyssnaren. Högtalare har alltså många hundra gånger större inverkan på ljudet än vad elektroniken har, rent objektivt sett och mätt med matematiska metoder. Detta är väl ett argument så gott som något för att man bör välja högtalare omsorgsfullt?

Hur stor inverkan har då lyssningsrummet på ljudet? Ja, lägg till en faktor 10 eller 100 till högtalarnas påverkan, så kommer man nära. Rummet kan tillföra amplitudavvikelser på +/-15 dB eller mer, med tvära kast mellan förstärkning och försvagning vid olika frekvenser - högtalare är mer jämna i detta avseende. Rummet påverkar också impulsåtergivningen kraftigt, ger upphov till tidiga reflexer som förstör ljudåtergivningens rumsliga och tidsliga dimension mer än någonsin en högtalare gör. Dessutom kan man tala om signal/brus-förhållande även inom rumsakustiken. Efterklangen i ett rum är ibland uppåt 2 sekunder lång, varvid avses att den skall vara 60 dB tystare än det initiala ljudet för att sägas vara borta. Tänk på det. 60 dB tystare inom två sekunder. Dessförinnan har efterklangen alltså utgjort ett "brus" i rummet, som maskerat allt ljud som kommit efter. Tänk om en stark ton efterföljs av en svag ton. "Bruset" är då av samma magnitud som signalen! Jämför det med förhållandet i en CD-spelare! Där är signalen ofta flera miljoner gånger starkare än bruset. Att påstå att rummet är anläggningens viktigaste komponent är inget tomt påstående. Det är ett obestridbart faktum, och det är en stor synd att så få musikälskare är medvetna om det! I det följande kommer jag, som jag redan nämnt, redogöra för de viktigaste problemområdena i lyssningsrummets akustik, deras konsekvenser för ljudet och vilka vägar man kan gå för att åtgärda problemen.

Haas-effekten och de tidiga reflektionerna

Vår hörsel bearbetar all inkommande akustisk information med hjälp av vissa matematiska kriterier. Genom att jämföra olika aspekter av inkommande ljud från vänster och höger öra kan hjärnan skapa sig en bild av varifrån ett ljud kommer. Vår kroppsform, vår huvudform och formen hos våra ytteröron påverkar ljud från olika infallsvinklar på olika sätt - genom att löptidsfördröja, kamfiltrera, fasvända, reflektera och interferera och så vidare. Ljud från varje specifik riktning kommer att tillföras en specifik signatur av sådan påverkan från vår kropp, och det är denna signatur som låter oss känna igen varifrån ett ljud kommer. Signaturen brukar vanligen brytas upp i delkomponenter, ITD, ILD och HRTF - interaurala tidsskillnader, interaurala nivåskillnader och huvudrelaterade överföringsfunktioner, när man ska analysera hur perceptionen går till.


HRTF


ILD

Stereofonisk återgivning försöker dra nytta av hur vår ljudperception går till genom att tidsfördröja ljud mellan vänster och höger kanal, och man använder sig då av Haas-effekten (precedence-effekten). Vår hörsel tolkar inkommande ljud så att den impuls som först når örat avgör riktningen till ljudkällan, även om senare impulser från andra riktningar kanske är av större amplitud, dvs är starkare. (I princip finns en stor nackdel inbyggd i stereofonisk presentation på grund av att ljud från vänster högtalare når höger öra och vice versa, vilket för ljud som kommer från båda högtalarna ger upphov till fyra hrtf-signaturer av typen som beskrevs ovan, när det realistiskt sett bara skulle bli två hrtf-signaturer för varje given ljudkälla. I detta avseende är hörlurslyssning med binaurala inspelningar, vågfrontssyntes eller ambiophonics-uppställning med stereodipol betydligt bättre på att återskapa realism i ljudet, men jag ska som sagt lämna dessa därhän och koncentrera mig på rumsakustik endast.)

Från det ögonblick vi mottar den första ljudimpulsen av ett ljud så infinner sig en kort tidsperiod som brukar kallas Haas-fönstret. Beroende på frekvensen av ljudet så är detta fönster ca 20-30 millisekunder stort (långt). De nästkommande ljudvågor av samma eller närliggande frekvens som följer på den initiala impulsen inom Haas-fönstret kommer av vår hörsel att uppfattas som klangliga egenskaper hos denna. I exemplet med trapphuset så nås vi av en enormt mättad efterklang med många nivåstarka reflektioner inom haas-fönstret, medan vi i fallet med den stora gräsmattan har en närmast obefintlig efterklang och extremt nivåsvaga tidiga reflektioner. De tidiga reflektionerna påverkar direktljudet så att dess impulsrespons avviker från det avsedda, och kan också faspåverka direktljudet så att det uppstår konstruktiv eller destruktiv interferens - alltså förstärkningar och utsläckningar. Enkelt uttryckt så kommer det förflutna att påverka framtiden på grund av löptidsskillnader. Detta kan vi uppleva som obehagliga svävningar, tryckande eller pressande tremolo mot öronen, överdriven klang i specifika register - det känns som i en trappuppgång, helt enkelt!


Haas-fönstret fullt av reflektioner

 

I den ideala lyssningsmiljön så förekommer inga som helst reflektioner inom Haas-fönstret. Om vi räknar på detta så finner vi att alla potentiella reflektionspunkter där löptidsskillnaden mellan reflekterat och direkt ljud är högst 30 millisekunder svarar mot en ljudväg som är ca 10 meter plus direktljudets löpsträcka. Om jag sitter och lyssnar 2,5 meter från högtalarna så bör jag alltså försöka finna de möjliga vägar ljudet kan gå mellan högtalarna och mina öron som är kortare än 10+2,5 meter = 12.5 meter. Jag vill alltså finna reflektionpunkter vid golv, tak och väggar som reflekterar ljudet från högtalarna till mina öron och som ger en löpsträcka på mindre är 12,5 meter. Om jag lyckas dämpa alla dessa reflektioner (som kan vara primära, sekundära, tertiära etc) så har jag åstadkommit ett tyst haas-fönster om ca 30 millisekunder, vilket gör att direktljudet slipper påverkas av de allra menligaste tidiga reflektionerna. De eventuella diffusa reflektioner som kan inträffa vid oregelbundna objekt i rummet är av mindre betydelse i sammanhanget, eftersom de till sin natur sprider ljudet och därför är nivåsvaga. Om bara det finns tillräckligt hög absorbtion i ett rum så är diffusion av godo, men jag återkommer till detta senare.


Haas-fönstret fritt från reflektioner

 

Klappeko

Ett alldeles speciellt fall av reflektion uppstår mellan parallella reflekterande ytor, som exempelvis tak och golv eller mellan väggar. En impuls i ljudsammanhang har idealt sett oändligt hög amplitud och oändligt kort varaktighet. I verkligheten kan förstås inga sådana ljud förekomma, men det närmaste vi kommer är transienter - till exempel en handklappning, ett slag på en puka eller cymbal eller liknande. En transient har den egenskapen att den egentligen inte kan sägas vara av en specifik frekvens, vilket man utnyttjar exempelvis i FFT-mätningar av högtalares frekvensrespons. Man utför då en fourier-analys av en impulsrespons för att beräkna frekvensrespons, så som Hifi &.Musik gör sina "vattenfallsmätningar" av högtalare. MLSSA och FFT är två av de vanligaste vägarna att göra rumsakustiska mätningar idag och används av TacT audio, Canton Digital och Perpetual Tech för att göra digital korrigering av rumsakustik.


klappeko

Nåväl. En handklappning har alltså ingen egentlig frekvens, utan "innehåller alla frekvenser". Om man står i ett tomt rum och klappar i händerna så uppfattar man tydligt en speciell sorts efterklangsmönster som inte alls låter som en handklappning - prova gärna själv i närheten av ett hörn i badrummet exempelvis. Denna efterklang kännetecknas av stark modulation - tremolo. Den kan låta fräsande, hårt, bumligt och ofta vibrerande. Man brukar säga att det "smäller mellan väggarna", och det är precis vad som händer. Impulsen studsar mellan de parallella ytorna och ger upphov till ett mönster av konstruktiv och destruktiv interferens.


klappekots efterklang

Samma sak kan hända mellan väggen bakom högtalaren och väggen bakom lyssnaren till exempel. Även om lyssnaren inte befinner sig mitt mellan högtalare och vägg så hörs klappekot (slap echo eller flutter på engelska) som ett lågfrekvent bumlande ljud eller som en hård ringning från rummets hårda väggar på grund av ljudets spridningsegenskaper.

 

Resonant avklingning

Klappeko-fenomenet leder vidare till resonant avklingning, som har att göra med samma fenomen. Mellan två parallella reflekterande ytor kan ljudet studsa fram och tillbaka ett stort antal gånger och bara försvagas marginellt mellan varje studs. Vid en given punkt mellan dessa ytor kan vågfronterna möta varandra i fas med varandra eller i ofas med varandra och ge upphov till interferens av det slag som diskuterats ovan. Om nu ljudets frekvens är av sådan art att den svarar mot en våglängd som är en jämn multipel eller fraktion av avståndet mellan de båda ytorna kommer det reflekterade ljudet alltid att befinna sig i akustisk fas med direktljudet i varje punkt, varvid vågfronterna adderas perfekt. Då har en stående våg uppkommit mellan ytorna, och då säger man också att en resonans har anlagits eller exciterats. Även om man slutar spela tonen så kommer den stående vågen ta god tid på sig att avklinga, eftersom den bestod av många adderade vågfronter och alltså hade stor akustisk energi.


fasförskjutna vågfronter

 

Det lustiga i detta sammanhang är att en stående våg inte alltid leder till högt ljudtryck i alla punkter. Det har att göra med ljudets "dubbelnatur". Akustisk energi finns i två former: kinetisk energi och potentiell energi eller rörelseenergi och tryck. Det mänskliga örat kan nästan bara uppfatta tryckfasen av akustisk energi, vilket är vad vi på vardagsspråk kallar för ljud eller ljudtryck. Ljud är nämligen en longitudinell vågrörelse - vanligen hos luftpartiklar. Denna vågrörelse ger upphov till zoner med tätt packade partiklar som rör sig, men där själva partiklarna egentligen bara rör sig fram och tillbaka kring ett jämviktsläge. I de punkter i rummet där man hör närvaron av en stående våg så befinner sig partiklarna i ytterläget av sin rörelse i båda de kolliderande vågfronterna, och här kommer luften att skifta densitet (tryck) i takt med den spelade frekvensen. Partikelrörelsen är minimal, medan tryckförändringen är maximal. I de punkter där man inte hör en stående våg befinner sig partiklarna i rörelsefas, men åt olika håll i de olika vågfronterna, varför de "tar ut varandra". Här är partikelrörelsen maximal, medan tryckförändringen är minimal. Vår trumhinna känner av tryckförändringar i förhållande till medellufttrycket, vilket är det tryck som finns i vårt inneröra, och därför uppfattar vi inte närvaron av akustisk kinetisk energi, utan bara den potentiella energin, trycket.

I hifi-sammanhang så kommer resonanta fenomen att ge upphov till underligheter i frekvensresponsen i rummet. Vissa frekvenser kommer att ge upphov till tryckväxlingszoner i lyssningspositionen, vilket vi uppfattar som kraftig förstärkning av dessa frekvenser. Andra frekvenser kommer att ge upphov till velocitets-maxima i lyssningsposition, vilket vi uppfattar som svackor i frekvensresponsen hos rummet. Notera att dessa effekter inte påverkar direktljudet, utan efterklangen. På direktljudet kan ske en klangpåverkan, men då ifrån de tidigaste reflektionerna, som vi redan diskuterat. Att införa en enkel equalizer i ljudkedjan för att dämpa de frekvenser som förstärks av efterklangen kommer visserligen att dämpa efterklangen, men kommer också att dämpa direktljudet, vilket ger upphov till en underlig situation av initiell olinjäritet följd av linjär avklingning. Dips i frekvensgången kan alls inte påverkas av en equalizer, av skäl som lätt inses av ovanstående resonemang.

 

För att sammanfatta så ger alltså resonant avklingning upphov till förlängd efterklang vid resonansfrekvenserna och dessutom förstärkning eller försvagning av vissa frekvenser i lyssningsposition. Men ännu är vi inte färdiga, tyvärr. Resonant avklingning ger också upphov till antiresonant avklingning, vilket är precis lika menligt för ljudet!

 

Betrakta två sinuskurvor. Den ena kurvan har en våglängd som svarar mot frekvensen 75 Hz, den andra kurvan svarar mot frekvensen 80 Hz. Under en påtagligt lång tidsrymd kommer dessa kurvor att approximera varandra relativt väl. De är "lika" men inte "samma". Sedan inträffar en tidsrymd då de är förskjutna i relation till varandra, följt av en tidsrymd då de är i nästan exakt motfas, för att sedan hinna ifatt varandra igen. Gitarrister är mycket bekanta med fenomenet, eftersom man använder sig av detta när man stämmer strängarna att passa inbördes. Om man spelar två toner som är väldigt nära varandra så kommer de att ge upphov till samverkan, interferens. Varje ton är skild från de andra när man spelar ett ackord, men tillsammans ger vågfronterna upphov till svävningar, som vår hörsel tolkar som självständiga vågfronter. Ett ackord eller en enkel ters eller kvint får en summa som är större än sina delar - en klangmättnad - som beror på att tonerna samverkar akustiskt och ger upphov till vad som förefaller vara självständiga toner, men som utgör differenser mellan de spelade tonerna. När man stämmer en gitarr så lyssnar man efter de långsamma svävningar som uppstår då strängarna inte ljuder med exakt samma frekvens.



Ponera nu att mitt rum har en resonansfrekvens vid 75 Hz, men att mina högtalare för en stund spelar en ton på 80 Hz. Denna 80 Hz-ton har många likheter med en 75 Hz-ton, varför den faktiskt kommer att slå an (excitera) rumsresonansen vid 75 Hz. Plötsligt inträder svängningsfenomenet, och jag hör en pulserande "tryckande" svävning vid 5 Hz, vilket är differensen mellan den spelade och resonanta tonen. Den spelade tonen innehåller också harmoniska övertoner som kan excitera resonansens harmoniska övertoner, vilket ger upphov till mer högfrekventa svävningar. Plötsligt slutar högtalaren att ljuda, och då hörs efterklangen en kort stund. Notera att mycket av efterklangen sker vid resonansfrekvensen 75 Hz, inte vid den spelade 80 Hz-tonen! Tonen "surnar" alltså i efterklangen, vilket inte alls låter särskilt trevligt. Jämför gärna med tankeexperimentet med trappuppgången ovan. I en trappuppgång så verkar det som om allt man säger surnar i efterklangen, som blir monotont klingande och full av tryckande svävning. Allt verkar låta likadant.

Antiresonant avklingning, som alltså beror på resonant avklingning, ger sammanfattningsvis upphov till tre akustiska effekter; Förlängd efterklang även för frekvenser som bara är "i närheten av" resonansfrekvensen, avklingning som är "sur" (slang för falsk) i förhållande till den spelade tonen, samt svävningar.

 

Interferens från reflektioner

Då jag ovan skrev om de tidiga reflektionernas roll för ljudet så berörde jag deras påverkan på klangupplevelsen och riktningsupplevelsen av direktljudet. Då lämnade jag avsiktligt en viktig aspekt av reflektionerna därhän, och det var deras förmåga att påverka ljudet på samma vis som resonanser gör - genom att ge förstärkning och försvagning.

Tänk dig att du sitter mitt ute på en stor gräsmatta. Den enda hårda yta som finns i närheten är en stor betongvägg som du har bakom din rygg. Framför dig har du ett par högtalare. Nu kan det omöjligt etableras någon stående våg mellan några parallella ytor, inte sant? Ändå kan konstruktiv och destruktiv interferens ske, mellan direktljudet och det reflekterade ljudet från väggen bakom dig. Om väggen är tre meter bakom dig så kommer dess reflekterade ljud löptidsfördröjas ca 20 millisekunder (motsvarande 6 meter). En frekvens vars våglängd motsvarar en period av 20 ms (ungefär 50 Hz) kommer då att resultera i att direktljudet och det reflekterade ljudet möts i fas och förstärker varandra i lyssningspositionen, dvs konstruktiv interferens. För frekvensen 75 Hz kommer vågfronterna ge destruktiv interferens. Och så vidare upp genom frekvensspektrat för alla jämna och udda multipler av dessa grundfrekvenser.

Tänk dig nu ett lyssningsrum med dess många väggar. Alla dessa ytor kommer att samverka med varandra och ge upphov till reflektioner som är av första, andra, tredje ordningen, och så vidare. Dessa studsar, dubbelstudsar, trippelstudsar etc kommer att ge upphov till en massiv klangpåverkan av direktljudet som inte alls behöver vara av resonant karaktär. Det är på grund av alla dessa reflektioner av ljud från rummets väggar, och de eventuella resonanta och antiresonanta fenomen de kan ge upphov till, som vi måste vara så omsorgsfulla när vi finner en plats att placera våra högtalare och väljer vår lyssningsposition. Det vi i själva verket försöker åstadkomma genom detta Sisyfosarbete är att finna en placering som ger största möjliga "utsmetning" av dessa resonanser och reflektioner i tidsdomänen och frekvensdomänen. Vi försöker skapa en situation där rummets beteende är så kaotiskt som möjligt!


direktljud och väggreflexer

Vad kan man då göra för att avhjälpa alla dessa problem med rummets bidrag till ljudet? Ja, jag har redan berört en viktig aspekt - att dämpa de tidiga reflexerna. Men nu gäller det verkligen att hålla tungan rätt i mun, för annars kan man begå kardinalfelet som gett upphov till sjukdomen anechoaphobia! Jag ska försöka redogöra för vilka svårigheter och fallgropar som finns när man arbetar med rumsakustik och försöka visa på vägar att undvika misstagen. Förklaringen kräven en djupdykning i vågfysik, men jag ska försöka vara så konkret som möjligt.

 

Q-värde i resonanta kretsar

Den som någon gång använt sig av en parametrisk equalizer vet att man kan variera centerfrekvens för varje regel, samt även variera vilken "bredd" av frekvensspektrat som ska påverkas av denna, samt förstås vilket ingrepp man gör vid denna frekvens (om man ska förstärka eller attenuera vid angreppsfrekvensen). Det intresanta är här "bredden" av verkningsområdet, som brukar kallas för Q-värde. Ju bredare omfång, desto högre Q-värde. Man kan tala om branthet hos amplitudkurvan kring mittfrekvensen. Ju större Q, desto flackare kurva, vilket medför att bredden vid basen blir större för en given amplitud.

På samma sätt fungerar rumsresonanser - de har olika Q-värde beroende på rummets dimensioner och mängden resistivt (absorberande) material i rummet. Redan genom att tillföra rummet absorbenter som dämpar de tidiga reflexerna så har vi tillfört rummet en resistiv verkan som kommer att påverka dess resonanta beteende. Mellan de ytor som täcks av absorbenter och deras speglingar i parallella ytor kommer alla resonanser att bli kortlivade. Märk att jag säger "kortlivade", för man kan nämligen inte komma undan resonanser helt och hållet! Dessa är nämligen funktioner av rummets dimensioner och geometriska form, och kan bara påverkas genom att ljud absorberas eller genom att man tillför mer resonans fast i motfas. Det man åstadkommer genom att absorbera ljud resistivt är att man förkortar efterklangstiden och sänker amplituden för de potentiellt resonanta reflekterade ljuden. Genom att amplituden sänks så minskar Q-värdet för varje resonansfrekvens, och därmed minskas också fenomenet antiresonant avklingning.

 

Biljardbollar och skvalpande vatten

Nu finns det dock ett stort problem med resisitiv dämpning av rumsresonanser, och det har att göra med ljudets natur ännu en gång. Egentligen har det att göra med luftens egenskaper - dess förmåga att vara "mjuk" eller "hård" för olika frekvenser - men det räcker med att man förstår effekterna för att förstå det kommande resonemanget: Höga frekvenser från ungefär 200 - 500 Hz och uppåt strålar från en högtalare i ett alltmer riktat mönster ju högre frekvensen är, medan låga frekvenser utbreder sig likformigt i alla riktningar. Det är därför man gärna använder sig av dome-diskanter för att öka diskantspridningen något, och det är därför som ljudet "mörknar" i klangen om man lyssnar på baksidan av en vanlig lådhögtalare. Man kan på ljudtekniskt språk säga att HF (högfrekventa ljud) utbreder sig i cardioid-mönster, medan LF utbreder sig omnipolärt.


strålningsmönster

Man behöver också känna till något om våglängder och tryckzoner och om resistiv dämpning i största allmänhet. Absorbtion av ljud är resistiv till sin natur. Det man dämpar är partikelrörelse. Man använder sig av ett genomsläppligt material som tillåter partikelrörelse, men gör visst mekaniskt motstånd mot den - glasfiberull är ett typisk sådant material. Luftpartiklarna svänger och kolliderar med fibrerna, varvid den mekaniska energin omvandlas till värme av friktionen.

Den vanliga platsen att placera en ljudabsorbent är på rummets väggar och i taket. Därvidlag inträder det fenomen som troligen givit upphov till den hemska vanföreställningen anechoaphobia, nämligen att bara HF kan dämpas resistivt så nära rummets begränsningsytor. Om vi erinrar oss ljudets dubbelnatur av kinetisk och potentiell akustisk energi och betraktar denna natur i termer av partikelrörelse i en longitudinell vågrörelse så är det ganska lätt att förstå att alla ljudvågor som reflekteras mot en vägg kommer att ha ett tryckmaxima vid väggen, av den enkla anledningen att ingen egentlig partikelrörelse kan ske där. Luftpartiklar kommer omväxlande att packas hårt mot väggen eller svalla bort från den och ge upphov till undertryck - lite som när vatten skvalpar fram och tillbaka i en bassäng eller ett badkar. Vid badkarets kanter så blir det höga toppar och djupa svackor i vattnet, till följd av reflektionen och begränsningen i rörelseriktning. En partikel alldeles invid en vägg kommer inte att kunna göra en vågrörelse i någon riktning annat än helt parallellt med väggen, eftersom väggen finns där och hindrar rörelser i andra riktningar. Lätt att förstå, inte sant?

Ju längre ut från väggen man betraktar luftpartiklarna, desto mer rörelse kommer man att se. Vid en given frekvens så kommer man att kunna se ett mönster av omväxlande tryckzoner och rörelsezoner när man rör sig bort från väggen. Placerar man nu en friktionsdämpare vid väggen så kommer den att vara verksam vid frekvenser där det finns partikelrörelse på det avstånd från väggen där dämparen är. Ju längre bort från väggen vi kommer, desto lägre frekvenser ger rörelsezoner, eftersom lägre frekvenser har större våglängd. Sätter vi alltså en absorbent dikt an mot en vägg, så kommer den att friktionsdämpa frekvenser vars våglängd är fyra gånger dess tjocklek eller mindre. Flyttar vi absorbenten ut från väggen kommer lägre frekvenser att friktionsdämpas. En vanlig strategi som man ser användas för att "dämpa ljudet lite" är att man sätter upp textilier, ibland speciella "ljudmattor", på väggarna. Dessa är sällan mer än ca 3 cm tjocka, varvid de svarar mot en våglängd på högst 12 cm, som motsvarar en frekvens av ca 2800 Hz. Under denna frekvens är sådana dämpare inte särskilt effektiva alls.

Om man dämpar ett lyssningsrum med ljudabsorbenter vid reflektionspunkterna på väggar och tak och använder tunna absorbenter dikt an mot vägg så blir resultatet nästan garanterat mycket dåligt. Man dämpar då höga frekvenser mycket kraftigt - de som ju redan strålar från högtalaren på ett ganska riktat sätt och därför inte sprids så väl i rummet, varför efterklangen inte är så besvärande till att börja med. Man får då ett ljud som är "dött" i den övre delen av frekvensspektrat, medan låga frekvenser har fritt spelrum och dränker direktljudet i en bumlande, oartikulerad ljudmatta. Detta är misstaget som givit upphov till vanföreställningen anechoaphobia. Ett sådant rum låter synnerligen illa!

För att friktionsdämpning ska kunna ske på ett effektivt sätt i ett brett frekvensspektrum så måste man använda tjocka absorbenter, eller se till att de hamnar på ett stort avstånd från vägg/tak - man inser att man kommer att få kompromissa en del, om man inte vill stjäla allt för mycket av rummets volym med absorbenter. Ett sort problem är att lägre frekvenser har så stora våglängder att de börjar bli av samma storleksordning som lyssningsrummets dimensioner - och för att dämpa dessa med friktionsabsorbenter så kommer man att få leva med en 2x2x2 meter kub av glasull upphängd i rummets mitt… Och då skymmer man rimligen högtalarna? Lösningen är förstås att finna ett sätt att dämpa låga frekvenser nära väggarna, och det är lättare sagt än gjort.

En strategi att dämpa låga frekvenser i tryckzoner är att använda helmholtz-resonatorer, vilka är luftkaviteter eller membran som "går i motfas" vid specifika frekvenser. Resonansen i dessa stora burkar/lådor ger upphov till en vågfront som är motsatt den som infaller, varvid ljudet utsläcks till viss del. Ett stort problem med denna princip är att resonatorn kommer att exciteras av ljud vars frekvens ligger nära avstämningsfrekvensen, och därför bidra till antiresonant avklingning - tillföra "burkighet" till rummet, helt enkelt. Man kan försöka tillföra resisitivt material till burkarna för att minska antiresonant avklingning, men då gör man avkall på deras effektivitet vid angreppsfrekvensen. För att åtgärda problem vid många frekvenser så krävs många burkar av olika storlekar, och då blir det trångt i rummets hörn. Att placera helmholtzresonatorer för att dämpa lågfrekventa reflektioner vid väggarna och i taket låter sig heller inte göras om man har ett lyssningsrum av normala proportioner, och om man ändå skulle försöka sig på att göra det så kommer man att få tumma med absorbtionen av höga frekvensers väggreflexer.

Tack och lov finns både billigare och betydligt bättre uppfinningar för absorbtion av ett mycket brett frekvensområde, och de går under samlingsnamnet "tubetraps". Dessa utnyttjar de kraftiga tryckväxlingarna vid rummets begränsningsytor för att producera kraftig friktion genom en genial omvandling av tryck till rörelse.

Tänk dig ett rör av poröst material - låt säga av pressad glasfiber. Röret är förslutet i båda ändar, så att ett tomrum bildas i det. Glasfiberullen i dess väggar är ett poröst material som tillåter luftrörelse i viss utsträckning, men luften har inte fri passage. Ett övertryck inuti röret skulle sakta utjämnas genom att luft strömmade ut genom dess väggar, och tvärtom för ett undertryck. Tänk dig nu att vi ställer röret i ett rum där vi spelar musik, alldeles inne i ett hörn där luften ändrar tryck i takt med de spelade frekvenserna. Luften inuti röret har ursprungligen samma tryck som luften i rummet, men i takt med tryckväxlingarna i luften utanför kommer röret omväxlande att ha övertryck eller undertryck. Dessa tryckskillnader kommer att göra att luften rusar in eller ut genom rörets porösa väggar. Där kommer de att stöta på friktion från glasfiberullen, vilket gör att den akustiska energin omvandlas till värme. Principen bygger på att man finner rätt densitet hos glasfiberullen - om den är för tät så sker för lite rörelse, om den är för tunn så sker för lite friktion och tryckskillnaderna blir alltför kortlivade.

Fördelen med denna princip framför burkresonatorerna är att glasfiber-rören är verksamma vid alla frekvenser, som påverkas mycket likartat, samt förstås att detta inte är en resonant krets, utan en resistiv krets. Därför inträder inga antiresonanta fenomen, och efterklangen blir väsentligt mycket kortare. Dessutom är den utmärkt för att absorbera HF såväl som LF, och kan tillverkas i sådana dimensioner att den kan placeras på väggarna eller i taket. Den som vill fördjupa sig i ämnet kan läsa mer på http://www.tubetrap.com/

Här finns också ett antal mycket intressanta artiklar om rumsakustik och recensioner av akustikbehandlingar. Rekommenderas varmt!

 

Kaos och Friktion

Jag vill nu för en stund återvända till exemplet med den ensamma betongväggen på den stora gräsmattan. Det exemplet visade tydligt hur reflektioner påverkar ljudet. Reflektionerna är det som ger upphov till all negativ impuls-, tids- och amplitudpåverkan av ljudet. När vi baxar omkring på högtalare och lyssningfåtölj i rummet för att finna en placering som man kan leva med så försöker man med hörselns hjälp sprida reflektionernas påverkan över så stort frekvensområde och så stort tidsfönster som möjligt, just för att ett slumpartat eller kaotisk mönster av påverkan tycks låta bättre än om det finns tydliga mönster i reflektioner och efterklang. Vi vill ha en så utslätad signatur som möjligt från rummet.

I princip så går det alldeles utmärkt att lyssna till musik under ekofria omständigheter, som exempelvis utomhus långt från väggar. Det ger en fullkomligt extrem precision i ljudbilden jämfört med att lyssna i ett rum. Ett starkt vägande argument för att detta är en bra väg att gå är att musik i allmänhet är inspelad med mikrofoner, och att dessa tar upp reflektionsmönster från inspelningslokalen - dess akustiska signatur. För att skapa realism i återgivningen så vill vi förstås påverka denna signatur så lite som möjligt. HIFI betyder ju just detta, inte sant?

Nu är det emellertid så att HELT ekofria miljöer ibland kan vara tröttande att vistas i - de ger en form av sensorisk isolering som inte är skön för örat då man inte spelar musik. Man kan acceptera en viss nivå av efterklang utan att det är särskilt destruktivt för lyssningsupplevelsen. Omkring 0,2 sekunder efterklang mätt som RT-60, närmare bestämt. Det viktiga är därvidlag att efterklangen inte innehåller för mycket av mönster. Den bör vara kaotisk, med ett jämnt förlopp i frekvensdomänen och fullständigt utsmetad i tidsdomänen.


lyssningsrummet med tubetraps

I praktiska termer innebär detta att rummets reflekterande ytor där reflektioner kan ske inom Haas-fönstret bör vara täckta av bredbandsabsorbenter, att de lågfrekventa resonanserna dämpas kraftigt medelst tubetraps i rummets alla hörn och vinklar mellan golv/vägg respektive tak/vägg, samt att de ytor som inte täcks av absorbenter bör förses med diffusorer som sprider allt infallande ljud på ett kaotiskt sätt. Ett rum konstruerat på detta vis kommer inte att vara helt neutralt ur en designers synvinkel, men det kommer att ha en "neutral röst".

Hur låter det?

Hur låter då ett rum av detta slag? Ja, man kan uttrycka det på olika sätt. För det första så har man sänkt "brusgolvet" av efterklang högst avsevärt. Detta innebär konkret att man fått ett större dynamikomfång. Små detaljer kommer att höras bättre, när de inte längre dränks i buller och efterklang. Stora dynamiska utbrott kommer också att komma mer till sin rätt. De höjer sig nu som högre toppar från en djupare belägen medelnivå. Musiken blir på samma gång tystare och kraftfullare. Man kan kalla det "svärta" - transienter etablerar sig kraftfullare om de kommer ur den kolsvarta tystnaden än om de kommer från ett buller.

Nästa sak man märker är att en tydlig färgning försvunnit. Från den djupaste basen via den varma mellanbasen och upp genom mellanregister, presens och diskant så finns inte en tillstymmelse till utsvällande områden som dränker intilliggande frekvenser. De allra flesta lyssningsrum har sin allra största påverkan från ca 60 Hz upp till 500 Hz, vilket kraftigt färgar instrument som cello, gitarr, violin och förstås mänskliga röster. Dessa kommer nu låta betydligt mindre svullna, mer naturliga. Man märker skillnaden genom att röster plötsligt låter helt naturliga i det dämpade lyssningsrummet. Det fungerat utmärkt både för samtal och för musiklyssning.

Så märker man förstås den enormt förbättrade basåtergivningen. Ju mer bas man absorberar, desto mer bas kommer man att höra! Detta för att den bumlande efterklangen nu inte påverkar direktljudet och dränker detta. Man uppfattar nu dynamiska kontraster i basområdet som tidigare inte kunnat uppfattas. Basen blir tight, torr, snabb, djup och nästan skrämmande kraftig jämfört med tidigare, men på ett korrekt sätt. Man hör nu all den bas man i själva verket alltid haft, men inte kunnat höra.

Mer subtilt, men minst lika viktigt som ovanstående, är att ljudets tidsmässiga förhållanden blir tydligare än tidigare. Precisionen i ljudbilden ökar mångfaldigt, och det är som att vrida kameraobjektivet så att man plötsligt får focus. Djup, bredd och höjd etablerar sig, och enskilda utplaceringar av instrument blir betydligt tydligare än tidigare. Individuella ljudkällor blir punktformiga. Först kan det tyckas att man har tappat stereobredd, men det är för att man inte längre har en väggreflex som lägger till en extra virtuell ljudkälla vid sidan om högtalarna. På musik inspelad med rätt mikrofonuppställning så sträcker sig dock ljudbilden djupare och längre ut åt sidorna än någonsin.

Digital rumskompensering?

Det finns ett antal digitala processorer på marknaden idag, som kan mäta hur högtalare och rum uppför sig och samverkar och sedan kompensera för deras sammanlagda påverkan. Mycket kort så går detta till så att man utsänder en kort sekvens av pulser, kallad Maximum Length Sequence. Denna signal kommer inte att återges perfekt av högtalarna, och kommer att påverkas ytterligare av rummet. Man mäter resultatet, och mätdata får genomgå två matamatiska omvandlingar. Först en FHT - Fast Hadamard Transform, för att ge en impulsrespons, sedan en FFT - Fast Fourier Transform, för att omvandla impulsresponsen till en frekvensrespons. Genom att jämföra den ursprungliga signalen med den uppmätta signalen så kan man skapa en matematisk modell av anläggningens fel, vilket kallas dess överföringsfunktion, dess Transfer Function. Sedan kan man specificera vilken återgivning man egentligen önskar, subtrahera överföringsfunktionen och "spegelvända" differensen. Denna inverterade differens tillför man sedan allt ljud som spelas upp, varvid tillfört fel och spegelvänt fel kommer att "ta ut" varandra. Man kan skapa den överföringsfunktion man önskar.

Men det finns problem med dessa tekniker. Först och främst så är algoritmerna man använder begränsade i omfattning. Man kan inte räkna för länge, helt enkelt, för datamängden blir då enormt stor och kan inte hanteras av dagens DSP-kretsar. Man är begränsad till att arbeta med data som omfattar en tidsrymd som motsvarar ungefär en hel våglängd av den frekvens man arbetar med. Vid 50 Hz är en svängning 20 ms lång, vilket svarar mot en löpsträcka på cirka sex meter. Om du har en vägg som befinner sig 150 centimeter bakom dig och du sitter 300 centimeter från högtalarna så kommer en korrektion att kunna kompensera för den väggens bidrag till ljudet vid frekvenser under 50 Hz således, men man kan inte kompensera för väggens bidrag vid högre frekvenser än så. Kapaciteten i DSP-kretsarna blir dock bättre och algoritmerna bättre, så dessa gränser kan komma att töjas en del i framtiden. Men att kompensera för höga frekvenser och under en lång tidsrymd låter sig inte göras. En liten rörelse på huvudet skulle förstöra all sådan kompensering!

Detta är nästa svaghet med digital rumskompensering. Den är specifik för en lyssningsposition. Mycket mer specifik än akustisk behandling av vanligt slag. Och den kan inte alls kompensera för rummets efterklang, som kommer att vara av samma längd som innan.

Är då digital kompensering värdelös? Absolut inte! Den kan nämligen drastiskt förbätta resultatet även i ett perfekt rum genom att kompensera för högtalarens brister. Den påverkar därvidlag inte högtalarens harmoniska distorsion i någon större utsträckning, men den kan kraftigt förbättra högtalarens impulsåtergivning, vilket även påverkar dess uppförande i frekvensdomänen. Jag nämnde att en högtalares fel i tidsdomänen kan mätas i antal tusendels sekunders fördröjning, och detta värde kan sänkas till ungefär 10 miljontedels sekund med digital kompensering!

Det har länge varit känt att högtalare som uppför sig bra i frekvensdomänen kan låta rent förskräckligt dålig ibland, medan högtalare som har ganska stora fel i frekvensgången kan låta superbt. Det har att göra med deras hantering av tidsdomänen. En högtalare där basen är tidsfördröjd mot resten av musiken kommer aldrig att kunna uppvisa ett bra stereoperspektiv, aldrig låta riktigt rytmiskt korrekt, aldrig låta tight och torr. Kombinationen av digital högtalarkorrektion och en korrekt behandling av lyssningsrummet har därför potential att lyfta hifi till de verkliga höjderna där det plötsligt blir relevant att tala om hög trohet - att återkapa ljudet så som det en gång lät. I grund och botten handlar hifi om så prosaiska saker som signal/brus-förhållande och överföringsfunktioner. Rummet är den del av din ljudanläggning som tillför flest fel i dessa avseenden. Rummet är den svagaste länken, den som gör att du inte får utbyte för dina dyra högtalare, din dyra förstärkare, din dyra skivspelare och dyra CD-spelare. Att spendera 50.000 kronor eller mer på en ljudanläggning utan att göra något åt rummet är rent ut sagt löjligt. Lägg 20.000 kronor på att skaffa absorbenter och diffusorer istället, och smäll 30.000 på stereon. Det ger BETYDLIGT bättre ljud! Det är den enkla, bistra sanningen.

Eder välljudsprofet

Morgan Andreason

Kommentarer, tips, frågor, kritik, provokationer, liksom även konsultuppdrag, mottas med glädje

morganlurk@hotmail.com