Günther Rabl: Electric Orpheus back | home | Electric Orheus Academy

Fourier Transformation

Vorbemerkung
Wer schon einmal etwas von ’FFT’ gehoert hat oder im Umfeld einer tontechnischen oder mathematischen Beschaeftigung ein paar praktische Dinge über Fouriertransformation weiss, dem würde ich dringend raten, vorerst einmal alles zu vergessen und sich eine umfassende Kenntnis dieses für die Elektroakustische Musik so wichtigen Werkzeuges aus einer anderen Perspektive zu verschaffen. Viele der Dinge, die man mit dem Begriff FFT verbindet, betreffen nicht unbedingt das Wesen der Transformation goto, sondern lediglich bestimmte Arten ihrer Anwendung in Tontechnik und signal-processing. Von dem, was man so gemeinhin darüber weiss, ist gewoehnlich die Haelfte falsch - und die andere Haelfte nicht ganz richtig.

FFT
Wenn wir in der Elektroakustischen Musik, oder auch im signal processing von Fouriertransformation sprechen, so meinen wir nicht das nach Jean Baptiste-Joseph de Fourier (1768-1830) benannte Verfahren zur Loesung von Gleichungen, mit der eine unendliche Funktion integral transformiert wird, sondern die entsprechende diskrete Transformation einer endlichen Datenmenge, wie wir sie im Computer durchführen koennen.
Dafür gibt es mittlerweile eine Vielzahl von Algorithmen, die exakt dasselbe Ergebnis liefern, aber unter bestimmten Bedingungen wesentlich schneller. Diese fasst man unter dem Begriff Fast Fourier Transform, abgekürzt FFT zusammen. [L1].
Vor allem die Anwendung der FFT auf kleine Ausschnitte von Klang (grains, oder windows) ist keine unmittelbare Eigenschaft der Transformation, sondern ergibt sich aus einigen praktischen Forderungen der Signalverarbeitung, die bei weitem nicht alles beinhalten, was mit Hilfe der FFT machbar ist und einem genauen Verstaendnis des Wesens der Transformation eher im Wege stehen. (Damit keine Verwechslung entsteht, wird dort, wo man keinen granularen Einsatz der FFT meint, gelegentlich auch von totaler FFT  oder Giant-FFT gesprochen). Im Nachfolgenden ist mit FFT immer eine totale (über den gesamten Datenbereich) gemeint.

Der zyklische Charakter der FFT
Wenn wir ein beliebiges Klangmaterial (in Form eines unkomprimierten Datensatzes mit einer bestimmten Anzahl von samples) einer FFT unterziehen, so erhalten wir als Ergebnis einen Datensatz gleicher Groesse, mit derselben Anzahl von samples, nur mit offensichtlich gaenzlich anderem Inhalt. Nichts hindert uns daran, diesen Datensatz als neues Klangmaterial (gleichsam als Derivat des ursprünglichen) aufzufassen und uns das anzuhoeren und weiter zu verwenden. In der Tat erhalten wir auf diese Weise zunaechst einmal gute, brauchbare Typen von Klaengen für die kompositorische Arbeit.
Als ich mich vor ungefaehr zwei Jahrzehnten theoretisch mit der FFT beschaeftigte (noch ohne jede Aussicht, hoerbare Resultate zu erhalten), versuchte ich gleich herauszufinden, zu welchen Klaengen man kommt, wenn man die Transformation mehrmals hintereinander anwendet. Erstaunlicherweise zeigt es sich, dass die Transformation (mit Amplitudennormierung) viermal hintereinander angewendet wieder zum Ausgangsklang zurückführt. Am entgegengesetzten Ende dieses geschlossenen Kreises (zweimalige FFT) liegt die Zeitumkehrung des Ausgangsklanges.

Original
FFT: Transformationsklang
FFT der FFT: Zeitumkehrung des Originals
FFT der FFT der FFT: Umkehrung des Transformationsklanges
FFT der FFT der FFT der FFT: Original

Das heisst aber:
Der Klang, der durch FFT eines Klanges entsteht ist der mittlere Zustand zwischen dem Ausgangsklang und dessen Zeitumkehrung !
Diese Eigenschaft der FFT ist von groesster formaler Bedeutung für die avancierte Computermusik. Diese 4 Zustaende, die jedem Klangmaterial immanent sind, lassen sich einsetzen wie Original, Krebs, Spiegel und Krebsspiegel in der Reihentechnik [@1, @2, @3].
Die Mathematiker bieten sogar ein Verfahren an, die sogenannte Fraktionale Fouriertransformation, mit der man jede Stufe in diesem geschlossenen Kreis erreichen kann.

Spektrum
Dass die Fouriertransformation das Spektrum eines Klanges ergäbe, ist eine der verbreitetsten Ansichten, die nicht ganz unrichtig ist, aber doch nur die halbe Wahrheit beinhaltet.
Betrachtet man einen Ausgangsklang (Original O) und den Klang, den man durch die FFT erhaelt (Transformation T), so kann man zunaechst feststellen, dass alle Aspekte von Zeit und alle Aspekte von Frequenz bis ins kleinste Detail vertauscht sind. Was im O zeitliche Strukturen sind (Rhythmen, Impulse), findet sich in der T als Frequenz-Strukturen (Toene, Akkorde, Klangflaechen) wieder – und umgekehrt! Allein darin liegt eine immense Bedeutung der FFT zur Erzeugung von Klangderivaten für die elektroakustische Komposition.
Jeder Sinuston in O, jeder Teilton (wirklich jeder !) wird zu einem Impuls in T, zu einem einzigen sample an einer bestimmten Stelle, mit einer bestimmten Amplitude und Phase. Insofern kann man tatsaechlich das Resultat der FFT als das Spektrum von O betrachten, in dem jedes sample eine Frequenz in O repraesentiert. Man muss sich aber bewusst sein, dass dieses (totale) Spektrum genausoviele Frequenzen repraesentiert, wie O samples hat. (Hat O eine Million samples, die den zeitlichen Verlauf ausmachen, dann repraesentiert T grundsaetzlich eine Million Frequenzen, die in O enthalten sind ...)
Was bei dieser Betrachtung aber üblicherweise unter den Tisch faellt ist die Umkehrbarkeit :
Jeder Impuls in O, jedes sample (wirklich jedes !) wird zu einem Teilton in T, zu einem Sinuston bestimmter Frequenz, Amplitude und Phase. Daher kann man genausogut O als das Spektrum von T betrachten, wenn man T als Klang auffasst.
Die Transformation ist das Spektrum des Originals in genau dem Masse, in dem auch das Original das Spektrum der Transformation (als Klang) ist.
Die einfache Darstellung des Spektrums, wie man sie noch in alten Akustik-Lehrbüchern und in der Instrumentenkunde findet (ein Grundton und ein paar abgezaehlte Obertoene), reichen hier nicht mehr aus. Es zeigt sich, dass das totale Spektrum eines Klanges, aus dem er verlustfrei rekonstruiert werden kann, von derselben Groessenordnung und von derselben Komplexitaet sein muss wie das Original - eben selber wieder ein Klang.

Symmetrien
In der Arbeit mit FFT hat man es mit einer ganzen Reihe von Symmetrien zu tun, die für den Anfaenger etwas verwirrend sind. Im Detail kann ich hier nicht darauf eingehen, einiges findet sich im Kapitel complex audio goto. Der Rest wird in der praktischen Arbeit besser verstaendlich. Dennoch einige Hinweise.
Die FFT arbeitet grundsaetzlich complex, das heisst, man benoetigt komplexe bzw. zweikanalige Audiodaten (stereo). Es gibt zwar reelle Varianten der FFT, die sozusagen nur mono arbeiten, aber viele interessante Phaenomene vergibt man sich damit.

realtime
Da die FFT den zeitlichen Verlauf eines Klangmaterials als Ganzes auf eine andere Ebene transformiert, ist realtime-Anwendung von totaler FFT strenggenommen nicht moeglich, weil paradox. Der gesamte Zeitverlauf des Klangmaterials muss im Moment der Transformation bekannt sein. Ein Einsatz in der Live-Elektronik ist jedoch moeglich, wenn man die damit notwendig verbundenen delays miteinbezieht. (nicht realtime, aber immediate).

Anwendung der FFT
Neben dem formalen Einsatz der 4 zusammengehoerigen Klangtypen in der elektroakustischen Komposition, ist die wichtigste Anwendung das Ausführen von allen moeglichen Operationen in den verschiedenen Ebenen. Man unterscheidet dabei nicht mehr zwischen Original und Transformation, sondern man spricht von Ebenen oder domains, je nach Bezugspunkt time-domain und frequency-domain, oder ganz einfach off-domain, wenn man einen Vorgang in der jeweils anderen Ebene ausführt.

Betrachten wir die Auswirkungen einiger der elementaren Operationen off-domain:
Lautstaerkeaenderung bleibt Lautstaerkeaenderung
Tempoaenderung wird zu reziproker Tempoaenderung
Zeitverschiebung (delay) wird zu Frequenzverschiebung (frequency-shift)
Frequenzverschiebung wird zu Zeitverschiebung
Hüllkurve (cut) wird zu Filterung
Filterung wird zu Hüllkurve
Verzerrung wird zu Hall
Hall wird zu Verzerrung
Abmischung bleibt Abmischung

Filter
Jede Art von Filterung laesst sich off-domain durch Aufmoduliern einer Hüllkurve erreichen. Es dürfen aber keine Verzerrungen dabei entstehen, sonst erhaelt man Resonanzen. (Obwohl damit nun Filter mit unbeschraenkter Steilheit realisierbar sind, hat die Steilheit eine Grenze, ab der Resonanzen an den Eckfrequenzen entstehen).

Hall
Moduliert man zwei beliebige Klangmaterialien (im Ringmodulator oder Frequency-Shifter), so erhaelt man bekanntlich Kombinationstoene, Summen-und Differenzfrequenzen. Bei einer Modulation off-domain erhaelt man dementsprechend Summen- und Differenzzeiten, also Echo-und Hallstrukturen. Eine Verhallung von beliebigem Klangmaterial mit jedem beliebigen anderen. Der ganze Prozess heisst auch Faltung oder convolution.
In der EM ist das eine elementare Form der Verknüpfung.
Interessant ist, dass beide Komponenten dabei grundsaetzlich gleichwertig sind, der Prozess ist kommutativ, wie eine Multiplikation. So wie es in der Multiplikation auf dasselbe hinauslaeuft, ob man A*B multipliziert oder B*A, so ist es bei der convolution dasselbe, ob man den Klang A mit dem Klang B ’verhallt’, oder den Klang B mit dem Klang A. Was davon im Resultat als ’Klang’ gehoert wird und was als ’Hall’, haengt vom Charakter der beiden Klaenge ab und davon, welcher der beiden Klaenge auch direkt zu hoeren ist [@4]. In jedem Fall enthaelt das Resultat nur Frequenzen, die in beiden Komponenten vorhanden sind (mit Multiplikation ihrer Amplituden).
Verwendet man gleichwertige Komponenten, dann entstehen eigenartige Klangtypen, die mit dem Begriff Hall nicht mehr zu umschreiben sind, sondern eine Art eigene Raeumlichkeit in sich tragen [@3].
Jede Art von Verzerrung und Automodulation off-domain wirkt sich ebenfalls in dieser Hinsicht aus. Bei sehr hohen Verzerrungsgraden erzielt man aber nicht nur dementsprechend multiple Verhallungen, sondern auch spektrale Ausdünnungen, weil die Frequenzanteile mit geringerer Amplitude tendenziell verschwinden [@3].

freeze
Moduliert man ein KM mit Weissem Rauschen, so erhaelt man soviele Kombinations-Frequenzen, dass das originale Spektrum voellig zerstoert wird, wohingegen die zeitliche Struktur voll erhalten bleibt [@5]. Dasselbe off-domain angewendet führt zum geraden Gegenteil, alle Frequenzen bleiben erhalten, die Zeitstruktur erscheint aber dementsprechend zerstoert oder nivelliert:  Ein stehender Klang aus dem Frequenzgemisch des Originals – von beliebiger Laenge, ohne jede Wiederholung. [@3, @6]

slope
Man stelle sich vor, die Frequenzen eines Spektrums so zu veraendern, dass alle darin enthaltenen Intervalle verdoppelt werden: alle Oktaven werden zu Doppeloktaven, alle Quinten zu Nonen, alle Quarten zu Septimen ... Das waere eine spektrale Dehnung mit dem Exponenten 2, bei der für alle Intervalle gilt: Ineu = Ialtm
Off-domain loest man das durch eine ’Neigung’ der Ordinate (slope), ein bestimmter Typus von glissando durch kontinuierliche Tempoaenderung. Man erzielt dadurch tatsaechlich entsprechende Dehnungen oder Stauchungen des Spektrums, manchmal in Kombination mit markanten Ausklaengen oder ebenfalls Glissandoeffekten. Damit lassen sich normale harmonische Klaenge mit ganzzahliger Teiltonstruktur in ’inharmonische’, glockenartige Klaenge überführen. [@6].

top


@1 Rolf Enstroem: TJIDTJAG OCH TJIDTJAGAISE
@2 Tamas Ungvary: GIPSY CHILDREN GIANT DANCE
@3 Günther Rabl: BETIRI
@4 Günther Rabl: FOURIER AUF DER REISE NACH PRAG
Ein kurzes Glissando (Luftblasen in einer Wasserleitung) wird in mehrern überlappenden Schichten mit einer zwei Minuten langen Aufnahme von Abbrucharbeiten ’verhallt’.
@5 Günther Rabl: STYX
@6 Günther Rabl: BELCANTO
L1 Cambridge University Press: NUMERICAL RECIPES The Art of Scientific Computing
P1 Günther Rabl: FFTBOX  (1996) ein Vektro-Assembler zur Bearbeitung von soundfiles in beiden domains (zur Zeit auf DOS, eine Version für Windows NT und 2000 ist in Vorbereitung, desgleichen eine Auskoppelung der wichtigsten Funktionen für MAX und PD)

homepage of Günther Rabl: http://www.canto-crudo.com
CDs available at: http://www.metamkine.com