Fourier Transformation
Vorbemerkung
Wer schon einmal etwas von ’FFT’ gehoert hat oder im Umfeld
einer tontechnischen oder mathematischen Beschaeftigung ein paar praktische
Dinge über Fouriertransformation weiss, dem würde ich dringend raten, vorerst
einmal alles zu vergessen und sich eine umfassende Kenntnis dieses für die
Elektroakustische Musik so wichtigen Werkzeuges aus einer anderen Perspektive
zu verschaffen. Viele der Dinge, die man mit dem Begriff FFT verbindet,
betreffen nicht unbedingt das Wesen der Transformation , sondern lediglich
bestimmte Arten ihrer Anwendung in Tontechnik und signal-processing. Von dem,
was man so gemeinhin darüber weiss, ist gewoehnlich die Haelfte falsch - und die andere Haelfte nicht ganz
richtig.
FFT
Wenn wir in der Elektroakustischen Musik, oder auch im
signal processing von Fouriertransformation sprechen, so meinen wir nicht das
nach Jean Baptiste-Joseph de Fourier (1768-1830) benannte Verfahren zur
Loesung von Gleichungen, mit der eine unendliche Funktion integral
transformiert wird, sondern die entsprechende diskrete Transformation einer
endlichen Datenmenge, wie wir sie im Computer durchführen koennen.
Dafür gibt es mittlerweile eine Vielzahl von Algorithmen,
die exakt dasselbe Ergebnis liefern, aber unter bestimmten Bedingungen
wesentlich schneller. Diese fasst man unter dem Begriff Fast Fourier
Transform, abgekürzt FFT zusammen. [L1].
Vor allem die Anwendung der FFT auf kleine Ausschnitte von
Klang (grains, oder windows) ist keine unmittelbare Eigenschaft
der Transformation, sondern ergibt sich aus einigen praktischen Forderungen der
Signalverarbeitung, die bei weitem nicht alles beinhalten, was mit Hilfe der
FFT machbar ist und einem genauen Verstaendnis des Wesens der Transformation
eher im Wege stehen. (Damit keine Verwechslung entsteht, wird dort, wo man
keinen granularen Einsatz der FFT meint, gelegentlich auch von totaler FFT oder Giant-FFT gesprochen). Im
Nachfolgenden ist mit FFT immer eine totale (über den gesamten Datenbereich)
gemeint.
Der zyklische Charakter der FFT
Wenn wir ein beliebiges Klangmaterial (in Form eines
unkomprimierten Datensatzes mit einer bestimmten Anzahl von samples) einer FFT
unterziehen, so erhalten wir als Ergebnis einen Datensatz gleicher Groesse, mit
derselben Anzahl von samples, nur mit offensichtlich gaenzlich anderem Inhalt.
Nichts hindert uns daran, diesen Datensatz als neues Klangmaterial (gleichsam
als Derivat des ursprünglichen) aufzufassen und uns das anzuhoeren und weiter
zu verwenden. In der Tat erhalten wir auf diese Weise zunaechst einmal gute,
brauchbare Typen von Klaengen für die kompositorische Arbeit.
Als ich mich vor ungefaehr zwei Jahrzehnten theoretisch mit
der FFT beschaeftigte (noch ohne jede Aussicht, hoerbare Resultate zu
erhalten), versuchte ich gleich herauszufinden, zu welchen Klaengen man kommt,
wenn man die Transformation mehrmals hintereinander anwendet.
Erstaunlicherweise zeigt es sich, dass die Transformation (mit
Amplitudennormierung) viermal hintereinander angewendet wieder zum
Ausgangsklang zurückführt. Am entgegengesetzten Ende dieses geschlossenen
Kreises (zweimalige FFT) liegt die Zeitumkehrung des Ausgangsklanges.
Original
FFT: Transformationsklang
FFT
der FFT: Zeitumkehrung des Originals
FFT
der FFT der FFT: Umkehrung
des Transformationsklanges
FFT
der FFT der FFT der FFT: Original
Das heisst aber:
Der Klang, der durch FFT eines Klanges entsteht ist der
mittlere Zustand zwischen dem Ausgangsklang und dessen Zeitumkehrung !
Diese Eigenschaft der FFT ist von groesster formaler
Bedeutung für die avancierte Computermusik. Diese 4 Zustaende, die jedem
Klangmaterial immanent sind, lassen sich einsetzen wie Original, Krebs,
Spiegel und Krebsspiegel in der Reihentechnik [@1, @2, @3].
Die Mathematiker bieten sogar ein Verfahren an, die sogenannte Fraktionale Fouriertransformation, mit der man jede Stufe in diesem geschlossenen Kreis erreichen kann.
Spektrum
Dass die Fouriertransformation das Spektrum eines
Klanges ergäbe, ist eine der verbreitetsten Ansichten, die nicht ganz unrichtig
ist, aber doch nur die halbe Wahrheit beinhaltet.
Betrachtet man einen Ausgangsklang (Original O) und den
Klang, den man durch die FFT erhaelt (Transformation T), so kann man zunaechst
feststellen, dass alle Aspekte von Zeit und alle Aspekte von Frequenz bis ins
kleinste Detail vertauscht sind. Was im O zeitliche Strukturen sind (Rhythmen,
Impulse), findet sich in der T als Frequenz-Strukturen (Toene, Akkorde,
Klangflaechen) wieder – und umgekehrt! Allein darin liegt eine immense
Bedeutung der FFT zur Erzeugung von Klangderivaten für die elektroakustische
Komposition.
Jeder Sinuston in O, jeder Teilton (wirklich jeder !) wird
zu einem Impuls in T, zu einem einzigen sample an einer bestimmten Stelle, mit
einer bestimmten Amplitude und Phase. Insofern kann man tatsaechlich das
Resultat der FFT als das Spektrum von O betrachten, in dem jedes sample eine
Frequenz in O repraesentiert. Man muss sich aber bewusst sein, dass dieses (totale)
Spektrum genausoviele Frequenzen repraesentiert, wie O samples hat. (Hat O eine
Million samples, die den zeitlichen Verlauf ausmachen, dann repraesentiert T
grundsaetzlich eine Million Frequenzen, die in O enthalten sind ...)
Was bei dieser Betrachtung aber üblicherweise unter den
Tisch faellt ist die Umkehrbarkeit :
Jeder Impuls in O, jedes sample (wirklich jedes !) wird zu
einem Teilton in T, zu einem Sinuston bestimmter Frequenz, Amplitude und Phase.
Daher kann man genausogut O als das Spektrum von T betrachten, wenn man T als
Klang auffasst.
Die Transformation ist das Spektrum des Originals in
genau dem Masse, in dem auch das Original das Spektrum der Transformation (als
Klang) ist.
Die einfache Darstellung des Spektrums, wie man sie noch in
alten Akustik-Lehrbüchern und in der Instrumentenkunde findet (ein Grundton
und ein paar abgezaehlte
Obertoene), reichen hier nicht mehr aus. Es zeigt sich, dass das totale
Spektrum eines Klanges, aus dem er verlustfrei rekonstruiert werden kann,
von derselben Groessenordnung und von derselben Komplexitaet sein muss wie das
Original - eben selber wieder ein
Klang.
Symmetrien
In der Arbeit mit FFT hat man es mit einer ganzen Reihe von
Symmetrien zu tun, die für den Anfaenger etwas verwirrend sind. Im Detail kann
ich hier nicht darauf eingehen, einiges findet sich im Kapitel complex audio .
Der Rest wird in der praktischen Arbeit besser verstaendlich. Dennoch einige
Hinweise.
Die FFT arbeitet grundsaetzlich complex, das heisst,
man benoetigt komplexe bzw. zweikanalige Audiodaten (stereo). Es gibt zwar
reelle Varianten der FFT, die sozusagen nur mono arbeiten, aber viele
interessante Phaenomene vergibt man sich damit.
realtime
Da die FFT den zeitlichen Verlauf eines Klangmaterials als
Ganzes auf eine andere Ebene transformiert, ist realtime-Anwendung von totaler
FFT strenggenommen nicht moeglich, weil paradox. Der gesamte Zeitverlauf des
Klangmaterials muss im Moment der Transformation bekannt sein. Ein Einsatz in
der Live-Elektronik ist jedoch moeglich, wenn man die damit notwendig
verbundenen delays miteinbezieht. (nicht realtime, aber immediate).
Anwendung der FFT
Neben dem formalen Einsatz der 4 zusammengehoerigen
Klangtypen in der elektroakustischen Komposition, ist die wichtigste Anwendung
das Ausführen von allen moeglichen Operationen in den verschiedenen Ebenen.
Man unterscheidet dabei nicht mehr zwischen Original und Transformation,
sondern man spricht von Ebenen oder domains, je nach Bezugspunkt
time-domain und frequency-domain, oder ganz einfach off-domain,
wenn man einen Vorgang in der jeweils anderen Ebene ausführt.
Betrachten wir die Auswirkungen einiger der elementaren
Operationen off-domain:
Lautstaerkeaenderung
bleibt Lautstaerkeaenderung
Tempoaenderung
wird zu reziproker Tempoaenderung
Zeitverschiebung
(delay) wird zu Frequenzverschiebung (frequency-shift)
Frequenzverschiebung
wird zu Zeitverschiebung
Hüllkurve
(cut) wird zu Filterung
Filterung
wird zu Hüllkurve
Verzerrung
wird zu Hall
Hall
wird zu Verzerrung
Abmischung
bleibt Abmischung
Filter
Jede Art von Filterung laesst sich off-domain durch
Aufmoduliern einer Hüllkurve erreichen. Es dürfen aber keine Verzerrungen
dabei entstehen, sonst erhaelt man Resonanzen. (Obwohl damit nun Filter mit
unbeschraenkter Steilheit realisierbar sind, hat die Steilheit eine Grenze, ab
der Resonanzen an den Eckfrequenzen entstehen).
Hall
Moduliert man zwei beliebige Klangmaterialien (im
Ringmodulator oder Frequency-Shifter), so erhaelt man bekanntlich
Kombinationstoene, Summen-und Differenzfrequenzen. Bei einer Modulation
off-domain erhaelt man dementsprechend Summen- und Differenzzeiten, also
Echo-und Hallstrukturen. Eine Verhallung von beliebigem Klangmaterial mit jedem
beliebigen anderen. Der ganze Prozess heisst auch Faltung oder convolution.
In der EM ist das eine elementare Form der Verknüpfung.
Interessant ist, dass beide Komponenten dabei grundsaetzlich
gleichwertig sind, der Prozess ist kommutativ, wie eine Multiplikation.
So wie es in der Multiplikation auf dasselbe hinauslaeuft, ob man A*B
multipliziert oder B*A, so ist es bei der convolution dasselbe, ob man den
Klang A mit dem Klang B ’verhallt’, oder den Klang B mit dem Klang A. Was davon
im Resultat als ’Klang’ gehoert
wird und was als ’Hall’, haengt vom Charakter der beiden Klaenge ab und davon,
welcher der beiden Klaenge auch direkt zu hoeren ist [@4]. In jedem Fall enthaelt das Resultat nur Frequenzen,
die in beiden Komponenten vorhanden sind (mit Multiplikation ihrer Amplituden).
Verwendet man gleichwertige Komponenten, dann entstehen
eigenartige Klangtypen, die mit dem Begriff Hall nicht mehr zu umschreiben
sind, sondern eine Art eigene Raeumlichkeit in sich tragen [@3].
Jede Art von Verzerrung und Automodulation off-domain wirkt sich ebenfalls in
dieser Hinsicht aus. Bei sehr hohen Verzerrungsgraden erzielt man aber nicht
nur dementsprechend multiple Verhallungen, sondern auch spektrale
Ausdünnungen, weil die Frequenzanteile mit geringerer Amplitude tendenziell
verschwinden [@3].
freeze
Moduliert man ein KM mit Weissem Rauschen, so erhaelt man
soviele Kombinations-Frequenzen, dass das originale Spektrum voellig zerstoert
wird, wohingegen die zeitliche Struktur voll erhalten bleibt [@5]. Dasselbe off-domain angewendet
führt zum geraden Gegenteil, alle Frequenzen bleiben erhalten, die
Zeitstruktur erscheint aber dementsprechend zerstoert oder nivelliert: Ein stehender Klang aus dem
Frequenzgemisch des Originals – von beliebiger Laenge, ohne jede Wiederholung. [@3, @6]
slope
Man stelle sich vor, die Frequenzen eines Spektrums so zu
veraendern, dass alle darin enthaltenen Intervalle verdoppelt werden: alle
Oktaven werden zu Doppeloktaven, alle Quinten zu Nonen, alle Quarten zu
Septimen ... Das waere eine spektrale Dehnung mit dem Exponenten 2, bei der
für alle Intervalle gilt: Ineu = Ialtm
Off-domain loest man das durch eine ’Neigung’ der Ordinate (slope),
ein bestimmter Typus von glissando durch kontinuierliche Tempoaenderung. Man
erzielt dadurch tatsaechlich entsprechende Dehnungen oder Stauchungen des
Spektrums, manchmal in Kombination mit markanten Ausklaengen oder ebenfalls
Glissandoeffekten. Damit lassen sich normale harmonische Klaenge mit
ganzzahliger Teiltonstruktur in ’inharmonische’, glockenartige Klaenge
überführen. [@6].
top
@1 Rolf
Enstroem: TJIDTJAG OCH TJIDTJAGAISE
@2 Tamas
Ungvary: GIPSY CHILDREN GIANT
DANCE
@3 Günther
Rabl: BETIRI
@4 Günther
Rabl: FOURIER AUF DER REISE NACH
PRAG
Ein
kurzes Glissando (Luftblasen in einer Wasserleitung) wird in mehrern überlappenden
Schichten mit einer zwei Minuten langen Aufnahme von Abbrucharbeiten
’verhallt’.
@5 Günther
Rabl: STYX
@6 Günther
Rabl: BELCANTO
L1 Cambridge
University Press: NUMERICAL RECIPES The
Art of Scientific Computing
P1 Günther
Rabl: FFTBOX (1996) ein
Vektro-Assembler zur Bearbeitung von soundfiles in beiden domains (zur
Zeit auf DOS, eine Version für Windows NT und 2000 ist in Vorbereitung, desgleichen
eine Auskoppelung der wichtigsten Funktionen für MAX
und PD)
homepage of
Günther Rabl:
http://www.canto-crudo.com
CDs
available at: http://www.metamkine.com