In diesem Text werden die theoretischen Grundlagen, die u.a. zu den
zyklischen Verfahren von Tendler (1973) führten, angeschnitten.
Es werden die Begriffe - und -Stabilität
eingeführt.
Die naheliegenden weiteren Definitionen von -
und -Stabilität werden ebenso diskutiert.
Diese Definitionen weichen gelegentlich von den Definitionen ab, wie sie in
der Literatur zu finden sind.
Die Begriffe - und -Stabilität werden
hier nur so benutzt, wie sie an dieser Stelle erklärt werden.
Diese Stabilitätsmerkmale ermöglichen einen Vergleich verschiedener
Verfahren gleicher Ordnung und damit eine Abschätzung über ihre
Brauchbarkeit bei einem Einsatz in einem Programmpaket.
Dennoch setzen diese Stabilitätsdefinitionen gewisse idealisierte
Bedingungen voraus.
Aus diesem Grunde ist es ratsam, ihnen nicht unangemessen großes Gewicht
beizumessen.
Erfüllt also ein Verfahren diese Eigenschaft besonders “gut”, so heißt dies
nicht automatisch, daß es sich in einem Rechenprogramm auch immer “gut”
verhalten würde.
Schließlich wird dargelegt, wie die neuen zyklischen Formeln generiert
wurden.
Das letzte ist von Interesse, wenn versucht werden sollte, die von
J.M. Tendler gefundenen Formeln weiter zu verbessern.
Von seinen prinzipiellen Grundbestandteilen her sind die Tendlerschen
Zyklen vergleichsweise einfach aufgebaut, nämlich als lineares
Komposituum linear unabhängiger Mehrschrittformeln.
Dennoch ist die tatsächliche Erzeugung, insbesondere die systematische
Generierung nicht ganz einfach.
Es handelt sich hier nicht um einen einfach erlernbaren Kalkül, sondern um
einen iterativen Suchvorgang.
Bibliographisch: Tendler, Joel Marvin: "A Stiffly Stable
Integration Process Using Cyclic Composite Methods",
Ph.D. Diss., Syracuse University, Syracuse, New York,
26.Feb.1973, viii+iv+172 S.
1. Definition von Stabilitätseigenschaften
wird sich diese Störung allerdings erst später einstellen,
aber auf alle Fälle wird die Integration nach ausreichend
vielen Schritten gründlich verpfuscht.
Man nennt diese Erscheinung numerische Instabilität.
Sie ist nicht etwa eine Folge der Akkumulation von Rundungsfehlern,
denn die Formel beschreibt den Integrationsprozeß unter der Annahme,
daß vollständig exakt gerechnet wird.
werden hier betrachtet.
Es sei für diesen und alle weiteren Abschnitte
angenommen, daß und damit so oft differenzierbar sind, wie
es für die jeweilige Betrachtung nötig ist.
Es wird nun gesetzt, und bezeichnet die berechneten
Näherung für , für und , die durch
die folgenden Mehrschrittformeln bestimmt wurden
wobei ist.
Ausführlich aufgeschrieben lautet der obige Ausdruck z.B. für ein
dreistufiges Verfahren mit drei Startwerten, also , und , wie
untenstehend.
Hier und im weiteren wird häufig die Abkürzung
benutzt.
Der obige Ausdruck wird zyklisch, falls gilt
Gälte oder für ein , so wäre das
zusammengesetzte Verfahren blockimplizit.
Der Aufwand zur “Beseitigung” der Implizitheit der Formeln wäre dann größer
als bei (einstufigen) linearen Mehrschrittformeln.
Bei zyklischen Verfahren ist der Aufwand zur Berechnung der Näherungen nicht
größer als wie bei Mehrschrittverfahren.
Andererseits hat man jedoch nun die Möglichkeit, da nicht alle Stufen gleich
gewählt werden müssen, Stabilitätseigenschaften zu erreichen die u.U. den
Stufen überlegen sind.
Die Stufen müssen untereinander nicht verschieden sein.
Einige oder auch alle dürfen übereinstimmen.
Praktische Ergebnisse deuten auf den merkwürdigen Umstand hin, daß die
dreifache Wiederholung der BDF2 als zyklisches Verfahren entsprechend
programmiert, gegenüber der dreifachen Anwendung von 3 Schritten mit der BDF2
mit einem Programm konzipiert für einstufige Verfahren, Vorteile bieten kann.
Während bis jetzt noch jede Stufe des Zykluses Parameter, d.h. noch
nicht bestimmte Koeffizienten, enthält, sei noch zusätzlich angenommen,
um die die Anzahl der der Bedingungen zu reduzieren, daß gelte
D.h., daß jede Stufe ein lineares -Schrittverfahren ist.
Es verbleiben jetzt noch Parameter.
Aus Vereinfachungsgründen wird nun verlangt, daß jede Stufe die
gleiche Konsistenzordnung hat.
Berücksichtigt man die Konsistenzbedingungen, so verbleiben noch Parameter.
Diese werden dazu benutzt die gewünschten Stabilitätseigenschaften des
Verfahrens zu erreichen.
Zur Untersuchung des Lösungsverhaltens der Differenzengleichung, welche
man zur numerischen Lösung von Differentialgleichungen einsetzt,
betrachtet man die sehr spezielle Testgleichung
Da man durch Linearisierung viele Differentialgleichung zumindestens in
einer kleinen Umgebung auf diese obige Form zurückführen kann, liefert
die Untersuchung dieser speziellen Gleichung einen ersten Eindruck was man
wohl im allgemeineren Falle zu erwarten hat.
Desweiteren kann man damit gewisse Ineffizienzen von Programmen verstehen
und erklären.
Zur Wiederholung seien in sehr salopper Form die beiden bekanntesten
Stabilitätsdefinitionen angegeben:
Eine Formel heißt stabil, wenn die sämtlichen berechneten
Lösungen für nicht unbeschränkt wachsen können; .
Die Formel heißt -stabil, wenn sämtliche berechneten Lösungen
eine Nullfolge bilden, für alle .
Ausführlicher
gegen Null gehen (), wenn das Verfahren mit fester
Schrittweite auf Differentialgleichungen der Form
angewendet wird, mit einer festen komplexen Konstante , mit
negativen Realteil.
Die Beschränkung auf lineare -Schrittverfahren ist unwesentlich.
Die Beschäftigung mit zyklischen linearen Verfahren hat zu einem nicht
unmaßgeblichen Teil ihren Ursprung in der zweiten Dahlquist-Barriere.
Diese besagt, daß -stabile, lineare Mehrschrittformeln keine beliebig
hohe Ordnung erreichen können: maximal die Ordnung zwei.
Durch die drastische Einschränkung der Vielfalt -stabiler, linearer
Mehrschrittverfahren werden zwei Erweiterungen nahegelegt:
Abschwächung des Begriffes der -Stabilität und Hinzufügung größerer
Klassen von Verfahren.
Zur Quantifizierung von Stabilitätseigenschaften einerseits und zur
Abschwächung der -Stabilität andererseits dienen die nachstehenden
Definitionen.
2. Definition: Bezeichne eine
zusammenhängende und offene Teilmenge der komplexen Ebene mit dem Ursprung
als Randpunkt, die mindestens einen unendlich großen Teil der linken
Halbebene enthält mit Elementen der Form
Nun heißt ein Verfahren -stabil, falls so eine
Menge existiert derart, daß wenn man das Verfahren auf
die lineare und zeitinvariante Differentialgleichung
anwendet, die mit dem Verfahren berechneten Lösungen gegen Null
streben, wenn , für eine feste positive Schrittweite , falls
immer .
Existiert kein unendlich großer Bereich der linken Halbebene, so werde von
nicht-stabil gesprochen.
Im Falle der Existenz heißt das betragsmässig kleinste die
Widlund-Distanz, nach Olof B. Widlund.
Diese Definition hat eine sehr anschauliche Interpretation, wenn man
das Gebiet aufzeichnet.
Von besonderem Interesse ist hier das betragsmässig kleinstmögliche .
Nur von diesem kleinstmöglichen wird im weiteren überhaupt
noch die Rede sein.
Gleiche Anschaulichkeit hat auch die folgende Definition.
3. Definition: Sei eine
zusammenhängende und offene Teilmenge der komplexen Zahlenebene mit
Elementen der Form
Jetzt heißt das Verfahren -stabil, wenn es w.o. eine
derartige Menge gibt derart, daß die berechneten
Näherungen dieses Verfahren gegen Null streben, für , wenn man
das Verfahren auf die Differentialgleichung anwendet.
Diese Abklingeigenschaft soll immer dann gelten, wenn
gilt, für feste positive Schrittweite .
Für werde von nicht-stabil gesprochen.
Im Falle der Existenz nennt man den größtmöglichen Winkel auch den
Widlund--Winkel, ebenfalls nach
Olof B. Widlund.
In sinnfälliger Verallgemeinerung nennt man ein Verfahren -stabil,
wenn es ein gibt, sodaß das Verfahren -stabil ist.
ist in nicht offen.
Wie die obige Definition kann man diese Eigenschaft wiederum
sehr anschaulich deuten.
Hier gilt je größer der Winkel , desto besser.
Bei der vorherigen Definition galt je kleiner , desto günstiger.
Durch ein größeres , bzw. kleineres , werden
die entsprechenden Mengen ,
bzw. , “größer”.
Bei den beiden
Defintionen beachte man, daß die Menge
bezeichnet und die dazugehörige Eigenschaft.
Entsprechend gilt dies für und .
Man stellt schnell fest, daß ein Verfahren stets -stabil ist,
für ein gewisses , wenn es -stabil ist.
Die Umkehrung ist nicht notwendig richtig.
Bei den noch folgenden Eigenschaften
und wird dies jedoch der Fall sein.
Ist oder , so ist dies das gleiche wie
-Stabilität.
Beide Werte führen zur selben Menge, nämlich der gesamten linken komplexen
Halbebene ohne die imaginäre Achse.
4. Beispiele: (1) Die impliziten BDF der Ordnung
bis erfüllen
mit gewissen und die obigen Stabilitätseigenschaften.
(2) Sämtliche zyklischen Verfahren von Tendler (1973), oder Tendler/Bickart/Picel (1978) sind ebenfalls
Beispiele für Verfahren, die - bzw. -stabil sind.
Zusätzlich sind die Formeln von Tendler auch - und
-stabil.
(Definition folgt.)
(3) Genauso sind auch alle zyklischen Formeln von
Peter E. Tischer (1983) und
Tischer/Sacks-Davis (1983) alle
- bzw. -stabil, sogar - und
-stabil.
(4) Die 10 blockimpliziten Verfahren von
Bickart/Picel (1973)
sind alle - und -stabil, sogar -
und -stabil.
(5) Explizite Verfahren mit konstanter Schrittweite erfüllen die
obigen Eigenschaften nicht.
Das explizite Euler-Verfahren mit konstanter Schrittweite ist also
weder - noch -stabil und zwar für
kein und kein .
Bibliographisch: Tischer, Peter E.: "The Cyclic Use of Linear Multistep
Formulas for the Solution of Stiff Differential Equations", Ph.D. Thesis,
Department of Computer Science, Monash University, Clayton, Victoria,
Australia, August 1983, x+180 S.
1. Wann nun ein Verfahren diese Eigenschaften hat, wird durch sein
charakteristisches Polynom bestimmt.
Dieses Polynom in zwei komplexen Veränderlichen erhält man nun wie folgt.
Den gesamten -stufigen Zyklus
ü
kann man als eine einzige Matrixdifferenzengleichung notieren, nämlich
mit .
ist hierbei die kleinste ganze Zahl, die größer oder
gleich ist.
Die insgesamt Matrizen , haben die Größe .
Es genügen genau dann zwei Matrizen und , bzw. und ,
wenn ist, also .
Vergrößert man die Dimensionen der Matrizen und mit Hilfe von
sogenannten Trivialstufen ( Stufen), so läßt sich natürlich die Anzahl
der Matrizen verringern, z.B. auf genau zwei, also und ,
bzw. und .
Bei den zyklischen Verfahren von J.M. Tendler ist stets ,
d.h. man kommt mit jeweils höchstens drei Matrizen zur Beschreibung der
Matrixdifferenzengleichung aus.
2. Die Matrizen und , für lauten:
und
beziehungsweise
und so weiter bis zu den Matrizen , und Vektoren .
Allgemein also
für .
Die analog wie die .
3. Bei einer vektorwertigen Funktion mit Komponenten hat man die
oben angegebenen Matrizen zu ersetzen durch
Hierbei ist die -Einheitsmatrix und bezeichnet
das Kroneckerprodukt,
nach Leopold Kronecker (1823—1891).
In den meisten Fällen kann man auf diese gesonderte Notierung verzichten,
u.a. weil gilt .
4. Beispiele: (1) Im Falle einstufiger Zyklen, also ,
reduziert sich die obige Matrixdifferenzengleichung zu der gewöhnlichen
skalaren Differenzengleichung für lineare Mehrschrittverfahren, mit
, und .
(2) Das lineare zweistufige zyklische -stabile Verfahren der
Ordnung 4, also , und , von
Tischer (1983) und Tischer/Sacks-Davis (1983),
soll in der obigen Schreibweise angegeben werden.
Die zu den Werten
gehörigen Koeffizienten lauten
wobei alle Koeffizienten auf eine Stelle hinter dem Komma gerundet worden
sind, also der “Konsistenzschnelltest” hier immer
ergibt.
In der Schreibweise als Matrixdifferenzengleichung w.o. ergibt sich
nun unmittelbar
Eine typische Eigenschaft der Formeln von
Tischer (1983) und
Tischer/Sacks-Davis (1983)
ist die relativ geringe Äquilibrierung der -Werte.
Bei diesem Verfahren beträgt sie über 1:20.
Für die Ordnung hat man sogar Verhältnisse von 1:130.
Maßgeblich betrifft dies stets die letzte Stufe der immer zweistufigen
Zyklen.
Die Formeln von Tendler (1973) besitzen diese
Eigenschaften nicht.
Bei gewöhnlichen Quadratur- und Kubaturformeln für
ist bekannt, daß diese Eigenschaft unerwünscht ist.
(3) Das zweistufige, zyklische Verfahren DH3 von Donelson/Hansen (1971)
Keinesfalls müssen zyklische Verfahren nur zweistufig sein.
Die Stufenzahl eines zyklischen Verfahrens unterliegt keiner Schranke,
außer, daß diese Anzahl nicht unendlich ist und daß diese Anzahl dabei fest ist.
Gleichzeitig erkennt man, daß eine formale Übertragung
() scheitert, weil z.B. für DH3
gilt
nach Substitution von .
5. Es ist natürlich ebenso möglich die Linearisierung des obigen
Matrixpolynoms zu betrachten, jedoch werden dann die Dimensionen der
Matrizen größer, falls , also ist.
Das Verfahren schreibt sich dann in der Form , oder
.
3. Stabilität und Polynome
1. Das charakteristische Polynom lautet
Man beweist jetzt, daß das verwendete Verfahren genau dann -stabil
bzw. -stabil ist, wenn die sämtlichen Nullstellen von
, alle betragsmässig kleiner eins sind, für alle
, bzw. alle .
Die Eigenschaft eines Polynomes für ein spezielles
sämtliche Wurzeln in der offenen Einheitskreisscheibe zu haben, nennt man
absolut-stabil.
und sind also Mengen der absoluten
Stabilität.
Äquivalent hierzu ist, daß das Verfahren genau dann -stabil ist,
bzw. -stabil ist, falls alle Nullstellen von
im Komplement von , bzw. im Komplement von
, liegen, für alle aus dem Komplement der offenen
Einheitskreisscheibe.
Man erhält somit den folgenden Test.
2. Test A: Ein Verfahren ist genau dann -stabil,
bzw. -stabil, falls
die Nullstellen von für ein festgehaltenes
beliebiges , bzw. ,
sämtlich betragsmässig kleiner 1 sind und gleichzeitig
die Kurve der Punkte , die
erfüllen, im
Komplement von , bzw. im Komplement von
liegen.
Leider sind Verfahren, die die obigen beiden Eigenschaften
erfüllen, noch nicht wirklich gut zur Integration von steifen
Differentialgleichungen geeignet.
Dies liegt u.a. daran, daß wenn immer
größer wird, die Nullstellen von betragsmässig gegen
eins streben könnten.
Integriert man jedoch () so würde dies
heißen, daß es eine Lösung gibt mit .
Diese Eigenschaft spiegelt sicherlich nicht das wahre Verhalten der Lösung
wider.
Diese Eigenheit hat z.B. die Trapezregel
Aus diesem Grunde sind Verfahren günstiger bei denen die Nullstellen
bei von in der offenen Einheitskreisscheibe
liegen, also keinerlei Wurzeln des Betrages eins auftauchen.
Damit hätte man die Trapezregel als zwar -stabiles Verfahren, letztlich
ausgesondert.
Um diesen Wunsch zu präzisieren und um handliche Begriffe bereitzustellen,
seien diese Anforderungen nun nomenklaturmässig genauer festgelegt.
4. Verschärfung von Stabilitätsdefinitionen
Suppose, for example, that it is known that the planetary system is
stable “in the past”. If it captures a new body, say, a speck of
dust arriving from “infinity”, then the newly formed system of
bodies looses its stability: with probability one, either a collision
occurs, or one of the bodies escapes again at infinity. Moreover,
it is by no means necessary that the speck of dust is the one that
leaves the Solar system: Jupiter, or even the Sun may equally well
leave.
Es liegt nun nahe, die Begriffe -Stabilität und
-Stabilität zu verfeinern.
Hierzu wird das Verhalten der Differenzengleichung für
mit in die Nomenklatur integriert.
Dies führt jetzt zur
1. Definition:
(1) Ein -stabiles Matrixpolynom mit der Eigenschaft,
daß die sämtlichen Nullstellen für in der offenen,
Kreisscheibe liegen, nennt man
-stabil.
Für sagt man abkürzend nur -stabil.
(2) Analog definiert man -Stabilität als Erweiterung
der -Stabilität.
Erneut bezeichnet -Stabilität die Abkürzung für
-Stabilität.
(3) Für ist gemeint, also: Die sämtlichen Nullstellen
für verschwinden.
Hierfür schreibt man - bzw. -stabil.
(4) Der Wert bei der -
bzw. -Stabilität heißt Widlund-Endradius.
I.a. wird ein kleinstmöglicher Wert angegeben und von dem
Widlund-Endradius gesprochen.
Hat ein Verfahren das Matrixpolynom , so vererbt sich der
entsprechende Name auf das Verfahren.
Genauso hätte man auch die - bzw. -Stabilität
einführen können.
Die Werte und bei den Stabilitätsdefinitionen werden
in der Schreibweise unterdrückt, wenn die Wert ,
bzw. betragen, genau w.o. auch.
Die Definition von -Stabilität verallgemeinert offensichtlich
den Begriff der L-Stabilität für Einschrittverfahren.
Offensichtlich ist jedes -stabiles Polynom auch
-stabil, falls , nicht jedoch immer
umgekehrt.
Gleiches gilt für die entsprechend andere Stabilitätseigenschaft, also
jedes -stabile Polynom ist natürlich auch
-stabil, falls .
Insbesondere ist jedes -stabile Polynom auch
- und -stabil.
I.d.R. wird man ein kleinstmögliches bei größtmöglichen ,
bzw. ein kleinstmögliches bei kleinstmöglichem , anstreben.
Welche der Eigenschaften insgesamt am günstigsten ist, kann allgemein nicht
gesagt werden.
Man hat hier einen Zielkonflikt.
Dies hängt auch von der zu lösenden Differentialgleichung ab.
Weiß man im voraus, daß beispielsweise die zu lösende lineare
Differentialgleichung eine Jacobimatrix mit nur negativen
reellen Eigenwerten hat, so ist ein großer Widlund--Winkel unerheblich.
Aber selbst einer beliebigen festen Matrix anzusehen, ob sie nur reelle
Eigenwerte hat, ist keine triviale Aufgabe.
2. Beispiele: (1) Die BDF der Ordnung
bis , die Formeln von Peter Tischer aller Ordnungen und
auch die Formeln von Tendler aller Ordnungen sind -
und -stabile Verfahren.
Aber auch die blockimpliziten Verfahren von
Bickart/Picel (1973)
sind - und -stabile Verfahren.
(2) Liniger/Gagnebin (1974)
zeigten u.a., daß
-stabil ist für .
Der lokale Fehler ist hierbei
Für erhält man die BDF3, welche - und
-stabil ist.
(3) Für ein nicht-triviales Beispiel, wo diese Eigenschaften erfüllt, aber
auch möglicherweise nicht erfüllt sind, kann man wie folgt vorgehen.
Kombiniert man in zyklischer Reihenfolge -mal das explizite und
-mal das implizite Eulerverfahren, so erhält man sofort für die
Nullstelle von die Gleichung
der man augenblicklich ansieht, daß für betragsmässig große mit
negativem Realteil, die Nullstelle sich wie untenstehend verhält:
Interessant hierbei ist, daß eine Kombination impliziter Verfahren mit
expliziten Verfahren dennoch -stabil,
bzw. -stabil sein kann.
Bei partiellen Differentialgleichungen, wo die Implizitheit von
Formeln häufig noch schwerlastiger auf die gesamte Rechenzeit einwirken,
werden sogar tatsächlich Kombinationen von expliziten und impliziten
Verfahren verwendet, beispielsweise beim
leapfrog-DuFort/Frankel-Verfahren, oder beim
odd-even-hopscotch-Verfahren.
Schwächt man noch weiter ab, daß also nicht mehr konstante Schrittweiten
zu nehmen sind, sondern auch variable Schrittweiten, so kann man sogar
alleine mit expliziten Verfahren prinzipiell auskommen.
Der Hinweis auf das Prinzipielle deswegen, weil die resultierenden
Verfahren nicht notwendig auch im praktischen Gebrauch gut einsetzbar sind.
Beim expliziten Eulerverfahren liegen die Verhältnisse besonders
durchsichtig vor.
Hier ist
und offensichtlicherweise kann man durch ein geeignet gewähltes , mit
das obige Produkt zum Verschwinden bringen.
Bei vektorwertigen Differentialgleichungen liegen die Verhältnisse nicht
mehr so einfach.
John (Jack) D. Lambert in Lambert (1986)
äußert sich hier in größerem Umfange zu dieser Problematik.
Hans Jörg Stetter reißt dieses Thema kurz in seinem
Buch "Analysis of Discretization Methods for Ordinary Differential Equations" von 1973 an, in dem Abschnitt über die Stabilitätsbereiche zyklischer Verfahren.
3. Weiteren Aufschluß über die Stabiltät eines linearen Verfahrens erhält
man, wenn man versucht zu quantifizieren, wie schnell die vom Verfahren
gelieferten Näherungswerte abklingen.
Für genügend rasch abfallende Lösungen ist die folgende Stabilitätsmenge
von Interesse:
Dies sind also diejenigen Zahlen , sodaß verschwindet,
dabei aber stets aus der offenen Kreisscheibe ist.
Weiter werden jetzt die Mengen und
verallgemeinert zu Mengen, die den Radius mit berücksichtigen.
Hier ist insbesondere natürlich von Interesse.
Es seien also die Mengen betrachtet
und
Zur Zeichnung des Randes löst man
genügend oft das verallgemeinerte Eigenwertproblem in zu
Mit durchläuft man dann eine diskrete Teilmenge von
, zum Beispiel
.
Mit wandert man von beispielsweise in Schritten
nach .
Damit erhält man also die Höhenlinien der “Funktion” ,
bzw. von .
Die “Funktion” ist implizit definiert.
Die Betragsfunktion wähle dann unter den
mehreren möglichen “Funktionswerten”, den betragsmässig größten
aus, ordnet also letztlich jedem eine komplexe Zahl zu.
Das bivariable Polynom ist natürlich algebraisch.
Lösungsäste algebraischer Funktionen haben höchstens algebraische
Singularitäten.
kann aus mehreren Zusammenhangskomponenten bestehen,
insbesondere für kleiner werdende ziehen sich die “kreisförmigen”
Komponenten immer mehr zu den Nullstellenpunkten von zusammen.
Ein mehr geometrisch-anschaulich motivierter Ansatz geht von der Betrachtung
von aus.
Dann löst man das verallgemeinerte Eigenwertproblem in zu
auf einem Gitter von für genügend viele und zeichnet entweder
nur die betragsmässig größten , oder zeichnet mehrere Schichten ein.
Eine räumliche Veranschaulichung dieses Sachverhaltes findet man in
Wanner (1987).
Wanner, Gerhard: "Order Stars and Stability", in
"The State of the Art in Numerical Analysis",
Proceedings of the joint IMA/SIAM conference held at the
University of Birmingham, 14–18 April 1986,
Edited by A. Iserles and M.J.R. Powell,
Clarendon Press, Oxford, 1987, 451—471
Für das verallgemeinerte Eigenwertproblem empfehlen sich die Unterprogramme
cqzhes(), cqzval() und cqzvec() von
Burton S. Garbow (1978), und
Garbow (1984), welche eine Implementierung des
QZ-Algorithmuses von Moler/Stewart (1973)
darstellen.
Aufgrund der Reellität der Matrixkoeffizienten, also
ist das Stabilitätsgebiet stets
achsensymmetrisch zur reellen Achse .
Die Eigenvektoren mittels cqzvec() werden für obige Stabilitätsüberlegungen nicht benötigt.
4. Bei dem, wie schon oben angegebenen charakteristischen Polynom
erhält man für immer mehr dominierendes schließlich im Grenzfalle
das Polynom zu
in etwas nachlässiger, aber sehr suggestiver Schreibweise.
Es ist hier interessant zu vermerken, daß jetzt - und
-Stabilität zueinander äquivalent sind, für geignete
und .
Dies ist ein weitergehendes Ergebnis, als man es von
der - und -Stabilität her kannte.
5. Um nun zu überprüfen ob ein Verfahren sogar
-stabil, bzw. -stabil
ist, erweitert man die 1.te Bedingung im Test A zu einer neuen Bedingung (1)
und erhält damit den
6. Test B: Ein Verfahren ist -stabil,
bzw. -stabil genau dann, wenn:
die Nullstellen von liegen in der offenen
Einheitskreisscheibe und
die Kurve der Punkte , die
erfüllen, im
Komplement von , bzw. im Komplement von
liegen.
7. Eine Möglichkeit die Bedingung (1) bei Test B zu erfüllen ist, wie es
u.a. Gear (1968) vorgeschlagen hat,
daß man alle Nullstellen von zu Null setzt.
Dies ist z.B. der Fall, wenn man fordert:
Eine einfache, notwendige und hinreichende Bedingung wird später angegeben.
Von der Sicht des Speicherplatzes, des Rechenbedarfs und der
programmiermässigen Einfachheit, sind diese Nullen besonders vorteilhaft
einsetzbar.
Diese Vorteile werden in dem Programm TENDLER genutzt.
Das Programm ODIOUS kann diese Vorteile natürlich nicht nutzen, aufgrund
, für .
Zusammen mit der Bedingung (LMSV) ergibt nun die Bedingung (NULL), daß
Nun enthält jede Stufe des Zykluses der Ordnung , die der Bedingung
(LMSV) und (Null) genügt, noch Parameter.
Jede Stufe kann aber noch skaliert werden, ohne die Stabilitätseigenschaften
zu verändern, d.h. von jeder Stufe muß man noch einen freien
Parameter abziehen.
Es bleiben dann völlig frei bestimmbare
Parameter für die -te Stufe, also ist
Wählt man die für , alle zu Null, so erhält man
wieder die BDF.
In diesem Sinne kann man die zyklischen Formeln von J.M. Tendler als
echte Verallgemeinerung der einstufigen BDF auffassen.
In der Tat unterscheiden sich die Formeln auch nicht allzu sehr in
ihren Eigenschaften und in ihren Ergebnissen, die sie liefern, insbesondere
ist bei den zyklischen Verfahren von Tendler die erste Stufe auch
immer gleich der entsprechenden BDF.
8. Die sämtlichen bisherigen Stabilitätsdefinitionen gehören zur “Begriffswelt”
der absoluten Stabilität, nicht jedoch zur relativen Stabilität.
Für den Begriff der relativen Stabilität benötigt man die folgenden
Überlegungen.
Sei
Dann ist
Sei einfache Nullstelle von
Da dann separiert ist, folgt aufgrund der stetigen Abhängigkeit der
Wurzeln für genügend kleine
das ist die Fortpflanzung der Separiertheit für genügend kleine .
Jetzt muß aber
gelten, damit für , aufgrund der
Konsistenz von .
9. Definition: Ein Matrixpolynom
heißt konsistent mit mindestens der Konsistenzordnung
genau dann, wenn die formale Ersetzung der Skalare ()
durch die Vektoren
() dann liefert
Das Matrixpolynom ist konsistent mit der genauen Ordnung
.
Gilt (), so heißt das Matrixpolynom konsistent.
Möchte man die besondere Form
besonders betonen, so spricht man von polynomial-konsistent.
Die obige Definition verallgemeinert
auf -Mehrstufigkeit mit -facher Ableitung für äquidistante Gitter.
Die Konsistenz nach obiger Festlegung ist eine Eigenschaft des Matrixpolynomes.
Sie vererbt sich sinngemäß auf das Verfahren, welches dem Matrixpolynom
i.d.R. zugrunde liegt.
Zur besseren Unterscheidung zwischen absoluter und relativer Stabilität seien
beide einander gegenübergestellt.
10. Definition: (10.1) Ein Matrixpolynom heißt
absolut-stabil
für ein genau dann, wenn für die sämtlichen Nullstellen von
gilt: .
(10.2) Die Menge derjenigen , für die das
Matrixpolynom absolut-stabil ist, also
heißt Menge der absoluten Stabilität.
Offensichtlich gilt: Enthält die offene, linke komplexe
Halbebene , so ist das Verfahren -stabil.
11. Definition: (11.1) Ein konsistentes Matrixpolynom ,
für welches einfache Nullstelle von ist, heißt
relativ-stabil für ein genau dann, wenn gilt
ist also die zu gehörende Nullstelle, wobei
().
Hat in nur den Grad 1, so sei das Matrixpolynom
relativ-stabil.
(11.2) Die Menge derjenigen , für die das Matrixpolynom
relativ-stabil ist, also
heißt Menge der relativen Stabilität.
Im Falle eines linearen Differentialgleichungssystems
mit diagonalähnlicher Matrix entstehen bei Transformation skalare
Differentialgleichungen.
Eigenwerte von mit stark negativen Realteil, also ,
führen zu schnell abklingenden Lösungen.
In diesem Falle zu forden, daß die Nebenwurzeln die Hauptwurzel
nicht betragsmässig übersteigen ist nur wichtig, wenn man an sehr
hoher relativer Genauigkeit interessiert ist, sonst allerdings nicht.
Wesentlicher ist in diesem Falle die absolute Stabilität.
Man ist an Exponentialtermen nur so lange interessiert, wie sie einen im Rahmen
der Rechengenauigkeit signifikanten Einfluß auf das Gesamtergebnis besitzen.
Spielen stark abklingende Terme keine Rolle mehr, so genügt absolute
Stabilität.
Dies motiviert die
12. Definition: (12.1) Ein konsistentes Matrixpolynom
heißt --stabil genau dann, wenn es -stabil ist
und das um den Ursprung angeordnete Rechteck
mit , Teilmenge der Menge der relativen Stabilität ist.
(12.2) Analog definiert man -- und
--Stabilität.
soll an lokal-relativ erinnern.
Die Festlegung auf ein Rechteck ist nicht wesentlich.
Genauso gut hätte man eine Kreisscheibe, eine elliptische Scheibe, ein
Hexagon, etc. nehmen können, solange es um den Ursprung angeordnet ist.
Je umfassender ist, desto günstiger.
Die Begrenzung in und rührt daher, daß Exponentialterme mit stark
imaginären Anteil, aber geringen negativen Realteil als Exponent, noch mehr
Eigenschaften benötigen als relative Stabilität.
Für Differentialgleichungen mit periodischen
Lösungen sind gesonderte Formeln besser geeignet.
13. Definition: Ein konsistentes Matrixpolynom ,
welches einer oder mehrerer der Bedingungen der
-, -, oder --,
--Stabilität genügt, heißt steif-stabil.
A computer program for plotting both the Lambda and Zeta Loci was
presented and described.
Using an interactive version of this program new and efficient
cyclic composite linear multistep methods of orders three through
seven were obtained.
The test for stiff stability of a composite linear multistep method
presented herein is entirely graphical.
Interactive communication was via a teletypewriter, the only device
available for this purpose at the computer facility used.
J.M. Tendler (1973)
1. In diesem Abschnitt wird darauf eingegangen, wie die in dem Programm
TENDLER verwendeten Formeln, von Tendler (1973)
entwickelt wurden.
Neben der schon mehrfach erwähnten Dissertation von J.M. Tendler, findet man
eine Darstellung der Parametrisierung von Verfahren in dem Aufsatz von
Donelson/Hansen (1971).
U.a. weitere Hinweise zur Konstruktion generell zyklischer Verfahren und
auch steif-stabiler zyklischer Verfahren, einschließlich entsprechender
Parametrisierungen, findet man in dem Buch von
Albrecht (1979).
Die beiden Aufsätze von Mihelčić (1977),
Mihelčić (1978),
die Veröffentlichung von Mihelčić/Wingerath (1981),
und die Disserattion von Tischer (1983), die Arbeit
Tischer/Sacks-Davis (1983)](https://doi.org/10.1137/0904051)
bzw. Tischer/Gupta (1985),
liefern ebenfalls Aufschluß über die Gewinnung zyklischer, steif-stabiler
Verfahren.
Tischer/Gupta (1985) äußern sich
dort mehr zu den Erfahrungen mit den von Tischer (1983)2 und
Tischer/Sacks-Davis (1983)3 gewonnen Formeln, wobei auch weitere
zyklische Formeln in die Bewertung mit eingeschlossen werden.
Die Dissertation von Tischer (1983) und die Arbeit von Tischer/Sacks-Davis (1983) geben sogar
zweistufige -stabile zyklische Verfahren an bis zur Ordnung
.
Über der Ordnung sind die weiterhin zweistufigen Zyklen noch
-stabil, mit =, ,
, und .
Die Formeln erfüllen sogar noch zahlreiche weitere wünschenswerte
Eigenschaften, allerdings haben sie auch gewisse Nachteile.
Tischer, Peter E.: "The Cyclic Use of Linear Multistep
Formulas for the Solution of Stiff Differential Equations", Ph.D. Thesis,
Department of Computer Science, Monash University, Clayton, Victoria,
Australia, August 1983, x+180 S.
2. Für die gestellte Aufgabe zur Gewinnung neuerer und besserer
Verfahren für die Integration steifer Differentialgleichungen ging
Tendler (1973) wie folgt vor:
Man entwerfe zyklische Formeln der Konvergenzordnung 1 bis 6, die Ordnung
für Ordnung bessere Stabilitätseigenschaften besitzen als die BDF.
Falls möglich sollten sogar Verfahren mit einer Ordnung höher als 6
entwickelt werden.
Als Vergleichsmaßstab wurde der Widlund--Winkel gewählt.
Andere Kriterien spielten keine Rolle.
Die Bedingungen (Null) und (LMSV) an die Koeffizienten
und , sorgen dafür, daß der Zyklus stets die folgende Form
hat
Die BDF erster und zweiter Ordnung
sind beide -stabil mit optimalen Widlund-Winkel von
und optimaler Widlund-Distanz , sodaß damit
eine weitere Verbesserung nicht mehr möglich ist, wenn man wie gesagt nur
den Widlund--Winkel als Vergleichsmaßstab nimmt.
Diese beiden Verfahren werden daher auch für und entsprechend
für in dem Programm TENDLER verwendet.
Die Parameter in der -ten Stufe deuten darauf hin, daß linear
unabhängige Formeln in geeigneter Kombination ausreichen, um ein neues
Verfahren zu konstruieren.
Für die Ordnungen und höher, wurde daher wie
folgt die Suche nach besseren Formeln durchgeführt:
Im ersten Schritt wurden zyklische Formeln gewonnen,
die die Bedingung (LMSV) und (Null) erfüllen und
im zweiten Schritt wurde der Widlund--Winkel numerisch
berechnet und mit dem entsprechenden Winkel für die BDF verglichen.
War dann der Winkel größer und damit besser, wurde die Suche abgebrochen,
andernfalls wurden die Parameter weiter variiert und der erste Schritt,
ggf. mit einer anderen Stufenzahl , erneut durchgeführt.
Beim ersten Schritt ging man wie folgt vor.
Zuerst wurde eine Folge von linear unabhängigen Mehrschrittformeln
aufgestellt, sodaß die -Koeffizienten eine Diagonalmatrix bilden.
Wegen der linearen Unabhängigkeit ist dies immer zu erreichen.
Diese Diagonalform erleichtert das Generieren von Zyklen mit der Eigenschaft
Da nur Linearkombinationen von diesen Mehrschrittformeln gebildet werden,
ist das Erfülltsein von (LMSV) ebenfalls sofort klar.
Dann wurde für jedes eine Linearkombination dieser Formeln
berechnet um daraus die -te Stufe des Zykluses zu bilden.
Die Stufenzahl wurde versucht so klein wie möglich zu halten.
Um das Vorgehen zu illustrieren ein längeres Beispiel.
3. Beispiel: Es seien die linear unabhängigen
Mehrschrittformeln bis der Konsistenzordnung 3 betrachtet:
Jede Zeile der Matrix ist dabei das entsprechende Mehrschrittverfahren,
also die erste Zeile ist F1, die zweite ist F2 und so fort.
Das Verfahren ist implizit, während hingegen , und
explizite Verfahren sind.
Wie so häufig gilt auch hier, daß die einzelnen Stufen instabil sind, mit
Ausnahme der ersten, welche gerade die BDF3 ist, mit den Nullstellen 1 und
.
Die Nullstellen der zweiten “Zeile” liegen bei 1, und .
Die dritte “Zeile” hat die Nullstellen 1, und und
schließlich die letzte vierte Zeile hat die Nullstellen 1 und
.
Diese Instabilität der Stufen bzw. von Komponenten der Stufen, überträgt
sich nicht automatisch auf den Gesamtzyklus.
Die Stabilität des Gesamtzyklus wird getrennt überprüft.
Von diesem Arsenal an Formeln wurde nun der
Zyklus für das Verfahren dritter Ordnung, wie folgt aufgebaut:
Jede Stufe wurde als Linearkombination der
bis erhalten, d.h. die -te Stufe ist gleich
Um nun die Bedingung (NULL) zu erfüllen, muß offensichtlich
für gelten.
Der Widlund--Winkel wurde jetzt für die Werte maximiert:
Der so gebildete Zyklus der Ordnung kann daher wie folgt geschrieben
werden:
Weil der Widlund--Winkel grösser und damit besser als der
entsprechende Winkel für BDF3 ausgefallen war, wurde der Zyklus akzeptiert.
Die Formeln der Konvergenzordnung bis wurden auf genau die oben
beschriebene Art und Weise erhalten.
Daß bei diesem Beispiel die ersten beiden Stufen gleich sind, nämlich
hier gleich BDF3, ist mehr oder minder Zufall.
Mit der Bedingung für hat dies nichts zu tun.
Beim zyklischen Verfahren sechster Ordnung sind auch tatsächlich
alle Stufen untereinander verschieden.
Bei allen anderen Verfahren hingegen, außer eben bei , sind die
ersten beiden Stufen gleich und zwar gleich der entsprechenden BDF.
4. Es waren 3 Stufen nötig für die
Verfahren 3.ter und 4.ter Ordnung und 4 Stufen für die Formeln 5.ter, 6.ter
und 7.ter Ordnung.
Die genauen Zahlenwerte für die Koeffizienten aller Zyklen werden später
in einem Schema angegeben.
Es sei angemerkt, daß immer die ersten beiden
Stufen des -ten Zykluses mit BDF beginnen.
Dies gilt bei allen Verfahren, außer bei der Ordnung .
Dort ist es nur die 1.te Stufe.
5. Zum Vergleich seien einmal die Werte für den
Widlund--Winkel für die neuen zyklischen Mehrschrittverfahren,
die in dem Programm TENDLER verwendet werden, mit denen der BDF in der
untenstehenden Tabelle gegenübergestellt.
Auch findet man die entsprechenden Werte für die Formeln, die in der Dissertation
Tischer (1983),
bzw. Tischer/Sacks-Davis (1983)
entwickelt haben, unter der Spalte ODIOUS.
BP73 bezeichnet hier die blockimpliziten Verfahren von
Bickart/Picel (1973).
Die BDF, für alle , sind nicht -stabil, also natürlich erst
recht nicht - bzw. -stabil.
Einen Beweis und alternative Beweisansätze findet man in dem Buch von
Hairer/Wanner/Nørsett (1987)
oder hier Hairer/Wanner (1983): On the Instability of the BDF Formulas.
Zyklische Verfahren über der Ordnung werden in dem Programm
TENDLER nicht verwendet.
Die Programme LSODE, LSODA und LSODAR benutzen die BDF lediglich bis zur
Ordnung .
Rechts daneben ist auch eine Gegenüberstellung der -Werte bei
der -Stabilität.
6. Die besseren Stabilitätseigenschaften, die sich durch den größeren
Widlund--Winkel bemerkbar machen, erlauben nun einem Programm,
welches die hergeleiteten Formeln benutzt, früher die Schrittweite zu
erhöhen, da sie nicht durch Stabilitätsbeschränkungen verkleinert
werden muß.
Insbesondere für Differentialgleichungen, bei denen die
Eigenwerte der Jacobimatrix nahe der imaginären Achse sind, sollten
besser integriert werden können.
Das Suchverfahren nach steif-stabilen zyklischen Formeln wird beschrieben in
der Dissertation von Tendler (1973).
Dort wird auch ein Programm zur Berechnung des Widlund--Winkels
angegeben, basierend auf einem Polynomlöser.
Das hier beschriebene Suchverfahren hängt von einem Programm zur Berechnung
des Widlund-Winkels ab.
Man beachte, daß alle Verfahren interaktiv gefunden wurden:
“Probieren-gucken”, “probieren-gucken”,
Wenn also hier von “maximiert” gesprochen wird, ist damit gemeint,
daß durch Suchen, nicht jedoch kalkülmässig, in geschlossener Form,
eine Maximierung stattgefunden hat.
Sieht man einmal von grundsätzlichen Einstellungen ab, so kann man diesem
pragmatischen Ansatz seine Bedeutung nicht absprechen.
Es wurde auch versucht ein Verfahren der Konvergenzordnung zu
erhalten, welches steif-stabil ist, doch gelang dies nicht.
Dies führt Tendler (1973) darauf zurück, daß eben
nur interaktiv gesucht wurde.
Eine andere Möglichkeit wird darin gesehen, daß die Begrenzung der Anzahl
der Stufen auf zu restriktiv gewesen sei.
Testläufe haben ergeben, daß die Auffindung von zyklischen Verfahren mit
mehr als 4 Stufen durchaus sinnvoll sein kann.
Oder m.a.W., die Erfahrungen mit dem Programm TENDLER deuten darauf hin,
daß Zyklen mit mehr als 4 Stufen nicht krass den praktischen Bedürfnissen
widerstreben.
Ob diese Erfahrung grundsätzlich für geeignete vielstufige Zyklen sich
bestätigen könnte, kann selbstverständlich nicht pauschal postuliert werden.
Ein Einbau solcher Formeln in das Programm TENDLER zumindestens wäre völlig
unproblematisch.
Da jede Stufe Element einer ringzyklischen Liste ist, macht es keinen
Aufwand hier eine weiteres Ringelement einzufügen.
Zudem ist die Konstante 4 als Programmkonstante MAXYRING abgelegt.
Außer Konstantenänderungen sind keine Änderungen nötig,
insbesondere keine algorithmischen, vorausgesetzt es handelt sich um echte
Verallgemeinerungen der BDF, wie es beispielsweise die Tendlerschen Zyklen
darstellen.
Man beachte hierzu die Ausführungen bzgl. der Prädiktorformeln.
Zu berücksichtigen ist jedoch, daß der Speicherplatzbedarf dann größer wird,
allerdings nur in linearen Termen der Dimension der
Differentialgleichung.
Dies nur, falls die Ordnung 7 übersteigt.
Dies liegt an der Notwendigkeit zur Bildung rückwärtsgenommener Differenzen
bis zur Ordnung in dem Programm TENDLER.
6. Basisformeln der Tendlerschen Zyklen
1. Die Bestandteile der zyklischen Formeln von Tendler (1973) lauten:
Die in jeder Tabelle ganz rechts stehende Formel, ist immer die BDF.
Die restlichen Formeln sind explizite Verfahren.
Alle unten aufgeführten Formeln benötigen Startwerte und besitzen
die Konsistenzordnung .
Die im folgenden angegebenen Basisformeln sind also ersteinmal nur für die
Konstruktion von Zyklen der Konvergenzordnung geeignet.
Wünscht man andere Konvergenzordnungen, bei anderer Schrittzahl, so gelten
die Überlegungen jedoch entsprechend.
Berücksichtigt man den Effekt der annullierten Dominanz, so sind die
angegebenen Basisformeln auch für zyklische Verfahren der Konvergenzordnung
geeignet.
Unter den Verfahren befindet sich stets der entsprechende,
gänzlich unskalierte Fehlerfaktor, der berechnet wurde nach der Vorschrift
Die Basisformeln im einzelnen.
2. Die Werte zur Bildung der Linearkombination der zyklischen
Formeln von Tendler lauten in der Reihenfolge und wie folgend:
7. Äquilibrierung von Formeln
Es folgt die Definition von Äquilibrierungsmaßen für eine
konsistente Formel der Form
1. Definition: Eine Formel hat
(1) Gaußsches--Äquilibrierungsmaß
(2) Gaußsches--Äquilibrierungsmaß
,
(3) Gauß-Henrici-Äquilibrierungsmaß
,
(4) Tschebyscheff--Äquilibrierungsmaß
(5) Tschebyscheff--Äquilibrierungsmaß
,
(6) Tschebyscheff-Henrici-Äquilibrierungsmaß
.
Sollten Zyklen mit geringem Äquilibrierungsmaß in den führenden
Koeffizienten stark flukturieren, so kann man daran denken, bei der Suche
nach günstigen Formeln die folgende
Deviation der führenden Koeffizienten
klein zu halten.
Sei .
Es gibt zyklusinterne Deviationen.
Man begrenzt dann beispielsweise die Gaußsche Deviation der Koeffizienten,
nämlich .
2. Beispiel: Sei .
Es gibt Deviationen.
Man fordert Beschränktheit, oder in besonderen Situationen auch Minimalität,
durch
Es sollen nun einige Eigenschaften der Äquilibrierungsmaße hergeleitet werden.
Es handelt sich hier um direkt aus der Definition herleitbare Aussagen.
3. Satz: Es gelten
(1) , .
Die Ungleichungen sind scharf, beispielsweise für die beiden Euler-Verfahren
(2) , .
(3) und sind stets definiert für -stabile Verfahren,
wegen , da 1 keine mehrfache Nullstelle sein darf.
Die -Äquilibrierungsmaße treten vornehmlich im Zusammenhang mit
expliziten gewöhnlichen Differentialgleichungen der Form
auf.
Die -Äquilibrierungsmaße treten bei DAE auf, die man mit linearen
Mehrschrittverfahren löst, und die Henrici-Äquilibrierungsmaße treten
gehäuft im Zusammenhang mit Einbein-Verfahren auf.
Man ist grundsätzlich, ersteinmal ohne Einschränkungen, an möglichst kleinen
Äquilibrierungsmaßen interessiert.
Bei Quadraturformeln ist aus Erfahrung bekannt, daß große Äquilibrierungsmaße
ungünstig sind, da diese Quadraturformeln zu Oszillationen neigen.
Jedoch bedeuten kleine Äquilibrierungsmaße nicht auch automatisch kleine
Fehlerkonstanten.
Gegenbeispiele anhand numerisch gewonnener Formeln sind bekannt.