Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Εθνικο Μετσοβιο ΠολυτεχνειοΣχολη Εϕαρμοσμενων Μαθηματικων amp
Φυσικων Εϕαρμογων
Τομεας Μαθηματικων
Βέλτιστος ΄Ελεγχος σε ΠαραβολικέςΜερικές Διαϕορικές Εξισώσεις Αριθμητική
Ανάλυση και Εϕαρμογές
ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ
του
ΕΥΘΥΜΙΟΥ Ν ΚΑΡΑΤΖΑΔιπλωματούχου Μαθηματικού
Αθήνα Φεβρουάριος 2015
Εθνικο Μετσοβιο ΠολυτεχνειοΣχολη Εϕαρμοσμενων Μαθηματικων amp Φυσικων Εϕαρμογων
Τομεας Μαθηματικων
Βέλτιστος ΄Ελεγχος σε ΠαραβολικέςΜερικές Διαϕορικές Εξισώσεις Αριθμητική
Ανάλυση και Εϕαρμογές
ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ
του
ΕΥΘΥΜΙΟΥ Ν ΚΑΡΑΤΖΑΔιπλωματούχου Μαθηματικού
Συμβουλευτική Επιτροπή Κωνσταντίνος Χρυσαϕίνος΄Ιωνας ΧρυσοβέργηςΒασίλειος Κοκκίνης
Εγκρίθηκε από την επταμελή εξεταστική επιτροπή την 4η Φεβρουάριος 2015
Κ Χρυσαϕίνος Ι Χρυσοβέργης Β ΚοκκίνηςΑν Καθηγητής ΕΜΠ Καθηγητής ΕΜΠ Επικ Καθηγητής ΕΜΠ
Ι Τσινιάς Α Χαραλαμπόπουλος Ι ΚωλέτσοςΚαθηγητής ΕΜΠ Αν Καθηγητής ΕΜΠ Επ καθηγητής ΕΜΠ
Εμ ΓεωργούληςΚαθηγητήςLeicester University
Αθήνα Φεβρουάριος 2015
ΕΥΘΥΜΙΟΣ Ν ΚΑΡΑΤΖΑΣΔιδάκτωρ Μαθηματικός ΣΕΜΦΕ ΕΜΠ
c⃝ 2015 - All rights reserved
i
Βέλτιστος ΄Ελεγχος σε Παραβολικές Μερικές ΔιαφορικέςΕξισώσεις Αριθμητική Ανάλυση και Εφαρμογές
Σύντομη περίληψηΤο κύριο αντικείμενο της διδακτορικής διατριβής είναι ο κατανεμημένος και συνοριακός έλεγχος σεπροβλήματα μερικών διαφορικών εξισώσεων εξελικτικού τύπου με τη μέθοδο πεπερασμένων στοιχείωνGalerkin Εξετάζουμε πρόβλημα συνοριακού ελέγχου τύπου Robin για γραμμικές παραβολικές εξι-σώσεις κατανεμημένο έλεγχο σε ημιγραμμικό παραβολικό πρόβλημα καθώς και κατανεμημένο έλεγχοσε εξελικτικό πρόβλημα Stokes Παρουσιάζουμε αποτελέσματα με ελέγχο με περιορισμούς με ελάχιστηομαλότητα στα δεδομένα του προβλήματος και επαληθεύονται αριθμητικά ακόμη και για L2(Ω) δεδομένααποδεικνύονται η ευστάθεια η σύγκλιση και εξετάζονται συνθήκες πρώτης και δεύτερης τάξης για τοτετραγωνικό συναρτησιακό Τέλος παραθέτουμε αριθμητικά αποτελέσματα για ενα πρόβλημα βιολο-γίας που αποτελείται απο σύστημα δυο εξισώσεων μιας γραμμικής και μιας ημιγραμμικής παραβολικήςεξίσωσης με κατανεμημένο έλεγχο
Λέξεις κλειδιά Βέλτιστος έλεγχος Ασυνεχή χρονικού βηματισμού σχήματα Galerkin Προ-σεγγίσεις πεπερασμένων στοιχείων Εξισώσεις Στοκες Πρόβλημα ταχύτητας Ημιγραμικά προβλήματαΦιτζυγη Ναγυμο Κατανεμημένος έλεγχος Ροβιν συνοριακός έλεγχος Εκτιμήσεις σφαλμάτων
Optimal Control and Parabolic Partial Differential EquationsNumerical Analysis and Applications
AbstractThe main object of the thesis is distributed and boundary optimal control in evolutionary - parabolicpartial differential equations problems using a discontinuous in time Galerkin finite element methodWe examine a Robin type boundary control problem for linear parabolic equations distributed controlin semilinear parabolic problem and distributed control in evolutionary Stokes problem We presentresults and optimal convergence rates in the cases of constrained and unconstrained control minimalsmoothness for the data of the problem and we numerically verify them even for L2(Ω) data We provestability convergence and we examine first and second order conditions for the quadratic functionalFinally we present numerical results for a biological problem which consists of two equations a linearand a semilinear parabolic equation with distributed control
We study first order in time and second order in space linear and semilinear evolutionary problemsthat often occur in applications to boundary problems for parabolic problems and Stokes systems Wewill present semilinear parabolic problems with zero Dirichlet boundary conditions linear parabolicproblems with Robin boundary conditions Stokes and Fitzugh-Nagumo systems with zero Dirichletboundary conditions
Particularly the aim is to focus on specific problems often encountered in practice than to studymore general problems in which the same analysis techniques may be applied This allows someonein short time to produce immediate results which are easy to use in applications
Περιεχόμενα
I Περιγραφή της Διατριβής 1
1 Εισαγωγικές έννοιες 311 Εισαγωγή 4
111 Βασικά στοιχεία προβλήματος βέλτιστου ελέγχου 412 Μελέτη προβλήματος βέλτιστου ελέγχου 513 Περιγραφή των προβλημάτων υπό μελέτη 514 Σχετικά αποτελέσματα - παλιότερες μελέτες 10
2 Βασικές έννοιες 1321 Χώροι Sobolev 14
211 Ασθενείς παράγωγοι 14212 Ορισμός χώρων Sobolev 14213 Συμπάγεια 15214 Ο χώρος Hminus1 16
22 Βασικές ιδιότητες ιχνών 16221 Ενδιάμεσοι-κλασματικοί χώροι 16
23 Χώροι που εμπεριέχουν χρόνο 18231 Χώροι λύσεων 19
24 Χρήσιμες ανισότητες 1925 Frechet Gateaux και παράγωγος κατά κατεύθυνση 20
3 Συνεχές Σύστημα Βελτιστοποίησης ΄Υπαρξη Λύσης 2131 Βασικές υποθέσεις 2232 Συνεχές πρόβλημα ελέγχου και ύπαρξη λύσης 2333 Το Σύστημα βελτιστοποίησης 26
4 Προσεγγισιμότητα και Αριθμητική Ανάλυση 3141 Το διακριτό πρόβλημα βέλτιστου ελέγχου 32
411 Προκαταρκτική μελέτη και ιδιότητες πλέγματος 32412 Το πλήρες διακριτοποιημένο πρόβλημα βελτιστοποίησης 35413 Το διακριτοποιημένο σύστημα βελτιστοποίησης 42
42 Εκτιμήσεις σφαλμάτων 47421 Γραμμικό πρόβλημα συνοριακού Robin ελέγχου 47422 Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου 60423 Πρόβλημα κατανεμημένου ελέγχου Stokes 75
5 Πείραμα Συνοριακού Ελέγχου σε Παραβολικές Γραμμικές μδε 8551 Συνοριακές συνθήκες Robin - Περιγραφή του μοντέλου 86
511 Ομαλότητα στα αρχικά δεδομένα 86512 Μικρή ομαλότητα στα αρχικά δεδομένα 91513 Πείραμα με χρήση γραμμικών πολυωνύμων στο χώρο και στο χρόνο 92
6 Πείραμα Κατανεμημένου Ελέγχου σε Ημιγραμμικές Παραβολικές μδε 9761 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου 98
611 Σταθερά πολυώνυμα στο χρόνο και γραμμικά στο χώρο 98612 Ισχυρές συνθήκες Wolfe-Powel 99
vi Περιεχόμενα
7 Πείραμα Κατανεμημένου Ελέγχου σε Εξισώσεις Stokes 10171 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου 102
711 Ομαλά δεδομένα 103712 Δεδομένα με μικρή ομαλότητα (ασυνέχεια στα y0 yd g) 105
8 Εφαρμογή στη Βιολογία Πείραμα Κατανεμημένου Ελέγχου σε Συστήματα Ημιγραμ-μικών Παραβολικών μδε 11181 Κατανεμημένος έλεγχος σε συστήματα FitzHugh-Nagumo 112
811 Εισαγωγή - Ιστορική αναδρομή 112812 Περιγραφή του μοντέλου 113813 Η ασθενής μορφή 113814 Το πλήρως διακριτοποιημένο πρόβλημα 114815 Αριθμητικές εφαρμογές 115
9 Ευχαριστίες 123
Λίστα συμβόλων 123
Κατάλογος Πινάκων 127
Κατάλογος Σχημάτων 129
Αʹ Παράρτημα 131Αʹ1 Προβολές 133Αʹ2 Εκθετική παρεμβολή 137Αʹ3 Διακριτή χαρακτηριστική συνάρτηση 138
II Περιγραφή της Διατριβής στα Αγγλικά - (Thesis Description in Engli-sh) 139
1 Introduction 14311 Description of the problems under consideration 14412 Related results 148
2 The Continuous Optimality System The Existence Of The Solution 15121 Assumptions 15222 The continuous control problem and the existence of solution 15323 The optimality system 156
3 Approximation and Numerical Analysis 15931 The discrete optimal control problem 160
311 Preliminaries and mesh properties 160312 The fully-discrete optimal control problem 163313 The discrete optimality system 170
32 Error estimates 174321 Robin boundary control problem 174322 Unconstrained Controls Preliminary estimates for the optimality system 181323 Semilinear distributed optimal control problem 187324 Stokes distributed optimal control problem 201
4 Robin Boundary Control Experiment in Linear Parabolic Pdes 21341 Robin boundary conditions setting the model 214
411 Smooth initial data 214412 Nonsmooth initial data 219413 Experiment using linear polynomials in space and time 219
Περιεχόμενα vii
5 Distributed Control Experiment In Semilinear Parabolic Pdes 22551 Distributed control - Description of the model 226
511 Constant polynomials in time and linear in space 226512 Strong Wolfe-Powel conditions 227
6 Experiment for Stokes Equations with Distributed control 22961 Distributed control in Stokes - description of the model 230
611 Smooth data 231612 Rough initial data (discontinuity of y0 yd g) 233
7 An Application In Biology Experiment With Distributed Control in Semilinear ParabolicSystems Of Pdes 23971 Distributed control subject to FitzHugh-Nagumo systems 240
711 Introduction - Related results 240712 Description of the model 241713 Weak form 241714 The full discretized system 242715 Numerical Experiments 243
List Of Symbols 249
List of Tables 251
List of Figures 253
A Appendix 255A1 Projections 257A2 The exponential interpolant 261A3 The discrete characteristic function 262
Bibliography 263
Πρόλογος
Η παρούσα διατριβή έχει υποβληθεί στη Σχολή Εφαρμοσμένων Μαθηματικών του Εθνικού ΜετσόβειουΠολυτεχνείου ως επιμέρους τμήμα σύμφωνα με τις απαιτήσεις για τη λήψη διδακτορικού διπλώματος Ηδουλειά που παρουσιάζεται ξεκίνησε το 2009 και ολοκληρώθηκε το 2014 υπό την επίβλεψη του ΑναπλΚαθηγητή Κωνσταντίνου Χρυσαφίνου
Η διατριβή είναι συνέχεια της μεταπτυχιακής εργασίας με τίτλο lsquolsquoΑνάλυση και προσεγγίσεις προβλη-μάτων βέλτιστου ελέγχου για εξελικτικές εξισώσεις βασικές έννοιες μερικά βασικά αποτελέσματαrsquorsquo υπότην επίβλεψη του Αναπλ Καθ Χρυσαφίνου την οποία υποστήριξα το 2009 αν και η πιο βαθιά μελέτησχετικά με τις μδε άρχισε αρκετά πρωτύτερα με τη μεταπτυχιακή μου εργασία με τίτλο lsquolsquoΥπερβολικέςμδε στην αεροακουστική έρευνα μοντέλο της ραδιοφωνικής κεραίαςrsquorsquo υπό την επίβλεψη του Καθ ΔΤσουμπελή την οποία υποστήριξα το 2001 στο Μαθηματικό Τμήμα του Πανεπιστημίου Πατρών
Αντικείμενο της ΔιατριβήςΟ πλήρης τίτλος της διατριβής είναι lsquolsquoΠεπερασμένα Στοιχεία Ασυνεχής Μέθοδος Galerkin και Βέλτι-στος ΄Ελεγχος Παραβολικών Μερικών Διαφορικών Εξισώσεων Αριθμητική Ανάλυση Μικρή ΟμαλότηταΔεδομένων και Εφαρμογέςrsquorsquo Θεωρούμε κυρίως πρώτης τάξης χρονικά και δεύτερης τάξης γραμμικά καιημιγραμμικά εξελικτικά προβλήματα που εμφανίζονται συχνά σε εφαρμογές ως συνοριακά προβλήματατιμών για παραβολικά προβλήματα και συστήματα Stokes Θα μελετηθούν παραβολικά ημιγραμμικάπροβλήματα με μηδενικές Dirichlet συνοριακές συνθήκες παραβολικά γραμμικά προβλήματα με Robinσυνοριακές συνθήκες συστήματα Stokes και Fitzugh-Nagumo με μηδενικές Dirichlet συνοριακές συν-θήκεςΕιδικότερα ο σκοπός είναι να επικεντρωθούμε σε συγκεκριμένα προβλήματα που συναντάμε συχνά στηπράξη παρά να μελετήσουμε γενικά προβλήματα στα οποία οι ίδιες τεχνικές ανάλυσης πιθανόν να εφαρ-μόζονται Αυτό επιτρέπει σε κάποιον σε μικρό χρονικό διάστημα να παράγει πιο άμεσα αποτελέσματακαι εύχρηστα στις εφαρμογές
Αφιερώνεταιστους γονείς μου Νικόλαο και Μαρίαστη σύζυγό μου Γεωργία καιστους γιους μου Νικόλα και μπέμπη
ΜέροςIΠεριγραφή της Διατριβής
Εισαγωγικές έννοιεςΑυτό το κεφάλαιο παρουσιάζει τις εισαγωγικές θεωρητικές και υπολογιστικές αρχές που θα χρησιμοποι-ηθούν στα επόμενα κεφάλαια
11 Εισαγωγή 4
111 Βασικά στοιχεία προβλήματος βέλτιστου ελέγχου 4
12 Μελέτη προβλήματος βέλτιστου ελέγχου 5
13 Περιγραφή των προβλημάτων υπό μελέτη 5
14 Σχετικά αποτελέσματα - παλιότερες μελέτες 10
1
Περιεχόμενα
4 1 Εισαγωγικές έννοιες
11 Εισαγωγή
Στα επόμενα και για καλύτερη κατανόηση παραθέτουμε εισαγωγικά τις συνθήκες βελτιστοποίησηςυπολογισμούς για τις παραγώγους κατά κατεύθυνση και κάποιες σημαντικές παρατηρήσεις σrsquo αυτάόπως πολύ εύστοχα κατέγραψε ο E Casas στο CIMPA School on Optimization and Control το2006
111 Βασικά στοιχεία προβλήματος βέλτιστου ελέγχου
Σε ένα πρόβλημα βέλτιστου ελέγχου βρίσκουμε τα ακόλουθα βασικά στοιχεία
Α ΄Εναν έλεγχο g τον οποίο μπορούμε να τον χειριστούμε όπως θέλουμε και μπορεί να επιλεγεί απόμια οικογένεια εφικτών ελέγχων K
Β Την κατάσταση y του συστήματος που πρέπει να ελεγχθεί η οποία και εξαρτάται από τον έλεγχοΚάποιοι περιορισμοί μπορούν να επιβληθούν στην βασική μεταβλητή y δηλαδή δεν είναι ικανοποι-ητική κάθε πιθανή κατάσταση του συστήματος
Γ Η εξίσωση κατάστασης που καταδεικνύει την εξάρτηση μεταξύ του ελέγχου και της βασικήςμεταβλητής Στις επόμενες παραγράφους αυτή η εξίσωση συνθηκών θα είναι μια μερική διαφορικήεξίσωση y είναι η λύση της εξίσωσης και g είναι μια συνάρτηση που εμφανίζεται στην βασικήεξίσωση έτσι ώστε κάθε αλλαγή στον έλεγχο g προκαλεί αλλαγή και στη λύση y
Δ Μια συνάρτηση που θέλουμε να ελαχιστοποιηθεί η οποία ονομάζεται συνάρτησης κόστους καιεξαρτάται από τον έλεγχο και τη βασική μεταβλητή (y g)
Στόχος είναι να προσδιορίσουμε επιτρεπτό έλεγχο ο οποίος ονομάζεται βέλτιστος έλεγχος που μαςπαρέχει ικανοποιητική κατάσταση του συστήματος και ελαχιστοποιεί την τιμή του συναρτησιακού J
Τα θεμελιώδη ερωτήματα που προκύπτουν και πρέπει να μελετήσουμε είναι η ύπαρξη της λύσης και ουπολογισμός της Εντούτοις για να βρούμε τη λύση πρέπει να χρησιμοποιήσουμε κάποιες αριθμητικέςμεθόδους και για την αριθμητική ανάλυση προκύπτουν κάποιες λεπτεπίλεπτες μαθηματικές ερωτήσεις
Το πρώτο βήμα για να λύσουμε αριθμητικά το πρόβλημα απαιτεί τη διακριτοποίηση του προβλήματοςελέγχου η οποία συνήθως γίνεται με πεπερασμένα στοιχεία Μια φυσική ερώτηση είναι lsquolsquoπόσο καλήείναι η προσέγγισηrsquorsquo Προφανώς θα θέλαμε να έχουμε κάποιες εκτιμήσεις σφαλμάτων για αυτές τιςπροσεγγίσεις Με σκοπό να παράγουμε τις εκτιμήσεις σφαλμάτων είναι θεμελιώδες να έχουμε κάποιαομαλότητα για το πρόβλημα βέλτιστου ελέγχου και συχνά είναι απαραίτητη (ανάλογα και με τις υπο-θέσεις που πιθανόν θα κάνουμε) και κάποια τάξη διαφορισιμότητας ή τουλάχιστον κάποιες παράγωγοιμε την ασθενή έννοια Η ομαλότητα του προβλήματος βέλτιστου ελέγχου μπορεί να βρεθεί από τιςπρώτης τάξης συνθήκες βελτιστοποίησης ΄Ενα άλλο εργαλείο κλειδί για την εύρεση και απόδειξη τωνεκτιμήσεων σφαλμάτων είναι η χρήση δεύτερης τάξης συνθηκών βελτιστοποίησης Οπότε η ανάλυσήμας απαιτεί να βρούμε τη πρώτης και δεύτερης τάξης συνθήκη βελτιστοποίησης
Σημείωση 111 Αν (t x) isin [0 T ] times Ω και Γ το σύνορο ένα τυπικό συναρτησιακό στη θεωρίαελέγχου είναι το
J(g) =int T
01
2yg(x)minus yd2L2(Ω) + α
2 g2L2(S)dt
όπου S = Ω ή Γ και yd isin L2 συμβολίζει την ιδανική κατάσταση του συστήματος και α gt 0 Ο όροςint T0
α2 g2L2(S)dt μπορεί να θεωρηθεί ως όρος κόστους και τότε λέμε ότι ο έλεγχος είναι lsquolsquoακριβόςrsquorsquo αν το
12 Μελέτη προβλήματος βέλτιστου ελέγχου 5
α είναι μεγάλο και ο έλεγχος είναι lsquolsquoφθηνόςrsquorsquo αν ο α είναι μικρός ή μηδέν Από μαθηματική πλευρά ηπαρουσία αυτού του όρου με α gt 0 έχει ομαλοποιητική επίδραση στον βέλτιστο έλεγχο
Σημείωση 112 Υπάρχουν πολλές επιλογές για το σύνολο των εφικτών ελέγχων πιο συχνός όμωςείναι ο K = L2 Σημαντικό είναι ότι ο K πρέπει να είναι κλειστός και κυρτός Επιπλέον αν ο Kδεν είναι φραγμένος τότε απαιτούνται κάποιες υποθέσεις πιεστικότητας για το συναρτησιακό J για ναεξασφαλίσουν την ύπαρξη λύσης
12 Μελέτη προβλήματος βέλτιστου ελέγχου
Εφόσον διακριτοποιήσουμε το πρόβλημα βελτιστοποίησης πρέπει να χρησιμοποιήσουμε κάποιους αριθ-μητικούς αλγόριθμους βελτιστοποίησης για να λύσουμε το πρόβλημα ΄Οταν το πρόβλημα δεν είναικυρτό ο αλγόριθμος βελτιστοποίησης ουσιαστικά παρέχει τοπικό ελάχιστο Η ερώτηση τώρα είναιαν αυτά τα τοπικά ελάχιστα είναι ενδεικτικά για το αρχικό πρόβλημα βελτιστοποίησης Τα ακόλουθαβήματα που πρέπει να ακολουθηθούν όταν μελετάμε ένα πρόβλημα βέλτιστου ελέγχου είναι
α) ΄Υπαρξη λύσης
β) Πρώτης και δεύτερης τάξης συνθήκες βελτιστοποίησης
γ) Αριθμητική προσέγγιση
δ) Αριθμητική ανάλυση του διακριτού προβλήματος ελέγχου
ε) Αριθμητικοί αλγόριθμοι βελτιστοποίησης
Οι πρώτης τάξης συνθήκες βελτιστοποίησης είναι απαραίτητες για τοπική βελτιστοποίηση εκτός από τηνπερίπτωση κυρτών προβλημάτων που τότε γίνονται επαρκείς συνθήκες για ολική βελτιστοποίηση Στηναπουσία κυρτότητας για ολική βελτιστοποίηση απαιτούνται και οι συνθήκες βελτιστοποίησης δεύτερηςτάξης Οι επαρκείς συνθήκες παίζουν πολύ σημαντικό ρόλο στην αριθμητική ανάλυση αυτών των προ-βλημάτων Οι συνθήκες βελτιστοποίησης δεύτερης τάξης δείχνουν καθαρά αν οι επαρκείς συνθήκεςείναι λογικές με την έννοια ότι η εκπλήρωσή τους δεν είναι πολύ περιοριστική για να απαιτηθεί
13 Περιγραφή των προβλημάτων υπό μελέτη
Σrsquo αυτή τη παράγραφο περιγράφουμε τα προβλήματα τα οποία θα αντιμετωπίσουμε στη διατριβή Πιοσυγκεκριμένα θέλουμε να ελαχιστοποιήσουμε την απόσταση μεταξύ του y και μιας δοσμένης κατανομήςyd int T
0
int
Ω|y minus yd|2
Σχετικά με τον έλεγχο έχουμε τον όρο στο συναρτησιακό
int T
0
int
S
|g|2
όπου S είναι Ω ή Γ ανάλογα με το αν ασκούμε συνοριακό ή κατανεμημένο έλεγχο
Παρακάτω παρουσιάζουμε τα προβλήματα που θα μας απασχολήσουν σε συνδυασμό με το συναρτησιακόπου θέλουμε να ελαχιστοποιήσουμε (θα έχουμε περιορισμούς που θα αποτελούνται από εξελικτικέςμδε)
6 1 Εισαγωγικές έννοιες
Γραμμικό πρόβλημα συνοριακού Robin ελέγχου Θεωρούμε ένα πρόβλημα βέλτιστου ελέγχου πουσχετίζεται με την ελαχιστοποίηση του συναρτησιακού παρακολούθησης υπό την επίδραση γραμμικήςπαραβολικής μδε (μερικής διαφορικής εξίσωσης) χωρίς ουσιαστική ομαλότητα στα αρχικά δεδομέναΕιδικότερα δεδομένης συνάρτησης στόχου yd αναζητούμε βασική μεταβλητή y και μεταβλητή Robinσυνοριακού ελέγχου g τέτοια ώστε το συναρτησιακό
J(y g) = 12
int T
0y minus yd2L2(Ω) dt+ α
2
int T
0g2L2(Γ) dt (131)
να ελαχιστοποιείται υπό τους περιορισμούς
yt minus η∆y = f στο(0 T ]times Ω
y + η
λ
party
partn = g στο (0 T ]times Γ (132)
y(0 x) = y0 στο Ω
Εδώ το Ω sub R2 συμβολίζει ένα ανοιχτό πολυγωνικό και κυρτό χωρίο με σύνορο Lipschitz Γ Ο έλεγ-χος g εφαρμόζεται στο σύνορο Γ και είναι τύπου Robin Η ανάλυσή μας και τα αποτελέσματά μας θαεπικεντρωθούν στη περίπτωση με υποθέσεις χαμηλής ομαλότητας δηλαδή αρχικά δεδομένα y0 isin L2(Ω)αλλά η ανάλυσή μας θα είναι επίσης εφαρμόσιμη και σε άλλες περιπτώσεις όπου η λύση παρουσιάζει ε-πιπλέον ομαλότητα Επιπροσθέτως ενδιαφερόμαστε για τη περίπτωση σημειακών περιορισμών για τονέλεγχο υπό την έννοια ga le g(t x) le gb για σπ (t x) isin (0 T ] times Γ όπου ga gb isin R Μια ακριβήςμοντελοποίηση θα δοθεί παρακάτω Ο όρος δύναμης f και οι παράμετροι λ gt 0 η gt 0 είναι δεδομέναενώ το α gt 0 συμβολίζει τη παράμετρο ποινής η οποία περιορίζει το μέγεθος του ελέγχου Η περίπτωσηαρχικών δεδομένων χωρίς ομαλότητα είναι πολύ σημαντική στο πλαίσιο των εν λόγω συνοριακών προ-βλημάτων βέλτιστου ελέγχου και ασκείται μεγάλη προσοχή ώστε να συμπεριληφθεί η περίπτωση αυτήστην ανάλυσή μαςΟ κύριος σκοπός μας είναι να δείξουμε πως οι εκτιμήσεις σφαλμάτων του αντίστοιχου συστήματος βελ-τιστοποίησης έχει την ίδια δομή με τις εκτιμήσεις χωρίς έλεγχο γραμμικής παραβολικής εξίσωσης μεRobin συνοριακά δεδομέναΗ βασική -αλλά όχι η μόνη - δομική δυσκολία που σχετίζεται με συνοριακά προβλήματα βέλτιστου ελέγ-χου με αρχικά δεδομένα χωρίς ομαλότητα προέρχεται από την έλλειψη αρκετής ομαλότητας της βασικήςτης συζυγούς και της μεταβλητής ελέγχου Πιο συγκεκριμένα αν y0 isin L2(Ω) τότε η ομαλότητα τηςβασικής μεταβλητής περιορίζεται σε L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] Ως εκ τούτου κλασικά προςlsquolsquoτα πίσωrsquorsquo επιχειρήματα (lsquolsquoboot-strap argumentsrsquorsquo) για τις χωρίς έλεγχο παραβολικές μδε που βασί-ζονται στο πρότυπο ελλειπτικών προβολών Ritz-Galerkin συνήθως αποτυγχάνουν εξαιτίας της έλλειψηςομαλότητας Κατά συνέπεια δεν έχουν υπολογιστεί οι εκτιμήσεις σφάλματος για χωροχρονικές προ-σεγγίσεις των παραβολικών προβλημάτων βέλτιστου ελέγχου ανώμαλων αρχικών δεδομένων y0 isin L2(Ω)σε Lipschitz χωρίαΓια να ξεπεραστεί η έλλειψη ομαλότητας αναλύουμε ένα σχήμα το οποίο βασίζεται σε μια ασυνεχήχρονική προσέγγιση η οποία είναι κατάλληλη για τα προβλήματα χωρίς αρκετά ομαλές λύσεις Η ανάλυ-ση αναδεικνύει την καλή συμπεριφορά αυτών των σχημάτων ακόμη και με την παρουσία συνοριακώνελέγχων Robin Το βασικό χαρακτηριστικό των διακριτών συστημάτων μας είναι ότι παρουσιάζουντις ίδιες ιδιότητες ομαλότητας με το συνεχές ασθενές πρόβλημα Τα αποτελέσματα μας μπορούν νασυνοψισθούν ως εξής
1 Αναπτύσσουμε συμμετρικές εκτιμήσεις σφαλμάτων υπό ελάχιστες υποθέσεις ομαλότητας για ταδεδομένα μας στη φυσική νόρμα ενδιαφέροντοςWR(0 T ) equiv Linfin[0 T L2(Ω)] cap L2[0 T H1(Ω)]times L2[0 T L2(Γ)] που σχετίζεται με το ασυνεχέςχρονικού βηματισμού σχήμα δηλαδή
σφάλμαWR(0T ) le Cκαλύτερο σφάλμα προσέγγισηςWR(0T )
το οποίο ορίζει ότι το σφάλμα είναι τόσο καλό όσο η ομαλότητα και η προσεγγιστική θεωρία του
13 Περιγραφή των προβλημάτων υπό μελέτη 7
επιτρέπει να είναι
2 Ορίζουμε μια νέα γενικευμένη προβολή του χωροχρόνου που παρουσιάζει καλύτερες προσεγγιστι-κές ιδιότητες στον L2[0 T L2(Ω)] και που είναι επίσης εφαρμόσιμες για yt isin L2[0 T H1(Ω)lowast]Χρησιμοποιώντας την παραπάνω προβολή και ένα κατάλληλο δυϊκό επιχείρημα για ένα βοηθητικόσύστημα παίρνουμε μια τάξη σύγκλισης O(h) για την L2[0 T L2(Ω)] νόρμα όταν τ le Ch2
3 Στη περίπτωση συνοριακών ελέγχων που καταδεικνύουν την εφαρμοσιμότητα των εκτιμήσεων μαςκατά την έννοια διακριτών μεταβολών του Hinze[65] Αυτή η προσέγγιση επιτρέπει να ξεπεραστείη έλλειψη της ισχυρής ομαλότητας που έχουμε στην βασική μεταβλητή κατάστασης λόγω τηςαποτυχίας του κλασικού προς lsquolsquoτα πίσωrsquorsquo (lsquolsquoboot-straprsquorsquo) επιχειρήματος για τον έλεγχο και τηβασική μεταβλητή κατάστασης
Οι παρακάτω εκτιμήσεις είναι καινούριες και βέλτιστες από την άποψη της προβλεπόμενης ομαλότηταςτων λύσεων και της παρουσίας των θεμελιωδών οριακών συνθηκών Επιπλέον ακόμη και με τη παρου-σία πρόσθετης ομαλότητας στα δεδομένα δηλαδή y0 isin H1(Ω) και παρά τη χρήση των L2 προβολώνπου εμφανίζουν καλύτερες προσεγγιστικές ιδιότητες η τάξη O(h32) (όταν τ le Ch2) φαίνεται να είναιη βέλτιστη δεδομένου ότι δεν υπάρχει δυνατότητα να αποκτήσουν μια καλύτερη εκτίμηση τουλάχιστονόταν εμπλέκονται πολυγωνικά και κυρτά χωρία Μπορούμε επίσης να επισημάνουμε ότι ο συνοριακόςέλεγχος Robin μπορεί να θεωρηθεί ως μια προσέγγιση ποινής σε Dirichlet συνοριακά προβλήματα ελέγ-χου [9 17 70] Για το λόγο αυτό η εξάρτηση από τις παραμέτρους λ α η από τις διάφορες σταθερέςπου εμφανίζονται στις εκτιμήσεις μας παρακολουθείται προσεκτικά
Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου Το πρόβλημα βέλτιστου ελέγχου που θεωρείταιεδώ σχετίζεται με την ελαχιστοποίηση του συναρτησιακού που υπόκειται σε ημι-γραμμικές παραβολικέςμδε Ειδικότερα επιδιώκουμε y και ελέγχους g (κατανεμημένου τύπου) τέτοιους ώστε το
J(y g) = 12
int T
0y minus yd2L2(Ω)dt+ α
2
int T
0g2L2(Ω)dt (133)
να ελαχιστοποιείται εφόσον υπόκεινται στους περιορισμούς
yt minus div[A(x)nablay] + φ(y) = f + g στο (0 T )times Ωy = 0 στο (0 T )times Γ (134)
y(0 x) = y0 στο Ω
Η φυσική έννοια του υπό μελέτη προβλήματος βελτιστοποίησης είναι να αναζητήσουμε τα y και τουςελέγχους g έτσι ώστε τα y να είναι όσο το δυνατόν πιο κοντά σε ένα δεδομένο στόχο yd Εδώ το Ωυποδηλώνει ένα φραγμένο χωρίο στο R2 με Lipschitz σύνορο Γ όπου τα y0 f δηλώνουν τα αρχικάδεδομένα και τον όρο δύναμης αντίστοιχα και το α είναι μια παράμετρος ποινής που μετρά το μέγεθοςτου στοιχείου ελέγχου Η μη γραμμική απεικόνιση φ ικανοποιεί κάποια συνέχεια και ιδιότητες μονο-τονίας και ο A(x) isin C1(Ω) είναι μια συνάρτηση συμμετρική μήτρα η οποία είναι ομοιόμορφα θετικάορισμένη Το πεδίο εφαρμογής της παρούσας εργασίας είναι η ανάλυση σφάλματος της πρώτης τάξεωςαπαραίτητων συνθηκών (συστήματος βελτιστοποίησης) του παραπάνω προβλήματος βέλτιστου ελέγχουμε τη χρήση ενός ασυνεχούς (στο χρόνο) σχήματος Galerkin (dG) Το αντίστοιχο σύστημα βελτιστο-ποίησης αποτελείται από μια βασική (προς τα εμπρός στο χρόνο) εξίσωση και μια συζυγής (οπισθόδρομηχρονικά) εξίσωση η οποία είναι συζευγμένη μέσω μιας συνθήκης βελτιστοποίησης και μη γραμμικώνόρων βλέπε πχ [50 56 80 93 109]Ο κύριος στόχος είναι να δείξουμε ότι οι dG προσεγγίσεις του συστήματος βελτιστοποίησης παρουσι-άζουν παρόμοιες προσεγγιστικές ιδιότητες με την τυπική γραμμική (χωρίς έλεγχο) παραβολική εξίσωσηΕιδικότερα φαίνεται ότι για κατάλληλα δεδομένα f y0 yd το σφάλμα των dG προσεγγίσεων είναι τόσοκαλό όσο επιτρέπει ςη ομαλότητα των λύσεων και οι ιδιότητες προσέγγισης των υποχώρων του
8 1 Εισαγωγικές έννοιες
Αυτό επιτυγχάνεται με το να αποδείξουμε την ακόλουθη συμμετρική εκτίμηση η οποία αναφέρει ότι
σφάλμαX le C(σφάλμα αρχικών δεδομένωνL2(Ω)
+σφάλμα καλύτερης προσέγγισης-προβολώνX+σφάλμα υποχώρωνX1
)
Εδώ η X = Linfin[0T L2(Ω)] + L2[0T H1(Ω)] και X1 υποδηλώνει μια νόρμα που σχετίζεται μεμια πιθανή αλλαγή των υποχώρων των πεπερασμένων στοιχείων σε κάθε (ή κάθε λίγα) χρονικά βήμα-τα και μπορεί να παραληφθεί όταν χρησιμοποιούνται οι ίδιοι υπόχωροι σε κάθε χρονικό βήμα Ο όροςκαλύτερο προσεγγιστικό σφάλμα-προβολώνX τίθεται από την άποψη της κατάλληλης τοπικής L2 προ-βολής και επιτρέπει βέλτιστες τάξεις σύγκλισης όταν η λύση είναι επαρκώς ομαλή Η σταθερά C δενεξαρτάται εκθετικά από ποσότητες της μορφής 1α Η εξάρτηση από το α των διαφόρων σταθερώνπου εμφανίζονται σε αυτές τις εκτιμήσεις είναι χαρακτηριστική στο πρόβλημα βέλτιστου ελέγχου και ωςεκ τούτου θα πρέπει να παρακολουθούνται προσεκτικά Ειδικότερα στα περισσότερα υπολογιστικά καιπρακτικά παραδείγματα μηχανικής μας ενδιαφέρουν μικρές τιμές της παραμέτρου α και σε ορισμένεςπεριπτώσεις ακόμη και συγκρίσιμη με τη παράμετρο διακριτοποίησης hΗ δομή της εκτίμησης είναι παρόμοια με αυτήν σε προηγούμενη εργασία των Chrysafinos και Walkington[31] η οποία αφορά τις dG προσεγγίσεις της γραμμικής (χωρίς έλεγχο) παραβολικής μδε καθώς αυτόαφορά βέλτιστες εκτιμήσεις σφαλμάτων όσον αφορά την ομαλότητα των λύσεων και την προσεγγιστικήθεωρία για τους επιλεγμένους υποχώρουςΗ απόδειξη της κύριας εκτίμησης βασίζεται στις εκτιμήσεις ενός βοηθητικού και ουσιαστικά μη συζευγ-μένου συστήματος μαζί με ένα προς lsquolsquoτα πίσωrsquorsquo (lsquolsquoboot-straprsquorsquo) επιχείρημα και τις εκτιμήσεις ευστάθειαςσε αυθαίρετα χρονικά σημεία κάτω από ελάχιστες υποθέσεις ομαλότητας Το βασικό στοιχείο τηςπροτεινόμενης μεθοδολογίας είναι η χρήση ενός lsquolsquoδυϊκούrsquorsquo τύπου επιχειρήματος για ασυνεχή χρονικούβηματισμού σχήματα ώστε να διευκολυνθεί η αποσύζευξη του συστήματος βελτιστοποίησης Ειδικότε-ρα με τη χρήση της συζυγούς μεταβλητής ως συνάρτησης δοκιμής στην βασική εξίσωση και τη βασικήμεταβλητή ως συνάρτηση δοκιμής στη συζυγή εξίσωση θα δείξουμε πρώτα ότι
σφάλμα2L2[0T L2(Ω)] le σφάλμα καλύτερης προσέγγισης-προβολών2X + α12σφάλμα2L2[0T H1(Ω)]
Στη συνέχεια για α κατάλληλα μικρό έχουμε εφαρμόσει ένα lsquolsquoπρος τα πίσωrsquorsquo (lsquolsquoboot-straprsquorsquo) επιχείρημαγια την απόκτηση της επιθυμητής συμμετρικής εκτίμησης Για καλύτερη γνώση οι ανωτέρω συμετρικέςεκτιμήσεις και ιδιαίτερα η δομή τους είναι νέες όσον αφορά τη ρύθμιση ελέγχουΤο κίνητρο για τη χρήση μιας dG προσέγγισης πηγάζει από τις επιδόσεις της σε μια τεράστια έκτα-ση των προβλημάτων όπου τα δεδομένα στοιχεία πληρούν χαμηλές ιδιότητες ομαλότητας όπως τωνπροβλημάτων βέλτιστου ελέγχου Επιπλέον η έννοια των συμμετρικών εκτιμήσεων σφάλματος μπο-ρεί να συλλάβει αποτελεσματικά την αλληλεπίδραση μεταξύ ομαλότητας των λύσεων και των ιδιοτήτωνπροσέγγισης των υποχώρων Αυτές οι προβλέψεις είναι επίσης πρόσφατα εφαρμόσιμες σε μια ποικιλίαπροβλημάτων τέτοιων όπως η ανάλυση σφαλμάτων των κινούμενων πλεγμάτων Lagrangian μεθοδολο-γίες για κινούμενο πλέγμα βλέπε πχ τα [42 85] και μπορεί να θεωρηθεί ως γενίκευση του κλασικούΛήμματος Ceacutea [34]Επιπλέον ασυνεχή (στο χρόνο) σχήματα μπορούν να επιτρέψουν τη χρήση διαφορετικών υποχώρων σεκάθε χρονικό βήμα και ως εκ τούτου βασικές ιδέες προσαρμοστικότητας με φυσικό τρόπο Σε πρόσφα-τα έργα [20 21 83 84 87 88] αναλύθηκαν ασυνεχή Galerkin σχήματα για προβλήματα κατανεμημένουβέλτιστου ελέγχου υπό γραμμικές παραβολικές μδε και έχει αναλυθεί η περίπτωση των ημι-γραμμικώνπεριορισμών βλέπε πχ [22 94] ΄Εχει μελετηθεί η σύγκλιση ασυνεχών σχημάτων χρονικού βηματισμο-ύ για προβλήματα βέλτιστου ελέγχου (χωρίς περιορισμούς ελέγχου) που σχετίζονται με ημι-γραμμικέςπαραβολικές μδε υπό υποθέσεις ελάχιστης ομαλότητας σχετικά με τα δεδομένα και τις παραδοχέςαύξουσας μονοτονίας για τον ημι-γραμμικό όρο βλέπε πχ το [22] Στη πολύ πρόσφατη εργασία [94]παρουσιάζονται οι πρώτης τάξεως (σε χρόνο) εκτιμήσεις σφαλμάτων για τους ελέγχους για ένα πρόβλη-μα βέλτιστου ελέγχου που σχετίζονται με ημι-γραμμικές παραβολικές μδε με τους περιορισμούς τουελέγχου σε περίπτωση που τα αρχικά δεδομένα ανήκουν στον H1
0 (Ω) cap Linfin(Ω) υπό ασθενή υπόθεση
13 Περιγραφή των προβλημάτων υπό μελέτη 9
για τον ημι-γραμμικό όρο Οι έλεγχοι διακριτοποιούνται με σταθερά τμηματικά πολυώνυμα σε χρόνοκαι στο χώρο ωστόσο η ανάλυση είναι επίσης εφαρμόσιμη όταν χρησιμοποιούνται σταθερά τμηματι-κά πολυώνυμα (στο χρόνο) και γραμμικά τμηματικά (στο χώρο) Για τη βασική εξίσωση κατάστασηςχρησιμοποιείται η χαμηλότερης τάξης (k = 0) ασυνεχή (στο χρόνο) μέθοδο Galerkin σε συνδυασμόμε σύμμορφα (conforming) πεπερασμένα στοιχεία (στο χώρο) ΄Εχουν παρουσιαστεί οι πρώτης τάξης(στο χρόνο) εκτιμήσεις στο [94] αφού αντιμετωπίζονται επιτυχώς μια ποικιλία δυσκολιών λόγω τηςπαρουσίας των περιορισμών ελέγχου και η αντίστοιχη μη κυρτότηταΟι τελευταίες εκτιμήσεις και η ανάλυση του [94] είναι διαφορετικές σε σύγκριση με αυτές που παρουσι-άζονται στη παρούσα μελέτη Εστιάζουμε κυρίως στην ανάπτυξη εκτιμήσεων που κατέχουν συμμετρικήδομή (και τα καλύτερα χαρακτηριστικά που περιγράφονται παραπάνω) για το σχετικό σύστημα βελτι-στοποίησης
Πρόβλημα κατανεμημένου ελέγχου Stokes Θεωρούμε ένα πρόβλημα βέλτιστου ελέγχου που σχε-τίζεται με την ελαχιστοποίηση του συναρτησιακού υπό τις εξελικτικές εξισώσεις Stokes Ειδικότεραδοσμένης μιας συνάρτησης στόχου yd ψάχνουμε ταχύτητα y και μεταβλητή ελέγχου g τέτοια ώστε τοσυναρτησιακό
J(y g) = 12
int T
0y minus yd2L2(Ω) dt+ α
2
int T
0g2L2(Ω) dt (135)
να ελαχιστοποιείται υπό τους περιορισμούς
yt minus ν∆y +nablap = f + g στο (0 T )times Ωdivy = 0 στο (0 T )times Ω
y = 0 στο (0 T )times Γy(0 x) = y0 στο Ω
(136)
Εδώ το Ω sub Rd d = 2 3 δείχνει μια ανοικτή φραγμένη πολυγωνική (πολύεδρη) και κυρτή περιοχήΟι εκτιμήσεις μας ισχύουν στις γενικές περιπτώσεις ενός Lipschitz συνόρου Γ εντούτοις για τη μελέτησχημάτων υψηλότερων τάξεων θα υποθέσουμε ομαλότερο σύνορο Σημειώνουμε πως ο έλεγχος g είναικατανεμημένου τύπου Η ανάλυση και τα αποτελέσματά μας θα ισχύουν και για σχήματα αυθαίρετηςτάξης με τις κατάλληλες υποθέσεις ομαλότητας αλλά ιδιαίτερη έμφαση δίνεται στην περίπτωση των μηομαλών αρχικών δεδομένων δηλ y0 isinW(Ω) equiv v isin L2(Ω) divv = 0 partv
partn = 0 Επιπλέον ενδιαφε-ρόμαστε επίσης για τη περίπτωση των σημειακών περιορισμών ελέγχου υπό την έννοια ga le g(t x) le gbγια σπ (t x) isin (0 T )times Ω όπου ga gb isin R Ο όρος δύναμης f και η σταθερά ιξώδους ν gt 0 δίνονταιως δεδομένα ενώ το α gt 0 δείχνει μια παράμετρο ποινής που περιορίζει το μέγεθος του ελέγχου καιείναι συγκρίσιμη με τις παραμέτρους διακριτοποίησηςΟ κύριος στόχος είναι να δειχτεί ότι οι εκτιμήσεις λάθους του αντίστοιχου συστήματος βελτιστοποίησηςέχουν την ίδια δομή με εκείνες των μη ελεγχόμενων εξελικτικών εξισώσεων Stokes Ειδικότερα ανα-πτύσσουμε μια σχεδόν συμμετρική εκτίμηση λάθους στις ελάχιστες υποθέσεις ομαλότητας στη φυσικήενεργειακή νόρμα WS(0T ) equiv Linfin[0T L2(Ω)] +L2[0T H1(Ω)] συνδεδεμένη στο ασυνεχές στο χρόνοχωροχρονικού βηματισμού σχήμα μας δηλ μια εκτίμηση της μορφής
σφάλμαWS(0T ) le Cσφάλμα καλύτερης προσέγγισης-προβολώνWS(0T )
+σφάλμα καλύτερης προσέγγισης της πίεσης L2[0T L2(Ω)]
Αυτή η εκτίμηση ισχύει και σε περίπτωση σχημάτων υψηλότερων τάξεων με τις κατάλληλες υποθέσειςομαλότητας δεδομένου ότι διαχωρίζει το ζήτημα της ομαλότητας του βέλτιστου ζευγαριού από την επι-λογή του σχήματος προσέγγισης Κατά συνέπεια οι εκτιμήσεις της υψηλής τάξης σχημάτων μπορούννα συμπεριληφθούν επίσης παρόμοια με την χωρίς έλεγχο περίπτωση τουλάχιστον σε περίπτωση τωνχωρίς περιορισμούς ελέγχων όταν τα κλασσικά (lsquolsquoboot-straprsquorsquo) lsquolsquoπρος τα πίσωrsquorsquo επιχειρήματα απαιτούνενισχυμένη ομαλότητα Για αυτόν τον λόγο ερευνάμε επίσης τις αραιού (coarse) χρονικού βηματισμούπροσεγγίσεις΄Ενα άλλο κύριο χαρακτηριστικό της ανωτέρω εκτίμησης είναι ότι ισχύει και στις περιπτώσεις χαμηλής
10 1 Εισαγωγικές έννοιες
ομαλότητας στα δεδομένα Ακριβέστερα η συμμετρική εκτίμηση λάθους απαιτεί μόνο την ταχύτηταy isin L2[0 T V(Ω)] capH1[0 T Hminus1(Ω)] και τη πίεση p isin L2[0 T L2
0(Ω)] όπου V(Ω) = v isin H10(Ω)
divv = 0 και L20(Ω) = p isin L2(Ω)
intΩ pdx = 0
Σημειώστε ότι εάν y0 isin W(Ω) τότε η ομαλότητα της βασικής μεταβλητής περιορίζεται σεL2[0 T V(Ω)] capH1[0 T V(Ω)lowast] όπου V(Ω) = v isin H1
0(Ω) divv = 0 Επιπλέον παρά το γεγονόςότι yt +nablap isin L2[0 T Hminus1(Ω)] δεν είναι γνωστό εάν p isin L2[0 T L2
0(Ω)] και yt isin L2[0 T Hminus1(Ω)]Κατά συνέπεια η πίεση p ικανοποιεί την (136) υπό μια έννοια κατανομής Συνεπώς η υπόθεσηp isin L2[0 T L2
0(Ω)] είναι η ελάχιστη ώστε να εγγυηθεί την αποσύζευξη μεταξύ yt και p και ως εκτούτου για να επικυρώσει μια κατάλληλη ασθενής διατύπωση για μη ομαλά αρχικά δεδομένα από τηνάποψη της αριθμητικής ανάλυσηςΗ εκτίμηση λάθους για χωροχρονικές προσεγγίσεις του προβλήματος ταχύτητας με μη ομαλά αρχικάδεδομένα y0 isin W(Ω) δεν έχει αντιμετωπιστεί προηγουμένως παρά το γεγονός ότι η περίπτωση τωνμη ομαλών αρχικών δεδομένων είναι μεγάλης σπουδαιότητας στο πλαίσιο του ελέγχου των ροών ρευ-στών βλέπε πχ [56] Για να υπερνικήσουμε την έλλειψη ομαλότητας αναλύουμε ένα σχήμα που είναιβασισμένο σε μια ασυνεχή χωροχρονική προσέγγιση η οποία είναι κατάλληλη για τα προβλήματα χωρίςαρκετά ομαλές λύσεις Η ανάλυση επιδεικνύει την ευνοϊκή συμπεριφορά τέτοιων σχημάτων Καθο-ρίζουμε μια νέα γενικευμένη χωροχρονική προβολή που εκθέτει καλύτερες ιδιότητες προσέγγισης μέσαστον L2[0 T L2(Ω)] αλλά είναι εφαρμόσιμη επίσης όταν έχουμε μόνο yt isin L2[0 T Hminus1(Ω)] Κατάσυνέπεια κατασκευάζοντας μια γενικευμένη χωροχρονική προβολή και χρησιμοποιώντας ένα κατάλληλοεπιχείρημα δυϊκότητας λαμβάνουμε τάξη σύγκλισης O(h) για την L2[0 T L2(Ω)] νόρμα όταν τ le Ch2Ομοίως σε περίπτωση φραγμένων ελέγχων καταδεικνύεται η δυνατότητα εφαρμογής των εκτιμήσεώνμας μέσα από την έννοια διακριτών μεταβολών στο [65] Αυτή η προσέγγιση επιτρέπει να υπερνικήσουμετην έλλειψη ενισχυμένης ομαλότητας ως αποτέλεσμα ενός lsquolsquoπρος τα πίσωrsquorsquo (lsquolsquoboot-straprsquorsquo) επιχειρήματοςγια τον έλεγχο και τη βασική μεταβλητή
14 Σχετικά αποτελέσματα - παλιότερες μελέτες
Γραμμικό πρόβλημα συνοριακού Robin ελέγχου ΄Εχει μελετηθεί το ασυνεχές Galerkinσχήμα βλέπε πχ [89 88] όπου αναπτύσσονται οι εκ των προτέρων εκτιμήσεις για τα κατανεμη-μένα προβλήματα βέλτιστου ελέγχου με και χωρίς περιορισμούς ελέγχου αντίστοιχα για την εξίσωσηθερμότητας ΄Εχουν παρουσιαστεί οι εκ των προτέρων εκτιμήσεις σφαλμάτων από την άποψη τωνκατάλληλων χωροχρονικών προβολών βλέπε πχ [20 21] και παράγονται για τα χωρίς περιορισμούςκατανεμημένα προβλήματα βέλτιστου ελέγχου σχετικά με τις παραβολικές και πεπλεγμένες (implicit) πα-ραβολικές μδε με γενικούς και ενδεχομένως χρονικά εξαρτημένους συντελεστές στο ελλειπτικό μέροςΠρόσφατα έχουν αναπτυχθεί εκτιμήσεις λάθους σχετικές με τα κατανεμημένα προβλήματα βέλτιστουελέγχου για τις ημιγραμμικές παραβολικές μδε [94] με περιορισμούς ελέγχου και H1
0 (Ω) cap Linfin(Ω)αρχικά δεδομένα και οι εκ των προτέρων συμμετρικού τύπου εκτιμήσεις σφάλματος στο [27] για ταπροβλήματα χωρίς περιορισμούς ελέγχου Οι εκ των προτέρων εκτιμήσεις λάθους για το πρόβλημα τηςταχύτητας του ρευστού με περιορισμούς ελέγχου έχουν αναλυθεί στα [13 14] Επίσης έχει εξετασθείπρόσφατα ένα αποτέλεσμα σύγκλισης για τα ασυνεχή χρονικού βηματισμού σχήματα για τα Robin προ-βλήματα βέλτιστου ελέγχου (χωρίς περιορισμούς ελέγχου) που αφορούσε τις ημιγραμμικές παραβολικέςμδε κάτω από L2(Ω) δεδομένα βλέπε πχ [23] Τέλος έχουν αναλυθεί οι πλήρως-διακριτοποιημένεςπροσεγγίσεις του συνοριακού Neumann προβλήματος ελέγχου πχ στο [86] σχετικό με ομογενείςγραμμικές παραβολικές μδε για το πεπλεγμένο - άμεσο σχήμα Euler για ομαλά χωρία και για αρκετάομαλά δεδομέναΕπίσης έχουν παρουσιαστεί διάφορα αποτελέσματα σχετικά με την ανάλυση των συνοριακών βέλ-τιστων προβλημάτων ελέγχου στα [56 80 93 109] Τα διάφορα συνοριακά προβλήματα ελέγχουσχετικά με τις χρονικά εξαρτημένες μδε έχουν μελετηθεί επίσης σε προηγούμενες εργασίες όπως[4 7 25 61 67 77 79 108 109 112]
14 Σχετικά αποτελέσματα - παλιότερες μελέτες 11
Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου ΄Εχουν μελετηθεί διάφορα προβλήματα με τουςκατανεμημένους ελέγχους βλέπε πχ [50 56 72 80 82 93 109] όπως επίσης και η ανάλυση τωναριθμητικών αλγορίθμων για προβλήματα βέλτιστου ελέγχου [11 19 18 25 37 38 49 53 58 60 6566 76 79 86 97 107 108 109 111 112] (βλ επίσης τις αναφορές τους)Οι εκ των υστέρων εκτιμήσεις για τα dG σχήματα για τα προβλήματα βέλτιστου ελέγχου που αφορούνγραμμικές παραβολικές μδε έχουν μελετηθεί παλιότερα στα [83 84] όπως έχει κατασκευαστεί καιαναλυθεί και ένας προσαρμοστικός (adaptive) αλγόριθμος χωροχρονικών πεπερασμένων στοιχείων στο[87] Οι εκ των προτέρων εκτιμήσεις σφαλμάτων για ένα πρόβλημα βέλτιστου ελέγχου του κατανε-μημένου τύπου που υπό συνθήκη την εξίσωση θερμότητας έχουν παρουσιαστεί στο [88] όπως και οιεκ των προτέρων εκτιμήσεις σφαλμάτων για τα dG σχήματα [20 21] για το πρόβλημα το σχετικό μεγραμμικού παραβολικού μδε και πεπλεγμένης (implicit) παραβολικής μδε αντίστοιχα με πιθανόν μηαυτοσυζυγείς εξαρτώμενους από το χρόνο συντελεστές Επίσης έχει εφαρμοστεί στο [90] ένα σχήμαPetrov-Galerkin Crank-Nicolson σε ένα πρόβλημα βέλτιστου ελέγχου με περιορισμούς ελέγχου σχετι-κούς με γραμμική παραβολικού τύπου μδε ενώ έχει επίσης αναλυθεί στο [6] μια τύπου Crank-Nicolsonμοντελοποίηση Και στα δύο έγγραφα αποδεικνύεται δεύτερης τάξης σύγκλισηΥπάρχει άφθονη βιβλιογραφία σχετικά με τα dG σχήματα για τη λύση παραβολικών εξισώσεων χωρίςεφαρμογή των ελέγχων πχ [104] Η σχέση της ασυνεχούς μεθόδου Galerkin με τις προσαρμοστικές(adaptive) τεχνικές έχει μελετηθεί λεπτομερώς στο [44 45 104] ΄Εχουν παρουσιαστεί αποτελέσματασχετικά με τις προσεγγίσεις πεπερασμένων στοιχείων ημιγραμμικών και γενικά μη γραμμικών παραβο-λικών προβλημάτων βλέπε πχ [1 48 46 47]
Πρόβλημα κατανεμημένου ελέγχου Stokes ΄Εχουν παρουσιαστεί διάφορα αποτελέσματα σχετικάμε την ανάλυση παρόμοιων προβλημάτων ελέγχου πχ στα [2 12 56 66 101 106] όπου αναπτύσσον-ται και αναλύονται οι διάφορες πτυχές συμπεριλαμβανομένου πρώτης και δεύτερης τάξης απαραίτητεςσυνθήκες Αντίθετα βιβλιογραφία σχετικά με την αριθμητική ανάλυση για τα προβλήματα βέλτιστουελέγχου σχετικά με εξελικτικές Navier-Stokes εξισώσεις είναι πολύ περιορισμένη ΄Ωστόσο έχει απο-δειχθεί στα [61 59] η σύγκλιση ενός αλγορίθμου κλίσης σε περίπτωση κατανεμημένων ελέγχων καιφραγμένων κατανεμημένων ελέγχων ΄Εχουν μελετηθεί οι εκτιμήσεις λάθους για ημιδιακριτή στο χώροδιακριτοποίηση βλέπε πχ στο [36] σε περίπτωση κατανεμημένων ελέγχων χωρίς περιορισμούς ελέγχουμε τη χρησιμοποίηση μιας προσέγγισης διακριτών μεταβολών Επίσης έχουν παρουσιαστεί στο [36]πλήρως-διακριτές εκτιμήσεις λάθους για το πεπλεγμένο σχήμα Euler για το πρόβλημα εύρεσης ταχύτη-τας (χωρίς περιορισμούς ελέγχου) για την ομογενή εξίσωση Stokes χρησιμοποιώντας τη προσέγγισηδιακριτών μεταβολών και για ομαλά δεδομέναΠρόσφατα αναλύθηκαν οι εκ των προτέρων εκτιμήσεις λάθους για το πρόβλημα παρακολούθησης τηςταχύτητας για ροές Navier-Stokes με περιορισμούς ελέγχου στα [13 14] Το χαμηλής τάξης ασυνεχέςχρονικά σχήμα Galerkin (τμηματικά σταθερά πολυώνυμα) που συνδυάστηκε με σύμμορφα (conforming)στοιχεία στο χώρο για την ταχύτητα και την πίεση και οι εκτιμήσεις για τη βασική μεταβλητή τη συζυ-γή και τις μεταβλητές ελέγχου παρήχθησαν για τρεις χωριστές επιλογές διακριτοποίησης του ελέγχου(τμηματικά σταθερά γραμμικά πολυώνυμα και διακριτοποίηση μεταβολών) Η μελέτη σε Stokes συ-στήματα παρακινήθηκε από αποτελέσματα πολύ πρόσφατης δουλειάς των Chrysafinos και Casas [13 14]ως προσπάθεια να επεκταθούν αυτά τα αποτελέσματα ώστε να συμπεριληφθούν οι περιπτώσεις των μηομαλών δεδομένων και τα υψηλής τάξης σχήματα μέσω μιας συμμετρικής εκτίμησης΄Αλλα αποτελέσματα σχετικά με τις ασυνεχείς χρονικού βηματισμού προσεγγίσεις συσχετίζονται μετους κατανεμημένους ελέγχους για τις γραμμικές και ημιγραμμικές παραβολικές μδε Πρόσφατα ανα-πτύχθηκαν οι εκτιμήσεις λάθους οι σχετικές με τα κατανεμημένα προβλήματα βέλτιστου ελέγχου γιατις ημιγραμμικές παραβολικές μδε βλέπε πχ το [94] με περιορισμούς ελέγχου και H1
0 (Ω) cap Linfin(Ω)αρχικά δεδομένα και τις εκ των προτέρων εκτιμήσεις σφαλμάτων συμμετρικού τύπου στο [27] για ταπροβλήματα χωρίς περιορισμούς ελέγχου Τέλος αναφέρουμε πως έχουν δημοσιευτεί διάφορες εργασίεςσχετικά με τα παραβολικά προβλήματα βέλτιστου ελέγχου με και χωρίς περιορισμούς στον έλεγχο πουμπορούν να συμπεριλάβουν υψηλότερης τάξης σχήματα όπως στα [6 20 21 88 89 95 100]Διάφορα αποτελέσματα σχετικά με την ανάλυση των προβλημάτων βέλτιστου ελέγχου έχουν παρουσια-στεί στα [56 80 93 109] (βλ επίσης τις αναφορές τους) Για τα γενικά αποτελέσματα σχετικά με την
12 1 Εισαγωγικές έννοιες
ασυνεχή μέθοδο Galerkin για παραβολικού τύπου μδε (χωρίς εφαρμογή των ελέγχων) παραπέμπουμετον αναγνώστη στα [104 73] (βλ επίσης τις αναφορές τους) Μια εκ των υστέρων εκτίμηση και τασχετικά ζητήματα προσαρμοστικότητας (adaptivity) μέσα στο ασυνεχές Galerkin πλαίσιο για τα προ-βλήματα βέλτιστου ελέγχου ερευνήθηκαν επίσης στις εργασίες των [84 87] (βλ επίσης τις αναφορέςτους)
Βασικές έννοιεςΣrsquo αυτή την ενότητα παραθέτουμε εισαγωγικά στοιχεία και ιδιότητες χώρων Sobolev Ορίζουμε τουςχώρους των ασθενών λύσεων που θα χρησιμοποιηθούν στη συνέχεια καθώς και άλλα εργαλεία συναρτη-σιακής ανάλυσης που κυρίως χρησιμοποιούνται στην ανάλυση για ημιγραμμικά παραβολικά προβλήμα-τα
21 Χώροι Sobolev 14
211 Ασθενείς παράγωγοι 14
212 Ορισμός χώρων Sobolev 14213 Συμπάγεια 15
214 Ο χώρος Hminus1 16
22 Βασικές ιδιότητες ιχνών 16
221 Ενδιάμεσοι-κλασματικοί χώροι 16
23 Χώροι που εμπεριέχουν χρόνο 18
231 Χώροι λύσεων 19
24 Χρήσιμες ανισότητες 19
25 Frechet Gateaux και παράγωγος κατά κατεύθυνση 20
2
Περιεχόμενα
14 2 Βασικές έννοιες
21 Χώροι Sobolev
Στην πράξη πρέπει να επιτύχουμε το σχεδιασμό χώρων αποτελούμενων από συναρτήσεις που έχουνκάποιες αλλά όχι τόσο σημαντικές ιδιότητες ομαλότητας Τέτοιοι χώροι είναι οι χώροι Sobolev καιπαρουσιάζονται στη συνέχεια
211 Ασθενείς παράγωγοι
Ξεκινάμε με ουσιαστική αποδυνάμωση της έννοιας της μερικής παραγώγου (weak derivative)Σημείωση Ας συμβολίσουμε με Cinfinc (U) το χώρο των απείρως διαφορίσιμων συναρτήσεων φ U rarr Rμε συμπαγές στήριγμα (compact support) στο U Θα ονομάζουμε συχνά μια συνάρτηση φ που ανήκειστον Cinfinc (U) ως συνάρτηση δοκιμής (test function)
Ορισμός 211 Υποθέτουμε ότι u υ isin L1loc(U) και α ένας πολυδείκτης (multiindex) Λέμε ότι η υ
είναι μια αminusoστη ασθενής μερική παράγωγος του υ γράφοντας
Dαu = υ
υπό την προϋπόθεση ότι int
U
uDαφdx = (minus1)|α|int
U
υφdx (211)
για όλες τις συναρτήσεις δοκιμής φ isin Cinfinc (U)
Με άλλα λόγια αν μας δίνεται u και αν συμβαίνει να υπάρχει μια συνάρτηση υ που ικανοποιεί την (211)για όλα τα φ λέμε ότι η Dαu = υ είναι η ασθενής έννοια Αν δεν υπάρχει τέτοια συνάρτηση υ τότε ηu δεν αποτελεί μια ασθενή αminusoστη παράγωγο
Λήμμα 212 (Μοναδικότητα των ασθενών παραγώγων) Μια ασθενής αminusoστη μερικήπαράγωγος του u αν υπάρχει είναι μοναδικά ορισμένη πάνω σε ένα σύνολο μέτρου μηδέν
212 Ορισμός χώρων Sobolev
΄Εστω 1 le p le infin και k ένας μη αρνητικός ακέραιος Ορίζουμε τώρα ορισμένους χώρους συναρτήσεωνοι οποίοι έχουν ασθενείς παραγώγους διαφόρων τάξεων πάνω σε χώρους Lp
Ορισμός 213 Ο χώρος SobolevW kp(U)
περιέχει όλες τις τοπικά ολοκληρώσιμες συναρτήσεις u U rarr R τέτοιες ώστε για κάθε πολυδείκτη α
με |α| 6 k η Dαu υπάρχει με την ασθενή έννοια και ανήκει στον Lp
Σημείωση
1 Αν p = 2 συνήθως γράφουμε
Hk(U) = W k2(U) (k = 0 1 )
Το γράμμα H χρησιμοποιείται αφού καθώς θα δούμε ο Hk(U) είναι ένας χώρος Hilbert Αςσημειώσουμε πως H0(U) = L2(U)
21 Χώροι Sobolev 15
2 Από εδώ και στο εξής θα αναγνωρίζουμε συναρτήσεις στον W kp(U) που συμφωνούν σχεδόνπαντού
Ορισμός 214 Αν u isinW kp(U) ορίζουμε την νόρμα
uWkp(U) =
(sum|α|6k
intU|Dau|pdx
)1p
(1 6 p 6infin)sum|α|6k
ess supU |Dau| (p =infin)
Συμβολισμός αν η πραγματικών τιμών συνάρτηση f είναι μετρήσιμη ορίζουμε το στοιχειώδεςανώτατο φράγμα (essential supremum )
ess sup f = infmicro isin R | |f gt micro| = 0
Ορισμός 215 1 ΄Εστω uminfinm=1 u isinW kp(U) Λέμε ότι um συγκλίνει στο u στο W kp(U)και γράφουμε um rarr u στο W kp(U) αν lim
mrarrinfinum minus uWkp(U) = 0
2 Γράφουμε um rarr u στο W kploc (U) εννοώντας ότι um rarr u στο W kp(V ) για κάθε V subsub U
Ορισμός 216 Συμβολίζουμε με W kp0 (U) το περίβλημα του Cinfinc (U) στο W kp(U)
Οπότε u isin W kp0 (U) αν και μόνο αν υπάρχουν συναρτήσεις um isin Cinfinc (U) τέτοιες ώστε um rarr u στο
W kp(U) Μεταφράζοντας τον W kp0 (U) αποτελείται από τις συναρτήσεις u isinW kp(U) τέτοιες ώστε
῾῾Dαu = 0 στο partU ᾿᾿ για όλα τα |α| le k minus 1
Συμβολισμός Συνήθως γράφουμε
Hk0 (U) = W k2
0 (U)
Αν n = 1 και U είναι ένα ανοιχτό διάστημα στον R1 τότε u isin W 1p(U) αν και μόνο αν η u ισούται μεμια σχεδόν παντού απολύτως συνεχή συνάρτηση της οποίας η συνηθισμένη παράγωγος (η οποία υπάρχεισχεδόν παντού) υπάρχει στον Lp(U) ΄Ενας τόσο απλός χαρακτηρισμός είναι παρrsquo όλα αυτά διαθέσιμοςμόνο για n = 1 Γενικά μία συνάρτηση μπορεί να ανήκει σε ένα χώρο Sobolev και ακόμη να είναιασυνεχής καιή φραγμένη
213 Συμπάγεια
Η ανισότητα Gagliardo-Nirenberg-Sobolev υποδηλώνει την εμφύτευση του χώρουW 1p(U) μέσα στο Lp
lowast(U) για 1 6 p lt n plowast = npnminusp Θα ισχυριστούμε στη συνέχεια ότι ο χώρος
W 1p(U) είναι πράγματι συμπαγώς εμφυτευμένος στον Lq(U) για 1 6 q lt plowast Η συμπάγεια είναι θεμε-λειώδης για τις εφαρμογές της γραμμικής και μη γραμμικής συναρτησιακής ανάλυσης στη θεωρία τωνμδε όπως θα δούμε παρακάτω
Ορισμός 217 ΄Εστω X και Y χώροι Banach με X sub Y Λέμε ότι ο X είναι συμπαγώς εμφυτευ-μένος στον Y γράφοντας
X subsub Y
υπό την προϋπόθεση
1 xY 6 C xX (x isin X) για κάποια σταθερά C και
2 κάθε φραγμένη ακολουθία στον X είναι προσυμπαγές (precompact) στον Y
16 2 Βασικές έννοιες
Θεvώρημα 218 (Θεώρημα συμπάγειας Rellich-Kondrachov) Θεωρούμε U ένα φραγμένο ανοιχτόυποσύνολο του Rn και το partU είναι C1 Υποθέτουμε 1 6 p lt n Τότε
W 1p(U) subsub Lq(U) για κάθε 1 6 q lt plowast
214 Ο χώρος Hminus1
΄Οπως θα δούμε στη συνέχεια στη μελέτη των γραμμικών ελλειπτικών παραβολικών και υπερβολικώνμδε είναι σημαντικό να έχουμε έναν άμεσο χαρακτηρισμό του δυϊκού χώρου του H1
0
Ορισμός 219 Συμβολίζουμε με Hminus1(U) τον δυϊκό χώρο του H10 (U)
Με άλλα λόγια η f ανήκει στον Hminus1(U) με την προϋπόθεση ότι η f είναι ένα φραγμένο γραμμικόσυναρτησιακό στον H1
0 (U) Ας σημειώσουμε πολύ προσεχτικά ότι δεν προσδιορίζουμε τον χώρο H10
μαζί με τον δυϊκό του Αντίθετα όπως θα δούμε σε λίγο έχουμε
H10 (U) sub L2(U) sub Hminus1(U)
Συμβολισμός Θα γράφουμε 〈 〉 για να συμβολίσουμε το δυϊκό ζεύγος μεταξύ Hminus1(U) και H10 (U)
Ορισμός 2110 Αν f isin Hminus1(U) ορίζουμε τη νόρμα
fHminus1(U) = sup〈f u〉 |u isin H10 (U) uH1
0 (U) le 1
Θεvώρημα 2111 (Χαρακτηρισμός του Hminus1) 1 Θεωρούμε ότιf isin Hminus1(U) Τότε υπάρχουν συναρτήσεις f0 f1 fn στον L2(U) τέτοιες ώστε
〈f u〉 =int
U
(f0υ+
nsum
i=1f iυxi
)dx
(υ isin H1
0 (U))
(212)
2 Επιπλέον
uHminus1(U) = inf
(int
U
nsum
i=0
∣∣f i∣∣2 dx
)12
| η f ικανοποιεί την (212) για f0 fn isin L2(U)
Συμβολισμός Γράφουμε ῾῾f = f0 minussumni=1 f
ixi ᾿᾿ όταν ισχύει η σχέση (212)
22 Βασικές ιδιότητες ιχνών
221 Ενδιάμεσοι-κλασματικοί χώροι
Για 0 lt σ lt 1 και 1 lt s lt 2 ισχύει
H2(Ω) sub Hs(Ω) sub Hσ(Ω) sub L2(Ω)
22 Βασικές ιδιότητες ιχνών 17
Εάν το Ω = RN ο Hs(Ω) μπορεί να χαρακτηριστεί από μετασχηματισμούς Fourier βλέπε πχ [52σελίδες 6-7]
Iσ =int
Ω
int
Ω
|y(x)minus y(ξ)|2|xminus ξ|n+2σ dxdξ ltinfin
yHσ(Ω) =(y2L2(Ω) + Iσ(y)
)12 0 lt σ lt 1
yHs(Ω) =(y2H1(Ω) +
nsum
i=1Isminus[s](partxiy)
)12 1 lt s lt 2
Οπότε έχουμε τους χώρους Sobolev Hs(Ω) και Hs(Γ) με s isin R με νόρμες middot Hs(Ω) και middot Hs(Γ)αντιστοίχως Για το πρόβλημα Robin συνοριακού ελέγχου θα χρησιμοποιούμε τους χώρους H12(Γ)τον δυϊκό του Hminus12(Γ) και το δυϊκό ζεύγος συμβολίζεται με 〈 〉Hminus12(Γ)H12(Γ) equiv 〈 middot middot 〉Γ ΄Εστω ότιu είναι μια συνάρτηση που ανήκει στο χώρο απείρως διαφορίσιμων συναρτήσεων με συμπαγές στήριγμαD(Ω) και ας συμβολίσουμε τις συνοριακές τιμές της με γ0u Το επόμενο θεώρημα ίχνους επεκτείνει τοντελεστή γ0 σε συναρτήσεις στον W sp(Ω)Θεvώρημα 221 ΄Εστω Ω ένα φραγμένο ανοιχτό υποσύνολο του RN με σύνορο Γ τάξης Ck1 (συνεχές- Lipschitz συνεχές τάξης Cm για κάποιο ακέραιο m) και έστω p ge 1 και s ge 0 δυο πραγματικοί αριθμοίτέτοιοι ώστε s le k+ 1 sminus 1p = l+σ όπου l ge 0 είναι ένας ακέραιος και 0 lt σ lt 1 Τότε η απεικόνισηurarr γ0u ορισμένη στον D(Ω) έχει μια μοναδική γραμμική συνεχή επέκταση ως ένας τελεστής από τον
W sp(Ω) στον W sminus1pp(Γ)
Εκτός από το συνοριακό τελεστή τιμών γ0 θα χρειαστούμε επίσης το ίχνος της κάθετης παραγώγουγ1u ορισμένο για u στον D(Ω) με
γ1u = partupartn =Nsum
i=1γ0(partupartxi)ni
όπου με n = (n1 nN ) συμβολίζουμε το μοναδιαίο προς τα έξω κάθετο διάνυσμα στο Γ οπότε
Θεvώρημα 222 Υπό τις υποθέσεις του παραπάνω θεωρήματος με l ge 1 η απεικόνιση
urarr γ0u γ1u
ορισμένη στον D(Ω) έχει μια γραμμική συνεχή επέκταση ως τελεστής από τον
W sp(Ω) στον W sminus1pp(Γ)timesW sminus1minus1pp(Γ)
Σημείωση 223 Αν το σύνορο του Ω έχει γωνίες το κάθετο διάνυσμα έχει ασυνέχειες και είναιπροφανές πως η partupartn είναι χαμηλής ομαλότητας όσο ομαλό και αν είναι το u Παρόλα αυτά το παραπάνωθεώρημα μπορεί να επεκταθεί και σrsquo αυτή τη περίπτωση βλέπε πχ [52]
Σημείωση 224 Ορίζουμε με τη βοήθεια των κλασματικών χώρων και των θεωρημάτων ιχνών πουπεριγράψαμε στα προηγούμενα τις βασικές ιδιότητες ιχνών Πιο συγκεκριμένα
H12(Γ) =y isin L2(Γ) | |y|H12(Γ) ltinfin
|y|H12(Γ) =(int
Γ
int
Γ
|y(x)minus y(ξ)|2|xminus ξ|nminus1+1 dxdξ
)12
yH12(Γ) =(y2L2(Γ) + |y|H12(Γ)
)12
Για την απεικόνιση γ0 y y|Γ ισχύουν τα ακόλουθα
γ0 H1(Ω) H12(Γ)
18 2 Βασικές έννοιες
γ0 Hs(Ω) Hsminus12(Γ) s gt 12
ο γ0 είναι lsquolsquoεπίrsquorsquo τελεστής απο τον Hs(Ω) στον Hsminus12(Γ)
Για τον τελεστή γ1 y partypartn έχουμε
γ1 H2(Ω) H12(Γ)
γ1 Hs(Ω) Hsminus32(Γ) s gt 32
όπου ο γ1 είναι lsquolsquoεπίrsquorsquo τελεστής απο τον Hs(Ω) στον Hsminus32(Γ)
Επίσης είναι
H10 (Ω) =
y isin H1(Ω) | γ0y = 0
Hminus1(Ω) =(H1
0 (Ω))lowast Hminus12(Γ) =
(H12(Γ)
)lowast
23 Χώροι που εμπεριέχουν χρόνο
Για καθέναν από τους παραπάνω χώρους Sobolev ορίζουμε τους χωροχρονικούς χώρους Lp[0 T X]Linfin[0 T X] με τους κλασικούς χώρους εφοδιασμένους με τις νόρμες
vLp[0T X] =(int T
0vpXdt
) 1p
vLinfin[0T X] = esssuptisin[0T ] vX
Το σύνολο όλων των συνεχών συναρτήσεων v [0 T ]rarr X συμβολίζεται με C[0 T X] με νόρμα πουορίζεται ως εξής
vC[0T X] = maxtisin[0T ]
v(t)X
Τελικώς συμβολίζουμε με H1[0 T X]
vH1[0T X] =(int T
0v2Xdt
) 12
+(int T
0vt2Xdt
) 12
le C ltinfin
Ειδικά για το διανυσματικό εξελικτικό πρόβλημα έχουμε το παρακάτω συμβολισμό Χρησιμοποιούμετον κλασικό συμβολισμό για τους χώρους Sobolev Hs(Ω) και τις αντίστοιχες διανυσματικές ιδιότητεςHs(Ω) για s isin R με νόρμες που θα συμβολίζουμε με middot Hs(Ω) και middot Hs(Ω) αντιστοίχως Επιπλέονέστω H1
0 (Ω) = v isin H1(Ω) v|Γ = 0 H10 = v isin H1(Ω) v|Γ = 0 Επίσης συμβολίζουμε με
Hminus1(Ω) τον δυϊκό του H10(Ω) και το αντίστοιχο δυϊκό ζεύγος με 〈 middot middot 〉Hminus1(Ω)H1(Ω) equiv 〈 middot middot 〉
Με H1(Ω) = H1(ΩR2) H10(Ω) = H1
0 (ΩR2) Hminus1(Ω) = (H10 (Ω))lowast Lp(Ω) = Lp(ΩR2)
H21[0 T Ω] = y isin L2[0 T Ω] partypartxi
part2y
partxipartxjparty
parttisin L2[0 T Ω] 1 le i j le 2
και
yH21[0T Ω] =int
[0T Ω]
(|y|2 +
∣∣∣∣party
partt
∣∣∣∣2 )dxdt
+2sum
i=1
int
[0T Ω]
∣∣∣∣party
partxi
∣∣∣∣2dxdt+
2sum
ij=1
int
[0T Ω]
∣∣∣∣part2y
partxixj
∣∣∣∣2
dxdt12
24 Χρήσιμες ανισότητες 19
Επίσης συμβολίζουμε H21[0 T Ω] = H21[0 T Ω]timesH21[0 T Ω] και τους αντίστοιχους χώρους μηδε-νικής απόκλισης (divergence free)i με V(Ω) = v isin H1
0(Ω) divv = 0 W(Ω) = v isin L2(Ω) divv =0 partvpartn = 0 εφοδιασμένο με τους H1(Ω) και L2(Ω) αντιστοίχως και με V(Ω)lowast τον δυϊκό του V(Ω)Τελικώς για την πίεση θα χρειαστούμε τον χώρο L2
0(Ω) = p isin L2(Ω) int
Ω p = 0 εφοδιασμένο μετην L2(Ω) νόρμα
231 Χώροι λύσεων
Ο χώρος ασθενών λύσεων των μδε που εξετάζουμε στη περίπτωση της βελτιστοποίησης σε εξελι-κτικές μερικές διαφορικές εξισώσεις εξαρτάται από τα δεδομένα του προβλήματος καθώς και από τιςσυνοριακές συνθήκες που εξετάζουμε Ακολουθούν κάποια τέτοια παραδείγματα που θα χρησιμοποιη-θούν Συμβολίζουμε το χώρο λύσεων με W (0 T ) χρησιμοποιώντας και ένα δείκτη που έχει σχέση μετο πρόβλημα το οποίο μελετάμε το χώρο λύσεων
Πρόβλημα συνοριακού Robin ελέγχου
WR(0 T ) = L2[0 T H1(Ω)] cap Linfin[0 T L2(Ω)]times L2[0 T L2(Γ)]
με νόρμα
u2WR(0T ) equiv u2L2[0T H1(Ω)] + u2Linfin[0T L2(Ω)] + u2L2[0T L2(Γ)]
Πρόβλημα κατανεμημένου ελέγχου
WD(0 T ) = L2[0 T H10 (Ω)] capH1[0 T Hminus1(Ω)]
με νόρμαv2WD(0T ) = v2L2[0T H1(Ω)] + vt2L2[0T Hminus1(Ω)]
Πρόβλημα κατανεμημένου ελέγχου σε συστήματαΣυχνά θα χρησιμοποιούμε το χώρο λύσεων
WS(0 T ) = L2[0 T V(Ω)] cap Linfin[0 T L2(Ω)]
εφοδιασμένο με τη νόρμα
v2WS(0T ) equiv v2L2[0T V1(Ω)] + u2Linfin[0T L2(Ω)]
24 Χρήσιμες ανισότητες
Παραθέτουμε κάποιες χρήσιμες ανισότητες και πιο συγκεκριμένα τις Groumlnwall Sobolev γενικευμένηHoumllder Friedrichs και Young ανισότητες που θα χρησιμοποιηθούν στα επόμεναΑνισότητα Groumlnwall (βλέπε πχ [43 Παράρτημα Β] [20 Παράρτημα Α]) Αν (1 minus Cτn)an + bn le
i το ρευστό είναι εντελώς ασυμπίεστο και ο συνολικός όγκος δεν μεταβάλλεται δηλαδή το ρευστό δε συστέλλεται ήδιαστέλλεται
20 2 Βασικές έννοιες
anminus1 + fn και maxn Cτn lt 1 τότε
aN +Nsum
n=1eC(tN minus tn)bi le (1 + TO(τ))
(eCt
N
a0 +Nsum
n=1eC(tNminustn)fn
)
όπου τ = max τn και tn =sumni=1 τ
nΣυνοριακή ανισότητα Sobolev (βλέπε πχ [10 Θεώρημα 166]) Για πραγματικό αριθμό p με 1 le p leinfin και εφόσον ο Ω έχει σύνορο Lipschitz τότε υπάρχει μια σταθερά C τέτοια ώστε
vLp(partΩ) le Cv1minus1pLp(Ω)v
1pW 1p (Ω)forallv isinW 1
p (Ω)
Γενικευμένη ανισότητα Houmllder Για κάθε μετρήσιμο σύνολο E οποιασδήποτε διάστασης και για (1s1)+(1s2) + (1s3) = 1 si ge 1
int
E
f1f2f3dE le f1Ls1 (E)f2Ls2 (E)f3Ls3 (E)
Ανισότητα Young Για κάθε a b ge 0 δ gt 0 ab le δa2 + (14δ)b2Γενικευμένη ανισότητα Friedrichs (βλέπε πχ [92 Θεώρημα 19]) Υπάρχει CF gt 0 (που εξαρτάταιμόνο από το Ω) τέτοια ώστε
nablay2L2(Ω) + y2L2(Γ) le CF y2H1(Ω)
25 Frechet Gateaux και παράγωγος κατά κατεύθυνση
Θυμίζουμε ότι για Banach χώρους X και για f X rarr (minusinfininfin) το όριο
f prime(x h) = limλrarr0
f(x+ λh)minus f(x)λ
όταν υπάρχει ονομάζεται παράγωγος κατά κατεύθυνση (directional derivative) του h isin X στο x Ηαπεικόνιση hrarr f prime(x h) ονομάζεται διαφορικό κατά κατεύθυνση (directional differential) της f στο xαν είναι καλά ορισμένο για όλα τα h isin X Η συνάρτηση f ονομάζεται ασθενώς (weakly) ή Gateauxδιαφορίσιμη στο x αν το hrarr f prime(x h) είναι ένα γραμμικό συναρτησιακό στον X Το αντίστοιχο στοιχείοαπό τον Xlowast θα συμβολίζεται με gradf(x)
f prime(x h) = (h gradf(x))XtimesXlowast forallh isin X
Επιπλέον αν
limyrarr0
f(x+ y)minus f(x)minus (y gradf(x))XtimesXlowast|y|X
= 0
τότε η f είναι Frechet διαφορίσιμη στο x Προφανώς κάθε Frechet διαφορίσιμη είναι Gateaux διαφορίσιμηεπίσης Η επέκταση των παραπάνω ορισμών σε διανυσματικές συναρτήσεις είναι άμεση Ο κανόνας τηςαλυσίδας βεβαιώνει πως αν η g X1 rarr X2 (χώροι Banach) είναι μία Gateaux διαφορίσιμη απεικόνισηκαι φ X2 rarr R είναι Frechet διαφορίσιμη τότε η f X1 rarr R που δίνεται από την f(x) = φ(g(x)) είναιGateaux διαφορίσιμη και gradf(x) = gradφ (g(x)) [gradg(x)] (Tapia [1971])
Συνεχές Σύστημα ΒελτιστοποίησηςΥπαρξη Λύσης
Σrsquo αυτό το κεφάλαιο παρουσιάζονται οι βασικές υποθέσεις που θα χρησιμοποιηθούν μια εισαγωγικήμελέτη ως προς την ύπαρξη λύσης καθώς και το συνεχές σύστημα βελτιστοποίησης
31 Βασικές υποθέσεις 22
32 Συνεχές πρόβλημα ελέγχου και ύπαρξη λύσης 23
33 Το Σύστημα βελτιστοποίησης 26
3
Περιεχόμενα
22 3 Συνεχές Σύστημα Βελτιστοποίησης ΄Υπαρξη Λύσης
31 Βασικές υποθέσεις
Γραμμικό πρόβλημα συνοριακού Robin ελέγχου Για κάθε η ge 0 η διγραμμική μορφή που σχε-τίζεται με το τελεστή μας είναι
a(y v) = η
int
Ωnablaynablavdx forally v isin H1(Ω)
και ικανοποιεί τις συνθήκες πιεστικότητας και συνέχειας
a(y y) gt η nablay2L2(Ω) α(y v) 6 Cη yH1(Ω) vH1(Ω) forally v isin H1(Ω)
Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου Και σε αυτή τη περίπτωση ο διγραμμικός τε-λεστής που ορίζεται από το
a(y v) =int
ΩA(x)nablaynablavdx forall y v isin H1(Ω)
επίσης ικανοποιεί τις συνθήκες πιεστικότητας και συνέχειας
a(y y) ge ηy2H1(Ω) a(y v) le CcyH1(Ω)vH1(Ω) forall y v isin H10 (Ω)
Τα δεδομένα ικανοποιούν τις ελάχιστες υποθέσεις ομαλότητας οι οποίες εγγυώνται την ύπαρξη ασθενούςλύσεως y isinW (0 T ) δηλαδή
f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω)
ενώ ο κατανεμημένος έλεγχος g είναι στο χώρο L2[0 T L2(Ω)] Πρέπει να πούμε πως με τις παραπάνωυποθέσεις ομαλότητας κάποιος θα μπορούσε να δείξει μόνο τη σύγκλιση των διακριτών σχημάτων όπωςμπορούμε να δούμε στην εργασία [22 Ενότητα 3] (ακόμη και στη περίπτωση χωρίς έλεγχο)Για εκτιμήσεις σφαλμάτων χρειαζόμαστε επιπλέον ομαλότητα ώστε να εγγυηθούμε τάξεις σύγκλισηςΠιο συγκεκριμένα θα υποθέσουμε πως y isin Linfin[0 T L4(Ω)] που στην ουσία απαιτεί y0 isin H1
0 (Ω)f isin L2[0 T L2(Ω)] Η επιλογή του χώρου ελέγχου απλοποιεί σημαντικά την εφαρμογή του αλγορίθμουπεπερασμένων στοιχείων αφού οδηγεί σε αλγεβρική συνθήκη βελτιστοποίησης Οπότε αποφεύγουμετη χρήση χώρων κλασματικής τάξης ή τη λύση μιας επιπλέον μδε η οποία εμφανίζεται όταν άλλεςνόρμες του ελέγχου g εμπεριέχονται στο συναρτησιακό βλέπε πχ [56]Για την επακόλουθη ανάλυση αρκεί ο στόχος yd isin L2[0 T L2(Ω)] Ωστόσο στις περισσότερες πε-ριπτώσεις το yd είναι στη πραγματικότητα ομαλότερο αφού στην ουσία αντιστοιχεί σε μια λύση τηςπαραβολικής μδε και οπότε μπορεί να θεωρηθεί πως yd isin WD(0 T ) Για την ανάλυση μας σταδιακριτά σχήματα ο ημιγραμμικός όρος απαιτείται να ικανοποιεί τις ακόλουθες δομικές υποθέσεις
Υπόθεση 311 (α) Για τη σύγκλιση της βασικής μεταβλητής Ο ημιγραμμικός όρος φ isin C1(RR)ικανοποιεί
φprime(s) ge 0∣∣φ(s)
∣∣ le C|s|p∣∣φprime(s)
∣∣ le C∣∣s∣∣pminus1
sφ(s) ge C∣∣s∣∣p+1
για 1 lt p le 3
(β) Για τη σύγκλιση της βασικής και της συζυγούς μεταβλητής Επιπλέον του (α) ο φprime είναι Lipschitzσυνεχής με σταθερά Lipschitz CL ή φ isin C2(RR) με |φprimeprime(s)| le C|s|pminus2 για 2 lt p le 3(γ) Αν ο ημιγραμμικός χώρος περιέχει επίσης χωροχρονικές σταθερές δηλαδή φ(s) equiv φ(t x s) [0 T ]timesΩtimesRrarr R τότε επιπλέον με τα (α)-(β) απαιτείται τα φ(0) φprime(0) να είναι ομοιόμορφα φραγμένα
Σημείωση 312 Η σύγκλιση μπορεί να αποδειχθεί απλά υποθέτοντας μονοτονία ή αύξουσα μονοτονίααπό την υπόθεση 311 (α)-(β) πάνω στα φ φprime (βλ [22 Section 3]) Η υπόθεση συνέχειας Lipschitz στον
32 Συνεχές πρόβλημα ελέγχου και ύπαρξη λύσης 23
φprime επιβάλλεται μόνο για να ελαχιστοποιήσει τις τεχνικές δυσκολίες Τα περισσότερα από τα αποτελέσματαπου παρουσιάζονται εδώ ισχύουν ακόμα στις πιο ασθενείς υποθέσεις του [94] με τα αρχικά δεδομένα ναανήκουν στον H1
0 (Ω) capLinfin(Ω) Παραπέμπουμε τον αναγνώστη στο [109] (βλ επίσης τις αναφορές) γιαμια λεπτομερή ανάλυση από τις πιθανές υποθέσεις στον ημιγραμμικό όρο και στην ομαλότητα δεδομένωνΕδώ εμείς έχουμε επιλέξει να επιβάλουμε τις ελάχιστες υποθέσεις ομαλότητας που εγγυώνται την ύπαρξητης αντίστοιχης διακριτής λύσης στο χώρο Linfin[0 T L2(Ω)] cap L2[0 T H1
0 (Ω)]
Πρόβλημα κατανεμημένου ελέγχου Stokes Εδώ ο ημιγραμμική μορφή η σχετική με τον τελεστήμας είναι
a(y v) = ν
int
Ωnablaynablavdx forally v isin H1
0(Ω)
και ικανοποιεί τις συνθήκες πιεστικότητας και συνέχειας
a(y y) gt ν nablay2L2(Ω) α(y v) 6 Cν yH1(Ω) vH1(Ω) forally v isin H10(Ω)
Τελικώς ο ημιγραμμικός χώρος ο σχετικός με τη πίεση είναι
b(v q) =int
Ωqnablavdx forallv isin H1
0(Ω) q isin L2(Ω)
που ικανοποιεί τις κλασικές συνθήκες συνέχειας και μέγιστου ελάχιστου όπως στο [52 102] δηλαδή
b(v q) le CvH1(Ω)qL2(Ω)
και
infqisinL2
0(Ω)sup
visinH10(Ω)
b(v q)vH1(Ω)qL2(Ω)
ge c gt 0
Στην επόμενη ενότητα παραθέτουμε τα βασικά αποτελέσματα για την ύπαρξη λύσης υπό τις παραπάνωυποθέσεις
32 Συνεχές πρόβλημα ελέγχου και ύπαρξη λύσης
Σε αυτή τη παράγραφο μελετάμε την ύπαρξη λύσης των προβλημάτων βελτιστοποίησης με περιορισμούςεξελικτικές μερικές διαφορικές εξισώσεις Μελετάμε συνοριακό ή κατανεμημένο έλεγχο και για κάθεπερίπτωση είναι απαραίτητο να παρατηρήσουμε και να αποδείξουμε την ευστάθεια των προβλημάτων καιτην ύπαρξη μοναδικής λύσης ή όχι Πρέπει να αναφέρουμε πως όταν το συναρτησιακό προς ελαχιστοποί-ηση είναι κυρτό (όπως στη περίπτωση των γραμμικών προβλημάτων) εύκολα αποδεικνύεται πως έχουμεμοναδική λύση Αν όμως το συναρτησιακό δεν είναι κυρτό όπως στα ημιγραμμικά προβλήματα έχουμεολική λύση αλλά δεν είναι μοναδική αφού μπορούμε να έχουμε ελαχιστοποίηση με διάφορες συναρτήσειςελέγχου
Γραμμικό πρόβλημα συνοριακού Robin ελέγχου Σε αυτό το παράδειγμα μελετάμε τη περίπτωσηχωρίς αλλά και αυτή με περιορισμούς συνάρτηση ελέγχου Ξεκινώντας παρουσιάζουμε την ασθενήμορφή της βασικής εξίσωσης Δοσμένων των f isin L2 [0 T H1(Ω)lowast
] g isin L2 [0 T Hminus12(Γ)
] και
y0 isin L2(Ω) αναζητούμε y isin L2[0 T H1(Ω)]capH1[0 T H1(Ω)lowast] τέτοιο ώστε για σπ t isin (0 T ] και γιαόλα τα v isin H1(Ω)
〈yt v〉+ a(y v) + λ 〈y v〉Γ = 〈f v〉+ λ 〈g v〉Γ και (y(0) v) = (y0 v) (321)
24 3 Συνεχές Σύστημα Βελτιστοποίησης ΄Υπαρξη Λύσης
Μια ισοδύναμη μορφή κατάλληλη για την ανάλυση σε dG σχήματα είναι το να αναζητούμε y isinWR(0 T )τέτοιο ώστε για όλα τα v isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast]
(y(T ) v(T )) +int T
0(minus〈y vt〉+ a(y v) + λ 〈y v〉Γ)dt = (y0 v(0)) +
int T
0(〈f v〉+ λ 〈g v〉Γ)dt (322)
Ακολουθεί η ύπαρξη μοναδικότητα και η ομαλότητα βλέπε και [25] αποτέλεσμα της (322)
Θεvώρημα 321 Υποθέτουμε πως g isin L2[0 T Hminus12+θ(Γ)]capHθ[0 T Hminus12(Γ)] y0 isin Hθ(Ω) καιf isin L2[0 T H1minusθ(Ω)lowast] για κάποιο θ isin [0 1] Τότε υπάρχει ένα μοναδικό y isin L2[0 T H1+θ(Ω)] capH1[0 T H1minusθ(Ω)lowast] που ικανοποιεί την (322) και
yL2[0T H1+θ(Ω)] + ytL2[0T H1minusθ(Ω)lowast] le C(fL2[0T H1minusθ(Ω)lowast] + u0Hθ(Ω) + gL2[0T Hminus12+θ(Γ)]
+gHθ[0T Hminus12(Γ)]
)
Επιπλέον η απεικόνιση της βασικής μεταβλητής στον έλεγχο G L2[0 T L2(Γ)] rarr WR(0 T ) πουσυνδέει στον κάθε έλεγχο g τη βασική μεταβλητή G(g) = yg equiv y(g) μέσω της (322) είναι καλάορισμένη και συνεχής Οπότε το συναρτησιακό κόστους συχνά συμβολίζεται με την ανηγμένη μορφήJ(y g) equiv J(y(g)) equiv J(g) L2[0 T L2(Γ)]rarr R η οποία είναι επίσης καλώς ορισμένη και συνεχής
Ορισμός 322 ΄Εστω f isin L2[0 T H1(Ω)lowast] y0 isin L2(Ω) και yd isin L2[0 T L2(Ω)] δοσμένα δεδο-μένα Τότε το σύνολο των επιθυμητών ελέγχων (συμβολιζόμενο με Aad) ορίζεται ως εξής
1 ΄Ελεγχος χωρίς περιορισμούς Aad equiv L2[0 T L2(Γ)]
2 ΄Ελεγχος με περιορισμούς Aad equiv g isin L2[0 T L2(Γ)] ga le g(t x) le gb για σπ (t x) isin(0 T )times Γ
Το ζεύγος (y(g) g) isinWR(0 T )timesAad ονομάζεται βέλτιστη λύση αν J(y(g) g) le J(w(h) h) forall(w(h) h) isinWR(0 T )timesAad
Συχνά θα υιοθετούμε το συμβολισμό y equiv yg equiv y(g) Παρακάτω παρουσιάζουμε το κύριο αποτέλεσμααπό το [109] σχετικό με την ύπαρξη μιας βέλτιστης λύσης
Θεvώρημα 323 ΄Εστω y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] yd isin L2[0 T L2(Ω)] είναι δοσμέναΤότε το πρόβλημα συνοριακού ελέγχου έχει μοναδική λύση την (y(g) g) isinWR(0 T )timesAad
Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου Αρχικά παραθέτουμε ένα αποτέλεσμα που α-φορά την επιλυσιμότητα του προβλήματος σε ασθενή μορφή (δοσμένων f g y0 και αναζητώντας y isinWD(0 T ) για όλα τα v isinWD(0 T ))
(y(T ) v(T )) +int T
0
(minus 〈y vt〉+ a(y v) + 〈φ(y) v〉
)dt = (y0 v(0)) +
int T
0
(〈f v〉+ (g v)
)dt (323)
στον φυσικό ενεργειακό χώρο με υποθέσεις ελάχιστης ομαλότητας
Θεvώρημα 324 ΄Εστω f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω) g isin L2[0 T L2(Ω)] Τότε υπάρχει μιαμοναδική λύση y isinWD(0 T ) η οποία ικανοποιεί την ακόλουθη ενεργειακή σχέση
yWD(0T ) le C(fL2[0T Hminus1(Ω)] + y0L2(Ω) + gL2[0T L2(Ω)]
)
Απόδειξη Η απόδειξη βρίσκεται στη βιβλιογραφία πχ [25 43 113]
Στη συνέχεια αναφέρουμε τον ορισμό του συνόλου των επιθυμητών - αποδεκτών λύσεων Aad και τονορισμό του (τοπικού) βέλτιστου ζεύγους λύσεων
32 Συνεχές πρόβλημα ελέγχου και ύπαρξη λύσης 25
Ορισμός 325 1 Με δεδομένα f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω) και στόχοyd isin L2[0 T L2(Ω)] τότε το ζεύγος (y g) λέμε ότι είναι αποδεκτό στοιχείο αν τα y isin WD(0 T )g isin L2[0 T L2(Ω)] ικανοποιούν την (323) (Σημειώνουμε πως το J(y g) είναι φραγμένο σύμ-φωνα με το θεώρημα 324)
2 Με δεδομένα f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω) και στόχο yd isin L2[0 T L2(Ω)] αναζητούμεζεύγος (y g) isin Aad τέτοιο ώστε J(y g) le J(w h) forall(w h) isin Aad όταν y minuswWD(0T ) + g minushL2[0T L2(Ω)] le δ για δ gt 0 κατάλληλα επιλεγμένο
Παρακάτω παρουσιάζουμε το βασικό αποτέλεσμα που αφορά την ύπαρξη μιας βέλτιστης λύσης για τηνελαχιστοποίηση του συναρτησιακού (133)
Θεvώρημα 326 Υποθέτουμε πως y0 isin L2(Ω) f isin L2[0 T Hminus1(Ω)] yd isin L2[0 T L2(Ω)] Τότετο πρόβλημα βέλτιστου ελέγχου έχει λύση την (y g) isinWD(0 T )times L2[0 T L2(Ω)]
Απόδειξη Η απόδειξη βρίσκεται στη βιβλιογραφία πχ [25 50 80 109]
Σημείωση 327 Η λύση προβλημάτων βέλτιστου ελέγχου έχοντας περιορισμούς μη γραμμικέςπαραβολικές μδε δεν είναι γενικά μοναδική Ωστόσο κάτω από κάποιες επιπλέον υποθέσεις σταδεδομένα του προβλήματος βελτιστοποίησης και στη κατασκευή του ημιγραμμικού όρου είναι δυνατόννα αποδειχτεί πως υπάρχει ένας μοναδικός έλεγχος g (βλέπε πχ [82 Κεφάλαιο 3 σελ 43]) και πωςτο αντίστοιχο σύστημα βελτιστοποίησης δέχεται μοναδική λύση
Πρόβλημα κατανεμημένου ελέγχου Stokes Μια πιθανή μοντελοποίηση του προβλήματος (136)ορίζεται ως εξής Δοσμένων f isin L2[0 T L2(Ω)] y0 isin V(Ω) και ελέγχου g isin L2[0 T L2(Ω)]αναζητούμε (y p) isinWS(0 T )times L2[0 T L2
0(Ω)] τέτοιο ώστε για σπ t isin (0 T ]
〈yt v〉+ a(y v) + b(v p) = 〈f v〉+ (g v) forall v isin H10(Ω)
b(y q) = 0 forall q isin L20(Ω)
(y(0) v) = (y0 v) forall v isinW(Ω)(324)
Μια εναλλακτική ασθενής μορφή για το πρόβλημα (136) κατάλληλο για την περίπτωση μη ομαλών αρχι-κών δεδομένων ορίζεται χρησιμοποιώντας μηδενικής απόκλισης (divergence-free) συναρτήσεις δοκιμήςκαι μπορεί να γραφεί ως εξής Δοσμένων f isin L2[0 T V(Ω)lowast] g isin L2[0 T L2(Ω)] και y0 isin W(Ω)ψάχνουμε y isin L2[0 T V(Ω)] capH1[0 T V(Ω)lowast] τέτοια ώστε για σπ t isin (0 T ]
〈yt v〉+ a(y v) = 〈f v〉+ (g v) forallv isin V(Ω)(y(0) v) = (y0 v) forallv isinW(Ω) (325)
Τελικώς από τη σκοπιά της αριθμητικής ανάλυσης μια επιθυμητή ασθενής μοντελοποίηση κατάλληληγια την ανάλυση σχημάτων ασυνεχούς μεθόδου Galerkin είναι να αναζητούμε y isin WS(0 T ) καιp isin L2[0 T L2
0(Ω)] τέτοια ώστε για όλα τα v isin L2[0 T H1(Ω)] cap H1[0 T Hminus1(Ω)] και για όλα ταq isin L2[0 T L2
0(Ω)]
(y(T ) v(T )) +int T
0(minus〈y vt〉+ a(y v) + b(v p)) dt = (y0 v(0)) +
int T
0(〈f v〉+ (g v)) dt
int T
0b(y q)dt = 0
(326)
Ακολουθούν κάποια σχόλια που αφορούν τις ασθενείς λύσεις των δισδιάστατων εξισώσεων Stokes καιτην ισοδυναμία των μορφών (324) (325) και (326)
Σημείωση 328 Υπενθυμίζουμε πως τα κλασικά θεωρήματα ομαλότητας βλέπε πχ [35 102]δείχνουν ότι εάν f g isin L2[0 T W(Ω)] και y0 isin V (Ω) τότε η λύση (y p) των εξισώσεων (324)
26 3 Συνεχές Σύστημα Βελτιστοποίησης ΄Υπαρξη Λύσης
ικανοποιεί την
(y p) isin L2[0 T H2(Ω) cap V (Ω)] capH1[0 T W(Ω)]times L2[0 T H1(Ω) cap L20(Ω)]
Σε αυτήν τη περίπτωση οι ασθενείς μορφές (324) (325) και (326) είναι ουσιαστικά ισοδύναμες Αντα δεδομένα f isin L2[0 T Vlowast(Ω)] y0 isinW(Ω) τότε υπάρχει μια μοναδική ασθενής λύση που ικανοποιείτην y isin L2[0 T H1
0(Ω)capV(Ω)]capHminus1[0 T Vlowast(Ω)] ενώ η πίεση p ικανοποιεί την (136) με την έννοιατης κατανομής και yt + nablap isin L2[0 T Hminus1(Ω)] Στην παραπάνω περίπτωση πρέπει να πούμε πωςδεν είναι προφανές αν η πίεση ανήκει στον L2[0 T L2
0(Ω)] υπό ελάχιστες συνθήκες ομαλότητας βλέπεπχ [102] και οπότε οι μορφές (324) και (326) δεν είναι απαραίτητα έγκυρες εκτός και εάν κάνουμευποθέσεις ύπαρξης για την πίεση όπως p isin L2[0 T L2
0(Ω)]
Η απεικόνιση ελέγχου προς την βασική μεταβλητή G L2[0 T L2(Ω))]rarrWS(0 T ) η οποία συσχετίζειγια κάθε έλεγχο g την βασική μεταβλητή G(g) = yg equiv y(g) μέσω της (325) είναι καλά ορισμένη καισυνεχής Επιπλέον πρέπει να πούμε ότι εάν τα δεδομένα του προβλήματος έχουν επιπλέον ομαλότηταπχ εάν y0 isin V(Ω) και f isin L2[0 T L2(Ω)] τότε y(g) isin L2[0 T H2(Ω) cap V (Ω)] capH1[0 T L2(Ω)]και p isin L2[0 T H1(Ω) cap L2
0(Ω)] Οπότε το συναρτησιακό κόστους το οποίο συχνά συμβολίζεταιJ(y g) equiv J(y(g)) equiv J(g) L2[0 T L2(Ω)]rarr R είναι καλά ορισμένο και συνεχές
Ορισμός 329 ΄Εστω τα δεδομένα f isin L2[0 T V(Ω)lowast] y0 isin W(Ω) και yd isin L2[0 T W(Ω)]Τότε το σύνολο των αποδεκτών ελέγχων (που συμβολίζεται με Aad) ορίζεται από την
1 ΄Ελεγχος χωρίς Περιορισμούς Aad equiv L2[0 T L2(Ω)]
2 ΄Ελεγχος με Περιορισμούς Aad equiv g isin L2[0 T L2(Ω)] ga le g(t x) le gb για σπ (t x) isin(0 T )times Ω
Το ζεύγος (y(g) g) isinWS(0 T )timesAad λέγεται ότι είναι βέλτιστο αν J(y(g) g) le J(w(h) h) forall(w(h) h) isinWS(0 T )timesAad
Ακολουθεί το κύριο αποτέλεσμα σύμφωνα με το [109] που αφορά την ύπαρξη μιας βέλτιστης λύσης
Θεvώρημα 3210 ΄Εστω y0 isin W(Ω) f isin L2[0 T V(Ω)lowast] yd isin L2[0 T L2(Ω)] είναι τα δοσμέναδεδομένα Τότε το πρόβλημα βέλτιστου ελέγχου έχει μοναδική λύση την (y(g) g) isin WS(0 T ) timesL2[0 T L2(Ω)] Επιπλέον υπάρχει πίεση p που ικανοποιεί την (136) με την έννοια της κατανομήςΕάν επιπλέον y0 isin V(Ω) f isin L2[0 T L2(Ω)] τότε p isin L2[0 T H1
0 (Ω) cap L20(Ω)] και το ζεύγος (y p)
ικανοποιεί την (326)
33 Το Σύστημα βελτιστοποίησης
Γραμμικό πρόβλημα συνοριακού Robin ελέγχου ΄Ενα σύστημα εξισώσεων βελτιστοποίησης μπο-ρεί να προκύψει χρησιμοποιώντας τις κλασικές τεχνικές βλέπε για παράδειγμα το [109] ή [25 Ενότητα2] Αρχικά διατυπώνουμε τη βασική ιδιότητα διαφορισιμότητας του συναρτησιακού κόστους
Λήμμα 331 Το συναρτησιακό κόστους J L2[0 T L2(Γ)] rarr R είναι τάξης Cinfin και για κάθεg u isin L2[0 T L2(Γ)]
Jprime(g)u =
int T
0
int
Γ(micro(g) + αg)udxdt
όπου micro(g) equiv microg isin WR(0 T ) είναι η μοναδική λύση του ακόλουθου προβλήματος Για όλα τα v isinL2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast]
int T
0
(〈microg vt〉+ a (microg v) + λ 〈microg v〉Γ
)dt = minus(microg(0) v(0)) +
int T
0(yg minus yd v)dt (337)
33 Το Σύστημα βελτιστοποίησης 27
όπου microg(T ) = 0 Επιπλέον (microg)t isin L2[0 T H1(Ω)lowast]
Οπότε το σύστημα βελτιστοποίησης που αποτελείται από τη βασική και τη συζυγή εξίσωση και ησυνθήκη βελτιστοποίησης παίρνουν τη μορφή
Λήμμα 332 ΄Εστω (yg g) equiv (y g) isinWR(0 T )timesAad συμβολίζει το μοναδικό βέλτιστο ζεύγος τουΟρισμού 322 Τότε υπάρχει μια συζυγής μεταβλητή micro isin WR(0 T ) που ικανοποιεί micro(T ) = 0 τέτοιοώστε για όλα τα v isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast]
(y(T ) v(T )) +int T
0(minus〈y vt〉+ a (y v) + λ 〈y v〉Γ) dt = (y0 v(0)) +
int T
0(〈f v〉+ λ 〈g v〉Γ) dt (338)
int T
0(〈micro vt〉+ a (v micro) + λ 〈micro v〉Γ) dt = minus(micro(0) v(0)) +
int T
0(y minus yd v) dt (339)
1) ΄Ελεγχος χωρίς περιορισμούςint T
0(αg + λmicro u)Γ dt = 0 forallu isin Aad (3310)
2) ΄Ελεγχος με περιορισμούςint T
0
int
Γ(αg + λmicro) (uminus g) dxdt ge 0 forallu isin Aad (3311)
Επιπλέον yt isin L2[0 T H1(Ω)lowast] micro isin L2[0 T H2(Ω)]capH1[0 T L2(Ω)] και η (3311) είναι ισοδύναμη
με την εξίσωση g(t x) = Proj[gagb](minus λα micro(t x)
)equiv Proj[gagb]
(ηαpartmicro(tx)partn
)για σπ (t x) isin (0 T ]times Γ
Απόδειξη Η δημιουργία του συστήματος βελτιστοποίησης αναφέρεται στη βιβλιογραφία (βλέπε πχ[109]) Για την βελτιωμένη ομαλότητα του micro σημειώνουμε ότι y minus yd isin L2[0 T L2(Ω)] και εφαρ-μόζουμε το ανάλογο του Θεωρήματος 321 για την (339) για να προκύψει πως micro isin L2[0 T H2(Ω)]capH1[0 T L2(Ω)]
Σημείωση 333 Σημειώνουμε πως για ομαλό σύνορο και για κάθε v isin H2(Ω) έχουμε πως ηκάθετη παράγωγος partv
partn είναι καλά ορισμένη και ανήκει στον H12(Γ) Αυτό όμως δεν ανήκει στηπερίπτωση που το Γ είναι πολυγωνικό χωρίο (δηλ μόνο Lipschitz συνεχής) παρόλο το γεγονός ότισε κάθε συνιστώσα του συνόρου (συμβολιζόμενη με Γi) βλέπουμε καθαρά πως partv
partn |Γi isin H12(Γi) Γιααποτελέσματα ομαλότητας για γενικά πολυγωνικά χωρία παραπέμπουμε τον αναγνώστη στο [51] Αν τοσύνορο είναι ομαλό πχ κλάσης C2 τότε micro|Γ isin L2[0 T H32(Γ)] cap H34[0 T L2(Γ)] Οπότε μπορείνα εφαρμοστεί ένα lsquolsquoπρος τα πίσω επιχείρημαrsquorsquo (lsquolsquobootstrap argumentrsquorsquo) (βλέπε και [86]) με σκοπό ναβελτιώσουμε την ομαλότητα του g y Για παράδειγμα στη περίπτωση του ελέγχου χωρίς περιορισμούςg isin L2[0 T H32(Γ)]capH34[0 T L2(Γ)] έχουμε ως αποτέλεσμα y isin L2[0 T H2(Ω)]capH1[0 T L2(Ω)]όταν y0 isin H1(Ω)
Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου Υποθέτουμε τώρα πως το (y g) isin Aad είναιμια (τοπική) βέλτιστη λύση με την έννοια του Ορισμού 325 Τότε ένα σύστημα βελτιστοποίησης πουαντιστοιχεί στο πρόβλημα βέλτιστου ελέγχου του Ορισμού 325 μπορεί εύκολα να παραχθεί βασιζόμενοιστις γνωστές τεχνικές όπως στα [25 50 80 93] πολλαπλασιαστών Lagrange Δοσμένων των f y0 ydκαι ικανοποιώντας τις υποθέσεις το Ορισμού 325 αναζητούμε y micro isin WD(0 T ) τέτοιο ώστε για όλατα v isinWD(0 T )
(y(T ) v(T )) +int T
0
(minus 〈y vt〉+ a(y v) + 〈φ(y) v〉
)dt = (y0 v(0)) +
int T
0
(〈f v〉+ (g v)
)dt
y(0 x) = y0(3312)int T
0
(〈micro vt〉+ a(micro v) + 〈φprime(y)micro v〉
)dt = minus(micro(0) v(0)) +
int T
0(y minus yd v)dt
micro(T x) = 0(3313)
28 3 Συνεχές Σύστημα Βελτιστοποίησης ΄Υπαρξη Λύσης
int T
0(αg + micro u)dt = 0 forallu isin L2[0 T L2(Ω)] (3314)
Σημείωση 334 Παρατηρούμε πως σύμφωνα με την συνθήκη βελτιστοποίησης έχουμε ότι ο έλεγχοςg είναι στη πραγματικότητα ομαλότερος δηλαδή g = minus(1α)micro isin WD(0 T ) Το τελευταίο μπορείνα χρησιμοποιηθεί για να βρούμε αποτελέσματα βελτιωμένης ομαλότητας για τη βασική και συζυγήμεταβλητή μέσω ενός lsquolsquoπρος τα πίσω επιχείρημαrsquorsquo (lsquolsquobootstrap argumentrsquorsquo) όταν είναι διαθέσιμη επιπλέονομαλότητα στα yd f y0
Πρόβλημα κατανεμημένου ελέγχου Stokes Ομοίως με προηγούμενα από [56 109] ή παρόμοια με[13 Ενότητα 3] διατυπώνουμε τη βασική ιδιότητα διαφορισιμότητας του συναρτησιακού κόστους
Λήμμα 335 Το συναρτησιακό κόστους J L2[0 T L2(Ω)] rarr R είναι τάξης Cinfin και για κάθεg u isin L2[0 T L2(Ω)]
Jprime(g)u =
int T
0
int
Ω(micro(g) + αg)udxdt
όπου micro(g) equiv microg isin WS(0 T ) είναι η μοναδική λύση του ακόλουθου προβλήματος Για όλα τα v isinL2[0 T V(Ω)] capH1[0 T V(Ω)lowast]
int T
0(〈microg vt〉+ a(microg v)) dt = minus(microg(0) v(0)) +
int T
0(yg minus yd v)dt (3315)
όπου microg(T ) = 0 Επιπλέον (microg)t isin L2[0 T L2(Ω)] και υπάρχει πίεση φ isin L2[0 T H1(Ω) cap L20(Ω)]
τέτοια ώστε η προς τα πίσω στο χρόνο εξίσωση Stokes ικανοποιείται με την ασθενή έννοια (326)
Οπότε το σύστημα βελτιστοποίησης που αποτελείται από την βασική και τη συζυγή εξίσωση και ησυνθήκη βελτιστοποίησης παίρνει την ακόλουθη μορφή
Λήμμα 336 ΄Εστω (yg g) equiv (y g) isinWS(0 T )timesAad συμβολίζει το μοναδικό βέλτιστο ζεύγος τουΟρισμού 329 Οπότε υπάρχει μια συζυγής μεταβλητή micro isin WS(0 T ) που την ικανοποιεί micro(T ) = 0τέτοια ώστε για όλα τα v isin L2[0 T V(Ω)] capH1[0 T V(Ω)lowast]
(y(T ) v(T )) +int T
0(minus〈y vt〉+ a(y v)) dt = (y0 v(0)) +
int T
0(〈f v〉+ (g v)) dt (3316)
int T
0(〈micro vt〉+ a(v micro)) dt = minus(micro(0) v(0)) +
int T
0(y minus yd v)dt (3317)
1) ΄Ελεγχος χωρίς περιορισμούςint T
0(αg + micro u) dt = 0 forallu isin Aad (3318)
2) ΄Ελεγχος με περιορισμούςint T
0
int
Ω(αg + micro) (uminus g) dxdt ge 0 forallu isin Aad (3319)
Επιπλέον yt isin L2[0 T V(Ω)lowast] micro isin L2[0 T H2(Ω)] capH1[0 T L2(Ω)] και η (3319) είναι ισοδύναμημε την εξίσωση g(t x) = Proj[gagb]
(minus 1α micro(t x)
)για σπ (t x) isin (0 T ] times Ω Επιπλέον υπάρχει μια
πίεση φ isin L2[0 T H1(Ω)capL20(Ω)] που συσχετίζεται με τη συζυγή μεταβλητή micro που ικανοποιεί το προς
τα πίσω χρονικά εξελικτικό πρόβλημα Stokes με την έννοια της (326)
Απόδειξη Η κατασκευή του συστήματος βελτιστοποίησης βρίσκεται στη βιβλιογραφία πχ στο [109]Για βελτιωμένη ομαλότητα της micro παρατηρούμε πως micro(T ) = 0 και y minus yd isin L2[0 T L2(Ω)] και οπότεη (3317) υποδηλώνει πως έχουμε micro isin L2[0 T H2(Ω) capV(Ω)] capH1[0 T L2(Ω)] Για την ομαλότητατης αντίστοιχης πίεσης φ αναφερόμαστε στη Σημείωση 328
33 Το Σύστημα βελτιστοποίησης 29
Σημείωση 337 Για βελτιωμένα αποτελέσματα ομαλότητας με περιορισμούς στον έλεγχο παρα-θέτουμε τον αναγνώστη στο [13 14] Αν το σύνορο είναι ομαλό πχ κλάσης C2 τότε g isin H1(ΩT ) capC[0 T H1(Ω)] cap L2[0 T W1p(Ω)] όταν y0 isin V(Ω) και f isin L2[0 T L2(Ω)] Πιο συγκεκριμένα οι(3316) και (3317) παίρνουν την ακόλουθη μορφή Για όλα τα v isin L2[0 T H1
0(Ω)]capH1[0 T Hminus1(Ω)]και q isin L2[0 T L2
0(Ω)]
(y(T ) v(T )) +int T
0(minus〈y vt〉+ a(y v) + b(v p)) dt = (y0 v(0)) +
int T
0(〈f v〉+ (g v)) dt
int T
0b(y q)dt = 0
(3320)
int T
0
(〈micro vt〉+ a(v micro) + b(v φ)
)dt = minus(micro(0) v(0)) +
int T
0(y minus yd v)dt
int T
0b(micro q)dt = 0
(3321)
Οπότε είναι ξεκάθαρο ότι η p φ isin L2[0 T H1(Ω)capL20(Ω)] ΄Οταν δεν υπάρχουν περιορισμοί τότε επίσης
μπορεί να εφαρμοστεί ένα lsquolsquoπρος τα πίσω επιχείρημαrsquorsquo (lsquolsquobootstrap argumentrsquorsquo) με σκοπό να βελτιώσουμετην ομαλότητα των g micro y
Προσεγγισιμότητα και ΑριθμητικήΑνάλυση
Στο παρόν κεφάλαιο παρουσιάζεται το πλήρως διακριτοποιημένο σύστημα βελτιστοποίησης και οι εκτι-μήσεις σφαλμάτων για το καθένα από τα προβλήματα που περιγράψαμε στα προηγούμενα
41 Το διακριτό πρόβλημα βέλτιστου ελέγχου 32
411 Προκαταρκτική μελέτη και ιδιότητες πλέγματος 32
412 Το πλήρες διακριτοποιημένο πρόβλημα βελτιστοποίησης 35
413 Το διακριτοποιημένο σύστημα βελτιστοποίησης 42
42 Εκτιμήσεις σφαλμάτων 47
421 Γραμμικό πρόβλημα συνοριακού Robin ελέγχου 474211 Η πλήρως διακριτή προβολή 47
4212 ΄Ελεγχοι χωρίς περιορισμούς Εισαγωγικές εκτιμήσεις 54
4213 Συμμετρικές εκτιμήσεις για αρχικά δεδομένα χωρίς ομαλότητα 57
4214 ΄Ελεγχοι με περιορισμούς Η διακριτή προσέγγιση μεταβολών 58
422 Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου 60
4221 Το πλήρως διακριτό σύστημα βελτιστοποίησης 60
4222 Εκτιμήσεις σφαλμάτων για το σύστημα βελτιστοποίησης 60
4223 ΄Ενα βοηθητικό σύστημα βελτιστοποίησης 60
423 Πρόβλημα κατανεμημένου ελέγχου Stokes 754231 Η πλήρως διακριτή προβολή 75
4232 Συμμετρικές εκτιμήσεις για το σύστημα βελτιστοποίησης 81
4233 ΄Ελεγχοι με περιορισμούς Η διακριτή προσέγγιση μεταβολών 83
4
ΠεριεχόμεναΠεριεχόμενα
Περιεχόμενα
32 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
41 Το διακριτό πρόβλημα βέλτιστου ελέγχου
Εδώ θα μελετήσουμε τη κατασκευή χώρων πεπερασμένων στοιχείων για τα προβλήματα που προαναφέρ-θηκαν το πλήρως διακριτοποιημένο πρόβλημα βέλτιστου ελέγχου καθώς και τις συνθήκες ευστάθειας
411 Προκαταρκτική μελέτη και ιδιότητες πλέγματος
Συνοριακό πρόβλημα Robin ελέγχου Θεωρούμε μια οικογένεια τριγωνοποιήσεων (ας πούμεThhgt0) του Ω ορισμένη με το κλασικό τρόπο ([34]) Για κάθε στοιχείο T isin Th συσχετίζουμεδυο παραμέτρους hT και ρT που συμβολίζουν τη διάμετρο του συνόλου T και τη διάμετρο της με-γαλύτερης μπάλας που περιέχεται στο T αντιστοίχως Το μέγεθος του πλέγματος συμβολίζεται μεh = maxTisinTh hT Θα θεωρηθούν οι ακόλουθες κλασικές ιδιότητες του πλέγματος(i) Υπάρχουν δυο θετικές σταθερές ρT και δT τέτοιες ώστεhTρT le ρT και h
hTle δT forallT isin Th και forallh gt
0(ii) Δοσμένου h έστω με TjNhj=1 συμβολίζουμε την οικογένεια των τριγώνων που ανήκουν στο Th καιέχουν μια πλευρά στο σύνορο Γ Οπότε αν οι πλευρές του Tj cap Γ συμβολίζονται με xjΓ xj+1Γ τότε ηευθεία γραμμή [xjΓ xj+1Γ] equiv TjcapΓ Σε αυτό το σημείο θα θεωρήσουμε επίσης πως x1Γ = xNh+1Γ
Πάνω στο πλέγμα Th θεωρούμε πεπερασμένους διανυσματικούς χώρους Uh sub H1(Ω) κατασκευασμένουςαπό τμηματικά πολυώνυμα στον Ω Κλασικές υποθέσεις θεωρίας προσεγγίσεων θα χρησιμοποιηθούν σεαυτούς τους χώρους Πιο συγκεκριμένα για κάθε v isin H l+1(Ω) υπάρχει ένας ακέραιος ` ge 1 και μιασταθερά C gt 0 (ανεξάρτητη του h) τέτοια ώστε
infvhisinUh
v minus vhHs(Ω) le Chl+1minussvHl+1(Ω) για 0 le l le ` και s = minus1 0 1
Χρησιμοποιούμε επίσης αντίστροφες ανισότητες (inverse inequalities) στις ψευδο-ομοιόμορφες (quasi-uniform) τριγωνοποιήσεις δηλαδή υπάρχουν σταθερές C ge 0 τέτοιες ώστε vhH1(Ω) le ChvhL2(Ω)και vhL2(Ω) le ChvhH1(Ω)lowast κτλ
Οι προσεγγίσεις θα κατασκευαστούν σε μια ψευδο-ομοιόμορφη (quasi-uniform) διαμέριση 0 = t0 lt t1 lt
lt tN = T του [0 T ] δηλαδή υπάρχει μια σταθερά 0 lt θ lt 1 τέτοια ώστε minn=1N (tn minus tnminus1) geθmaxn=1N (tnminus tnminus1) Επίσης χρησιμοποιούμε το συμβολισμό τn = tnminus tnminus1 τ = maxn=1N τ
n
και ορίζουμε με Pk[tnminus1 tnUh] το χώρο των πολυωνύμων βαθμού k ή μικρότερο έχοντας τιμές στονUh Ψάχνουμε προσεγγιστικές λύσεις που ανήκουν στο χώρο
Uh = yh isin L2[0 T H1(Ω)] yh|(tnminus1tn] isin Pk[tnminus1 tnUh]
Οι συναρτήσεις του Uh είναι αριστερά συνεχείς με δεξιά όρια και οπότε θα γράφουμε ynh equiv ynhminus γιαyh(tn) = yh(tnminus) και ενώ η ασυνέχεια στο tn συμβολίζεται με [ynh ] = ynh+ minus ynh Στους παραπάνωορισμούς έχουμε υιοθετήσει το συμβολισμό yhτ equiv yh Uhτ equiv Uh κτλ Για τη χρονική διακριτοποί-ηση επικεντρωνόμαστε στα σχήματα χαμηλής τάξης (k = 0) και την ασυνεχή μέθοδο Galerkin πουαντιστοιχεί στην έμμεση μέθοδο Euler Δίνουμε έμφαση στο ότι άλλα σχήματα (συμπεριλαμβανομένουτης αυθαίρετης τάξης σε χρόνο και χώρο) μπορούν να συμπεριληφθούν στη παρούσα μελέτη Ωστόσοη περιορισμένη ομαλότητα αποτελεί εμπόδιο για τη μελέτη σχημάτων ανώτερης τάξης
Για τη μεταβλητή ελέγχου έχουμε δυο επιλογές για τη περίπτωση με περιορισμούς και τη περίπτωσηχωρίς περιορισμούς αντιστοίχως στον έλεγχο Και στις δυο περιπτώσεις η διακριτοποιησή μας εξαρτάταιαπό τη συνθήκη βελτιστοποίησης βλέπε πχ [30]
41 Το διακριτό πρόβλημα βέλτιστου ελέγχου 33
Περίπτωση 1 ΄Ελεγχοι χωρίς περιορισμούς Εφαρμόζουμε μια διακριτοποίηση που επιτρέπειτην παρουσία ασυνεχειών πχ ορίζουμε
Gh = gh isin L2[0 T L2(Γ)] gh|(tnminus1tn] isin Pk[tnminus1 tnGh]
Στη συνέχεια προσδιορίζεται ένας σύμμορφος υπόχωρος (conforming subspace) Gh sub L2(Γ) σε κάθεχρονικό διάστημα (tnminus1 tn] ο οποίος ικανοποιεί τις κλασικές ιδιότητες προσεγγισιμότητας Υπάρχουνκαι άλλες επιλογές του Gh Εδώ επικεντρωνόμαστε στην φυσική επιλογή Gh = Uh|Γ και για μιαλεπτομερέστερη ανάλυση παραπέμπουμε τον αναγνώστη στα [52 57] Για τους υπολογισμούς σφαλμάτωνθα χρειαστεί μόνο L2[0 T L2(Γ)] ομαλότητα Συνοψίζοντας για την επιλογή τμηματικά γραμμικώνπολυωνύμων (στο χώρο) επιλέγουμε
Uh = vh isin C(Ω) vh|T isin P1 για όλα τα T isin ThGh = uh isin C(Γ) uh|[xiΓxi+1Γ] isin P1 για i = 1 Nh
Περίπτωση 2 ΄Ελεγχοι με περιορισμό Σrsquo αυτή τη περίπτωση εφαρμόζουμε την αρχήδιακριτοποίησης μεταβολών (variational discretization concept) βλέπε πχ [65] που επιτρέπει τη φυσικήδιακριτοποίηση του ελέγχου μέσω της συζυγούς μεταβλητής και δεν διακριτοποιούμε τη μεταβλητήελέγχου απευθείας
Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου ΄Ομοια με τη προηγούμενη περίπτωση του συνο-ριακού Robin ελέγχου οι πλήρως διακριτοποιημένες προσεγγίσεις κατασκευάζονται σε μια διαμέριση 0 =t0 lt t1 lt lt tN = T του [0 T ] Σε κάθε χρονικό διάστημα (tnminus1 tn] μήκους τn equiv tnminustnminus1 προσδιο-ρίζεται ένας υπόχωρος Unh του H1
0 (Ω) και θεωρείται πως κάθε Unh ικανοποιεί τα κλασικά θεωρητικά απο-τελέσματα προσεγγισιμότητας ([34]) Επίσης θεωρούμε ότι τα χρονικά βήματα είναι ψευδο-ομοιόμορφα(quasi-uniform) δηλαδή υπάρχει 0 le θ le 1 τέτοιο ώστε minn=1N τn ge θmaxn=1N τn Τώραψάχνουμε προσεγγιστικές λύσεις οι οποίες ανήκουν στο χώρο
Uh = yh isin L2[0 T H10 (Ω)] yh|(tnminus1tn] isin Pk[tnminus1 tnUnh ]
Εδώ με Pk[tnminus1 tnUnh ] συμβολίζουμε το χώρο των πολυωνύμων βαθμού k ή μικρότερου έχονταςτιμές στον Unh Επίσης χρησιμοποιούμε τον ακόλουθο συμβολισμό yhτ equiv yh Uhτ equiv Uh κτλΗ διακριτοποίηση του ελέγχου μπορεί να επιτευχθεί αποτελεσματικά μέσω της διακριτοποίησης τηςσυζυγούς μεταβλητής micro Ωστόσο τονίζουμε ότι η μόνη υπόθεση ομαλότητας για τον διακριτό έλεγχοείναι gh isin L2[0 T L2(Ω)]
Κατά σύμβαση η συναρτήσεις του Uh είναι αριστερά συνεχείς με δεξιά όρια και οπότε γράφουμε (υιο-θετώντας το συμβολισμό) yn για yh(tn) = yh(tnminus) και yn+ για yh(tn+) Ο παραπάνω συμβολισμός θαχρησιμοποιείται επίσης για τη συνάρτηση σφάλματος e = y minus yh Σύμφωνα με αποτελέσματα από γνω-στό θεώρημα εμφύτευσης WD(0 T ) sub C[0 T L2(Ω)] (βλέπε πχ [43 Κεφάλαιο 5]) η ακριβής λύσηy είναι στον C[0 T L2(Ω)] ΄Ετσι η ασυνέχεια (jump) για το σφάλμα στο tn συμβολίζεται με [en] καιείναι [en] = [yn] = yn+ minus yn
Πρόβλημα κατανεμημένου ελέγχου Stokes Ομοίως ορίζεται μια οικογένεια τριγωνοποιήσεων(συμβολιζόμενη όπως στο [34] με Thhgt0) του Ω Θεωρούμε ότι κάθε στοιχείο T isin Th δυο παράμε-τροι hT και ρT συμβολίζουν τη διάμετρο του συνόλου T και τη διάμετρο της μεγαλύτερης μπάλας πουπεριέχεται στο T αντιστοίχως και το σχετικό μέγεθος πλέγματος συμβολιζόμενο με h equiv maxTisinTh hT Υποθέτουμε τις ακόλουθες ιδιότητες πλέγματος(i) Υπάρχουν δυο θετικές σταθερές ρT και δT τέτοιες ώστε hT
ρTle ρT και h
hTle δT forallT isin Th και
forallh gt 0(ii) Ορίζουμε Ωh = cupTisinThT και συμβολίζουμε με Ωh και Γh το εσωτερικό και το σύνορο αντιστοίχωςΕπίσης υποθέτουμε πως οι πλευρές του συνόρου του Th είναι σημεία του Γ
34 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
Στο πλέγμα Th θεωρούμε δυο πεπερασμένης διάστασης χώρους Yh sub H10(Ω) και Qh sub L2
0(Ω) κατα-σκευασμένους από τμηματικά πολυώνυμα στον Ωh τα οποία μηδενίζονται στον Ωminus Ωh Παρατηρούμεπως κάτω από της παραπάνω υποθέσεις κατασκευής αν ο Ω είναι κυρτός τότε και ο Ωh είναι κυρτόςκαι |Ωminus Ωh| le Ch2 Οι παραπάνω υποθέσεις είναι αρκετές με σκοπό να παράγουμε εκτιμήσεις για τιςπεριπτώσεις όπου τα αρχικά δεδομένα ανήκουν στον W(Ω) ή V(Ω)
Η υπόθεση για το χωρίο να είναι κυρτό και πολυγωνικό (ή πολυεδρικό στον R3) είναι απαραίτητηεφόσον δεν είναι γνωστό αν η κυρτότητα είναι αρκετή να εγγυηθεί την H2 ελλειπτική ομαλότητα τωνστατικών εξισώσεων Stokes στον R3 Επιπλέον περισσότερη ομαλότητα στο σύνορο Γ (ονομαστικάC3) υποδηλώνει την H3 ομαλότητα για τις στατικές Stokes αλλά τυπικά απαιτούνται πολύ περισσότεροπερίπλοκα στοιχεία ΄Οταν έχουμε να κάνουμε με σχήματα υψηλότερης τάξης δίνουμε έμφαση στηνεπιπλέον ομαλότητα στο Γ που πρέπει να υποθέσουμε βλέπε για παράδειγμα [35 102] μαζί με συνθήκεςσυμβατότητας με σκοπό να εξασφαλίσουμε την κατάλληλη ομαλότητα για τις λύσεις
Κλασικές υποθέσεις θεωρίας προσεγγισιμότητας θα εφαρμοστούν σε αυτούς τους χώρους Πιο συγκε-κριμένα για κάθε v isin Hl+1(Ω)capH1
0(Ω) υπάρχει ένας ακέραιος ` ge 1 και μια σταθερά C gt 0 (ανεξάρτητητου h) τέτοια ώστε
infvhisinYh
v minus vhHs(Ω) le Chl+1minussvHl+1(Ω) για 0 le l le ` και s = minus1 0 1 (411)
Επίσης για κάθε q isin H l(Ω) cap L20(Ω) όταν
infqhisinQh
q minus qhL2(Ω) le ChlqHl(Ω) για 0 le l le ` (412)
Επιπλέον οι χώροι Yh και Qh πρέπει να ικανοποιούν τη συνθήκη μέγιστου-ελάχιστου (inf-sup) δηλυπάρχει ένα C gt 0 (ανεξάρτητο του h) τέτοιο ώστε
infqhisinQh
supvhisinYh
b(vh qh)vhH1(Ωh)qhL2(Ωh)
gt C (413)
Θεωρούμε επίσης το διακριτό μηδενικής απόκλισης ανάλογο του Yh και συμβολίζεται με
Uh = vh isin Yh b(vh qh) = 0 forall qh isin Qh
Επίσης θα κατασκευαστούν προσεγγίσεις σε μια ψευδο-ομοιόμορφη (quasi-uniform) διαμέριση 0 = t0 lt
t1 lt lt tN = T του [0 T ] δηλαδή υπάρχει μια σταθερά 0 lt θ lt 1 τέτοια ώστε minn=1N (tn minustnminus1) ge θmaxn=1N (tn minus tnminus1) Συμβολίζουμε με τn = tn minus tnminus1 τ = maxn=1N τ
n μεPk[tnminus1 tn Yh] Pk[tnminus1 tn Uh] και Pk[tnminus1 tnQh] τους χώρους των πολυωνύμων βαθμού k ήλιγότερο έχοντας τιμές στον Yh Uh και Qh αντιστοίχως Αναζητούμε προσεγγιστικές λύσεις για τηταχύτητα και τη πίεση που ανήκουν στους χώρους
Yh = yh isin L2[0 T H10(Ω)] yh|(tnminus1tn] isin Pk[tnminus1 tn Yh]
Uh = yh isin L2[0 T H10(Ω)] yh|(tnminus1tn] isin Pk[tnminus1 tn Uh]
Qh = yh isin L2[0 T L20(Ω)] yh|(tnminus1tn] isin Pk[tnminus1 tnQh]
Η επόμενη σημείωση εστιάζει τη προσοχή μας στο γιατί η χρήση ίδιου βαθμού πολυωνύμων ως προς τοχρόνο είναι η φυσική επιλογή για τη διακριτοποίηση (στο χρόνο) της πίεσης
Σημείωση 411 Είναι φανερό ότι το ανάλογο του διακριτού μηδενικής απόκλισης υποχώρου του
Pk[tnminus1 tn Yh] είναι Znh = vh isin Pk[tnminus1 tn Yh] int tntnminus1 b(vh qh) = 0 forall qh isin Pk[tnminus1 tnQh]
41 Το διακριτό πρόβλημα βέλτιστου ελέγχου 35
Τότε το [32 Λήμμα 23] υποδηλώνει πως ο Znh equiv Pk[tnminus1 tn Uh] Οπότε μπορούμε να γράψουμε ότι
Zh equiv vh isin Yh int T
0b(vh qh) = 0 forall qh isin Qh
= vh isin Yh vh|(tnminus1tn] isin Znh = vh isin Yh vh|(tnminus1tn] isin Pk[tnminus1 tn Uh] equiv Uh
Παραπέμπουμε τον αναγνώστη στην [32 Ενότητα 2] για περισσότερες λεπτομέρειες
Στους παραπάνω συμβολισμούς κατά σύμβαση οι συναρτήσεις του Uh είναι αριστερά συνεχείς με δεξιάόρια Οπότε θα γράφουμε yn για το y(tn) equiv y(tnminus) ynminus1
+ για το y(tnminus1+ ) ynh για το yh(tn) = yh(tnminus) και
ynh+ για το y(tn+) ενώ η ασυνέχεια (jump) στο tn συμβολίζεται με [ynh ] = ynh+ minus ynh Στους παραπάνωορισμούς έχουμε επίσης χρησιμοποιήσει τον ακόλουθο συμβολισμό yhτ equiv yh Yhτ equiv Yh Uhτ equiv Uhκτλ Αυτό εξαιτίας του γεγονότος ότι η παράμετρος χρονικής διακριτοποίησης τ μπορεί να επιλεγείανεξάρτητη του h
Τονίζουμε πως άλλα σχήματα (όπως σχημάτων αυθαίρετης τάξης στο χρόνο και στο χώρο) θα συμπερι-ληφθούν στις παρακάτω αποδείξεις Ωστόσο η περιορισμένη ομαλότητα αποτελεί φράγμα στην ανάπτυ-ξη εκτιμήσεων υψηλότερης τάξης τουλάχιστον στην παρουσία περιορισμών στον έλεγχο Η περίπτωσησχημάτων χαμηλής τάξης στο χώρο και στο χρόνο έχει αντιμετωπιστεί με λεπτομέρεια στις πρόσφατεςεργασίες [13 14] για το πρόβλημα εντοπισμού ταχύτητας σε ροές Navier-Stokes με περιορισμούς γιατον έλεγχο όταν τα δεδομένα είναι y0 isin V(Ω) f isin L2[0 T L2(Ω)]
Για την μεταβλητή ελέγχου έχουμε δυο ξεχωριστές επιλογές για τη περίπτωση με και χωρίς περιορισμούςαντίστοιχα Και στις δυο περιπτώσεις η διακριτοποίησή μας έχει ως κίνητρο τη συνθήκη βελτιστοποίη-σηςΠερίπτωση 1 Για ελέγχους χωρίς περιορισμούς Μας απασχολούν οι φυσικές χωροχρο-νικές διακριτοποιήσεις που επιτρέπουν τη παρουσία ασυνεχειών (στο χρόνο) Ειδικότερα ορίζουμε ωςGh equiv Yh Στα επόμενα θα χρειαστούμε για τις εκτιμήσεις σφαλμάτων μόνο L2[0 T L2(Ω)] ομαλότηταΠερίπτωση 2 Για ελέγχους με περιορισμούς Παρόμοια με τη προηγούμενη περίπτωσημας απασχολούν οι αρχές διακριτοποίησης μεταβολών βλέπε πχ [65] οι οποίες επιτρέπουν τη φυσικήδιακριτοποίηση των ελέγχων μέσω της συζυγούς μεταβλητής Στην ουσία δεν διακριτοποιούμε απευθείαςτη μεταβλητή ελέγχου δηλαδή στον Gh equiv L2[0 T L2(Ω)]
412 Το πλήρες διακριτοποιημένο πρόβλημα βελτιστοποίησης
Γραμμικό πρόβλημα συνοριακού Robin ελέγχου Το ασυνεχές χρονικού βηματισμού πλήρως δια-κριτοποιημένο σχήμα για την απεικόνιση του ελέγχου στη βασική μεταβλητή Gh L2[0 T L2(Γ)]rarr Uhη οποία συσχετίζει το κάθε έλεγχο g στην βασική του μεταβλητή Gh(g) = ygh equiv yh(g) ορίζεταιως εξής Για κάθε g isin L2[0 T L2(Γ)] για δοσμένα δεδομένα y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast]και στόχο yd isin L2[0 T L2(Ω)] αναζητούμε yh isin Uh τέτοιο ώστε για n = 1 N και για όλα ταvh isin Pk[tnminus1 tnUh]
(ynh vnh) +int tn
tnminus1
(minus 〈yh vht〉+ a(yh vh) + λ〈yh vh〉Γ
)dt
= (ynminus1h vnminus1
h+ ) +int tn
tnminus1
(〈f vh〉+ λ〈g vh〉Γ
)dt (414)
Σημειώνουμε πως στον παραπάνω ορισμό χρειάζεται μόνο g isin L2[0 T L2(Γ)] ομαλότητα για να επαλη-θεύεται το πλήρες διακριτοποιημένο σχήμα Υπολογισμοί ευστάθειας στα σημεία της χρονικής διαμέρισηςκαθώς και οι L2[0 T H1(Ω)] και L2[0 T L2(Γ)] νόρμες εύκολα προκύπτουν θέτοντας vh = yh στην
36 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
(414) Για τους υπολογισμούς σε αυθαίρετα χρονικά σημεία μπορούμε να εφαρμόσουμε τεχνικές πουπαρουσιάστηκαν στην [31 Ενότητα 2] για γενικές γραμμικές παραβολικές εξισώσεις (βλέπε επίσης [23Ενότητα 3] για υπολογισμούς ευστάθειας σε ημιγραμμικές παραβολικές μδε με Robin δεδομένα)Παρόμοια με τη συνεχή περίπτωση η πλήρως διακριτοποιημένη απεικόνιση από τον έλεγχο στη βασικήμεταβλητή Gh L2[0 T L2(Γ)] rarr Uh είναι καλά ορισμένη και συνεχής Ακολουθεί ο ορισμός τουδιακριτοποιημένου προβλήματος βελτιστοποίησης με έλεγχο σε Robin συνθήκες
Ορισμός 412 ΄Εστω δοσμένα δεδομένα f isin L2[0 T H1(Ω)lowast] y0 isin L2(Ω) yd isin L2[0 T L2(Ω)]Υποθέτουμε ότι το σύνολο των διακριτοποιημένων επιθυμητών ελέγχων συμβολίζεται με Adad equiv Gh capAad και έστω Jh(yh gh) equiv 1
2int T
0int
Ω |yh minus yd|2dxdt + α2int T
0int
Γ |gh|2dxdt Εδώ το ζεύγος (yh gh) isinUhtimesAdad ικανοποιεί την (414) ΄Οταν το ζεύγος (yh gh) isin UhtimesAdad τότε λέμε πως είναι μια βέλτιστηλύση αν Jh(yh gh) le Jh(wh uh) forall(wh uh) isin Uh timesAdad
Η ύπαρξη λύσης του διακριτοποιημένου προβλήματος βέλτιστου ελέγχου μπορεί να αποδειχθεί με κλα-σικές τεχνικές ενώ η μοναδικότητα προκύπτει από τη δομή του συναρτησιακού και τη γραμμικότη-τα της εξίσωσης Οι βασικοί υπολογισμοί ευστάθειας αναφορικά με το βέλτιστο ζεύγος (yh gh) isinWR(0 T ) times L2[0 T L2(Γ)] μπορεί εύκολα να προκύψει Παραθέτουμε στη συνέχεια τους υπολογι-σμούς σε αυθαίρετα χρονικά σημεία για σχήματα αυθαίρετης τάξης με ελάχιστες υποθέσεις ομαλότη-τας υιοθετημένα και προσαρμοσμένα στη δικιά μας περίπτωση από την [23 Ενότητα 3] Οι υπολο-γισμοί εστιάζουν τη προσοχή μας στο γεγονός ότι η φυσική επιλογή της διακριτής ενεργειακής νόρ-μας για τη βασική μεταβλητή σχετικά με ασυνεχή σχήματα χρονικού βηματισμού είναι WR(0T ) =L2[0T H1(Ω)] + Linfin[0T L2(Ω)] + L2[0T L2(Γ)]
Λήμμα 413 ΄Εστω y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] Αν (yh gh) isin Uh times Adad συμβολίζει τοζεύγος λύσεων του διακριτοποιημένου προβλήματος βέλτιστου ελέγχου Τότε
yhLinfin[0T L2(Ω)] le C max
1(λ
α
)12 ( ∥∥y0∥∥L2(Ω) + fL2[0T H1(Ω)lowast]
)
Εδώ η C ge 0 εξαρτάται από το 1CF minη λ Ck και το Ω αλλά όχι από τα α τ h
Απόδειξη Βήμα 1 Εφόσον το ζεύγος (yh 0) είναι ένα επιθυμητό ζέυγος για το διακριτό πρόβλημαείναι
J(yh gh) le J(yh 0) = 12
int T
0yh minus yd2L2(Ω) le C
(yh2L2[0T L2(Ω)] + yd2L2[0T L2(Ω)]
)
le C(fL2[0T H1(Ω)lowast] + y0L2(Ω) + yd2L2(Ω)
)
Βήμα 2 Θέτοντας υh = yh στη σχέση
(yn υn) +int tn
tnminus1(〈minusyh υht〉+ a(yh υh) + λ 〈yh υh〉Γ) = (ynminus1 υnminus1
+ ) +int tn
tnminus1(〈f υh〉+ λ 〈gh υh〉Γ)
έχουμε
12 y
n2L2(Ω) + 12∥∥[ynminus1]
∥∥2L2(Ω) minus
12∥∥ynminus1∥∥2
L2(Ω) +int tn
tnminus1
(CF minη λ yh2H1(Ω) + λ
4 yhL2(Γ)
)dt
leint tn
tnminus1
(1CF
minη λ f2H1(Ω)lowast + λ gh2L2(Γ)
)dt
Στη συνέχεια χρησιμοποιούμε το φράγμα για τοint tntnminus1 gh2L2(Γ) dt από τη σχέση J(yh gh) le C
(fL2[0T H1(Ω)lowast] + y0L2(Ω) + yd2L2(Ω)
)
41 Το διακριτό πρόβλημα βέλτιστου ελέγχου 37
και παίρνουμε
yn2L2(Ω) +nminus1sum
i=1[y]2L2(Ω) +
int tn
0
(CF minη λ yh2H1(Ω) + λ yh2L2(Γ)
)le Cst max1 λ
a
Βήμα 3 Σχετικά με το φφράγμα σε αυθαίρετα χρονικά σημεία χρησιμοποιούμε την εκθετική παρεμβολήeminusρ(tminust
nminus1)yh συμβολιζόμενη με _yh
int tn
tnminus1(yht_yh)dt =
int tn
tnminus1(yht yh)eminusρ(tminust
nminus1)dt
= 12 y
n2L2(Ω) eminusρ(tnminustnminus1) + 1
2∥∥[ynminus1]
∥∥2L2(Ω) minus
12∥∥ynminus1∥∥2
L2(Ω)
+ρ
2
int tn
tnminus1yhL2(Ω) e
minusρ(tminustnminus1)dt
leint tn
tnminus1
(∣∣∣a(yh_yh)∣∣∣+ λ
∣∣∣langyh
_yh
rangΓ
∣∣∣+∣∣∣langf
_yh
rang∣∣∣+ λ∣∣∣langgh
_yh
rangΓ
∣∣∣)dt
Απο το θεώρημα προβολής το _yh φράσσεται απο το yh επίσης είναι
int tn
tnminus1|a(yh yh)| dt le Ck
int tn
tnminus1yh2L2[tnminus1tnH1(Ω)] dt
int tn
tnminus1
∣∣∣langf
_yh
rang∣∣∣ dt le CkCF
minη λint tn
tnminus1f2H1(Ω)lowast dt+ CF minη λ
int tn
tnminus1yh2H1(Ω) dt
int tn
tnminus1λ∣∣∣langgh
_yh
rangΓ
∣∣∣+ λ∣∣∣langyh
_yh
rangΓ
∣∣∣ dt leint tn
tnminus1gh2L2(Γ) dt+ Ck(λ+ λ2
a)int tn
tnminus1yh2L2(Γ) dt
Οπότε
12 y
n2L2(Ω) eminusρ(tnminustnminus1) + 1
2∥∥[ynminus1]
∥∥2L2(Γ) minus
12∥∥[ynminus1]
∥∥2L2(Ω) + ρ
2
int tn
tnminus1yn2L2(Ω) e
minusρ(tminustnminus1)dt
le Ckint tn
tnminus1
(1CF
minη λ f2H1(Ω)lowast + (η + CF minη λ) yh2H1(Ω) + α gh2L2(Ω)
+(λ+ λ2
α) yn2L2(Γ))dt
)
και τελικά έχουμε για ρ = 1τn
12 y
n2L2(Ω) eminus1 + 1
2∥∥[ynminus1]
∥∥2L2(Ω) minus
12∥∥ynminus1∥∥2
L2(Ω) +(eminus12τn
) int tn
tnminus1yh2L2(Ω) dt
le Ckint tn
tnminus1
(minη λ
CFf2H1(Ω)lowast + (η + CF minη λ) yh2H1(Ω) + α gh2L2(Γ)
+(λ+ λ2
α) yh2L2(Γ))dt
)
Επίσης από την αντίστροφη εκτίμηση (inverse estimate) yh2L2(Ω) le Ckτn
int tntnminus1 yh2L2(Ω) dt έχουμε
yhLinfin[tnminus1tnC2(Ω)] le Ck(∥∥ynminus1∥∥2
L2(Ω) +int tn
tnminus1
((1CF ) minη λ f2H1(Ω)lowast
+ (η + CF min(η λ)) yh2H1(Ω) + a gh2L2(Γ) + (λ+ λ2a) yh2L2(Γ)
))
38 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
οπότε ο όρος gh2L2(Γ) φράσσεται όπως προηγουμένως και έχουμε τη ζητούμενη εκτίμηση
Σημειώνουμε πως η παραπάνω εκτίμηση είναι έγκυρη ακόμη και για τη περίπτωση των περιορισμών στονέλεγχο υποθέτοντας ότι 0 isin Adad
Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου Η διακριτή βασική εξίσωση μπορεί να οριστείως ακολούθως Κάτω από τις υποθέσεις του Ορισμού 325 αναζητούμε yh isin Uh τέτοιο ώστε για κάθεgh isin L2[0 T L2(Ω)]
(yn vn) +int tn
tnminus1
(minus 〈yh vht〉+ a(yh vh) + (φ(yh) vh)
)dt = (ynminus1 vnminus1
+ )
+int tn
tnminus1
(〈f vh〉+ (gh vh)
)dt forall vh isin Pk[tnminus1 tnUnh ] (415)
για n = 1 N Το διακριτό επιθυμητό σύνολο Adad και το διακριτό (τοπικό) πρόβλημα βέλτιστουελέγχου είναι τώρα καλά ορισμένα κατrsquo αναλογίαν με το συνεχές πρόβλημα
Ορισμός 414 Υποθέτουμε πως ισχύουν οι υποθέσεις που αναφέραμε στο προηγούμενο κεφάλαιο
1 Adad equiv (yh gh) isin Uh times L2[0 T Unh ] τέτοιο ώστε να ισχύει η (415)
2 Διακριτό βέλτιστο (τοπικό) Βέλτιστο Ζεύγος Ψάχνουμε ζεύγος (yh gh) isin Adad τέτοιο ώστεJ(yh gh) le J(wh uh) για όλα τα (wh uh) isin Adad ότανyh minus whL2[0T H1
0 (Ω)] + yh minus whLinfin[0T L2(Ω)] + gh minus uhL2[0T L2(Ω)] le δprime για κατάλληλοεπιλεγμένο δprime gt 0
΄Εστω yh είναι η λύση του (415) χωρίς έλεγχο Χωρίς βλάβη της γενικότητας είναι κατανοητό ότι τοζεύγος (yh 0) isin Adad και δprime είναι επιλεγμένο με τέτοιο τρόπο ώστε να διασφαλίζεται ότι J(yh gh) leJ(yh 0) Η απόδειξη της ύπαρξης βέλτιστης λύσης του διακριτού προβλήματος και του αντίστοιχουδιακριτού συστήματος διακριτοποίησης (1ης Τάξης Συνθήκη Βελτιστοποίησης) απαιτούν υπολογισμούςευστάθειας για τη λύση της (415) υπό υποθέσεις ελάχιστης ομαλότητας (βλέπε πχ [22 Ενότητα3]) Αυτοί οι υπολογισμοί ευστάθειας χρειάζονται επίσης για τη παραγωγή υπολογισμών σφαλμάτων Ηνόρμα yhX equiv yhLinfin[0T L2(Ω)] + yhL2[0T H1(Ω)] χρησιμοποιείται ως μια φυσική ενεργειακή νόρμαπου σχετίζεται με τη dG μοντελοποίηση εφόσον η διακριτή χρονική παράγωγος δεν παρουσιάζει καμίαουσιαστική ομαλότητα εξαιτίας της παρουσίας ασυνεχειών
Κάτω από τις επιπρόσθετες υποθέσεις για τον ημιγραμμικό όρο παράγουμε ένα φράγμα ευστάθειας τοοποίο βελτιώνει την εξάρτηση του τ σε σχέση με τη παράμετρο ποινής α συγκρινόμενα με το αποτέλεσματου [22 Λήμμα 36]
Υπόθεση 415 Υποθέτουμε πως το tnNn=0 συμβολίζει μια ψευδο-ομοιόμορφη (quasi-uniform)διαμέριση του [0 T ] Επιπλέον της Υπόθεσης 311 υποθέτουμε πως ο φ ικανοποιεί την ακόλουθηυπόθεση Για όλα τα n = 1 N και s1 s2 isin L2[tnminus1 tnL2(Ω)] με s1minus s2L2[tnminus1tnL2(Ω)] le ε γιακάποιο ε gt 0 υπάρχει CL gt 0 (αλγεβρική σταθερά) τέτοια ώστε
φ(s1)minus φ(s2)L2[tnminus1tnL2(Ω)] le CLs1 minus s2L2[tnminus1tnL2(Ω)]
Σημείωση 416 Στη συνέχεια θα συμβολίζουμε με CL τις σταθερές που εξαρτώνται μόνο απόσταθερές Lipschitz των Υποθέσεων 311 και 415 και με Ck σταθερές που εξαρτώνται από το k Καιοι δυο σταθερές μπορούν να είναι διαφορετικές σε διαφορετικές εμφανίσεις
Λήμμα 417 Υποθέτουμε πως τα y0 isin L2(Ω) yd isin L2[0 T L2(Ω)] f isin L2[0 T Hminus1(Ω)] είναιδεδομένες συναρτήσεις και έστω ο φ ικανοποιεί τις Υποθέσεις 311 και 415 Αν (yh gh) isin Uh times
41 Το διακριτό πρόβλημα βέλτιστου ελέγχου 39
L2[0 T Unh ] είναι ένα ζεύγος λύσεων του διακριτού (τοπικού) προβλήματος βέλτιστου ελέγχου τότε
int T
0yh minus yd2L2(Ω)dt+ (α2)
int T
0gh2L2(Ω)dt
le C(y02L2(Ω) + (1η)
int T
0f2Hminus1(Ω)dt+
int T
0yd2L2(Ω)dt
)equiv Cst
όπου C είναι μια σταθερά που εξαρτάται μόνο από το Ω Επιπλέον για όλα τα n = 1 N
yn2L2(Ω) +nminus1sum
i=0[yi]2L2(Ω) +
int tn
0ηyh2H1(Ω)dt le Dyst
με Dyst equiv Cst max1 1α12 ΄Εστω τ equiv maxi=1n τi με τi = ti minus timinus1 Αν τ leminCk8CLC12
st Ckα128 τότε ισχύει η ακόλουθη εκτίμηση
yh2Linfin[0T L2(Ω)] le CDyst
όπου C εξαρτάται από τα (Ccη) Ck και Ω αλλά όχι από τα α τ h
Απόδειξη Για τις δύο πρώτες εκτιμήσεις απλώς παρατηρούμε πως J(yh gh) le J(yh 0) equiv(12)
int T0 yh minus U2L2(Ω)dt όπου το yh αντιστοιχεί στη λύση της (415) χωρίς έλεγχο Η εκτίμηση
για το yh προκύπτει από το [31 Ενότητα 2] Για τη δεύτερη εκτίμηση θέτουμε vh = yh στην (415)και χρησιμοποιούμε την ανισότητα Young για να πάρουμε
(12)yn2L2(Ω) + (12)[ynminus1]2L2(Ω) + η
int tn
tnminus1yh2H1(Ω)dt
le (12)ynminus12L2(Ω) + (1(4α12))int tn
tnminus1yh2L2(Ω)dt+ α12
int tn
tnminus1gh2L2(Ω)dt
Η εκτίμηση τώρα προκύπτει προσθέτοντας τις παραπάνω ανισότητες και χρησιμοποιώντας το πρώτουπολογισμό Για την εκτίμηση σε αυθαίρετα σημεία η απόδειξη βασίζεται σε παλιότερες ιδέες ([32]) Γιαχάρη πληρότητας περιγράφουμε την απόδειξη Θέτουμε vh = yh στην (415) όπου yh είναι η εκθετικήπαρεμβολή του eminusρ(tminust
nminus1)yh του yh (για κάποιο ρ gt 0) και ορίζεται στο Παράρτημα Α΄2 Οπότε οορισμός του yh επιτρέπει να πάρουμε
int tn
tnminus1(yht yh)dt =
int tn
tnminus1(yht yh)eminusρ(tminust
nminus1)dt = (12)yn2L2(Ω)eminusρ(tnminustnminus1)
minus(12)ynminus12L2(Ω) + (ρ2)int tn
tnminus1yh(t)2L2(Ω)e
minusρ(tminustnminus1)dt (416)
Στη συνέχεια εφαρμόζοντας παραγοντική ολοκλήρωση ως προς το χρόνο στην (415) και χρησιμοποι-ώντας την (416) έχουμε
(12)yn2L2(Ω)eminusρ(tminustnminus1) + (12)[ynminus1]2L2(Ω) minus (12)ynminus12L2(Ω)
+(ρ2)int tn
tnminus1yh(t)2L2(Ω)e
minusρ(tminustnminus1)dt+int tn
tnminus1〈φ(yh) yh〉dt
leint tn
tnminus1|a(yh yh)|dt+
int tn
tnminus1|〈f yh〉|dt+
int tn
tnminus1|(gh yh)|dt
Χρησιμοποιώντας το Λήμμα Αʹ22 μπορούμε να φράξουμε το yh σε όρους του yh σε διάφορες νόρμες
40 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
Ειδικότερα χρησιμοποιώντας τις ανισότητες Young καταλήγουμε
(12)yn2L2(Ω)eminusρ(tminustnminus1) + (12)[ynminus1]2L2(Ω) minus (12)ynminus12L2(Ω)
+(ρ2)int tn
tnminus1yh(t)2L2(Ω)e
minusρ(tminustnminus1)dt+int tn
tnminus1〈φ(yh) yh〉dt
le Ck(int tn
tnminus1
(f2Hminus1(Ω) + (Cc + η)yh2H1(Ω)
)dt
+int tn
tnminus1
(α12gh2L2(Ω) + (1α12)yh2L2(Ω)
)dt) (417)
Απομένει να φράξουμε τον ημιγραμμικό όρο Για αυτό το σκοπό χρησιμοποιώντας την Υπόθεση 311έχουμε
int tn
tnminus1〈φ(yh) yh〉dt ge
int tn
tnminus1〈φ(yh)minus φ(yh) yh〉dt
Μεταφέροντας το τελευταίο ολοκλήρωμα στο δεξί μέλος της (417) έχουμε το φράγμα ως ακολούθωςΤο Λήμμα Αʹ22 δείχνει πως η διαφορά yhminusyh παραμένει μικρή Πιο συγκεκριμένα χρησιμοποιώντας τιςπροηγούμενες εκτιμήσεις για το yhL2[0T L2(Ω)] μπορούμε να φράξουμε το yhminus yhL2[tnminus1tnL2(Ω)] leCkρτnyhL2[tnminus1tnL2(Ω)] le CkρτC12
st Επομένως έχουμε από την Υπόθεση 415 και την ανισότηταHoumllder
int tn
tnminus1〈φ(yh)minus φ(yh) yh〉dt le CLyh minus yhL2[tnminus1tnL2(Ω)]yhL2[tnminus1tnL2(Ω)]
le CkCLρτnC12st
int tn
tnminus1yh2L2(Ω)dt
Εφαρμόζοντας τις παραπάνω ανισότητες στην (417) παίρνουμε
(12)yn2L2(Ω)eminusρ(tminustnminus1) + (12)[ynminus1]2L2(Ω) minus (12)ynminus12L2(Ω)
+(ρ2)int tn
tnminus1yh(t)2L2(Ω)e
minusρ(tminustnminus1)dt
le Ckint tn
tnminus1
(f2Hminus1(Ω) + (Cc + η)yh2H1(Ω) + α12gh2L2(Ω)
)dt
+(
(1α12) + CkCLρτnC12st
)int tn
tnminus1yh2L2(Ω)dt
le Ckint tn
tnminus1
(f2Hminus1(Ω) + (Cc + η)yh2H1(Ω) + α12gh2L2(Ω)
)dt
+τn(
(1α12) + CkCLρτnC12st
)yh2Linfin[tnminus1tnL2(Ω)]
Οπότε επιλέγοντας ρ = 1τn και χρησιμοποιώντας την αντίστροφη εκτίμηση yh2Linfin[tnminus1tnL2(Ω)] leCkτn
int tntnminus1 yh(t)2L2(Ω) παρατηρούμε πως ο τελευταίος όρος στο αριστερό μέλος μπορεί να φραχτεί
όπως παρακάτω
(ρ2)int tn
tnminus1yh(t)2L2(Ω)e
minusρ(tminustnminus1)dt ge (eminus12τn)int tn
tnminus1yh(t)2L2(Ω)dt
ge Ckyh2Linfin[tnminus1tnL2(Ω)]
Τελικώς φράσσουμε τον τελευταίο όρο στο δεξί μέλος Επιλέγοντας το τn gt 0 με τέτοιο τρόποώστε να κρύψουμε αυτόν τον όρο από το αριστερό μέλος στο δεξί δηλ C12
st CkCLτn le Ck8 και
41 Το διακριτό πρόβλημα βέλτιστου ελέγχου 41
(τnα12) le Ck8 για τn le min(Ck8CLC12
st (α12Ck8) παίρνουμε
(14)yh2Linfin[tnminus1tnL2(Ω)] le ynminus12L2(Ω)
+Ckint tn
tnminus1
(f2Hminus1(Ω) + (Cc + η)yh2H1(Ω) + α12gh2L2(Ω)
)dt
Η εκτίμηση τώρα ακολουθεί χρησιμοποιώντας τις παραπάνω εκτιμήσεις στην ενεργειακή νόρμα και τασημεία διαμέρισης
Σημείωση 418 Η Υπόθεση 415 είναι επίσης χρήσιμη με σκοπό να ελαχιστοποιήσουμε τις τε-χνικές λεπτομέρειες στην επακόλουθη παραγωγή των συμμετρικών εκτιμήσεων σφαλμάτων Ωστόσοτονίζουμε πως η συνθήκη αύξουσας μονοτονίας ικανοποιείται με τον εκθέτη 1 le p le 2 και μπορεί εύκολανα αποδειχθεί πως φ(yh)minus φ(yh)L2[tnminus1tnL2(Ω)] le C(Cst Ck)yh minus yhL2[tnminus1tnL2(Ω)]
΄Ομοια με τη περίπτωση του [22 Θεώρημα 38] (όπου το φ ικανοποιεί τις συνθήκες μονοτονίας καιαύξουσας μονοτονίας) ισχύει το ακόλουθο αποτέλεσμα σύγκλισης υπό ελάχιστες υποθέσεις ομαλότηταςόταν χρησιμοποιούνται οι ίδιοι υπόχωροιi σε κάθε χρονικό διάστημα πχ Unh = Uh sub H1
0 (Ω) γιαn = 1 N
Θεvώρημα 419 Δεδομένου σταθερού (fixed) h και διαμέρισης 0 = t0 lt t1 lt lt tN = T του [0 T ]με τ = maxi=1N τi ικανοποιούνται οι υποθέσεις του Λήμματος 417 και έστω ότι ισχύει η υπόθεση311 Υποθέτουμε πως f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω) yd isin L2[0 T L2(Ω)] και έστω α gt 0 Τότεγια Unh equiv Uh sub H1
0 (Ω) και για ψευδο-ομοιόμορφους (quasi-uniform) χρονικούς βηματισμούς έχουμε
bull Υπάρχει yh isin Uh και gh isin L2[0 T L2(Ω)] τέτοια ώστε το ζεύγος (yh gh) ικανοποιεί τη διακριτήεξίσωση (415) και το συναρτησιακό J(yh gh) ελαχιστοποιείται
bull Το διακριτό ζεύγος (yh gh) συγκλίνει καθώς τα τ hrarr 0 στη λύση (y g) του συνεχούς προβλήμα-τος βέλτιστου ελέγχου με την ακόλουθη έννοια
yh rarr y ασθενώς στον L2[0 T H10 (Ω)]
yh rarr y ασθενώς- στον Linfin[0 T L2(Ω)]yh rarr y ισχυρώς στον L2[0 T L2(Ω)]gh rarr g ασθενώς στον L2[0 T L2(Ω)]
Σημείωση 4110 Οι εκτιμήσεις ευστάθειας υπό ελάχιστες υποθέσεις ομαλότητας είναι έγκυρεςακόμη και όταν χρησιμοποιηθούν διαφορετικοί υπόχωροι σε κάθε χρονικό διάστημα Το αποτέλεσμα τηςσύγκλισης του [22 Θεωρήματος 38] βασίζεται στο επιχείρημα διακριτής συμπάγειας του Walkington(βλέπε [110 Θεώρημα 31]) για ασυνεχή χρονικού βηματισμού σχήματα τα οποία δημιουργούνται ότανUnh equiv Uh Ωστόσο είναι πιθανό να επεκτείνουμε το κύριο αποτέλεσμα ακόμη και στη περίπτωση μεδιαφορετικούς υπόχωρους Υπογραμμίζουμε επίσης ότι η απόδειξη του Θεωρήματος 419 απαιτεί μόνοτις υποθέσεις μονοτονίας και αύξουσας μονοτονίας της Υπόθεσης 311
Πρόβλημα κατανεμημένου ελέγχου Stokes Το ασυνεχές χρονικού βηματισμού πλήρως διακριτο-ποιημένο σχήμα για την απεικόνιση από τον έλεγχο στη βασική μεταβλητή Gh L2[0 T L2(Ω)]rarr Uhαπεικονίζει τον κάθε έλεγχο g στην αντίστοιχη κατάσταση Gh(g) = ygh equiv yh(g) Για κάθε δεδομένοg isin L2[0 T L2(Ω)] και δοθέντων y0 isinW(Ω) f isin L2[0 T V(Ω)lowast] αναζητούμε yh isin Uh τέτοιο ώστεγια n = 1 N και για όλα τα vh isin Pk[tnminus1 tn Uh]
(ynh vnh) +int tn
tnminus1
(minus 〈yh vht〉+ a(yh vh)
)dt = (ynminus1
h vnminus1h+ ) +
int tn
tnminus1
(〈f vh〉+ (g vh)
)dt (418)
iΣε ένα διανυσματικό χώρο με νόρμα V μια ακολουθία uk του V συγκλίνει ασθενώς στο u isin V αν 〈vlowast un〉 rarr 〈vlowast u〉για κάθε vlowast isin V lowast Σε ένα διανυσματικό χώρο με νόρμα V μια ακολουθία ulowast
k του V lowast συγκλίνει ασθενώςminuslowast στοulowast isin V lowast αν 〈ulowast
n v〉 rarr 〈ulowast v〉 για κάθε v isin V Ταυτίζεται με την ασθενή σύγκλιση αν ο V είναι ανακλαστικός ειδικάαν V lowast = V πχ αν ο V είναι Hilbert
42 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
Προκύπτουν εύκολα εκτιμήσεις σφαλμάτων στα σημεία διαμέρισης για τις νόρμες L2[0 T H1(Ω)] θέτον-τας vh = yh στην (418) Για εκτιμήσεις σε αυθαίρετα σημεία παραπέμπουμε τον αναγνώστη στο[32 Παράρτημα Α] Οπότε οι εκτιμήσεις ευστάθειας υποδηλώνουν πως ο έλεγχος απεικονίζεται στηπλήρως διακριτοποιημένη βασική μεταβλητή μέσω της απεικόνισης Gh L2[0 T L2(Ω)] rarr Uh είναικαλά ορισμένη και συνεχής Παρόμοια με τη συνεχή περίπτωση όταν για τα δεδομένα είναι διαθέσιμηπερισσότερη ομαλότητα δηλαδή y0 isin V(Ω) f isin L2[0 T L2(Ω)] τότε αναζητούμε (yh ph) isin Uh timesQhτέτοια ώστε να ισχύει η παρακάτω τυποποίηση Για n = 1 N και για όλα τα vh isin Pk[tnminus1 tn Yh]qh isin L2[0 T L2
0(Ω)
(ynh vnh) +int tn
tnminus1
(minus 〈yh vht〉+ a(yh vh) + b(vh ph)
)dt = (ynminus1
h vnminus1h+ ) +
int tn
tnminus1
(〈f vh〉+ (g vh)
)dt
int tn
tnminus1b(yh qh)dt = 0 (419)
Το πλήρες διακριτοποιημένο πρόβλημα βέλτιστου ελέγχου μπορεί να οριστεί ως εξής
Ορισμός 4111 Θεωρούμε δοσμένα δεδομένα f isin L2[0 T V(Ω)lowast] y0 isin W(Ω) yd isinL2[0 T W(Ω)] Υποθέτουμε ότι το σύνολο των διακριτών επιθυμητών ελέγχων συμβολίζεται μεAdad equiv Gh cap Aad και έστω Jh(yh gh) equiv 1
2int T
0int
Ωh |yh minus yd|2dxdt + α2int T
0int
Ωh |gh|2dxdt Εδώ το
ζεύγος (yh gh) isin Uh times Adad ικανοποιεί την (418) Τότε το ζεύγος (yh gh) isin Uh times Adad λέγεται πωςείναι βέλτιστη λύση αν Jh(yh gh) le Jh(wh uh) forall(wh uh) isin Uh timesAdad
Η ύπαρξη και μοναδικότητα του διακριτού προβλήματος βέλτιστου ελέγχου μπορεί να αποδειχθεί μεκλασικές τεχνικές Στη συνέχεια θα δούμε τις εκτιμήσεις σε αυθαίρετα σημεία για σχήμα αυθαίρε-της τάξης κάτω από ελάχιστες υποθέσεις ομαλότητας προσαρμοσμένα στη περίπτωσή μας από την[32 Ενότητα 4] Στην εκτίμηση υπογραμμίζεται το γεγονός πως η φυσική διακριτή ενεργειακή νόρ-μα για τη βασική μεταβλητή σχετική με τα ασυνεχή σχήματα χρονικού βηματισμού είναι WS(0T ) =L2[0T H1(Ω)] + Linfin[0T L2(Ω)]
Λήμμα 4112 Υποθέτουμε ότι y0 isin W(Ω) f isin L2[0 T V(Ω)lowast] Αν το (yh gh)isin Uh times Adadσυμβολίζει το ζεύγος λύσεων του διακριτού προβλήματος βέλτιστου ελέγχου τότε υπάρχει σταθερά C gt 0εξαρτώμενη από τα 1ν Ck και Ω αλλά όχι από τα α τ h τέτοια ώστε
yh2Linfin[0T L2(Ω)] le C(1α)( ∥∥y0∥∥2
L2(Ω) + f2L2[0T V(Ω)lowast])
413 Το διακριτοποιημένο σύστημα βελτιστοποίησης
Γραμμικό πρόβλημα συνοριακού Robin ελέγχου Χρησιμοποιώντας γνωστές τεχνικές και τουςυπολογισμούς ευστάθειας για τον WR(0 T ) είναι εύκολο να δείξουμε την διαφορισιμότητα της σχέσηςg rarr yh(g) για κάθε g isin L2[0 T L2(Γ)] Οπότε το διακριτό αντίστοιχο του Λήμματος 332 παίρνειτην ακόλουθη μορφή
Λήμμα 4113 Το συναρτησιακό κόστους Jh L2[0 T L2(Γ)]rarr R είναι καλά ορισμένο διαφορίσιμοκαι για κάθε g u isin L2[0 T L2(Γ)]
Jprimeh(g)u =
int T
0
int
Γ(microh(g) + αg)udxdt
όπου microh(g) equiv microgh isin WR(0 T ) είναι η μοναδική λύση του ακόλουθου προβλήματος Για όλα τα n =
41 Το διακριτό πρόβλημα βέλτιστου ελέγχου 43
1 N και για όλα τα vh isin Pk[tnminus1 tnUh]
minus(microngh+ vnh) +
int tn
tnminus1
(〈microgh vht〉+ a(vh microgh) + λ〈microgh vh〉Γ
)dt
= minus(micronminus1gh+ v
nminus1h+ ) +
int tn
tnminus1〈ygh minus yd vh〉dt (4110)
όπου microNgh+ = 0 Εδώ yhg equiv yh(g) είναι η λύση του (414)
Οπότε το πλήρως διακριτοποιημένο σύστημα βελτιστοποίησης παίρνει την ακόλουθη μορφή
Λήμμα 4114 ΄Εστω (yh(gh) gh) equiv (yh gh) isin Uh times Adad συμβολίζει το μοναδιαίο βέλτιστο ζεύγοςτου Ορισμού 412 Τότε υπάρχει μια συζυγής μεταβλητή microh isin Uh που ικανοποιεί microN+ = 0 τέτοιο ώστεγια όλα τα vh isin Pk[tnminus1 tnUh] και για όλα τα n = 1 N
(ynh vnh) +int tn
tnminus1(minus〈yh vht〉+ a(yh vh) + λ〈yh vh〉Γ) dt
= (ynminus1h vnminus1
h+ ) +int tn
tnminus1(〈f vh〉+ λ〈gh vh〉Γ) dt (4111)
minus(micronh+ vnh) +
int tn
tnminus1(〈microh vht〉+ a(microh vh) + λ〈microh vh〉Γ) dt
= minus(micronminus1h+ vnminus1
h+ ) +int tn
tnminus1(yh minus yd vh) dt (4112)
και ισχύει η ακόλουθη συνθήκη βελτιστοποίησης Για όλα τα uh isin Adad
1) ΄Ελεγχοι χωρίς περιορισμούςint T
0(αgh + λmicroh uh)Γdt = 0 (4113)
2) ΄Ελεγχοι με περιορισμούςint T
0
int
Γ(αgh + λmicroh) (uh minus gh) dxdt ge 0 (4114)
Οι υπολογισμοί για τη συζυγή μεταβλητή στα σημεία της χρονικής διαμέρισης και στον L2[0 T H1(Ω)]μπορούν να παραχθούν εύκολα ενώ για τους υπολογισμούς στην Linfin[0 T L2(Ω)] παραπέμπουμε τοναναγνώστη στη βιβλιογραφία [23] Ο ακόλουθος υπολογισμός τονίζει το γεγονός ότι οι διακριτές λύσειςπου παράγονται από τα ασυνεχή σχήματα με χρονικό βηματισμό χαρακτηρίζονται από τις ίδιες ιδιότητεςομαλότητας με το συνεχές πρόβλημα
Λήμμα 4115 Θεωρούμε ως (yh gh) τη διακριτή βέλτιστη λύση και οι (yh microh gh) ικανοποιούν τοσύστημα (4111)-(4112)-(4113) ή το (4114) Τότε
microhLinfin[0T H1(Ω)] + λ12microhLinfin[0T L2(Γ)] 6 Cyh minus ydL2[0T L2(Ω)]
όπου το C δεν εξαρτάται από τα α τ h αλλά μόνο από τα 1η Ck Ω
Απόδειξη Στη συνέχεια βασιζόμαστε στις τεχνικές του [32 Θεώρημα 410] προσαρμοσμένες με σκοπόνα χειριστούμε τα δεδομένα στο σύνορο Robin και την lsquolsquoπρος τα πίσωrsquorsquo χρονικά φύση της μδε Αρχικάπαρατηρούμε πως micro(T ) = 0 και yh minus yd isin Linfin[0 T L2(Ω)] Οπότε σε κάθε χρονική στιγμή t isin(tnminus1 tn] έστω ap() isin Uh είναι η ακόλουθη διακριτή προσέγγιση της Λαπλασιανής (με Robin συνοριακάδεδομένα)
(ap vh) = (1η)a(microh vh) + (λη)(microh vh)Γ forallvh isin Uh
Οπότε ap isin Pk[tnminus1 tnUh] και θέτοντας vh() = microht() isin Uh και vh() = ap() isin Uh παίρνουμε
(12) ddt
(nablamicroh2L2(Ω) + (λη)microhL2(Γ)) = (ap microht)
44 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
καιa(microh ap) + λ〈microh ap〉Γ = η(ap ap)
Εφαρμόζοντας παραγοντική ολοκλήρωση χρονικά στην (4111) θέτοντας vh = ap στην ισότητα πουπροκύπτει χρησιμοποιώντας τις δυο τελευταίες ισότητες και τον ορισμό του ap(tn) δηλ (ap(tn) micronh+minusmicronh) = (nablamicronhnabla(micronh+ minus micronh)) + (λη)(micronh micronh+ minus micronh)Γ έχουμε
(12)nablamicronminus1h+ L2(Ω) + (λ2η)micronminus1
h+ L2(Γ) + η
int tn
tnminus1ap2L2(Ω)
le (12)nablamicronh+L2(Ω) + (λ2η)micronminus1h+ L2(Γ) +
int tn
tnminus1(yh minus yd ap)dt
Η παραπάνω ανισότητα υποδηλώνει φράγματα στα σημεία διαμέρισης και συνεπώς φράγματα στηνLinfin[0 T H1(Ω)] όταν k = 0 1 αφού εισάγουμε το φράγμα ευστάθειας στο yh Για υψηλότερης τάξηςχρονικά σχήματα ακολουθούμε απευθείας την τεχνική του [32 Θεώρημα 410]
Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου Το πλήρως διακριτοποιημένο σύστημα βελτι-στοποίησης ορίζεται ως ακολούθως Αναζητούμε yh microh isin Uh τέτοιο ώστε για n = 1 N και για κάθεvh isin Pk[tnminus1 tnUnh ]
(yn vn) +int tn
tnminus1
(minus 〈yh vht〉+ a(yh vh) + (φ(yh) vh)
)dt
= (ynminus1 vnminus1+ ) +
int tn
tnminus1
(〈f vh〉+ (gh vh)
)dt (4115)
minus(micron+ vn) +int tn
tnminus1
(〈microh vht〉+ a(vh microh) + (φprime(yh)microh vh)
)dt
= minus(micronminus1+ vnminus1
+ ) +int tn
tnminus1(yh minus yd vh)dt (4116)
int T
0(αgh + microh uh)dt = 0 foralluh isin L2[0 T Unh ] (4117)
Εδώ τα y0 = yh0 microN+ = 0 f yd είναι δοσμένα δεδομένα και το yh0 συμβολίζει μια προσέγγιση για τοy0
Σημείωση 4116 Για σχήματα χαμηλής τάξης (k = 0 ή k = 1) η απόδειξη της ύπαρξης του διακρι-τού συστήματος βελτιστοποίησης μπορεί να παραχθεί από κλασικές τεχνικές Για σχήματα υψηλότερηςτάξης παραπέμπουμε τον αναγνώστη στην [23 Ενότητα 4]
Σημείωση 4117 Σημειώνουμε ότι δοκιμάζοντας στη συνθήκη βελτιστοποίησης (4117) πολυω-νυμικές συναρτήσεις με χρονική δομή μπορούμε εύκολα να δούμε πως η (4117) είναι ισοδύναμη με
τηνint tntnminus1(αgh + microh vh) = 0 για όλα τα vh isin Pk[tnminus1 tnUnh ] και n = 1 N
Το υπόλοιπο αυτής της ενότητας αφιερώνεται στις εκτιμήσεις ευστάθειας για τη συζυγή μεταβλητή microhΑυτές οι εκτιμήσεις θα παίξουν σημαντικό ρόλο στην επακόλουθη ανάλυση για τις εκτιμήσεις σφαλμάτωνγια το πλήρως διακριτοποιημένο σύστημα βελτιστοποίησης
Λήμμα 4118 Υποθέτουμε πως τα y0 isin L2(Ω) yd isin L2[0 T L2(Ω)] f isin L2[0 T Hminus1(Ω)] είναιδοσμένες συναρτήσεις Θεωρούμε ότι ο ημιγραμμικός όρος φ ικανοποιεί τις υποθέσεις 311-415 Αντα (yh microh) ικανοποιούν τις (4115)-(4116)-(4117) τότε
int T
0microh2L2(Ω)dt le Cstα
41 Το διακριτό πρόβλημα βέλτιστου ελέγχου 45
micro0+2L2(Ω) +
Nsum
i=1[microi]2L2(Ω) + η
int T
0microh2H1(Ω)dt le Cstα12
για όλα τα n = 1 N micronminus1+ 2L2(Ω) le Cstα12 όπου Cst ορίζεται στο Λήμμα 417 Θεωρούμε επιπλέον
τις υποθέσεις του Λήμματος 417 τ equiv maxi=1n τi και((DystC
2LC
2k4η) + (Ck4α12)
)τ le (14)
Οπότε προκύπτει
microh2Linfin[0T L2(Ω)] le CCstα12 equiv Dmicrost
όπου το C δεν εξαρτάται από τα α τ h αλλά μόνο από τα Ccη Ck και Ω όπου το Dyst συμβολίζει τησταθερά ευστάθειας του Λήμματος 417
Απόδειξη Οι δύο πρώτες εκτιμήσεις ταυτίζονται με αυτές στο [22 Λήμμα 38] Για την εκτίμησησε αυθαίρετα χρονικά σημεία παρόμοια με το [22 Ενότητα 4] θέτουμε vh = microh όπου microh είναι ηεκθετική παρεμβολή eminusρ(t
nminust)microh του microh (για κάποιο ρ gt 0) και ορίζεται στο Παράρτημα Α΄2 (κατάλληλατροποποιημένη ώστε να εφαρμοστεί στο προς τα πίσω χρονικά πρόβλημα) Τότε το ανάλογο της (417)παίρνει τη μορφή
(12)micronminus1+ 2L2(Ω)e
minusρ(tminustnminus1) + (12)[micron]2L2(Ω) minus (12)micron+2L2(Ω)
+(ρ2)int tn
tnminus1microh(t)2L2(Ω)e
minusρ(tminustnminus1)dt+int tn
tnminus1〈φprime(yh)microh microh〉dt
le Ckint tn
tnminus1
(microh2H1(Ω) + (Ckα12)microh2L2(Ω) + α12yh minus yd2L2(Ω)
)dt (4118)
Απομένει να χειριστούμε τον ημιγραμμικό όρο Παρατηρούμε πως προσθαφαιρώντας το microh ο ημιγραμ-μικός όρος παίρνει τη μορφή
int tn
tnminus1〈φprime(yh)microh microh〉dt =
int tn
tnminus1〈φprime(yh)microh microh minus microh〉dt+
int tn
tnminus1〈φprime(yh)microh microh〉dt
Επομένως μπορούμε να διώξουμε τον τελευταίο όρο εξαιτίας της μονοτονίας του φ και μετακινώνταςτον πρώτο όρο στο δεξί μέλος Στη συνέχεια χρησιμοποιώντας την Lipschitz συνέχεια του φprime τηνανισότητα παρεμβολής 2L4(Ω) le CL2(Ω)H1(Ω) την ανισότητα Houmllder και το Παράρτημα Α΄2παίρνουμε
int tn
tnminus1|〈φprime(yh)microh microh minus microh〉|dt le CL
int tn
tnminus1yhL2(Ω)microhL4(Ω)microh minus microhL4(Ω)dt
le CCLD12yst
int tn
tnminus1microh12L2(Ω)microh
12H1(Ω)microh minus microh
12L2(Ω)microh minus microh
12H1(Ω)dt
le CkCLD12yst ρτnmicrohL2[tnminus1tnL2(Ω)]microhL2[tnminus1tnH1(Ω)]
Οπότε χρησιμοποιώντας την ανισότητα Young με δ gt 0 παράγουμε την
int tn
tnminus1|〈φprime(yh)microh microh minus microh〉|dt le (C2
kC2LDystρ
2τ2n4η)microh2L2[tnminus1tnL2(Ω)] + η
int tn
tnminus1microh2H1(Ω)dt
Επομένως συνδυάζοντας τις τρεις τελευταίες σχέσεις στην (4118) και επιλέγοντας ρ = 1τn έχουμετην επιθυμητή εκτίμηση εργαζόμενοι ομοίως με το Λήμμα 417
Σημείωση 4119 Τελικώς κλείνουμε αυτήν την ενότητα παρατηρώντας ότι τα διακριτά φράγματαευστάθειας για τη συζυγή μεταβλητή είναι καλύτερα ως προς την παράμετρο α όπως είναι αναμενόμενο
46 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
Πρόβλημα κατανεμημένου ελέγχου Stokes Χρησιμοποιώντας εκτιμήσεις ευστάθειας και γνωστέςτεχνικές για τον WS(0 T ) είναι εύκολο να δείξουμε τη διαφορισιμότητα της σχέσης g rarr yh(g) γιακάθε g isin L2[0 T L2(Ω)]
Λήμμα 4120 Το συναρτησιακό κόστους Jh L2[0 T L2(Ω)]rarr R είναι καλά ορισμένο διαφορίσιμοκαι για κάθε g u isin L2[0 T L2(Ω)]
Jprimeh(g)u =
int T
0
int
Ωh(microh(g) + αg)udxdt
όπου microh(g) equiv microgh isin WS(0 T ) είναι η μοναδική λύση του ακόλουθου προβλήματος Για όλα τα n =1 N και για όλα τα vh isin Pk[tnminus1 tn Uh]
minus(microngh+ vnh) +
int tn
tnminus1
(〈microgh vht〉+ a(vh microgh)
)dt = minus(micronminus1
gh+ vnminus1h+ ) +
int tn
tnminus1〈ygh minus yd vh〉dt
(4119)
όπου microNg+ = 0 Εδώ το ygh equiv yh(g) είναι η λύση της (418)
Οπότε το πλήρως διακριτοποιημένο σύστημα βελτιστοποίησης παίρνει την ακόλουθη μορφή
Λήμμα 4121 ΄Εστω το (yh(gh) gh) equiv (yh gh) isin UhtimesAdad συμβολίζει το μοναδικό βέλτιστο ζεύγοςτου Ορισμού 4111 Τότε υπάρχει μια συζυγής μεταβλητή microh isin Uh που ικανοποιεί microN+ = 0 τέτοιοώστε για όλα τα vh isin Pk[tnminus1 tn Uh] και για όλα τα n = 1 N
(ynh vnh) +int tn
tnminus1(minus〈yh vht〉+ a(yh vh)) dt = (ynminus1
h vnminus1h+ ) +
int tn
tnminus1(〈f vh〉+ (gh vh)) dt
minus(micronh+ vnh) +
int tn
tnminus1(〈microh vht〉+ a(microh vh)) dt = minus(micronminus1
h+ vnminus1h+ ) +
int tn
tnminus1(yh minus yd vh) dt
και ισχύει η ακόλουθη συνθήκη βελτιστοποίησης Για όλα τα uh isin Adad
1) Για ελέγχους χωρίς περιορισμούςint T
0(αgh + microh uh)dt = 0 (4120)
2) Για ελέγχους με περιορισμούςint T
0
int
Ωh(αgh + microh) (uh minus gh) dxdt ge 0 (4121)
Σημείωση 4122 Παρόμοια με τη Σημείωση 337 αν p isin L2[0 T L20(Ω)] τότε οι εξισώσεις
(4120) (4120) μπορούν να ξαναγραφούν στην ακόλουθη ισοδύναμη μορφή για όλα τα vh isin Pk[tnminus1 tn Yh]qh isin L2[0 T Qh] και για όλα τα n = 1 N
(ynh vnh) +int tn
tnminus1(minus〈yh vht〉+ a(yh vh) + b(vh ph)) dt = (ynminus1
h vnminus1h+ ) +
int tn
tnminus1(〈f vh〉+ (gh vh)) dt
int tn
tnminus1b(yh qh)dt = 0 (4122)
minus(micronh+ vnh) +
int tn
tnminus1
(〈microh vht〉+ a(microh vh) + b(vh φh)
)dt = minus(micronminus1
h+ vnminus1h+ ) +
int tn
tnminus1(yh minus yd vh) dt
int tn
tnminus1b(microh qh)dt = 0 (4123)
Εκτιμήσεις στα σημεία διαμέρισης και στον χώρο L2[0 T H1(Ω)] μπορούν να παραχθούν εύκολα ενώ γιατις εκτιμήσεις στον Linfin[0 T L2(Ω)] παραπέμπουμε τον αναγνώστη στη βιβλιογραφία [32] Ο ακόλουθοςυπολογισμός δείχνει ξεκάθαρα το γεγονός ότι οι διακριτές λύσεις που παράγονται με ασυνεχή χρονικούβηματισμού σχήματα έχουν τις ίδιες ιδιότητες ομαλότητας με το αντίστοιχο συνεχές πρόβλημα
42 Εκτιμήσεις σφαλμάτων 47
Λήμμα 4123 ΄Εστω πως με (yh gh) συμβολίζουμε την διακριτή βέλτιστη λύση και τα (yh microh gh)ικανοποιούν το σύστημα (4120)-(4120)-(4120) ή την (4121) Τότε
microhLinfin[0T H1(Ω)] 6 Cyh minus ydL2[0T L2(Ω)]
όπου η C δεν εξαρτάται από τα α τ h παρά μόνο από τα 1ν Ck Ω Αν επιπλέον y0 isin V(Ω)f isin L2[0 T L2(Ω)] τότε η λύση yh της (4121) επίσης ικανοποιεί
yhLinfin[0T H1(Ω)] le C
Απόδειξη Η απόδειξη για την προς τα εμπρός χρονικά εξελικτική εξίσωση Stokes δίνεται στο [32Θεώρημα 410] Για το χρονικά οπισθόδρομο πρόβλημα παρατηρούμε πως yh minus yd isin L2[0 T W(Ω)]και οπότε με μια παραλλαγή της τεχνικής παράγουμε το επιθυμητό αποτέλεσμα
42 Εκτιμήσεις σφαλμάτων
Στη συνέχεια θα μελετήσουμε τις τάξεις σύγκλισης στις κατάλληλες νόρμες για τα αντίστοιχα προ-βλήματα και θα παρουσιάσουμε τις εκτιμήσεις σφαλμάτων
421 Γραμμικό πρόβλημα συνοριακού Robin ελέγχου
Το κλειδί στη μελέτη των εκτιμήσεων είναι ο ορισμός μιας κατάλληλης γενικευμένης χωροχρονικής dGπροβολής τέτοια ώστε να μπορούμε να χειριστούμε τη χαμηλή ομαλότητα του yt isin L2[0 T H1(Ω)lowast]και ένα βοηθητικό σύστημα βελτιστοποίησης το οποίο παίζει το ρόλο μιας καθολικής χωροχρονικήςπροβολής και παρουσιάζει καλύτερες ιδιότητες προσεγγισιμότητας
4211 Η πλήρως διακριτή προβολή
΄Εστω ότι wh zh isin Uh είναι οι λύσεις του παρακάτω συστήματος Δεδομένων f y0 και αρχικώνσυνθηκών w0
h = y0h όπου με y0
h equiv Phy0 συμβολίζουμε την αρχική προσέγγιση του y0 zN+ = 0αναζητούμε wh zh isin Uh τέτοια ώστε για n = 1 N και για όλα τα vh isin Pk[tnminus1 tnUh]
(wnh vnh) +int tn
tnminus1
(minus 〈wh vht〉+ a(wh vh) + λ〈wh vh〉Γ
)dt
= (wnminus1h vnminus1
h+ ) +int tn
tnminus1
(〈f vh〉+ λ〈g vh〉Γ
)dt (4224)
minus(znh+ vnh) +
int tn
tnminus1
(〈zh vht〉+ a(zh vh) + λ〈zh vh〉Γ
)dt
= minus(znminus1h+ vnminus1
h+ ) +int tn
tnminus1(wh minus yd vh)dt (4225)
Οι λύσεις wh zh isin Uh υπάρχουν εξαιτίας της ομαλότητας των y micro isin WR(0 T ) Οι λύσεις του βοη-θητικού συστήματος βελτιστοποίησης έχουν το ρόλο της lsquolsquoγενικευμένης προβολήςrsquorsquo μέσα στον Uh Ο
48 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
βασικός υπολογισμός της ενεργειακής νόρμας του y minus wh micro minus zh θα παραχθεί σε όρους τοπικών L2
προβολών που σχετίζονται με τις ασυνεχείς χρονικού βηματισμού μεθόδους βλέπε πχ [104]
Ορισμός 421 (1) Η προβολή P locn C[tnminus1 tnL2(Ω)] rarr Pk[tnminus1 tnUh] ικανοποιεί την(P locn v)n = Phv(tn) και
int tn
tnminus1(v minus P locn v vh) = 0 forall vh isin Pkminus1[tnminus1 tnUh] (4226)
Εδώ έχουμε χρησιμοποιήσει τη σύμβαση ότι (P locn v)n equiv (P locn v)(tn) και Ph L2(Ω) rarr Uh είναι οτελεστής ορθογώνιας προβολής στον Uh sub H1(Ω)(2) Η προβολή P loch C[0 T L2(Ω)]rarr Uh ικανοποιεί
P loch v isin Uh και (P loch v)|(tnminus1tn] = P locn (v|[tnminus1tn])
Λόγω της έλλειψης ομαλότητας και κυρίως του ότι y isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] κατασκευ-άζουμε μια χωροχρονική γενικευμένη L2 προβολή που συνδυάζει την κλασική dG χρονικού βηματισμούπροβολή και τη χωρική γενικευμένη L2 προβολή Qh H1(Ω)lowast rarr Uh Ανακαλούμε πως ο ορισμός τουQh υποδηλώνει ότι 〈v minusQhv vh〉 = 0 για όλα τα v isin H1(Ω)lowast και vh isin Uh (βλέπε για παράδειγμα την[26 ενότητα 2])
Ορισμός 422 (1) Η προβολή Qlocn C[tnminus1 tnH1(Ω)lowast] rarr Pk[tnminus1 tnUh] ικανοποιεί την(Qlocn v)n = Qhv(tn) και την
int tn
tnminus1〈v minusQlocn v vh〉 = 0 forall vh isin Pkminus1[tnminus1 tnUh]
Εδώ θα χρησιμοποιήσουμε επίσης τη σύμβαση ότι (Qlocn v)n equiv (Qlocn v)(tn) και Qh H1(Ω)lowast rarr Uh είναιο τελεστής γενικευμένης ορθογώνιας προβολής στον Uh sub H1(Ω)(2) Η προβολή Qloch C[0 T H1(Ω)lowast]rarr Uh ικανοποιεί την
Qloch v isin Uh και (Qloch v)|(tnminus1tn] = Qlocn (v|[tnminus1tn])
Για k = 0 η προβολή Qloch C[0 T H1(Ω)lowast] rarr Uh ανάγει την Qloch v(t) = Qhv(tn) για όλα ταt isin (tnminus1 tn] n = 1 N
Το βασικό χαρακτηριστικό της Qloch είναι ότι ταυτίζεται με την P loch όταν v isin L2[0 T L2(Ω)] δηλαδήP loch v = Qloch v όταν v isin L2[0 T L2(Ω)] και οπότε παρουσιάζει καλύτερες ιδιότητες προσεγγισιμότη-τας αλλά είναι επίσης εφαρμόσιμη για v equiv yt isin L2[0 T H1(Ω)lowast] Για το lsquolsquoπρος τα πίσωrsquorsquo χρονικάπρόβλημα χρειάζεται η τροποποίηση των παραπάνω προβολών (επίσης συμβολιζόμενο με P locn Qlocn αν-τιστοίχως) Για παράδειγμα επιπλέον της σχέσης (4226) χρειάζεται να επιβάλουμε την lsquolsquoσυνθήκηταιριάσματοςrsquorsquo (matching condition) στα αριστερά δηλαδή (P locn v)nminus1
+ = Phv(tnminus1+ ) αντί της επιβο-
λής της συνθήκης στα δεξιά Στο παρακάτω Λήμμα συλλέγουμε μερικά αποτελέσματα όσον αφορά τις(βέλτιστες) τάξεις σύγκλισης για την παραπάνω προβολή Εδώ δίνουμε έμφαση στις ιδιότητες προ-σέγγισης για την γενικευμένη προβολή Qloch κάτω από υποθέσεις ελάχιστης ομαλότητας δηλαδή γιαv isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] για το σχήμα χαμηλότερης τάξης
Λήμμα 423 ΄Εστω Uh sub H1(Ω) και P loch Qloch ορίζεται στους Ορισμούς 421 και 422 αντιστοίχωςΤότε για όλα τα v isin L2[0 T H l+1(Ω)] cap Hk+1[0 T L2(Ω)] υπάρχει σταθερά C ge 0 ανεξάρτητα τωνh τ τέτοια ώστε
v minus P loch vL2[0T L2(Ω)] le C(hl+1vL2[0T Hl+1(Ω)] + τk+1v(k+1)L2[0T L2(Ω)]
)
Αν επιπλέον k = 0 l = 1 και v isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] τότε υπάρχει μια σταθερά C ge 0
42 Εκτιμήσεις σφαλμάτων 49
ανεξάρτητη από τα h τ τέτοια ώστε
v minusQloch vL2[0T L2(Ω)] le C(hvL2[0T H1(Ω)] + τ12(vL2[0T H1(Ω) + vtL2[0T H1(Ω)lowast])
)
v minusQloch vL2[0T H1(Ω)] le C(vL2[0T H1(Ω)] + (τh2)vtL2[0T H1(Ω)lowast]
)
΄Εστω k = 0 l = 1 και v isin L2[0 T H2(Ω)]capH1[0 T L2(Ω)] Τότε υπάρχει σταθερά C ge 0 ανεξάρτητηαπό τα h τ τέτοια ώστε
v minusQloch vL2[0T H1(Ω)] le C(hvL2[0T H2(Ω)] + τ12(vtL2[0T L2(Ω)] + vL2[0T H2(Ω)])
)
Απόδειξη Βλέπε Παράρτημα Α΄1
Σημείωση 424 Η εκτίμηση ευστάθειας στον L2[0 T H1(Ω)] απαιτεί το περιορισμό για το χρονικόβήμα τ le Ch2 εξαιτίας της έλλειψης ομαλότητας ως προς το χρόνο Αν το v isin L2[0 T H l+1(Ω)] capHk+1[0 T L2(Ω)] τότε η πρώτη εκτίμηση του Λήμματος 423 υποδηλώνει πως
v minus P loch vL2[0T H1(Ω)] le C(hlvL2[0T Hl+1(Ω)] + τk+1hv(k+1)L2[0T L2(Ω)]
)
Πράγματι χρησιμοποιώντας το [32 Θεώρημα 43 Πόρισμα 48] έχουμε τις παρακάτω (τοπικές στοχρόνο) εκτιμήσεις
v minus P locn vL2[tnminus1tnH1(Ω)] le C(v minus PhvL2[tnminus1tnH1(Ω)] + τk+1Phv(k+1)L2[tnminus1tnH1(Ω)]
)
le C(hlvL2[tnminus1tnHl+1(Ω)] + (τk+1h)v(k+1)L2[tnminus1tnL2(Ω)]
)
όπου στη τελευταία εκτίμηση έχουμε χρησιμοποιήσει μια αντίστροφη εκτίμηση Σημειώνουμε πως ανείναι διαθέσιμη περισσότερη ομαλότητα η αντίστροφη εκτίμηση δεν είναι απαραίτητη Πιο συγκεκρι-μένα αν v(k+1) isin L2[0 T H1(Ω)] τότε ισχύουν οι βελτιωμένες τάξεις σύγκλισης O(hl + τk+1) στηνόρμα L2[0T H1(Ω)] Ωστόσο παρατηρούμε ότι για το συνοριακό πρόβλημα βέλτιστου ελέγχου η αυ-ξημένη ομαλότητα vt isin L2[0 T H1(Ω)] δεν είναι διαθέσιμη Οπότε δίνουμε έμφαση στο ότι η έλλειψηομαλότητας ενεργεί ως φράγμα για την ανάπτυξη ενός σχήματος υψηλότερης τάξης Εργαζόμενοι όμοιαέχουμε μια εκτίμηση σε αυθαίρετα χρονικά σημεία δηλαδή
v minus P loch vLinfin[0T L2(Ω)] le C(hl+1vLinfin[0T Hl+1(Ω)] + τk+1hv(k+1)Linfin[0T H1(Ω)]
)
Παρακάτω παρουσιάζουμε το κύριο αποτέλεσμα σχετικά με το βοηθητικό πρόβλημα το οποίο ενεργείως μια γενικευμένη χωροχρονική dG προβολή Στόχος μας είναι να βρούμε ότι το σφάλμα προβολήςείναι τόσο καλό όσο η τοπική dG προβολή επιτρέπει να είναι και οπότε είναι βέλτιστη υπό την έννοιατης διαθέσιμης ομαλότητας
Θεvώρημα 425 ΄Εστω ότι μας δίνονται τα f isin L2[0 T H1(Ω)lowast] και y0 isin L2(Ω) και y micro isinWR(0 T )είναι οι λύσεις των (337)-(338)-(339) ή (3310) και έστω wh zh isin Uh είναι οι λύσεις των (4224)-(4225) Συμβολίζουμε με e1 = yminuswh r1 = microminus zh και έστω ep equiv yminusQloch y rp = microminusP loch micro όπου ταP loch Qloch ορίζονται στους Ορισμούς 421 και 422 Τότε υπάρχει μια αλγεβρική σταθερά C gt 0 πουεξαρτάται μόνο από το Ω τέτοιο ώστε
CF minη λe12L2[0T H1(Ω)] +Nminus1sum
i=0[ei1]2L2(Ω) + λe12L2[0T L2(Γ)]
le C(e0
12L2(Ω) + (1CF minη λ)(ep2L2[0T H1(Ω)] + λep2L2[0T L2(Γ)]
)
CF minη λr12L2[0T H1(Ω)] +Nsum
i=1[ri1]2L2(Ω) + λr12L2[0T L2(Γ)]
le C(
(1CF minη λ)(e12L2[0T L2(Ω)] + rp2L2[0T H1(Ω)]
)+ λrp2L2[0T L2(Γ)]
)
50 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
e1L2[0T L2(Ω)] le C(ηepL2[0T L2(Ω)] + τ12(epL2[0T H1(Ω)] + epL2[0T L2(Γ)])
)
r1L2[0T L2(Ω)] le C(ηe1L2[0T L2(Ω)] + rpL2[0T L2(Ω)] + τ12(rpL2[0T H1(Ω)]
+rpL2[0T L2(Γ)]))
Εδώ w0h = y0
h όπου y0h συμβολίζει μια προσέγγιση του y0 και η C είναι μια σταθερά εξαρτώμενη από
το χωρίο Ω
Απόδειξη Βήμα 1 Προκαταρκτικοί υπολογισμοί Στα επόμενα συμβολίζουμε με e1 = y minus wh r1 =micro minus zh και διαχωρίζουμε τα e1 r1 σε e1 equiv e1h + ep equiv (Qloch y minus wh) + (y minus Qloch y) r1 equiv r1h + rp equiv(P loch micro minus zh) + (micro minus P loch micro) όπου P loch Qloch ορίζονται στους Ορισμούς 421 και 422 Αφαιρώνταςτην (4224) από τις (338) και την (4225) από την (339) έχουμε την συνθήκη ορθογωνιότητας Γιαn = 1 N και για όλα τα vh isin Pk[tnminus1 tnUh]
(en1 vnh) +int tn
tnminus1
(minus 〈e1 vht〉+ a(e1 vh) + λ〈e1 vh〉Γ
)dt = (enminus1
1 vnminus1h+ ) (4227)
minus(rn1+ vnh) +
int tn
tnminus1
(〈r1 vht〉+ a(r1 vh) + λ〈r1 vh〉Γ
)dt = minus(rnminus1
1+ vnminus1h+ ) +
int tn
tnminus1(e1 vh)dt
(4228)
Σημειώνουμε πως η συνθήκη ορθογωνιότητας (4227) είναι ουσιαστικά αποσυζευγμένη και ταυτίζεταιμε τη συνθήκη ορθογωνιότητας του [31 Σχέση (26)] Οπότε εφαρμόζοντας το [31 Θεώρημα 22]παίρνουμε τη πρώτη εκτίμηση Με παρόμοιο τρόπο η συνθήκη ορθογωνιότητας (4228) είναι ισοδύναμημε Για n = 1 N και για όλα τα vh isin Pk[tnminus1 tnUh]
minus(rn1h+ vnh) +
int tn
tnminus1
(〈r1h vht〉+ a(r1h vh) + λ〈r1h vh〉Γ
)dt
= minus(rnminus11h+ v
nminus1h+ ) +
int tn
tnminus1
((e1 vh)minus a(rp vh)minus λ(rp vh)Γ
)dt (4229)
Εδώ έχουμε χρησιμοποιήσει τον Ορισμό 421 της προβολής P loch ο οποίος υποδηλώνει πωςint tntnminus1〈rp vht〉dt = 0 (rnp+ vnh) = 0 και (rnminus1
p+ vnminus1h+ ) = 0 Θέτοντας vh = r1h στην (4229) χρη-
σιμοποιώντας την ανισότητα Friedrich για να φράξουμε τον δεύτερο και τον τρίτο όρο στα αριστερά
int tn
tnminus1(a(r1h r1h) + λ〈r1h r1h〉Γ)dt ge
int tn
tnminus1
(η2nablar1h2L2(Ω) + λ
2 r1h2L2(Γ)
+CF2 minλ ηr1h2H1(Ω)
)dt
την ανισότητα Young για να φράξουμε τους όρους στα δεξιά
int tn
tnminus1
∣∣(e1 r1h)∣∣dt le
int tn
tnminus1
((CF minλ η8)r1h2H1(Ω) + (CCF minλ η)e12L2(Ω)
)dt
int tn
tnminus1
∣∣a(r1h rp)∣∣dt le (CF minλ η8)
int tn
tnminus1r1h2H1(Ω)dt+ (C(CF minλ η))
int tn
tnminus1rp2H1(Ω)dt
42 Εκτιμήσεις σφαλμάτων 51
και με υπολογισμούς έχουμε
minus12r
n1h+2L2(Ω) + 1
2[rn1h]2L2(Ω) + 1
2rnminus11h+2L2(Ω) + λ
4
int tn
tnminus1r1h2L2(Γ)dt
+CF minλ η4
int tn
tnminus1r1h2H1(Ω)dt+ η
2
int tn
tnminus1nablar1h2L2(Ω)dt
le Cint tn
tnminus1
((1CF minλ η)e12L2(Ω) + (1CF minλ η)rp2H1(Ω) + λrp2L2(Γ)
)dt
Η δεύτερη εκτίμηση προκύπτει μετά από άθροισηΒήμα 2 Δυϊκά επιχειρήματα Στρέφουμε τη προσοχή μας στις δυο τελευταίες εκτιμήσεις Με στόχονα παράγουμε μια βελτιωμένη τάξη σύγκλισης για την L2[0 T L2(Ω)] νόρμα εφαρμόζουμε ένα δυϊκόεπιχείρημα για να πάρουμε ένα καλύτερο φράγμα για τη ποσότητα e1h2L2[0T L2(Ω)] Για αυτό τοσκοπό ορίζουμε ένα προς τα πίσω χρονικά παραβολικό πρόβλημα με δεξί μέλος e1h isin L2[0 T L2(Ω)]και μηδενικά Robin και τελικά δεδομένα δηλ λφ+ η partφpartn |Γ = 0 και φ(T ) = 0 Για n = 1 N και γιαόλα τα v isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] αναζητούμε φ isinWR(0 T ) τέτοια ώστε
int tn
tnminus1
(〈φ vt〉+ a(v φ) + λ〈φ v〉Γ
)dt+ (φ(tnminus1 v(tnminus1)) =
int tn
tnminus1(e1h v)dt (4230)
Παρατηρούμε πως εφόσον e1h isin Linfin[0 T L2(Ω)] τότε φ isin L2[0 T H2(Ω)] capH1[0 T L2(Ω)] (βλέπεΘεώρημα 321) Ειδικότερα ισχύει η ακόλουθη εκτίμηση
φL2[0T H2(Ω)] + φtL2[0T L2(Ω)] + λφL2[0T L2(Γ)] le Ce1hL2[0T L2(Ω)] (4231)
Η έλλειψη ομαλότητας στο δεξί μέλος της (4230) εξαιτίας των ασυνεχειών δείχνει πως δε μπορούμενα βελτιώσουμε την ομαλότητα του φ στο [0 T ] Το σχετικό ασυνεχές σχήμα χρονικού βηματισμούμπορεί να παραχθεί ως ακολούθως Δεδομένων τελικών δεδομένων φNh+ = 0 αναζητούμε φh isin Uhτέτοιο ώστε για όλα τα vh isin Pk[tnminus1 tnUh]
minus(φnh+ vnhminus) +
int tn
tnminus1
((φh vht) + a(φh vh) + λ〈φh vh〉Γ
)dt+ (φnminus1
h+ vnminus1h+ ) =
int tn
tnminus1(e1h vh)dt
(4232)
Οπότε χρησιμοποιώντας το Λήμμα 4115 ισχύει η ακόλουθη εκτίμηση
φhLinfin[0T H1(Ω)] + λφhLinfin[0T L2(Γ)] le Cke1hL2[0T L2(Ω)] (4233)
Τώρα είναι φανερό πως έχουμε την ακόλουθη εκτίμηση για το φminusφh η οποία είναι άμεση εφαρμογή τωνπροηγούμενων εκτιμήσεων στον L2[0 T H1(Ω)] των προσεγγιστικών ιδιοτήτων του Λήμματος 423των προβολών P loch Qloch και της συνοριακής ανισότητας Sobolev
φminus φhL2[0T H1(Ω)] + λφminus φhL2[0T L2(Γ)] le C(h+ τ12)(φL2[0T H2(Ω)] + φtL2[0T L2(Ω)]
)
le C(h+ τ12)e1hL2[0T L2(Ω)] (4234)
Σημειώνουμε πως η έλλειψη ομαλότητας στο δεξί μέλος περιορίζει τη τάξη σύγκλισης σε αυτή τουχαμηλότερης τάξης σχήματος l = 1 k = 0 ακόμη κι αν επιλεχθούν υψηλής τάξης χρονικά σχήματαΘέτοντας vh = e1h στη σχέση (4232) έχουμε
minus(φnh+ en1hminus) +
int tn
tnminus1(φh e1ht) + a(e1h φh) + λ〈φh e1h〉Γdt+ (φnminus1
h+ enminus11h+) =
int tn
tnminus1e1h2L2(Ω)dt
52 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
Εφαρμόζοντας παραγοντική ολοκλήρωση χρονικά έχουμε
minus(φnh+ en1hminus) + (φnhminus en1hminus) +
int tn
tnminus1
(minus (φht e1h) + a(φh e1h) + λ〈φh e1h〉Γ
)dt
=int tn
tnminus1e1h2L2(Ω)dt (4235)
Θέτοντας vh = φh στην (4227) και χρησιμοποιώντας ότι e1 = ep + e1h και τον Ορισμό 422 τηςπροβολής Qloch παίρνουμε
(en1hminus φnhminus) +int tn
tnminus1
(minus (e1h φht) + a(e1h φh) + λ〈e1h φh〉Γ
)dt
= minus(enminus11hminus φ
nminus1h+ )minus
int tn
tnminus1
(a(ep φh) + λ〈ep φh〉
)dt (4236)
Εδώ έχουμε χρησιμοποιήσει το ότι ο ορισμός της προβολής Qloch του Ορισμού 422 δείχνει πως
(enp φnhminus) = 0int tntnminus1(ep vht)dt = 0 και (enminus1
pminus φnminus1h+ ) = 0 Χρησιμοποιώντας την (4235) για να
αντικαταστήσουμε τους τρεις πρώτους όρους της (4236) καταλήγουμε στην
(φnh+ en1h)minus (enminus1
1hminus φnminus1h+ ) +
int tn
tnminus1e1h2L2(Ω)dt = minus
int tn
tnminus1
(a(ep φh) + λ〈ep φh〉Γ
)dt
= minusint tn
tnminus1
(a(ep φh minus φ) + a(ep φ) + λ〈ep φh minus φ〉Γ + λ〈ep φ〉Γ
)dt
= minusint tn
tnminus1
(a(ep φh minus φ) + λ〈ep φh minus φ〉Γ minus η(ep∆φ) + η〈ep
partφ
partn〉Γ + λ〈ep φ〉Γ
)dt
= minusint tn
tnminus1
(a(ep φh minus φ) + λ〈ep φh minus φ〉Γ minus η(ep∆φ)
)dt
όπου στις δυο τελευταίες εξισώσεις έχουμε χρησιμοποιήσει χωρική παραγοντική ολοκλήρωση και οορισμός του φ ως ένα δυϊκό πρόβλημα με μηδενικά Robin συνοριακά δεδομένα αντιστοίχως Οπότε
int tn
tnminus1e1h2L2(Ω)dt+ (φnh+ e
n1hminus)minus (enminus1
1hminus φnminus1h+ )
leint tn
tnminus1ηφh minus φH1(Ω)epH1(Ω)dt+
int tn
tnminus1
(ηepL2(Ω)∆φL2(Ω) + λepL2(Γ)φh minus φL2(Γ)
)dt
Αθροίζοντας τις παραπάνω ανισότητες και χρησιμοποιώντας το γεγονός ότι φN+ equiv 0 και e01hminus = 0 (εξ
ορισμού) και ανακαθορίζοντας τους όρους παίρνουμε
(12)e1h2L2[0T L2(Ω)] le Cηint T
0epL2(Ω)φH2(Ω)dt
+Cint T
0
(ηφh minus φH1(Ω)epH1(Ω) + λepL2(Γ)φh minus φL2(Γ)
)dt
le C(ηepL2[0T L2(Ω)]φL2[0T H2(Ω)] + ηφh minus φL2[0T H1(Ω)]
epL2[0T H1(Ω)] + λepL2[0T L2(Γ)]φh minus φL2[0T L2(Γ)]
)
le C(ηepL2[0T L2(Ω)]e1hL2[0T L2(Ω)]
+(h+ τ12)e1hL2[0T L2(Ω)](epL2[0T H1(Ω)] + λepL2[0T L2(Γ)]))
Εδώ έχουμε χρησιμοποιήσει την ανισότητα Cauchy-Schwarz τα φράγματα ευστάθειας της δυϊκής ε-ξίσωσης (4231) και τις εκτιμήσεις σφάλματος (4234) για τον φh minus φ Τελικώς η εκτίμηση για τον
42 Εκτιμήσεις σφαλμάτων 53
όρο r1L2[0T L2(Ω)] προκύπτει χρησιμοποιώντας ένα παρόμοιο δυϊκό επιχείρημα
Εφόσον έχουμε μια εκτίμηση στην νόρμα L2[0 T H1(Ω)] και το βοηθητικό πρόβλημα είναι ουσιαστικάαποσυνδεδεμένο μπορούν να εφαρμοστούν απευθείας οι τεχνικές της [31 Ενότητας 2] για να παράγουμεμια Linfin[0 T L2(Ω)] εκτίμηση (βλέπε επίσης την Πρόταση 4210)
Θεvώρημα 426 ΄Εστω wh zh isin Uh οι λύσεις των (4224)-(4225) Συμβολίζουμε με e1 = yminuswhr1 = microminuszh και υποθέτουμε πως ισχύουν οι υποθέσεις του Θεωρήματος 425 Τότε υπάρχει μια σταθεράC που εξαρτάται από τα Ck Ω τέτοια ώστε
e1Linfin[0T L2(Ω)] le C(epLinfin[0T L2(Ω)] + e0
1L2(Ω) + epL2[0T H1(Ω)] + λepL2[0T L2(Γ)])
r1Linfin[0T L2(Ω)] le C(rpLinfin[0T L2(Ω)] + e1L2[0T L2(Ω)] + rpL2[0T H1(Ω)] + λrpL2[0T L2(Γ)]
)
Εδώ ep = y minusQloch y rp = microminus P loch micro
Απόδειξη Διαχωρίζοντας τα σφάλματα όπως στο προηγούμενο θεώρημα δηλ e1 = e1h + ep αρκεί ναφράξουμε τον όρο suptnminus1lttletn e1h(t)2L2(Ω) Αυτό έχει γίνει στο [31 Θεώρημα 25] (σημειώνουμεπως η συνθήκη ορθογωνιότητας είναι αποσυζευγμένη)
Σημείωση 427 Ο συνδυασμός των δυο τελευταίων Θεωρημάτων δείχνει την lsquolsquoσυμμετρική ελεύ-θερης ομαλότηταςrsquorsquo κατασκευή της εκτίμησής μας Ουσιαστικά υποθέτουμε πως τα αρχικά δεδομέναείναι y0 isin L2(Ω) και ο όρος δύναμης f isin L2[0 T H1(Ω)lowast] Τότε ορίζουμε τη φυσική ενεργειακήνόρμα την ( )X εφοδιασμένη με την ασθενή μορφή υπό υποθέσεις ελάχιστης ομαλότητας
(e1 r1)X equiv e1WR(0T ) + r1WR(0T )
Οπότε χρησιμοποιώντας τα Θεωρήματα 4239 426 έχουμε μια εκτίμηση της μορφής
σφάλμα X le C(σφάλμα αρχικών δεδομένωνL2(Ω)
+σφάλμα καλύτερης προσέγγισης-προβολώνX)
Η παραπάνω εκτίμηση δείχνει πως το σφάλμα είναι τόσο καλό όσο επιτρέπουν οι συνθήκες προσεγ-γισιμότητας υπό τις υποθέσεις φυσικής παραβολικής ομαλότητας και θα μπορούσαμε να το δούμε ωςτο πλήρως διακριτό ανάλογο του Λήμματος Ceacutea ([34]) Οπότε οι τάξεις σύγκλισης για τα e1 r1 ε-ξαρτώνται μόνο από τα αποτελέσματα προσεγγισιμότητας και ομαλότητας μέσω του σφάλματος προ-βολών ep rp όπως φαίνεται στο Λήμμα 423 και τη Σημείωση 424 Αν y0 isin L2(Ω) δηλαδήy isin L2[0 T H1(Ω)]capH1[0 T H1(Ω)lowast] και micro isin L2[0 T H2(Ω)]capH1[0 T L2(Ω)] τότε για l = 1 k = 0και για τ le Ch2 έχουμε
1 epL2[0T H1(Ω)] le C
2 rpL2[0T H1(Ω)] le C(hmicroL2[0T H2(Ω)] + τ12microtL2[0T L2(Ω)])
3 epL2[0T L2(Ω)] le C(hyL2[0T H1(Ω)] + τ12ytL2[0T H1(Ω)lowast])
4 rpL2[0T L2(Ω)] le C(h2microL2[0T H2(Ω)] + τmicrotL2[0T L2(Ω)])
5 epL2[0T L2(Γ)] le Cep12L2[0T L2(Ω)]ep12L2[0T H1(Ω)] le C(h+ τ12)12
Οπότε οι παραπάνω εκτιμήσεις και το Θεώρημα 425 συνεπάγονται για τ le Ch2 οι ακόλουθες τάξειςσύγκλισης e1L2[0T L2(Ω)] asymp O(h) και r1L2[0T L2(Γ)] asymp O(h)
Οι εκτιμήσεις είναι εφαρμόσιμες ακόμη και στη περίπτωση ομαλότερων λύσεων Για παράδειγμα ανεπιπλέον τα y micro isin L2[0 T H2(Ω)] capH1[0 T L2(Ω)] (εδώ l = 1 και k = 0)
1 epL2[0T H1(Ω)] le C(hyL2[0T H2(Ω)] + τ12ytL2[0T L2(Ω)])
2 epL2[0T L2(Ω)] le C(h2yL2[0T H2(Ω)] + τytL2[0T L2(Ω)])
54 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
3 epL2[0T L2(Γ)] le C(h2 + τ)12(h+ τ12)12
Για τη συνοριακή νόρμα έχουμε χρησιμοποιήσει τη συνοριακή ανισότητα Sobolev ΄Ιδιες τάξεις σύγκλισηςισχύουν για τις rp νόρμες Οπότε από το Θεώρημα 425 προκύπτει πως e1L2[0T H1(Ω)] asymp O(h)r1L2[0T H1(Ω)] asymp O(h) e1L2[0T L2(Ω)] asymp O(h32) και r1L2[0T L2(Ω)] asymp O(h32) όταν τ le Ch2
4212 ΄Ελεγχοι χωρίς περιορισμούς Εισαγωγικές εκτιμήσεις
Απομένει να συγκρίνουμε το διακριτό σύστημα βελτιστοποίησης (4111)-(4112)-(4113) με το βοη-θητικό σύστημα (4224)-(4225)
Λήμμα 428 ΄Εστω yh microh wh zh isin Uh οι λύσεις του διακριτού συστήματος βελτιστοποίησης(4111)-(4112)-(4113) και του βοηθητικού συστήματος (4224)-(4225) αντιστοίχως Συμβολίζουμεμε e1 equiv yminuswh r1 equiv microminus zh και έστω e2h equiv whminus yh r2h equiv zhminus microh Τότε υπάρχει αλγεβρική σταθεράC gt 0 τέτοια ώστε
e2hL2[0T L2(Ω)] + (λα12)r2hL2[0T L2(Γ)] le Cλα12r1L2[0T L2(Γ)]
Απόδειξη Αφαιρώντας τη (4112) από την (4225) παράγεται η εξίσωση Για n = 1 N
minus(rn2h+ vnh) +
int tn
tnminus1
(〈r2h vht〉+ a(r2h vh) + λ〈r2h vh〉Γ
)dt
= minus(rnminus12h+ v
nminus1h+ ) +
int tn
tnminus1(e2h vh)dt forall vh isin Pk[tnminus1 tnUh] (4237)
Αφαιρώντας τη (4111) από τη (4224) και χρησιμοποιώντας τις (3310)-(4113) έχουμε Για n =1 N
(en2h vnh) +int tn
tnminus1
(minus 〈e2h vht〉+ a(e2h vh) + λ〈e2h vh〉Γ
)dt = (enminus1
2h vnminus1h+ )
+int tn
tnminus1minus(λ2α)(microminus microh vh)Γdt forall vh isin Pk[tnminus1 tnUh] (4238)
Θέτουμε vh = e2h στην (4237) για να πάρουμε
minus(rn2h+ en2h) +
int tn
tnminus1
(〈r2h e2ht〉+ a(r2h e2h) + λ〈r2h e2h〉Γ
)dt+ (rnminus1
2h+ enminus12h+)
=int tn
tnminus1e2h2L2(Ω)dt (4239)
΄Ομοια θέτοντας vh = r2h στην (4238) έχουμε
(en2h rn2h) +int tn
tnminus1
(minus 〈e2h r2ht〉+ a(e2h r2h) + λ〈e2h r2h〉Γ
)dtminus (enminus1
2h rnminus12h+)
=int tn
tnminus1
(minus (λ2α)〈r1 r2h〉Γ minus (λ2α)r2h2L2(Γ)
)dt (4240)
Εφαρμόζοντας παραγοντική ολοκλήρωση ως προς το χρόνο στην (4240) και αφαιρώντας την εξίσωσηπου προκύπτει από την (4239) φτάνουμε στην
(rn2h+ en2h)minus (enminus1
2h rnminus12h+) +
int tn
tnminus1
(e2h2L2(Ω) + (λ2α)r2h2L2(Γ)
)dt = minus(λ2α)
int tn
tnminus1〈r1 r2h〉Γdt
(4241)
42 Εκτιμήσεις σφαλμάτων 55
Χρησιμοποιώντας την ανισότητα Young για να φράξουμε το δεξί μέλος προκύπτει
∣∣∣∣∣(λ2α)
int tn
tnminus1(r1 r2h)Γdt
∣∣∣∣∣ le (λ24α)int tn
tnminus1r2h2L2(Γ)dt+ (λ2α)
int tn
tnminus1r12L2(Γ)dt
προσθέτοντας τις ανισότητες που προκύπτουν από το 1 μέχρι το N και παρατηρώντας πωςsumNn=1
((rn2h+ e
n2h)minus (enminus1
2h rnminus12h+)
)= 0 (αφού e0
2h equiv 0 rN2h+ = 0) παίρνουμε την επιθυμητή εκτίμη-ση
Οι εκτιμήσεις εύκολα προκύπτουν από το προηγούμενο Λήμμα και τις εκτιμήσεις για τις προβολές e1και r1 μαζί με ένα κλασικό lsquolsquoπρος τα πίσωrsquorsquo (lsquolsquoboot-straprsquorsquo) επιχείρημα
Πρόταση 429 ΄Εστω yh microhwhzh isin Uh οι λύσεις του συστήματος βελτιστοποίησης (4111)-(4112)-(4113) και του βοηθητικού συστήματος (4224)-(4225) αντιστοίχως Συμβολίζουμε με e1 equivy minus wh r1 equiv microminus zh και έστω e2h equiv wh minus yh r2h equiv zh minus microh Τότε ισχύει η ακόλουθη εκτίμηση
eN2h2L2(Ω) +Nminus1sum
i=0[ei2h]2L2(Ω) + CF minη λ
int T
0e2h2H1(Ω)dt+ λ
int T
0e2h2L2(Γ)dt
le (Cλα2)int tn
tnminus1r12L2(Γ))dt
r02h+2L2(Ω) +
Nsum
i=1[ri2h]2L2(Ω) + CF minη λ
int T
0r2h2H1(Ω)dt+ λ
int T
0r2h2L2(Γ)dt
le (Cλ2αCF minη λ)int T
0r12L2(Γ)dt
όπου η C είναι μια σταθερά που εξαρτάται μόνο από το Ω
Απόδειξη Βήμα 1 Εκτιμήσεις για τη βασική μεταβλητή Θέτοντας vh = e2h στην (4238) καιπαρατηρώντας πως microminus microh = r1 + r2h παίρνουμε
(12)en2h2L2(Ω) + (12)[enminus12h ]2L2(Ω) minus (12)enminus1
2h 2L2(Ω) + η
int tn
tnminus1nablae2h2L2(Ω)dt
+λint tn
tnminus1e2h2L2(Γ) +
int tn
tnminus1〈φ(y)minus φ(yh) e2h〉dt le minus(λ2α)
int tn
tnminus1(r1 + r2h e2h)Γdt (4242)
Χρησιμοποιώντας την ανισότητα Young για το πρώτο όρο στο δεξί μέλος
∣∣∣ 1α
int tn
tnminus1(r1 e2h)Γdt
∣∣∣ le(λ2)
int tn
tnminus1|e2h2L2(Γ)dt+ (1λα2)
int tn
tnminus1r12L2(Γ)dt
Οπότε συγκεντρώνοντας τα παραπάνω φράγματα στην (4242) έχουμε
(12)en2h2L2(Ω) + (12)[enminus12h ]2L2(Ω) minus (12)enminus1
2h 2L2(Ω) + η
int tn
tnminus1nablae2h2L2(Ω)dt
+(λ2)int tn
tnminus1e2h2L2(Γ) le (1λα2)
int tn
tnminus1(r12L2(Γ) + r2h2L2(Γ))dt (4243)
Χρησιμοποιώντας την ανισότητα Friedrich και με κάποιους υπολογισμούς παίρνουμε την εκτίμηση μετάαπό άθροιση χρησιμοποιώντας την εκτίμηση της r2hL2[0T L2(Γ)] του Λήμματος 428Βήμα 2 Εκτιμήσεις για τη συζυγή μεταβλητή Θέτοντας vh = r2h στην (4237) και χρησιμοποιώντας
56 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
τις ανισότητες Friedrich και Young και το Λήμμα 428 για να φράξουμε τη νόρμα του e2hL2[0T L2(Ω)]έχουμε
minus(12)rn2h+2L2(Ω) + (12)[rn2h]2L2(Ω) + (12)rnminus12h+2L2(Ω) + CF minη2 λ4)
int tn
tnminus1r2h2H1(Ω)dt
+int tn
tnminus1〈φprime(y)microminus φprime(yh)microh r2h〉dt+ η
2
int tn
tnminus1nablae2h2L2(Ω)dt+ λ
4
int tn
tnminus1r2h2L2(Γ)dt le
int tn
tnminus1(e2h r2h)dt
(4244)
και αφού
int tn
tnminus1(e2h r2h)dt le (2CF minη2
λ
4 )int tn
tnminus1e2h2L2(Ω)dt+ (CF minη2
λ
4 2)int tn
tnminus1r2h2H1(Ω)dt
αντικαθιστώντας τη τελευταία ανισότητα στην 4244 έχουμε
minus(12)rn2h+2L2(Ω) + (12)[rn2h]2L2(Ω) + (12)rnminus12h+2L2(Ω) + CF minη4
λ
2 2int tn
tnminus1r2h2H1(Ω)dt
+η4int tn
tnminus1nablar2h2L2(Ω)dt+ λ2
int tn
tnminus1r2h2L2(Γ)dt le (2CF minη2
λ
4 )int tn
tnminus1e2h2L2(Ω)dt
η οποία υποδηλώνει την επιθυμητή εκτίμηση μετά από άθροιση και χρησιμοποιώντας το Λήμμα 428
Μια εκτίμηση για αυθαίρετα χρονικά σημεία μπορεί να παραχθεί εφαρμόζοντας τις προσεγγίσεις τηςτεχνικής για τις διακριτές χαρακτηριστικές του [31] στην γραμμική με σύνορο Robin περίπτωση Εδώθα χρειαστούν επίσης οι υπολογισμοί ευστάθειας σε αυθαίρετα χρονικά σημεία
Πρόταση 4210 Υποθέτουμε πως ισχύουν οι υποθέσεις του Θεωρήματος 425 και της Πρότασης429 Τότε υπάρχει μια σταθερά C εξαρτώμενη μόνο από τη σταθερά Ck και το χωρίο τέτοια ώστε
e2hLinfin[0T L2(Ω)] le C(ηe2hL2[0T H1(Ω)] + λe2hL2[0T L2(Γ)] + (λ32α)r1L2[0T L2(Γ)]
)
r2hLinfin[0T L2(Ω)] le C(ηr2hL2[0T H1(Ω)] + (λα12)r1L2[0T L2(Γ)]
)
Απόδειξη Η απόδειξη ακολουθεί τις τεχνικές του [31 Ενότητα 2] προσαρμοσμένη στη περίπτωση τωνRobin συνοριακών δεδομένων Για πληρότητα παρουσιάζουμε την απόδειξη της πρώτης εκτίμησης ενώτη δεύτερη μπορούμε να τη χειριστούμε παρόμοια Αρχικά ανακαλούμε το κύριο προσεγγιστικό εργαλείοτην διακριτή χαρακτηριστική εξίσωση Για κάθε πολυώνυμο s isin Pk(tnminus1 tn) συμβολίζουμε τη διακριτήχαρακτηριστική εξίσωση χ[tnminus1t)s με το πολυώνυμο s isin s isin Pk(tnminus1 tn) s(tnminus1) = s(tnminus1) η οποίαικανοποιεί τη int tn
tnminus1sq =
int t
tnminus1sq forall q isin Pkminus1(tnminus1 tn)
Το κίνητρο για τη παραπάνω κατασκευή προκύπτει από τη παρατήρηση πως q = sprime παίρνονταςint tntnminus1 s
primes =int ttnminus1 ss
prime = 12 (s2(t) minus s2(tnminus1)) Η κατασκευή μπορεί να επεκταθεί στις προσεγγίσεις χ[tnminus1t)v για
v isin Pk[tnminus1 tnV ] όπου V είναι ένας γραμμικός χώρος Η διακριτή προσέγγιση του χ[tnminus1t)v στον
Pk[tnminus1 tnV ] ορίζεται στον v =sumki=0 si(t)vi και αν V είναι ένας χώρος ημι-εσωτερικού γινομένου
τότε forallw isin Pkminus1[tnminus1 tnV ]
v(tnminus1) = v(tnminus1) καιint tn
tnminus1(v w)V =
int t
tnminus1(v w)V
Το [31 Λήμμα 24] δείχνει κάποιες ιδιότητες συνέχειας και πιο συγκεκριμένα
vL2[tnminus1tnV ] le CkvL2[tnminus1tnV ]
42 Εκτιμήσεις σφαλμάτων 57
v minus χ[tnminus1t)vL2[tnminus1tnV ] le CkvL2[tnminus1tnV ]
όπου Ck είναι μια σταθερά που εξαρτάται από το k Ξεκινώντας ολοκληρώνουμε κατά μέλη χρονικάτην (4238) και αντικαθιστώντας με vh = e2hόπου το e2h συμβολίζει τη προσέγγιση της διακριτήςχαρακτηριστικής εξίσωσης χ[tnminus1t)e2h (για κάθε συγκεκριμένο -fixed- t isin [tnminus1 tn)) όπως είναι κα-τασκευασμένο παραπάνω Ο ορισμός του e2h και το γεγονός ότι e2ht isin Pkminus1[tnminus1 tnUh] υποδηλώνει
πωςint tntnminus1(e2ht e2h)dt =
int ttnminus1(e2ht e2h)dt και οπότε
12e2h(t)2L2(Ω) + 1
2[enminus12h ]2L2(Ω) +
int tn
tnminus1a(e2h e2h)dt = 1
2enminus12h 2L2(Ω)
minusλint tn
tnminus1(e2h e2h)Γdtminus
int tn
tnminus1(λ2α)(r1 + r2h e2h)Γdt (4245)
Υπενθυμίζουμε επίσης πως η ιδιότητα συνέχειας για το a( ) δείχνει
∣∣∣int tn
tnminus1a(e2h e2h) + λ(e2h e2h)Γdt
∣∣∣ le Ckint tn
tnminus1(ηe2h2H1(Ω) + λe2h2L2(Γ))dt
ενώ ο όρος σύζευξης μπορεί να γραφεί
∣∣∣λ2
α
int tn
tnminus1(r1 + r2h e2h)Γdt
∣∣∣ le (Ckλ3α2)int tn
tnminus1
(r2h2L2(Γ) + r12L2(Γ)
)dt+ Ckλ
int tn
tnminus1e2h2L2(Γ)dt
Εδώ έχουμε χρησιμοποιήσει την ανισότητα Young με κατάλληλο δ gt 0 και σε διάφορες χρονικές στιγμέςτης ιδιότητας συνέχειας της προσέγγισης της διακριτής χαρακτηριστικής Οπότε αντικαθιστώντας τιςπαραπάνω εκτιμήσεις στη (4245) έχουμε μια ανισότητα της μορφής (1 minus Cτ)an le anminus1 + fn όπουan = supsisin(tnminus1tn] e2h(s)2L2(Ω) Πράγματι έστω t isin (tnminus1 tn] επιλεγμένο ως an equiv e2h(t)2L2(Ω) και
παρατηρώντας πως enminus12h 2L2(Ω) le anminus1 προκύπτει η επιθυμητή εκτίμηση μετά από πρόσθεση και από
το Λήμμα 428
4213 Συμμετρικές εκτιμήσεις για αρχικά δεδομένα χωρίς ομαλότητα
Πολλές εκτιμήσεις μπορούν να προκύψουν χρησιμοποιώντας τα αποτελέσματα απο τις προηγούμενεςπαραγράφους και κλασικά αποτελέσματα της θεωρίας προσεγγίσεων Ξεκινώντας παραθέτουμε τις συμ-μετρικές εκτιμήσεις σφαλμάτων οι οποίες μπορούν να θεωρηθούν ως ανάλογες του κλασικού ΛήμματοςCeacutea
Θεvώρημα 4211 ΄Εστω yh microh isin Uh και (y micro) isinWR(0 T ) οι λύσεις του διακριτού και του συνεχούςσυστήματος βελτιστοποίησης (4111)-(4112)-(4113) και (338)-(339)-(3310) αντιστοίχως ΄Εστωep = y minusQloch y rp = microminus P loch micro το σφάλμα προσέγγισης όπου τα P loch Qloch ορίζονται στους Ορισμούς421 και 422 αντιστοίχως Τότε η ακόλουθη ισχύει η ακόλουθη εκτίμηση για το σφάλμα e = y minus yhκαι r = microminus microh
(e r)X le C(1α)(ep rp)X
όπου η C εξαρτάται απο τις σταθερές των Θεωρημάτων 425 426 και τις Προτάσεις 429 4210 καιείναι ανεξάρτητη από τα τ h α
Απόδειξη Η πρώτη εκτίμηση ακολουθεί από την τριγωνική ανισότητα και τις προηγούμενες εκτιμήσειςτων Θεωρημάτων 425 και 426 και των προτάσεων 429 και 4210
58 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
Ακολουθεί μια βελτιωμένη εκτίμηση για την L2[0 T L2(Ω)] νόρμα για τη βασική μεταβλητή και στηνL2[0 T L2(Γ)] για την συζυγή μεταβλητή συνδυάζοντας τις εκτιμήσεις του Θεωρημάτων 425 και τουΛήμματος 428
Θεvώρημα 4212 Θεωρούμε πως y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] και ισχύουν οι υποθέσειςτου Θεωρήματος 425 και του Λήμματος 428 ΄Εστω ep = y minus Qloch y rp = micro minus P loch micro το σφάλμαπροσέγγισης όπου τα P loch Qloch ορίζονται στους ορισμούς 421 και 422 αντιστοίχως Τότε υπάρχειμια σταθερά C ανεξάρτητη των h τ α τέτοια ώστε
eL2[0T L2(Ω)] le C(epL2[0T L2(Ω)] + τ12(epL2[0T H1(Ω)]
+epL2[0T L2(Γ)]) + (λα12)r1L2[0T L2(Γ)]
)
rL2[0T L2(Γ)] le Cr112L2[0T L2(Ω)]r112L2[0T H1(Ω)]
όπου το r1 υπολογίζεται με βάση τα σφάλματα των προβολών ep rp του Θεωρήματος 425
Απόδειξη Ο πρώτος υπολογισμός προκύπτει από την τριγωνική ανισότητα και τα προηγούμενα απο-τελέσματα του Θεωρήματος 425 και του Λήμματος 428 Ο δεύτερος υπολογισμός προκύπτει απότην τριγωνική ανισότητα την εκτίμηση του Λήμματος 428 για να φράξουμε το r2h και τη συνοριακήανισότητα Sobolev
Χρησιμοποιώντας τώρα την συνηθισμένη ομαλότητα και τη θεωρία προσεγγισιμότητας παίρνουμε τιςτάξεις σύγκλισης Παρακάτω παρουσιάζουμε τις τάξεις σύγκλισης σε δυο ξεχωριστές περιπτώσεις πουεξαρτώνται από τη διαθέσιμη ομαλότητα
Πρόταση 4213 Υποθέτουμε πως πληρούνται οι υποθέσεις του Θεωρήματος 425 και του Λήμματος428 και έστω y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] Υποθέτουμε πως τμηματικά γραμμικά πολυώνυμαχρησιμοποιούνται για να κατασκευάσουμε τους υποχώρους Uh sub H1(Ω) σε κάθε χρονικό βήμα καιτμηματικά σταθερά πολυώνυμα k = 0 για τη χρονική διακριτοποίηση Τότε για τ le Ch2 έχουμε
eL2[0T L2(Ω)] le Ch και rL2[0T L2(Γ)] le Ch
Αν επιπλέον y micro isin L2[0 T H2(Ω)] capH1[0 T L2(Ω)] τότε
(e r)X le C(1α)(h+ τ12)
eL2[0T L2(Ω)] le C(1α12)(h2 + τ + (h2 + τ)12(h+ τ12)12 + (h+ τ12)2)
rL2[0T L2(Γ)] le C(h2 + τ)12(h+ τ12)12
που δείχνει πως για τ asymp h2 οι τάξεις σύγκλισης είναι
(e r)X asymp O(h)eL2[0T L2(Ω)] asymp O(h32)rL2[0T L2(Γ)] asymp O(h32)
Απόδειξη Οι τάξεις σύγκλισης προκύπτουν απευθείας από το Θεώρημα 4211 το Θεώρημα 4212 τοΛήμμα 423 και τη Σημείωση 427
4214 ΄Ελεγχοι με περιορισμούς Η διακριτή προσέγγιση μεταβολών
Αξίζει να σημειωθεί πως οι εκτιμήσεις μας είναι επίσης εφαρμόσιμες στην περίπτωση των σημεια-κών περιορισμών ελέγχου χρησιμοποιώντας τη διακριτοποιημένη προσέγγιση μεταβολών του Hinze
42 Εκτιμήσεις σφαλμάτων 59
([65]) Η διακριτή προσέγγιση μεταβολών υποδηλώνει πως Adad equiv Aad δηλαδή ο έλεγχος δενείναι διακριτοποιημένος άμεσα αλλά έμμεσα μέσω της συζυγούς μεταβλητής Οπότε το διακριτο-ποιημένο πρόβλημα ελέγχου τώρα ταυτίζεται με το Ελαχιστοποίηση συναρτησιακού Jh(yh(g) g) =int T
0 yh(g) minus yd2L2(Ω)dt + αint T
0 g2L2(Γ)dt υπό την (414) όπου yh(g) isin Uh συμβολίζει τη λύση της(414) με δεξί μέλος έναν δοσμένο έλεγχο g isin L2[0 T L2(Γ)] Οπότε ο βέλτιστος έλεγχος (υιοθε-τώντας πάλι το συμβολισμό gh) ικανοποιεί τις ακόλουθες πρώτης τάξης συνθήκες βελτιστοποίησης
Jprimeh(gh)(uminus gh) ge 0 για όλα τα u isin L2[0 T L2(Γ)]
όπου ο gh μπορεί να πάρει τη μορφή gh = Proj[gagb](minus λα microh(gh)) όμοια με τη συνεχή περίπτωση
Σημειώνουμε πως ο gh δεν είναι γενικά μια συνάρτηση πεπερασμένων στοιχείων που αντιστοιχεί στοπεπερασμένων στοιχείων πλέγμα μας οπότε η αλγοριθμική κατασκευή απαιτεί προσοχή βλέπε πχ [65]Ωστόσο σε αρκετές πρακτικές καταστάσεις ο κύριος σκοπός είναι να ελαχιστοποιήσουμε και να υπο-λογίσουμε τη βασική μεταβλητή και όχι απαραίτητα τον έλεγχο που χρησιμοποιούμε για να επιτύχουμετο σκοπό μας Για τη δεύτερη παράγωγο εύκολα υπολογίζουμε μια εκτίμηση ανεξάρτητη του g gh καιπιο συγκεκριμένα
Jprimeprimeh (u)(u u) ge αu2L2[0T L2(Γ)] για όλα τα u isin L2[0 T L2(Γ)]
Θεvώρημα 4214 ΄Εστω y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] και yd isin L2[0 T L2(Ω)] Υποθέτουμεπως Adad equiv Aad και έστω g gh οι λύσεις που αντιστοιχούν στο συνεχές και στο διακριτό πρόβλημαβέλτιστου ελέγχου Τότε ισχύει
g minus ghL2[0T L2(Γ)] le C(1α)micro(g)minus microh(g)L2[0T L2(Γ)]
όπου microh(g) και micro(g) είναι οι λύσεις των (4110) και (337) αντιστοίχως Επιπλέον αν τ le Ch2
g minus ghL2[0T L2(Γ)] asymp O(h)
Απόδειξη Σημειώνουμε πως Adad equiv Aad και οπότε οι συνθήκες βελτιστοποίησης δείχνουν πως
Jprimeh(gh)(g minus gh) ge 0 και J
prime(g)(g minus gh) le 0 (4246)
Οπότε χρησιμοποιώντας τη δεύτερης τάξης συνθήκη και το θεώρημα μέσης τιμής έχουμε για κάθεu isin L2[0 T L2(Γ)] (και ως εκ τούτου για αυτό που προκύπτει από το θεώρημα μέσης τιμής) και τιςανισότητες (4246)
αg minus gh2L2[0T L2(Γ)] le Jprimeprimeh (u)(g minus gh g minus gh) = J
primeh(g)(g minus gh)minus J primeh(gh)(g minus gh)
le J primeh(g)(g minus gh)minus J prime(g)(g minus gh) =int T
0
int
Γ(micro(g)minus microh(g))(g minus gh)dxdt
le Cmicro(g)minus microh(g)L2[0T L2(Γ)]g minus ghL2[0T L2(Γ)]
το οποίο δείχνει ξεκάθαρα την πρώτη εκτίμηση Τώρα μια τάξη σύγκλισης μπορεί να παραχθεί χρησι-μοποιώντας παρόμοια επιχειρήματα με το Θεώρημα 425 Πράγματι παρατηρούμε πως αφαιρώντας την(4110) από την (337) και θέτοντας r = microh(g)minusmicro(g) και e = yh(g)minusy(g) έχουμε το ανάλογο της συν-θήκης ορθογωνιότητας (4227)-(4228) για όλα τα n = 1 N και για όλα τα vh isin Pk[tnminus1 tnUh]
(en1 vnh) +int tn
tnminus1
(minus 〈e1 vht〉+ a(e1 vh) + λ〈e1 vh〉Γ
)dt = (enminus1
1 vnminus1h+ )
minus(rn+ vnh) +int tn
tnminus1
(〈r vht〉+ a(r vh) + λ〈r vh〉Γ
)dt = minus(rnminus1
1+ vnminus1h+ ) +
int tn
tnminus1(e vh)dt
Χρησιμοποιώντας τη συνοριακή ανισότητα Sobolev τις εκτιμήσεις του Θεωρήματος 425 και τις τάξεις
60 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
σύγκλισης της Πρότασης 4213 έχουμε την επιθυμητή εκτίμηση αφού τονίσουμε την μειωμένη ομα-λότητα για το e
422 Ημιγραμμικό πρόβλημα κατανεμημένου ελέγχου
Στη συνέχεια επεκτείνουμε τη θεωρία που παρουσιάσαμε στη περίπτωση που έχουμε ημιγραμμικό όροστην βασική εξίσωση και κατανεμημένο έλεγχο σε όλο το χωρίο Ω ΄Οπως αναμένεται εμφανίζονταιτεχνικές δυσκολίες στις αποδείξεις των θεωρημάτων εξαιτίας του ημιγραμμικού όρου Επιπλέον χρησι-μοποιούμε ένα βοηθητικό σύστημα για την αποσύζευξη του συστήματος και διευκόλυνση στον χειρισμότου
4221 Το πλήρως διακριτό σύστημα βελτιστοποίησης
Επίσης παρακάτω θα αποδείξουμε πως οι dG προσεγγίσεις του συστήματος βελτιστοποίησης παρου-σιάζουν τις ίδιες τάξεις σύγκλισης με την αντίστοιχη (χωρίς έλεγχο) γραμμική παραβολική μδε γιακατάλληλα δεδομένα f y0 yd και τη παράμετρο α
4222 Εκτιμήσεις σφαλμάτων για το σύστημα βελτιστοποίησης
Στη περίπτωση του ημιγραμμικού προβλήματος κατανεμημένου ελέγχου επίσης το κλειδί για τις α-ποδείξεις για τις εκτιμήσεις σφαλμάτων είναι οι υπολογισμοί ευστάθειας σε αυθαίρετα χρονικά σημείαμαζί με τις εκτιμήσεις για το βοηθητικό σύστημα (βασιζόμενοι σε κατάλληλες L2 τεχνικές προβολών)και ένα lsquolsquoδυϊκό επιχείρημαrsquorsquo με σκοπό να χειριστούμε τους μη γραμμικούς χώρους Για να βρούμε μιαπραγματική τάξη σύγκλισης ουσιαστικά χρειάζεται περισσότερη ομαλότητα
Υπόθεση 4215 ΄Εστω (y g) είναι ένα βέλτιστο ζεύγος με την έννοια του Ορισμού 325 Επιπλέονέστω y0 isin H1
0 (Ω) f isin L2[0 T L2(Ω)] και υποθέτουμε πως α12y2Linfin[0T L4(Ω)] le Cd όπου η Cd είναιμια σταθερά που εξαρτάται μόνο από τα δεδομένα f yd y0 τις σταθερές Cc η και το χωρίο Ω
Σημείωση 4216 Η παραπάνω υπόθεση δείχνει έναν ήπιο περιορισμό στο μέγεθος του y σε όρουςτης παραμέτρου ποινής α και των δεδομένων Παραπέμπουμε τον αναγνώστη στη βιβλιογραφία [113]για μια λεπτομερή ανάλυση των αποτελεσμάτων ομαλότητας και της ημιγραμμικής παραβολικής μδε
4223 ΄Ενα βοηθητικό σύστημα βελτιστοποίησης
Αρχικά ορίζουμε ένα βοηθητικό σύστημα βελτιστοποίησης το οποίο θα βοηθήσει να αποσυζεύξουμετο διακριτό σύστημα βελτιστοποίησης ΄Εστω wh zh isin Uh είναι οι λύσεις του ακόλουθου συστήματοςΔοθέντων των δεδομένων f yd y0 και των αρχικών συνθηκών wh0 = yh0 όπου yh0 είναι η αρχικήπροσέγγιση των y0 zN+ = 0 αναζητούμε wh zh isin Uh τέτοιο ώστε για n = 1 N και για όλα ταvh isin Pk[tnminus1 tnUnh ]
(wn vn) +int tn
tnminus1
(minus 〈wh vht〉+ a(wh vh) + 〈φ(y) vh〉
)dt
= (wnminus1 vnminus1+ ) +
int tn
tnminus1
(〈f vh〉 minus (1α)(micro vh)
)dt (4247)
42 Εκτιμήσεις σφαλμάτων 61
minus(zn+ vn) +int tn
tnminus1
(〈zh vht〉+ a(zh vh) + 〈φprime(y)micro vh〉
)dt
= minus(znminus1+ vnminus1
+ ) +int tn
tnminus1(wh minus yd vh)dt (4248)
Οι λύσεις wh zh isin Uh υπάρχουν εφόσον οι ημιγραμμικοί όροι φ(y) φprime(y)micro ανήκουν τουλάχιστον στονL2[0 T Hminus1(Ω)] σύμφωνα με τις Υποθέσεις 311-415 και την ομαλότητα των y micro isin WD(0 T ) Οιλύσεις του βοηθητικού συστήματος βελτιστοποίησης παίζουν το ρόλο lsquolsquoγενικευμένων προβολώνrsquorsquo στονUh Η βασική εκτίμηση της ενεργειακής νόρμας yminuswh microminus zh θα παραχθεί με βάση τοπικές L2 προβο-λές χρησιμοποιώντας τεχνικές του [31 Ενότητα 2] στο βοηθητικό σύστημα (3312)-(3313)(4247)-(4248)
΄Ομοια με το συνοριακό Robin πρόβλημα σημαντικό σε αυτές τις εκτιμήσεις είναι το ότι είναι έγκυρες α-κόμη και κάτω από υποθέσεις ελάχιστης ομαλότητας Κατά παρόμοιο τρόπο λοιπόν ορίζουμε τη κλασικήπροβολή που εφαρμόζεται και για τον ημιγραμμικό όρο (χρειάζεται όμως προσοχή γιατί στη περίπτωσητου κατανεμημένου ελέγχου σε ημιγραμμικό πρόβλημα εργαζόμαστε σε διαφορετικούς χώρους από αυ-τούς που αναφέρθηκαν στα προηγούμενα προβλήματα) Οπότε χρειαζόμαστε τις ακόλουθες σχετικέςμε τη μέθοδο dG προβολές βλέπε πχ [104]
Ορισμός 4217 (1) Η προβολή P locn C[tnminus1 tnL2(Ω)] rarr Pk[tnminus1 tnUnh ] ικανοποιεί την(P locn v)n = Pnv(tn) και την
int tn
tnminus1(v minus P locn v vh) = 0 forall vh isin Pkminus1[tnminus1 tnUnh ] (4249)
Εδώ έχουμε χρησιμοποιήσει τη σύμβαση (P locn v)n equiv (P locn v)(tn) και Pn L2(Ω)rarr Unh είναι ο τελεστήςορθογώνιας προβολής στον Unh sub H1
0 (Ω)(2) Η προβολή P loch C[0 T L2(Ω)]rarr Uh ικανοποιεί τη σχέση
P loch v isin Uh και (P loch v)|(tnminus1tn] = P locn (v|[tnminus1tn])
Επιπλέον της συνθήκης (4249) για το χρονικά οπισθόδρομο πρόβλημα χρειάζεται να επιβάλλουμετη lsquolsquoσυνθήκη ταιριάσματοςrsquorsquo στα αριστερά δηλαδή (P locn v)nminus1
+ = Pnv(tnminus1+ ) αντί της επιβολής της
συνθήκης στα αριστερά Υπογραμμίζουμε πως η προβολή του Ορισμού 4217 μπορεί να θεωρηθεί ως ημονοβηματική dG προσέγγιση της vt = f στο διάστημα (tnminus1 tn] με ακριβή αρχικά δεδομένα v(tnminus1) καινα καθορίζεται ως f = vt ενώ η παραλλαγή της προβολής για την οπισθόδρομη χρονικά μονοβηματικήdG προσέγγιση της οπισθόδρομης χρονικά σδε με δοσμένα τελικά δεδομένα Υπενθυμίζουμε πωςλόγω του [104 Θεώρημα 121] αυτές οι προβολές ικανοποιούν τις αναμενόμενες ιδιότητες προσέγγισηςΠαρακάτω παραθέτουμε το κύριο αποτέλεσμα για το βοηθητικό πρόβλημα
Θεvώρημα 4218 ΄Εστω τα δεδομένα f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω) και yd isin L2[0 T L2(Ω)]και έστω πως ισχύει η Υπόθεση 311 Αν τα y micro isin WD(0 T ) είναι οι λύσεις του (3312)-(3313) καιwh zh isin Uh οι λύσεις του (4247)-(4248) υπολογισμένες χρησιμοποιώντας το dG σχήμα Συμβο-λίζουμε με e1 = yminuswh r1 = microminus zh και έστω ep equiv yminusP loch y rp = microminusP loch micro όπου P loch ορίζεται στονΟρισμό 4217 Τότε υπάρχει μια αλγεβρική σταθερά C gt 0 που εξαρτάται μόνο από το Ω τέτοιο ώστε
ηe12L2[0T H1(Ω)] +Nminus1sum
i=0[ei1]2L2(Ω) le C
(e0
12L2(Ω) + (C2c η)ep2L2[0T H1(Ω)]
)
+Nminus1sum
i=02 min
((I minus Pi)y(ti)2L2(Ω) (1(τi+1η))Pi+1(I minus Pi)y(ti)2Hminus1(Ω)
)
62 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
ηr12L2[0T H1(Ω)] +Nsum
i=1[ri1]2L2(Ω) le C
((1η)e12L2[0T L2(Ω)] + (C2
c η)rp2L2[0T H1(Ω)]
)
+Nsum
i=12 min
((I minus Pi+1)micro(ti)2L2(Ω) (1(τiη))Pi(I minus Pi+1)micro(ti)2Hminus1(Ω)
)
Εδώ w0h = y0h όπου y0h συμβολίζει μια προσέγγιση της y0 τi = ti minus timinus1 Pn συμβολίζουν την L2
προβολή του Unh και έχουμε χρησιμοποιήσει τη σύμβαση P0 equiv P1 PN+1 equiv PN
Απόδειξη Σε αυτή την απόδειξη συμβολίζουμε με e1 = y minus wh r1 = micro minus zh και διαχωρίζουμε ταe1 r1 σε e1 equiv e1h + ep equiv (P loch y minus wh) + (y minus P loch y) r1 equiv r1h + rp equiv (P loch micro minus zh) + (micro minus P loch micro)όπου P loch ορίζεται στον Ορισμό 4217 Χρησιμοποιώντας το παραπάνω συμβολισμό και αφαιρώντας τη(4247) από τη (3312) και τη (4248) από τη (3313) παίρνουμε τη συνθήκη ορθογωνιότητας Γιαn = 1 N
(en1 vn) +int tn
tnminus1
(minus 〈e1 vht〉+ a(e1 vh)
)dt = (enminus1
1 vnminus1+ ) (4250)
minus (rn1+ vn) +
int tn
tnminus1
(〈r1 vht〉+ a(r1 vh)
)dt = minus(rnminus1
1+ vnminus1+ ) +
int tn
tnminus1(e1 vh)dt (4251)
για όλα τα vh isin Pk[tnminus1 tnUnh ] Παρατηρούμε πως η συνθήκη ορθογωνιότητας (4250) είναι ου-σιαστικά αποσυζευγμένη και ταυτίζεται με τη συνθήκη ορθογωνιότητας της [31 Σχέση (26)] Οπότεεφαρμόζοντας το [31 Θεώρημα 22] καταλήγουμε στη πρώτη εκτίμηση Με παρόμοιο τρόπο η συνθήκηορθογωνιότητας (4251) είναι ισοδύναμη με
minus(rn1h+ vn) +
int tn
tnminus1
(〈r1h vht〉+ a(r1h vh)
)dt = minus(rnminus1
1h+ vnminus1+ )
+int tn
tnminus1
((e1 vh)minus a(rp vh)
)dt+ (rnp+ vn) forall vh isin Pk[tnminus1 tnUnh ]
Εδώ έχουμε χρησιμοποιήσει τον ορισμό της προβολής Θέτοντας vh = r1h στη (4252) χρησιμοποιών-τας τα φράγματα
int tn
tnminus1
∣∣(e1 r1h)∣∣dt le
int tn
tnminus1
((η4)r1h2H1(Ω) + (Cη)e12L2(Ω)
)dt
int tn
tnminus1
∣∣a(r1h rp)∣∣dt le (η4)
int tn
tnminus1r1h2H1(Ω)dt+ (C2
c η)int tn
tnminus1rp2H1(Ω)dt
και με κάποιους υπολογισμούς παίρνουμε
minus12r
n1h+2L2(Ω) + 1
2[rn1h]2L2(Ω) + 1
2rnminus11h+2L2(Ω) + η
2
int tn
tnminus1r1h2H1(Ω)dt
le Cint tn
tnminus1
((C2
c η)rp2H1(Ω) + (1η)e12L2(Ω)
)dt+
∣∣((I minus Pn+1)micro(tn+) rn1h)∣∣ (4252)
Τελικώς για το τελευταίο όρο παρατηρούμε ότι rnh+ isin Un+1h και επομένως
((I minus Pn+1)micro(tn+) rn1h) = ((I minus Pn+1)micro(tn+) rn1h minus rn1h+)le (I minus Pn+1)micro(tn+)2L2(Ω) + (14)rn1h+ minus rn1h2L2(Ω)
Είναι δυνατό να παραχθεί ένα εναλλακτικό φράγμα χρησιμοποιώντας μια αντίστροφη εκτίμηση
42 Εκτιμήσεις σφαλμάτων 63
rn1h2H1(Ω) le (Ckτn)int tntnminus1 r1h2H1(Ω)dt και παρατηρώντας πως rn1h isin Unh
((I minus Pn+1)micro(tn+) rn1h) = (Pn(I minus Pn+1)micro(tn+) rn1h) le Pn(I minus Pn+1)micro(tn+)Hminus1(Ω)rn1hH1(Ω)
le (C2k(τnη))Pn(I minus Pn+1)micro(tn+)2Hminus1(Ω) + (η4)
int tn
tnminus1r1h2H1(Ω)dt
όπου στο τελευταίο βήμα έχουμε χρησιμοποιήσει την ανισότητα Young Συγκεντρώνοντας τις δυοτελευταίες εκτιμήσεις και την εξίσωση (4252) παίρνουμε την επιθυμητή εκτίμηση μετά από άθροισμακαι κάποιους υπολογισμούς
Σημείωση 4219 Αν χρησιμοποιούνται οι ίδιοι υπόχωροι σε κάθε χρονικό βήμα δηλαδή Unh equivUh sub H1
0 (Ω) τότε παρατηρούμε πως δεν υπάρχει συνεισφορά από τον όρο αθροίσματος στο Θεώρημα4218 Σημειώνουμε πως για i = 1 N η τοπική L2(Ω) προβολή Pi equiv Pi+1 equiv PL2 L2(Ω) rarr Uhείναι η ίδια σε κάθε χρονικό βήμα Οπότε το rnh+ isin Uh μας δείχνει πως
((I minus Pn+1)micro(tn+) rn1h
)equiv((I minus PL2)micro(tn+) rn1h
)equiv 0
Οπότε η (4252) παίρνει τη μορφή
minus(12)rn1h+2L2(Ω) + (12)[rn1h]2L2(Ω) + (12)rnminus11h+2L2(Ω) + (η2)
int tn
tnminus1r1h2H1(Ω)dt
le Cint tn
tnminus1
((C2
c η)rp2H1(Ω) + (1η)e12L2(Ω)
)dt
Εργαζόμενοι όμοια για το προς τα εμπρός (χρονικά) πρόβλημα έχουμε τους ακόλουθους υπολογισμούς
ηe12L2[0T H1(Ω)] +Nminus1sum
i=0[ei1]2L2(Ω) le C
(e0
12L2(Ω) + (C2c η)ep2L2[0T H1(Ω)]
)
ηr12L2[0T H1(Ω)] +Nsum
i=1[ri1]2L2(Ω) le C
((1η)e12L2[0T L2(Ω)] + (C2
c η)rp2L2[0T H1(Ω)]
)
Επακολούθως παράγεται ένας υπολογισμός για την Linfin[0 T L2(Ω)] νόρμα χρησιμοποιώντας τη διακριτήχαρακτηριστική (βλέπε στο Παράρτημα Α΄3) και το επακόλουθο Θεώρημα 4228 Εφόσον μια εκτίμησηγια την L2[0 T H1(Ω)] νόρμα έχει ήδη παραχθεί και το βοηθητικό σύστημα βελτιστοποίησης είναιουσιαστικά αποσυζευγμένο οι τεχνικές της [31 Ενότητα 2] μπορούν να εφαρμοστούν απευθείας
Θεvώρημα 4220 ΄Εστω wh zh isin Uh οι λύσεις του (4247)-(4248) υπολογισμένες χρησιμοποιώ-ντας το dG σχήμα Συμβολίζουμε με e1 = y minus wh r1 = micro minus zh και υποθέτουμε πως πληρούνται οιυποθέσεις του Θεωρήματος 4218 Τότε υπάρχει μια σταθερά C που εξαρτάται από τα CkΩ τέτοια ώστε
e12Linfin[0T L2(Ω)] le C[ep2Linfin[0T L2(Ω)] + e0
12L2(Ω) + (C2c η)ep2L2[0T H1(Ω)]
+Nminus1sum
i=02 min
((I minus Pi)y(ti)2L2(Ω) (1(τi+1η))Pi+1(I minus Pi)y(ti)2Hminus1(Ω)
)]
r12Linfin[0T L2(Ω)] le C[rp2Linfin[0T L2(Ω)] + (1η)e12L2[0T L2(Ω)] + (C2
c η)rp2L2[0T H1(Ω)]
+Nsum
i=12 min
((I minus Pi+1)micro(ti)2L2(Ω) (1(τiη))Pi(I minus Pi+1)micro(ti)2Hminus1(Ω)
)]
Απόδειξη Διαχωρίζοντας το σφάλμα όπως στο προηγούμενο θεώρημα (καθώς και στο Robin πρόβλημαστα προηγούμενα) δηλ e1 = e1h + ep αρκεί να φράξουμε τον όρο suptnminus1lttletn e1h(t)2L2(Ω) Αυτόέχει γίνει στο [31 Θεώρημα 25] (τονίζουμε πως η συνθήκη ορθογωνιότητας είναι αποσυζευγμένη) Η
64 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
εκτίμηση για τη συζυγή μεταβλητή μπορεί να παραχθεί παρόμοια ξεκινώντας από τη συνθήκη ορθογω-νιότητας (4251) και χρησιμοποιώντας μια κατάλληλη προσέγγιση για τη διακριτή χαρακτηριστική γιατο οπισθόδρομο χρονικά πρόβλημα
Σημείωση 4221 Παρόμοια με τη Σημείωση 4219 ισχύει ένα βελτιωμένο φράγμα όταν Unh = Uhn = 1 N Ειδικότερα
e12Linfin[0T L2(Ω)] le C(ep2Linfin[0T L2(Ω)] + e0
12L2(Ω) + (C2c η)ep2L2[0T H1(Ω)]
)
r12Linfin[0T L2(Ω)] le C(rp2Linfin[0T L2(Ω)] + (1η)e12L2[0T L2(Ω)] + (C2
c η)rp2L2[0T H1(Ω)]
)
Σημείωση 4222 Ο συνδυασμός των δυο τελευταίων Θεωρημάτων καταδεικνύει τη lsquolsquoσυμμετρικήrsquorsquoδομή των εκτιμήσεων Πιο συγκεκριμένα έστω ( )X ( )X1 ορίζονται από την
(e1 r1)2X equiv e12X + r12X equiv e12L2[0T H1(Ω)] + r12L2[0T H1(Ω)]
+e12Linfin[0T L2(Ω)] + r12Linfin[0T L2(Ω)]
και
(e1 r1)2X1 equiv e12X1 + r12X1
equivNminus1sum
i=02 min
((I minus Pi)y(ti)2L2(Ω) (1(τi+1η))Pi+1(I minus Pi)y(ti)2Hminus1(Ω)
)
+Nsum
i=12 min
((I minus Pi+1)micro(ti)2L2(Ω) (1(τiη))Pi(I minus Pi+1)micro(ti)2Hminus1(Ω)
)
Τότε χρησιμοποιώντας τα Θεωρήματα 4218 4220 έχουμε μια εκτίμηση της μορφής
σφάλμαX le C(σφάλμα αρχικών δεδομένωνL2(Ω) + σφάλμα καλύτερης προσέγγισηςX
+σφάλμα υποχώρωνX1
)
Ο παραπάνω υπολογισμός δείχνει πως το σφάλμα είναι εφαρμόσιμο για υψηλότερης τάξης στοιχεία υπότις φυσικές παραβολικές υποθέσεις ομαλότητας Αν Unh equiv Uh για n = 1 N τότε το σφάλμα υποχώρωνμπορεί να παραλειφθεί και οπότε έχουμε μια συμμετρική εκτίμηση της μορφής
σφάλμα X le C(σφάλμα αρχικών δεδομένων L2(Ω) + σφάλμα καλύτερης προσέγγισηςX
)
(4253)
το οποίο μπορεί να θεωρηθεί ως το πλήρως διακριτό ανάλογο του Λήμματος Ceacutea ([34])
Απομένει να συγκρίνουμε το διακριτό σύστημα βελτιστοποίησης (4115)-(4116) με το βοηθητικόσύστημα (4247)-(4248) Στη συνέχεια συμβολίζουμε με e2h equiv wh minus yh και με r2h equiv zh minus microhΞεκινάμε αναγνωρίζοντας ένα βοηθητικό φράγμα για το e2h2L2[0T L2(Ω)] και (1α)r2h2L2[0T L2(Ω)]σε όρους του α12e2h2L2[0T H1(Ω)] και όρους προβολών e1 r1 Εδώ παρατηρούμε πως χωρίς βλάβητης γενικότητας υποθέτουμε α lt 1 το οποίο αντιστοιχεί στη φυσική περίπτωση
Λήμμα 4223 Υποθέτουμε πως πληρούνται οι Υποθέσεις 311-415-4215 ΄Εστω yh microhwhzh isinUh είναι οι λύσεις του συστήματος βελτιστοποίησης (4115)-(4116) και του βοηθητικού συστήματος(4247)-(4248) αντιστοίχως υπολογισμένα με το ασυνεχές σχήμα Galerkin Συμβολίζουμε με e1 equivy minus wh r1 equiv microminus zh και έστω e2h equiv wh minus yh r2h equiv zh minus microh Τότε υπάρχει σταθερά C που εξαρτάταιαπό τα η CL Cc και τις σταθερές Cd Cst της Υπόθεσης 4215 και του Λήμματος 417 αντιστοίχωςτέτοια ώστε για τ να ικανοποιεί τις υποθέσεις του Λήμματος 417 και 4118 και για α lt CCL να ισχύει
42 Εκτιμήσεις σφαλμάτων 65
η ακόλουθη εκτίμηση
int T
0e2h2L2(Ω)dt+ (1α)
int T
0r2h2L2(Ω)dt
le Cint T
0
((1α)e12H1(Ω) + r12H1(Ω)
)dt+ Cα12
int T
0e2h2H1(Ω)dt
Απόδειξη Αφαιρώντας τη (4116) από τη (4248) παίρνουμε την εξίσωση
minus(rn2h+ vn) +
int tn
tnminus1
(〈r2h vht〉+ a(r2h vh) + 〈φprime(y)microminus φprime(yh)microh vh〉
)dt
= minus(rnminus12h+ v
nminus1+ ) +
int tn
tnminus1(e2h vh)dt forall vh isin Pk[tnminus1 tnUnh ] (4254)
Αφαιρώντας τη (4115) από τη (4247) παίρνουμε την εξίσωση
(en2h vn) +int tn
tnminus1
(minus 〈e2h vht〉+ a(e2h vh) + 〈φ(y)minus φ(yh) vh〉
)dt
= (enminus12h vnminus1
+ ) +int tn
tnminus1minus(1α)(microminus microh vh)dt forall vh isin Pk[tnminus1 tnUnh ] (4255)
Θα βρούμε ένα βοηθητικό φράγμα για το e2h2L2[0T L2(Ω)] και το (1α)r2h2L2[0T L2(Ω)] σε όρους του
α12e2h2L2[0T H1(Ω)] και όρους προβολών Για αυτό το σκοπό θέτουμε vh = e2h στην (4254) για ναπροκύψει
minus(rn2h+ en2h) +
int tn
tnminus1
(〈r2h e2ht〉+ a(r2h e2h) + 〈φprime(y)microminus φprime(yh)microh e2h〉
)dt+ (rnminus1
2h+ enminus12h+)
=int tn
tnminus1e2h2L2(Ω)dt (4256)
και vh = r2h στη (4255)
(en2h rn2h) +int tn
tnminus1
(minus 〈e2h r2ht〉+ a(e2h r2h) + 〈φ(y)minus φ(yh) vh〉
)dtminus (enminus1
2h rnminus12h+)
=int tn
tnminus1minus(1α)(r1 r2h)minus (1α)r2h2L2(Ω)dt (4257)
Εφαρμόζοντας παραγοντική ολοκλήρωση ως προς το χρόνο στη (4257) και αφαιρώντας την εξίσωσηπου προκύπτει από την (4256) καταλήγουμε στη
(rn2h+ en2h)minus (enminus1
2h rnminus12h+) +
int tn
tnminus1
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt
=int tn
tnminus1(〈φprime(y)microminus φprime(yh)microh e2h〉 minus 〈φ(y)minus φ(yh) r2h〉) dtminus (1α)
int tn
tnminus1(r1 r2h)dt (4258)
Χρειάζεται να φράξουμε τους τρεις όρους στο δεξί μέλος Ξεκινάμε υπολογίζοντας τους δυο τελευταίουςόρους Για αυτό το σκοπό παρατηρούμε πως
∣∣∣∣∣(1α)int tn
tnminus1(r1 r2h)dt
∣∣∣∣∣ le (14α)int tn
tnminus1r2h2L2(Ω)dt+ (1α)
int tn
tnminus1r12L2(Ω)dt
αφού η Υπόθεση 415 (σημειώνουμε σύμφωνα με το Θεώρημα 419 πως υπάρχει ε gt 0 τέτοιο ώστε
66 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
yh minus yL2[tnminus1tnL2(Ω)] le ε) και η ανισότητα Young δίνουν
int tn
tnminus1|〈φ(y)minus φ(yh) r2h〉| dt le C2
Lα
int tn
tnminus1
(e2h2L2(Ω) + e12L2(Ω)
)dt+ (14α)
int tn
tnminus1r2h2L2(Ω)dt
Επιπλέον για τον τελευταίο όρο μπορούμε να φράξουμε
Inl equivint tn
tnminus1|〈φprime(y)microminus φprime(yh)microh e2h〉| dt
leint tn
tnminus1|〈φprime(y)(microminus microh) e2h〉| dt+
int tn
tnminus1|〈(φprime(y)minus φprime(yh))microh e2h〉| dt equiv I1
nl + I2nl
Για το ολοκλήρωμα I1nl προσθαφαιρώντας το φprime(0)
I1nl =
int tn
tnminus1|〈φprime(y)(microminus microh) e2h〉| dt
leint tn
tnminus1(|〈(φprime(y)minus φprime(0))(microminus microh) e2h〉|+ |〈φprime(0)(microminus microh) e2h〉|) dt
Επομένως χρησιμοποιώντας τη συνέχεια Lipschitz του φprime το ομοιόμορφο φράγμα του φprime(0) τηνεμφύτευση H1(Ω) sub L4(Ω) και την ανισότητα Young με κατάλληλο δ gt 0 έχουμε
I1nl le CCL
int tn
tnminus1yL4(Ω)r2h + r1L2(Ω)e2hL4(Ω)dt
+Cint tn
tnminus1r2h + r1L2(Ω)e2hL2(Ω)dt
le (1α)int tn
tnminus1r12L2(Ω)dt+ (14α)
int tn
tnminus1r2h2L2(Ω)dt
+αC(CL)y2Linfin[0T L4(Ω)]
int tn
tnminus1e2h2H1(Ω)dt+ Cα
int tn
tnminus1e2h2L2(Ω)dt
le (1α)int tn
tnminus1r12L2(Ω)dt+ (14α)
int tn
tnminus1r2h2L2(Ω)dt
+α12C(CL Cd)int tn
tnminus1e2h2H1(Ω)dt+ Cα
int tn
tnminus1e2h2L2(Ω)dt
όπου στη τελευταία ανισότητα έχουμε χρησιμοποιήσει την Υπόθεση 4215 Εδώ η C(CL Cd) συμβολίζειμια σταθερά που εξαρτάται από το CL τα δεδομένα f y0 yd η και το Ω Επιπλέον η συνέχεια Lipschitzτου φprime και η γενικευμένη ανισότητα Houmllder υποδηλώνουν πως
I2nl =
int tn
tnminus1|〈(φprime(y)minus φprime(yh))microh e2h〉| dt
le CLint tn
tnminus1e1L4(Ω)microhL2(Ω)e2hL4(Ω)dt+
int tn
tnminus1e2hL4(Ω)microhL2(Ω)e2hL4(Ω)dt
Το πρώτο μέρος του I2nl μπορεί να φραχτεί χρησιμοποιώντας την εμφύτευση H1(Ω) sub L4(Ω) και την
ανισότητα Youngint tn
tnminus1e1H1(Ω)microhL2(Ω)e2hH1(Ω)dt le (CDmicrostα
12)int tn
tnminus1e12H1(Ω)dt+ α12
int tn
tnminus1e2h2H1(Ω)dt
όπου συμβολίζουμε με Dmicrost τη σταθερά ευστάθειας του Λήμματος 4118 Τελικώς παρατηρούμε πωςη ανισότητα παρεμβολής 2L4(Ω) le CL2(Ω)H1(Ω) η ανισότητα ευστάθειας του microh του Λήμματος
42 Εκτιμήσεις σφαλμάτων 67
4118 και η ανισότητα Young με κατάλληλο δ υποδηλώνει πως
int tn
tnminus1e2hL4(Ω)e2hL4(Ω)microhL2(Ω)dt le microhLinfin[tnminus1tnL2(Ω)]
int tn
tnminus1e2hL2(Ω)e2hH1(Ω)dt
le (14)int tn
tnminus1e2h2L2(Ω)dt+ Cmicroh2Linfin[tnminus1tnL2(Ω)]
int tn
tnminus1e2h2H1(Ω)dt
le (14)int tn
tnminus1e2h2L2(Ω)dt+ CCstα
12int tn
tnminus1e2h2H1(Ω)dt
Αντικαθιστώντας τα παραπάνω φράγματα στην (4258) και προσθέτοντας τις ανισότητες που προκύπτουναπό το 1 μέχρι το N παρατηρώντας πως
sumNn=1
((rn2h+ e
n2h)minus (enminus1
2h rnminus12h+)
)= 0 (εφόσον e0
2h equiv 0rN2h+ = 0) και επιλέγοντας α lt C(CL) για να lsquolsquoκρύψουμεrsquorsquo το
int tntnminus1 e2h2L2(Ω)dt παίρνουμε το επιθυ-
μητό αποτέλεσμα
Σημείωση 4224 Στη παραπάνω απόδειξη χρησιμοποιούμε τη συνέχεια Lipschitz του φprime για νααποφύγουμε επιπλέον τεχνικές λεπτομέρειες Η υπόθεση πως y isin Linfin[0 T L4(Ω)] θα απαιτήσει ναεπιβάλουμε επιπρόσθετη ομαλότητα στα δεδομένα ειδικότερα y0 isin H1
0 (Ω) f isin L2[0 T L2(Ω)] αλλάόχι επιπλέον ομαλότητα στον έλεγχο και το στόχο
Οι εκτιμήσεις προκύπτουν χρησιμοποιώντας τεχνικές προβολών του Θεωρήματος 4218 οι οποίες θαεπιτρέψουν να χειριστούμε τις προς τα εμπρός και τις προς τα πίσω (στο χρόνο) συζευγμένες μδεμαζί με ένα lsquolsquoπρος τα πίσωrsquorsquo (lsquolsquoboot-straprsquorsquo) επιχείρημα
Θεvώρημα 4225 ΄Εστω οτι πληρούνται οι Υποθέσεις 311-415-4215 Θεωρούμε yh microh whzh isinUh ως λύσεις του συστήματος βελτιστοποίησης (4115)-(4116) και του βοηθητικού συστήματος (4247)-(4248) αντιστοίχως υπολογισμένες με το σχήμα ασυνεχούς Galerkin Συμβολίζουμε με e1 equiv yminuswhr1 equiv microminus zh και έστω e2h equiv wh minus yh r2h equiv zh minus microh Τότε υπάρχει μια σταθερά D που εξαρτάται από
το yLinfin[0T L2(Ω)]η τη σταθερά C του Λήμματος 4223 και το ρ equiv CC2stη+βC
η4+CC2stη+βC lt 1 (για β gt 0)
τέτοιο ώστε για τ να ικανοποιεί τις υποθέσεις των Λημμάτων 417 και 4118 και ισχύει η ακόλουθηεκτίμηση
eN2h2L2(Ω) + η
int T
0e2h2H1(Ω)dt+
Nminus1sum
i=0[ei2h]2L2(Ω)
+(ηα)int T
0r2h2H1(Ω)dt+ (1α)r0
2h+2L2(Ω) + (1α)Nsum
i=1[ri2h]2L2(Ω)
le D(1α2)int T
0
(e12H1(Ω) + r12H1(Ω)
)dt
Εδώ η σταθερά D είναι ανεξάρτητη των τ h α
Σημείωση 4226 Παρατηρούμε πως μας ενδιαφέρει η περίπτωση όπου οι τιμές του α είναι μικρέςκαι πιθανώς συγκρίσιμες με το h οι οποίες εγγυώνται γρήγορη σύγκλιση στο στόχο yd Ως εκ τούτουαπαιτείται μεγάλη προσοχή για να αποφευχθεί η χρήση ανισοτήτων τύπου Groumlnwall που ουσιαστικάοδηγούν σε σταθερές της μορφής exp(1α)
Απόδειξη Βήμα 1 Προκαταρκτικά αποτελέσματα για τη βασική μεταβλητή Θέτοντας vh = e2h στην(4255) και παρατηρώντας πως microminus microh = r1 + r2h παίρνουμε
12e
n2h2L2(Ω) + 1
2[enminus12h ]2L2(Ω) minus
12e
nminus12h 2L2(Ω) + η
int tn
tnminus1e2h2H1(Ω)dt
+int tn
tnminus1〈φ(y)minus φ(yh) e2h〉dt le minus
1α
int tn
tnminus1(r1 + r2h e2h)dt (4259)
68 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
Για το πρώτο όρο στο δεξί μέλος παρατηρούμε πως
∣∣∣(1α)int tn
tnminus1(r1 e2h)dt
∣∣∣ le(η4)
int tn
tnminus1e2h2H1(Ω)dt+ (Cηα2)
int tn
tnminus1r12L2(Ω)dt
Στα επόμενα επικεντρωνόμαστε στους μη γραμμικούς όρους Τονίζουμε πως η μονοτονία του φ υπο-δηλώνει πως
Inl equivint tn
tnminus1〈φ(y)minus φ(yh) e2h〉dt ge
int tn
tnminus1〈φ(y)minus φ(wh) e2h〉dt
και οπότε μετακινώντας τον παραπάνω όρο στο δεξί μέλος μπορούμε να φράξουμε αυτόν τον όρο χρη-σιμοποιώντας την Υπόθεση 415 την ανισότητα Poincareacute και την ανισότητα Young όπως ακολουθεί
∣∣∣Inl∣∣∣ le CL
int tn
tnminus1e1L2(Ω)e2hL2(Ω)dt le (η4)
int tn
tnminus1e2h2H1(Ω)dt+ (CCLη)
int tn
tnminus1e12H1(Ω)dt
Επομένως συλλέγοντας τα παραπάνω φράγματα στην (4259) και πολλαπλασιάζοντας με α12 παίρνουμε
α12(en2h2L2(Ω) + [enminus1
2h ]2L2(Ω) minus enminus12h 2L2(Ω) + (η4)
int tn
tnminus1e2h2H1(Ω)dt
)
leint tn
tnminus1
((Cηα32)r12H1(Ω) + (CCLα12η)e12H1(Ω)
)dtminus (1α12)
int tn
tnminus1(r2h e2h)dt
(4260)
Βήμα 2 Προκαταρκτικά αποτελέσματα για τη συζυγή μεταβλητή Θέτοντας vh = r2h στην (4254)έχουμε
minus(12)rn2h+2L2(Ω) + (12)[rn2h]2L2(Ω) + (12)rnminus12h+2L2(Ω) + η
int tn
tnminus1r2h2H1(Ω)dt
+int tn
tnminus1〈φprime(y)microminus φprime(yh)microh r2h〉dt le
int tn
tnminus1(e2h r2h)dt (4261)
Χρησιμοποιώντας την μονοτονία του φ και παρατηρώντας πως micro minus microh = r1 + r2h η μη γραμμικότητατης συζυγούς εξίσωσης μπορεί να γραφεί ως εξής
int tn
tnminus1〈φprime(y)microminus φprime(yh)microh r2h〉dt =
int tn
tnminus1〈φprime(y)microminus φprime(y)microh r2h〉dt+
int tn
tnminus1〈φprime(y)microh minus φprime(yh)microh r2h〉dt
geint tn
tnminus1〈φprime(y)r1 r2h〉dt+
int tn
tnminus1〈φprime(y)microh minus φprime(yh)microh r2h〉dt
Μετακινώντας τα τελευταία δυο ολοκληρώματα στο δεξί μέλος παίρνουμε κατάλληλα φράγματα Για τοπρώτο ολοκλήρωμα χρησιμοποιώντας τη συνέχεια Lipschitz του φprime το ομοιόμορφο φράγμα του φprime(0)τη γενικευμένη ανισότητα Houmllderrsquos και την εμφύτευση H1(Ω) sub L4(Ω) παίρνουμε
∣∣∣int tn
tnminus1〈φprime(y)r1 r2h〉dt
∣∣∣ le∣∣∣int tn
tnminus1〈(φprime(y)minus φprime(0))r1 r2h〉dt
∣∣∣+∣∣∣int tn
tnminus1〈φprime(0)r1 r2h〉dt
∣∣∣
le (η4)int tn
tnminus1r2h2H1(Ω)dt+ (Cyη)
int tn
tnminus1r12H1(Ω)dt
∣∣∣int tn
tnminus1〈φprime(y)r1 r2h〉dt
∣∣∣ le∣∣∣int tn
tnminus1〈(φprime(y)minus φprime(0))r1 r2h〉dt
∣∣∣+∣∣∣int tn
tnminus1〈φprime(0)r1 r2h〉dt
∣∣∣
le (η4)int tn
tnminus1r2h2H1(Ω)dt+ (Cyη)
int tn
tnminus1r12H1(Ω)dt
42 Εκτιμήσεις σφαλμάτων 69
όπου η Cy εξαρτάται μόνο από το yLinfin[0T L2(Ω)] και το χωρίο Παρόμοια για το δεύτερο ολοκλήρωμαη συνέχεια Lipschitz του φprime η γενικευμένη ανισότητα Houmllder και το γεγονός ότι y minus yh = e1 + e2hδείχνει
∣∣∣int tn
tnminus1〈(φprime(y)minus φprime(yh))microh r2h〉dt
∣∣∣ le CLint tn
tnminus1microhL2(Ω)e1 + e2hL4(Ω)r2hL4(Ω)dt le II1
nl + II2nl
Απομένει να φράξουμε τα τελευταία δυο ολοκληρώματα Αρχίζοντας από το II2nl χρησιμοποιώντας την
ιδιότητα παρεμβολής 2L4(Ω) le CL2(Ω)H1(Ω) και τις εκτιμήσεις ευστάθειας για το microh παίρνουμε
II2nl le CL
int tn
tnminus1microhL2(Ω)e2hL4(Ω)r2hL4(Ω)dt
le η4int tn
tnminus1microh2L2(Ω)r2hH1(Ω)e2hH1(Ω)dt
+(CCLη)int tn
tnminus1e2hL2(Ω)r2hL2(Ω)dt
le η4int tn
tnminus1r2h2H1(Ω)dt+ microh4Linfin[tnminus1tnL2(Ω)]η16
int tn
tnminus1e2h2H1(Ω)dt
+(CCLη)int tn
tnminus1
(α12e2h2L2(Ω) + (1α12)r2h2L2(Ω)
)dt
le η4int tn
tnminus1r2h2H1(Ω)dt+ (CC2
stαη16)int tn
tnminus1e2h2H1(Ω)dt
+(CCLη)int tn
tnminus1
(α12e2h2L2(Ω) + (1α12)r2h2L2(Ω)
)dt
όπου έχουμε χρησιμοποιήσει το φράγμα ευστάθειας για το Λήμμα 4118 Για το II1nl χρησιμοποιώντας
την ανισότητα Houmllder και την εμφύτευση H1(Ω) sub L4(Ω) έχουμε
II1nl le C
int tn
tnminus1microhL2(Ω)e1H1(Ω)r2hH1(Ω)dt
le (η4)int tn
tnminus1r2h2H1(Ω)dt+ (CCLCstα12η)
int
tnminus1e12H1(Ω)dt
Βάζοντας τα φράγματα του II1nl II2
nl στην (4261) και πολλαπλασιάζοντας με (1α12) έχουμε
minus(12α12)rn2h+2L2(Ω) + (12α12)[rn2h]2L2(Ω) + (12α12)rnminus12h+2L2(Ω)
+(η2α12)int tn
tnminus1r2h2H1(Ω)dt
le Dint tn
tnminus1
(e12H1(Ω) + (1α12)r12H1(Ω)
)dt+ (1α12)
int tn
tnminus1(e2h r2h)dt
+CC2stα
12η
int tn
tnminus1e2h2H1(Ω)dt+ CCLη
int tn
tnminus1
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt (4262)
όπου το D εξαρτάται από τα CCLCstη και το CyηΒήμα 3 Συνδυασμός των (4260)-(4262) Στα επόμενα θα διατυπώσουμε το κυρτό συνδυασμό των(4260)-(4262) πολλαπλασιάζοντας με 1 minus ρ την εξίσωση (4262) και με ρ την εξίσωση (4260)
70 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
0 lt ρ lt 1 (το ρ θα προσδιοριστεί αργότερα) και προσθέτουμε τις εξισώσεις που προκύπτουν
ρα12(en2h2L2(Ω) + [enminus1
2h ]2L2(Ω) minus enminus12h 2L2(Ω)
)+ (ρηα124)
int tn
tnminus1e2h2H1(Ω)dt
((1minus ρ)2α12)(minusrn2h+2L2(Ω) + [rn2h]2L2(Ω) + rnminus1
2h+2L2(Ω)
)
+((1minus ρ)η4α12)int tn
tnminus1r2h2H1(Ω)dt
le D(1α32)int tn
tnminus1
(r12H1(Ω) + e12H1(Ω)
)dt+ (1minus ρ)CC2
stα12η
int tn
tnminus1e2h2H1(Ω)dt
+(1minus ρ)(CCLη)int tn
tnminus1
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt
+(1minus ρ)α12int tn
tnminus1(e2h r2h)dtminus (ρα12)
int tn
tnminus1(e2h r2h)dt (4263)
Υπάρχουν δύο διαφορετικές περιπτώσεις Αν 0 lt ρ le (12) τότε ρ le (1minusρ) και μπορούμε να φράξουμε
τους τελευταίους δυο όρους με το 2(1minusρ)α12 int tntnminus1 |(e2h r2h)|dt και επομένως χρησιμοποιώντας την
ανισότητα Young να την φράξουμε με την
2(1minus ρ)α12int tn
tnminus1
(α12e2h2L2(Ω) + (1α12)r2h2L2(Ω)
)dt
Αντικαθιστώντας τη τελευταία ανισότητα στην (4263) και προσθέτοντας από 1 εως το N έχουμε
ρα12eN2h2L2(Ω) + ρα12Nsum
i=1[eiminus1
2h ]2L2(Ω) + (ρηα124)int T
0e2h2H1(Ω)dt
+(1minus ρ)2α12Nsum
i=1[ri2h]2L2(Ω) + ((1minus ρ)2α12)r0
2h+2L2(Ω) + ((1minus ρ)η4α12)int T
0r2h2H1(Ω)dt
le D(1α32)int T
0
(r12H1(Ω) + e12H1(Ω)
)dt+ (1minus ρ)CC2
stα12η
int T
0e2h2H1(Ω)dt
+(1minus ρ)CCLηint T
0
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt
+2(1minus ρ)int T
0
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt (4264)
όπου το D εξαρτάται μόνο από τη σταθερά ευστάθειας Cst η CL Παρατηρούμε πως μπορούμε ναχρησιμοποιήσουμε το Λήμμα 4223 για να αντικαταστήσουμε τα τελευταία δυο ολοκληρώματα με τουςόρους προβολής e1 r1 και το α12e2h2L2[0T H1(Ω)] Οπότε
ρα12eN2h2L2(Ω) + ρα12Nsum
i=1[eiminus1
2h ]2L2(Ω) + (ρηα124)int T
0e2h2H1(Ω)dt
+((1minus ρ)2α12)Nsum
i=1[ri2h]2L2(Ω) + ((1minus ρ)2α12)r0
2h+2L2(Ω) + ((1minus ρ)η4α12)int T
0r2h2H1(Ω)dt
le D(ρ)(1α32)int T
0
(r12H1(Ω) + e12H1(Ω)
)dt
+(1minus ρ)CC2stα
12η
int T
0e2h2H1(Ω)dt+ (1minus ρ)3Cα12
int T
0e2h2H1(Ω)dt (4265)
Εδώ η C συμβολίζει τη σταθερά του Λήμματος 4223 Οπότε επιλέγοντας ρ με σκοπό να κρύψουμε
42 Εκτιμήσεις σφαλμάτων 71
τον όρο e2hL2[0T H1(Ω)] στα αριστερά δηλ
(1minus ρ)(CC2stη + 3C)α12 = ρηα124 ρ equiv CC2
stη + 3Cη4 + CC2
stη + 3C lt 1
(τονίζουμε πως το ρ είναι ανεξάρτητο του α) καταλήγουμε στην επιθυμητή εκτίμηση Σημειώνουμεεπίσης πως έχουμε χειριστεί τη περίπτωση 0 lt ρ le 12 η οποία υποδηλώνει μια υπόθεση για τομέγεθος των δεδομένων και ειδικότερα CC2
stη + 3C lt η4 Απομένει να χειριστούμε τη περίπτωσηπου 12 lt ρ lt 1 Ενδιαφερόμαστε για το χειρισμό των δυο τελευταίων όρων της (4263) Για τοσκοπό αυτό παρατηρούμε πως
(1minus ρ)α12int tn
tnminus1(e2h r2h)dtminus (ρα12)
int tn
tnminus1(e2h r2h)dt le |(1minus 2ρ)|α12
int tn
tnminus1|(e2h r2h)|dt
Εφόσον 12 lt ρ lt 1 παίρνουμε |(1 minus 2ρ)| = (2ρ minus 1) le β(1 minus ρ) για κάποιο β gt 0 Ωστόσοπαρατηρούμε πως αν το β gt 0 είναι αρκετά μεγάλο τότε ρ asymplt 1 εφόσον ρ le (1 + β)(2 + β) asymplt 1Το υπόλοιπο της απόδειξης παραμένει το ίδιο Το ανάλογο της (4265) παίρνει τη μορφή
ρα12eN2h2L2(Ω) + ρα12Nsum
i=1[eiminus1
2h ]2L2(Ω) + (ρηα124)int T
0e2h2H1(Ω)dt
+((1minus ρ)2α12)Nsum
i=1[ri2h]2L2(Ω) + ((1minus ρ)2α12)r0
2h+2L2(Ω)
+((1minus ρ)η4α12)int T
0r2h2H1(Ω)dt
le D(ρ)(1α32)int T
0
(r12H1(Ω) + e12H1(Ω)
)dt
+(1minus ρ)CC2stα
12η
int T
0e2h2H1(Ω)dt+ β(1minus ρ)Cα12
int T
0e2h2H1(Ω)dt
Οπότε επιλέγοντας ρ (ανεξάρτητα από το α) με σκοπό να κρύψουμε τους τελευταίους δυο όρους στοδεξί μέλος δηλ για
(1minus ρ)(CC2stη + βC)α12 = ρηα124 ρ equiv CC2
stη + βCη4 + CC2
stη + βC lt 1
και έχουμε το επιθυμητό αποτέλεσμα
Σημείωση 4227 Στις περισσότερες πρακτικές καταστάσεις τέτοιες όπως μικρού χρονικού βημα-τισμού ή όχι μεγάλων δεδομένων Cst παρατηρούμε πως οι τιμές των παραμέτρων ρ ή 1 minus ρ δεν είναισυγκρίσιμες με τον όρο a12 ltlt 1 οπότε η εξάρτηση των υπολογισμών από τον α δε χειροτερεύειπεραιτέρω
Βασιζόμενοι στις εκτιμήσεις των ενεργειακών νορμών συνεχίζουμε ώστε να πάρουμε εκτιμήσεις σεαυθαίρετες χρονικές στιγμές Εφόσον μια εκτίμηση της ενεργειακής νόρμας r1L2[0T H1(Ω)] έχει ήδηυπολογιστεί στο Θεώρημα 4225 το σύστημα βελτιστοποίησης είναι αποσυζευγμένο Μια εκτίμησησε αυθαίρετα χρονικά σημεία για την προς τα εμπρός εξίσωση μπορεί να υπολογιστεί εφαρμόζοντας τητεχνική προσέγγισης των διακριτών χαρακτηριστικών του [31] στη περίπτωση με τον ημιγραμμικό όροΟπότε θα χρειαστεί η εκτίμηση ευστάθειας σε αυθαίρετα χρονικά σημεία
Θεvώρημα 4228 Θεωρούμε τις λύσεις yh microh isin Uh των (4115)-(4116) Αν επιπλέον των υπο-θέσεων των Θεωρημάτων 4218 4225 το τ ικανοποιεί την τ le Ckη τότε υπάρχει μια σταθερά Dεξαρτώμενη από τους λόγους (Cyη) (Ccη) eTCkη και τη σταθερά D του Θεωρήματος 4225 τέτοιες
72 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
ώστε
e2h2Linfin[0T L2(Ω)] le D(1α2)int T
0
(e12H1(Ω) + r12H1(Ω)
)dt
Εδώ η D είναι επίσης ανεξάρτητη των τ h α
Απόδειξη Ξεκινάμε με παραγοντική ολοκλήρωση ως προς το χρόνο στην (4255) και αντικαθιστώνταςμε vh = e2h όπου το e2h συμβολίζει τη προσέγγιση της διακριτής χαρακτηριστικής εξίσωσης χ[tnminus1t)e2h(για κάθε συγκεκριμένο -fixed- t isin [tnminus1 tn)) όπως είναι κατασκευασμένη στο Παράρτημα Α΄3 Οορισμός του e2h (βλέπε Παράρτημα Α΄3) και το γεγονός ότι e2ht isin Pkminus1[tnminus1 tnUnh ] υποδηλώνει πωςint tntnminus1(e2ht e2h)dt =
int ttnminus1(e2ht eeh)dt το οποίο δείχνει
(12)e2h(t)2L2(Ω) + (12)[enminus12h ]2L2(Ω) +
int tn
tnminus1
(a(e2h e2h) + 〈φ(y)minus φ(yh) e2h〉
)dt
= (12)enminus12h 2L2(Ω) minus
int tn
tnminus1(1α)(r1 + r2h e2h)dt
Υπενθυμίζουμε επίσης πως η ιδιότητα συνέχειας για το a( ) και η Πρόταση Αʹ31 υποδηλώνουν πως
∣∣∣int tn
tnminus1a(e2h e2h)dt
∣∣∣ le C(Ck Cc)int tn
tnminus1e2h2H1(Ω)dt
εφόσον ο όρος σύζευξης μπορεί να φραχτεί ως ακολούθως
∣∣∣ 1α
int tn
tnminus1(r1 + r2h e2h)dt
∣∣∣ le (Ckα2)int tn
tnminus1
(r2h2L2(Ω) + r12L2(Ω)
)dt+ Ck
int tn
tnminus1e2h2L2(Ω)dt
Εδώ έχουμε χρησιμοποιήσει την ανισότητα Young για κατάλληλο δ gt 0 και τη Πρόταση Αʹ31 Γιατον ημιγραμμικό όρο υπενθυμίζουμε πως η συνθήκη αύξουσας μονοτονίας και η ανισότητα Houmllder ηεμφύτευση H1(Ω) sub L4(Ω) υποδηλώνει
int tn
tnminus1〈φ(y)minus φ(yh) e2h〉dt le CL
int tn
tnminus1y minus yhH1(Ω)e2hH1(Ω)dt
Χρησιμοποιώντας την ανισότητα Young τελικά καταλήγουμε στην
int tn
tnminus1〈φ(y)minus φ(yh) e2h〉dt le Ck(Cy + CL)
int tn
tnminus1
(e12H1(Ω) + e2h2H1(Ω)
)dt
όπου η Cy εξαρτάται μόνο από το yLinfin[0T L2(Ω)] Επομένως αντικαθιστώντας τους παραπάνω υ-πολογισμούς στην (4266) παίρνουμε μια ανισότητα της μορφής (1 minus Cτn)an le anminus1 + fn όπουan = supsisin(tnminus1tn] e2h(s)2L2(Ω) Πράγματι έστω t isin (tnminus1 tn] επιλεγμένο ως an equiv e2h(t)2L2(Ω) και
παρατηρώντας πως Ckint tntnminus1 e2h2L2(Ω)dt le Ckτna
n για τn ικανοποιώντας τnCk lt 14 η επιθυμητήεκτίμηση ακολουθεί από το διακριτό Λήμμα Groumlnwall χρησιμοποιημένο στα προηγούμενα φράγματα τουΛήμματος 4223 των Θεωρημάτων 4218 4225 και υπολογισμούς
Ακολουθούν εκτιμήσεις για τη συζυγή μεταβλητή micro χρησιμοποιώντας παρόμοιες τεχνικές καθώς καιτους προηγούμενους υπολογισμούς για τη βασική μεταβλητή Παρακάτω διατυπώνουμε τη σχετικήεκτίμηση
Θεvώρημα 4229 ΄Εστω yh microh isin Uh οι λύσεις του (4115)-(4116) Υποθέτουμε πως πληρούνται οιυποθέσεις των Θεωρημάτων 4225-4228 Τότε υπάρχει μια σταθερά D gt 0 (παρόμοια του Θεωρήματος
42 Εκτιμήσεις σφαλμάτων 73
4228) τέτοια ώστε
r2h2Linfin[0T L2(Ω)] le Dint T
0
(e12H1(Ω) + r12H1(Ω)
)dt
Διάφορες εκτιμήσεις μπορούν να προκύψουν χρησιμοποιώντας τα αποτελέσματα από τη προηγούμενηενότητα και κλασικά αποτελέσματα από τη θεωρία προσεγγίσεων Ξεκινάμε παραθέτοντας τις συμμετρι-κές εκτιμήσεις σφαλμάτων
Θεvώρημα 4230 Υποθέτουμε πως πληρούνται οι υποθέσεις 311-415-4215 ΄Εστω yh microh isin Uhοι προσεγγιστικές λύσεις του συστήματος βελτιστοποίησης (4115)-(4116) υπολογισμένες χρησιμο-ποιώντας το σχήμα της ασυνεχούς μεθόδου Galerkin Υποθέτουμε πως τα τ = maxi=1n τn hικανοποιούν τις συνθήκες των Λημμάτων 417 4118 και του Θεωρήματος 4228 Τότε ισχύει ηακόλουθη εκτίμηση
e2X + (1α)r2X le C(1α2)(e02L2(Ω) + ep2X + rp2X
)
+Nminus1sum
i=02 min
((I minus Pi)y(ti)2L2(Ω) (1τ i+1η)Pi+1(I minus Pi)y(ti)2Hminus1(Ω)
)
+Nsum
i=12 min
((I minus Pi+1)micro(ti)2L2(Ω) (1τ iη)Pi(I minus Pi+1)micro(ti)2Hminus1(Ω)
)
όπου η σταθερά C εξαρτάται από τις σταθερές ευστάθειας των Λημμάτων 417 4118 και τις σταθερέςC D D του Λήμματος 4223 και των Θεωρημάτων 4225 4228 αντιστοίχως αλλά είναι ανεξάρτητοτων τ h α Επιπλέον υποθέτουμε πως χρησιμοποιούνται οι ίδιοι υπόχωροι δηλαδή Unh = Uh Οπότε
e2X + (1α)r2X le C(1α2)(e02L2(Ω) + ep2X + rp2X
)
Απόδειξη Ο πρώτος υπολογισμός προκύπτει χρησιμοποιώντας τη τριγωνική ανισότητα και τις προηγού-μενες εκτιμήσεις των Θεωρημάτων 4218-4225 Ο δεύτερος υπολογισμός προκύπτει από τη Σημείωση4219
Χρησιμοποιώντας τώρα κλασικά αποτελέσματα της θεωρίας προσεγγίσεων παράγουμε τις τάξεις σύγ-κλισης Παρακάτω παρουσιάζουμε τις τάξεις σύγκλισης σε δυο ξεχωριστές περιπτώσεις ανάλογα μετη διαθέσιμη ομαλότητα
Πρόταση 4231 Θεωρούμε πως πληρούνται οι υποθέσεις των Θεωρημάτων 4218-4225 Υπο-θέτουμε επίσης πως τα y micro ικανοποιούν
(y micro) isin Linfin[0 T H l+1 capH10 (Ω)] (y(k+1) micro(k+1)) isin Linfin[0 T H1(Ω)]
Θεωρούμε πως τμηματικά πολυώνυμα βαθμού l χρησιμοποιούνται για να κατασκευάσουμε τους χώρουςUnh sub H1(Ω) σε κάθε χρονικό βήμα όπου το h συμβολίζει την παράμετρο χρονικής διακριτοποίησηςΤότε ισχύει η ακόλουθη εκτίμηση
e2X + (1α)r2X le C(1α2)(h2l + τ2(k+1) + h2l minh4(τ2η) h2τ
)
Εδώ η σταθερά C είναι η σταθερά του Θεωρήματος 4230 Στην περίπτωση που Unh = Uh τότεαιτιολογείται η ακόλουθη εκτίμηση
e2X + (1α)r2X le C(1α2)(h2l + τ2(k+1)
)
74 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
Απόδειξη Απομένει να εκτιμήσουμε τα ep rp Χρησιμοποιώντας το [33 Συμπέρασμα 48] και τιςσυνηθισμένες ιδιότητες προσεγγισιμότητας του Pn έχουμε
y minus P locn yL2[tnminus1tnH1(Ω)] le C(y minus PnyL2[tnminus1tnH1(Ω)] + τk+1Pny(k+1)L2[tnminus1tnH1(Ω)]
)
le C(hlyL2[tnminus1tnHl+1(Ω)] + τk+1y(k+1)L2[tnminus1tnH1(Ω)]
)
Οπότε y minus P loch yL2[0T H1(Ω)] le C(hlyL2[0T Hl+1(Ω)] + τk+1y(k+1)L2[0T H1(Ω)]
)
Εργαζόμενοι παρόμοια έχουμε
y minus P loch yLinfin[0T L2(Ω)] le C(hl+1yLinfin[0T Hl+1(Ω)] + τk+1y(k+1)Linfin[0T H1(Ω)]
)
Παρόμοια αποτελέσματα επίσης ισχύουν για το rp Παραμένει να φράξουμε τους όρους σφάλματοςλόγω της αλλαγής υποχώρων Γιrsquo αυτό το σκοπό είναι εύκολο να δούμε πως
Nminus1sum
i=02 min
((I minus Pi)y(ti)2L2(Ω) (1τ i+1η)Pi+1(I minus Pi)y(ti)2Hminus1(Ω)
)
le Cy2C[0T Hl+1(Ω)] minh2l+4
τ2ηh2+2l
τ
ενώ μια παρόμοια εκτίμηση ισχύει για τους όρους τους σχετικούς με τη συζυγή μεταβλητή
Το τελευταίο μας αποτέλεσμα αφορά εκτιμήσεις σφαλμάτων κάτω από πιο αυστηρές υποθέσεις ομαλότη-τας και πιο συγκεκριμένα στην χρονική παράγωγο
Πρόταση 4232 ΄Εστω πως πληρούνται οι υποθέσεις των Θεωρημάτων 4218-4225 Υποθέτουμεεπίσης πως τα y micro ικανοποιούν
(y micro) isin Linfin[0 T H l+1 capH10 (Ω)] (y(k+1) micro(k+1)) isin Linfin[0 T L2(Ω)]
και έστω πως χρησιμοποιούνται οι ίδιοι υπόχωροι σε κάθε χρονικό βηματισμό Unh = Uh και χρησιμο-ποιούνται τμηματικά πολυώνυμα βαθμού l για να κατασκευάσουμε τον υπόχωρο Uh sub H1(Ω) όπου τοh συμβολίζει τη παράμετρο της χρονικής διακριτοποίησης Υποθέτουμε πως ισχύουν οι υποθέσεις τουΘεωρήματος 4230 Τότε έχουμε
e2X + (1α)r2X le C(1α2)(h2l + (τ2k+2h2)
)
όπου η C συμβολίζει τη σταθερά του Θεωρήματος 4230
Απόδειξη Εργαζόμενοι παρόμοια με το προηγούμενο Θεώρημα και μια αντίστροφη εκτίμηση οδηγούμα-στε στο
y minus P locn y2L2[tnminus1tnH1(Ω)] le Cy minus Pny2L2[tnminus1tnH1(Ω)] + Ckτ2(k+1)Pny(k+1)2L2[tnminus1tnH1(Ω)]
le C(y minus Pny2L2[tnminus1tnH1(Ω)] + τ2(k+1)h2Pny(k+1)2L2[tnminus1tnL2(Ω)]
)
Το σφάλμα προσέγγισης στον Linfin[tnminus1 tnL2(Ω)] μπορεί να αντιμετωπιστεί με τον ίδιο τρόπο Ησυζυγής μεταβλητή μπορεί επίσης να αντιμετωπιστεί με τον ίδιο τρόπο Οπότε χρησιμοποιώντας τηνευστάθεια για την ορθογώνια προβολή έχουμε τον επιθυμητό υπολογισμό
Σημείωση 4233 Είναι φανερό από τις αποδείξεις των Προτάσεων 4231 και 4232 πως οι υπο-θέσεις βελτιωμένης ομαλότητας για τα (y micro) χρειάζονται μόνο για να υπολογίσουμε (βέλτιστες) τάξειςσύγκλισης ως προς το Linfin[0T L2(Ω)] κομμάτι της X νόρμας Αντίθετα αν επιλέξουμε τους ίδιουςυπόχωρους σε κάθε χρονικό βήμα Unh = Uh τότε δεν υπάρχει συνεισφορά από τους όρους ασυνέχειας(jump terms) και οπότε μπορούμε να συνδυάσουμε τα αποτελέσματα της Σημείωσης 4219 και του Θε-ωρήματος 4225 για να συνδέσουμε τα σφάλματα eL2[0T H1(Ω)] και rL2[0T H1(Ω)] με τα σφάλματα
42 Εκτιμήσεις σφαλμάτων 75
προβολών y minus P loch y και microminus P loch micro στις ίδιες νόρμες Ως συνέπεια οι τάξεις σύγκλισης της Πρότασης4232 ως προς τις L2[0T H1(Ω)] νόρμες απαιτούν μόνο (y micro) isin L2[0 T H l+1(Ω)]capHk+1[0 T L2(Ω)]ομαλότητα
Σημείωση 4234 Εξαιτίας της απουσίας περιορισμών για τον έλεγχο μια εκτίμηση για τους ε-λέγχους g minus gh προκύπτει απευθείας από τους υπολογισμούς για την συζυγή μεταβλητή micro minus microhXχρησιμοποιώντας τη συνθήκη βελτιστοποίησης Ωστόσο όπως είναι φανερό και στα αντίστοιχα αριθμη-τικά αποτελέσματα αναμένεται για τον έλεγχο μια βελτιωμένη τάξη σύγκλισης στην L2[0 T L2(Ω)]νόρμα
423 Πρόβλημα κατανεμημένου ελέγχου Stokes
΄Ομοια επεκτείνουμε τη μελέτη μας σε προβλήματα Stokes και εργαζόμαστε στους αντίστοιχους χώρουςπου έχουν προαναφερθεί Ορίζουμε ένα βοηθητικό σύστημα που παίζει το ρόλο μιας γενικευμένηςdG προβολής Θα δουλεύουμε με τις ασθενείς μορφές που υποστηρίζουν την ύπαρξη πίεσης p isinL2[0 T L2
0(Ω)] (και οπότε της yt isin L2[0 T Hminus1(Ω)]) Οπότε η συνέχεια του συστήματος βελτιστο-ποίησης αποτελείται από τις εξισώσεις (3320)-(3321) και (3318) ή (3319) και το διακριτό σύστημαβελτιστοποίησης (4122)-(4123) και (4120) ή (4121)
4231 Η πλήρως διακριτή προβολή
Δοσμένων δεδομένων f y0 και των αρχικών συνθηκών w0h = y0
h όπου y0h equiv Phy0 είναι οι αρχικές
προσεγγίσεις των y0 zN+ = 0 αναζητούμε (wh p1h)(zh φ1h) isin Uh timesQh τέτοια ώστε για n = 1 Nκαι για όλα τα vh isin Pk[tnminus1 tn Yh] qh isin Pk[tnminus1 tnQh]
(wnh vnh)minusint tn
tnminus1
(〈wh vht〉 minus a(wh vh)minus b(vh p1h)
)dt = (wnminus1
h vnminus1h+ ) +
int tn
tnminus1
(〈f vh〉+ (g vh
)dt
int tn
tnminus1b(wh qh)dt = 0
(4266)
minus(znh+ vnh) +
int tn
tnminus1
(〈zh vht〉+ a(zh vh) + b(vh φ1h)
)dt = minus(znminus1
h+ vnminus1h+ ) +
int tn
tnminus1(wh minus yd vh)dt
int tn
tnminus1b(zh qh)dt = 0
(4267)Οι λύσεις wh zh isin Uh υπάρχουν για οποιαδήποτε δοσμένα δεδομένα f isin L2[0 T V(Ω)lowast] y0 isinW(Ω)και yd isin L2[0 T L2(Ω)] Στην ουσία οι υπολογισμοί ευστάθειας δείχνουν πως wh zh isin WS(0 T ) καιεπιπλέον εξαιτίας της βελτιωμένης ομαλότητας του wh minus yd έχουμε zh isin Linfin[0 T H1(Ω)]
Οι λύσεις του βοηθητικού συστήματος βελτιστοποίησης παίζουν το ρόλο lsquolsquoγενικευμένης προβολήςrsquorsquo στονUh Η βασική εκτίμηση για την ενεργειακή νόρμα του yminuswh microminus zh θα προκύψει σε όρους τοπικής L2
προβολής στο βοηθητικό σύστημα Παρόμοια με τα προηγούμενα προβλήματα χρειάζεται η ακόλουθηπροβολή η σχετική με την ασυνεχή χρονικού βηματισμού μέθοδο για τις εξισώσεις Navier-Stokes (βλέπεπχ [32 Ορισμούς 41 42])
Ορισμός 4235 (1) Η προβολή P locn C[tnminus1 tn L2(Ω)] rarr Pk[tnminus1 tn Uh] ικανοποιεί την(P locn v)n = Phv(tn) και
int tn
tnminus1(v minus P locn v vh) = 0 forall vh isin Pkminus1[tnminus1 tn Uh] (4268)
76 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
΄Εχουμε χρησιμοποιήσει το συμβολισμό (P locn v)n equiv (P locn v)(tn) και Ph L2(Ω)rarr Uh είναι ο τελεστήςορθογώνιας προβολής πάνω στον διακριτό μοναδικής απόκλισης υπόχωρο Uh(2) Η προβολή P loch C[0 T L2(Ω)]rarr Uh ικανοποιεί την
P loch v isin Uh και (P loch v)|(tnminus1tn] = P locn (v|[tnminus1tn])
Επίσης εξαιτίας της έλλειψης ομαλότητας και της σύζευξης μεταξύ της χρονικής παραγώγου και τηςπίεσης θα χρειαστούμε την ακόλουθη γενικευμένη dG προβολή η οποία θα μπορεί να εφαρμοστεί ότανp isin L2[0 T L2
0(Ω)] yt isin L2[0 T Hminus1(Ω)] Ειδικότερα κατασκευάζουμε μια χωροχρονική γενικευμένηL2 μηδενικής απόκλισης προβολή (βλέπε επίσης [30]) που συνδυάζει την κλασική χρονικού βηματισμούdG προβολή και τη γενικευμένη L2 προβολή Qh Hminus1(Ω) rarr Uh Για ιδιότητες της Qh βλέπε γιαπαράδειγμα [69 ενότητα 2] Θυμίζουμε πως ο ορισμός του Qh δείχνει πως 〈v minusQhv vh〉 = 0 για όλατα v isin Hminus1(Ω) και τα vh isin Uh Η προβολή είναι καλώς ορισμένη στον Hminus1(Ω) και ταυτίζεται με τηνPh για v isin L2(Ω)
Ορισμός 4236 (1) Η προβολή Qlocn C[tnminus1 tn Hminus1(Ω)] rarr Pk[tnminus1 tn Uh] ικανοποιεί την(Qlocn v)n = Qhv(tn) και
int tn
tnminus1〈v minusQlocn v vh〉 = 0 forall vh isin Pkminus1[tnminus1 tn Uh]
Εδώ θα χρησιμοποιήσουμε το συμβολισμό (Qlocn v)n equiv (Qlocn v)(tn) και Qh Hminus1(Ω) rarr Uh είναι οτελεστής της γενικευμένης ορθογώνιας προβολής στον Uh(2) Η προβολή Qloch C[0 T Hminus1(Ω)]rarr Uh ικανοποιεί την
Qloch v isin Uh και (Qloch v)|(tnminus1tn] = Qlocn (v|[tnminus1tn])
Για k = 0 η προβολή Qloch C[0 T Hminus1(Ω)] rarr Uh ανάγεται στην Qloch v(t) = Qhv(tn) για όλα ταt isin (tnminus1 tn] n = 1 N
Παρόμοια με το Robin πρόβλημα εξ ορισμού η Qloch ταυτίζεται με την P loch όταν v isin L2[0 T L2(Ω)]δηλαδή P loch v = Qloch v όταν v isin L2[0 T L2(Ω)] και όποτε παρουσιάζει καλύτερες ιδιότητες προ-σεγγισιμότητας Ωστόσο δίνουμε έμφαση ότι είναι εφαρμόσιμη για v equiv yt isin L2[0 T Hminus1(Ω)]Για το οπισθόδρομο στο χρόνο πρόβλημα μια παραλλαγή των παραπάνω προβολών (επίσης συμβο-λιζόμενων με P locn Qlocn αντιστοίχως) ορίζεται με παρόμοιο τρόπο Για παράδειγμα επιπλέον τηςσχέσης (4268) χρειαζόμαστε να επιβάλλουμε τη lsquolsquoσυνθήκη ταιριάσματοςrsquorsquo στα αριστερά δηλαδή(P locn v)nminus1
+ = Phv(tnminus1+ ) αντί της επιβολής της συνθήκης στα δεξιά
Στο επόμενο Λήμμα συλλέγουμε κάποια αποτελέσματα όσο αφορά τις (βέλτιστες) τάξεις σύγκλισηςγια τη παραπάνω προβολή Εδώ η έμφαση δίνεται στις ιδιότητες προσεγγισιμότητας για τη γενικευμένηπροβολή Qloch υπό ελάχιστες υποθέσεις ομαλότητας δηλαδή για v isin L2[0 T V(Ω)]capH1[0 T Hminus1(Ω)]για το χαμηλότερης τάξης σχήμα
Λήμμα 4237 ΄Εστω Uh sub H1(Ω) και P loch Qloch ορισμένο στους Ορισμούς 4235 και 4236αντιστοίχως Τότε για όλα τα v isin L2[0 T Hl+1(Ω)capV(Ω)]capHk+1[0 T L2(Ω)] υπάρχει μια σταθεράC ανεξάρτητη των h τ τέτοιο ώστε
v minus P loch vL2[0T L2(Ω)] le C(hl+1vL2[0T Hl+1(Ω)] + τk+1v(k+1)L2[0T L2(Ω)]
)
v minus P loch vL2[0T H1(Ω)] le C(hlvL2[0T Hl+1(Ω)] + τk+1hv(k+1)L2[0T L2(Ω)]
)
΄Εστω k = 0 l ge 1 και v isin L2[0 T H2(Ω) cap V (Ω)] capH1[0 T L2(Ω)] Τότε υπάρχει μια σταθερά cανεξάρτητη των h τ τέτοιο ώστε
v minus P loch vL2[0T H1(Ω)] le C(hvL2[0T H2(Ω)] + τ12(vtL2[0T L2(Ω)] + vL2[0T H2(Ω)])
)
42 Εκτιμήσεις σφαλμάτων 77
΄Εστω k = 0 l ge 1 και v isin L2[0 T V(Ω)] cap H1[0 T Hminus1(Ω)] Τότε υπάρχει μια σταθερά C gt 0ανεξάρτητη των h τ τέτοια ώστε
v minusQloch vL2[0T L2(Ω)] le C(hvL2[0T H1(Ω)] + τ12vtL2[0T Hminus1(Ω)]
)
v minusQloch vL2[0T H1(Ω)] le C(vL2[0T H1(Ω)] + (τ12h)(vtL2[0T Hminus1(Ω)] + vL2[0T H1(Ω)])
)
Απόδειξη Βλέπε Παράρτημα Α΄1
Σημείωση 4238 Ο υπολογισμός ευστάθειας στον L2[0 T H1Ω)] απαιτεί το περιορισμό για τοχρονικό βήμα τ le Ch2 εξαιτίας της έλλειψης ομαλότητας ως προς το χρόνο Για τον δεύτερο υπολογισμότονίζουμε πως αν είναι διαθέσιμη περισσότερη ομαλότητα δεν χρειάζεται να χρησιμοποιήσουμε τηναντίστροφη εκτίμηση Ειδικότερα το v(k+1) isin L2[0 T H1(Ω)] οπότε έχουμε τη βελτιωμένη τάξησύγκλισης O(hl + τk+1) στην L2[0T H1(Ω)] νόρμα Ωστόσο παρατηρούμε πως για τα χαμηλότερηςτάξης σχήματα k = l le 1 η αυξημένη ομαλότητα vt isin L2[0 T H1(Ω)] δεν είναι διαθέσιμη τουλάχιστονμε τη παρουσία περιορισμών για τον έλεγχο Οπότε δίνουμε έμφαση στο ότι η έλλειψη ομαλότηταςαποτελεί εμπόδιο για την ανάπτυξη σχημάτων υψηλότερης τάξης Λειτουργώντας παρόμοια παίρνουμεεπίσης τις εκτιμήσεις σε αυθαίρετα σημεία όπως στο [32] Τελικώς είναι σημαντικό να πούμε πωςισχύουν οι προσεγγιστικές ιδιότητες της Qloch στον L2[0T Hminus1(Ω)] νόρμας (βλέπε πχ [69 Πρόταση212]) μόνο στον υπόχωρο μηδενικής απόκλισης Vminus1 equiv v isin Hminus1(Ω) divv = 0 εφοδιασμένο με τηνόρμα Vminus1 = Hminus1 Στη συνέχεια έχουμε τη προϋπόθεση μηδενικής απόκλισης
〈vnablaφ〉 = 0 forallφ στο H20 (Ω) equiv φ isin H2(Ω) capH1
0 (Ω) (nablaφ)|Γ = 0
όπου 〈 〉 equiv 〈 〉Hminus1H10 Παραπέμπουμε τον αναγνώστη στην [69 Ενότητα 23] για μια λεπτομερή
ανάλυση της αντίστοιχης προβολής και των ιδιοτήτων της Σημειώνουμε ωστόσο πως στην επακόλουθηανάλυση η χρήση της L2[0T Hminus1(Ω)] εκτίμησης προβολής δεν είναι απαραίτητη
Το επόμενο αποτέλεσμα δηλώνει πως το σφάλμα σχετικό με τη βοηθητική προβολή είναι τόσο καλόόσο το επιτρέπει το τοπικό dG σφάλμα προβολών και οπότε είναι βέλτιστο ως προς την έννοια τηςδιαθέσιμης ομαλότητας
Θεvώρημα 4239 ΄Εστω f isin L2[0 T Hminus1(Ω)] και y0 isin W(Ω) είναι δοσμένα και (y p) (micro φ) isinWS(0 T ) times L2[0 T L2
0(Ω)] είναι οι λύσεις των (3320)-(3321)-(3319) ή (3320) και wh zh isin Uhείναι οι λύσεις των (4266)-(4267) Συμβολίζουμε με e = yminuswh r = microminuszh και έστω ep equiv yminusQloch yrp = microminusP loch micro όπου τα P loch Qloch είναι ορισμένα στους Ορισμούς 4235 και 4236 Τότε υπάρχει μιααλγεβρική σταθερά C gt 0 που εξαρτάται μόνο από τα Ω τέτοια ώστε για κάθε qh isin L2[0 T L2
0(Ω)]
1) e2W (0T ) +Nminus1sum
i=0[ei]2L2(Ω) le C
(e02L2(Ω) + (1ν)
(ep2W (0T ) + pminus qh2L2[0T L2(Ω)]
))
2) r2W (0T ) +Nsum
i=1[ri]2L2(Ω) le C(1ν)
(e2L2[0T L2(Ω)]+rp2W (0T ) + φminus qh2L2[0T L2(Ω)]
)
3) eL2[0T L2(Ω)] le C(1ν)(νepL2[0T L2(Ω)] + τ12(epL2[0T H1(Ω)] + pminus qhL2[0T L2(Ω))
)
4) rL2[0T L2(Ω)] le C(νeL2[0T L2(Ω)] + rpL2[0T L2(Ω)]
+τ12(rpL2[0T H1(Ω)] + φminus qhL2[0T L20(Ω)])
)
Εδώ w0h = y0
h όπου y0h συμβολίζει τη προσέγγιση του y0 και C είναι μια σταθερά που εξαρτάται από
το χωρίο Ω
Απόδειξη Εκτιμήσεις (1)-(2) Στη συνέχεια συμβολίζουμε με e = yminuswh r = microminuszh και διαχωρίζουμετα e r σε e equiv e1h + ep equiv (Qloch yminuswh) + (yminusQloch y) r equiv r1h + rp equiv (P loch microminus zh) + (microminusP loch micro) όπουP loch Qloch ορίζονται στους Ορισμούς 4235 και 4236 Αφαιρώντας την (4266) από την (3320) και
78 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
την (4267) από την (3321) παίρνουμε τη συνθήκη ορθογωνιότητας Για n = 1 N και για όλα ταvh isin Pk[tnminus1 tn Yh] qh isin Pk[tnminus1 tnQh]
(en vnh) +int tn
tnminus1
(minus 〈e vht〉+ a(e vh) + b(vh pminus p1h)
)dt = (enminus1 vnminus1
h+ )int tn
tnminus1b(y minus wh qh)dt = 0
(4269)
minus(rn+ vnh) +int tn
tnminus1
(〈r vht〉+ a(r vh) + b(vh φminus φ1h)
)dt = minus(rnminus1
+ vnminus1h+ ) +
int tn
tnminus1(e vh)dt
int tn
tnminus1b(microminus zh qh)dt = 0
(4270)Παρατηρούμε πως η συνθήκη ορθογωνιότητας (4269) είναι αποσυζευγμένη και ταυτίζεται με την συν-θήκη ορθογωνιότητας [32 Εξίσωση (44)] Οπότε εφαρμόζοντας τα σχετικά θεωρήματα του [32 Θεω-ρήματα 46 και 47] παίρνουμε τη πρώτη εκτίμηση Για τη δεύτερη εκτίμηση παρατηρούμε πως η συνθήκηορθογωνιότητας (4270) είναι ισοδύναμη με Για n = 1 N και για όλα τα vh isin Pk[tnminus1 tn Yh]qh isin Pk[tnminus1 tnQh]
minus(rn1h+ vnh) +
int tn
tnminus1
(〈r1h vht〉+ a(r1h vh) + b(vh φminus φ1h)
)dt
= minus(rnminus11h+ v
nminus1h+ ) +
int tn
tnminus1
((e vh)minus a(rp vh)
)dt
int tn
tnminus1b(microminus zh qh)dt = 0
(4271)
Εδώ έχουμε χρησιμοποιήσει τον Ορισμό 4235 της προβολής P loch που δείχνει πωςint tntnminus1〈rp vht〉dt =
0 και (rnp+ vn) = 0 Θέτοντας vh = r1h isin Uh στην (4271) χρησιμοποιώντας το περιορισμό μη
συμπιεστότηταςint tntnminus1 b(r1h φminus φ1h) =
int tntnminus1 b(r1h φminus qh) έχουμε
minus(12)rn1h+2L2(Ω) + (12)[rn1h]2L2(Ω) + (12)rnminus11h+2L2(Ω) + (ν4)
int tn
tnminus1r1h2H1(Ω)dt
le Cint tn
tnminus1
((1ν)e2L2(Ω) + (1ν)rp2H1(Ω) + φminus qh2L2(Ω)
)dt (4272)
Προσθέτοντας τις ανισότητες (4272) και χρησιμοποιώντας τη τριγωνική ανισότητα παίρνουμε την ε-κτίμηση για τα σημεία διαμέρισης και στον L2[0 T H1(Ω)] Αφού έχει αποδειχθεί η εκτίμηση για τοrL2[0T H1(Ω)] η εκτίμηση στον Linfin[0 T L2(Ω)] προκύπτει χρησιμοποιώντας τα επιχειρήματα του Θε-ωρήματος [32 Θεώρημα 47] τροποποιημένο ώστε να χειριστούμε την οπισθόδρομη χρονικά εξίσωσηStokesΕκτιμήσεις (3) και (4) Στρέφουμε τη προσοχή μας στις τελευταίες δυο εκτιμήσεις Με στόχο νααποδείξουμε μια βελτιωμένη τάξη σύγκλισης για τη νόρμα L2[0 T L2(Ω)] κατασκευάζουμε ένα δυϊκόεπιχείρημα ώστε να πάρουμε ένα καλύτερο φράγμα για τη ποσότητα e1h2L2[0T L2(Ω)] Γιαυτό το σκοπόγενικεύουμε το δυϊκό επιχείρημα της απόδειξης της [14 Ενότητα 3] ή του [30 Λήμμα 43] με στόχο ναχειριστούμε σχήματα αυθαίρετης τάξης και τον διακριτό περιορισμό μη συμπιεστότητας Ορίζουμε έναοπισθόδρομο χρονικά εξελικτικό πρόβλημα με δεξί μέλος e1h isin L2[0 T L2(Ω)] και μηδενικά τελικάδεδομένα δηλ για n = 1 N και για όλα τα v isin L2[0 T H1(Ω)] cap H1[0 T Hminus1(Ω)] αναζητούμε(z ψ) isinW (0 T )times L2[0 T L2
0(Ω)] τέτοια ώστε
int T
0
(〈z vt〉+ a(v z) + b(v ψ)
)dt+ (φ(tnminus1) v(tnminus1)) =
int T
0(e1h v)dt
int T
0b(z q)dt = 0 forall q isin L2[0 T L2
0(Ω)](4273)
42 Εκτιμήσεις σφαλμάτων 79
Σημειώνουμε πως εφόσον e1h isin Linfin[0 T W(Ω)] τότε η Σημείωση 328 υποδηλώνει πως ισχύει ηακόλουθη εκτίμηση
zL2[0T H2(Ω)] + ztL2[0T L2(Ω)] + ψL2[0T H1(Ω)] le Ce1hL2[0T L2(Ω)] (4274)
Η έλλειψη ομαλότητας του δεξιού μέλους της (4273) εξαιτίας της παρουσίας ασυνεχειών δείχνει πως δεμπορούμε να βελτιώσουμε την ομαλότητα του z στον [0 T ] Το σχετικό ασυνεχές χρονικού βηματισμούσχήμα μπορεί να οριστεί ως ακολούθως δοσμένων τελικών δεδομένων zNh+ = 0 αναζητούμε (zh ψh) isinUh timesQh τέτοιο ώστε για όλα τα vh isin Pk[tnminus1 tn Yh] qh isin Pk[tnminus1 tnQh]
minus(znh+ vnh) +
int tn
tnminus1
((zh vht) + a(zh vh) + b(ψh vh)
)dt+ (znminus1
h+ vnminus1h+ ) =
int tn
tnminus1(e1h vh)dt
int tn
tnminus1b(zh qh)dt = 0
(4275)Επομένως χρησιμοποιώντας το Λήμμα 4123 έχουμε zhLinfin[0T H1(Ω)] le Cke1hL2[0T L2(Ω)] Τώραείναι ξεκάθαρο ότι έχουμε την ακόλουθη εκτίμηση για το z minus zh το οποίο είναι άμεση εφαρμογή τωνπροηγούμενων εκτιμήσεων στον L2[0 T H1(Ω)] των προσεγγιστικών ιδιοτήτων του Λήμματος 4237και των προβολών P loch Qloch (βλέπε πχ το [32 Θεώρημα 46])
νz minus zhL2[0T H1(Ω)] le C(h+ τ12
) (zL2[0T H2(Ω)] + ztL2[0T L2(Ω)] + ψL2[0T H1(Ω)]
)
le C(h+ τ12)e1hL2[0T L2(Ω)] (4276)
Παρατηρούμε πως η έλλειψη ομαλότητας στο δεξί μέλος περιορίζει την τάξη σύγκλισης σε αυτή που δίνε-ται από το χαμηλότερης τάξης σχήμα l ge 1 k = 0 ακόμη κι εάν επιλεχθούν υψηλότερης τάξης σχήματα
(χρονικά) Θέτοντας vh = e1h στην (4275) και χρησιμοποιώντας το γεγονός πωςint tntnminus1 b(e1h ψh)dt =
0 έχουμε
minus(znh+ en1h) +
int tn
tnminus1(zh e1ht) + a(e1h zh)dt+ (znminus1
h+ enminus11h+) =
int tn
tnminus1e1h2L2(Ω)dt
Εφαρμόζοντας παραγοντική ολοκλήρωση ως προς το χρόνο παίρνουμε
minus(znh+ en1h) + (znh en1h) +
int tn
tnminus1
(minus (zht e1h) + a(zh e1h)
)dt =
int tn
tnminus1e1h2L2(Ω)dt (4277)
Θέτοντας vh = zh στην (4269) και χρησιμοποιώντας το e = ep + e1h ο ορισμός της προβολής Qlochτου Ορισμού 4236 και το γεγονός πως
int tntnminus1 b(zh pminus p1h)dt =
int tntnminus1 b(zh pminus qh)dt μας δίνει
(en1h znh ) +int tn
tnminus1
(minus (e1h zht) + a(e1h zh)
)dtminus (enminus1
1h znminus1h+ ) = minus
int tn
tnminus1
(a(ep zh) + b(zh pminus qh))dt
(4278)
Εδώ έχουμε επίσης χρησιμοποιήσει το γεγονός πως ο ορισμός της προβολής Qloch του Ορισμού 4236
δείχνει πως (enp znh ) = 0int tntnminus1(ep vht)dt = 0 και (enminus1
p znminus1h+ ) = 0 Χρησιμοποιώντας την (4277) για
να αντικαθιστήσουμε τους τρεις πρώτους όρους της (4278) καταλήγουμε στην
(znh+ en1h)minus (enminus1
1h znminus1h+ ) +
int tn
tnminus1e1h2L2(Ω)dt = minus
int tn
tnminus1
(a(ep zh) + b(zh pminus qh))dt
= minusint tn
tnminus1
(a(ep zh minus z) + a(ep z) + b(zh minus z pminus qh)
)dt
= minusint tn
tnminus1
(a(ep zh minus z) + ν(ep∆z) + b(zh minus z pminus qh)
)dt
80 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
όπου στις δυο τελευταίες ισότητες έχουμε χρησιμοποιήσει παραγοντική ολοκλήρωση (στο χώρο) και ο
περιορισμός μη συμπιεστότητας μας δείχνει πωςint tntnminus1 b(z pminus qh)dt = 0 Επομένως
int tn
tnminus1e1h2L2(Ω)dt+ (znh+ e
n1h)minus (enminus1
1h znminus1h+ ) le
int tn
tnminus1ν(zh minus zH1(Ω)epH1(Ω)dt
+int tn
tnminus1
(epL2(Ω)∆zL2(Ω) + z minus zhH1(Ω)pminus qhL2(Ω)
)dt
Οπότε προσθέτοντας τις παραπάνω ανισότητες και χρησιμοποιώντας το ότι φN+ equiv 0 και e01hminus = 0 (εξ
ορισμού) και αναδιατάσσοντας τους όρους παίρνουμε
(12)e1h2L2[0T L2(Ω)] le C(νepL2[0T L2(Ω)]zL2[0T H2(Ω)]
+νzh minus zL2[0T H1(Ω)](epL2[0T H1(Ω)] + (1ν)pminus qhL2[0T L2(Ω)]
)
le C(νepL2[0T L2(Ω)]e1hL2[0T L2(Ω)]
+(1ν)(h+ τ12)e1hL2[0T L2(Ω)](epL2[0T H1(Ω)] + (1ν)pminus qhL2[0T L2(Ω)]
))
Εδώ έχουμε χρησιμοποιήσει την ανισότητα Cauchy-Schwarz τα φράγματα ευστάθειας της δυϊκής ε-ξίσωσης (4274) και τις εκτιμήσεις σφαλμάτων (4276) για το zh minus z Τελικώς η εκτίμηση για τοrL2[0T L2(Ω)] προκύπτει χρησιμοποιώντας ένα παρόμοιο δυϊκό επιχείρημα
Σημείωση 4240 Ο συνδυασμός των τελευταίων δυο Θεωρημάτων δείχνει τη lsquolsquoσυμμετρική μηδενι-κής απόκλισηςrsquorsquo κατασκευή της εκτίμησης Ειδικότερα υποθέτουμε πως τα αρχικά δεδομένα y0 isinW(Ω)και ο όρος δύναμης f isin L2[0 T Hminus1(Ω)] και ορίζουμε τη φυσική ενεργειακή νόρμα|(v1 v2)|WS(0T ) equiv v1WS(0T ) + v2WS(0T ) εφοδιασμένη με την ασθενή μορφή Οπότε η ε-κτίμηση υπό υποθέσεις ελάχιστης ομαλότητας μπορούν να γραφούν ως εξής
|(e r)|WS(0T ) le C(|(ep rp)|WS(0T ) + pminus qhL2[0T L2(Ω)] + φminus qhL2[0T L2(Ω)])
Η παραπάνω εκτίμηση καταδεικνύει πως το σφάλμα είναι τόσο καλό όσο οι ιδιότητες προσεγγισιμότηταςεπιτρέπουν να είναι υπό τις υποθέσεις της φυσικής παραβολικής ομαλότητας και μπορεί κάποιος να τοδει ως το πλήρως διακριτό ανάλογο του Λήμματος Ceacutea βλέπε πχ [34] Οπότε οι τάξεις σύγκλισηςγια τα e r εξαρτώνται μόνο από τα αποτελέσματα της ομαλότητας και τις προσεγγισιμότητας μέσω τουσφάλματος προβολών ep όπως φαίνεται στο Λήμμα 4237 και τη Σημείωση 4238 Για παράδειγμα ανχρησιμοποιείται το στοιχείο Taylor-Hood και y isin L2[0 T V(Ω)]capH1[0 T Hminus1(Ω)] p isin L2[0 T L2
0(Ω)]τότε για τ le Ch2 έχουμε
1 epL2[0T H1(Ω)] le C pminus qhL2[0T L2(Ω)] le C
2 epL2[0T L2(Ω)] le ChyL2[0T H1(Ω)] + τ12ytL2[0T Hminus1(Ω)]
Οπότε οι παραπάνω υπολογισμοί και το Θεώρημα 4239 δείχνουν πως eL2[0T L2(Ω)] asymp O(h) γιατ le Ch2 Προφανώς η εκτίμηση του Θεωρήματος 4239 εφαρμόζεται και στη περίπτωση πιο ομαλώνλύσεων Για παράδειγμα για ομαλές λύσεις το Taylor-Hood στοιχείο συνδυασμένο με σχήμα χρονικούβηματισμού dG τάξης k μας δίνει τις εξής τάξεις σύγκλισης
1 epL2[0T H1(Ω)] le C(h2 + τk+1)
2 epL2[0T L2(Ω)] le C(h3 + τk+1)
Οπότε το Θεώρημα 4239 υποδηλώνει πως για τ le Ch2
eL2[0T H1(Ω)] asymp O(h2 + τk+1)
rL2[0T H1(Ω)] asymp O(h2 + τk+1)
eL2[0T L2(Ω)] asymp O(h3 + τk+1)
42 Εκτιμήσεις σφαλμάτων 81
rL2[0T L2(Ω)] asymp O(h3 + τk+1)
4232 Συμμετρικές εκτιμήσεις για το σύστημα βελτιστοποίησης
Απομένει να συγκρίνουμε το διακριτό σύστημα βελτιστοποίησης (4122)-(4123)-(4120) με το βοη-θητικό σύστημα (4266)-(4267)
Λήμμα 4241 ΄Εστω (yh ph) (microh φh) (wh p1h) (zh φ1h) isin Uh timesQh οι λύσεις του διακριτού συ-στήματος βελτιστοποίησης (4122)-(4123)-(4120) και του βοηθητικού συστήματος (4266)-(4267)αντιστοίχως Συμβολίζουμε με e equiv y minuswh r equiv microminus zh και έστω e2h equiv wh minus yh r2h equiv zh minus microh Τότευπάρχει αλγεβρική σταθερά C gt 0 τέτοια ώστε
e2hL2[0T L2(Ω)] + (1α12)r2hL2[0T L2(Ω)] le C(1α12)rL2[0T L2(Ω)]
Επιπλέον ισχύει η ακόλουθη εκτίμηση
eN2h2L2(Ω) +Nminus1sum
i=0[ei2h]2L2(Ω) + ν
int T
0e2h2H1(Ω)dt le (Cα32)
int tn
tnminus1r2L2(Ω))dt
r02h+2L2(Ω) +
Nsum
i=1[ri2h]2L2(Ω) + ν
int T
0r2h2H1(Ω)dt le (Cα12)
int T
0r2L2(Ω)dt
όπου C είναι μια σταθερά που εξαρτάται μόνο από το Ω
Απόδειξη Αφαιρώντας τη σχέση (4123) από τη (4267) παίρνουμε την εξίσωση Για n = 1 N vh isin Pk[tnminus1 tnYh] qh isin Pk[tnminus1 tnQh]
minus(rn2h+ vn) + (rnminus1
2h+ vnminus1+ ) +
int tn
tnminus1
(〈r2h vht〉+ a(r2h vh) + b(vh φ1h minus φh)
)dt =
int tn
tnminus1(e2h vh)dt
int tn
tnminus1b(r2h qh)dt = 0
(4279)Αφαιρώντας τη σχέση (4122) από τη (4266) και χρησιμοποιώντας τις (3318)-(4120) παίρνουμεΓια n = 1 N για όλα τα vh isin Pk[tnminus1 tnYh] qh isin Pk[tnminus1 tnQh]
(en2h vn) +int tn
tnminus1
(minus 〈e2h vht〉+ a(e2h vh) + b(vh p1h minus ph)
)dt
= (enminus12h vnminus1
+ ) +int tn
tnminus1minus(1α)(microminus microh vh)dt
int tn
tnminus1b(e2h qh)dt = 0
(4280)
Θέτουμε vh = e2h στην (4279) και παρατηρώντας πωςint tntnminus1 b(e2h φ1h minus φh)dt = 0 παίρνουμε
minus(rn2h+ en2h) +
int tn
tnminus1
(〈r2h e2ht〉+ a(r2h e2h)
)dt+ (rnminus1
2h+ enminus12h+) =
int tn
tnminus1e2h2L2(Ω)dt (4281)
Θέτοντας vh = r2h στην (4280) και παρατηρώντας πωςint tntnminus1 b(r2h p1h minus ph)dt = 0 έχουμε
(en2h rn2h) +int tn
tnminus1
(minus 〈e2h r2ht〉+ a(e2h r2h)
)dtminus (enminus1
2h rnminus12h+)
=int tn
tnminus1
(minus (1α)〈r r2h〉 minus (1α)r2h2L2(Ω)
)dt (4282)
82 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
Εφαρμόζοντας παραγοντική ολοκλήρωση ως προς το χρόνο στην (4282) και αφαιρώντας την εξίσωσηπου προκύπτει από τη (4281) καταλήγουμε στην
(rn2h+ en2h)minus (enminus1
2h rnminus12h+) +
int tn
tnminus1
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt = minus(1α)
int tn
tnminus1〈r r2h〉dt
(4283)
Χρησιμοποιώντας την ανισότητα Young για να φράξουμε το δεξί μέλος προσθέτοντας τις ανισότητεςπου προκύπτουν από το 1 έως το N και παρατηρώντας πως
sumNn=1
((rn2h+ e
n2h)minus (enminus1
2h rnminus12h+)
)= 0
(αφού e02h equiv 0 rN2h+ = 0) έχουμε τη πρώτη εκτίμηση Για τη δεύτερη εκτίμηση απλώς θέτουμε
vh = e2h στην (4280) και χρησιμοποιούμε την προηγούμενη εκτίμηση για το r2h Τελικώς η τρίτηεκτίμηση προκύπτει εύκολα θέτοντας vh = r2h στην (4279) στην εκτίμηση για το e2hL2[0T L2(Ω)]και αλγεβρικούς υπολογισμούς
Διάφορες εκτιμήσεις μπορούν να παραχθούν χρησιμοποιώντας τα αποτελέσματα του Θεωρήματος 4239και του Λήμματος 4241 και τα αποτελέσματα της θεωρίας προσεγγισιμότητας Ξεκινώντας παρουσι-άζουμε τις σχεδόν συμμετρικές εκτιμήσεις σφαλμάτων ανάλογες με το κλασικό Λήμμα του Ceacutea
Θεvώρημα 4242 ΄Εστω (yh ph) (microh φh) isin UhtimesQh και (y p) (micro φ) isinWS(0 T )timesL2[0 T L20(Ω)]
είναι οι προσεγγιστικές λύσεις του διακριτού και του συνεχούς συστήματος βελτιστοποίησης (4122)-(4123)-(4120) και (3316)-(3317)-(3318) αντιστοίχως Θεωρούμε ep = yminusQloch y rp = microminusP loch micro
τα σφάλματα προβολών όπου P loch Qloch είναι ορισμένα στους Ορισμούς 4235 και 4236 αντιστοίχωςΤότε ισχύει η ακόλουθη εκτίμηση για το σφάλμα e = y minus yh και r = microminus microh
|(e r)|WS(0T ) le C(1α32)(|(ep rp)|WS(0T ) + pminus qhL2[0T L2(Ω)] + φminus qhL2[0T L2(Ω)])
όπου η C εξαρτάται από τις σταθερές του Θεωρήματος 4239 και του Λήμματος 4241 1ν2 και είναιανεξάρτητη των τ h α και qh isin Qh αυθαίρετο
Απόδειξη Αρχικά παρατηρούμε πως μια εκτίμηση για το e2hLinfin[0T L2(Ω)] και r2hLinfin[0T L2(Ω)] μπο-ρεί να παραχθεί όμοια με το [32 Θεώρημα 46] εφόσον τα (4278)-(4279) είναι αποσυζευγμένα εξαιτίαςτης εκτίμησης του Λήμματος 4241 Οπότε προκύπτει η εκτίμηση χρησιμοποιώντας τη τριγωνική ανι-σότητα και τις προηγούμενες εκτιμήσεις του Θεωρήματος 4239 και του Λήμματος 4241
΄Ενας βελτιωμένος υπολογισμός για την L2[0 T L2(Ω)] νόρμα για τη βασική και τη συζυγή μεταβλητήπροκύπτει συνδυάζοντας τις εκτιμήσεις του Θεωρήματος 4239 και της πρώτης εκτίμησης του Λήμματος4241
Θεvώρημα 4243 Υποθέτουμε πως ισχύουν y0 isinW(Ω) f isin L2[0 T Hminus1(Ω)] και οι υποθέσεις τουΘεωρήματος 4239 και του Λήμματος 4241 ΄Εστω ep = yminusQloch y rp = microminusP loch micro είναι τα σφάλματαπροβολών όπου P loch Qloch ορίζονται στους Ορισμούς 4235 και 4236 αντιστοίχως Τότε υπάρχει μιασταθερά C που εξαρτάται από τα Ω 1ν τέτοια ώστε
eL2[0T L2(Ω)] le C(1α12)(epL2[0T L2(Ω)] + rpL2[0T L2(Ω)]
+τ12(epL2[0T H1(Ω)] + pminus qhL2[0T L2(Ω)])
+τ12(rpL2[0T H1(Ω)] + φminus qhL2[0T L2(Ω)]))
rL2[0T L2(Ω)] le C(epL2[0T L2(Ω)] + rpL2[0T L2(Ω)]
+τ12(epL2[0T H1(Ω)] + pminus qhL2[0T L2(Ω)])
+τ12(rpL2[0T H1(Ω)] + φminus qhL2[0T L2(Ω)]))
42 Εκτιμήσεις σφαλμάτων 83
Απόδειξη Η πρώτη εκτίμηση προκύπτει χρησιμοποιώντας τη τριγωνική ανισότητα και τις προηγούμενεςεκτιμήσεις του Θεωρήματος 4239 και του Λήμματος 4241
Κλείνουμε αυτήν τη παράγραφο παραθέτοντας τις τάξεις σύγκλισης σε δυο περιπτώσεις για το στοιχείοTaylor-Hood ανάλογα με τη διαθέσιμη ομαλότητα Προφανώς μπορούν να προκύψουν πολλές άλλεςεκτιμήσεις ανάλογα με τα επιλεγμένα στοιχεία που θα χρησιμοποιηθούν
Πρόταση 4244 Δεδομένου πως ισχύουν οι υποθέσεις του Θεωρήματος 4239 και του Λήμματος42411) ΄Εστω y0 isinW(Ω) f isin L2[0 T Hminus1(Ω)] και υπάρχει p isin L2[0 T L2
0(Ω)] τέτοια ώστε η ασθενήςμορφή (3320) να είναι έγκυρη Υποθέτουμε πως χρησιμοποιούνται τα στοιχεία Taylor-Hood για νακατασκευάσουμε τους υποχώρους και τμηματικά σταθερά πολυώνυμα k = 0 για την χρονική διακριτο-ποίηση Τότε για τ le Ch2 έχουμε
eL2[0T L2(Ω)] le Ch και rL2[0T L2(Ω)] le Ch
2) ΄Εστω y micro isin L2[0 T H3(Ω)capV(Ω)]capHk+1[0 T H1(Ω)] p φ isin L2[0 T H2(Ω)capL20(Ω) Υποθέτουμε
πως χρησιμοποιούνται στοιχεία Taylor-Hood συνδυασμένα με τμηματικά πολυώνυμα βαθμού k για τηχρονική διακριτοποίηση τότε ισχύουν οι ακόλουθες τάξεις σύγκλισης
(e r)W (0T ) le C(1α32)(h2 + τk+1)
eL2[0T L2(Ω)] le C(1α12)(h3 + τk+1 + τ12(h2 + τk+1)
)
rL2[0T L2(Ω)] le C(h3 + τk+1 + τ12(h2 + τk+1)
)
Απόδειξη Οι τάξεις σύγκλισης προκύπτουν απευθείας απο το Θεώρημα 4239 το Θεώρημα 4243 τοΛήμμα 4237 και τη Σημείωση 4240
4233 ΄Ελεγχοι με περιορισμούς Η διακριτή προσέγγιση μεταβολών
Αποδεικνύουμε ότι η διακριτή προσέγγιση μεταβολών του Hinze ([65]) μπορεί να χρησιμοποιηθεί στοπαραπάνω πλαίσιο Παρόμοια με τη περίπτωση του γραμμικού προβλήματος με Robin συνοριακό έλεγχοστη διακριτή προσέγγιση μεταβολών ο έλεγχος δεν διακριτοποιείται άμεσα αλλά έμμεσα και ειδικότεραορίζουμε Adad equiv Aad Οπότε το διακριτό βέλτιστου ελέγχου πρόβλημά μας ταυτίζεται με το Ελαχι-στοποίηση του συναρτησιακού
Jh(yh(g) g) =int T
0yh(g)minus yd2L2(Ω)dt+ α
int T
0g2L2(Ω)dt
υπό την (412) όπου yh(g) isin Uh συμβολίζει τη λύση του (412) με δεξί μέλος το δεδομένο έλεγχο g isinL2[0 T L2(Ω)] Ο βέλτιστος έλεγχος (χρησιμοποιώντας το συμβολισμό gh) ικανοποιεί την ακόλουθηπρώτης τάξης συνθήκη βελτιστοποίησης
Jprimeh(gh)(uminus gh) ge 0 για όλα τα u isin L2[0 T L2(Ω)]
΄Οπου gh παίρνει τη μορφή gh = Proj[gagb](minus 1α microh(gh)) όμοια με τη συνεχή περίπτωση Σημειώνου-
με πως το gh δεν είναι γενικά μια συνάρτηση πεπερασμένων στοιχείων που αντιστοιχεί στο πλέγμαπεπερασμένων στοιχείων που χρησιμοποιούμε Οπότε μια αλγοριθμική κατασκευή που θα χρησιμοποι-ήσουμε είναι στη βιβλιογραφία βλέπε πχ [65] Ωστόσο στις περισσότερες περιπτώσεις ενδιαφέρονέχει η βασική μεταβλητή και όχι ο έλεγχος Για τη δεύτερη παράγωγο εύκολα παίρνουμε μια εκτίμησηανεξάρτητη των g gh και ειδικότερα
Jprimeprimeh (u)(u u) ge αu2L2[0T L2(Ω)] για όλα τα u isin L2[0 T L2(Ω)]
84 4 Προσεγγισιμότητα και Αριθμητική Ανάλυση
Θεvώρημα 4245 ΄Εστω y0 isinW(Ω) f isin L2[0 T Hminus1(Ω)] yd isin L2[0 T L2(Ω)] και υπάρχει μιασυσχετισμένη πίεση p isin L2[0 T L2
0(Ω)] Υποθέτουμε πως Adad equiv Aad και έστω g gh είναι οι λύσεις τουαντίστοιχου συνεχούς και διακριτού συστήματος βέλτιστου ελέγχου Τότε ισχύει η ακόλουθη εκτίμηση
g minus ghL2[0T L2(Ω)] le C(1α)micro(g)minus microh(g)L2[0T L2(Ω)]
le C(epL2[0T L2(Ω)] + rpL2[0T L2(Ω)]
+τ12(epL2[0T H1(Ω)] + pminus qhL2[0T L2(Ω)])+τ12(rpL2[0T H1(Ω)] + φminus qhL2[0T L2(Ω)])
όπου με (microh(g) φh(g)) και (micro(g) φ) συμβολίζουμε τις λύσεις των (4119) και (3315) αντιστοίχωςκαι ep equiv y(g) minus Qloch y(g) rp = micro(g) minus P loch micro(g) είναι τα αντίστοιχα σφάλματα ελέγχου Επιπλέον αντ le Ch2 τότε έχουμε
g minus ghL2[0T L2(Ω)] le Ch
Απόδειξη Υπογραμμίζουμε πως Adad equiv Aad και οπότε οι πρώτης τάξης αναγκαίες συνθήκες δίνουν
Jprimeh(gh)(g minus gh) ge 0 και J
prime(g)(g minus gh) le 0 (4284)
Κατά συνέπεια χρησιμοποιώντας τις δεύτερης τάξης συνθήκες και το θεώρημα μέσης τιμής έχουμε γιακάθε u isin L2[0 T L2(Ω)] (και ως εκ τούτου για τη παράσταση που προκύπτει από το θεώρημα μέσηςτιμής) και τις ανισότητες (4284)
αg minus gh2L2[0T L2(Ω)] le Jprimeprimeh (u)(g minus gh g minus gh) = J
primeh(g)(g minus gh)minus J primeh(gh)(g minus gh)
le J primeh(g)(g minus gh)minus J prime(g)(g minus gh) =int T
0
int
Ω(micro(g)minus microh(g))(g minus gh)dxdt
le Cmicro(g)minus microh(g)L2[0T L2(Ω)]g minus ghL2[0T L2(Ω)]
και έτσι έχουμε τη πρώτη εκτίμηση Τώρα μπορεί εύκολα να προκύψει χρησιμοποιώντας παρόμοιαεπιχειρήματα με το Θεώρημα 4239 Πράγματι αφαιρώντας την (4119) από την (3315) και θέτονταςr = microh(g) minus micro(g) και e = yh(g) minus y(g) Χρησιμοποιώντας τις εκτιμήσεις του Θεωρήματος 4239και τις τάξεις σύγκλισης της Πρότασης 4244 έχουμε τη ζητούμενη εκτίμηση αφού παρατηρήσουμε τημειωμένη ομαλότητα του e
Αφού μελετήσαμε τις τάξεις σύγκλισης στις σχετικές νόρμες για το καθένα από τα υπό μελέτη προ-βλήματα στα κεφάλαια που ακολουθούν περιγράφουμε τα αντίστοιχα πειραματικά αποτελέσματα καιεπαληθεύουμε τα αντίστοιχα θεωρητικά αποτελέσματα
Πείραμα Συνοριακού Ελέγχου σεΠαραβολικές Γραμμικές μδε
Αυτό το κεφάλαιο παρουσιάζει τις θεωρητικές αρχές και τα αντίστοιχα πειραματικά αποτελέσματα γιαένα πρόβλημα συνοριακού ελέγχου σε παραβολικές γραμμικές μερικές διαφορικές εξισώσεις με Robinσυνοριακές συνθήκες
51 Συνοριακές συνθήκες Robin - Περιγραφή του μοντέλου 86
511 Ομαλότητα στα αρχικά δεδομένα 86
512 Μικρή ομαλότητα στα αρχικά δεδομένα 91
513 Πείραμα με χρήση γραμμικών πολυωνύμων στο χώρο και στο χρόνο 92
5
Περιεχόμενα
86 5 Πείραμα Συνοριακού Ελέγχου σε Παραβολικές Γραμμικές μδε
51 Συνοριακές συνθήκες Robin - Περιγραφή του μοντέλου
Σύμφωνα με όσα έχουμε αναφέρει στα προηγούμενα κεφάλαια σχετικά με το πρόβλημα συνοριακούελέγχου Robin θέλουμε να ελαχιστοποιήσουμε το συναρτησιακό
J(y g) = 12
int T
0y minus yd2L2(Ω)dt+ α
2
int T
0g2L2(Γ)dt
υπό τους περιορισμούς
yt minus∆y = f στο (0 T )times Ω
y + λminus1 party
partn = g στο (0 T )times Γ (511)
y(0 x) = y0 στο Ω
Θεωρούμε αριθμητικά παραδείγματα για το μοντέλο πρόβλημα στον χώρο Ωtimes I = Ωtimes [0 T ] = [0 1]2times[0 01] στις περιπτώσεις με
α) Ομαλά αρχικά δεδομένα για την βασική μεταβλητή (με γνωστή αναλυτική λύση) χρησιμοποιώνταςπολυώνυμα μηδενικού βαθμού χρονικά και πρώτου βαθμού στο χώρο
β) Ασυνεχή αρχικά δεδομένα y0 isin L2(Ω) - σε αυτή τη περίπτωση πρέπει να αναφέρουμε ότι έχουμεάγνωστη πραγματική λύση θεωρώντας ως ακριβή λύση την λύση στο χώρο - χρονικό πλέγμαdt = 271267eminus 05 h = 520833eminus 03 (3687 και 37249 βαθμούς ελευθερίας αντίστοιχα) και
γ) Ομαλά αρχικά δεδομένα για την βασική μεταβλητή (με γνωστή πραγματική λύση) χρησιμοποιώνταςπολυώνυμα πρώτου βαθμού χρονικά και χωρικά
Σημειώνουμε ότι ο συνοριακός έλεγχος δεν παρουσιάζει συνεχείς πρώτες παραγώγους σε ορισμένασημεία
Στα παραδείγματα σταθεροποιούμε την παράμετρο ομαλοποίησης του συναρτησιακού στη τιμή α =πminus4 Το συνοριακό πρόβλημα βελτιστοποίησης λύνεται με το πακέτο FreeFem++ βλέπε πχ το [64]χρησιμοποιώντας έναν αλγόριθμο κλίσεων σε έναν 4 Six-Core AMD Opteron(tm) Processor 8431 96GB RAM υπολογιστή
511 Ομαλότητα στα αρχικά δεδομένα
΄Εστω a = minusradic
5 Επιλέγουμε δεξί μέλος
f(t x1 x2) = π2eaπ2t(
2(x22 minus x2 + x2
1) cos(πx1x2) cos(πx1(x2 minus 1))
minus(2x22 minus 2x2 + 2x2
1 + a+ 1)sin(πx1x2) sin(πx1(x2 minus 1)))
αρχική συνθήκη y0(x1 x2) = sin(π(1 + x1x2))sin(πx1(x2 minus 1)) με βέλτιστο ζεύγος λύσεων (y g) τουπαραπάνω προβλήματος
y(t x1 x2) = exp(aπ2t)sin(π(1 + x1x2))sin(πx1(x2 minus 1))
51 Συνοριακές συνθήκες Robin - Περιγραφή του μοντέλου 87
ενώ η g έχει υπολογιστεί χρησιμοποιώντας την Robin συνθήκη σε κάθε συνιστώσα - πλευρά τετραγώνουΓi i = 1 4 (ξεκινώντας από τη κάτω πλευρά) του συνόρου με
g(t x1 x2) = eπ2at
0 στο Γ1
πx2 sin(πx2 minus π) + π(1minus x2) sin(πx2)cos(π (x2 minus 1)) στο Γ2
0 στο Γ3
0 στο Γ4
Για αυτή την επιλογή δεδομένων και συνάρτηση στόχου yd(t x1 x2) = 05 τα αντίστοιχα σφάλματα γιατην βασική μεταβλητή καθώς και για την συνάρτηση ελέγχου για διαφορετικά πλέγματα φαίνονται στονΠίνακα 51
Πίνακας 51 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 τ = h22 ομαλά αρχικά δεδομένα καιyd = 05
Διακριτοποίηση Σφάλματατ = h22 eL2[0T L2(Ω)] eL2[0T H1(Ω)] J(y g)
h = 02357022 0018310605 0070340370 0002395820h = 01178511 0004085497 0031958661 0001857961h = 00589255 0001335615 0016375314 0001738954h = 00294627 0000766443 0008819160 0001711876h = 00147313 0000676697 0005626214 0001705198Τάξη Σύγκλισης 1526118558 0998546583 -
Οι τάξεις σύγκλισης που βλέπουμε είναι αυτές που προβλέπει η θεωρία και ίσες με 15 για την L2[0 T L2(Ω)]νόρμα και 1 για την L2[0 T H1(Ω)] νόρμα (O(τ + h32) και O(τ + h) αντιστοίχως σύμφωνα με τα θε-ωρητικά αποτελέσματα της Πρότασης 4213) Ειδικότερα η τάξη σύγκλισης 15 για την L2[0 T L2(Ω)]νόρμα είναι η βέλτιστη που μπορούμε να πάρουμε με αυτά τα συνοριακά δεδομένα αφού από τον ορι-σμό της προβολής είναι η L2[0 T L2(Γ)] νόρμα που μας περιορίζει λόγω του συνόρου Οπότε αντί ναέχουμε τάξη σύγκλισης 2 όπως έχουμε στο κατανεμημένο έλεγχο με συνοριακές συνθήκες Dirichletμηδέν η τάξη σύγκλισης ελαττώνεται στη τιμή 15
Παρόμοια αποτελέσματα έχουν προκύψει για συναρτήσεις στόχου 0 και 05 cos(πx1) cos(πx2) Πιοσυγκεκριμένα παρατηρώντας τα αποτελέσματα που φαίνονται στους Πίνακες 51 52 53 για τους τρειςδιαφορετικούς στόχους βλέπουμε κατά προσέγγιση τις ίδιες τάξεις σύγκλισης για τα σφάλματα τηςβασικής μεταβλητής στους χώρους L2[0 T L2(Ω)] και L2[0 T H1(Ω)] καθώς και παρεμφερείς τιμές γιατο συναρτησιακό
Πίνακας 52 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 τ = h22 ομαλά αρχικά δεδομένα καιyd = 0
Διακριτοποίηση Σφάλματατ = h22 eL2[0T L2(Ω)] eL2[0T H1(Ω)] J(y g)
h = 02357022 0018437187 0070206813 0003505277h = 01178511 0004163875 0036356131 0002718328h = 00589255 0001477032 0017039099 0002520912h = 00294627 0000961147 0010077840 0002473947h = 00147313 0000883837 0007476681 0002462163Τάξη Σύγκλισης 1420572191 0875175799 -
Το 3-διάστατο Σχήμα 51 δείχνει από μία διαφορετική πλευρά πώς μεταβάλλονται τα σφάλματα στουςχώρους L2[0 T H1(Ω)] και L2[0 T L2(Ω)] καθώς τα τ h αλλάζουν Ειδικότερα ξεκινώντας για
88 5 Πείραμα Συνοριακού Ελέγχου σε Παραβολικές Γραμμικές μδε
Πίνακας 53 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 τ = h22 ομαλά αρχικά δεδομένα καιyd = 05 cos(πx1) cos(πx2)
Διακριτοποίηση Σφάλματατ = h22 eL2[0T L2(Ω)] eL2[0T H1(Ω)] J(y g)
h = 02357022 0018033381 0070977749 0004957926h = 01178511 0003666894 0032317405 0004953116h = 00589255 0001015930 0016629768 0004905743h = 00294627 0000821597 0009086474 0004909695h = 00147313 0000879346 0005954120 0004907448Τάξη Σύγκλισης 1485364815 0988524738 -
Σχήμα 51 Σφάλματα για τη βασική μεταβλητή και τη μεταβλητή ελέγχου για τ = h22
h = 02350722 και τ = 005555449 έχουμε σχετικά μεγάλα σφάλματα για την L2[0 T H1(Ω)] νόρμασφάλματος και αρκετά μικρότερα σφάλματα για την L2[0 T L2(Ω)] της τάξης του 0070 και 0018 αντι-στοίχως Καθώς εξελίσσεται το πείραμα τα σφάλματα ελαττώνονται μέχρι να φτάσουν στις τιμές 00056και 000067 αντίστοιχα όπου και τα σφάλματα αρχίζουν να σταθεροποιούνται εξαιτίας της πολύ πυκνήςχωρικής και χρονικής διαμέρισης και επομένως των σφαλμάτων ολοκλήρωσης και στρογγυλοποίησηςΣτο παραπάνω γράφημα είναι φανερό επίσης ότι τα σφάλματα για τη συνάρτηση ελέγχου σταθεροποιο-ύνται πιο γρήγορα αφού όπως είναι φυσιολογικό lsquolsquoδουλεύειrsquorsquo περισσότερο στα πρώτα βήματα ώστε ναέχουμε ένα επιθυμητό έλεγχο
Το 2-διάστατο Σχήμα 52 παρουσιάζει πως η νόρμα για τον έλεγχο g(t)L2(Ω) μεταβάλλεται ως προςτην εξέλιξη του χρόνου στα πλέγματα για τις διάφορες διαμερίσεις των τ h Το αριστερό γράφημα τουΣχήματος 53 δείχνει πως η απόσταση από το στόχο y(t) minus yd(t)L2(Ω) μεταβάλλεται ως προς τηνεξέλιξη του χρόνου σε διαφορετικά πλέγματα και πιο συγκεκριμένα όσο περισσότερο πυκνό πλέγμαχρησιμοποιούμε τόσο μικρότερη απόσταση από το στόχο επιτυγχάνουμε
Επίδραση από τις μεταβολές της ομαλοποιητικής παραμέτρου α για το συναρτησιακό ΣτοΣχήμα 54 παρατηρούμε πως για μικρές τιμές της ομαλοποιητικής παραμέτρου εφαρμόζεται από τη μέθοδοκλίσεων μεγάλος έλεγχος και αντίστροφα παρατηρήθηκαν μικρές τιμές της συνάρτησης ελέγχου γιαμεγάλες τιμές του α Από την εκτέλεση του κώδικα σε όλες αυτές τις περιπτώσεις παρατηρήσαμε ομαλήλειτουργία και τις αναμενόμενες τάξεις σύγκλισης για 10minus1 lt α lt 10minus5
Η απόσταση της λύσης από το στόχο Σημαντική παρατήρηση είναι το ότι δε παρατηρήσαμεαλλαγή στη πρόοδο της απόστασης της αριθμητικής λύσης από το στόχο για τις διάφορες τιμές του α
51 Συνοριακές συνθήκες Robin - Περιγραφή του μοντέλου 89
Σχήμα 52 Η νόρμα για τη συνάρτηση ελέγχου g(t)L2(Ω)
Σχήμα 53 Απόσταση από το στόχο y(t)minus yd(t)L2(Ω) α) Ομαλά δεδομένα β) Δεδομένα με μικρήομαλότητα L2(Ω) - ασυνέχεια
Σχήμα 54 Επίδραση από τις μεταβολές της ομαλοποιητικής παραμέτρου για το συναρτησιακό α στονέλεγχο g(t)L2(Ω) για σταθερό πλέγμα 48times 48 και τις διάφορες τιμές του α
90 5 Πείραμα Συνοριακού Ελέγχου σε Παραβολικές Γραμμικές μδε
Σχήμα 55 Επίδραση από τις μεταβολές της ομαλοποιητικής παραμέτρου για το συναρτησιακό α στηναπόσταση της λύσης από το στόχο y(t)minus yd(t)L2(Ω)
όπως φαίνεται και στο Σχήμα 55
Ο αλγόριθμος για τμηματικά σταθερά πολυώνυμα στο χρόνο Για τα παραπάνω αποτελέσματαχρησιμοποιήσαμε το παρακάτω κώδικα αφού αρχικοποιήσαμε τα n = 0 ε = 1 την παράμετρο ανοχήςtol και τον έλεγχο g0|Γ Να σημειώσουμε πως πχ το yn είναι ακολουθία τμηματικά γραμμικώνπολυωνύμων στο χρόνο (με καθε όρο αυτής της ακολουθίας να αντιπροσωπεύει άλλη ακολουθία τιμώνσχετική με το χώρο) κατά την n επανάληψη της μεθόδου κλίσεων
bull Βήμα 0 (Αρχική κατάσταση) Επίλυση με g|Γ = g0|Γ για y = y0 του συστήματος
yt minus∆y = f
y|Γ + λminus1 party
partn = g|Γy(0 x) = y0
bull Βήμα 1 (Επίλυση συζυγούς εξίσωσης) Υπολογισμός micro = micron
microt + ∆micro = y minus yd
micro|Γ + λminus1 partmicro
partn = 0
micro(T x) = 0
bull Βήμα 2 (Νέα κατεύθυνση καθόδου) Λαμβάνουμε ως (descent) κατεύθυνση καθόδου την αρνητικήκλίση του συναρτησιακού κόστους
minusJ prime(g|Γ) = minus(αg|Γ + micro|Γ)
bull Βήμα 3 (΄Ελεγχος του βήματος) Προσδιορισμός του βέλτιστου μεγέθους βήματος εn
J(gn|Γ + εn(αg|Γ + micro|Γ)
)= min
εgt0J(gn|Γ + ε(αg|Γ + micro|Γ)
)
bull Βήμα 4 (Νέα συνάρτηση ελέγχου) Θέτουμε
gn+1|Γ = gn|Γ + εn(αgn|Γ + micron|Γ)
51 Συνοριακές συνθήκες Robin - Περιγραφή του μοντέλου 91
bull Βήμα 5 (Νέα κατάσταση) Ελέγχουμε αν Jn le Jnminus1 και θέτουμε ε = 15ε Αν Jn ge Jnminus1
θέτουμε ε = 05ε Εκτελούμε το Βήμα 0 με g|Γ = gn+1|Γ για y = yn και n = n + 1 Οαλγόριθμος σταματά όταν |Jn minus Jnminus1|Jn le tol
Να σημειώσουμε πως για τη λύση της βασικής εξίσωσης χρειάζεται να γράψουμε τη βασική εξίσωσησε κατάλληλη ασυνεχή στο χρόνο Galerkin μορφή Ειδικότερα οι προσεγγιστικές συναρτήσεις είναιτμηματικά σταθερά πολυώνυμα στο χρόνο οπότε η μέθοδος ανάγεται στην τροποποιημένη προς τα πίσωμέθοδο Euler (μέθοδο dG0)
(I + dtA)yi+1 + yi+1|Γ = yi + gi+1|Γ +int ti+1
ti
fds
Ομοίως για τη λύση της συζυγούς εξίσωσης χρειάζεται να γράψουμε την οπισθόδρομη χρονικά εξίσωσηστη μορφή
(I + dtA)microi + microi|Γ = microi+1 +int ti+1
ti
(yi minus yd)ds
΄Οπου ο τελεστής A αντιστοιχεί στο τελεστή Laplace
512 Μικρή ομαλότητα στα αρχικά δεδομένα
Για αυτό το πρόβλημα τα Ω T είναι τα ίδια όπως στο πρώτο παράδειγμα δηλαδή Ω = [0 1] times [0 1]T = 01 Η διαφορά είναι ότι σε αυτό το παράδειγμα τα αρχικά δεδομένα y0 είναι μια ασυνεχής συνάρτησηπου ορίζεται από τη σχέση
y0 =
sin(π(1 + x1x2))sin(πx1(x2 minus 1)) αν x1 x2 ge 0510 + sin(π(1 + x1x2))sin(πx1(x2 minus 1)) διαφορετικά
Τα σχετικά αποτελέσματα για τα σφάλματα παρουσιάζονται στον Πίνακα 54 όπου η τάξη σύγκλισηςO(h) όταν τ le Ch2 για την L2[0 T L2(Ω)] επαληθεύεται για την βασική και τη συζυγή μεταβλητήΤα αποτελέσματα σχετικά με τη τάξη σύγκλισης και την αναμενόμενη τάξη σύγκλισης δείχνουν λίγοκαλύτερα εξαιτίας του τρόπου lsquolsquoκατασκευήςrsquorsquo της ακριβής λύσης Συγκρίνοντας το παρόν παράδειγμαμε αυτό με τα ομαλά δεδομένα παρατηρούμε πως το συναρτησιακό έχει πολύ μεγαλύτερες τιμές καιτο σφάλμα πχ στο h = 0014 είναι επίσης μεγαλύτερο Προφανώς λόγω της ασυνέχειας η νόρμα
Πίνακας 54 Τάξεις Σύγκλισης για τη δισδιάστατη λύση με k = 0 τ = h22 και αρχικά δεδομένα με μικρήομαλότητα
Διακριτοποίηση Σφάλματατ = h22 eL2[0T L2(Ω)] rL2[0T L2(Ω)] J(y g)
h = 02357022 04093275092 0008552165422 09411555956h = 01178511 01555909764 0005056762072 08225865966h = 00589255 00714820269 0002440981965 07424795375h = 00294627 00302970740 0001179518135 07066657202h = 001473139 00100448501 0001097951813 06883517113Τάξη Σύγκλισης 12520017243 0952697386266 -
σφάλματος L2[0 T H1(Ω)] δε συγκλίνει λόγω της ασυνέχειας μιας και τα δεδομένα y0 isin L2(Ω) καιαυτή η αρχική ασυνέχεια μεταδίδεται μέσω των χαρακτηριστικών σε ολόκληρη τη λύση Τελικώς τογράφημα στα δεξιά του Σχήματος 53 δείχνει πως η απόσταση από το στόχο μειώνεται σταδιακά με τοπέρασμα του χρόνου και όπως περιμέναμε είναι πολύ πιο δύσκολο για την βασική μεταβλητή με τηνεπίδραση της συνάρτησης ελέγχου να φτάσει στο στόχο
92 5 Πείραμα Συνοριακού Ελέγχου σε Παραβολικές Γραμμικές μδε
513 Πείραμα με χρήση γραμμικών πολυωνύμων στο χώρο και στο χρόνο
Για να παρουσιάσουμε την εφαρμοσιμότητα σχημάτων υψηλότερης τάξης ως προς το χρόνο θεωρούμεμία αραιού χρονικού βηματισμού προσέγγιση που βασίζεται στο σχήμα χρονικού βηματισμού k = 1
Σε αυτό το σημείο αναφερόμαστε στο παράδειγμα της παραγράφου 511 με γνωστή ομαλή βασικήμεταβλητή y να δίνεται από την y(t x1 x2) = exp(aπ2t)sin(π(1 + x1x2))sin(πx1(x2 minus 1)) για k = 1l = 1 Σημειώνουμε πως παρόλο το γεγονός ότι έχουμε επιλέξει ομαλή βασική μεταβλητή η παρουσίασυνοριακού ελέγχου Robin περιορίζει την ομαλότητα τουλάχιστον κοντά στο σύνορο για τη χρονικήπαράγωγο για τη συζυγή μεταβλητή καθώς και για τη μεταβλητή ελέγχου Ωστόσο παρόλα αυτάπεριμένουμε ότι θα εμφανιστεί η παραβολική ομαλότητα καθώς ο χρόνος εξελίσσεται Οι εκτιμήσειςμας βέλτιστης προσέγγισης για ομαλή βασική συζυγή μεταβλητή και μεταβλητή ελέγχου παράγουν μιατάξη σύγκλισης ως προς τη νόρμα L2[0 T H1(Ω)] της τάξης O(τ2 + h) όταν θεωρούνται τμηματικάγραμμικά πολυώνυμα και για το χρόνο και για το χώρο δηλ k = 1 l = 1
Στα ακόλουθα παραδείγματα παρουσιάζουμε τις τάξεις σύγκλισης σε μια αραιού χρονικού βηματισμο-ύ προσέγγιση Ειδικότερα για την επιλογή τ = h12 και τ = h34 η οποία αντιστοιχεί σε πολύλίγα χρονικά βήματα τα αποτελέσματα παρουσιάζονται στους Πίνακες 55 και 56 αντιστοίχως Να
Πίνακας 55 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 1 l = 1 τ = O(h34) ομαλά αρχικάδεδομένα και yd = 0
Διακριτοποίηση Σφάλματατ = h3416 eL2[0T L2(Ω)] eL2[0T H1(Ω)] J(y g)h = 02357022 0007064919 0071348872 0002392313h = 01178511 0002639725 0031653985 0002355530h = 00589255 0001462584 0017397858 0002305098h = 00294627 0000873854 0009497292 0002258746h = 00147313 0000566631 0005500319 0002230101h = 00073656 0000410072 0003614028 0002214837Τάξη Σύγκλισης 0910047586 0924325857 -
Πίνακας 56 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 1 l = 1 τ = O(h12) ομαλά αρχικάδεδομένα και yd = 0
Διακριτοποίηση Σφάλματατ = h1216 eL2[0T L2(Ω)] eL2[0T H1(Ω)] J(y g)h = 02357022 0008385394 0068070558 0002676642h = 01178511 0004769310 0040332082 0002579619h = 00589255 0002736129 0019010050 0002468955h = 00294627 0001954915 0012117836 0002384007h = 00147313 0001398719 0008222888 0002322462h = 00073656 0001003904 0005980212 0002276926Τάξη Σύγκλισης 0645943041 0762328463 -
σημειώσουμε πως για τη λύση της βασικής εξίσωσης χρειάζεται να γράψουμε τη βασική εξίσωση σεκατάλληλη ασυνεχή στο χρόνο Galerkin μορφή dG1 Ειδικότερα οι προσεγγιστικές συναρτήσεις είναιτμηματικά γραμμικά πολυώνυμα στο χρόνο Για λόγους σαφήνειας περιγράφουμε το πως προκύπτει τοσύστημα εξισώσεων σε αυτή τη περίπτωση Υπενθυμίζουμε πως το ασυνεχές χρονικού βηματισμού
51 Συνοριακές συνθήκες Robin - Περιγραφή του μοντέλου 93
πλήρως διακριτοποιημένο σχήμα είναι το
(ynminus1h+ vnminus1
h+ ) +int tn
tnminus1
(minus 〈yht vh〉+ a(yh vh) + λ〈yh vh〉Γ
)dt
= (ynminus1h vnminus1
h+ ) +int tn
tnminus1
(〈f vh〉+ λ〈g vh〉Γ
)dtforallvh isin Pk[tnminus1 tnUh] 1 le n le N
y0 = y0
Οπότε στη περίπτωση k = 1 δηλ γραμμικών πολυωνύμων για το t μπορούμε να γράψουμε yh(t) =Y n0 + Y n1 (tminus tnminus1)τ στο διάστημα (tnminus1 tn] με τ = tn minus tnminus1 και παίρνοντας ως συνάρτηση δοκιμήςτην vh = τminusl(s minus tnminus1)l για l = 0 1 και μετά από χρονική ολοκλήρωση και συμβολίζοντας Y n0 = Y0Y n1 = Y1 έχουμε το ζητούμενο σύστημα όπως φαίνεται στον επόμενο αλγόριθμο με yi = Y0 + Y1Παρόμοια εργαζόμαστε για την λύση της οπισθόδρομης χρονικά εξίσωσης με microi = M0 +M1
Ο αλγόριθμος για τμηματικά γραμμικά πολυώνυμα στο χρόνο Ομοίως με τον προηγούμενοαλγόριθμο για τα παραπάνω αποτελέσματα χρησιμοποιήσαμε το παρακάτω κώδικα αφού αρχικοποιήσαμετα n = 0 ε = 1 την παράμετρο ανοχής tol και τον έλεγχο g0|Γ Να σημειώσουμε πως πχ το yn
είναι ακολουθία τμηματικά γραμμικών πολυωνύμων στο χρόνο (με καθε όρο αυτής της ακολουθίαςνα αντιπροσωπεύει άλλη ακολουθία τιμών σχετική με το χώρο) κατά την n επανάληψη της μεθόδουκλίσεων
bull Βήμα 0 (Αρχική κατάσταση) Επίλυση με g|Γ = g0|Γ για y = y0 του συστήματος
(I + dtA)Y0 + (I + 12dtA)Y1 + (Y0 + 1
2Y1)|Γ = gi+1|Γ + yi +int ti+1
ti
fds
12dtAY0 + (1
2I + 13dtA)Y1 + (1
2Y0 + 13Y1)|Γ = 1
2gi+1|Γ + 1dt
int ti+1
ti
(sminus ti)fds
με y = Y0 + Y1
bull Βήμα 1 (Επίλυση συζυγούς εξίσωσης) Υπολογισμός micro = micron
(I + dtA)M0 + (I + 12dtA)M1 + (M0 + 1
2M1)|Γ = microi +int ti+1
ti
(yi minus yd)ds
12dtAM0 + (1
2I + 13dtA)M1 + (1
2M0 + 13M1)|Γ = 1
dt
int ti+1
ti
(yi minus yd)(sminus ti)ds
με micro = M0 +M1
bull Βήμα 2 (Νέα κατεύθυνση καθόδου) Λαμβάνουμε ως (descent) κατεύθυνση καθόδου την αρνητικήκλίση του συναρτησιακού κόστους
minusJ prime(g|Γ) = minus(αg|Γ + micro|Γ)
bull Βήμα 3 (΄Ελεγχος του βήματος) Προσδιορισμός του βέλτιστου μεγέθους βήματος εn
J(gn|Γ + εn(αg|Γ + micro|Γ)
)= min
εgt0J(gn|Γ + ε(αg|Γ + micro|Γ)
)
bull Βήμα 4 (Νέα συνάρτηση ελέγχου) Θέτουμε
gn+1|Γ = gn|Γ + εn(αgn|Γ + micron|Γ)
94 5 Πείραμα Συνοριακού Ελέγχου σε Παραβολικές Γραμμικές μδε
Σχήμα 56 Στιγμιότυπο της βασικής μεταβλητής
bull Βήμα 5 (Νέα κατάσταση) Ελέγχουμε αν Jn le Jnminus1 και θέτουμε ε = 15ε Αν Jn ge Jnminus1
θέτουμε ε = 05ε Εκτελούμε το Βήμα 0 με g|Γ = gn+1|Γ για y = yn και n = n + 1 Οαλγόριθμος σταματά όταν |Jn minus Jnminus1|Jn le tol
Σημείωση 511 Σχετικά με τον αλγόριθμο κλίσης σε όλες τις περιπτώσεις χρησιμοποιήσαμε έναναλγόριθμο βασισμένο στην Απότομη Κάθοδο (steepest-descentprojected gradient) μέθοδο Πρέπει νααναφέρουμε πως η παραπάνω μέθοδος συγκλίνει αργά ωστόσο είναι πολύ εύκολο να υλοποιηθεί και οπότεκατάλληλη για αριθμητικά πειράματα Επίσης επειδή τα εξελικτικά προβλήματα απαιτούν πολύ μεγάληυπολογιστική προσπάθεια εξαιτίας της χρονικής μεταβολής οι μέθοδοι κλίσεων είναι πολύ χρήσιμεςεναλλακτικές μέθοδοι των μεθόδων με υψηλότερη τάξη σύγκλισης αφού απαιτούν λιγότερους υπολογι-στικούς πόρους Το βήμα για τη προβολή εn είναι απαραίτητο αφού ο όρος gin + εn(γigi + microi) μπορείνα μην είναι επιθυμητός Ειδικότερα χρησιμοποιείται η αρνητικά μειωμένη κλίση ως κατεύθυνση ανα-ζήτησης και στη συνέχεια υπολογίζεται το βήμα προς αυτή την κατεύθυνση Το βήμα εn προκύπτει απόμια κατάλληλη στρατηγική γραμμικής αναζήτησης (line search strategy)΄Ενα τυπικό χαρακτηριστικότων μεθόδων κλίσεων είναι η καλή προοπτική ώστε να οδηγηθούμε στη λύση στις πρώτες επαναλήψειςενώ ελαττώνεται η αποτελεσματικότητά τους στις επόμενες επαναλήψεις Ωστόσο στο επόμενο κεφάλαιοσχετικό με κατανεμημένο έλεγχο σε ημιγραμμικό παραβολικό πρόβλημα θα βελτιώσουμε το κώδικακάνοντας χρήση ισχυρών κανόνων - συνθηκών Wolfe-Powel και αντί των κατευθύνσεων αρνητικώνκατευθύνσεων της παραγώγου του συναρτησιακού τη κατεύθυνση Fletcher-Reeves
Σημείωση 512 Στα Σχήματα 56 57 παραθέτουμε ενδεικτικά κάποια στιγμιότυπα της βασικήςκαι της συζυγούς μεταβλητής
Σημείωση 513 Είναι εύλογο να συγκρίνουμε τα αποτελέσματα των πειραμάτων με ομαλά δεδομέναστη περίπτωση k = 0 και k = 1 Πιο συγκεκριμένα ας συγκρίνουμε για παράδειγμα τα αποτελέσματατων Πινάκων 53 και 55 Παρατηρούμε πως παρόλο που η τάξη σύγκλισης είναι αρκετά μικρότερηγια τη περίπτωση k = 1 τα σφάλματα πχ για h = 0014 παρόλο που παραμένουν ίδια για τηνL2[0 T H1(Ω)] και περίπου ίσα με 0005 είναι μικρότερα για την L2[0 T L2(Ω)] νόρμα από 0008 γιαk = 0 σε 0005 για k = 1 δηλαδή έχουμε καλύτερα αποτελέσματα Αξιοσημείωτο είναι επίσης πως στηπερίπτωση k = 1 εξαιτίας του αραιού χρονικού βηματισμού παρόλο που χρησιμοποιούμε την ίδια μνήμηΗΥ έχουμε τη δυνατότητα να προχωρήσουμε σε περισσότερο πυκνή διαμέριση Αυτό είναι εφικτό μιας
51 Συνοριακές συνθήκες Robin - Περιγραφή του μοντέλου 95
Σχήμα 57 Στιγμιότυπο της συζυγούς μεταβλητής
και έχουμε μικρότερο μέγεθος μνήμης αποθήκευσης δεδομένων αφού τα χρονικά σημεία είναι πολύλιγότερα και είναι αυτό που παίζει κρίσιμο ρόλο στη δέσμευση λιγότερης μνήμης του υπολογιστή Αυτήλοιπόν η δυνατότητα να προχωρήσουμε σε περισσότερο πυκνή διαμέριση μας επιτρέπει ακόμη καλύτερααποτελέσματα και για τη νόρμα σφάλματος L2[0 T H1(Ω)] από 0005 για k = 0 σε 00036 για k = 1 καιγια την L2[0 T L2(Ω)] νόρμα από 0008 για k = 0 σε 00004 για k = 1 Τέλος να επισημάνουμε πως τοελαχιστοποιημένο συναρτησιακό J από τη τιμή 00049 που έχουμε στη περίπτωση k = 0 επιτυγχάνουμεστη περίπτωση k = 1 πολύ μικρότερη τιμή ελαχιστοποιημένου συναρτησιακού ίση με 00022
Αναφέρουμε πως οι βαθμοί ελευθερίας σχετικά με το μικρού χρονικού βηματισμού (coarse time stepping)παράδειγμα k = 1 τ = O(h34) για κάθε διαμέριση (βλέπε Πίνακα 55) εξελίσσονται ως εξής (για τηκάθε μια από τις 5 μεταβλητές του συστήματος - 2 για το ευθύ 2 για το συζυγές πρόβλημα και μια γιατον έλεγχο)
bull για το χωρικό κομμάτι έχουμε διαδοχικά βαθμούς ελευθερίας 49 169 625 2401 9409 37249(148225)
bull για το χρονικό κομμάτι έχουμε διαδοχικά βαθμούς ελευθερίας 5 8 14 23 38 64 (108)
ενώ για για τη περίπτωση k = 0 τ = O(h2) για κάθε μια από τις 3 μεταβλητές
bull για το χωρικό κομμάτι έχουμε διαδοχικά βαθμούς ελευθερίας 49 169 625 2401 9409 (37249)
bull για το χρονικό κομμάτι έχουμε διαδοχικά βαθμούς ελευθερίας 4 15 58 231 922 (3687)
Πείραμα Κατανεμημένου Ελέγχου σεΗμιγραμμικές Παραβολικές μδε
Αυτό το κεφάλαιο παρουσιάζει τις θεωρητικές αρχές και τα αντίστοιχα πειραματικά αποτελέσματα γιαένα πρόβλημα ημιγραμμικής παραβολικής εξίσωσης με κατανεμημένο έλεγχο σε συνθήκες DirichletΜηδέν
61 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου 98
611 Σταθερά πολυώνυμα στο χρόνο και γραμμικά στο χώρο 98
612 Ισχυρές συνθήκες Wolfe-Powel 99
6
Περιεχόμενα
98 6 Πείραμα Κατανεμημένου Ελέγχου σε Ημιγραμμικές Παραβολικές μδε
61 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου
Σύμφωνα με όσα έχουμε αναφέρει στα προηγούμενα κεφάλαια σχετικά με το ημιγραμμικό πρόβλημακατανεμημένου ελέγχου θα επαληθεύσουμε αριθμητικά τους εκ των προτέρων υπολογισμούς σφαλμάτωνγια k = 0 l = 1 στις περιπτώσεις τ = h2 και τ = h για το σφάλμα των συναρτήσεων ελέγχου βασικήςμεταβλητής και συζυγούς μεταβλητής και θα παρουσιάσουμε και αποτελέσματα για τη περίπτωση μεισχυρές συνθήκες Wolfe-Powel
Θεωρούμε το ακόλουθο αριθμητικό παράδειγμα για το μοντέλο με γνωστή ακριβής αναλυτική λύση στοΩ times (0 T ) = (0 1)2 times (0 01) και ομογενείς Dirichlet συνοριακές συνθήκες παρόμοιο με αυτό πουπαρουσιάζεται στο [94] Πιο συγκεκριμένα ελαχιστοποιούμε το συναρτησιακό
J(y g) = 12
int T
0y minus yd2L2(Ω)dt+ α
2
int T
0g2L2(Ω)dt
υπό τους περιορισμούς
yt minus ∆y + (13)y3 = f + g στο (0 T )times Ωy = 0 στο (0 T )times Γ
y(0 x) = y0 στο Ω
Επιλέγουμε παράμετρο ομαλοποίησης α = πminus4 δεξί μέλος
f(t x1 x2) = minusπ4eminusradic
5π2T sin(πx1)sin(πx2) + 13( minus1
2minusradic
5π2eminus
radic5π2tsin(πx1)sin(πx2))3
συνάρτηση στόχου
yd(t x1 x2) =(
2π2eminusradic
5π2T minus π4
(2minusradic
5)2
(eminusradic
5π2tsin(πx1)sin(πx2))2
(eminusradic
5π2t minus eminusradic
5π2T))
sin(πx1)sin(πx2)
και αρχική συνθήκη y0(x1 x2) = minus12minusradic
5π2sin(πx1)sin(πx2) με τέτοιο τρόπο ώστε η βέλτιστη λύση
(y micro g) του παραπάνω προβλήματος να είναι η
y(t x1 x2) = minus12minusradic
5π2eminus
radic5π2tsin(πx1)sin(πx2)
micro(t x1 x2) = (eminusradic
5π2t minus eminusradic
5π2T )sin(πx1)sin(πx2)
g(t x1 x2) = minusπ4(eminusradic
5π2t minus eminusradic
5π2T )sin(πx1)sin(πx2)
611 Σταθερά πολυώνυμα στο χρόνο και γραμμικά στο χώρο
Για τα παραπάνω αποτελέσματα χρησιμοποιήσαμε το παρακάτω κώδικα αφού αρχικοποιήσαμε τα n = 0ε = 1 την παράμετρο ανοχής tol και τον έλεγχο g0| Να σημειώσουμε πως πχ το yn είναι ακολουθίατμηματικά γραμμικών πολυωνύμων στο χρόνο (με καθε όρο αυτής της ακολουθίας να αντιπροσωπεύειάλλη ακολουθία τιμών σχετική με το χώρο) κατά την n επανάληψη της μεθόδου κλίσεων
61 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου 99
bull Βήμα 0 (Αρχική κατάσταση) Επίλυση με g = g0 για y = y0 του συστήματος
yt minus∆y + 13y
3 = g + f
yΓ = 0y(0 x) = y0
bull Βήμα 1 (Επίλυση συζυγούς εξίσωσης) Υπολογισμός micro = micron
microt + ∆micro+ y2micro = y minus ydmicroΓ = 0micro(T x) = 0
bull Βήμα 2 (Νέα κατεύθυνση καθόδου) Λαμβάνουμε ως (descent) κατεύθυνση καθόδου την αρνητικήκλίση του συναρτησιακού κόστους
minusJ prime(g) = minus(αg + micro)
bull Βήμα 3 (΄Ελεγχος του βήματος) Προσδιορισμός του βέλτιστου μεγέθους βήματος εn
J(gn + εn(αg + micro)
)= min
εgt0J(gn + ε(αg + micro)
)
bull Βήμα 4 (Νέα συνάρτηση ελέγχου) Θέτουμε
gn+1 = gn + εn(αgn + micron)
bull Βήμα 5 (Νέα κατάσταση) Ελέγχουμε αν Jn le Jnminus1 και θέτουμε ε = 15ε Αν Jn ge Jnminus1
θέτουμε ε = 05ε Εκτελούμε τοΒήμα 0 με g = gn+1 για y = yn και n = n+1 Ο αλγόριθμοςσταματά όταν |Jn minus Jnminus1|Jn le tol
΄Ομοια με το προηγούμενο κεφάλαιο για τη λύση της βασικής εξίσωσης χρειάζεται να γράψουμε τηβασική εξίσωση στη μορφή
(I + dtA)yi+1 + 13yi+1
3 = yi +int ti+1
ti
(f + g)ds
και για τη λύση της συζυγούς εξίσωσης χρειάζεται να γράψουμε την οπισθόδρομη χρονικά εξίσωση στημορφή
(I + dtA)microi + y2i microi = microi+1 +
int ti+1
ti
(yi minus yd)ds
Ο μη γραμμικός όρος αντιμετωπίστηκε ξεχωριστά με γραμμικοποίηση αλλά και με γενική επαναληπτικήμέθοδο
612 Ισχυρές συνθήκες Wolfe-Powel
Στα παραπάνω πειράματα όπως και στο προηγούμενο κεφάλαιο χρησιμοποιούμε έναν αλγόριθμο βασι-σμένο στην Απότομη Κάθοδο (steepest - descent projected gradient) μέθοδο Το βήμα για τηπροβολή εn είναι επίσης απαραίτητο αφού ο όρος κατεύθυνσης μπορεί να μην είναι επιθυμητός Χρη-σιμοποιείται η συζυγής κατεύθηνση Fletcher-Reeves ως κατεύθυνση αναζήτησης και στη συνέχειαυπολογίζεται το βήμα προς αυτή την κατεύθυνση Το βήμα εn και εδώ προκύπτει από μια κατάλληλη
100 6 Πείραμα Κατανεμημένου Ελέγχου σε Ημιγραμμικές Παραβολικές μδε
Πίνακας 61 Τάξεις Σύγκλισης για την 2-διάστατη λύση με k = 0 l = 1 (h = τ)
Διακριτοποίηση Σφάλματαh = τ eL2[0T H1
0 (Ω)] rL2[0T H10 (Ω)] g minus ghL2[0T L2(Ω)]
h = 002946280 3631050 005551130 002498330h = 001473140 1508560 002618430 001082740h = 000736570 0772711 001454260 000561528h = 000368285 0391391 000758848 000281426Τάξη Σύγκλισης 1071233 095696566 105004366
Πίνακας 62 Τάξη σύγκλισης για το δισδιάστατο πρόβλημα με k = 0 l = 1 (h2 = τ)
Διακριτοποίηση Σφάλματαh2 = τ eL2[0T H1
0 (Ω)] rL2[0T H10 (Ω)] g minus ghL2[0T L2(Ω)]
h = 01178510 2254550 004141390 007661170h = 00589256 1003230 001943350 002208320h = 00294628 0470049 000914215 000546600h = 00147314 0229416 000445367 000135706Τάξη Σύγκλισης 1051790 106430666 189617666
στρατηγική γραμμικής αναζήτησης (line search strategy) Να σημειώσουμε πως στα πειράματα αυτήςτης παραγράφου (βλέπε Πίνακα 63) και ειδικότερα στη περίπτωση k = 0 αν και σπαταλήσαμε περισσότε-
Πίνακας 63 Τάξη σύγκλισης για το δισδιάστατο πρόβλημα με k = 0 l = 1 (h2 = τ)
Διακριτοποίηση Σφάλματαh2 = τ eL2[0T H1
0 (Ω)] rL2[0T H10 (Ω)] g minus ghL2[0T L2(Ω)]
h = 01178510 2195070 00411142 0348617h = 00589256 0989756 00192208 0098052h = 00294628 0467749 00091017 0027175h = 00147314 0229123 00044466 0008308Τάξη Σύγκλισης 1086690 10695966 1796943
ρους υπολογιστικούς πόρους σε μνήμη καταφέραμε να μειώσουμε σημαντικά τον αριθμό επαναλήψεωντου διπλού βρόγχου επαναλήψεων της μεθόδου κλίσεων από κατά μέσο όρο 31 επαναλήψεις σε 23 (δια-τηρώντας σχεδόν τις ίδιες τάξεις σύγκλισης και παρεμφερή αποτελέσματα) χρησιμοποιώντας τις ισχυρέςWolfe - Powel συνθήκες
1 J(yk+1 gk+1) le J(yk gk) + σεkJprimeTkdk (κανόνας Armijo)
2 |J primek+1dk| le minusρJ primekdkμε 0 lt ρ le σ lt 1 και dk+1 = minusJ primek+1 + βk+1dk με d0 = minusJ primek και με την επιλογή για τον ορισμό των
συζυγών κατευθύνσεων Fletcher-Reeves βk = JprimeTk JprimekJprimekminus12
Πείραμα Κατανεμημένου Ελέγχου σεΕξισώσεις Stokes
Αυτό το κεφάλαιο παρουσιάζει τις θεωρητικές αρχές και τα αντίστοιχα πειραματικά αποτελέσματα για έναπρόβλημα κατανεμημένου ελέγχου σε εξισώσεις Stokes με συνθήκες Dirichlet μηδέν στο σύνορο
71 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου 102
711 Ομαλά δεδομένα 103
7111 Χρονική k = 0 και χωρική TaylorHood διακριτοποίηση 103
7112 Χρονική k = 1 και χωρική TaylorHood διακριτοποίηση 103712 Δεδομένα με μικρή ομαλότητα (ασυνέχεια στα y0 yd g) 105
7121 Διακριτοποίηση χωρίς περιορισμούς στον έλεγχο 105
7122 Διακριτοποίηση με περιορισμούς στον έλεγχο 106
7
Περιεχόμενα
102 7 Πείραμα Κατανεμημένου Ελέγχου σε Εξισώσεις Stokes
71 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου
Σε αυτό το κεφάλαιο περιγράφουμε το μαθηματικό μοντέλο που θα εξετάσουμε σύμφωνα με όσα έχουμεαναφέρει στα προηγούμενα σχετικά με το πρόβλημα κατανεμημένου ελέγχου σε εξελικτικά προβλήματαStokes
Τα παραδείγματα είναι βασισμένα σε αυτά που παρουσιάζονται στην [60 Ενότητα 3] Η πίεση και ηταχύτητα πρέπει να διακριτοποιηθούν σε συμβατούς χώρους πεπερασμένων στοιχείων με τις κατάλληλεςinf-sup συνθήκες να ικανοποιούνται Τέτοιοι κατάλληλοι χώροι είναι για παράδειγμα τα Taylor HoodP2P1 στοιχεία για τη χωρική προσέγγιση της ταχύτηταςπίεσης Για την χρονική προσέγγιση χρησι-μοποιούμε dG σχήματα χρονικού βήματος τάξης k = 0 k = 1 δηλαδή τμηματικά σταθερά και τμηματικάγραμμικά στοιχεία αντιστοίχως
Θεωρούμε ένα αριθμητικό παράδειγμα για την περίπτωση k = 0 και τρία παραδείγματα για την δυ-σκολότερη αλλά με καλύτερες τάξεις σύγκλισης περίπτωση k = 1 για το πρόβλημα μοντέλο στονΩtimes [0 T ] = [0 2]2 times [0 01] επιλέγοντας y|Γ = 0 με γνωστή αναλυτική ακριβής λύση την
y = (y1 y2) = ((cos(2kx)minus 1) sin(2my) sin(2mx)(1minus cos(2ky)))eminusνt2
p = eminusνt((sin(kx)2 sin(my)2)k2 + (cos(2kx)minus 1)2 sin(2my)2
+ sin(2mx)2(1minus cos(2ky))2)2g = (g1 g2)
όπου
g1 = ((((kν sin(kx)2 minus kν cos(kx)2 + kν) cos(my) sin(my) + ((minus8km2 minus 8k3) sin(kx)2
+(8km2 + 8k3) cos(kx)2 minus 8km2) cos(my) sin(my)))keminusνt2g2 = (((k2ν sin(2mx) cos(2ky)minus k2ν sin(2mx)) + (minus8k2m2 minus 8k4) sin(2mx) cos(2ky)
+8k2m2 sin(2mx)))(2k2))eminusνt2
αρχική ταχύτητα y0 = ((cos(2kx)minus 1) sin(2my) sin(2mx)(1minus cos(2ky))) και στόχο yd = (yd1 yd2) =(05 05)
Ο όρος δύναμης f = (f1 f2) μπορεί εύκολα να υπολογιστεί από την βασική εξίσωση τοποθετώντας τηνπαραπάνω ακριβής λύση και πιο συγκεκριμένα
f1 = (((cos(kx) sin(kx) sin(my)2 + (16k2 cos(kx) sin(kx)3 + (16k2 cos(kx)minus16k2 cos(kx)3) sin(kx)) cos(my)2 sin(my)2 + ((16km cos(mx) sin(mx)3
minus16km cos(mx)3 sin(mx)) cos(ky)2 minus 8km cos(mx) sin(mx)3
+8km cos(mx)3 sin(mx)) sin(ky)2 + (8km cos(mx) sin(mx)3
minus8km cos(mx)3 sin(mx)) cos(ky)2 minus 8km cos(mx) sin(mx)3
+8km cos(mx)3 sin(mx)))k)eminusνtf2 = (((2m sin(kx)2 cos(my) sin(my) + (minus4k2m sin(2kx)2 minus 8k2m cos(2kx)
+8k2m) cos(2my) sin(2my) + (4k3 sin(2mx)2 minus 4k3 sin(2mx)2 cos(2ky)) sin(2ky)))(2k2))eminusνt
Αναμένουμε για την ταχύτητα O(h3 + τk+1) και O(h2 + τk+1) τάξεις σύγκλισης για τις νόρμεςL2[0 T L2(Ω)] και L2[0 T H1(Ω)] αντιστοίχως
Σε όλα τα παραδείγματα επιλέγουμε σταθερή την παράμετρο ομαλοποίησης στο συναρτησιακό και ίσημε α = 10minus4 και οι ελεύθερες παράμετροι παρόμοια με το [32] ν = 1 k = π m = π και λ = 1 Το
71 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου 103
πρόβλημα βέλτιστου ελέγχου επιλύεται με το πακέτο πεπερασμένων στοιχείων FreeFem++ βλέπε και[64] χρησιμοποιώντας έναν αλγόριθμο κλίσεων
711 Ομαλά δεδομένα
Σrsquo αυτή την ενότητα μελετάμε τη περίπτωση που τα αρχικά δεδομένα είναι ομαλά και με γνωστή βέλτιστηλύση Να παρατηρήσουμε πως ως αρχικό βήμα έχουμε h = 047 αρκετά μεγαλύτερο από τα αντίστοιχαπαραδείγματα στα προηγούμενα κεφάλαια διότι εδώ το χωρίο είναι μεγαλύτερο (τετράγωνο πλευράς 2)οπότε μας επιτρέπεται μια τέτοια διαμέριση Στο τέλος του παρόντος κεφαλαίου αναφέρονται και οιαντίστοιχοι βαθμοί ελευθερίας
Σε όλα τα παραδεἰγματα επιβεβαιώνονται οι τάξεις σύκλισης σύμφωνα με τη θεωρία Γενικά όμως είναιδύσκολο να λυθεί υπολογιστικά το σύστημα και ειδικά για τη περίπτωση k = 1 έχουμε μόνο για τοδιάνυσμα της ταχύτητας ένα σύστημα 4 εξισώσεων
7111 Χρονική k = 0 και χωρική TaylorHood διακριτοποίηση
Παράδειγμα 1 (k = 0 για τ = h28) ΄Εστω τ = h28 Περιμένουμε
eL2[0T L2(Ω)] = O(h2) και eL2[0T H1(Ω)] = O(h2)
Για αυτή την επιλογή πλέγματος τα αντίστοιχα σφάλματα φαίνονται στο Πίνακα 71
Πίνακας 71 Τάξεις Σύγκλισης για k = 0 και τ = h28
Διακριτοποίηση Σφάλματα Ταχύτητας - Ελέγχουτ = h28 eL2[0T L2(Ω)] eL2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]
h = 04714050 0110215 181853 533150h = 02357022 0011512 043118 063211h = 01178511 0002031 011109 011369h = 00589255 0001255 002922 007081Τάξη Σύγκλ 2152143 198600 207596
7112 Χρονική k = 1 και χωρική TaylorHood διακριτοποίηση
Παράδειγμα 2 (k = 1 για τ = h16) ΄Εστω τ = h16 Περιμένουμε
eL2[0T L2(Ω)] = O(h2) eL2[0T H1(Ω)] = O(h2)
Για αυτή την επιλογή πλέγματος τα αντίστοιχα σφάλματα φαίνονται στον Πίνακα 72 Τονίζουμε ότι ηαρκετά lsquolsquoάγριαrsquorsquo επιλογή βήματος τ asymp h δίνει επίσης τα αναμενόμενα θεωρητικά αποτελέσματα τα οποίαεπισημαίνουν την lsquolsquoπεπλεγμένη (implicit)rsquorsquo φύση των dG σχημάτων χρονικού βήματος
104 7 Πείραμα Κατανεμημένου Ελέγχου σε Εξισώσεις Stokes
Πίνακας 72 Τάξεις Σύγκλισης για k = 1 με τ = h16
Διακριτοποίηση Σφάλματα Ταχύτητας - Ελέγχουτ = h16 eL2[0T L2(Ω)] eL2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]
h = 04714050 0108866 2315120 5470750h = 02357022 0010535 0453111 0607322h = 01178511 0001838 0113375 0083115h = 00589255 0000832 0028927 0020270Τάξη Σύγκλ 2343953 2107000 2686666
Παράδειγμα 3 (k = 1 για τ = h3210) ΄Εστω τ = h3210 Περιμένουμε
eL2[0T L2(Ω)] = O(h3) eL2[0T H1(Ω)] = O(h2)
Για αυτή την επιλογή πλέγματος τα αντίστοιχα σφάλματα φαίνονται στον Πίνακα 73 Εδώ παίρνουμετα σφάλματα για την L2[0 T L2(Ω)] νόρμα με μία πιο lsquolsquoάγριαrsquorsquo επιλογή χρονικού βήματος
Πίνακας 73 Τάξεις Σύγκλισης για k = 1 με τ = h3210
Διακριτοποίηση Σφάλματα Ταχύτητας - Ελέγχουτ = h3210 eL2[0T L2(Ω)] eL2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]h = 04714050 01138780 2420150 5718610h = 02357022 00104282 0455479 0610602h = 01178511 00014891 0112681 0082763h = 00589255 00004965 0028212 0020051Τάξη Σύγκλ 26137833 2140366 2718333
Παράδειγμα 4 (k = 1 για τ = h28) ΄Εστω τ = h28 Περιμένουμε
eL2[0T L2(Ω)] = O(h3) eL2[0T H1(Ω)] = O(h2)
Για αυτή την επιλογή πλέγματος τα αντίστοιχα σφάλματα φαίνονται στο Πίνακα 74
Πίνακας 74 Τάξεις Σύγκλισης για k = 1 με τ = h28
Διακριτοποίηση Σφάλματα Ταχύτητας - Ελέγχουτ = h28 eL2[0T L2(Ω)] eL2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]
h = 04714050 0105817 2251280 5320290h = 02357022 0010357 0461360 0618637h = 01178511 0001298 0112730 0082865h = 00589255 0000355 0028156 0020091Τάξη Σύγκλ 2739333 2106666 2671000
Σημείωση 711 Εδώ παρατηρούμε πως συγκρίνοντας τη περίπτωση k = 0 με τη περίπτωσηk = 1 βλέπε πχ Πίνακες 71 74 έχουμε σχεδόν ίδια σφάλματα για την περίπτωση σφαλμάτωνστην L2[0 T H1(Ω)] νόρμα και σχεδόν ίσα με 002922 για k = 0 και 0028156 για k = 1 Επίσηςπαρατηρούμε πολύ μικρότερα σφάλματα για την L2[0 T L2(Ω)] της τάξης από 0001 για k = 0 σε00003 για k = 1 Το ελαχιστοποιημένο συναρτησιακό ελαχιστοποιείται καλύτερα όταν k = 1 και πιοσυγκεκριμένα έχει τιμή 007 για k = 0 ενώ όταν k = 1 είναι 002
71 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου 105
712 Δεδομένα με μικρή ομαλότητα (ασυνέχεια στα y0 yd g)
Σrsquo αυτήν την ενότητα μελετάμε τη περίπτωση που τα αρχικά δεδομένα είναι μη ομαλά και η ακριβήςαριθμητική λύση είναι άγνωστη Ειδικότερα για να συγκρίνουμε και να βρούμε τα σφάλματα θεωρούμεως λύση μια λύση σε προχωρημένο πλέγμα πχ σε διαμέριση 96times 96 του τετραγώνου και η σύγκρισηγίνεται χρησιμοποιώντας παρεμβολή για τα διαφορετικά Uh
Στα επόμενα παραδείγματα θα χρησιμοποιήσουμε χρονική k = 0 και χωρική TaylorHood διακριτοπο-ίηση
7121 Διακριτοποίηση χωρίς περιορισμούς στον έλεγχο
΄Οπως φαίνεται παρακάτω εφαρμόζουμε ασυνέχεια στα αρχικά δεδομένα καθώς και στο στόχο yd
Παράδειγμα 5 (k = 0 για τ = h28 και ασυνέχεια) Σε αυτό το παράδειγμα αναμένουμε τάξειςσύγκλισης
eL2[0T L2(Ω)] = O(h) rL2[0T L2(Ω)] = O(h)
Επιλέγουμε f = (f1 f2) όπως προηγουμένως αλλά ασυνέχεια στο στόχο στον έλεγχο και στη βασικήμεταβλητή y καθώς και στη συζυγή μεταβλητή micro όπως παρακάτω
yd(x1 x2) = (yd1(x1 x2) yd2(x1 x2))
όπου
yd1(x1 x2) = yd2(x1 x2) =
05 + 6 y ge 05 και x ge 0505 y lt 05 και x lt 05
y0(x1 x2) = (y01(x1 x2) y02(x1 x2))
όπου
y01(x1 x2) =
6 + (cos(2kx)minus 1)sin(2my) y ge 05 και x ge 05(cos(2kx)minus 1)sin(2my) y lt 05 και x lt 05
y02(x1 x2) =
6 + sin(2mx)(1minus cos(2ky)) y ge 05 και x ge 05sin(2mx)(1minus cos(2ky)) y lt 05 και x lt 05
Για την εκκίνηση της μεθόδου κλίσης χρησιμοποιήθηκε αρχικός έλεγχος
g0(x1 x2) = (g01(x1 x2) g02(x1 x2))
όπου
g01(x1 x2) =
6 + ((((kνsin(kx)2 minus kνcos(kx)2 + kν)cos(my)sin(my)minus((8km2 + 8k3)sin(kx)2 + (8km2 + 8k3)cos(kx)2 minus 8km2)cos(my)sin(my)))k)
για y ge 05 και x ge 05((((kνsin(kx)2 minus kνcos(kx)2 + kν)cos(my)sin(my)minus((8km2 + 8k3)sin(kx)2 + (8km2 + 8k3)cos(kx)2 minus 8km2)cos(my)sin(my)))k)
για y lt 05 και x lt 05
106 7 Πείραμα Κατανεμημένου Ελέγχου σε Εξισώσεις Stokes
g02(x1 x2) =
6 + ((((k2νsin(2mx)cos(2ky)minus k2νsin(2mx)) + (minus8k2m2
minus8k4)sin(2mx)cos(2ky) + 8k2m2sin(2mx))(2k2))y ge 05 και x ge 05
((((k2νsin(2mx)cos(2ky)minus k2νsin(2mx)) + (minus8k2m2
minus8k4)sin(2mx)cos(2ky) + 8k2m2sin(2mx))(2k2))y lt 05 και x lt 05
Πίνακας 75 Τάξεις Σύγκλισης για k = 0 με τ = h28 με ασυνέχεια στα αρχικά δεδομένα και ασυνέχειαστο στόχο
Διακριτοποίηση Σφάλματα Ταχύτητας - Ελέγχουτ = h28 eL2[0T L2(Ω)] rL2[0T L2(Ω)] J(yg)
h = 04714050 0126828 00079597 1480282h = 0235702 0036255 00015081 9742095h = 0117851 0014052 00004364 9608375h = 0058925 0004472 00000703 9619787h = 0029462 - - 9612306Τάξη Σύγκλ 1608596 22742714 -
7122 Διακριτοποίηση με περιορισμούς στον έλεγχο
Σrsquo αυτήν την ενότητα μελετάμε τη περίπτωση που τα αρχικά δεδομένα είναι μη ομαλά και η ακριβήςαριθμητική λύση είναι επίσης άγνωστη αλλά εξετάζουμε τη περίπτωση περιορισμών στον έλεγχο minus85 legi le 85 για το Παράδειγμα 6 και minus05 le gi le 05 Για το Παράδειγμα 7 εφαρμόζουμε ασυνέχεια στααρχικά δεδομένα καθώς και στο στόχο yd όμοια με το προηγούμενο παράδειγμα
Παράδειγμα 6 (k = 0 για τ = h28 με ασυνέχεια και περιορισμούς στον έλεγχο) Αναμένουμετάξεις σύγκλισης επίσης
eL2[0T L2(Ω)] = O(h) rL2[0T L2(Ω)] = O(h)
Επιλέγουμε f = (f1 f2) όπως προηγουμένως με ασυνέχεια στο στόχο στον έλεγχο και στη βασικήμεταβλητή y καθώς και στη συζυγή μεταβλητή micro
Για την εκκίνηση της μεθόδου κλίσης χρησιμοποιήθηκε αρχικός έλεγχος
g0(x1 x2) = (g01(x1 x2) g02(x1 x2)) = (0 0)
Παράδειγμα 7 (k = 0 για τ = h28 με ασυνέχεια και περιορισμούς στον έλεγχο) Αναμένουμετάξεις σύγκλισης επίσης
eL2[0T L2(Ω)] = O(h) rL2[0T L2(Ω)] = O(h)
Επιλέγουμε f = (f1 f2) όπως προηγουμένως με ασυνέχεια στον έλεγχο και στη βασική μεταβλητή yαλλά όχι στη συνάρτηση στόχο
71 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου 107
Πίνακας 76 Τάξεις Σύγκλισης για k = 0 με τ = h28 με ασυνέχεια στα αρχικά δεδομένα ασυνέχεια στοστόχο και ασθενείς περιορισμούς στον έλεγχο
Διακριτοποίηση Σφάλματα Ταχύτητας - Συναρτησιακότ = h28 eL2[0T L2(Ω)] J(yg)
h = 0471405 0125484 1435750h = 0235702 0038590 9417572h = 0117851 0014412 9289013h = 0058925 0004503 9299375h = 0029462 - 9291695Τάξη Σύγκλ 1600097 -
Για την εκκίνηση της μεθόδου κλίσης χρησιμοποιήθηκε αρχικός έλεγχος
g0(x1 x2) = (g01(x1 x2) g02(x1 x2)) = (6 6)
Πίνακας 77 Τάξεις Σύγκλισης για k = 0 με τ = h28 με ασυνέχεια στα αρχικά δεδομένα και ισχυρούςπεριορισμούς στον έλεγχο
Διακριτοποίηση Σφάλματα Ταχύτητας - Συναρτησιακότ = h28 eL2[0T L2(Ω)] J(yg)
h = 0471405 0125664 2265422h = 0235702 0038621 1478615h = 0117851 0014417 1455425h = 0058925 0004504 1455310h = 0029462 - 1453629Τάξη Σύγκλ 1600733 -
Σημείωση 712 Στα πειράματα χωρίς περιορισμούς στον έλεγχο και με αυστηρούς περιορισμούςστον έλεγχο για μη ομαλά αρχικά δεδομένα όπως φαίνεται στους Πίνακες αποτελεσμάτων 75 και 77παρατηρούμε παρεμφερείς τιμές για την L2[0 T L2(Ω)] νόρμα σφάλματος και ίδια τάξη σύγκλισηςόπως ήταν αναμενόμενο ενώ το ελαχιστοποιημένο συναρτησιακό έχει πολύ μεγαλύτερες τιμές ότανεπιβάλλονται ισχυροί περιορισμοί στον έλεγχο
Σημείωση 713 Στα Σχήματα 71 72 παραθέτουμε ενδεικτικά κάποια στιγμιότυπα της βασικήςμεταβλητής για το παράδειγμα με ομαλά δεδομένα σε δυο διαφορετικά πλέγματα Σημειώνουμε πως στιςβάσεις των σχημάτων εμφανίζονται τα αντίστοιχα διανύσματα ενώ η τρισδιάστατη απεικόνιση πάνω απότη βάση του σχήματος αναπαριστά τη πίεση Στα Σχήματα 73 74 75 παραθέτουμε ενδεικτικά κάποιαστιγμιότυπα της βασικής μεταβλητής για το παράδειγμα με μη ομαλά δεδομένα για τη βασική και τησυζυγή μεταβλητή σε αρχικό στάδια με την εκκίνηση με τα ασυνεχή δεδομένα και στη συνέχειακαθώς η βασική λύση πλησιάζει το στόχο
Σημείωση 714 Αναφέρουμε πως οι βαθμοί ελευθερίας σχετικά με τα παραπάνω παραδείγματα γιακάθε διαμέριση εξελίσσονται ως εξής
bull αν τ = O(h2)8 είναι [Uhndof Phndof T imendof)] = [169 49 72] [625 169 288] [2401 625 1152][9409 2401 4608] ([37249 9409 18432]) σε κάθε πλέγμα
bull αν τ = O(h)16 είναι [Uhndof Phndof T imendof)] = [169 49 68] [625 169 136] [2401 625 272][9409 2401 544] ([37249 9409 1087])
bull αν τ = O(h32)10 είναι [Uhndof Phndof T imendof)] = [169 49 43] [625 169 85] [2401 625 170][9409 2401 340] ([37249 9409 679])
108 7 Πείραμα Κατανεμημένου Ελέγχου σε Εξισώσεις Stokes
Σχήμα 71 Στιγμιότυπο της βασικής μεταβλητής σε πλέγμα 12x12 με ομαλά δεδομένα
Σχήμα 72 Στιγμιότυπο της βασικής μεταβλητής σε πλέγμα 24x24 με ομαλά δεδομένα
71 Κατανεμημένος έλεγχος - Περιγραφή του μοντέλου 109
Σχήμα 73 Στιγμιότυπο της βασικής μεταβλητής με μη ομαλά δεδομένα σε αρχικό χρονικό στάδιο
Σχήμα 74 Στιγμιότυπο της βασικής μεταβλητής με μη ομαλά δεδομένα σε τελικό χρονικό στάδιο
110 7 Πείραμα Κατανεμημένου Ελέγχου σε Εξισώσεις Stokes
Σχήμα 75 Στιγμιότυπο της συζυγούς μεταβλητής με μη ομαλά δεδομένα
επίσης να σημειώσουμε πως για k = 0 έχουμε να λύσουμε ως προς 8 μεταβλητές το σύστημα - 3για το ευθύ 3 για το συζυγές πρόβλημα και 2 για τον έλεγχο και για k = 1 έχουμε να λύσουμε ωςπρος 14 μεταβλητές το σύστημα - 6 για το ευθύ 6 για το συζυγές πρόβλημα και 2 για τον έλεγχοΥπενθυμίζουμε πως κάθε μεταβλητή είναι ακολουθία πολυωνύμων στο χώρο (τιμές σε κάθε σημείο τουπλέγματος)
Σημείωση 715 Τέλος υπενθυμίζουμε πως στα τελευταία παραδείγματα θεωρήσαμε ως λύση τηλύση σε προχωρημένο πλέγμα και ενδεικτικά είχαμε τους βαθμούς ελευθερίας που αναφέρονται στιςπαρενθέσεις στη παραπάνω σημείωση
Εφαρμογή στη Βιολογία ΠείραμαΚατανεμημένου Ελέγχου σε Συστήματα
Ημιγραμμικών Παραβολικών μδεΑυτό το κεφάλαιο παρουσιάζει τις θεωρητικές αρχές και τα αντίστοιχα πειραματικά αποτελέσματα για έναπρόβλημα κατανεμημένου ελέγχου σε συστήματα ημιγραμμικών παραβολικών εξισώσεων με Dirichletμηδέν συνοριακές συνθήκες - (FitzHugh-Nagumo σύστημα)
81 Κατανεμημένος έλεγχος σε συστήματα FitzHugh-Nagumo 112811 Εισαγωγή - Ιστορική αναδρομή 112
812 Περιγραφή του μοντέλου 113
813 Η ασθενής μορφή 113
814 Το πλήρως διακριτοποιημένο πρόβλημα 114
815 Αριθμητικές εφαρμογές 115
8
Περιεχόμενα
1128 Εφαρμογή στη Βιολογία Πείραμα Κατανεμημένου Ελέγχου σε Συστήματα
Ημιγραμμικών Παραβολικών μδε
81 Κατανεμημένος έλεγχος σε συστήματα FitzHugh-Nagumo
811 Εισαγωγή - Ιστορική αναδρομή
Η θεωρία Βέλτιστου ελέγχου έχει πολλές και πολύ χρήσιμες εφαρμογές σε πολλούς επιστημονικούςτομείς όπως την Βιολογία την Ιατρική τη Μηχανική τη Κοινωνιολογία Στη συνέχεια παραθέτουμε μιαεφαρμογή που σχετίζεται με τη Βιολογία και μας δείχνει πόσο σημαντική και άμεσα εφαρμόσιμη είναι ηθεωρία βέλτιστου ελέγχου σε πραγματικά προβλήματα
Μια από τις πιο σημαντικές ανακαλύψεις του 20ου αιώνα στη βιοφυσική είναι η κατανόηση για το πως τανεύρα μεταφέρουν πληροφορία Η βασική ανακάλυψη σχετίζει τη μεταφορά ιόντων καλίου και νατρίου(επίσης νατρίου και ασβεστίου) κατά μήκους της εξωτερικής μεμβράνης ενός κυττάρου του νεύρου σεηλεκτρικά σήματα τα οποία μπορούν να διαδίδονται κατά μήκος της μεμβράνης μετά από κατάλληληδιέγερση Οι Alan Hodqkin και Andrew Huxley (δουλεύοντας νωρίς στη δεκαετία του 1950) περι-έγραψαν τη θεωρία για τη μεταφορά ιόντων δημιούργησαν ένα μαθηματικό μοντέλο και ερμήνευσαντα πειραματικά δεδομένα για ηλεκτρικά σήματα διεγερμένα σε καλαμαροειδείς νευροάξονες και βραβε-ύτηκαν με βραβείο Nobel στη Φυσιολογία και Ιατρική το 1963 Το γνήσιο Hodgkin-Huxley μοντέλοαποτελείται από τέσσερις σδε Απλοποιήσεις του βασικού μοντέλου τροποποιήσεις προσαρμόσιμες σεάλλα διεγέρσιμα μέσα (για παράδειγμα μυϊκών κυττάρων) και εξάρτησης από το χώρο έχουν μελετηθείεκτενώς
Μια από τις περισσότερο σημαντικές απλοποιήσεις του μοντέλου Hodgkin-Huxley παρουσιάστηκε πρω-τοποριακά από τον Richard Fitzhugh από τη πλευρά της μαθηματικής και αριθμητικής ανάλυσης ΄Εναηλεκτρικό κύκλωμα για ένα ανάλογο μοντέλο κατασκευάστηκε από τον Jin-Ichi Nagumo Αυτό τομοντέλο των δυο καταστάσεων το οποίο ακόμη χρησιμοποιείται εκτενώς περιγράφει τη ποιοτική ηλε-κτρική συμπεριφορά διεγερμένων κυττάρων νεύρου Θα μελετήσουμε αυτό το μοντέλο Ωστόσο είμαστεμακρυά από το να κατανοήσουμε πλήρως τα βιολογικά διεγέρσιμα μέσα Πολλές σύγχρονες μελέτες ε-πικεντρώνονται στη μεταφορά ιόντων Οι ζωντανές μεμβράνες περιέχουν διάφορα κανάλια ιόντων (κατάμήκος της μεμβράνης) και είναι επιλεκτικά σε συγκεκριμένα ιόντα Οι μηχανισμοί μεταφοράς και οιδιακόπτες που ανοίγουν και κλείνουν τα κανάλια ιόντων είναι θεμελιώδη για τη λειτουργία πολλών βιο-λογικών διεργασιών Επίσης δίκτυα νευρικών κυττάρων και άλλα διεγέρσιμα μέσα είναι πανταχού παρώνστη βιολογία Η μελέτη τέτοιων δικτύων μπορεί να οδηγήσει στη κατανόηση για το πως λειτουργεί οεγκέφαλος Τα μαθηματικά παίζουν έναν αυξανόμενο ρόλο σημασίας σrsquo αυτή τη περιοχή διεπιστημονικήςέρευνας
Η μεταβλητή κατάστασης y1 αναπαριστά τη τάση και επίσης ονομάζεται δράση ή δυναμικό μεμβράνηςκαι η y2 ονομάζεται μεταβλητή ανάκτησης (η μεταβλητή τάσης εμφανίζει κυβική μη γραμμικότητα πουεπιτρέπει αναγενώσιμη αυτο-διέγερση μέσω της θετικής ανάδρασηςκαι η μεταβλητή ανάκτησης έχει μιαγραμμική δυναμική που παρέχει μια περισσότερο αργή αρνητική ανάδραση)
Το μοντέλο Fitzhugh-Nagumo δεν κατασκευάστηκε τόσο για να κάνει πρόβλεψη αλλά για να συλλάβειτα βασικά ποιοτικά χαρακτηριστικά της ηλεκτρικής δραστηριότητας κατά μήκος ενός νευρώνα
Η πιο σημαντική πρόβλεψη του μοντέλου (το οποίο συμφωνεί με πειραματικά δεδομένα) είναι η ύπαρξηενός ορίου του παλμού ερεθίσματος που παράγει οδεύοντα κύματα τάσης (και ανάκτησης) κύματα πουδιαδίδονται μακριά από το χωρική θέση του ερεθίσματος Το οδεύων κύμα του δυναμικού της μεμβράνηςπου διαδίδεται-ταξιδεύει είναι ο μηχανισμός που ευθύνεται για τη μεταφορά πληροφοριών κατά μήκοςτου νευρώνα πρόβλεψης
Το κύκλωμα Hodgkin-Huxley υποτίθεται πως μοντελοποιεί την ηλεκτρική δραστηριότητα σε ένα σημείοενός νεύρου Η διαδικασία ανοίγματος και κλεισίματος καναλιών ιόντων μοντελοποιείται με τη διάχυση
81 Κατανεμημένος έλεγχος σε συστήματα FitzHugh-Nagumo 113
της τάσης (η οποία αντιστοιχεί στην αδιάστατη κατάσταση y1) Η χωρική εξάρτηση μοντελοποιείταιως διάχυση όπου δ είναι η διαχυσιμότητα Προσθέτοντας αυτόν τον όρο στο δεξί μέλος του μον-τέλου κυκλώματος και μεταβάλλοντας επίσης τη χωρική μεταβλητή παίρνουμε την αδιάστατη μορφήτων εξισώσεων Fitzhugh-Nagumo
Η διάχυση στις εξισώσεις Fitzhugh-Nagumo μοντελοποιεί τη χωρική σύζευξη μεταξύ των καναλιώνιόντων κατά μήκους του νεύρου
Είναι αξιοσημείωτο πως για δ ltlt 1 το σύστημά μας γίνεται παρόμοιο με αυτό που περιγράφεται στηπρόσφατη εργασία [78]
812 Περιγραφή του μοντέλου
Σrsquo αυτήν την ενότητα παραθέτουμε το μαθηματικό μοντέλο που σχετίζεται με τη παραπάνω περιγραφήκαι πιο συγκεκριμένα θέλουμε να ελαχιστοποιήσουμε το συναρτησιακό
J(y g) = 12
int T
0y1 minus y1d2L2(Ω) dt+ γ1
2
int T
0g12L2(Ω) dt
+ 12
int T
0y2 minus y2d2L2(Ω))dt+ γ2
2
int T
0g22L2(Ω) dt (811)
υπό τους περιορισμούς
party1parttminus∆y1 + y3
1 minus y1 = minusy2 + g1 + f1 στο (0 T ]times Ω y1 = 0 στο (0 T ]times Γ
party2parttminus δ∆y2 + εa1y2 = εy1 + g2 + f2 στο (0 T ]times Ω y2 = 0 στο(0 T ]times Γ (812)
y1(0 x) = y10 y2(0 x) = y20 στο Ω
και τους περιορισμούς ελέγχου
gia le gi(t x) le gib για σχεδόν παντού (t x) isin (0 T )times Ω όπου gia gib isin R i = 1 2
813 Η ασθενής μορφή
Ξεκινώντας παραθέτουμε την ασθενή μορφή της βασικής εξίσωσης Δεδομένων των f1 f2 isin L2 [0 T Hminus1(Ω)]
των ελέγχων g1 g2 isin L2 [0 T L2(Ω)] και αρχικών καταστάσεων y10 y20 isin L2(Ω) αναζητούμε
y1 y2 isin L2[0 T H10 (Ω)] capH1[0 T Hminus1(Ω)] τέτοια ώστε για σχεδόν παντού t isin (0 T ] και για όλα τα
v isin H1(Ω)
〈y1t v〉+ α(y1 v) +langy3
1 minus y1 vrang
= 〈f1 v〉+ 〈g1 v〉 και (y1(0) v) = (y10 v)〈y2t v〉+ δα(y2 v) = ε(y1 minus a1y2 v) + 〈g2 v〉+ 〈f2 v〉 και (y2(0) v) = (y20 v)
(813)
Μια ισοδύναμη μορφή η οποία είναι πιο κατάλληλη για την ανάλυση dG σχημάτων είναι να αναζη-τούμε (ygi gi) equiv (yi gi) isin W (0 T ) times Aad i = 1 2 (μοναδικά βέλτιστα ζεύγη) Τότε υπάρχει μιασυζυγή μεταβλητή micro1 micro2 isin W (0 T ) που ικανοποιεί micro1(T ) = micro2(T ) = 0 τέτοια ώστε για όλα τα
1148 Εφαρμογή στη Βιολογία Πείραμα Κατανεμημένου Ελέγχου σε Συστήματα
Ημιγραμμικών Παραβολικών μδε
v isin L2[0 T H1(Ω)] capH1[0 T Hminus1(Ω)]
(y1(T ) v(T )) +int T
0
(minus〈y1 vt〉+ α (y1 v) +
(y3
1 minus y1 v))dt
= (y10 v(0)) +int T
0(〈f1 minus y2 v〉)dt+
int T
0(〈g1 v〉)dt (814)
(y2(T ) v(T )) +int T
0(minus〈y2 vt〉+ δα (y2 v))dt
= (y20 v(0)) +int T
0(〈ε(y1 minus a1y2) v〉+ 〈f2 v〉)dt+
int T
0(〈g2 v〉)dt (815)
int T
0
(〈micro1 vt〉+ α (micro1 v) +
lang(3y2
1 minus 1)micro1 vrang)dt
= minus(micro1(0) v(0)) +int T
0((y1 minus y1d v)) dt (816)
int T
0(〈micro2 vt〉+ α (micro2 v)minus 〈εa1micro2 v〉) dt
= minus(micro2(0) v(0)) +int T
0((y2 minus y2d v)) dt (817)
με περιορισμούς ελέγχων
int T
0
int
Ω
((αg1 + micro1) (u1 minus g1) (αg2 + micro2) (u2 minus g2)
)dxdt ge 0 forallu1 u2 isin Aad (818)
Επιπλέον αν yit microit isin L2[0 T Hminus1(Ω)] σημειώνουμε πως η (818) είναι ισοδύναμη με
gi(t x) = Proj[giagib]
(minus 1αmicroi(t x)
)
για σχεδόν παντού (t x) isin (0 T ]times Ω Επιπλέον microit isin L2[0 T H2(Ω)] cap L2[0 T L2(Ω)] i = 1 2
814 Το πλήρως διακριτοποιημένο πρόβλημα
΄Εστω (yh(gih) gih) equiv (yih gih) isin UhtimesL2[0 T Uh] i = 1 2 συμβολίζουν τα μοναδικά βέλτιστα ζεύγηΤότε υπάρχει μια συζυγή μεταβλητή micro1 micro2 isin Uh που ικανοποιεί microN1h+ = microN2h+ = 0 τέτοια ώστευh isin Pk[tnminus1 tnUh] και για όλα τα n = 1 N
(yn1 υn) +int tn
tnminus1
(minus〈y1h υht〉+ α (y1h υh) +
(y3
1h minus y1h υh))dt
= (y1nminus1 υnminus1
+ ) +int tn
tnminus1(〈f1 minus y2h υh〉)dt+
int tn
tnminus1(〈g1 υh〉)dt (819)
(yn2 υn) +int tn
tnminus1(minus〈y2h υht〉+ δα (y2h υh))dt
= (y2nminus1 υnminus1
+ ) +int tn
tnminus1(〈ε(y1h minus a1y2h) υh〉+ 〈f2 υh〉)dt+
int tn
tnminus1(〈g2 υh〉)dt(8110)
81 Κατανεμημένος έλεγχος σε συστήματα FitzHugh-Nagumo 115
(micron1+ υn) +
int tn
tnminus1
(〈micro1h υht〉+ α (micro1h υh) +
lang(3y2
1h minus 1)micro1h vrang)dt
= minus(micronminus11+ υnminus1
+ ) +int tn
tnminus1((y1h minus y1d v)) dt (8111)
(micron2+ υn) +
int tn
tnminus1(〈micro2h υht〉+ α (micro2h υh)minus 〈εa1micro2h υh〉) dt
= minus(micronminus12+ υnminus1
+ ) +int tn
tnminus1((y2h minus y2d v)) dt (8112)
με τους περιορισμούς ελέγχων
int T
0
int
Ω
((αg1h + micro1h) (u1h minus g1h) (αg2h + micro2h) (u2h minus g2h)
)dxdt ge 0 (8113)
forallu1h u2h isin Adad
Επιπλέον η (8113) είναι ισοδύναμη με την
gih(t x) = Proj[giagib]
(minus 1αmicroih(t x)
) i = 1 2
για σχεδόν παντού (t x) isin (0 T ]times Ω
Λόγω της παρουσίας των ορίων gia gib για τη μεταβλητή ελέγχου μια προβολή πάνω στο σύνολο τωναποδεκτών ελέγχων είναι απαραίτητη η οποία δίνεται από τη συνάρτηση αποκοπής Εξαιτίας της παρου-σίας φραγμάτων για τη μεταβλητή ελέγχου χρειάζεται μια προβολή πάνω στο σύνολο των επιθυμητώνελέγχων η οποία δίνεται από τη συνάρτηση αποκοπής
P[giagib](g) = maxgiamingib g
815 Αριθμητικές εφαρμογές
Σrsquo αυτήν την ενότητα παρουσιάζουμε τις τάξεις σύγκλισης σφαλμάτων σε περιπτώσεις με περιορισμούςστον έλεγχο και χωρίς περιορισμούς όταν για την προσέγγιση χρησιμοποιούμε k = 0 l = 1 (σταθεράπολυώνυμα στο χρόνο και γραμμικά στο χώρο) με τ = O(h2) και τ = O(h) για την βασική μεταβλητήκαι τη συζυγή μεταβλητή στην L2[0 T H1
0 (Ω)] νόρμα και τον έλεγχο στην L2[0 T L2(Ω)] νόρμα
Για τα αποτελέσματα χρησιμοποιήσαμε το παρακάτω κώδικα αφού αρχικοποιήσαμε n = 0 ε = 1 tol καιg1
0 και g20 Να σημειώσουμε πως πχ το yni είναι επίσης ακολουθία τμηματικά γραμμικών πολυωνύμων
στο χώρο κατά την n επανάληψη της μεθόδου κλίσεων και στη περίπτωση χωρίς περιορισμούς στονέλεγχο θεωρούμε πως τα όρια περιορισμού του ελέγχου gia rarr minusinfin gib rarr infin Πιο συγκεκριμέναθεωρούμε τον αλγόριθμο
bull Βήμα 0 (Αρχική κατάσταση) Επίλυση με g1 = g10 g2 = g2
0 για y1 = y10 y2 = y2
0 τουσυστήματος
y1t minus∆y1 + y31 minus y1 = minusy2 + g1 + f1
y2t minus δ∆y2 + εa1y2 = εy1 + g2 + f2
y1Γ = y2Γ = 0y1(0 x) = y10 y2(0 x) = y20
1168 Εφαρμογή στη Βιολογία Πείραμα Κατανεμημένου Ελέγχου σε Συστήματα
Ημιγραμμικών Παραβολικών μδε
bull Βήμα 1 (Επίλυση συζυγούς εξίσωσης) Υπολογισμός των συζυγών μεταβλητών micro1 = micro1n
micro2 = micro2n επιλύοντας το σύστημα
micro1t + ∆micro1 + (3y21 minus 1)micro1 = y1 minus y1d
micro2t + δ∆micro2 + εa1micro2 = y2 minus y2d
micro1Γ = micro2Γ = 0micro1(T x) = micro2(T x) = 0
bull Βήμα 2 (Νέα κατεύθυνση καθόδου) Λαμβάνουμε ως κατεύθυνση καθόδου την αρνητική κλίσητου συναρτησιακού κόστους
minusJ prime(g1 g2) = minus(γ1g1 + micro1 γ2g2 + micro2)
bull Βήμα 3 (΄Ελεγχος του βήματος) Προσδιορισμός του βέλτιστου μεγέθους βήματος εn επιλύονταςτο πρόβλημα
J(P[g1ag1b]g1
n + εn(γ1g1 + micro1)P[g2ag2b]g2n + εn(γ2g1 + micro2))
)=
= minεgt0
J(P[g1ag1b]g1
n + ε(γ1g1 + micro1)P[g2ag2b]g2n + ε(γ2g1 + micro2)
)
bull Βήμα 4 (Νέα συνάρτηση ελέγχου) Θέτουμε
g1n+1 = P[g1ag1b]g1
n + εn(γ1g1n + micro1
n)
g2n+1 = P[g2ag2b]g2
n + εn(γ2g2n + micro2
n)
bull Βήμα 5 (Νέα κατάσταση) Ελέγχουμε αν Jn le Jnminus1 και θέτουμε ε = 15ε Αν Jn ge Jnminus1
θέτουμε ε = 05ε Εκτελούμε το Βήμα 0 με g1 = g1n+1 g2 = g2
n+1 για y1 = y1n y2 = y2
n
και n = n+ 1 Ο αλγόριθμος σταματά όταν |Jn minus Jnminus1|Jn le tol
Θεωρούμε παραδείγματα με γνωστή λύση στο Ωtimes (0 T ) = (0 001)2times (0 001) και ομογενείς Dirichletσυνοριακές συνθήκες παρόμοια με το Κεφάλαιο 6
Θα επιλέξουμε παραμέτρους δ = 4 a1 = 2 L = 001 H = 001 ε = 00001 σύμφωνα με τη πρόσφατηεργασία [24] θεωρώντας τις ομαλοποιητικές σταθερές - σχετικές με το μέγεθος του ελέγχου για τοσυναρτησιακό γ1 = γ2 = 10minus4
Παράδειγμα 1 Υποθέτουμε συναρτήσεις στόχου
y1d(t x1 x2) = minus(eminusεt(ε sin(πyH)H2 sin(πxL)L2 minus sin(πyH)H2 sin(πxL)L2
+ π2 sin(πyH) sin(πxL)L2 minus sin(πyH)H2 sin(πxL)L2
+ π2 sin(πyH)H2sin(πxL)) + 3 sin(πyH)3H2 sin(πxL)3L2eminus3εt
minus 3eminusεTminus2εt sin(πyH)3H2 sin(πxL)3L2 + eminusεT (sin(πyH)H2 sin(πxL)L2
minus π2 sin(πyH) sin(πxL)L2 minus π2 sin(πyH)H2 sin(πxL))))(H2L2)y2d(t x1 x2) = ((((((2a1ε
2 minus 1) sin(πyH)H2 minus 2δεπ2sin(πyH)) sin(πxL)+ 2εsin(πyH)H2 sin(πxL))L2 minus 2δεπ2sin(πyH)H2 sin(πx)L)eT(2ε)
+ (2δεπ2et(2ε) sin(πyH)minus 2a1ε2et(2ε) sin((πy)H)H2)sin(πxL)L2
+ 2δεπ2et(2ε) sin(πyH)H2 sin(πxL))eminusT(2ε)minust(2ε))(2εH2L2)
81 Κατανεμημένος έλεγχος σε συστήματα FitzHugh-Nagumo 117
και αρχικές συνθήκες
y10(x1 x2) = sin(πx1L)) sin(πx2H)y20(x1 x2) = sin(πx1L) sin(πx2H)
με τέτοιο τρόπο ώστε να έχουμε βέλτιστη λύση για το παραπάνω πρόβλημα (y1 micro1 g1) (y2 micro2 g2) ίσημε
y1(t x1 x2) = eminusεt sin(πx1L) sin(πx2H)y2(t x1 x2) = eminust(2ε)(sin(πx1L))(sin(πx2H))micro1(t x1 x2) = (eεt minus eεT ) sin(πx1L) sin(πx2H)micro2(t x1 x2) = (et(2ε) minus eT(2ε)) sin(πx1L) sin(πx2H)
g1(t x1 x2) = PQad(
(eminus3εtminust(2ε) sin(πyH) sin((πx)L)(et(2ε) sin(πyH)2
sin((πx)L)2 minus εe2εt+t(2ε)))))
g2(t x1 x2) = PQad(a1εe
minust(2ee) sin((πy)H) sin(πxL))
Τονίζουμε πως έχουμε περιορισμούς στον έλεγχο και πιο συγκεκριμένα (gi isin [gia gib])
Πίνακας 81 Τάξεις Σύγκλισης για την δισδιάστατη λύση για τον έλεγχο τη βασική και συζυγή μεταβλητήμε k = 0 l = 1 (τ = O(h)) και περιορισμούς στον έλεγχο
Διακριτοποίηση Σφάλματαh = 2τ eL2[0T H1
0 (Ω)] rL2[0T H10 (Ω)] g minus ghL2[0T L2(Ω)]
h = 0002357022 00439518 886349 425156ε-005h = 0001178511 00214931 314208 120440ε-005h = 0000589255 00108039 120744 441810ε-006h = 0000294627 00054238 555306 326909ε-006h = 0000147313 00027193 282740 307129ε-006Τάξη Σύγκλισης 10036512 124257 0947767750
Πίνακας 82 Τάξεις Σύγκλισης για την δισδιάστατη λύση για τον έλεγχο τη βασική και συζυγή μεταβλητήμε k = 0 l = 1 (τ = O(h2)) και περιορισμούς στον έλεγχο
Διακριτοποίηση Σφάλματαh = τ1216 eL2[0T H1
0 (Ω)] rL2[0T H10 (Ω)] g minus ghL2[0T L2(Ω)]
h = 000235702 00448696 962116 43365ε-005h = 000138889 00216560 253040 12195ε-005h = 000058925 00109022 111981 44012ε-006h = 000029462 00054459 571635 31558ε-006Τάξη Σύγκλισης 10141566 135768 126015110
Παράδειγμα 2 Σrsquo αυτό το παράδειγμα η συνάρτηση ελέγχου είναι χωρίς περιορισμούς και θεωρούμετις δυνάμεις
f1(t x1 x2) = (eminus3εtminust(2ε) sin(πyH) sin(πxL)(minuse2εt+t(2ε)H2L2 + e3εt
+π2e2εt+t(2ε)H2 + π2e2εt+t(2ε)L2))f2(t x1 x2) = (eminusεtminust(2ε) sin(πyH) sin(πxL)(minuseεt minus 2ε2et(2ε)
+2π2δεeεtH2 + 2π2δεeεtL2))(2ε)
1188 Εφαρμογή στη Βιολογία Πείραμα Κατανεμημένου Ελέγχου σε Συστήματα
Ημιγραμμικών Παραβολικών μδε
τις συναρτήσεις στόχου
y1d(t x1 x2) = 2minus cos(πxL) sin(πyH)y2d(t x1 x2) = 2minus sin(πxL) cos(πyH)
και αρχικές συνθήκες
y10(x1 x2) = sin(πx1L)) sin(πx2H)y20(x1 x2) = sin(πx1L) sin(πx2H)
με βέλτιστη λύση (y1 g1) (y2 g2)
y1(t x1 x2) = eminusεt sin(πx1L) sin(πx2H)y2(t x1 x2) = eminust(2ε)(sin(πx1L))(sin(πx2H))g1(t x1 x2) = eminus3εtminust(2ε) sin(πx2H) sin(πx1L)(et(2ε) sin((πx2)H)2 sin((πx1)L)2
minusεe2εt+t(2ε))g2(t x1 x2) = a1εe
minust(2ε) sin(πx2H) sin(πx1L)
Πρέπει να αναφέρουμε πως το πρόβλημα βέλτιστου ελέγχου έχει επίσης λυθεί όπως και τα παραδείγματα
Πίνακας 83 Τιμές του συναρτησιακού και τάξεις σύγκλισης για την δισδιάστατη λύση για τον έλεγχο καιτη βασική μεταβλητή με k = 0 l = 1 (τ = O(h)) και χωρίς περιορισμούς στον έλεγχο
Διακριτοποίηση Σφάλματαh = 2τ eL2[0T H1
0 (Ω)] g minus ghL2[0T L2(Ω)] J(y g)h = 0002357022 00544954 474548ε-005 565672ε-006h = 0001178511 00219039 102414ε-005 364340ε-006h = 0000589255 00107374 260774ε-006 349583ε-006h = 0000294627 00054011 716507ε-007 352582ε-006h = 0000147313 00027120 246111ε-007 353950ε-006Τάξη Σύγκλισης 10815777 18972500000 -
Πίνακας 84 Τιμές του συναρτησιακού και τάξεις σύγκλισης για την δισδιάστατη λύση για τον έλεγχο καιτη βασική μεταβλητή με k = 0 l = 1 (τ = O(h2)) και χωρίς περιορισμούς στον έλεγχο
Διακριτοποίηση Σφάλματαh = τ1222 eL2[0T L2(Ω)] eL2[0T H1
0 (Ω)] g minus ghL2[0T L2(Ω)] J(y g)h = 0002357022 628133ε-005 00544269 473965ε-005 564252ε-006h = 0001388890 130951ε-005 00218849 102321ε-005 363497ε-006h = 0000589250 327452ε-006 00108686 263420ε-006 355844ε-006h = 0000294627 819355ε-007 00054478 720667ε-007 355338ε-006Τάξη Σύγκλισης 20868133333 11068586 20131000000 -
στα προηγούμενα κεφάλαια με το λογισμικό FreeFem++ βλέπε πχ [64]
81 Κατανεμημένος έλεγχος σε συστήματα FitzHugh-Nagumo 119
Παράδειγμα 3 Σrsquo αυτό το παράδειγμα έχουμε περιορίσει τον έλεγχο στο διάστημα [ga gb] και μεδυνάμεις στο δεξί μέλος
f1(t x1 x2) = (eminus3εtminust(2ε)(et(2ε) sin(πyH)3H2 sin(πxL)3L2 minus εe2εt+t(2ε)
sin(πyH)H2 sin(πxL)L2 minus e2εt+t(2ε) sin(πyH)H2 sin(πxL)L2
+e3εt sin(πyH)H2 sin(πxL)L2 + π2e2εt+t(2ε) sin(πyH) sin(πxL)L2
minusPQad(eminus3εt sin(πyH) sin(πxL)(sin(πyH)2 sin(πxL)2 minus εe2εt)
)
e3εt+t(2ε)H2L2 + π2e2εt+t(2ε) sin(πyH)H2 sin(πxL)))(H2L2)f2(t x1 x2) = (eminusεtminust(2ε)(2a1ε
2eεt sin(πyH)H2 sin(πxL)L2 minus eεt sin(πyH)H2 sin(πxL)L2 minus 2ε2et(2ε) sin(πyH)H2 sin(πxL)L2 + 2π2δεeεt
sin(πyH) sin(πxL)L2 minus 2εPQad(a1εe
minust(2ε) sin(πyH) sin(πxL))
eεt+t(2ε)H2L2 + 2π2δεeεt sin(πyH)H2 sin(πxL)))(2εH2L2)
τις ίδιες συναρτήσεις στόχων καθώς και τις αρχικές συνθήκες όπως στο Παράδειγμα 2 έτσι ώστε ηβέλτιστη λύση (y1 g1) (y2 g2) του παραπάνω προβλήματος να δίνονται όπως παρακάτω
y1(t x1 x2) = eminusεt sin(πx1L) sin(πx2H)y2(t x1 x2) = eminust(2ε)(sin(πx1L))(sin(πx2H))
g1(t x1 x2) = PQad(eminus3εtminust(2ε) sin(πx2H) sin(πx1L)(et(2ε) sin(πx2H)2
sin(πx1L)2 minus εe2εt+t(2ε)))
g2(t x1 x2) = PQad(a1εe
minust(2ε) sin(πx2H) sin(πx1L))
Για αυτήν την επιλογή δεδομένων τα αντίστοιχα σφάλματα για τη βασική μεταβλητή και τη μεταβλητήελέγχου σε διάφορα πλέγματα φαίνονται στους Πίνακες 85 και 86
Πίνακας 85 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 l = 1 (τ = O(h))
Διακριτοποίηση Σφάλματαh = τ eL2[0T H1
0 (Ω)] g minus ghL2[0T L2(Ω)] J(y g)h = 0002357022 00544956 526533ε-005 565673ε-006h = 0001178511 00219040 120416ε-005 364340ε-006h = 0000589255 00107375 321396ε-006 349583ε-006h = 0000294620 00054011 106383ε-006 352583ε-006h = 0000147310 00027120 396590ε-007 353950ε-006Τάξη Σύγκλισης 10821677 17631825000 -
Πίνακας 86 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 l = 1 (τ = O(h2))
Διακριτοποίηση Σφάλματαh = τ1222 eL2[0T L2(Ω)] eL2[0T H1
0 (Ω)] g minus ghL2[0T L2(Ω)] J(y g)h = 0002357022 628160ε-005 00544271 525886ε-005 564252ε-006h = 0001388890 130974ε-005 00218850 120306ε-005 363497ε-006h = 0000589250 327688ε-006 00108686 324638ε-006 355844ε-006h = 0000294627 821734ε-007 00054478 106902ε-006 355339ε-006Τάξη Σύγκλισης 20854400000 11068586 18734666666 -
1208 Εφαρμογή στη Βιολογία Πείραμα Κατανεμημένου Ελέγχου σε Συστήματα
Ημιγραμμικών Παραβολικών μδε
Παράδειγμα 4 Σrsquo αυτό το παράδειγμα έχουμε ως στόχο συνάρτηση με πολύ μεγάλες τιμές και lsquolsquoμα-κρυάrsquorsquo από τις τιμές της βασικής μεταβλητής Σημειώνουμε πως σrsquo αυτό το παράδειγμα δεν περιορίζουμετον έλεγχο Οι δυνάμεις στο δεξί μέλος είναι
f1(t x1 x2) = minus(minus(π2e(minusεt) sin(πx2H) sin(πx1L))H2) + eminus3εt sin(πx2H)3 sin(πx1L)3
minusεeminusεt sin(πx2H) sin(πx1L)minus eminusεt sin(πx2H) sin(πx1L)+eminust(2ε) sin(πx2H) sin(πx2L)
f2(t x1 x2) = (π2δeminust(2ε) sin(πx2H) sin(πx1L))H2 minus εeminusεt sin(πx2H) sin(πx1L)+a1εe
minust(2ε) sin(πx2H) sin(πx1L)minus (eminust(2ε) sin(πx2H) sin(πx1L))(2ε)
συναρτήσεις στόχων
y1d(t x1 x2) = minus sin(πx2H) sin(πx1L)eminusεTminus3εt(minusεH2L2eεT+2εt minus 2H2L2eεT+2εt + π2L2eεT+2εt
+π2H2eεT+2εt + 3 sin(πx2H)2H2 sin(πx1L)2L2eεT
minus3eεt sin(πx2H)2H2 sin(πx1L)2L2 + e3εtH2L2 minus π2e3εtL2 minus π2e3εtH2))(H2L2)y2d(t x1 x2) = eminusT(2ε)minust(2ε)(2εH2L2)(((((2a1ε
2 + 2ε+ 1) sin(πx2)H)H2
minus2π2δε sin(πx2H)) sin(πx1L)L2 minus 2π2δε sin(πx2H)H2 sin(πx1L))eT(2ε)
+(2π2δεet(2ε) sin(πx2H)minus 2a1ε2et(2ε) sin(πx2H)H2) sin(πx1L)L2
+2π2δε exp(t(2ε)) sin(πx2H)H2 sin(πx1L))
καθώς και τις αρχικές συνθήκες όπως στο Παράδειγμα 2 έτσι ώστε οι δύο τριάδες οι οποίες αποτελούνκαι τη βέλτιστη λύση (y1 micro1 g1) (y2 micro2 g2) του παραπάνω προβλήματος να δίνονται όπως παρακάτω
y1(t x1 x2) = eminusεt sin(πx1L) sin(πx2H)y2(t x1 x2) = eminust(2ε)(sin(πx1L))(sin(πx2H))micro1(t x1 x2) = (eεT minus eεt)eminusεTminusεt sin(πx2H) sin(πx1L)micro2(t x1 x2) = (eT(2ε) minus et(2ε))eminusT(2ε)minust(2ε) sin(πx2H) sin(πx1L)g1(t x1 x2) = π2eminusεt sin(πx2H) sin(πx1L)L2
g2(t x1 x2) = π2δeminust(2ε) sin(πx2H) sin(πx1L)L2
Για αυτήν την επιλογή δεδομένων τα αντίστοιχα σφάλματα για τη βασική μεταβλητή και τη μεταβλητήελέγχου σε διάφορα πλέγματα φαίνονται στους Πίνακες 87 και 88
Πίνακας 87 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 l = 1 (τ = O(h))
Διακριτοποίηση Σφάλματαh = τ ey1L2[0T H1(Ω)] ey2L2[0T H1
0 (Ω)] emicro1L2[0T H1(Ω)] emicro2L2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]
h = 00023570 007174 00457565 164568ε-006 0017634 929315h = 00013888 002924 00192318 674248ε-007 0007384 196774h = 00005892 001438 00096866 332127ε-007 0003687 050788h = 00002946 000723 00048361 162793ε-007 0001809 014044h = 00001473 000362 00024077 807215ε-008 0000890 004936Τάξη Σύγκλισης 107636 10620475 1086875 107702 -
Σημείωση 811 Πρέπει να παρατηρήσουμε πως σε όλα τα παραδείγματα του παρόντος κεφαλαίουοι τιμές για το h είναι πολύ πιο μικρότερες από αυτές των παραδειγμάτων σε προηγούμενα κεφάλαιαΑυτό συμβαίνει διότι το πείραμα λαμβάνει χώρα σε πιο μικροσκοπικό επίπεδο και πιο συγκεκριμένασε τετράγωνο πλευράς 001 οπότε και οι τιμές για το χρονικό βηματισμό τ θα είναι πιο μικρές αφούεκτελούμε πειράματα με τις επιλογές τ = O(h) και τ = O(h2) Αυτό βέβαια δεν επηρεάζει το πλήθοςτων χωροχρονικών βαθμών ελευθερίας σε κάθε πλέγμα ο οποίος είναι παρόμοιος με τα προηγούμενα
81 Κατανεμημένος έλεγχος σε συστήματα FitzHugh-Nagumo 121
Πίνακας 88 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 l = 1 (τ = O(h2))
Διακριτοποίηση Σφάλματαh = τ1222 ey1L2[0T H1(Ω)] ey2L2[0T H1
0 (Ω)] emicro1L2[0T H1(Ω)] emicro2L2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]
h = 00023570 0071655 0044594 197478ε-006 00225159 9087240h = 00013888 0029221 0019430 669304ε-007 00074020 1985270h = 00005892 0014532 0009640 321201ε-007 00035714 0506377h = 00002946 0007271 0004792 158142ε-007 00017506 0139421h = 00001473 0003634 0002391 792880ε-008 00008706 0049084Τάξη Σύγκλισης 1075285 10552 115961 1173165 -
και ούτε επίσης το μέγεθος αποθήκευσης των πινάκων που θα χρειαστεί να αποθηκευτούν στη μνήμητου υπολογιστή
Παρόλα ταύτα παρατηρούνται οι αναμενόμενες τάξεις σύγκλισης για τα σφάλματα στην L2[0 T H1(Ω)]και είναι ίδιες όπως είναι αναμενόμενο με αυτές του ημιγραμμικού προβλήματος βέλτιστου ελέγχου στοΚεφάλαιο 6 αφού και το παρόν πρόβλημα είναι ημιγραμμικό σύστημα εξισώσεων με βέλτιστο έλεγχοκαι επίσης ίδιες με αυτές της εργασίας [24] (Fitzugh- Nagumo σύστημα χωρίς έλεγχο) Ωστόσοστο τελευταίο παράδειγμα χρησιμοποιώντας πιο ακραίο στόχο και ακραίες τιμές για τον έλεγχο καικάνοντας μια πιο αναλυτική μελέτη για τη κάθε μια μεταβλητή ξεχωριστά παρατηρούμε πολύ μεγαλύτερασφάλματα για τον έλεγχο αλλά είναι αξιοσημείωτο ότι έχουμε και πάλι τις αναμενόμενες τάξεις σύγκλισηςόπως φαίνεται στους Πίνακες 88 και 87
Σημείωση 812 Τέλος να παρατηρήσουμε πως όπως είναι αναμενόμενο συγκρίνοντας τα προ-βλήματα με περιορισμούς στον έλεγχο με τα αντίστοιχα χωρίς περιορισμούς έχουμε παρεμφερείς τιμέςσφαλμάτων για τη βασική και συζυγή μεταβλητή αλλά αυξημένες τιμές για τα σφάλματα ελέγχουόπως επίσης και για το συναρτησιακό (βλέπε παρόμοια φαινόμενα και στα παραδείγματα σε εξελικτικάπροβλήματα Stokes με περιορισμούς στον έλεγχο στο Κεφάλαιο 7)
Ευχαριστίες
Είναι μεγάλη ευχαρίστηση να εκφράσω την ευγνωμοσύνη μου σε κάποιους ανθρώπους που με βοήθησανκαι με στήριξαν τα τελευταία πέντε χρόνια
Καταρχήν θα ήθελα να ευχαριστήσω τον επιβλέποντα μου Κ Χρυσαφίνο για τη βοήθεια και τη συνέπειαγια τη διαδρομή μου από το μεταπτυχιακό δίπλωμα ειδίκευσης στο διδακτορικό δίπλωμα Αν και μερικέςφορές οι περιστάσεις δεν ήταν ιδανικές είμαι ευγνώμων για το χρόνο και την υπευθυνότητα και τηνεμπιστοσύνη που μου έδειξε όλο αυτό το καιρό
Ευχαριστώ επίσης τα μέλη της τριμελούς επιτροπής κ Χρυσοβέργη και Κοκκίνη για τη ευγενικήπαρουσία τους τη διδασκαλία τους και τις εύστοχες και για βαθύ προβληματισμό ερωτήσεις τους ειδικάκατά τη παρουσίαση της ενδιάμεσης για το διδακτορικό ομιλίας μου
Πολύ σημαντική ήταν επίσης η οικονομική ενίσχυση και η υποτροφία του Ιδρύματος Παπακυριακόπουλουκαθώς και η διδασκαλία εργαστηρίων που μου εμπιστεύτηκε η διεύθυνση του Τομέα ΜαθηματικώνΣΕΜΦΕ και που μου έδωσε τη δυνατότητα να ασχοληθώ πλήρες χρόνου και να μελετήσω σε βάθοςτο θέμα της διατριβής μου
Τέλος είμαι παντοτινά ευγνώμων στη σύζυγό μου Γεωργία για όλη την αγάπη και υποστήριξη ακόμηκαι όταν είχα πολύ δουλειά ακόμη και στο σπίτι και οι ώρες εργασίας είχαν κατά πολύ υπερβεί το υγιέςόριο Ευχαριστώ πολύ και τους γιους μου Νικόλα και μπέμπη που κάθε πρωί μου ζωγράφιζαν ένατεράστιο χαμόγελο στο πρόσωπό μου
Ευθύμιος Καρατζάς
Αθήνα Ελλάδα Ιανουάριος 2015
9
Λιστα Συμβολων( middot middot ) εσωτερικό γινόμενο του L2(Ω) 14
( middot middot )Γ εσωτερικό γινόμενο του L2(Γ) 14
H1(Ω) equiv H1(ΩR2) 19
Hminus1(Ω) equiv (H10 (Ω))lowast 19
H10(Ω) equiv H1
0 (ΩR2) 19
Lp(Ω) equiv Lp(ΩR2) 19
partpartn κάθετη προς τα έξω παράγωγος στο partΩ 18
Γ equiv partΩ το σύνορο του Ω 14
〈 middot middot 〉 δυϊκό ζεύγος 14
N το σύνολο φυσικών αριθμών 14
Ω φραγμένο χωρίο στον RN 14
Hk(Ω) equivW k2 14
Hk(Ω)lowast ο δυϊκός του Hk(Ω) 14
Hminus1(Ω) ο δυϊκός του H10 (Ω) 14
H21[0 T Ω] equivW 212[0 T Ω] 19
Lp(Ω) χώρος p-ολοκληρώσιμων συναρτήσεων στο Ω 1 le p le infin 14
W 21p[0 T Ω] equiv Lp[0 T W 2p(Ω)] capW 1p[0 T Lp(Ω)] 19
W kp χώρος Sobolev p-ολοκληρώσιμων συναρτήσεων με παραγώγους κατανομών μέχρι τάξηςk p-ολοκληρώσιμες στο Ω 14
WD(0 T ) equiv L2[0 T H10 (Ω)] capH1[0 T Hminus1(Ω)] 19
WR(0 T ) equiv L2[0 T H1(Ω)] cap Linfin[0 T L2(Ω)]times L2[0 T L2(Γ)] 19
WS(0 T ) equiv L2[0 T V(Ω)] cap Linfin[0 T L2(Ω)]] 19
Κατάλογος Πινάκων51 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 τ = h22 ομαλά αρχικά δεδομένα
και yd = 05 8752 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 τ = h22 ομαλά αρχικά δεδομένα
και yd = 0 8753 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 τ = h22 ομαλά αρχικά δεδομένα
και yd = 05 cos(πx1) cos(πx2) 8854 Τάξεις Σύγκλισης για τη δισδιάστατη λύση με k = 0 τ = h22 και αρχικά δεδομένα με
μικρή ομαλότητα 9155 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 1 l = 1 τ = O(h34) ομαλά αρχικά
δεδομένα και yd = 0 9256 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 1 l = 1 τ = O(h12) ομαλά αρχικά
δεδομένα και yd = 0 92
61 Τάξεις Σύγκλισης για την 2-διάστατη λύση με k = 0 l = 1 (h = τ) 10062 Τάξη σύγκλισης για το δισδιάστατο πρόβλημα με k = 0 l = 1 (h2 = τ) 10063 Τάξη σύγκλισης για το δισδιάστατο πρόβλημα με k = 0 l = 1 (h2 = τ) 100
71 Τάξεις Σύγκλισης για k = 0 και τ = h28 10372 Τάξεις Σύγκλισης για k = 1 με τ = h16 10473 Τάξεις Σύγκλισης για k = 1 με τ = h3210 10474 Τάξεις Σύγκλισης για k = 1 με τ = h28 10475 Τάξεις Σύγκλισης για k = 0 με τ = h28 με ασυνέχεια στα αρχικά δεδομένα και ασυ-
νέχεια στο στόχο 10676 Τάξεις Σύγκλισης για k = 0 με τ = h28 με ασυνέχεια στα αρχικά δεδομένα ασυνέχεια
στο στόχο και ασθενείς περιορισμούς στον έλεγχο 10777 Τάξεις Σύγκλισης για k = 0 με τ = h28 με ασυνέχεια στα αρχικά δεδομένα και ισχυρούς
περιορισμούς στον έλεγχο 107
81 Τάξεις Σύγκλισης για την δισδιάστατη λύση για τον έλεγχο τη βασική και συζυγήμεταβλητή με k = 0 l = 1 (τ = O(h)) και περιορισμούς στον έλεγχο 117
82 Τάξεις Σύγκλισης για την δισδιάστατη λύση για τον έλεγχο τη βασική και συζυγήμεταβλητή με k = 0 l = 1 (τ = O(h2)) και περιορισμούς στον έλεγχο 117
83 Τιμές του συναρτησιακού και τάξεις σύγκλισης για την δισδιάστατη λύση για τον έλεγχοκαι τη βασική μεταβλητή με k = 0 l = 1 (τ = O(h)) και χωρίς περιορισμούς στον έλεγχο118
84 Τιμές του συναρτησιακού και τάξεις σύγκλισης για την δισδιάστατη λύση για τον έλεγχοκαι τη βασική μεταβλητή με k = 0 l = 1 (τ = O(h2)) και χωρίς περιορισμούς στονέλεγχο 118
85 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 l = 1 (τ = O(h)) 11986 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 l = 1 (τ = O(h2)) 11987 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 l = 1 (τ = O(h)) 12088 Τάξεις Σύγκλισης για την δισδιάστατη λύση με k = 0 l = 1 (τ = O(h2)) 121
Κατάλογος Σχημάτων51 Σφάλματα για τη βασική μεταβλητή και τη μεταβλητή ελέγχου για τ = h22 8852 Η νόρμα για τη συνάρτηση ελέγχου g(t)L2(Ω) 8953 Απόσταση από το στόχο y(t)minusyd(t)L2(Ω) α) Ομαλά δεδομένα β) Δεδομένα με μικρή
ομαλότητα L2(Ω) - ασυνέχεια 8954 Επίδραση από τις μεταβολές της ομαλοποιητικής παραμέτρου για το συναρτησιακό α στον
έλεγχο g(t)L2(Ω) για σταθερό πλέγμα 48times 48 και τις διάφορες τιμές του α 8955 Επίδραση από τις μεταβολές της ομαλοποιητικής παραμέτρου για το συναρτησιακό α στην
απόσταση της λύσης από το στόχο y(t)minus yd(t)L2(Ω) 9056 Στιγμιότυπο της βασικής μεταβλητής 9457 Στιγμιότυπο της συζυγούς μεταβλητής 95
71 Στιγμιότυπο της βασικής μεταβλητής σε πλέγμα 12x12 με ομαλά δεδομένα 10872 Στιγμιότυπο της βασικής μεταβλητής σε πλέγμα 24x24 με ομαλά δεδομένα 10873 Στιγμιότυπο της βασικής μεταβλητής με μη ομαλά δεδομένα σε αρχικό χρονικό στάδιο 10974 Στιγμιότυπο της βασικής μεταβλητής με μη ομαλά δεδομένα σε τελικό χρονικό στάδιο 10975 Στιγμιότυπο της συζυγούς μεταβλητής με μη ομαλά δεδομένα 110
ʹΠαράρτημα
Περιεχόμενα
Παράρτημα 1 Παράθεση των αποτελεσμάτων που σχετίζονται με προβολές
Παράρτημα 2 Παράθεση των αποτελεσμάτων που σχετίζονται με εκθετική παρεμβολή
Παράρτημα 3 Παράθεση των αποτελεσμάτων που σχετίζονται με τη διακριτή χαρακτηριστική συ-νάρτηση
A
Αʹ1 Προβολές 133
Αʹ1 Προβολές
Λήμμα Αʹ11 ΄Εστω Uh sub H1(Ω) και P loch Qloch ορίζεται στους Ορισμούς 421 και 422 αντιστο-ίχως Τότε για όλα τα v isin L2[0 T H l+1(Ω)] capHk+1[0 T L2(Ω)] υπάρχει σταθερά C ge 0 ανεξάρτητατων h τ τέτοια ώστε
v minus P loch vL2[0T L2(Ω)] le C(hl+1vL2[0T Hl+1(Ω)] + τk+1v(k+1)L2[0T L2(Ω)]
)
Αν επιπλέον k = 0 l = 1 και v isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] τότε υπάρχει μια σταθερά C ge 0ανεξάρτητο από τα h τ τέτοια ώστε
v minusQloch vL2[0T L2(Ω)] le C(hvL2[0T H1(Ω)]τ
12(vL2[0T H1(Ω) + vtL2[0T H1(Ω)lowast]))
v minusQloch vL2[0T H1(Ω)] le C(vL2[0T H1(Ω)] + (τh2)vtL2[0T H1(Ω)lowast]
)
΄Εστω k = 0 l = 1 και v isin L2[0 T H2(Ω)]capH1[0 T L2(Ω)] Τότε υπάρχει σταθερά C ge 0 ανεξάρτητηαπό τα h τ τέτοια ώστε
v minusQloch vL2[0T H1(Ω)] le C(hvL2[0T H2(Ω)] + τ12(vtL2[0T L2(Ω)] + vL2[0T H2(Ω)])
)
Απόδειξη Η πρώτη εκτίμηση δίνεται στο [32 Θεώρημα 43 και Συμπέρασμα 48] Για τη δεύτερη χρησι-μοποιώντας το [32 Θεώρημα 43 Συμπέρασμα 48] και τις ιδιότητες προσεγγισιμότητας του Ph παίρνου-με για κάθε v isin L2[tnminus1 tnH l+1(Ω)] με την (k+ 1)th χρονική παράγωγο vk+1 isin L2[tnminus1 tnL2(Ω)]τους ακόλουθους υπολογισμούς
v minus P locn vL2[tnminus1tnH1(Ω)] le C(v minus PnvL2[tnminus1tnH1(Ω)] + τk+1Pnv(k+1)L2[tnminus1tnH1(Ω)]
)
le C(hlvL2[tnminus1tnHl+1(Ω)] + (τk+1h)v(k+1)L2[tnminus1tnL2(Ω)]
)
όπου στον τελευταίο υπολογισμό έχουμε χρησιμοποιήσει μια αντίστροφη ανισότητα Οπότε
v minus P loch vL2[0T H1(Ω)] le C(hlvL2[0T Hl+1(Ω)] + τk+1
hv(k+1)L2[0T L2(Ω)]
)
το οποίο αποδεικνύει τη δεύτερη εκτίμηση Για τη δεύτερη εκτίμηση για κάθε t isin (tnminus1 tn] προσθα-φαιρώντας τους κατάλληλους όρους και χρησιμοποιώντας τον ορισμό του Qloch παίρνουμε
v minusQloch v2L2[0T L2(Ω)] leNsum
n=1
int tn
tnminus1(v(t)minus v(tn)2L2(Ω) + v(tn)minusQhv(tn)2L2(Ω))dt
Για το πρώτο όρο
int tn
tnminus1v(t)minus v(tn)2L2(Ω)dt le Cτ
int tn
tnminus1
(vt2H1(Ω)lowast + v2H1(Ω)
)dt
Ο δεύτερος όρος μπορεί να προσεγγιστεί με τη τριγωνική ανισότητα την ιδιότητα πρεοσεγγισιμότηταςv(t)minusQhv(t)L2(Ω) le Chv(t)H1(Ω) και το φράγμα του v(t)minusv(tn)L2(Ω) Ορίζουμε e(t) = v(tn)minusv(t) και παρατηρούμε πως (12) ddte(t)2L2(Ω) = 〈et e〉 = minus〈vt(t) v(tn) minus v(t)〉 Επομένως ολοκλη-
ρώνοντας κατά παράγοντες στο (s tn] έχουμε (12)(e(tn)2L2(Ω)minuse(s)2L2(Ω)
)=int tnsminus〈vt(t) v(tn)minus
v(t)〉dt Σημειώνουμε πως e(tn) = 0 και οπότε παίρνουμε μετά από ολοκλήρωση κατά παράγον-
τες στο χρόνο (12)e(s)2L2(Ω) = minus〈v(s) v(tn) minus v(s)〉 minusint tns〈vt(t) v(t)〉dt Οπότε διώχνοντας
τους θετικούς όρους και χρησιμοποιώντας την ανισότητα Young (14)e(s)2L2(Ω) le v(tn)2L2(Ω) +int tnsvtH1(Ω)lowastvH1(Ω)dt Χρησιμοποιώντας την εμφύτευση L2[s tnH1(Ω)] cap H1[s tnH1(Ω)lowast] sub
134 Αʹ Παράρτημα
Linfin[s tnL2(Ω)] την ανισότητα Houmllder και ολοκληρώνοντας χρονικά από το tnminus1 στο tn τελικώςκαταλήγουμε στην
(14)int tn
tnminus1e(s)2L2(Ω)dt le Cτ
int tn
tnminus1
(vt2H1(Ω)lowast + v2H1(Ω)
)ds
Για τη τρίτη εκτίμηση αρχικά παρατηρούμε πως η γενικευμένη ορθογώνια προβολή Qh H1(Ω)lowast rarr Uhείναι ευσταθής στη νόρμα H1(Ω)lowast Ωστόσο για όλα τα v isin H1(Ω)lowast w isin H1(Ω) από τον ορισμό τωνπροβολών Qh και Ph
QhvH1(Ω)lowast = supwisinH1(Ω)
|〈Qhv w〉|wH1(Ω)
le supwisinH1(Ω)
( |〈Qhv minus v w〉|wH1(Ω)
+ |〈v w〉|wH1(Ω)
)
le supwisinH1(Ω)
|〈Qhv minus v w minus Phw〉|wH1(Ω)
+ vH1(Ω)lowast
όπου στη τελευταία ανισότητα έχουμε χρησιμοποιήσει το γεγονός ότι 〈Qhvminusv Phw〉 = 0 Σημειώνουμεεπίσης πως απο τον ορισμό της προβολής Ph έχουμε πως 〈Qhvminusv wminusPhw〉 = 〈minusv wminusPhw〉 Οπότεη H1(Ω) ευστάθεια για την προβολή Ph υποδηλώνει
QhvH1(Ω)lowast le supwisinH1(Ω)
|〈v w minus Phw〉|wH1(Ω)
+ vH1(Ω)lowast le CvH1(Ω)lowastw minus PhwH1(Ω)
wH1(Ω)+ vH1(Ω)lowast
le CvH1(Ω)lowast
Επομένως ο ορισμός τουQloch για k = 0 l = 1 η αντίστροφη εκτίμηση QhvL2(Ω) le ChQhvH1(Ω)lowast και η ευστάθεια της Qh στη νόρμα H1(Ω)lowast δείχνει πως
v minusQloch vL2[0T H1(Ω)] =(
Nsum
n=1
int tn
tnminus1v(t)minusQhv(tn)2H1(Ω)dt
)12
=(
Nsum
n=1
int tn
tnminus1v(t)minusQhv(t)2H1(Ω)dt
)12
+(
Nsum
n=1
int tn
tnminus1Qhv(t)minusQhv(tn)2H1(Ω)dt
)12
le CvL2[0T H1(Ω)] + C
h2
(Nsum
n=1
int tn
tnminus1Qhv(t)minusQhv(tn)2H1(Ω)lowastdt
)12
le CvL2[0T H1(Ω)] + C
h2
(Nsum
n=1
int tn
tnminus1v(t)minus v(tn)2H1(Ω)lowastdt
)12
le CvL2[0T H1(Ω)] + C
h2
(Nsum
n=1
int tn
tnminus1(tn minus t)
int tn
tnminus1vt2H1(Ω)lowastdsdt
)12
le CvL2[0T H1(Ω)] + Cτ
h2 vtL2[0T H1(Ω)lowast]
για όλα τα v isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] το οποίο ολοκληρώνει την απόδειξη της τέταρτηςεκτίμησης Η τελευταία εκτίμηση μπορεί να παραχθεί παρόμοια με τη δεύτερη αφού παρατηρήσουμεπως Qloch equiv P loch και d
dtnablav(t)2L2(Ω) = 2〈nablavtnablav〉 και
12d
dtnablae(t)2L2(Ω) + λe(t)2L2(Γ) = 1
2d
dt
((nablae(t)nablae(t)) + λ(e(t) e(t))Γ)
Στη συνέχεια ολοκληρώνοντας ως προς το χρόνο στο (s tn] και χρησιμοποιώντας τον κανόνα του
Αʹ1 Προβολές 135
γινομένου έχουμε
minus(12)(nablae(s)2L2(Ω) + e(s)2L2(Γ)
)=int tn
s
minus(nablavt(t)nabla(v(tn)minus v(t)) + 〈et e〉Γ dt
=int tn
s
((nablavt(t)nablav(t)) + 〈vt v〉Γ)dt+int tn
s
minus(nablavt(t)nablav(tn))minus 〈vt v(tn)〉Γ dt
Σημειώνουμε πως έχουμε χρησιμοποιήσει το γεγονός ότι e(tn) = 0 Οπότε ολοκληρώνοντας κατάμέρη χωρικά το πρώτο ολοκλήρωμα στο δεξί μέλος χρησιμοποιώντας τη μηδενική συνθήκη Robin τηνανισότητα Houmllder έχουμε
(12)(nablae(s)2L2(Ω) + e(s)2L2(Γ)
)=int tn
s
((vt∆v)minus
langvt
partv
partn
rang
Γminus 〈vt v〉Γ
)dt+ nablav(tn)2L2(Ω)
minus(nablav(s)nablav(tn)) + 〈v(s) v(tn)〉Γ minus v(tn)2L2(Γ)
le CvtL2[tnminus1tnL2(Ω)]vL2[tnminus1tnH2(Ω) + nablav(s)L2(Ω)nablav(tn)L2(Ω) + Cv(s)2L2(Γ)
+Cv(tn)2L2(Γ)
le C(vt2L2[tnminus1tnL2(Ω)] + v2L2[tnminus1tnH2(Ω) + nablavLinfin[tnminus1tnL2(Ω)] + vLinfin[0T L2(Γ)]
)
Χρησιμοποιώντας το θεώρημα ίχνους για να φράξουμε το vLinfin[tnminus1tnL2(Γ)] le CvLinfin[tnminus1tnH1(Ω)]η εμφύτευση L2[tnminus1 tnH2(Ω)] capH1[0 T L2(Ω)] sub Linfin[0 T H1(Ω)] και ολοκληρώνοντας άλλη μιαφορά από το tnminus1 στο tn τελικώς καταλήγουμε στην
14
int tn
tnminus1nablae(s)2L2(Ω) + e(s)2L2(Γ)dt le Cτ
int tn
tnminus1
(vt2L2(Ω) + v2H2(Ω)
)ds
από την οποία παίρνουμε την επιθυμητή εκτίμηση μετά από άθροισμα κατά μέλη
Λήμμα Αʹ12 ΄Εστω Uh sub H1(Ω) και P loch Qloch ορισμένο στους Ορισμούς 4235 και 4236αντιστοίχως Τότε για όλα τα v isin L2[0 T Hl+1(Ω)capV(Ω)]capHk+1[0 T L2(Ω)] υπάρχει μια σταθεράC ανεξάρτητη των h τ τέτοιο ώστε
v minus P loch vL2[0T L2(Ω)] le C(hl+1vL2[0T Hl+1(Ω)] + τk+1v(k+1)L2[0T L2(Ω)]
)
v minus P loch vL2[0T H1(Ω)] le C(hlvL2[0T Hl+1(Ω)] + τk+1hv(k+1)L2[0T L2(Ω)]
)
΄Εστω k = 0 l ge 1 καιv isin L2[0 T H2(Ω) cap V (Ω)] cap H1[0 T L2(Ω)] Τότε υπάρχει μια σταθερά cανεξάρτητη των h τ τέτοιο ώστε
v minus P loch vL2[0T H1(Ω)] le C(hvL2[0T H2(Ω)] + τ12(vtL2[0T L2(Ω)] + vL2[0T H2(Ω)])
)
΄Εστω k = 0 l ge 1 και v isin L2[0 T V(Ω)] cap H1[0 T Hminus1(Ω)] Τότε υπάρχει μια σταθερά C gt 0ανεξάρτητη των h τ τέτοια ώστε
v minusQloch vL2[0T L2(Ω)] le C(hvL2[0T H1(Ω)] + τ12vtL2[0T Hminus1(Ω)]
)
v minusQloch vL2[0T H1(Ω)] le C(vL2[0T H1(Ω)] + (τ12h)(vtL2[0T Hminus1(Ω)] + vL2[0T H1(Ω)])
)
Απόδειξη Η πρώτη εκτίμηση δίνεται στο [32 Θεώρημα 43 και Συμπέρασμα 48] Για τη δεύτερηχρησιμοποιώντας το [32 Θεώρημα 43 Συμπέρασμα 48] και τις προσεγγιστικές ιδιότητες του Phέχουμε για κάθε v isin L2[tnminus1 tn Hl+1(Ω)] με την (k + 1)τή παράγωγο ως προς το χρόνο vk+1 isinL2[tnminus1 tn L2(Ω)] τις ακόλουθες εκτιμήσεις
v minus P locn vL2[tnminus1tnH1(Ω)] le C(v minus PhvL2[tnminus1tnH1(Ω)] + τk+1Phv(k+1)L2[tnminus1tnH1(Ω)]
)
le C(hlvL2[tnminus1tnHl+1(Ω)] + (τk+1h)v(k+1)L2[tnminus1tnL2(Ω)]
)
136 Αʹ Παράρτημα
όπου στον τελευταίο υπολογισμό έχουμε χρησιμοποιήσει μια αντίστροφη εκτίμηση Οπότε αποδεικνύεταιη δεύτερη εκτίμηση
v minus P loch vL2[0T H1(Ω)] le C(hlvL2[0T Hl+1(Ω)] + τk+1
hv(k+1)L2[0T L2(Ω)]
)
Η τρίτη εκτίμηση είναι στη βιβλιογραφία και η απόδειξη παραλείπεται Η τέταρτη εκτίμηση προκύπτειαπό γνωστά επιχειρήματα με μικρές τροποποιήσεις για να χειριστούμε τη μηδενικής απόκλισης φύσητης προβολής Για χάριν πληρότητας διατυπώνουμε τα βασικά επιχειρήματα Για κάθε t isin (tnminus1 tn]προσθαφαιρώντας κατάλληλους όρους και χρησιμοποιώντας τον ορισμό του Qloch παίρνουμε
v minusQloch v2L2[0T L2(Ω)] leNsum
n=1
int tn
tnminus1(v(t)minus v(tn)2L2(Ω) + v(tn)minusQhv(tn)2L2(Ω))dt
Για το πρώτο όρο ορίζουμε e(t) = v(tn) minus v(t) και παρατηρούμε πως (12) ddte(t)2L2(Ω) = 〈et e〉 =minus〈vt(t) v(tn) minus v(t)〉 Επομένως ολοκληρώνοντας ως προς το χρόνο στο διάστημα (s tn] παίρνουμε
(12)(e(tn)2L2(Ω) minus e(s)2L2(Ω)
)=int tnsminus〈vt(t) v(tn) minus v(t)〉dt Παρατηρούμε πως e(tn) = 0 και
επομένως παίρνουμε μετά από χρονική ολοκλήρωση κατά μέλη (12)e(s)2L2(Ω) = minus〈v(s) v(tn) minusv(s)〉minus
int tns〈vt(t) v(t)〉dt Επίσης διώχνοντας τους θετικούς όρους και χρησιμοποιώντας την ανισότητα
Young (14)e(s)2L2(Ω) le v(tn)2L2(Ω)+int tnsvtHminus1(Ω)vH1(Ω)dt Χρησιμοποιώντας την εμφύτευση
L2[s tn V(Ω)] cap H1[s tn Hminus1(Ω)] sub Linfin[s tn L2(Ω)] την ανισότητα Houmllder και ολοκλήρωση στοχρόνο από το tnminus1 μέχρι το tn τελικά καταλήγουμε
(14)int tn
tnminus1e(s)2L2(Ω)dt le Cτ
int tn
tnminus1
(vt2Hminus1(Ω) + v2H1(Ω)
)ds
η οποία δείχνει την επιθυμητή εκτίμηση για το πρώτο όρο Ο δεύτερος όρος μπορεί να αποδειχθείπαρόμοια χρησιμοποιώντας την τριγωνική ανισότητα και τη προσεγγιστική ιδιότητα
Nsum
n=1
int tn
tnminus1(v(tn)minusQhv(tn)2L2(Ω))dt le
Nsum
n=1
int tn
tnminus1(v(tn)minus v(t)2L2(Ω) + v(t)minusQhv(t)2L2(Ω))dt
όπου ο τελευταίος όρος μπορεί να να φραχτεί από τον v(t)minusQhv(t)L2(Ω) le ChvH1(Ω) (υπογραμ-μίζουμε πως v isin L2[0 T V(Ω)]) Για τη τελευταία εκτίμηση θα χρησιμοποιήσουμε το προηγούμενουπολογισμό αφού τονίσουμε τη μηδενικής απόκλισης φύση της προβολής μας Αρχικά παρατηρούμεπως η γενικευμένη ορθογώνια προβολή Qh Hminus1(Ω) rarr Uh είναι ευσταθής Hminus1(Ω) νόρμα βλέπεπχ το [69] για όλα τα v isin Vminus1(Ω) Πράγματι για όλα τα v isin Vminus1(Ω) w isin H1
0(Ω) από τον ορισμότων Qh και Ph
QhvHminus1(Ω) = supwisinH1
0(Ω)
|〈Qhv w〉|wH1(Ω)
le supwisinH1
0(Ω)
( |〈Qhv minus v w〉|wH1(Ω)
+ |〈v w〉|wH1(Ω)
)
le supwisinH1
0(Ω)
|〈Qhv minus v w minus Phw〉|wH1(Ω)
+ vHminus1(Ω)
όπου στη τελευταία ανισότητα έχουμε χρησιμοποιήσει το γεγονός ότι 〈Qhvminusv Phw〉 = 0 Σημειώνουμεπως από τον ορισμό της προβολής Ph έχουμε 〈Qhv minus v w minus Phw〉 = 〈minusv w minus Phw〉 Επομένως ηH1(Ω) ευστάθεια της Ph προβολής στην H1(Ω) νόρμα για κάθε v isin V (Ω) υποδηλώνει
QhvHminus1(Ω) le supwisinH1(Ω)
|〈v w minus Phw〉|wH1(Ω)
+ vHminus1(Ω) le CvHminus1(Ω)w minus PhwH1(Ω)
wH1(Ω)+ vHminus1(Ω)
le CvHminus1(Ω)
Επίσης ο ορισμός του Qloch για k = 0 l ge 1 η αντίστροφη ανισότητα QhvH1(Ω) le ChQhvL2(Ω)
Αʹ2 Εκθετική παρεμβολή 137
δείχνουν
v minusQloch vL2[0T H1(Ω)] =(
Nsum
n=1
int tn
tnminus1v(t)minusQhv(tn)2H1(Ω)dt
)12
=(
Nsum
n=1
int tn
tnminus1v(t)minusQhv(t)2H1(Ω)dt
)12
+(
Nsum
n=1
int tn
tnminus1Qhv(t)minusQhv(tn)2H1(Ω)dt
)12
le CvL2[0T H1(Ω)] + C
h
(Nsum
n=1
int tn
tnminus1Qhv(t)minusQhv(tn)2L2(Ω)dt
)12
le CvL2[0T H1(Ω)] + C
h
(Nsum
n=1
int tn
tnminus1v(t)minus v(tn)2L2(Ω)dt
)12
le CvL2[0T H1(Ω)] + C
h
(Nsum
n=1τ
int tn
tnminus1vt2Hminus1(Ω) + v2H1(Ω)dt
)12
le CvL2[0T H1(Ω)] + Cτ12
h(vtL2[0T Hminus1(Ω)] + vL2[0T H1(Ω)])
για όλα τα v isin L2[0 T V(Ω)] cap H1[0 T Hminus1(Ω)] το οποίο συμπληρώνει την απόδειξη της τέταρτηςεκτίμησης
Αʹ2 Εκθετική παρεμβολή
Η πολυωνυμική παρεμβολή των συναρτήσεων eminusρ(tminustnminus1)v όπου v isin Pk[tnminus1 tnV ] και και ο V να
είναι γραμμικός χώρος χρειάζεται για την απόδειξη αποτελεσμάτων ευστάθειας Εδώ παραθέτουμε τονορισμό και τα κύρια αποτελέσματα από το [32]
Ορισμός Αʹ21 ΄Εστω V ένας γραμμικός χώρος και το ρ gt 0 είναι δεδομένο Αν v =sumki=0 ri(t)vi isin
Pk[tnminus1 tnV ] με ri isin Pk[tnminus1 tn] και vi isin V ορίζουμε την εκθετική παρεμβολή του v με
v =ksum
i=0ri(t)vi
όπου ri isin Pk[tnminus1 tn] είναι η προσέγγιση του ri(t)eminusρ(tminustnminus1) που ικανοποιεί την ri(tnminus1) = ri(tnminus1)
και int tn
tnminus1ri(t)q(t)dt =
int tn
tnminus1ri(t)q(t)eminusρ(tminust
nminus1)dt q isin Pkminus1[tnminus1 tn]
Το ακόλουθο Λήμμα (βλέπε [32 Λήμμα 34]) εξασφαλίζει πως η διαφορά v minus v παραμένει μικρή σεδιάφορες φόρμες
Λήμμα Αʹ22 ΄Εστω V και Q γραμμικοί χώροι και v rarr v είναι η απεικόνιση κατασκευασμένη στονΟρισμό Αʹ21 για δοσμένο ρ gt 0 Αν L( ) V timesQrarr R συμβολίζει μια διγραμμική απεικόνιση καιv isin Pk[tnminus1 tnV ] τότε
int tn
tnminus1L(v(t) q(t))dt =
int tn
tnminus1L(v(t) q(t))eminusρ(tminust
nminus1)dt forall q isin Pkminus1[tnminus1 tnQ]
Αν ( )V είναι ένα (ημι) εσωτερικό γινόμενο στον V τότε υπάρχει μια σταθερά Ck ανεξάρτητη τουρ gt 0 τέτοια ώστε
v minus vL2[tnminus1tnV ] le Ckρ(tn minus tnminus1)vL2[tnminus1tnV ]
138 Αʹ Παράρτημα
Αʹ3 Διακριτή χαρακτηριστική συνάρτηση
Τονίζουμε πως ο υπολογισμός του σφάλματος σε αυθαίρετες χρονικές στιγμές t isin [tnminus1 tn) μπορεί ναδιευκολυνθεί με την αντικατάσταση vh = χ[tnminus1t)yh στις διακριτές εξισώσεις Ωστόσο αυτή η επιλογήδεν είναι διαθέσιμη αφού χ[tnminus1t)yh δεν ανήκει στον Uh εκτός εάν t είναι σημείο της διαμέρισης Οπότεπρέπει να κατασκευαστούν οι προσεγγίσεις τέτοιων συναρτήσεων Αυτό έχει γίνει στο [31 Ενότητα23] Για χάρη πληρότητας παραθέτουμε τα κύρια αποτελέσματα Οι προσεγγίσεις είναι κατασκευασμένεςστο διάστημα [0 τ) όπου τ = tn minus tnminus1 και δεν αλλάζουν κατά τους μετασχηματισμούς
΄Εστω t isin (0 τ) Θεωρούμε πολυώνυμα s isin Pk(0 τ) και συμβολίζουμε τη διακριτή προσέγγιση τουχ[0t)s με το πολυώνυμο s isin s isin Pk(0 τ) s(0) = s(0) το οποίο ικανοποιεί την
int τ
0sq =
int t
0sq forall q isin Pkminus1(0 τ)
Το κίνητρο για τη παραπάνω κατασκευή προέρχεται από τη βασική παρατήρηση πως για q = sprime παίρνουμεint τ0 sprimes =
int t0 ss
prime = 12 (s2(t)minus s2(0))
Η κατασκευή μπορεί να επεκταθεί σε προσεγγίσεις του χ[0t)v για v isin Pk[0 τ V ] όπου V είναι γραμμικός
χώρος Η διακριτή προσέγγιση του χ[0t)v στον Pk[0 τ V ] ορίζεται από την v =sumki=0 si(t)vi και αν
το V είναι ένας χώρος ημι-εσωτερικού γινομένου τότε
v(0) = v(0) καιint τ
0(v w)V =
int t
0(v w)V forallw isin Pkminus1[0 τ V ]
Τελικώς παραθέτουμε το κύριο αποτέλεσμα από το [31]
Πρόταση Αʹ31 Υποθέτουμε πως ο V είναι ένας χώρος (ήμι) εσωτερικού γινομένου Τότε ηαπεικόνιση
sumki=0 si(t)vi rarr
sumki=0 si(t)vi στον Pk[0 τ V ] είναι συνεχής στον L2[0τ V ] Ειδικότερα
vL2[0τ V ] le CkvL2[0τ V ] v minus χ[0t)vL2[0τ V ] le CkvL2[0τ V ]
όπου Ck είναι μια σταθερά που εξαρτάται από το k
Απόδειξη Βλέπε [31 Λήμμα 24]
Σημείωση Αʹ32 Συνδυάζοντας τις παραπάνω εκτιμήσεις με το πεπερασμένης διάστασης Pk[0 τ ]παίρνουμε μια εκτίμηση της μορφής
vLinfin[0τ L2(Ω)] le CkvLinfin[0τL2(Ω)]
ΜέροςIIΠεριγραφή της Διατριβής στα Αγγλι-κά - (Thesis Description in En-glish)
National Technical University of AthensSchool of Applied Mathematics
and Physical Sciences
Department of Mathematics
Optimal Control and Parabolic Partial
Differential Equations Numerical Analysis and
Applications
DOCTOR OF PHILOSOPHY
EFTHIMIOS N KARATZAS
Thesis Committee Konstantinos ChrysafinosIon ChrysovergisVasilios Kokkinis
The PHD Degree Proposal has been examined and approved on 4th February 2015
K Chrysafinos I Chrysovergis B KokkinisAssoc Prof NTUA Professor NTUA Lecturer NTUA
I Tsinias A Charalampopoulos I KoletsosProfessor NTUA Assoc Prof NTUA Lecturer NTUA
Em GeorgoulisProfessorLeicester University
Athens February 2015
Optimal Control and Parabolic Partial Differential EquationsNumerical Analysis and Applications
AbstractThe main object of the thesis is distributed and boundary optimal control in evolutionary - parabolicpartial differential equations problems using a discontinuous in time Galerkin finite element methodWe examine a Robin type boundary control problem for linear parabolic equations distributed controlin semilinear parabolic problem and distributed control in evolutionary Stokes problem We presentresults and optimal convergence rates in the cases of constrained and unconstrained control minimalsmoothness for the data of the problem and we numerically verify them even for L2(Ω) data We provestability convergence and we examine first and second order conditions for the quadratic functionalFinally we present numerical results for a biological problem which consists of two equations a linearand a semilinear parabolic equation with distributed control
We study first order in time and second order in space linear and semilinear evolutionary problemsthat often occur in applications to boundary problems for parabolic problems and Stokes systems Wewill present semilinear parabolic problems with zero Dirichlet boundary conditions linear parabolicproblems with Robin boundary conditions Stokes and Fitzugh-Nagumo systems with zero Dirichletboundary conditions
Particularly the aim is to focus on specific problems often encountered in practice than to studymore general problems in which the same analysis techniques may be applied This allows someonein short time to produce immediate results which are easy to use in applications
1Introduction
In this chapter it is presented an introduction to the problems that we will study in the followingsections
Contents11 Description of the problems under consideration 14412 Related results 148
144 1 Introduction
11 Description of the problems under consideration
In this section we describe the problems that we will consider in the thesis More specifically wewant to minimize the distance between y and a given distribution yd
int T
0
int
Ω|y minus yd|2
For the control function we have the term in the functionalint T
0
int
S
|g|2
where S is Ω or Γ depending on having boundary or distributed control Below we present theproblems to be dealt with in conjunction with the functional we want to minimize (subject toevolutionary pdes)
Robin Boundary control problem We consider an optimal control problem associated to theminimization of the tracking functional subject to linear parabolic pdes with rough initial data Inparticular given a target function yd we seek state variable y and the Robin boundary control variableg such that the functional
J(y g) = 12
int T
0y minus yd2L2(Ω) dt+ α
2
int T
0g2L2(Γ) dt (111)
is minimized subject to the constrains
yt minus η∆y = f in (0 T ]times Ω
y + η
λ
party
partn = g on (0 T ]times Γ (112)
y(0 x) = y0 in Ω
Here Ω sub R2 denotes an open bounded polygonal and convex domain with Lipschitz boundaryΓ The control g is applied on the boundary Γ and it is of Robin type Our analysis and resultswill be primarily focused on the case of low regularity assumptions ie initial data y0 isin L2(Ω)but our analysis will be also applicable in other cases where the solution possesses additionalregularity Furthermore we are also interested in case of pointwise control constraints in the sensethat ga le g(t x) le gb for ae (t x) isin (0 T ] times Γ where ga gb isin R A precise formulation will begiven in the next section The forcing term f and the parameters λ gt 0 η gt 0 are given data whileα gt 0 denotes a penalty parameter which limits the size of the control and it is comparable to thediscretization parameters The case of rough initial data is very important within the context of suchboundary optimal control problems and great care is exercised in order to include this case into ouranalysisThe main goal is to show that the error estimates of the corresponding optimality system have thesame structure to the estimates of the uncontrolled linear parabolic equation with Robin boundarydataThe key -but not the only- structural difficulty associated to boundary optimal control problems withrough initial data stems from the lack of sufficient regularity of the state adjoint and control variablesIn particular if y0 isin L2(Ω) then the regularity of the state variable is limited to L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] Hence classical boot-strap arguments for the uncontrolled parabolic pdes whichrely on standard Rietz-Galerkin elliptic projections typically fail due to the lack of regularity As a
11 Description of the problems under consideration 145
consequence error estimates for space-time approximations of parabolic optimal control problemswith rough initial data y0 isin L2(Ω) in Lipschitz domains have not been treated before
To overcome the lack of regularity we analyze a scheme which is based on a discontinuous time-stepping approach which is suitable for problems without regular enough solutions The analysisshowcases the favorable behavior of such schemes even in presence of essential boundary Robincontrols The key feature of our discrete schemes is that they exhibit the same regularity propertiesto the continuous weak problem Our results can be summarized as follows
1 We develop a symmetric error estimate under minimal regularity assumptions on the naturalnormWR(0 T ) equiv Linfin[0 T L2(Ω)] cap L2[0 T H1(Ω)]times L2[0 T L2(Γ)] associated to our discontinuoustime-stepping scheme ie
error WR(0T ) le Cbest approximation error WR(0T )
which states that the error is as good as the regularity and approximation theory allows it tobe
2 We define a new generalized space-time projection that exhibits best approximation propertiesin L2[0 T L2(Ω)] and which is also applicable for yt isin L2[0 T H1(Ω)lowast] Using the aboveprojection and an appropriate duality argument for an auxiliary system we obtain a rate ofO(h) for the L2[0 T L2(Ω)] norm when τ le Ch2
3 In case of bounded controls we demonstrate the applicability of our estimates within thevariational discretization concept of [65] This approach allows to overcome the lack of theenhanced regularity resulting on state variable due to the failure of classical ldquoboot-straprdquoarguments for the control and state variable
To our best knowledge our estimates are new and optimal in terms of the prescribed regularity ofthe solutions and the presence of essential boundary conditions In addition even in presence ofadditional regularity on the data ie y0 isin H1(Ω) and despite the use of L2 projections which exhibitbest approximation properties the rate O(h32) (when τ le Ch2) appears to be optimal since there isno possibility to obtain a better estimate at least when polygonal and convex domains are involvedWe also point out that the Robin boundary control can be viewed as a penalization approach forDirichlet boundary control problems (see for instance the works of [9 17 70] and references within)For this reason the dependence upon the parameters λ α η of various constants appearing in ourestimates is carefully tracked
Semilinear distributed optimal control problem The optimal control problem considered here isassociated to the minimization of the tracking functional subject to semi-linear parabolic pdes Inparticular we seek states y and controls g (of distributed type) such that
J(y g) = 12
int T
0y minus yd2L2(Ω)dt+ α
2
int T
0g2L2(Ω)dt (113)
is minimized subject to the constraints
yt minus div[A(x)nablay] + φ(y) = f + g in (0 T )times Ωy = 0 on (0 T )times Γ (114)
y(0 x) = y0 in Ω
The physical meaning of the optimization problem under consideration is to seek states y and controlsg such that yis as close as possible to a given target U Here Ω denotes a bounded domain in R2with Lipschitz boundary Γ y0 f denote the initial data and the forcing term respectively and α
146 1 Introduction
is a penalty parameter which measures the size of the control The nonlinear mapping φ satisfiescertain continuity and monotonicity properties and A(x) isin C1(Ω) is a symmetric matrix valuedfunction that is uniformly positive definite The scope of this work is the error analysis of the firstorder necessary conditions (optimality system) of the above optimal control problem by using adiscontinuous (in time) Galerkin (dG) scheme The corresponding optimality system consists of aprimal (forward in time) equation and an adjoint (backwards in time) equation which are coupledthrough an optimality condition and nonlinear terms (see eg [50 56 80 93 109])The main aim is to show that the dG approximations of the optimality system exhibit similarapproximation properties to the standard linear (uncontrolled) parabolic equation In particular it isshown that the error of the dG approximations is as good as the regularity of the solutions and theapproximation properties of the subspaces enables it to be for suitable data f y0 U
This is achieved by proving the following symmetric estimate which states that
error X le C(in data error L2(Ω)
+best approx error X+subsp error X1
)
Here X = Linfin[0T L2(Ω)] + L2[0T H1(Ω)] and X1 denotes a norm related to a possiblechange of finite element subspaces every other (or every few) time steps and can be omitted whenthe same subspaces are being used in every time step The term best approx errorX is posed interms of suitable local L2 projections and allows optimal rates of convergence when the solutionis sufficiently smooth The constant C does not depend exponentially on quantities of the form1α The dependance upon α of various constants appearing in these estimates is essential to theunderlying optimal control problem and hence it should be carefully tracked In particular in mostcomputational and practical engineering examples we are interested for small values of the parameterα and in certain cases even comparable to the discretization parameter hThe structure of the estimate is similar to the work of [31] which concerns the dG approximations oflinear (uncontrolled) parabolic pdersquos and it leads to optimal error estimates in terms of the regularityof the solutions and the approximation theory of the chosen subspaces
The proof of the main estimate is based on estimates of an auxiliary and essentially uncoupled systemtogether with a ldquoboot-straprdquo argument and stability estimates at arbitrary time-points under minimalregularity assumptions The key element of the proposed methodology is the use of a ldquodualityrdquo typeof argument for discontinuous time-stepping schemes to facilitate the decoupling of the optimalitysystem In particular using the adjoint variable as test function in the primal equation and theprimal variable as test function in the adjoint equation we first show that
error2L2[0T L2(Ω)] le best approx error2X + α12error2L2[0T H1(Ω)]
Then for α suitably small we apply a ldquoboot-straprdquo argument to obtain the desired symmetricestimate To our best knowledge the above symmetric estimates and their particular structure arenew within our optimal control settingThe motivation for using a dG approach stems from its performance in a vast area of problemswhere the given data satisfy low regularity properties such as optimal control problems Furthermorethe concept of symmetric error estimates can effectively capture the interplay between regularity ofsolutions and approximation properties of the subspaces Such estimates are also recently applicable toa variety of problems such as error analysis of moving meshes Lagrangian moving mesh methodologies(see eg [42 85]) and can be viewed as generalization of the classical Ceacutea Lemma (see eg [34])In addition discontinuous (in time) schemes accommodate the use of different subspaces in each timestep and hence basic adaptivity ideas in a natural way In the recent works of [20 21 83 84 87 88]discontinuous Galerkin schemes were analyzed for distributed optimal control problems constrainedto linear parabolic pdersquos while the case of semi-linear constraints is analyzed in [22 94] In [22]
11 Description of the problems under consideration 147
convergence of discontinuous time-stepping schemes for optimal control problems (without controlconstraints) related to semi-linear parabolic pdersquos is studied under minimal regularity assumptionson the data and growth assumptions on the semi-linear term In the very recent work of [94]first order (in time) error estimates for the controls are presented for an optimal control problemrelated to semi-linear parabolic pdersquos with control constraints in case that the initial data belong toH1
0 (Ω)capLinfin(Ω) under weak hypothesis on semi-linear term The controls are discretized by piecewiseconstants in time and space however the analysis is also applicable when piecewise constants (intime) piecewise linears (in space) are being used For the state equation the lowest order (k = 0)discontinuous Galerkin (in time) combined with standard conforming finite elements (in space) arebeing used The first-order (in time) estimates presented in [94] successfully address a variety ofdifficulties due to the presence of control constraints and the corresponding nonconvexityThe estimates and the analysis of [94] are different compared to the ones presented here Our workprimarily focuses on the development of estimates that possess the symmetric structure (and theiradvantageous features described above) for the associated optimality system
Stokes distributed optimal control problem We consider an optimal control problem associated tothe minimization of the tracking functional subject to the evolutionary Stokes equations In particulargiven a target function yd we seek velocity y and control variable g such that the functional
J(y g) = 12
int T
0y minus yd2L2(Ω) dt+ α
2
int T
0g2L2(Ω) dt (115)
is minimized subject to the constrains
yt minus ν∆y +nablap = f + g in (0 T )times Ωdivy = 0 on (0 T )times Ω
y = 0 on (0 T )times Γy(0 x) = y0 in Ω
(116)
Here Ω sub Rd d = 2 3 denotes an open bounded polygonal (polyhedral) and convex domain Ourestimates are valid under the general assumption of a Lipschitz boundary Γ however when consideringhigh order schemes we will assume more regular boundary The control g is of distributed typeOur analysis and results will be applicable for schemes of arbitrary order under suitable regularityassumptions but special emphasis is placed in the case of rough initial data ie y0 isin W(Ω) equivv isin L2(Ω) divv = 0 partv
partn = 0 Furthermore we are also interested in case of pointwise controlconstraints in the sense that ga le g(t x) le gb for ae (t x) isin (0 T ) times Ω where ga gb isin R Theforcing term f and the viscosity constant ν gt 0 are given data while α gt 0 denotes a penaltyparameter which limits the size of the control and it is comparable to the discretization parametersThe main goal is to show that the error estimates of the corresponding optimality system have thesame structure to those of the uncontrolled evolutionary Stokes equations In particular we developan almost symmetric error estimate under minimal regularity assumptions on the natural energynorm W (0T ) equiv Linfin[0T L2(Ω)] + L2[0T H1(Ω)] associated to our discontinuous time-steppingscheme ie an estimate of the form
error WS(0T ) le Cbest approximation error WS(0T )
+best approx error pressure L2[0T L2(Ω)]
This estimate is valid in case of high order schemes under suitable regularity assumptions since itseparates the issue of regularity of the optimal pair from the choice of the approximation scheme Asa consequence estimates of high order can be also included similar to the uncontrolled case at leastin case of unbounded controls when classical boot-strap arguments imply enhanced regularity Tothis end we also explore coarse time-stepping approaches
148 1 Introduction
Another key feature of the above estimate is that the estimate is valid under low regularity as-sumptions on the given data More precisely the symmetric error estimate only requires velocityy isin L2[0 T V(Ω)] capH1[0 T Hminus1(Ω)] and pressure p isin L2[0 T L2
0(Ω)] where V(Ω) = v isin H10(Ω)
divv = 0 and L20(Ω) = p isin L2(Ω)
intΩ pdx = 0
Note that if y0 isin W(Ω) then the regularity of the state variable is limited to L2[0 T V(Ω)] capH1[0 T V(Ω)lowast] where V(Ω) = v isin H1
0(Ω) divv = 0 Furthermore despite the fact thatyt +nablap isin L2[0 T Hminus1(Ω)] it is not known whether p isin L2[0 T L2
0(Ω)] and yt isin L2[0 T Hminus1(Ω)]As a consequence the pressure p satisfies (116) in a distributional sense Hence the assumptionp isin L2[0 T L2
0(Ω)] is the minimal one to guarantee the decomposition between yt and p and henceto validate a suitable weak formulation for rough initial data from the numerical analysis viewpointError estimates for space-time approximations of the velocity tracking problem with rough initialdata y0 isinW(Ω) have not been treated before despite the fact that the case of rough initial data isof extreme importance within the context of controlling fluid flows (see eg [56]) To overcome thelack of regularity we analyze a scheme which is based on a discontinuous time-stepping approachwhich is suitable for problems without regular enough solutions The analysis showcases the favorablebehavior of such schemes We define a new generalized space-time projection which exhibits bestapproximation properties in L2[0 T L2(Ω)] but is also applicable when yt isin L2[0 T Hminus1(Ω)] onlyThus constructing a global space-time projection and using an appropriate duality argument andwe obtain a rate of O(h) for the L2[0 T L2(Ω)] norm when τ le Ch2Similarly In case of bounded controls we demonstrate the applicability of our estimates within thevariational discretization concept of [65] This approach allows to overcome the lack of the enhancedregularity resulting from a ldquoboot-straprdquo argument for the control and state variable
To our best knowledge our estimates are new and optimal in terms of the prescribed regularity ofthe solutions and the presence of the incompressibility constraint
12 Related results
Robin boundary control problem Previous related results regarding discontinuous time-steppingapproaches are almost exclusively related to distributed controls For instance the discontinuousGalerkin framework is explored in the works of [89] and [88] where a-priori estimates are developedfor distributed optimal control problems with and without control constraints respectively for theheat equation In [20 21] a priori error estimates in terms of suitable space-time projections arederived for unconstrained distributed optimal control problems related to parabolic and implicitparabolic pdes with general and possibly time-dependent coefficients in the elliptic part Recentlyerror estimates related to distributed optimal control problems for semi-linear parabolic pdes aredeveloped in the works of [94] with control constraints and H1
0 (Ω) cap Linfin(Ω) initial data and in [27]a priori error estimates of symmetric type for problems without control constraints A-priori errorestimates for the velocity tracking problem with control constraints are analyzed in the works of[13 14] A convergence result for discontinuous time-stepping schemes for Robin optimal controlproblems (without control constraints) related to semi-linear parabolic pdes under L2(Ω) data isrecently considered in [23] Finally in [86] fully-discrete approximations of a Neumann boundarycontrol problem related to homogeneous linear parabolic pdes are analyzed for the implicit Eulerscheme for smooth domains and for regular enough dataSeveral results regarding the analysis of optimal boundary control problems can be found in [56 8093 109] (see also references within) Various boundary control problems related to time-dependentpdes were studied in the previous works of [4 7 25 61 67 77 79 108 109 112]
Semilinear distributed optimal control problem Several problems with distributed controls havebeen studied before analytically in [50 56 72 80 82 93 109] (see also references within) Several
12 Related results 149
results related to the analysis of numerical algorithms for optimal control problems were studied in[11 19 18 25 37 38 49 53 58 60 65 66 76 79 86 97 107 108 109 111 112]A posteriori estimates for dG schemes were studied in [83 84] for optimal control problems related tolinear parabolic pdersquos while in [87] an adaptive space-time finite element algorithm is constructedand analyzed A priori error estimates for an optimal control problem of distributed type havingstates constrained to the heat equation are presented in [89] while in [20 21] a priori error estimatesfor dG schemes for the tracking problem related to linear parabolic pdersquos and implicit parabolicpdersquos respectively with non-selfadjoint possibly time dependent coefficients are established In [90]a Petrov-Galerkin Crank-Nicolson scheme is applied to an optimal control problem with controlconstraints related to linear parabolic pdersquos while in [6] a Crank-Nicolson formulation is analyzedIn both papers second order rates of convergence are obtainedThere is an abundant literature concerning dG schemes for the solution of parabolic equations withoutapplying controls (see eg [104] and references therein) The relation of the discontinuous Galerkinmethod to adaptive techniques was studied in detail in [44 45 104] Some results related to finiteelement approximation of semi-linear and general nonlinear parabolic problems are presented in[1 48 46 47]
Stokes distributed optimal control problem Several results regarding the analysis of similar controlproblems were presented in [2 12 56 66 101 106] (see also references within) where various aspectsincluding first and second order necessary conditions are developed and analyzed To the contrarythe literature regarding numerical analysis for optimal control problems related to evolutionaryNavier-Stokes equations is very limited In [61 59] convergence of a gradient algorithm is proven incase of distributed controls and of bounded distributed controls Error estimates for the semi-discrete(in space) discretization are derived in [37] in case of distributed controls without control constraintsby using a variational discretization approach while in [36] fully-discrete error estimates for theimplicit Euler scheme is presented for the velocity tracking problem (without control constraints) forthe homogeneous Stokes equations using the variational discretization approach and for smooth dataRecently a-priori error estimates for the velocity tracking problem for Navier-Stokes flows withcontrol constraints were analyzed in the works of [13 14] The lowest order (piecewise constants)discontinuous Galerkin scheme in time combined with conforming elements in space for the velocityand the pressure was analyzed and estimates for the state adjoint and control variables were derivedfor three separate choices of control discretization (piecewise constants linears and the variationaldiscretization) Our work is motivated by the results of [13 14] and it can be viewed as an attemptto extend these results to include the cases of rough data and high order schemes via the derivationof a symmetric estimateOther results concerning discontinuous time-stepping approaches are almost related to distributedcontrols for linear and semilinear parabolic pdes Recently error estimates related to distributedoptimal control problems for semi-linear parabolic pdes are developed in the works of [94] withcontrol constraints and H1
0 (Ω) cap Linfin(Ω) initial data and in [27] a priori error estimates of symmetrictype for problems without control constraints Finally we also mention several related works[6 20 21 88 89 95 100] regarding parabolic optimal control problems with and and without controlconstraints which may involve high order discrete schemesSeveral results regarding the analysis of optimal control problems can be found in [56 80 93 109] (seealso references within) For general results related to the discontinuous Galerkin method parabolicpdersquos (without applying controls) we refer the reader to [104 73] (see also references therein) Aposteriori estimates and related adaptivity issues within the discontinuous Galerkin framework foroptimal control problems were also explored in the works of [84 87] (see also references within)
2The Continuous Optimality
System The Existence Of TheSolution
In this chapter we present the basic assumptions to be used an introductory study on the existenceof a solution and the continuous optimization system
Contents21 Assumptions 15222 The continuous control problem and the existence of solution 15323 The optimality system 156
152 2 The Continuous Optimality System The Existence Of The Solution
21 Assumptions
Robin boundary control linear problem For any η ge 0 The bilinear form associated to our operatoris given by
a(y v) = η
int
Ωnablaynablavdx forally v isin H1(Ω)
and satisfies the standard coercivity and continuity conditions
a(y y) gt η nablay2L2(Ω) α(y v) 6 Cη yH1(Ω) vH1(Ω) forally v isin H1(Ω)
Semilinear distributed optimal control problem In this case too the bilinear form associated toour operator is defined by
a(y v) =int
ΩA(x)nablaynablavdx forall y v isin H1(Ω)
and satisfies the standard coercivity and continuity conditions
a(y y) ge ηy2H1(Ω) a(y v) le CcyH1(Ω)vH1(Ω) forall y v isin H10 (Ω)
The data satisfy the minimal regularity assumptions which guarantee the existence of a weak solutiony isinW (0 T ) ie
f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω)
while the distributed control g will be sought in L2[0 T L2(Ω)] Note that under the above regularityassumptions one can only show convergence of the discrete schemes see [22 Section 3] (even in theuncontrolled case )For error estimates additional regularity assumptions are needed in order to guarantee rates ofconvergence In particular we will assume that y isin Linfin[0 T L4(Ω)] which typically requiresthat y0 isin H1
0 (Ω) f isin L2[0 T L2(Ω)] The choice of the control space significantly simplifies theimplementation of the finite element algorithm since it leads to an algebraic optimality conditionHence it avoids the use of spaces of fractional order or the solution of an extra pde which typicallyoccurs when other norms of are included in the functional (see eg [56])For the subsequent analysis it suffices that the target yd isin L2[0 T L2(Ω)] However in most cases ydis actually smoother since the target typically corresponds to the solution a parabolic pde and henceit can be assumed that yd isinWD(0 T ) For the analysis of our discrete schemes the semi-linear termis required to fulfill the following structural assumptions
Assumption 211 (a) For convergence of the state variable The semi-linear term φ isin C1(RR)satisfies
φprime(s) ge 0∣∣φ(s)
∣∣ le C|s|p∣∣φprime(s)
∣∣ le C∣∣s∣∣pminus1
sφ(s) ge C∣∣s∣∣p+1
for 1 lt p le 3
(b) For convergence of the state and adjoint variable In addition to (a) φprime be Lipschitz continuouswith Lipschitz constant CL or φ isin C2(RR) with |φprimeprime(s)| le C|s|pminus2 for 2 lt p le 3(c) If the semi-linear also includes time-space coefficients ie φ(s) equiv φ(t x s) [0 T ]times Ωtimes Rrarr Rthen in addition to (a)-(b) φ(0) φprime(0) are required to be uniformly bounded
Remark 212 Convergence can be shown by simply assuming growth and monotonicity conditionsof Assumption 211 (a)-(b) on φ φprime (see [22 Section 3]) The Lipschitz continuity assumption on φprimeis imposed only to minimize technicalities Most of the results presented here are still valid underthe weaker assumptions of [94] provided that the initial data belong to H1
0 (Ω) cap Linfin(Ω) We refer
22 The continuous control problem and the existence of solution 153
the reader to [109] (see also references within) for a detailed analysis of possible assumptions on thesemi-linear term and on the regularity of the data Here we have chosen to impose the minimalregularity assumptions that guarantee the existence on the corresponding discrete solution on the spaceLinfin[0 T L2(Ω)] cap L2[0 T H1
0 (Ω)]
Evolutionary Stokes problem with distributed control The bilinear form associated to our operatoris given by
a(y v) = ν
int
Ωnablaynablavdx forally v isin H1
0(Ω)
and satisfies the standard coercivity and continuity conditions
a(y y) gt ν nablay2L2(Ω) α(y v) 6 Cν yH1(Ω) vH1(Ω) forally v isin H10(Ω)
Finally the bilinear form associated to the pressure is gived by
b(v q) =int
Ωqnablavdx forallv isin H1
0(Ω) q isin L2(Ω)
which satisfies the standard continuity and inf-sup conditions (see eg [52 102]) ie
b(v q) le CvH1(Ω)qL2(Ω)
andinf
qisinL20(Ω)
supvisinH1
0(Ω)
b(v q)vH1(Ω)qL2(Ω)
ge c gt 0
Next we introduce the basic results related to the solution existence under the above assumptions
22 The continuous control problem and the existence of solution
Here we will study the existence of an optimal solution constrained to evolutionary partial differentialequations We will handle boundary and distributed control and for every case it is necessary toprove the stability and the the existence of a unique (or not unique) optimal solution We have tomention that if the minimization functional is convex (like linear problems) it is easy to prove thatwe have unique solution If the functional is not convex like semilinear problems we have a wholesolution but but it is not unique since we can minimize functional using various control functions
Robin boundary control linear problem In this problem we study the case with and withoutconstraints for the control function Starting present weak form of the basic equation Starting weintroduce the weak form of the state equation Given f isin L2 [0 T H1(Ω)lowast
] g isin L2 [0 T Hminus12(Γ)
]
and y0 isin L2(Ω) we seek y isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] such that for ae t isin (0 T ] and forall v isin H1(Ω)
〈yt v〉+ a(y v) + λ 〈y v〉Γ = 〈f v〉+ λ 〈g v〉Γ and (y(0) v) = (y0 v) (221)
An equivalent weak formulation suitable for dG schemes is to seek y isin WR(0 T ) such that for allv isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast]
(y(T ) v(T )) +int T
0(minus〈y vt〉+ a(y v) + λ 〈y v〉Γ)dt = (y0 v(0)) +
int T
0(〈f v〉+ λ 〈g v〉Γ)dt (222)
154 2 The Continuous Optimality System The Existence Of The Solution
The basic existence uniqueness and regularity result of (222) follows (see eg [25])
Theorem 221 Suppose g isin L2[0 T Hminus12+θ(Γ)] cap Hθ[0 T Hminus12(Γ)] y0 isin Hθ(Ω) and f isinL2[0 T H1minusθ(Ω)lowast] for some θ isin [0 1] Then there exists a unique y isin L2[0 T H1+θ(Ω)] capH1[0 T H1minusθ(Ω)lowast] satisfying (222) and
yL2[0T H1+θ(Ω)] + ytL2[0T H1minusθ(Ω)lowast] le C(fL2[0T H1minusθ(Ω)lowast] + u0Hθ(Ω) + gL2[0T Hminus12+θ(Γ)]
+gHθ[0T Hminus12(Γ)]
)
Thus the control to state mapping G L2[0 T L2(Γ)]rarrWR(0 T ) which associates to each controlg the state G(g) = yg equiv y(g) via (222) is well defined and continuous Hence the cost functionalfrequently denoted to by its reduced form J(y g) equiv J(y(g)) equiv J(g) L2[0 T L2(Γ)]rarr R is also welldefined and continuous
Definition 222 Let f isin L2[0 T H1(Ω)lowast] y0 isin L2(Ω) and yd isin L2[0 T L2(Ω)] given data Thenthe set of admissible controls (denoted by Aad) is defined by
1 Unconstrained Controls Aad equiv L2[0 T L2(Γ)]
2 Constrained Controls Aad equiv g isin L2[0 T L2(Γ)] ga le g(t x) le gb for ae (t x) isin (0 T )timesΓ
The pair (y(g) g) isin WR(0 T ) times Aad is said to be an optimal solution if J(y(g) g) le J(w(h) h)forall(w(h) h) isinWR(0 T )timesAad
We will occasionally abbreviate the notation y equiv yg equiv y(g) Below we state the main resultconcerning the existence of an optimal solution (see for instance [109])
Theorem 223 Let y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] yd isin L2[0 T L2(Ω)] be given Then theboundary control problem has unique solution (y(g) g) isinWR(0 T )timesAad
Semilinear distributed optimal control problem First we quote a result regarding the solvabilityof the weak problem (given f g y0 we seek y isinWD(0 T ) for all v isinWD(0 T ))
(y(T ) v(T )) +int T
0
(minus 〈y vt〉+ a(y v) + 〈φ(y) v〉
)dt = (y0 v(0)) +
int T
0
(〈f v〉+ (g v)
)dt (223)
on the natural energy space under minimal regularity assumptions
Theorem 224 Let f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω) g isin L2[0 T L2(Ω)] Then there exists aunique solution y isinWD(0 T ) which satisfies the following energy estimate
yWD(0T ) le C(fL2[0T Hminus1(Ω)] + y0L2(Ω) + gL2[0T L2(Ω)]
)
Proof The proof is standard (see eg [25 43 113])
Next we state the definition of the set of admissible solutions Aad and of the (local) optimal pair
Definition 225 1 Given data f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω) and targetyd isin L2[0 T L2(Ω)] then (y g) is said to be an admissible element (pair) if y isin WD(0 T )g isin L2[0 T L2(Ω)] satisfy (223) (Note that J(y g) is bounded due to Theorem 224)
2 Given data f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω) and target yd isin L2[0 T L2(Ω)] we seek pair(y g) isin Aad such that J(y g) le J(w h) forall(w h) isin Aad when y minus wWD(0T ) + g minushL2[0T L2(Ω)] le δ for δ gt 0 appropriately chosen
22 The continuous control problem and the existence of solution 155
Below we state the main result concerning the existence of an optimal solution for the minimizationof the functional (113)
Theorem 226 Suppose y0 isin L2(Ω) f isin L2[0 T Hminus1(Ω)] yd isin L2[0 T L2(Ω)] Then the optimalcontrol problem has solution (y g) isinWD(0 T )times L2[0 T L2(Ω)]
Proof Similar to [25 50 80 109]
Remark 227 The solution to optimal control problems having states constrained to nonlinearparabolic pdersquos is in general not unique However we note that under additional assumptions onthe data of the control problem and the structure of the semi-linear term it is possible to prove thatthere exists a unique optimal control g (see eg [82 Chapter 3 pp 43]) and that the correspondingoptimality system admits a unique solution
Evolutionary Stokes problem with distributed control A possible weak formulation of the problem(116) is defined by Given data f isin L2[0 T L2(Ω)] y0 isin V(Ω) and control g isin L2[0 T L2(Ω)] weseek (y p) isinWS(0 T )times L2[0 T L2
0(Ω)] such that for ae t isin (0 T ]
〈yt v〉+ a(y v) + b(v p) = 〈f v〉+ (g v) forall v isin H10(Ω)
b(y q) = 0 forall q isin L20(Ω)
(y(0) v) = (y0 v) forall v isinW(Ω)(224)
A weak formulation of (116) suitable for the case of rough initial data is defined by using divergence-free test functions and can be written as follows Given f isin L2[0 T V(Ω)lowast] g isin L2[0 T L2(Ω)] andy0 isinW(Ω) we seeky isin L2[0 T V(Ω)] capH1[0 T V(Ω)lowast] such that for ae t isin (0 T ]
〈yt v〉+ a(y v) = 〈f v〉+ (g v) forallv isin V(Ω)(y(0) v) = (y0 v) forallv isinW(Ω) (225)
To the contrary from the numerical analysis viewpoint a desirable weak formulation suitable forthe analysis of dG schemes is to seek y isin WS(0 T ) and p isin L2[0 T L2
0(Ω)] such that for allv isin L2[0 T H1(Ω)] capH1[0 T Hminus1(Ω)] and for all q isin L2[0 T L2
0(Ω)]
(y(T ) v(T )) +int T
0(minus〈y vt〉+ a(y v) + b(v p)) dt = (y0 v(0)) +
int T
0(〈f v〉+ (g v)) dt
int T
0b(y q)dt = 0
(226)
Some comments regarding the existence and uniqueness of weak solutions of the evolutionary Stokesand the equivalence of formulations (224) (225) and (226) follow
Remark 228 Recall that standard regularity theorems in [35 102] show that if f g isin L2[0 T W(Ω)]and y0 isin V (Ω) then the solution (y p) of equations (224) satisfies
(y p) isin L2[0 T H2(Ω) cap V (Ω)] capH1[0 T W(Ω)]times L2[0 T H1(Ω) cap L20(Ω)]
In this case weak formulations (224) (225) and (226) are essentially equivalent If the data f isinL2[0 T Vlowast(Ω)] y0 isinW(Ω) then there exists a unique weak solution that satisfies y isin L2[0 T H1
0(Ω)capV(Ω)]capHminus1[0 T Vlowast(Ω)] while the pressure p satisfies (116) in a distributional sense and yt+nablap isinL2[0 T Hminus1(Ω)] In the above case we note that it is not evident whether the pressure belongs toL2[0 T L2
0(Ω)] under minimal regularity assumptions (see eg [102]) and hence formulation (224)and (226) is not necessarily valid unless the existence of a pressure p isin L2[0 T L2
0(Ω)] is assumed
The control to state mapping G L2[0 T L2(Ω))] rarr WS(0 T ) which associates to each controlg the state G(g) = yg equiv y(g) via (225) is well defined and continuous Furthermore we note
156 2 The Continuous Optimality System The Existence Of The Solution
that if more regularity is available to data ie if y0 isin V(Ω) and f isin L2[0 T L2(Ω)] theny(g) isin L2[0 T H2(Ω) cap V (Ω)] capH1[0 T L2(Ω)] and p isin L2[0 T H1(Ω) cap L2
0(Ω)] Hence the costfunctional is frequently denoted by its reduced form J(y g) equiv J(y(g)) equiv J(g) L2[0 T L2(Ω)]rarr Ris continuous and well defined
Definition 229 Let f isin L2[0 T V(Ω)lowast] y0 isinW(Ω) and yd isin L2[0 T W(Ω)] Then the set ofadmissible controls (denoted by Aad) is defined by
1 Unconstrained Controls Aad equiv L2[0 T L2(Ω)]
2 Constrained Controls Aad equiv g isin L2[0 T L2(Ω)] ga le g(t x) le gb for ae (t x) isin(0 T )times Ω
The pair (y(g) g) isin WS(0 T ) times Aad is said to be an optimal solution if J(y(g) g) le J(w(h) h)forall(w(h) h) isinWS(0 T )timesAad
The main result concerning the existence of an optimal solution follows directly from the setting ofour problem (see for eg [109]) since Aad 6= 0 (note that (y(0) 0) isin WS(0 T ) times Aad for instancewith loss of generality)
Theorem 2210 Let y0 isinW(Ω) f isin L2[0 T V(Ω)lowast] yd isin L2[0 T L2(Ω)] be given data Thenthe optimal control problem has unique solution (y(g) g) isinWS(0 T )times L2[0 T L2(Ω)] In additionthere exists a pressure p that satisfies (116) in a distributional sense If in addition y0 isin V(Ω)f isin L2[0 T L2(Ω)] then p isin L2[0 T H1
0 (Ω) cap L20(Ω)] and the pair (y p) also satisfies (226)
23 The optimality system
Robin boundary control linear problem An optimality system of equations can be derived by usingstandard techniques see for instance [109] or [25 Section 2] We first state the basic differentiabilityproperty of the cost functional
Lemma 231 The cost functional J L2[0 T L2(Γ)] rarr R is of class Cinfin and for every g u isinL2[0 T L2(Γ)]
Jprime(g)u =
int T
0
int
Γ(micro(g) + αg)udxdt
where micro(g) equiv microg isinWR(0 T ) is the unique solution of following problem For all v isin L2[0 T H1(Ω)]capH1[0 T H1(Ω)lowast]
int T
0
(〈microg vt〉+ a (microg v) + λ 〈microg v〉Γ
)dt = minus(microg(0) v(0)) +
int T
0(yg minus yd v)dt (237)
where microg(T ) = 0 In addition (microg)t isin L2[0 T H1(Ω)lowast]
Therefore the optimality system which consists of the state and adjoint equations and the optimalitycondition takes the form
Lemma 232 Let (yg g) equiv (y g) isinWR(0 T )timesAad denote the unique optimal pair of Definition222 Then there exists an adjoint micro isin WR(0 T ) satisfying micro(T ) = 0 such that for all v isinL2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast]
(y(T ) v(T )) +int T
0(minus〈y vt〉+ a (y v) + λ 〈y v〉Γ) dt = (y0 v(0)) +
int T
0(〈f v〉+ λ 〈g v〉Γ) dt (238)
23 The optimality system 157
int T
0(〈micro vt〉+ a (v micro) + λ 〈micro v〉Γ) dt = minus(micro(0) v(0)) +
int T
0(y minus yd v) dt (239)
1) Unconstrained Controlsint T
0(αg + λmicro u)Γ dt = 0 forallu isin Aad (2310)
2) Constrained Controls int T
0
int
Γ(αg + λmicro) (uminus g) dxdt ge 0 forallu isin Aad (2311)
In addition yt isin L2[0 T H1(Ω)lowast] micro isin L2[0 T H2(Ω)] capH1[0 T L2(Ω)] and (2311) is equivalentto g(t x) = Proj[gagb]
(minus λα micro(t x)
)equiv Proj[gagb]
(ηαpartmicro(tx)partn
)for ae (t x) isin (0 T ]times Γ
Proof The derivation of the optimality system is standard (see eg [109]) For the enhanced regularityon micro we note that y minus yd isin L2[0 T L2(Ω)] and apply the analogue of Theorem 221 for (239) toget that micro isin L2[0 T H2(Ω)] capH1[0 T L2(Ω)]
Remark 233 We point out that for smooth boundary and for any v isin H2(Ω) we obtain thatthe normal derivative partv
partn is well defined and belongs to H12(Γ) This is not the case when Γ ispolygonal domain (say only Lipschitz continuous) despite the fact that on each straight component(denoted by Γi) we clearly obtain partv
partn |Γi isin H12(Γi) We refer the reader to [51] for relatedregularity results for general polygonal domains If the boundary is smooth eg of class C2 thenmicro|Γ isin L2[0 T H32(Γ)] cap H34[0 T L2(Γ)] Hence a bootstrap argument can be applied in orderto improve the regularity of g y see eg [86] For example in case of unconstrained controlsg isin L2[0 T H32(Γ)] cap H34[0 T L2(Γ)] too which results y isin L2[0 T H2(Ω)] cap H1[0 T L2(Ω)]when y0 isin H1(Ω)
Semilinear distributed control problem Suppose now that (y g) isin Aad is a (local) optimal solutionin the sense of Definition 225 Then an optimality system corresponding to the optimal controlproblem of Definition 225 can be easily derived based on well known Lagrange multiplier techniquessee eg [25 50 80 93] Given f y0 yd satisfying the assumptions of Definition 225 we seeky micro isinWD(0 T ) such that for all v isinWD(0 T )
(y(T ) v(T )) +int T
0
(minus 〈y vt〉+ a(y v) + 〈φ(y) v〉
)dt = (y0 v(0)) +
int T
0
(〈f v〉+ (g v)
)dt
y(0 x) = y0(2312)int T
0
(〈micro vt〉+ a(micro v) + 〈φprime(y)micro v〉
)dt = minus(micro(0) v(0)) +
int T
0(y minus yd v)dt
micro(T x) = 0(2313)
int T
0(αg + micro u)dt = 0 forallu isin L2[0 T L2(Ω)] (2314)
Remark 234 Note that due to optimality condition we obtain that the control g is actually smootherie g = minus(1α)micro isinWD(0 T ) The later can be used to obtain improved regularity results for theprimal and adjoint variables via when additional regularity on yd f y0 is available
Evolutionairy Stokes distributed optimal control problem An optimality system of equations canbe derived by using standard techniques see for instance [56 109] or [13 Section 3] We first statethe basic differentiability property of the cost functional
Lemma 235 The cost functional J L2[0 T L2(Ω)] rarr R is of class Cinfin and for every g u isinL2[0 T L2(Ω)]
Jprime(g)u =
int T
0
int
Ω(micro(g) + αg)udxdt
158 2 The Continuous Optimality System The Existence Of The Solution
where micro(g) equiv microg isinWS(0 T ) is the unique solution of following problem For all v isin L2[0 T V(Ω)] capH1[0 T V(Ω)lowast]
int T
0(〈microg vt〉+ a(microg v)) dt = minus(microg(0) v(0)) +
int T
0(yg minus yd v)dt (2315)
where microg(T ) = 0 In addition (microg)t isin L2[0 T L2(Ω)] and there exists pressure φ isin L2[0 T H1(Ω) capL2
0(Ω)] such that the backwards in time Stokes equation is satisfied in the sense of weak formulation(226)
Therefore the optimality system which consists of the state and adjoint equations and the optimalitycondition takes the following form
Lemma 236 Let (yg g) equiv (y g) isinWS(0 T )timesAad denote the unique optimal pair of Definition229 Then there exists an adjoint micro isin WS(0 T ) satisfying micro(T ) = 0 such that for all v isinL2[0 T V(Ω)] capH1[0 T V(Ω)lowast]
(y(T ) v(T )) +int T
0(minus〈y vt〉+ a(y v)) dt = (y0 v(0)) +
int T
0(〈f v〉+ (g v)) dt (2316)
int T
0(〈micro vt〉+ a(v micro)) dt = minus(micro(0) v(0)) +
int T
0(y minus yd v)dt (2317)
1) Unconstrained Controlsint T
0(αg + micro u) dt = 0 forallu isin Aad (2318)
2) Constrained Controlsint T
0
int
Ω(αg + micro) (uminus g) dxdt ge 0 forallu isin Aad (2319)
In addition yt isin L2[0 T V(Ω)lowast] micro isin L2[0 T H2(Ω)] capH1[0 T L2(Ω)] and (2319) is equivalentto g(t x) = Proj[gagb]
(minus 1α micro(t x)
)for ae (t x) isin (0 T ] times Ω In addition there exists a pressure
φ isin L2[0 T H1(Ω) cap L20(Ω)] associated to the adjoint variable micro satisfying the backwardsrsquo in time
evolutionary Stokes in the sense of formulation (226)
Proof The derivation of the optimality system is standard (see eg [109]) For the enhanced regularityon micro we note that micro(T ) = 0 and y minus yd isin L2[0 T L2(Ω)] and hence (2317) implies that to get thatmicro isin L2[0 T H2(Ω) capV(Ω)] capH1[0 T L2(Ω)] For the regularity of the corresponding pressure φ werefer to Remark 228
Remark 237 We refer the reader to [13 14] for enhanced related regularity results when controlconstraints are involved If the boundary is smooth eg of class C2 then g isin H1(ΩT )capC[0 T H1(Ω)]capL2[0 T W1p(Ω)] when y0 isin V(Ω) and f isin L2[0 T L2(Ω)] In particular (2316) and (2317)take the following form For all v isin L2[0 T H1
0(Ω)] capH1[0 T Hminus1(Ω)] and q isin L2[0 T L20(Ω)]
(y(T ) v(T )) +int T
0(minus〈y vt〉+ a(y v) + b(v p)) dt = (y0 v(0)) +
int T
0(〈f v〉+ (g v)) dt
int T
0b(y q)dt = 0
(2320)
int T
0
(〈micro vt〉+ a(v micro) + b(v φ)
)dt = minus(micro(0) v(0)) +
int T
0(y minus yd v)dt
int T
0b(micro q)dt = 0
(2321)
Thus p φ isin L2[0 T H1(Ω) cap L20(Ω)] When control constraints are not present then a bootstrap
argument can be applied in order to improve the regularity of g micro y in a straightforward manner
3Approximation and Numerical
AnalysisIn this chapter we introduce the fully discrete optimization system and the error estimates for each ofthe problems that we described aboves
Contents31 The discrete optimal control problem 160
311 Preliminaries and mesh properties 160312 The fully-discrete optimal control problem 163313 The discrete optimality system 170
32 Error estimates 174321 Robin boundary control problem 174
3211 The fully-discrete projection 174322 Unconstrained Controls Preliminary estimates for the optimality system 181
3221 Unconstrained Controls Symmetric error estimates - estimates forrough initial data 185
3222 Control Constraints The variational discretization approach 186323 Semilinear distributed optimal control problem 187
3231 The fully-discrete optimality system 1873232 Error estimates for the optimality system 1873233 An auxiliary optimality system 188
324 Stokes distributed optimal control problem 2013241 The fully-discrete projection 2023242 Symmetric estimates for the optimality system 2073243 Control Constraints The variational discretization approach 210
160 3 Approximation and Numerical Analysis
31 The discrete optimal control problem
Here we will study the construction of finite element spaces suitable for the above problems the fullydiscrete optimal control problem and stability estimates
311 Preliminaries and mesh properties
Robin boundary control problem We consider a family of triangulations (sayThhgt0) of Ω defined in the standard way ([34]) To every element T isin Th we associate twoparameters hT and ρT denoting the diameter of the set T and the diameter of the largest ballcontained in T respectively The size of the mesh is denoted by h = maxTisinTh hT The followingstandard properties of the mesh will be assumed(i) There exist two positive constants ρT and δT such that hTρT le ρT and h
hTle δT forallT isin Th and forallh gt
0(ii) Given h let TjNhj=1 denote the family of triangles belonging to Th and having one side includedon the boundary Γ Thus if the vertices of Tj cap Γ are denoted by xjΓ xj+1Γ then the straight line[xjΓ xj+1Γ] equiv Tj cap Γ Here we also assume that x1Γ = xNh+1Γ
On the mesh Th we consider finite dimensional spaces Uh sub H1(Ω) constructed by piecewisepolynomials in Ω Standard approximation theory assumptions are assumed on these spaces Inparticular for any v isin H l+1(Ω) there exists an integer ` ge 1 and a constant C gt 0 (independent ofh) such that
infvhisinUh
v minus vhHs(Ω) le Chl+1minussvHl+1(Ω) for 0 le l le ` and s = minus1 0 1
We also use inverse inequalities on quasi-uniform triangulations ie there exist constants C ge 0such that vhH1(Ω) le ChvhL2(Ω) and vhL2(Ω) le ChvhH1(Ω)lowast etc
Approximations will be constructed on a (quasi-uniform) partition 0 = t0 lt t1 lt lt tN = T of [0 T ]ie there exists a constant 0 lt θ lt 1 such that minn=1N (tn minus tnminus1) ge θmaxn=1N (tn minus tnminus1)We also use the notation τn = tn minus tnminus1 τ = maxn=1N τ
n and we denote by Pk[tnminus1 tnUh] thespace of polynomials of degree k or less having values in Uh We seek approximate solutions whobelong to the space
Uh = yh isin L2[0 T H1(Ω)] yh|(tnminus1tn] isin Pk[tnminus1 tnUh]
By convention the functions of Uh are left continuous with right limits and hence will write ynh equiv ynhminusfor yh(tn) = yh(tnminus) and ynh+ for yh(tn+) while the jump at tn is denoted by [ynh ] = ynh+ minus ynh In theabove definitions we have used the following notational abbreviation yhτ equiv yh Uhτ equiv Uh etc Forthe time-discretization our main focus will be the lowest order scheme (k = 0) which corresponds tothe discontinuous Galerkin variant of the implicit Euler We emphasize that other schemes (includingschemes of arbitrary order in time and space) can be included in our proofs However the limitedregularity will be acting as a barrier in terms of developing estimates of higher order
For the control variable we have two separate choices for the constrained and the unconstrained caserespectively In both cases our discretization is motivated by the optimality condition see also [30]Case 1 Unconstrained Controls We employ a discretization which allows the presence ofdiscontinuities (in time) ie we define
Gh = gh isin L2[0 T L2(Γ)] gh|(tnminus1tn] isin Pk[tnminus1 tnGh]
31 The discrete optimal control problem 161
Here a conforming subspace Gh sub L2(Γ) is specified at each time interval (tnminus1 tn] which satisfystandard approximation properties Even though various choices of Gh are possible here we focusour attention to the natural choice Gh = Uh|Γ and we refer the reader to [52 57] (see also referenceswithin) for a detailed analysis Only L2[0 T L2(Γ)] regularity will be needed in the error estimatesTo summarize for the choice of piecewise linears (in space) we choose
Uh = vh isin C(Ω) vh|T isin P1 for all T isin ThGh = uh isin C(Γ) uh|[xiΓxi+1Γ] isin P1 for i = 1 Nh
Case 2 Constrained Controls Analogously to the previous case we employ the variationaldiscretization concept (see eg [65]) which allows the natural discretization of the controls viathe adjoint variable In this case we do not explicitly discretize the control variable ie Gh equivL2[0 T L2(Γ)]
Semilinear distributed optimal control problem Similarly with the boundary control problemthe fully-discrete approximations are constructed on a partition 0 = t0 lt t1 lt lt tN = T
of [0 T ] On each time interval (tnminus1 tn] of length τn equiv tn minus tnminus1 a subspace Unh of H10 (Ω) is
specified and it is assumed that each Unh satisfies the classical approximation theory results (see eg([34]) We also assume that the time-steps are quasi-uniform ie there exists 0 le θ le 1 such thatminn=1N τn ge θmaxn=1N τn Now we seek approximate solutions who belong to the space
Uh = yh isin L2[0 T H10 (Ω)] yh|(tnminus1tn] isin Pk[tnminus1 tnUnh ]
Here Pk[tnminus1 tnUnh ] denotes the space of polynomials of degree k or less having values in Unh Wealso use the following notational abbreviation yhτ equiv yh Uhτ equiv Uh etc The discretization of thecontrol can be effectively achieved through the discretization of the adjoint variable micro However wepoint out that the only regularity assumption on the discrete control is gh isin L2[0 T L2(Ω)]
By convention the functions of Uh are left continuous with right limits and hence will subsequentlywrite (abusing the notation) yn for yh(tn) = yh(tnminus) and yn+ for yh(tn+) The above notation will also beused for the error e = yminusyh function Due to a well known embedding resultWD(0 T ) sub C[0 T L2(Ω)](see eg [43 Chapter 5]) the exact solution y is in C[0 T L2(Ω)] so that the jump in the error attn denoted by [en] is [en] = [yn] = yn+ minus yn
Evolutionary Stokes problem with distributed control Similarly a family of triangulations ([34])denoted by Thhgt0) of Ω is defined in the standard way We assume that to every element T isin Thtwo parameters hT and ρT denoting the diameter of the set T and the diameter of the largestball contained in T respectively are assigned and the associated size of the mesh is denoted byh equiv maxTisinTh hT The following standard properties of the mesh will be assumed(i) There exist two positive constants ρT and δT such that hT
ρTle ρT and h
hTle δT forallT isin Th and
forallh gt 0(ii) Define Ωh = cupTisinThT and denote by Ωh and Γh its interior and boundary respectively We alsoassume that the boundary vertices of Th are points of Γ
On the mesh Th we consider two finite dimensional spaces Yh sub H10(Ω) and Qh sub L2
0(Ω) constructedby piecewise polynomials in Ωh and vanishing in Ωminus Ωh We note that under the above structuralassumptions if Ω is convex then Ωh is convex and |Ω minus Ωh| le Ch2 The above assumptions areenough in order to obtain an estimate for the cases where the initial data belong to W(Ω) or V(Ω)
The assumption on the domain to be convex and polygonal (or polyhedral in R3) is necessary since itis not known if convexity is enough to guarantee the H2 elliptic regularity of the stationary Stokesequations in R3 Furthermore more regularity on the boundary Γ (C3) implies H3 regularity of thestationary Stokes but typically demands much more complicated elements When dealing with higher
162 3 Approximation and Numerical Analysis
order schemes we emphasize that additional smoothness on Γ should be assumed see for instance[35 102] together with compatibility conditions in order to guarantee the appropriate regularity ofthe solutions
Standard approximation theory assumptions are assumed on these spaces In particular for anyv isin Hl+1(Ω) capH1
0(Ω) there exists an integer ` ge 1 and a constant C gt 0 (independent of h) suchthat
infvhisinYh
v minus vhHs(Ω) le Chl+1minussvHl+1(Ω) for 0 le l le ` and s = minus1 0 1 (311)
Also for any q isin H l(Ω) cap L20(Ω) then
infqhisinQh
q minus qhL2(Ω) le ChlqHl(Ω) for 0 le l le ` (312)
In addition the spaces Yh and Qh must satisfy the inf-sup condition ie there exists C gt 0(independent of h) such that
infqhisinQh
supvhisinYh
b(vh qh)vhH1(Ωh)qhL2(Ωh)
gt C (313)
We also consider the discrete divergence free analog of Yh denoted by
Uh = vh isin Yh b(vh qh) = 0 forall qh isin Qh
We will also use inverse inequalities on quasi-uniform triangulations ie there exist constants C c gt 0such that vhH1(Ω) le ChvhL2(Ω) and vhL2(Ω) le chvhH1(Ω)lowast etc Approximations will beconstructed on a (quasi-uniform) partition 0 = t0 lt t1 lt lt tN = T of [0 T ] ie there existsa constant 0 lt θ lt 1 such that minn=1N (tn minus tnminus1) ge θmaxn=1N (tn minus tnminus1) We denote byτn = tn minus tnminus1 τ = maxn=1N τ
n and by Pk[tnminus1 tn Yh] Pk[tnminus1 tn Uh] and Pk[tnminus1 tnQh]the spaces of polynomials of degree k or less having values in Yh Uh and Qh respectively We seekapproximate solutions for the velocity and the pressure who belong to the space
Yh = yh isin L2[0 T H10(Ω)] yh|(tnminus1tn] isin Pk[tnminus1 tn Yh]
Uh = yh isin L2[0 T H10(Ω)] yh|(tnminus1tn] isin Pk[tnminus1 tn Uh]
Qh = yh isin L2[0 T L20(Ω)] yh|(tnminus1tn] isin Pk[tnminus1 tnQh]
The following remark highlights why the use of same degree of polynomials with respect to time isthe natural choice for the discretization (in time) of the pressure
Remark 311 It is obvious that the analogue of the discrete divergence free subspace of Pk[tnminus1 tn Yh]is Znh = vh isin Pk[tnminus1 tn Yh]
int tntnminus1 b(vh qh) = 0 forall qh isin Pk[tnminus1 tnQh] Then [32 Lemma
23] states that Znh equiv Pk[tnminus1 tn Uh] Therefore we may write that
Zh equiv vh isin Yh int T
0b(vh qh) = 0 forall qh isin Qh
= vh isin Yh vh|(tnminus1tn] isin Znh = vh isin Yh vh|(tnminus1tn] isin Pk[tnminus1 tn Uh] equiv Uh
We refer the reader to [32 Section 2] for more details
In the above notations by convention the functions of Uh are left continuous with right limits Thuswe will write yn for y(tn) equiv y(tnminus) ynminus1
+ for y(tnminus1+ ) ynh for yh(tn) = yh(tnminus) and ynh+ for y(tn+) while
the jump at tn is denoted by [ynh ] = ynh+ minus ynh In the above definitions we have also used thefollowing notational abbreviation yhτ equiv yh Yhτ equiv Yh Uhτ equiv Uh etc This is due to the fact thatthe time-discretization parameter τ can be chosen independent of h
31 The discrete optimal control problem 163
We emphasize that other schemes (including schemes of arbitrary order in time and space) willbe inclued in our proofs However the limited regularity will be acting as a barrier in terms ofdeveloping estimates of high order at least in presence of control constraints The case of the lowestorder scheme in time and space has been treated in detail in the recent works of [13 14] for thevelocity tracking problem of Navier-Stokes flows with control constraints when data y0 isin V(Ω)f isin L2[0 T L2(Ω)]
For the control variable we have two separate choices for the constrained and the unconstrained caserespectively In both cases our discretization is motivated by the optimality conditionCase 1 The Unconstrained Controls We employ the natural space-time discretizationwhich allows the presence of discontinuities (in time) In particular we define by Gh equiv Yh OnlyL2[0 T L2(Ω)] regularity will be needed in the error estimatesCase 2 Constrained Controls Analogously to the previous case we employ the variationaldiscretization concept see eg [65] which allows the natural discretization of the controls via the adjointvariable In this case we do not explicitly discretize the control variable ie Gh equiv L2[0 T L2(Ω)]
312 The fully-discrete optimal control problem
Robin boundary control problem The discontinuous time-stepping fully-discrete scheme for thecontrol to state mapping Gh L2[0 T L2(Γ)] rarr Uh which associates to each control g its stateGh(g) = ygh equiv yh(g) is defined as follows For any boundary data g isin L2[0 T L2(Γ)] for givendata y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] and target yd isin L2[0 T L2(Ω)] we seek yh isin Uh such that forn = 1 N and for all vh isin Pk[tnminus1 tnUh]
(ynh vnh) +int tn
tnminus1
(minus 〈yh vht〉+ a(yh vh) + λ〈yh vh〉Γ
)dt
= (ynminus1h vnminus1
h+ ) +int tn
tnminus1
(〈f vh〉+ λ〈g vh〉Γ
)dt (314)
We note that in the above definition only g isin L2[0 T L2(Γ)] regularity is needed to validate thefully-discrete formulation Stability estimates at partition time-points as well as in L2[0 T H1(Ω)] andL2[0 T L2(Γ)] norms easily follow by setting vh = yh into (314) For the estimate at arbitrary time-points we may apply the techniques which were developed in [31 Section 2] for general linear parabolicPDEs (see also [23 Section 3] for stability estimate for semilinear parabolic PDEs with Robin data)Similar to the continuous case the control to fully-discrete state mapping Gh L2[0 T L2(Γ)]rarr Uhis well defined and continuous The definition of the discrete Robin boundary control problem nowfollows
Definition 312 Let f isin L2[0 T H1(Ω)lowast] y0 isin L2(Ω) yd isin L2[0 T L2(Ω)] be given dataSuppose that the set of discrete admissible controls is denoted by Adad equiv GhcapAad and let Jh(yh gh) equiv12int T
0int
Ω |yh minus yd|2dxdt+ α2int T
0int
Γ |gh|2dxdt Here the pair (yh gh) isin Uh timesAdad satisfy (314) Thenthe pair (yh gh) isin Uh timesAdad is said to be an optimal solution if Jh(yh gh) le Jh(wh uh) forall(wh uh) isinUh timesAdad
The existence the discrete optimal control problem can be proved by standard techniques whileuniqueness follows from the structure of the functional and the linearity of the equation Thebasic stability estimates in terms of the optimal pair (yh gh) isin WR(0 T ) times L2[0 T L2(Γ)] canbe easily obtained We close this subsection by quoting the estimate at arbitrary time-pointsfor schemes of arbitrary order under minimal regularity assumptions adapted to our case from[23 Section 3] The estimate highlights the fact that the natural choice of the discrete energynorm for the state variable associated to discontinuous time-stepping schemes is WR(0T ) =L2[0T H1(Ω)] + Linfin[0T L2(Ω)] + L2[0T L2(Γ)]
164 3 Approximation and Numerical Analysis
Lemma 313 Let y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] If (yh gh) isin Uh timesAdad denotes the solutionpair of the discrete optimal control problem Then
yhLinfin[0T L2(Ω)] le C max
1(λ
α
)12 ( ∥∥y0∥∥L2(Ω) + fL2[0T H1(Ω)lowast]
)
Here C ge 0 depends on 1CF minη λ Ck and Ω but not on α τ h
Proof We will sketch the proofStep 1 Since (yh 0) is an admissible pair for the discrete problem it is
J(yh gh) le J(yh 0) = 12
int T
0yh minus yd2L2(Ω) le C
(yh2L2[0T L2(Ω)] + yd2L2[0T L2(Ω)]
)
le C(fL2[0T H1(Ω)lowast] + y0L2(Ω) + yd2L2(Ω)
)
Step 2 Setting υh = yh to relation
(yn υn) +int tn
tnminus1(〈minusyh υht〉+ a(yh υh) + λ 〈yh υh〉Γ) = (ynminus1 υnminus1
+ ) +int tn
tnminus1(〈f υh〉+ λ 〈gh υh〉Γ)
we have
12 y
n2L2(Ω) + 12∥∥[ynminus1]
∥∥2L2(Ω) minus
12∥∥ynminus1∥∥2
L2(Ω) +int tn
tnminus1
(CF minη λ yh2H1(Ω) + λ
4 yhL2(Γ)
)dt
leint tn
tnminus1
(1CF
minη λ f2H1(Ω)lowast + λ gh2L2(Γ)
)dt
Next we use the bound forint tntnminus1 gh2L2(Γ) dt from the relation J(yh gh) le C
(fL2[0T H1(Ω)lowast]
+ y0L2(Ω) + yd2L2(Ω))and we have
yn2L2(Ω) +nminus1sum
i=1[y]2L2(Ω) +
int tn
0
(CF minη λ yh2H1(Ω) + λ yh2L2(Γ)
)le Cst max1 λ
a
Step 3 For the bound in arbitrary time points we use the exponential interpolation eminusρ(tminustnminus1)yhdenoted by _
yh
int tn
tnminus1(yht_yh)dt =
int tn
tnminus1(yht yh)eminusρ(tminust
nminus1)dt
= 12 y
n2L2(Ω) eminusρ(tnminustnminus1) + 1
2∥∥[ynminus1]
∥∥2L2(Ω) minus
12∥∥ynminus1∥∥2
L2(Ω)
+ρ
2
int tn
tnminus1yhL2(Ω) e
minusρ(tminustnminus1)dt
leint tn
tnminus1
(∣∣∣a(yh_yh)∣∣∣+ λ
∣∣∣langyh
_yh
rangΓ
∣∣∣+∣∣∣langf
_yh
rang∣∣∣+ λ∣∣∣langgh
_yh
rangΓ
∣∣∣)dt
From projection theorem _yh is bounded from yh also it is
int tn
tnminus1|a(yh yh)| dt le Ck
int tn
tnminus1yh2L2[tnminus1tnH1(Ω)] dt
31 The discrete optimal control problem 165
int tn
tnminus1
∣∣∣langf
_yh
rang∣∣∣ dt le CkCF
minη λint tn
tnminus1f2H1(Ω)lowast dt+ CF minη λ
int tn
tnminus1yh2H1(Ω) dt
int tn
tnminus1λ∣∣∣langgh
_yh
rangΓ
∣∣∣+ λ∣∣∣langyh
_yh
rangΓ
∣∣∣ dt leint tn
tnminus1gh2L2(Γ) dt+ Ck(λ+ λ2
a)int tn
tnminus1yh2L2(Γ) dt
So
12 y
n2L2(Ω) eminusρ(tnminustnminus1) + 1
2∥∥[ynminus1]
∥∥2L2(Γ) minus
12∥∥[ynminus1]
∥∥2L2(Ω) + ρ
2
int tn
tnminus1yn2L2(Ω) e
minusρ(tminustnminus1)dt
le Ckint tn
tnminus1
(1CF
minη λ f2H1(Ω)lowast + (η + CF minη λ) yh2H1(Ω) + α gh2L2(Ω)
+(λ+ λ2
α) yn2L2(Γ))dt
)
and finally for ρ = 1τn
we take
12 y
n2L2(Ω) eminus1 + 1
2∥∥[ynminus1]
∥∥2L2(Ω) minus
12∥∥ynminus1∥∥2
L2(Ω) +(eminus12τn
) int tn
tnminus1yh2L2(Ω) dt
le Ckint tn
tnminus1
(minη λ
CFf2H1(Ω)lowast + (η + CF minη λ) yh2H1(Ω) + α gh2L2(Γ)
+(λ+ λ2
α) yh2L2(Γ))dt
)
also from the inverse estimate yh2L2(Ω) le Ckτn
int tntnminus1 yh2L2(Ω) dt we have
yhLinfin[tnminus1tnC2(Ω)] le Ck(∥∥ynminus1∥∥2
L2(Ω) +int tn
tnminus1
((1CF ) minη λ f2H1(Ω)lowast
+ (η + CF min(η λ)) yh2H1(Ω) + a gh2L2(Γ) + (λ+ λ2a) yh2L2(Γ)
))
then the term gh2L2(Γ) is bounded like before and we have the desired estimate
We note that the above estimate is valid even if the control constraints are present assuming that0 isin Adad
Semilinear distributed optimal control problem The discrete state equation can be defined asfollows Under the assumptions of Definition 225 we seek state yh isin Uh such that for anygh isin L2[0 T L2(Ω)]
(yn vn) +int tn
tnminus1
(minus 〈yh vht〉+ a(yh vh) + (φ(yh) vh)
)dt = (ynminus1 vnminus1
+ )
+int tn
tnminus1
(〈f vh〉+ (gh vh)
)dt forall vh isin Pk[tnminus1 tnUnh ] (315)
for n = 1 N The discrete admissible set Adad and the discrete (local) optimal control problem isnow defined analogously to the continuous problem
Definition 314 Suppose that the assumptions of the previous Chapter hold
1 Adad equiv (yh gh) isin Uh times L2[0 T Unh ] such that (315) holds
2 Discrete (local) Optimal Pair We seek pair (yh gh) isin Adad such that J(yh gh) le J(wh uh) forall (wh uh) isin Adad when
166 3 Approximation and Numerical Analysis
yh minus whL2[0T H10 (Ω)] + yh minus whLinfin[0T L2(Ω)] + gh minus uhL2[0T L2(Ω)] le δprime for δprime gt 0 appro-
priately chosen
Let yh be the solution of (315) without control Without loss of generality it is understood that thepair (yh 0) isin Adad and δprime are chosen in a way to guarantee that J(yh gh) le J(yh 0) The proof ofexistence of optimal solution of the discrete problem and its corresponding discrete optimality systemof equations (first order necessary conditions) require stability estimates for the solution of (315)under minimal regularity assumptions (see eg [22 Section 3]) These stability estimates are alsoneeded for the derivation of error estimates The yhX equiv yhLinfin[0T L2(Ω)] + yhL2[0T H1(Ω)] normis used as the natural energy norm associated to the DG formulation since the discrete time-derivativedoes not possesses any meaningful regularity due to the presence of discontinuities
Now we are ready to state stability estimates for the discrete optimal control problem Under anadditional assumption on the semi-linear term we derive a stability bound which improves thedependence of τ upon the penalty parameter α compared to the result of [22 Lemma 36]
Assumption 315 Suppose that tnNn=0 denotes a quasi-uniform partition of [0 T ] In additionto Assumption 211 we assume that φ satisfies the following assumption For all n = 1 N ands1 s2 isin L2[tnminus1 tnL2(Ω)] with s1 minus s2L2[tnminus1tnL2(Ω)] le ε for some ε gt 0 there exists CL gt 0(algebraic constant) such that
φ(s1)minus φ(s2)L2[tnminus1tnL2(Ω)] le CLs1 minus s2L2[tnminus1tnL2(Ω)]
Remark 316 In the remaining of this paper we will denote by CL constants that depend onlyupon Lipschitz constants of Assumptions 211 and 315 and by Ck constants that depend upon kBoth constants can be different in different appearances
Lemma 317 Suppose that y0 isin L2(Ω) yd isin L2[0 T L2(Ω)] f isin L2[0 T Hminus1(Ω)] are givenfunctions and let φ satisfy Assumptions 211 and 315 If (yh gh) isin Uh times L2[0 T Unh ] denotes asolution pair of the discrete (local) optimal control problem then
int T
0yh minus yd2L2(Ω)dt+ (α2)
int T
0gh2L2(Ω)dt
le C(y02L2(Ω) + (1η)
int T
0f2Hminus1(Ω)dt+
int T
0yd2L2(Ω)dt
)equiv Cst
where C is a constant depending only on Ω In addition for all n = 1 N
yn2L2(Ω) +nminus1sum
i=0[yi]2L2(Ω) +
int tn
0ηyh2H1(Ω)dt le Dyst
with Dyst equiv Cst max1 1α12 Let τ equiv maxi=1n τi with τi = ti minus timinus1 If τ leminCk8CLC12
st Ckα128 then the following estimate holds
yh2Linfin[0T L2(Ω)] le CDyst
where C depends on (Ccη) Ck and Ω but not on α τ h
Proof For the first two estimates we simply note that J(yh gh) le J(yh 0) equiv(12)
int T0 yh minus U2L2(Ω)dt where yh corresponds to the solution of (315) without control The
estimate on yh follows from [31 Section 2] For the second estimate we set vh = yh into (315) and
31 The discrete optimal control problem 167
use Youngrsquos inequality to obtain
(12)yn2L2(Ω) + (12)[ynminus1]2L2(Ω) + η
int tn
tnminus1yh2H1(Ω)dt
le (12)ynminus12L2(Ω) + (1(4α12))int tn
tnminus1yh2L2(Ω)dt+ α12
int tn
tnminus1gh2L2(Ω)dt
The estimate now follows by adding the above inequalities and using the first estimate For theestimate at arbitrary points the proof uses ideas of ([32]) For completeness we sketch the proof Setvh = yh into (315) where yh is the exponential interpolant of eminusρ(tminustnminus1)yh of yh (for some ρ gt 0)and defined as in Appendix Arsquo2 Then the definition of yh allows to obtain
int tn
tnminus1(yht yh)dt =
int tn
tnminus1(yht yh)eminusρ(tminust
nminus1)dt = (12)yn2L2(Ω)eminusρ(tnminustnminus1)
minus(12)ynminus12L2(Ω) + (ρ2)int tn
tnminus1yh(t)2L2(Ω)e
minusρ(tminustnminus1)dt (316)
Hence integrate by parts with respect to time in (315) and using (316) we obtain
(12)yn2L2(Ω)eminusρ(tminustnminus1) + (12)[ynminus1]2L2(Ω) minus (12)ynminus12L2(Ω)
+(ρ2)int tn
tnminus1yh(t)2L2(Ω)e
minusρ(tminustnminus1)dt+int tn
tnminus1〈φ(yh) yh〉dt
leint tn
tnminus1|a(yh yh)|dt+
int tn
tnminus1|〈f yh〉|dt+
int tn
tnminus1|(gh yh)|dt
Using Lemma A22 we may bound yh in terms of yh in various norms In particular using Youngrsquosinequalities we obtain
(12)yn2L2(Ω)eminusρ(tminustnminus1) + (12)[ynminus1]2L2(Ω) minus (12)ynminus12L2(Ω)
+(ρ2)int tn
tnminus1yh(t)2L2(Ω)e
minusρ(tminustnminus1)dt+int tn
tnminus1〈φ(yh) yh〉dt
le Ck(int tn
tnminus1
(f2Hminus1(Ω) + (Cc + η)yh2H1(Ω)
)dt
+int tn
tnminus1
(α12gh2L2(Ω) + (1α12)yh2L2(Ω)
)dt) (317)
It remains to bound the semi-linear term For this purpose using Assumption 211 we obtainint tn
tnminus1〈φ(yh) yh〉dt ge
int tn
tnminus1〈φ(yh)minus φ(yh) yh〉dt
Moving the last integral on the right hand side of (317) we obtain a bound as follows Lemma A22implies that the difference yh minus yh remains small In particular using the previously derived estimateon yhL2[0T L2(Ω)] we may bound yhminusyhL2[tnminus1tnL2(Ω)] le CkρτnyhL2[tnminus1tnL2(Ω)] le CkρτC12
st Therefore we deduce from Assumption 315 and Houmllderrsquos inequality
int tn
tnminus1〈φ(yh)minus φ(yh) yh〉dt le CLyh minus yhL2[tnminus1tnL2(Ω)]yhL2[tnminus1tnL2(Ω)]
le CkCLρτnC12st
int tn
tnminus1yh2L2(Ω)dt
168 3 Approximation and Numerical Analysis
Collecting the above inequalities into (317) we obtain
(12)yn2L2(Ω)eminusρ(tminustnminus1) + (12)[ynminus1]2L2(Ω) minus (12)ynminus12L2(Ω)
+(ρ2)int tn
tnminus1yh(t)2L2(Ω)e
minusρ(tminustnminus1)dt
le Ckint tn
tnminus1
(f2Hminus1(Ω) + (Cc + η)yh2H1(Ω) + α12gh2L2(Ω)
)dt
+(
(1α12) + CkCLρτnC12st
)int tn
tnminus1yh2L2(Ω)dt
le Ckint tn
tnminus1
(f2Hminus1(Ω) + (Cc + η)yh2H1(Ω) + α12gh2L2(Ω)
)dt
+τn(
(1α12) + CkCLρτnC12st
)yh2Linfin[tnminus1tnL2(Ω)]
Hence selecting ρ = 1τn and using the inverse estimate yh2Linfin[tnminus1tnL2(Ω)] le Ckτnint tntnminus1 yh(t)2L2(Ω)
we observe that the last term on the left hand side can be bounded from below by
(ρ2)int tn
tnminus1yh(t)2L2(Ω)e
minusρ(tminustnminus1)dt ge (eminus12τn)int tn
tnminus1yh(t)2L2(Ω)dt
ge Ckyh2Linfin[tnminus1tnL2(Ω)]
It remains to bound the last term at the right hand side Choosing τn gt 0 in a way hide this term onthe left hand side at the right hand side ie C12
st CkCLτn le Ck8 and (τnα12) le Ck8 ie forτn le min
(Ck8CLC12
st (α12Ck8) we obtain
(14)yh2Linfin[tnminus1tnL2(Ω)] le ynminus12L2(Ω)
+Ckint tn
tnminus1
(f2Hminus1(Ω) + (Cc + η)yh2H1(Ω) + α12gh2L2(Ω)
)dt
The estimate now follows by using the previously derived estimates at the energy norm and atpartition points
Remark 318 The Assumption 315 is also helpful in order to minimize technicalities in thesubsequent derivation of symmetric error estimates However we note that if the growth conditionis satisfied with exponent 1 le p le 2 it can be easily shown that φ(yh) minus φ(yh)L2[tnminus1tnL2(Ω)] leC(Cst Ck)yh minus yhL2[tnminus1tnL2(Ω)]
Similar to the case of [22 Theorem 38] (where φ satisfies growth and monotonicity conditions) thefollowing convergence result can be established when the same subspaces are being used at everytime interval ie Unh = Uh sub H1
0 (Ω) for n = 1 N under minimal regularity assumptions
Theorem 319 Given fixed h and partition 0 = t0 lt t1 lt lt tN = T of [0 T ] with τ =maxi=1N τi satisfying the assumptions of Lemma 317 and let the Assumption 211 hold Supposealso that f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω) yd isin L2[0 T L2(Ω)] and let α gt 0 Then for Unh equivUh sub H1
0 (Ω) and for quasi-uniform time-steps we obtain
bull There exist yh isin Uh and gh isin L2[0 T L2(Ω)] such that the pair (yh gh) satisfies the discreteequation (315) and the functional J(yh gh) is minimized
bull The discrete pair (yh gh) converges as τ h rarr 0 to solution (y g) of the continuous optimal
31 The discrete optimal control problem 169
control problem in the following sense
yh rarr y weakly in L2[0 T H10 (Ω)]
yh rarr y weakly- in Linfin[0 T L2(Ω)]yh rarr y strongly in L2[0 T L2(Ω)]gh rarr g weakly in L2[0 T L2(Ω)]
Remark 3110 The stability estimates under minimal regularity assumptions are valid even whendifferent subspaces are being used at every time interval The convergence result of [22 Theorem 38]is based on a discrete compactness argument of Walkington (see [110 Theorem 31]) for discontinuoustime-stepping schemes which is established when Unh equiv Uh However it is possible to extend the mainresult even in case of different subspaces We note also that the proof of Theorem 319 requires onlythe growth and monotonicity assumptions of Assumption 211
Evolutionary Stokes problem with distributed control The discontinuous time-stepping fully-discrete scheme for the control to state mapping Gh L2[0 T L2(Ω)] rarr Uh associates to eachcontrol g the corresponding state Gh(g) = ygh equiv yh(g) For any data g isin L2[0 T L2(Ω)] for givendata y0 isin W(Ω) f isin L2[0 T V(Ω)lowast] we seek yh isin Uh such that for n = 1 N and for allvh isin Pk[tnminus1 tn Uh]
(ynh vnh) +int tn
tnminus1
(minus 〈yh vht〉+ a(yh vh)
)dt = (ynminus1
h vnminus1h+ ) +
int tn
tnminus1
(〈f vh〉+ (g vh)
)dt (318)
Stability estimates at partition points as well as in L2[0 T H1(Ω)] norm easily follow by setting vh = yhinto (318) For the estimate at arbitrary time-points we refer the reader to [32 Appendix A] Thusthe stability estimates imply that the control to fully-discrete state mapping Gh L2[0 T L2(Ω)]rarr Uhis well defined and continuous Similar to the continuous case when more regularity is available todata ie y0 isin V(Ω) f isin L2[0 T L2(Ω)] then we seek (yh ph) isin Uh timesQh such that the followingformulation is satisfied For n = 1 N and for all vh isin Pk[tnminus1 tn Yh] qh isin L2[0 T L2
0(Ω)
(ynh vnh) +int tn
tnminus1
(minus 〈yh vht〉+ a(yh vh) + b(vh ph)
)dt = (ynminus1
h vnminus1h+ ) +
int tn
tnminus1
(〈f vh〉+ (g vh)
)dt
int tn
tnminus1b(yh qh)dt = 0 (319)
The fully-discrete optimal control problem can be defined as follows
Definition 3111 Let f isin L2[0 T V(Ω)lowast] y0 isin W(Ω) yd isinL2[0 T W(Ω)] be given data Suppose that the set of discrete admissible controls is denoted byAdad equiv Gh cap Aad and let Jh(yh gh) equiv 1
2int T
0int
Ωh |yh minus yd|2dxdt + α
2int T
0int
Ωh |gh|2dxdt Here the pair
(yh gh) isin Uh times Adad satisfy (318) Then the pair (yh gh) isin Uh times Adad is said to be an optimalsolution if Jh(yh gh) le Jh(wh uh) forall(wh uh) isin Uh timesAdad
The existence and uniqueness of the discrete optimal control problem can be proved by standardtechniques We close this subsection by quoting the estimate at arbitrary time-points for schemes ofarbitrary order under minimal regularity assumptions adapted to our case from [32 Section 4] Theestimate highlights the fact that the natural discrete energy norm for the state variable associated todiscontinuous time-stepping schemes is WS(0T ) = L2[0T H1(Ω)] + Linfin[0T L2(Ω)]
Lemma 3112 Suppose that y0 isinW(Ω) f isin L2[0 T V(Ω)lowast] If (yh gh)isin Uh timesAdad denotes thesolution pair of the discrete optimal control problem then there exists constant C gt 0 depending on1ν Ck and Ω but not on α τ h such that
yh2Linfin[0T L2(Ω)] le C(1α)( ∥∥y0∥∥2
L2(Ω) + f2L2[0T V(Ω)lowast])
170 3 Approximation and Numerical Analysis
313 The discrete optimality system
Robin boundary control problem Using well known techniques and the stability estimates inWR(0 T ) it is easy to show the differentiability of the relation g rarr yh(g) for any g isin L2[0 T L2(Γ)]Hence the discrete analogue of Lemma 232 takes the following form
Lemma 3113 The cost functional Jh L2[0 T L2(Γ)]rarr R is well defined differentiable and forevery g u isin L2[0 T L2(Γ)]
Jprimeh(g)u =
int T
0
int
Γ(microh(g) + αg)udxdt
where microh(g) equiv microgh isinWR(0 T ) is the unique solution of following problem For all n = 1 N andfor all vh isin Pk[tnminus1 tnUh]
minus(microngh+ vnh) +
int tn
tnminus1
(〈microgh vht〉+ a(vh microgh) + λ〈microgh vh〉Γ
)dt
= minus(micronminus1gh+ v
nminus1h+ ) +
int tn
tnminus1〈ygh minus yd vh〉dt (3110)
where microNgh+ = 0 Here yhg equiv yh(g) is the solution of (314)
Thus the fully-discrete optimality system takes the following form
Lemma 3114 Let (yh(gh) gh) equiv (yh gh) isin UhtimesAdad denote the unique optimal pair of Definition312 Then there exists an adjoint microh isin Uh satisfying microN+ = 0 such that for all vh isin Pk[tnminus1 tnUh]and for all n = 1 N
(ynh vnh) +int tn
tnminus1(minus〈yh vht〉+ a(yh vh) + λ〈yh vh〉Γ) dt
= (ynminus1h vnminus1
h+ ) +int tn
tnminus1(〈f vh〉+ λ〈gh vh〉Γ) dt (3111)
minus(micronh+ vnh) +
int tn
tnminus1(〈microh vht〉+ a(microh vh) + λ〈microh vh〉Γ) dt
= minus(micronminus1h+ vnminus1
h+ ) +int tn
tnminus1(yh minus yd vh) dt (3112)
and the following optimality condition holds For all uh isin Adad
1) Unconstrained Controlsint T
0(αgh + λmicroh uh)Γdt = 0 (3113)
2) Constrained Controlsint T
0
int
Γ(αgh + λmicroh) (uh minus gh) dxdt ge 0 (3114)
Estimates for the adjoint variable at partition points and in L2[0 T H1(Ω)] can be derived easilywhile for an estimate in Linfin[0 T L2(Ω)] we refer the reader to [23] The following estimate highlightsthe fact that the discrete solutions produced by discontinuous time-stepping schemes posses the sameregularity properties of the continuous problem
Lemma 3115 Let (yh gh) denote the discrete optimal solution and (yh microh gh) satisfy the system(3111)-(3112)-(3113) or (3114) Then
microhLinfin[0T H1(Ω)] + λ12microhLinfin[0T L2(Γ)] 6 Cyh minus ydL2[0T L2(Ω)]
31 The discrete optimal control problem 171
where C does not depend on α τ h but only on 1η Ck Ω
Proof The proof follows based on the techniques of [32 Theorem 410] modified in order to handlethe Robin boundary data and the backward in time nature of our pde First we note that micro(T ) = 0and yh minus yd isin Linfin[0 T L2(Ω)] Hence at each time t isin (tnminus1 tn] let ap() isin Uh denote the followingdiscrete approximation of the Laplacian (with Robin boundary data)
(ap vh) = (1η)a(microh vh) + (λη)(microh vh)Γ forallvh isin Uh
Thus ap isin Pk[tnminus1 tnUh] and hence setting vh() = microht() isin Uh and vh() = ap() isin Uh we obtain
(12) ddt
(nablamicroh2L2(Ω) + (λη)microhL2(Γ)) = (ap microht)
anda(microh ap) + λ〈microh ap〉Γ = η(ap ap)
Integrating by parts in time (3111) setting vh = ap into the resulting equality using the last twoequalities the definition of ap(tn) ie (ap(tn) micronh+minusmicronh) = (nablamicronhnabla(micronh+minusmicronh))+(λη)(micronh micronh+minusmicronh)Γand standard algebra we obtain
(12)nablamicronminus1h+ L2(Ω) + (λ2η)micronminus1
h+ L2(Γ) + η
int tn
tnminus1ap2L2(Ω)
le (12)nablamicronh+L2(Ω) + (λ2η)micronminus1h+ L2(Γ) +
int tn
tnminus1(yh minus yd ap)dt
The above inequality implies bounds at the partition points and hence bounds inLinfin[0 T H1(Ω)] when k = 0 1 after inserting the stability bound on yh For high-order (in time)schemes we directly follow the approach of [32 Theorem 410]
Semilinear problem with distributed optimal control The fully-discrete optimality system isdefined as follows We seek yh microh isin Uh such that for n = 1 N and for every vh isin Pk[tnminus1 tnUnh ]
(yn vn) +int tn
tnminus1
(minus 〈yh vht〉+ a(yh vh) + (φ(yh) vh)
)dt
= (ynminus1 vnminus1+ ) +
int tn
tnminus1
(〈f vh〉+ (gh vh)
)dt (3115)
minus(micron+ vn) +int tn
tnminus1
(〈microh vht〉+ a(vh microh) + (φprime(yh)microh vh)
)dt
= minus(micronminus1+ vnminus1
+ ) +int tn
tnminus1(yh minus yd vh)dt (3116)
int T
0(αgh + microh uh)dt = 0 foralluh isin L2[0 T Unh ] (3117)
Here y0 = yh0 microN+ = 0 f yd are given data and yh0 denotes an approximation of y0
Remark 3116 For low order schemes (k = 0 or k = 1) the proof of existence of the discreteoptimality system can be derived by standard techniques For high order schemes we refer the readerto [23 Section 4]
172 3 Approximation and Numerical Analysis
Remark 3117 Note that testing the optimality condition (3117) with functions of polynomialin time structure we may easily see that (3117) is equivalent to
int tntnminus1(αgh + microh vh) = 0 for all
vh isin Pk[tnminus1 tnUnh ] and n = 1 N
The remaining of this section is devoted to stability estimates on the adjoint variable microh Theseestimates will play a crucial role in the subsequent analysis of error estimates for the fully-discreteoptimality system
Lemma 3118 Suppose that y0 isin L2(Ω) yd isin L2[0 T L2(Ω)] f isin L2[0 T Hminus1(Ω)] are givenfunctions let φ satisfy Assumptions 211-315 If (yh microh) satisfy (3115)-(3116)-(3117) then
int T
0microh2L2(Ω)dt le Cstα
micro0+2L2(Ω) +
Nsum
i=1[microi]2L2(Ω) + η
int T
0microh2H1(Ω)dt le Cstα12
and for n = 1 N micronminus1+ 2L2(Ω) le Cstα
12 where Cst is defined in Lemma 317 Suppose thatin addition to the assumptions of Lemma 317 τ equiv maxi=1n τi satisfies
((DystC
2LC
2k4η) +
(Ck4α12))τ le (14) Then we obtain
microh2Linfin[0T L2(Ω)] le CCstα12 equiv Dmicrost
where C does not depend on α τ h but only on Ccη Ck and Ω and Dyst denotes the stabilityconstant of Lemma 317
Proof The first two estimates are identical to [22 Lemma 38] For the estimate at arbitrary time weproceed as follows Similar to [22 Section 4] we set vh = microh where microh is the exponential interpolanteminusρ(t
nminust)microh of microh (for some ρ gt 0) and defined as in Appendix Arsquo2 (suitably modified to handle thebackwards in time problem) Then the analog of (317) takes the form
(12)micronminus1+ 2L2(Ω)e
minusρ(tminustnminus1) + (12)[micron]2L2(Ω) minus (12)micron+2L2(Ω)
+(ρ2)int tn
tnminus1microh(t)2L2(Ω)e
minusρ(tminustnminus1)dt+int tn
tnminus1〈φprime(yh)microh microh〉dt
le Ckint tn
tnminus1
(microh2H1(Ω) + (Ckα12)microh2L2(Ω) + α12yh minus yd2L2(Ω)
)dt (3118)
It remains to treat the semi-linear term Note that adding and subtracting microh the semi-linear termtakes the form
int tn
tnminus1〈φprime(yh)microh microh〉dt =
int tn
tnminus1〈φprime(yh)microh microh minus microh〉dt+
int tn
tnminus1〈φprime(yh)microh microh〉dt
Hence we may drop the last term due to the monotonicity of φ and move the first term at theright hand side Then using the Lipschitz continuity of φprime the interpolation inequality 2L4(Ω) leCL2(Ω)H1(Ω) Houmllderrsquos inequality and Appendix Arsquo2 we obtain
int tn
tnminus1|〈φprime(yh)microh microh minus microh〉|dt le CL
int tn
tnminus1yhL2(Ω)microhL4(Ω)microh minus microhL4(Ω)dt
le CCLD12yst
int tn
tnminus1microh12L2(Ω)microh
12H1(Ω)microh minus microh
12L2(Ω)microh minus microh
12H1(Ω)dt
le CkCLD12yst ρτnmicrohL2[tnminus1tnL2(Ω)]microhL2[tnminus1tnH1(Ω)]
31 The discrete optimal control problem 173
Therefore using Youngrsquos inequality with δ gt 0 we deduce thatint tn
tnminus1|〈φprime(yh)microh microh minus microh〉|dt le (C2
kC2LDystρ
2τ2n4η)microh2L2[tnminus1tnL2(Ω)] + η
int tn
tnminus1microh2H1(Ω)dt
Then combining the last three relations into (3118) and selecting ρ = 1τn we obtain the desiredestimate working identical to Lemma 317
Remark 3119 We close this section by noting that the discrete stability bounds for the adjointvariable scale better in terms of the parameter α compared to stability constant of the state variableas expected
Stokes distributed optimal control problem Using well known techniques and the stability es-timates in WS(0 T ) it is easy to show the differentiability of the relation g rarr yh(g) for anyg isin L2[0 T L2(Ω)]
Lemma 3120 The cost functional Jh L2[0 T L2(Ω)] rarr R is well defined differentiable andfor every g u isin L2[0 T L2(Ω)]
Jprimeh(g)u =
int T
0
int
Ωh(microh(g) + αg)udxdt
where microh(g) equiv microgh isinWS(0 T ) is the unique solution of following problem For all n = 1 N andfor all vh isin Pk[tnminus1 tn Uh]
minus(microngh+ vnh) +
int tn
tnminus1
(〈microgh vht〉+ a(vh microgh)
)dt = minus(micronminus1
gh+ vnminus1h+ ) +
int tn
tnminus1〈ygh minus yd vh〉dt
(3119)
where microNg+ = 0 Here ygh equiv yh(g) is the solution of (318)
Thus the fully-discrete optimality system takes the following form
Lemma 3121 Let (yh(gh) gh) equiv (yh gh) isin Uh times Adad denote the unique optimal pair ofDefinition 3111 Then there exists an adjoint microh isin Uh satisfying microN+ = 0 such that for allvh isin Pk[tnminus1 tn Uh] and for all n = 1 N
(ynh vnh) +int tn
tnminus1(minus〈yh vht〉+ a(yh vh)) dt = (ynminus1
h vnminus1h+ ) +
int tn
tnminus1(〈f vh〉+ (gh vh)) dt
minus(micronh+ vnh) +
int tn
tnminus1(〈microh vht〉+ a(microh vh)) dt = minus(micronminus1
h+ vnminus1h+ ) +
int tn
tnminus1(yh minus yd vh) dt
and the following optimality condition holds For all uh isin Adad
1) Unconstrained Controlsint T
0(αgh + microh uh)dt = 0 (3120)
2) Constrained Controlsint T
0
int
Ωh(αgh + microh) (uh minus gh) dxdt ge 0 (3121)
Remark 3122 Similar to Remark 237 if p isin L2[0 T L20(Ω)] then equations (3120) (3120)
can be rewritten in the following equivalent form For all vh isin Pk[tnminus1 tn Yh] qh isin L2[0 T Qh]
174 3 Approximation and Numerical Analysis
and for all n = 1 N
(ynh vnh) +int tn
tnminus1(minus〈yh vht〉+ a(yh vh) + b(vh ph)) dt = (ynminus1
h vnminus1h+ ) +
int tn
tnminus1(〈f vh〉+ (gh vh)) dt
int tn
tnminus1b(yh qh)dt = 0 (3122)
minus(micronh+ vnh) +
int tn
tnminus1
(〈microh vht〉+ a(microh vh) + b(vh φh)
)dt = minus(micronminus1
h+ vnminus1h+ ) +
int tn
tnminus1(yh minus yd vh) dt
int tn
tnminus1b(microh qh)dt = 0 (3123)
Estimates at partition points and in L2[0 T H1(Ω)] can be derived easily while for an estimate inLinfin[0 T L2(Ω)] we refer the reader to [32] The following estimate clearly highlights the fact thatthe discrete solutions produced by discontinuous time-stepping schemes posses the same regularityproperties of the continuous problem
Lemma 3123 Let (yh gh) denote the discrete optimal solution and (yh microh gh) satisfy the system(3120)-(3120)-(3120) or (3121) Then
microhLinfin[0T H1(Ω)] 6 Cyh minus ydL2[0T L2(Ω)]
where C does not depend on α τ h but only on 1ν Ck Ω If in addition y0 isin V(Ω) f isinL2[0 T L2(Ω)] then the solution yh of (3121) also satisfies
yhLinfin[0T H1(Ω)] le C
Proof The proof is given for the forward in time evolutionary Stokes equations in [32 Theorem 410]For the backwards in time problem we simply note that yh minus yd isin L2[0 T W(Ω)] and hence by asimple modification of the technique we obtain the desired result
32 Error estimates
Next we will study the rates of convergence in appropriate norms for the problems under considerationand we will introduce some results
321 Robin boundary control problem
The key ingredient of the proof is the definition of a suitable generalized space-time dG projectioncapable of handling the low regularity of yt isin L2[0 T H1(Ω)lowast] and an auxiliary optimality systemwhich plays the role of a global space-time projection and exhibits best approximation properties
3211 The fully-discrete projection
Let wh zh isin Uh be defined as the solutions of the following system Given data f y0 and initialconditions w0
h = y0h where y0
h equiv Phy0 denote the initial approximation of y0 zN+ = 0 we seek
32 Error estimates 175
wh zh isin Uh such that for n = 1 N and for all vh isin Pk[tnminus1 tnUh]
(wnh vnh) +int tn
tnminus1
(minus 〈wh vht〉+ a(wh vh) + λ〈wh vh〉Γ
)dt
= (wnminus1h vnminus1
h+ ) +int tn
tnminus1
(〈f vh〉+ λ〈g vh〉Γ
)dt (3224)
minus(znh+ vnh) +
int tn
tnminus1
(〈zh vht〉+ a(zh vh) + λ〈zh vh〉Γ
)dt
= minus(znminus1h+ vnminus1
h+ ) +int tn
tnminus1(wh minus yd vh)dt (3225)
The solutions wh zh isin Uh exist due to the regularity of y micro isinWR(0 T ) The solutions of the auxiliaryoptimality system play the role of ldquoglobal projectionsrdquo onto Uh The basic estimate on the energynorm of y minus wh microminus zh will be derived in terms of local L2 projections associated to discontinuoustime-stepping methods see eg [104]
Definition 321 (1) The projection P locn C[tnminus1 tnL2(Ω)] rarr Pk[tnminus1 tnUh] satisfies(P locn v)n = Phv(tn) and
int tn
tnminus1(v minus P locn v vh) = 0 forall vh isin Pkminus1[tnminus1 tnUh] (3226)
Here we have used the convention (P locn v)n equiv (P locn v)(tn) and Ph L2(Ω) rarr Uh is the orthogonalprojection operator onto Uh sub H1(Ω)(2) The projection P loch C[0 T L2(Ω)]rarr Uh satisfies
P loch v isin Uh and (P loch v)|(tnminus1tn] = P locn (v|[tnminus1tn])
Due to the lack of regularity and in particular the fact that y isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast]we construct a space-time generalized L2 projection which combines the standard dG time steppingprojection and the spacial generalized L2 projection Qh H1(Ω)lowast rarr Uh Recall that the definition ofQh states that 〈v minusQhv vh〉 = 0 for all v isin H1(Ω)lowast and vh isin Uh (see for instance [26 Section 2])
Definition 322 (1) The projection Qlocn C[tnminus1 tnH1(Ω)lowast] rarr Pk[tnminus1 tnUh] satisfies(Qlocn v)n = Qhv(tn) and
int tn
tnminus1〈v minusQlocn v vh〉 = 0 forall vh isin Pkminus1[tnminus1 tnUh]
Here we also use the convention (Qlocn v)n equiv (Qlocn v)(tn) and Qh H1(Ω)lowast rarr Uh is the generalizedorthogonal projection operator onto Uh sub H1(Ω)(2) The projection Qloch C[0 T H1(Ω)lowast]rarr Uh satisfies
Qloch v isin Uh and (Qloch v)|(tnminus1tn] = Qlocn (v|[tnminus1tn])
For k = 0 the projection Qloch C[0 T H1(Ω)lowast] rarr Uh reduces to Qloch v(t) = Qhv(tn) for allt isin (tnminus1 tn] n = 1 N
The key feature of Qloch is that it coincides to P loch when v isin L2[0 T L2(Ω)] ie P loch v = Qloch v
when v isin L2[0 T L2(Ω)] and hence exhibits best approximation properties but is also applicablefor v equiv yt isin L2[0 T H1(Ω)lowast] For the backwards in time problem a modification of the aboveprojections (still denoted by P locn Qlocn respectively ) will be needed For example in addition torelation (3226) we need to impose the rdquomatching conditionrdquo on the left ie (P locn v)nminus1
+ = Phv(tnminus1+ )
176 3 Approximation and Numerical Analysis
instead of imposing the condition on the right In the following Lemma we collect several resultsregarding (optimal) rates of convergence for the above projection Here the emphasis is placed on theapproximation properties of the generalized projection Qloch under minimal regularity assumptionsie for v isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] for the lowest order scheme
Lemma 323 Let Uh sub H1(Ω) and P loch Qloch defined in Definitions 321 and 322 respectivelyThen for all v isin L2[0 T H l+1(Ω)] capHk+1[0 T L2(Ω)] there exists constant C ge 0 independent ofh τ such that
v minus P loch vL2[0T L2(Ω)] le C(hl+1vL2[0T Hl+1(Ω)] + τk+1v(k+1)L2[0T L2(Ω)]
)
If in addition k = 0 l = 1 and v isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] then there exists a constantC ge 0 independent of h τ such that
v minusQloch vL2[0T L2(Ω)] le C(hvL2[0T H1(Ω)] + τ12(vL2[0T H1(Ω) + vtL2[0T H1(Ω)lowast])
)
v minusQloch vL2[0T H1(Ω)] le C(vL2[0T H1(Ω)] + (τh2)vtL2[0T H1(Ω)lowast]
)
Let k = 0 l = 1 and v isin L2[0 T H2(Ω)] cap H1[0 T L2(Ω)] Then there exists constant C ge 0independent of h τ such that
v minusQloch vL2[0T H1(Ω)] le C(hvL2[0T H2(Ω)] + τ12(vtL2[0T L2(Ω)] + vL2[0T H2(Ω)])
)
Proof See Appendix Arsquo1
Remark 324 The stability estimate in L2[0 T H1(Ω)] requires the time-step restriction of τ le Ch2
due to the lack of regularity with respect to time If v isin L2[0 T H l+1(Ω)] capHk+1[0 T L2(Ω)] thenthe first estimate of Lemma 323 implies that
v minus P loch vL2[0T H1(Ω)] le C(hlvL2[0T Hl+1(Ω)] + τk+1hv(k+1)L2[0T L2(Ω)]
)
Indeed using [32 Theorem 43 Corollary 48] we obtain the following (local in time) estimates
v minus P locn vL2[tnminus1tnH1(Ω)] le C(v minus PhvL2[tnminus1tnH1(Ω)] + τk+1Phv(k+1)L2[tnminus1tnH1(Ω)]
)
le C(hlvL2[tnminus1tnHl+1(Ω)] + (τk+1h)v(k+1)L2[tnminus1tnL2(Ω)]
)
where at the last estimate we have used an inverse estimate We note that if more regularity isavailable the inverse estimate is not necessary In particular if v(k+1) isin L2[0 T H1(Ω)] then theimproved rate of O(hl + τk+1) holds in L2[0T H1(Ω)] norm However we note that for our boundaryoptimal control problem the increased regularity vt isin L2[0 T H1(Ω)] is not available Hence weemphasize that the lack of regularity acts as a barrier for developing a true higher order schemeWorking similarly we also obtain an estimate at arbitrary time-points ie
v minus P loch vLinfin[0T L2(Ω)] le C(hl+1vLinfin[0T Hl+1(Ω)] + τk+1hv(k+1)Linfin[0T H1(Ω)]
)
Below we state the main result for related to the auxiliary problem which acts as the globalspace-time dG projection Our goal is to state that the projection error is as good as the local dgprojection error allows it to be and hence it is optimal in the sense of the available regularity
Theorem 325 Let f isin L2[0 T H1(Ω)lowast] and y0 isin L2(Ω) be given and y micro isin WR(0 T ) be thesolutions of (237)-(238)-(239) or (2310) and wh zh isin Uh be the solutions of (3224)-(3225)Denote by e1 = y minus wh r1 = micro minus zh and let ep equiv y minus Qloch y rp = micro minus P loch micro where P loch Qloch aredefined in Definitions 321 and 322 Then there exists an algebraic constant C gt 0 depending only
32 Error estimates 177
on Ω such that
CF minη λe12L2[0T H1(Ω)] +Nminus1sum
i=0[ei1]2L2(Ω) + λe12L2[0T L2(Γ)]
le C(e0
12L2(Ω) + (1CF minη λ)(ep2L2[0T H1(Ω)] + λep2L2[0T L2(Γ)]
)
CF minη λr12L2[0T H1(Ω)] +Nsum
i=1[ri1]2L2(Ω) + λr12L2[0T L2(Γ)]
le C(
(1CF minη λ)(e12L2[0T L2(Ω)] + rp2L2[0T H1(Ω)]
)+ λrp2L2[0T L2(Γ)]
)
e1L2[0T L2(Ω)] le C(ηepL2[0T L2(Ω)] + τ12(epL2[0T H1(Ω)] + epL2[0T L2(Γ)])
)
r1L2[0T L2(Ω)] le C(ηe1L2[0T L2(Ω)] + rpL2[0T L2(Ω)] + τ12(rpL2[0T H1(Ω)]
+rpL2[0T L2(Γ)]))
Here w0h = y0
h where y0h denotes an approximation of y0 and C a constant depending upon on the
domain Ω
Proof Step 1 Preliminary estimates Throughout this proof we denote by e1 = y minus wh r1 = microminus zhand we split e1 r1 to e1 equiv e1h+ep equiv (Qloch yminuswh)+(yminusQloch y) r1 equiv r1h+rp equiv (P loch microminuszh)+(microminusP loch micro)where P loch Qloch are defined in Definitions 321 and 322 Subtracting (3224) from (238)and (3225) from (239) we obtain the orthogonality condition For n = 1 N and for allvh isin Pk[tnminus1 tnUh]
(en1 vnh) +int tn
tnminus1
(minus 〈e1 vht〉+ a(e1 vh) + λ〈e1 vh〉Γ
)dt = (enminus1
1 vnminus1h+ ) (3227)
minus(rn1+ vnh) +
int tn
tnminus1
(〈r1 vht〉+ a(r1 vh) + λ〈r1 vh〉Γ
)dt = minus(rnminus1
1+ vnminus1h+ ) +
int tn
tnminus1(e1 vh)dt
(3228)
Note that the orthogonality condition (3227) is essentially uncoupled and identical to the orthogo-nality condition of [31 Relation (26)] Hence applying [31 Theorem 22] we derive the first estimateIn a similar way the orthogonality condition (3228) is equivalent to For n = 1 N and for allvh isin Pk[tnminus1 tnUh]
minus(rn1h+ vnh) +
int tn
tnminus1
(〈r1h vht〉+ a(r1h vh) + λ〈r1h vh〉Γ
)dt
= minus(rnminus11h+ v
nminus1h+ ) +
int tn
tnminus1
((e1 vh)minus a(rp vh)minus λ(rp vh)Γ
)dt (3229)
Here we have used the Definition 321 of the projection P loch which implies thatint tntnminus1〈rp vht〉dt = 0 (rnp+ vnh) = 0 and (rnminus1
p+ vnminus1h+ ) = 0 Setting vh = r1h into (3229) using
the Friedrichsrsquo inequality to bound the second and the third term on the leftint tn
tnminus1(a(r1h r1h) + λ〈r1h r1h〉Γ)dt ge
int tn
tnminus1
(η2nablar1h2L2(Ω) + λ
2 r1h2L2(Γ)
+CF2 minλ ηr1h2H1(Ω)
)dt
178 3 Approximation and Numerical Analysis
Youngrsquos inequality to bound the terms on the rightint tn
tnminus1
∣∣(e1 r1h)∣∣dt le
int tn
tnminus1
((CF minλ η8)r1h2H1(Ω) + (CCF minλ η)e12L2(Ω)
)dt
int tn
tnminus1
∣∣a(r1h rp)∣∣dt le (CF minλ η8)
int tn
tnminus1r1h2H1(Ω)dt+ (C(CF minλ η))
int tn
tnminus1rp2H1(Ω)dt
and standard algebra we obtain
minus12r
n1h+2L2(Ω) + 1
2[rn1h]2L2(Ω) + 1
2rnminus11h+2L2(Ω) + λ
4
int tn
tnminus1r1h2L2(Γ)dt
+CF minλ η4
int tn
tnminus1r1h2H1(Ω)dt+ η
2
int tn
tnminus1nablar1h2L2(Ω)dt
le Cint tn
tnminus1
((1CF minλ η)e12L2(Ω) + (1CF minλ η)rp2H1(Ω) + λrp2L2(Γ)
)dt
The second estimate now follows upon summationStep 2 Duality arguments We turn our attention to the last two estimates In order to obtain theimproved rate for the L2[0 T L2(Ω)] norm we employ a duality argument to derive a better boundfor the quantity e1h2L2[0T L2(Ω)] For this purpose we define a backwards in time parabolic problemwith right hand side e1h isin L2[0 T L2(Ω)] and zero Robin and terminal data ie λφ+η partφpartn |Γ = 0 andφ(T ) = 0 For n = 1 N and for all v isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] we seek φ isinWR(0 T )such that
int tn
tnminus1
(〈φ vt〉+ a(v φ) + λ〈φ v〉Γ
)dt+ (φ(tnminus1 v(tnminus1)) =
int tn
tnminus1(e1h v)dt (3230)
Note that since e1h isin Linfin[0 T L2(Ω)] then φ isin L2[0 T H2(Ω)]capH1[0 T L2(Ω)] (see Theorem 221)In particular the following estimate hold
φL2[0T H2(Ω)] + φtL2[0T L2(Ω)] + λφL2[0T L2(Γ)] le Ce1hL2[0T L2(Ω)] (3231)
The lack of regularity of the right hand side of (3230) due to the presence of discontinuitiesimplies that we can not improve regularity of φ in [0 T ] The associated discontinuous time-steppingscheme can be defined as follows Given terminal data φNh+ = 0 we seek φh isin Uh such that for allvh isin Pk[tnminus1 tnUh]
minus(φnh+ vnhminus) +
int tn
tnminus1
((φh vht) + a(φh vh) + λ〈φh vh〉Γ
)dt+ (φnminus1
h+ vnminus1h+ ) =
int tn
tnminus1(e1h vh)dt
(3232)
Hence using Lemma 3115 the following stability estimate holds
φhLinfin[0T H1(Ω)] + λφhLinfin[0T L2(Γ)] le Cke1hL2[0T L2(Ω)] (3233)
It is now clear that we have the following estimate for φminusφh which is a straightforward application ofthe previous estimates in L2[0 T H1(Ω)] the approximation properties of Lemma 323 of projectionsP loch Qloch and the boundary Sobolev inequality
φminus φhL2[0T H1(Ω)] + λφminus φhL2[0T L2(Γ)] le C(h+ τ12)(φL2[0T H2(Ω)] + φtL2[0T L2(Ω)]
)
le C(h+ τ12)e1hL2[0T L2(Ω)] (3234)
We note that the lack of regularity on the right hand side restricts the rate of convergence to therate given by the lowest order scheme l = 1 k = 0 even if high order schemes (in time) are chosen
32 Error estimates 179
Setting vh = e1h into (3232) we obtain
minus(φnh+ en1hminus) +
int tn
tnminus1(φh e1ht) + a(e1h φh) + λ〈φh e1h〉Γdt+ (φnminus1
h+ enminus11h+) =
int tn
tnminus1e1h2L2(Ω)dt
Integrating by parts in time we deduce
minus(φnh+ en1hminus) + (φnhminus en1hminus) +
int tn
tnminus1
(minus (φht e1h) + a(φh e1h) + λ〈φh e1h〉Γ
)dt
=int tn
tnminus1e1h2L2(Ω)dt (3235)
Setting vh = φh into (3227) and using e1 = ep + e1h and the definition of projection Qloch ofDefinition 322 we obtain
(en1hminus φnhminus) +int tn
tnminus1
(minus (e1h φht) + a(e1h φh) + λ〈e1h φh〉Γ
)dt
= minus(enminus11hminus φ
nminus1h+ )minus
int tn
tnminus1
(a(ep φh) + λ〈ep φh〉
)dt (3236)
Here we have used the fact that the definition of projection Qloch of Definition 322 implies that(enp φnhminus) = 0
int tntnminus1(ep vht)dt = 0 and (enminus1
pminus φnminus1h+ ) = 0 Using (3235) to replace the first three
terms of (3236) we arrive to
(φnh+ en1h)minus (enminus1
1hminus φnminus1h+ ) +
int tn
tnminus1e1h2L2(Ω)dt = minus
int tn
tnminus1
(a(ep φh) + λ〈ep φh〉Γ
)dt
= minusint tn
tnminus1
(a(ep φh minus φ) + a(ep φ) + λ〈ep φh minus φ〉Γ + λ〈ep φ〉Γ
)dt
= minusint tn
tnminus1
(a(ep φh minus φ) + λ〈ep φh minus φ〉Γ minus η(ep∆φ) + η〈ep
partφ
partn〉Γ + λ〈ep φ〉Γ
)dt
= minusint tn
tnminus1
(a(ep φh minus φ) + λ〈ep φh minus φ〉Γ minus η(ep∆φ)
)dt
where at the last two equalities we have used integration by parts (in space) and the definition of φas a dual problem with zero Robin boundary data respectively Thereforeint tn
tnminus1e1h2L2(Ω)dt+ (φnh+ e
n1hminus)minus (enminus1
1hminus φnminus1h+ )
leint tn
tnminus1ηφh minus φH1(Ω)epH1(Ω)dt+
int tn
tnminus1
(ηepL2(Ω)∆φL2(Ω) + λepL2(Γ)φh minus φL2(Γ)
)dt
Then summing the above inequalities and using the fact that φN+ equiv 0 and e01hminus = 0 (by definition)
180 3 Approximation and Numerical Analysis
and rearranging terms we obtain
(12)e1h2L2[0T L2(Ω)] le Cηint T
0epL2(Ω)φH2(Ω)dt
+Cint T
0
(ηφh minus φH1(Ω)epH1(Ω) + λepL2(Γ)φh minus φL2(Γ)
)dt
le C(ηepL2[0T L2(Ω)]φL2[0T H2(Ω)] + ηφh minus φL2[0T H1(Ω)]
epL2[0T H1(Ω)] + λepL2[0T L2(Γ)]φh minus φL2[0T L2(Γ)]
)
le C(ηepL2[0T L2(Ω)]e1hL2[0T L2(Ω)]
+(h+ τ12)e1hL2[0T L2(Ω)](epL2[0T H1(Ω)] + λepL2[0T L2(Γ)]))
Here we have used the Cauchy-Schwarz inequality the stability bounds of dual equation (3231)ie and the error estimates (3234) on φh minus φ Finally the estimate on r1L2[0T L2(Ω)] follows byusing a similar duality argument
Since an estimate on the L2[0 T H1(Ω)] norm is already obtained and the auxiliary optimalitysystem is now essentially uncoupled the techniques of [31 Section 2] can be applied directly to derivean estimate in Linfin[0 T L2(Ω)] see also Proposition 3210)
Theorem 326 Let wh zh isin Uh be the solutions of (3224)-(3225) Denote by e1 = y minus whr1 = microminus zh and suppose that the assumptions of Theorem 325 hold Then there exists a constant Cdepending on Ck Ω such that
e1Linfin[0T L2(Ω)] le C(epLinfin[0T L2(Ω)] + e0
1L2(Ω) + epL2[0T H1(Ω)] + λepL2[0T L2(Γ)])
r1Linfin[0T L2(Ω)] le C(rpLinfin[0T L2(Ω)] + e1L2[0T L2(Ω)] + rpL2[0T H1(Ω)] + λrpL2[0T L2(Γ)]
)
Here ep = y minusQloch y rp = microminus P loch micro
Proof Splitting the error as in the previous theorem ie e1 = e1h + ep it suffices to bound the termsuptnminus1lttletn e1h(t)2L2(Ω) This is done in [31 Theorem 25] (note that the orthogonality conditionis uncoupled)The estimate for the adjoint variable can be derived similarly
Remark 327 The combination of the last two Theorems implies the ldquosymmetric regularity freerdquostructure of our estimate In particular suppose that the initial data y0 isin L2(Ω) and the forcingterm f isin L2[0 T H1(Ω)lowast] Then define the natural energy norm ( )X endowed by the weakformulation under minimal regularity assumptions as follows
(e1 r1)X equiv e1WR(0T ) + r1WR(0T )
Then using Theorems 3239 326 we obtain an estimate of the form
error X le C(in data error L2(Ω)
+best approx error X)
The above estimate indicates that the error is as good as the approximation properties enables it to beunder the natural parabolic regularity assumptions and it can be viewed as the fully-discrete analogue ofCeacutea Lemma see eg ([34]) Hence the rates of convergence for e1 r1 depend only on the approximationand regularity results via the projection error ep rp as indicated in Lemma 323 and Remark 324If y0 isin L2(Ω) ie y isin L2[0 T H1(Ω)] capH1[0 T H1(Ω)lowast] and micro isin L2[0 T H2(Ω)] capH1[0 T L2(Ω)]then for l = 1 k = 0 and for τ le Ch2 we obtain that
32 Error estimates 181
1 epL2[0T H1(Ω)] le C
2 rpL2[0T H1(Ω)] le C(hmicroL2[0T H2(Ω)] + τ12microtL2[0T L2(Ω)])
3 epL2[0T L2(Ω)] le C(hyL2[0T H1(Ω)] + τ12ytL2[0T H1(Ω)lowast])
4 rpL2[0T L2(Ω)] le C(h2microL2[0T H2(Ω)] + τmicrotL2[0T L2(Ω)])
5 epL2[0T L2(Γ)] le Cep12L2[0T L2(Ω)]ep12L2[0T H1(Ω)] le C(h+ τ12)12
Therefore the above estimates and Theorem 325 imply for τ le Ch2 the following rates e1L2[0T L2(Ω)] asymp O(h) and r1L2[0T L2(Γ)] asymp O(h)
The estimate is applicable even in case more regular solutions For example if in addition bothy micro isin L2[0 T H2(Ω)] capH1[0 T L2(Ω)] (here l = 1 and k = 0)
1 epL2[0T H1(Ω)] le C(hyL2[0T H2(Ω)] + τ12ytL2[0T L2(Ω)])
2 epL2[0T L2(Ω)] le C(h2yL2[0T H2(Ω)] + τytL2[0T L2(Ω)])
3 epL2[0T L2(Γ)] le C(h2 + τ)12(h+ τ12)12
For the boundary norm we have used Sobolevrsquos boundary inequality Same rates hold also therelated norms of rp Therefore from Theorem 325 we obtain that e1L2[0T H1(Ω)] asymp O(h)r1L2[0T H1(Ω)] asymp O(h) e1L2[0T L2(Ω)] asymp O(h32) and r1L2[0T L2(Ω)] asymp O(h32) when τ le Ch2
322 Unconstrained Controls Preliminary estimates for the optimality system
It remains to compare the discrete optimality system (3111)-(3112)-(3113) to the auxiliary system(3224)-(3225)
Lemma 328 Let yh microh wh zh isin Uh be the solutions the discrete optimality system (3111)-(3112)-(3113) and of the auxiliary system (3224)-(3225) respectively Denote by e1 equiv y minus whr1 equiv microminus zh and let e2h equiv wh minus yh r2h equiv zh minus microh Then there exists algebraic constant C gt 0 suchthat
e2hL2[0T L2(Ω)] + (λα12)r2hL2[0T L2(Γ)] le Cλα12r1L2[0T L2(Γ)]
Proof Subtracting (3112) from (3225) we obtain the equation For n = 1 N
minus(rn2h+ vnh) +
int tn
tnminus1
(〈r2h vht〉+ a(r2h vh) + λ〈r2h vh〉Γ
)dt
= minus(rnminus12h+ v
nminus1h+ ) +
int tn
tnminus1(e2h vh)dt forall vh isin Pk[tnminus1 tnUh] (3237)
Subtracting (3111) from (3224) and using (2310)-(3113) we obtain For n = 1 N
(en2h vnh) +int tn
tnminus1
(minus 〈e2h vht〉+ a(e2h vh) + λ〈e2h vh〉Γ
)dt = (enminus1
2h vnminus1h+ )
+int tn
tnminus1minus(λ2α)(microminus microh vh)Γdt forall vh isin Pk[tnminus1 tnUh] (3238)
182 3 Approximation and Numerical Analysis
We set vh = e2h into (3237) to obtain
minus(rn2h+ en2h) +
int tn
tnminus1
(〈r2h e2ht〉+ a(r2h e2h) + λ〈r2h e2h〉Γ
)dt+ (rnminus1
2h+ enminus12h+)
=int tn
tnminus1e2h2L2(Ω)dt (3239)
Similarly setting vh = r2h into (3238) we deduce
(en2h rn2h) +int tn
tnminus1
(minus 〈e2h r2ht〉+ a(e2h r2h) + λ〈e2h r2h〉Γ
)dtminus (enminus1
2h rnminus12h+)
=int tn
tnminus1
(minus (λ2α)〈r1 r2h〉Γ minus (λ2α)r2h2L2(Γ)
)dt (3240)
Integrating by parts with respect to time in (3240) and subtracting the resulting equation from(3239) we arrive to
(rn2h+ en2h)minus (enminus1
2h rnminus12h+) +
int tn
tnminus1
(e2h2L2(Ω) + (λ2α)r2h2L2(Γ)
)dt = minus(λ2α)
int tn
tnminus1〈r1 r2h〉Γdt
(3241)
Using Youngrsquos inequality to bound the right hand side∣∣∣∣∣(λ
2α)int tn
tnminus1(r1 r2h)Γdt
∣∣∣∣∣ le (λ24α)int tn
tnminus1r2h2L2(Γ)dt+ (λ2α)
int tn
tnminus1r12L2(Γ)dt
adding the resulting inequalities from 1 to N and noting thatsumNn=1
((rn2h+ e
n2h)minus (enminus1
2h rnminus12h+)
)= 0 (since e0
2h equiv 0 rN2h+ = 0) we obtain the desired estimate
Estimates easily follow by the previous Lemma and the estimates on the projections e1 and r1 togetherwith a classical ldquoboot-straprdquo argument
Proposition 329 Let yh microhwhzh isin Uh be the solutions the optimality system (3111)-(3112)-(3113) and of the auxiliary system (3224)-(3225) respectively Denote by e1 equiv yminuswh r1 equiv microminuszhand let e2h equiv wh minus yh r2h equiv zh minus microh Then the following estimate holds
eN2h2L2(Ω) +Nminus1sum
i=0[ei2h]2L2(Ω) + CF minη λ
int T
0e2h2H1(Ω)dt+ λ
int T
0e2h2L2(Γ)dt
le (Cλα2)int tn
tnminus1r12L2(Γ))dt
r02h+2L2(Ω) +
Nsum
i=1[ri2h]2L2(Ω) + CF minη λ
int T
0r2h2H1(Ω)dt+ λ
int T
0r2h2L2(Γ)dt
le (Cλ2αCF minη λ)int T
0r12L2(Γ)dt
where C is constant depending only upon Ω
Proof Step 1 Estimates for the state Setting vh = e2h into (3238) and noting that microminusmicroh = r1+r2h
32 Error estimates 183
we obtain
(12)en2h2L2(Ω) + (12)[enminus12h ]2L2(Ω) minus (12)enminus1
2h 2L2(Ω) + η
int tn
tnminus1nablae2h2L2(Ω)dt
+λint tn
tnminus1e2h2L2(Γ) +
int tn
tnminus1〈φ(y)minus φ(yh) e2h〉dt le minus(λ2α)
int tn
tnminus1(r1 + r2h e2h)Γdt (3242)
Using Youngrsquos inequality for the first term on the right hand side
∣∣∣ 1α
int tn
tnminus1(r1 e2h)Γdt
∣∣∣ le(λ2)
int tn
tnminus1|e2h2L2(Γ)dt+ (1λα2)
int tn
tnminus1r12L2(Γ)dt
Therefore collecting the above bounds (3242) gives
(12)en2h2L2(Ω) + (12)[enminus12h ]2L2(Ω) minus (12)enminus1
2h 2L2(Ω) + η
int tn
tnminus1nablae2h2L2(Ω)dt
+(λ2)int tn
tnminus1e2h2L2(Γ) le (1λα2)
int tn
tnminus1(r12L2(Γ) + r2h2L2(Γ))dt (3243)
Using Friedrichsrsquo inequality and standard algebra we obtain the estimate upon summation by usingthe estimate on r2hL2[0T L2(Γ)] of Lemma 328Step 2 Estimates for the adjoint Setting vh = r2h into (3237) and using Friedrichsrsquo and Youngrsquosinequalities and Lemma 328 to bound the norm of e2hL2[0T L2(Ω)] we obtain the desired estimate
minus(12)rn2h+2L2(Ω) + (12)[rn2h]2L2(Ω) + (12)rnminus12h+2L2(Ω) + CF minη2 λ4)
int tn
tnminus1r2h2H1(Ω)dt
+int tn
tnminus1〈φprime(y)microminus φprime(yh)microh r2h〉dt+ η
2
int tn
tnminus1nablae2h2L2(Ω)dt+ λ
4
int tn
tnminus1r2h2L2(Γ)dt le
int tn
tnminus1(e2h r2h)dt
(3244)
and sinceint tn
tnminus1(e2h r2h)dt le (2CF minη2
λ
4 )int tn
tnminus1e2h2L2(Ω)dt+ (CF minη2
λ
4 2)int tn
tnminus1r2h2H1(Ω)dt
substituting the last inequality into 3244 we obtain
minus(12)rn2h+2L2(Ω) + (12)[rn2h]2L2(Ω) + (12)rnminus12h+2L2(Ω) + CF minη4
λ
2 2int tn
tnminus1r2h2H1(Ω)dt
+η4int tn
tnminus1nablar2h2L2(Ω)dt+ λ2
int tn
tnminus1r2h2L2(Γ)dt le (2CF minη2
λ
4 )int tn
tnminus1e2h2L2(Ω)dt
which implies the desired estimate after summation by using Lemma 328
An estimate at arbitrary time points for the forward in time equation can be derived by applying theapproximation of the discrete characteristic technique of [31] into the Robin boundary linear caseHere the stability estimate at arbitrary time-points will be also needed
Proposition 3210 Suppose that the assumptions of Theorem 325 and Proposition 329 holdThen there exists a constant C depending only upon constant Ck and the domain such that
e2hLinfin[0T L2(Ω)] le C(ηe2hL2[0T H1(Ω)] + λe2hL2[0T L2(Γ)] + (λ32α)r1L2[0T L2(Γ)]
)
r2hLinfin[0T L2(Ω)] le C(ηr2hL2[0T H1(Ω)] + (λα12)r1L2[0T L2(Γ)]
)
Proof The proof closely follows the techniques of [31 Section 2] adjusted to the Robin boundary
184 3 Approximation and Numerical Analysis
data case For completeness we state the proof for the first estimate while the second one can betreated similarly First we briefly recall the main tool of approximations of the discrete characteristicfunction For any polynomial s isin Pk(tnminus1 tn) and we denote the discrete approximation of χ[tnminus1t)s
by the polynomial s isin s isin Pk(tnminus1 tn) s(tnminus1) = s(tnminus1) which satisfiesint tn
tnminus1sq =
int t
tnminus1sq forall q isin Pkminus1(tnminus1 tn)
The motivation for the above construction stems from the elementary observation that for q = sprime weobtain
int tntnminus1 s
primes =int ttnminus1 ss
prime = 12 (s2(t)minuss2(tnminus1)) The construction can be extended to approximations
of χ[tnminus1t)v for v isin Pk[tnminus1 tnV ] where V is a linear space The discrete approximation of χ[tnminus1t)v
in Pk[tnminus1 tnV ] is defined by v =sumki=0 si(t)vi and if V is a semi-inner product space then
forallw isin Pkminus1[tnminus1 tnV ]
v(tnminus1) = v(tnminus1) andint tn
tnminus1(v w)V =
int t
tnminus1(v w)V
Then [31 Lemma 24] states various continuity properties and in particular that
vL2[tnminus1tnV ] le CkvL2[tnminus1tnV ]
v minus χ[tnminus1t)vL2[tnminus1tnV ] le CkvL2[tnminus1tnV ]
where Ck is a constant depending on k We begin by integrating by parts with respect to time in(3238) and substituting vh = e2h where e2h denotes the approximation of the discrete characteristicfunction χ[tnminus1t)e2h (for any fixed t isin [tnminus1 tn)) as constructed above The definition of the e2h andthe fact that e2ht isin Pkminus1[tnminus1 tnUh] implies that
int tntnminus1(e2ht e2h)dt =
int ttnminus1(e2ht e2h)dt and hence
12e2h(t)2L2(Ω) + 1
2[enminus12h ]2L2(Ω) +
int tn
tnminus1a(e2h e2h)dt = 1
2enminus12h 2L2(Ω)
minusλint tn
tnminus1(e2h e2h)Γdtminus
int tn
tnminus1(λ2α)(r1 + r2h e2h)Γdt (3245)
Recall also that the continuity property on a( ) imply
∣∣∣int tn
tnminus1a(e2h e2h) + λ(e2h e2h)Γdt
∣∣∣ le Ckint tn
tnminus1(ηe2h2H1(Ω) + λe2h2L2(Γ))dt
while the coupling term can be bounded as
∣∣∣λ2
α
int tn
tnminus1(r1 + r2h e2h)Γdt
∣∣∣ le (Ckλ3α2)int tn
tnminus1
(r2h2L2(Γ) + r12L2(Γ)
)dt+ Ckλ
int tn
tnminus1e2h2L2(Γ)dt
Here we have used Youngrsquos inequality with appropriate δ gt 0 and in various instances of thecontinuity property of the approximation of the discrete characteristic Hence substituting theabove estimates into (3245) we obtain an inequality of the form (1minus Cτ)an le anminus1 + fn wherean = supsisin(tnminus1tn] e2h(s)2L2(Ω) Indeed let t isin (tnminus1 tn] to be chosen as an equiv e2h(t)2L2(Ω) andnote that enminus1
2h 2L2(Ω) le anminus1 Hence the desired estimate follows by summation and by Lemma328
32 Error estimates 185
3221 Unconstrained Controls Symmetric error estimates - estimates for rough initial data
Various estimates can be derived using results of previous subsections and standard approximationtheory results We begin by stating symmetric error estimates which can be viewed as the analogueof the classical Ceacutearsquos Lemma
Theorem 3211 Let yh microh isin Uh and (y micro) isin WR(0 T ) denote the approximate solutions of thediscrete and continuous optimality systems (3111)-(3112)-(3113) and (238)-(239)-(2310)respectively Let ep = y minus Qloch y rp = micro minus P loch micro denote the projection error where P loch Qlochdefined in Definition of 321 and 322 respectively Then the following estimate holds for the errore = y minus yh and r = microminus microh
(e r)X le C(1α)(ep rp)X
where C depends upon constants of Theorems 325 326 and Proposition 329 3210 and isindependent of τ h α
Proof The first estimate follows by using triangle inequality and previous estimates of Theorem 325and 326 and Propositions 329 and 3210
An improved estimate for the L2[0 T L2(Ω)] norm for the state and in L2[0 T L2(Γ)] for the adjointfollow by combining the estimates of Theorem 325 and Lemma 328
Theorem 3212 Suppose that y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] and the assumptions of Theorem325 and Lemma 328 hold Let ep = y minusQloch y rp = microminus P loch micro denote the projection error whereP loch Qloch defined in Definition of 321 and 322 respectively Then there exists a constant Cindependent of h τ α such that
eL2[0T L2(Ω)] le C(epL2[0T L2(Ω)] + τ12(epL2[0T H1(Ω)]
+epL2[0T L2(Γ)]) + (λα12)r1L2[0T L2(Γ)]
)
rL2[0T L2(Γ)] le Cr112L2[0T L2(Ω)]r112L2[0T H1(Ω)]
where r1 is estimated in terms of projection errors ep rp by Theorem 325
Proof The first estimate follows by using triangle inequality and previous estimates of Theorem 325Lemma 328 The second estimate follows by triangle inequality the estimate of Lemma 328 tobound r2h and Sobolevrsquos boundary inequality
Using now standard regularity and approximation theory results we obtain convergence rates Belowwe state convergence rates in two distinct cases depending on the available regularity
Proposition 3213 Suppose that the assumptions of Theorem 325 and Lemma 328 hold andlet y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] Assume that piecewise linear polynomials are being used toconstruct the subspaces Uh sub H1(Ω) in each time step and piecewise constants polynomials k = 0 forthe temporal discretization Then for τ le Ch2 we obtain
eL2[0T L2(Ω)] le Ch and rL2[0T L2(Γ)] le Ch
186 3 Approximation and Numerical Analysis
If in addition y micro isin L2[0 T H2(Ω)] capH1[0 T L2(Ω)] then
(e r)X le C(1α)(h+ τ12)
eL2[0T L2(Ω)] le C(1α12)(h2 + τ + (h2 + τ)12(h+ τ12)12 + (h+ τ12)2)
rL2[0T L2(Γ)] le C(h2 + τ)12(h+ τ12)12
which imply for τ asymp h2 the rates
(e r)X asymp O(h)eL2[0T L2(Ω)] asymp O(h32)rL2[0T L2(Γ)] asymp O(h32)
Proof The rates directly follow from Theorem 3211 Theorem 3212 Lemma 323 and Remark327
3222 Control Constraints The variational discretization approach
It is worth noting that our estimates are also applicable in case of point-wise control constraints whenusing the variational discretization approach of Hinze ([65]) The variational discretization approachimplies that Adad equiv Aad ie the control is not discretized explicitly but only implicitly via theadjoint variable Thus our discrete optimal control problem now coincides to Minimize functionalJh(yh(g) g) =
int T0 yh(g)minus yd2L2(Ω)dt+ α
int T0 g2L2(Γ)dt subject to (314) where yh(g) isin Uh denotes
the solution of (314) with right hand side given control g isin L2[0 T L2(Γ)] Then the optimalcontrol (abusing the notation denoted again by gh) satisfies the following first order optimalitycondition
Jprimeh(gh)(uminus gh) ge 0 for all u isin L2[0 T L2(Γ)]
where gh can take the form gh = Proj[gagb](minus λα microh(gh)) similar to continuous case We note that
the gh is not in general a finite element function corresponding to our finite element mesh hence itsalgorithmic construction requires extra care see eg [65] However in most practical situations themain goal is to minimize and compute the state variable and not necessary the control that is used toachieve our goal For the second derivative we easily obtain an estimate independent of g gh and inparticular
Jprimeprimeh (u)(u u) ge αu2L2[0T L2(Γ)] for all u isin L2[0 T L2(Γ)]
Theorem 3214 Let y0 isin L2(Ω) f isin L2[0 T H1(Ω)lowast] and yd isin L2[0 T L2(Ω)] Suppose thatAdad equiv Aad and let g gh denote the solutions of the corresponding continuous and discrete optimalcontrol problems Then the following estimate hold
g minus ghL2[0T L2(Γ)] le C(1α)micro(g)minus microh(g)L2[0T L2(Γ)]
where microh(g) and micro(g) denote the solutions of (3110) and (237) respectively Furthermore ifτ le Ch2
g minus ghL2[0T L2(Γ)] asymp O(h)
Proof We note that Adad equiv Aad and hence the optimality conditions imply that
Jprimeh(gh)(g minus gh) ge 0 and J
prime(g)(g minus gh) le 0 (3246)
Therefore using the second order condition and the mean value theorem we obtain for any u isinL2[0 T L2(Γ)] (and hence for the one resulting from the mean value theorem) and inequalities
32 Error estimates 187
(3246)
αg minus gh2L2[0T L2(Γ)] le Jprimeprimeh (u)(g minus gh g minus gh) = J
primeh(g)(g minus gh)minus J primeh(gh)(g minus gh)
le J primeh(g)(g minus gh)minus J prime(g)(g minus gh) =int T
0
int
Γ(micro(g)minus microh(g))(g minus gh)dxdt
le Cmicro(g)minus microh(g)L2[0T L2(Γ)]g minus ghL2[0T L2(Γ)]
which clearly implies the first estimate Now a rate of convergence can be obtained using similararguments to Theorem 325 Indeed note that subtracting (3110) from (237) and setting r =microh(g)minus micro(g) and e = yh(g)minus y(g) we obtain the analog of orthogonality condition (3227)-(3228)ie for all n = 1 N and for all vh isin Pk[tnminus1 tnUh]
(en1 vnh) +int tn
tnminus1
(minus 〈e1 vht〉+ a(e1 vh) + λ〈e1 vh〉Γ
)dt = (enminus1
1 vnminus1h+ )
minus(rn+ vnh) +int tn
tnminus1
(〈r vht〉+ a(r vh) + λ〈r vh〉Γ
)dt = minus(rnminus1
1+ vnminus1h+ ) +
int tn
tnminus1(e vh)dt
Using Sobolevrsquos boundary inequality the estimates of Theorem 325 and the rates of Proposition3213 we obtain the desired estimate after noting the reduced regularity of e
323 Semilinear distributed optimal control problem
Next we expand the above theory in the case we have a semilinear term in the state equation anddistributed control in Ω As expected technical difficulties appear to the proof of theorems due tosemilinear term we also use an auxiliary system for decoupling the system and make things easier tohandle
3231 The fully-discrete optimality system
The rest of the paper is devoted in proving that the dG approximations of the optimality systemexhibit the same rate of convergence to the related (uncontrolled) linear parabolic pde for appropriatedata f y0 yd and the parameter α
3232 Error estimates for the optimality system
In the case of semilinear distributed optimal control problem he key ingredient of the proof willbe the stability estimate at arbitrary time-points along with estimates for an auxiliary optimalitysystem (based on suitable L2 projection techniques) and a ldquoduality argumentrdquo in order to treat thenonlinear terms In order to obtain an actual rate of convergence more regularity is needed
Assumption 3215 Let (y g) be an optimal pair in the sense of Definition 225 In addition lety0 isin H1
0 (Ω) f isin L2[0 T L2(Ω)] and assume that α12y2Linfin[0T L4(Ω)] le Cd where Cd is constantdepending only upon data f yd y0 the constants Cc η and the domain Ω
188 3 Approximation and Numerical Analysis
Remark 3216 The above assumption implies a mild restriction on the size of y in terms ofthe penalty parameter α and the given data We refer the reader to [113] for a detailed analysis ofregularity results for semi-linear parabolic pdes Analogous Linfin[0 T H1(Ω)] stability results for thediscrete optimal control problem and for the optimality system (3115)-(3116)-(3117) will bestudied in detail elsewhere
3233 An auxiliary optimality system
First we define an auxiliary optimality system which will help uncoupling the discrete optimalitysystem Let wh zh isin Uh be defined as the solutions of the following system Given data f yd y0and initial conditions wh0 = yh0 where yh0 denote the initial approximation of y0 zN+ = 0 we seekwh zh isin Uh such that for n = 1 N and for all vh isin Pk[tnminus1 tnUnh ]
(wn vn) +int tn
tnminus1
(minus 〈wh vht〉+ a(wh vh) + 〈φ(y) vh〉
)dt
= (wnminus1 vnminus1+ ) +
int tn
tnminus1
(〈f vh〉 minus (1α)(micro vh)
)dt (3247)
minus(zn+ vn) +int tn
tnminus1
(〈zh vht〉+ a(zh vh) + 〈φprime(y)micro vh〉
)dt
= minus(znminus1+ vnminus1
+ ) +int tn
tnminus1(wh minus yd vh)dt (3248)
The solutions wh zh isin Uh exist since φ(y) φprime(y)micro belong at least to L2[0 T Hminus1(Ω)] due toAssumptions 211-315 and the regularity of y micro isin WD(0 T ) The solutions of the auxiliaryoptimality system play the role of ldquoglobal projectionsrdquo onto Uh The basic estimate on the energynorm of yminuswh microminus zh will be derived in terms of local L2 projections using techniques of [31 Section2] into the auxiliary system (2312)-(2313)(3247)-(3248)
Similarly with the Robin boundary control problem important for these estimates is to be validunder low regularity assumptions Therefore we define the classical projection that can apply tosemilinear term too (extra care is needed in the case of distributed control in a semilinear problembecause of working in different spaces than those reported in previous problems) So we need thefollowing regarding the method dG projections see eg [104]
Definition 3217 (1) The projection P locn C[tnminus1 tnL2(Ω)] rarr Pk[tnminus1 tnUnh ] satisfies(P locn v)n = Pnv(tn) and
int tn
tnminus1(v minus P locn v vh) = 0 forall vh isin Pkminus1[tnminus1 tnUnh ] (3249)
Here we have used the convention (P locn v)n equiv (P locn v)(tn) and Pn L2(Ω) rarr Unh is the orthogonalprojection operator onto Unh sub H1
0 (Ω)(2) The projection P loch C[0 T L2(Ω)]rarr Uh satisfies
P loch v isin Uh and (P loch v)|(tnminus1tn] = P locn (v|[tnminus1tn])
For the backwards in time problem a modification of the above projection still denoted by P locn ) willbe needed In particular in addition to relation (3249) we need to impose the ldquomatching conditionrdquoon the left ie (P locn v)nminus1
+ = Pnv(tnminus1+ ) instead of imposing the condition on the right Note that
the projection of Definition 3217 can be viewed as the one step DG approximation of vt = f on the
32 Error estimates 189
interval (tnminus1 tn] with exact initial data v(tnminus1) and f = vt specified while the modified projectionfor the backwards in time stems from the one step DG approximation of the backwards in time ODEwith given terminal data Recall that due to [104 Theorem 121] or [33] these projections satisfy theexpected approximation properties Below we state the main result for the auxiliary problem
Theorem 3218 Let f isin L2[0 T Hminus1(Ω)] y0 isin L2(Ω) and yd isin L2[0 T L2(Ω)] be given and letAssumption 211 hold Let y micro isinWD(0 T ) be the solutions of (2312)-(2313) and wh zh isin Uh bethe solutions of (3247)-(3248) computed using the DG scheme Denote by e1 = yminuswh r1 = microminus zhand let ep equiv y minus P loch y rp = microminus P loch micro where P loch is defined in Definition 3217 Then there existsan algebraic constant C gt 0 depending only on Ω such that
ηe12L2[0T H1(Ω)] +Nminus1sum
i=0[ei1]2L2(Ω) le C
(e0
12L2(Ω) + (C2c η)ep2L2[0T H1(Ω)]
)
+Nminus1sum
i=02 min
((I minus Pi)y(ti)2L2(Ω) (1(τi+1η))Pi+1(I minus Pi)y(ti)2Hminus1(Ω)
)
ηr12L2[0T H1(Ω)] +Nsum
i=1[ri1]2L2(Ω) le C
((1η)e12L2[0T L2(Ω)] + (C2
c η)rp2L2[0T H1(Ω)]
)
+Nsum
i=12 min
((I minus Pi+1)micro(ti)2L2(Ω) (1(τiη))Pi(I minus Pi+1)micro(ti)2Hminus1(Ω)
)
Here w0h = y0h where y0h denotes an approximation of y0 τi = ti minus timinus1 Pn denotes the L2
projection on Unh and we have used the convention P0 equiv P1 PN+1 equiv PN
Proof Throughout this proof we denote by e1 = y minus wh r1 = micro minus zh and we split e1 r1 toe1 equiv e1h + ep equiv (P loch y minus wh) + (y minus P loch y) r1 equiv r1h + rp equiv (P loch microminus zh) + (microminus P loch micro) where P lochis defined in Definition 3217 Using the above notation and subtracting (3247) from (2312) and(3248) from (2313) we obtain the orthogonality condition for n = 1 N
(en1 vn) +int tn
tnminus1
(minus 〈e1 vht〉+ a(e1 vh)
)dt = (enminus1
1 vnminus1+ ) (3250)
minus (rn1+ vn) +
int tn
tnminus1
(〈r1 vht〉+ a(r1 vh)
)dt = minus(rnminus1
1+ vnminus1+ ) +
int tn
tnminus1(e1 vh)dt (3251)
for all vh isin Pk[tnminus1 tnUnh ] Note that the orthogonality condition (3250) is essentially uncoupledand identical to the orthogonality condition of [31 Relation (26)] Hence applying [31 Theorem 22]we derive the first estimate In a similar way the orthogonality condition (3251) is equivalent to
minus(rn1h+ vn) +
int tn
tnminus1
(〈r1h vht〉+ a(r1h vh)
)dt = minus(rnminus1
1h+ vnminus1+ )
+int tn
tnminus1
((e1 vh)minus a(rp vh)
)dt+ (rnp+ vn) forall vh isin Pk[tnminus1 tnUnh ]
Here we have used the definition of the projection Setting vh = r1h into (3252) using the boundsint tn
tnminus1
∣∣(e1 r1h)∣∣dt le
int tn
tnminus1
((η4)r1h2H1(Ω) + (Cη)e12L2(Ω)
)dt
int tn
tnminus1
∣∣a(r1h rp)∣∣dt le (η4)
int tn
tnminus1r1h2H1(Ω)dt+ (C2
c η)int tn
tnminus1rp2H1(Ω)dt
190 3 Approximation and Numerical Analysis
and standard algebra we obtain
minus12r
n1h+2L2(Ω) + 1
2[rn1h]2L2(Ω) + 1
2rnminus11h+2L2(Ω) + η
2
int tn
tnminus1r1h2H1(Ω)dt
le Cint tn
tnminus1
((C2
c η)rp2H1(Ω) + (1η)e12L2(Ω)
)dt+
∣∣((I minus Pn+1)micro(tn+) rn1h)∣∣ (3252)
Finally for the last term observe that rnh+ isin Un+1h and hence
((I minus Pn+1)micro(tn+) rn1h) = ((I minus Pn+1)micro(tn+) rn1h minus rn1h+)le (I minus Pn+1)micro(tn+)2L2(Ω) + (14)rn1h+ minus rn1h2L2(Ω)
An alternative bound can be obtained by using the inverse estimatern1h2H1(Ω) le (Ckτn)
int tntnminus1 r1h2H1(Ω)dt and noting that rn1h isin Unh
((I minus Pn+1)micro(tn+) rn1h) = (Pn(I minus Pn+1)micro(tn+) rn1h) le Pn(I minus Pn+1)micro(tn+)Hminus1(Ω)rn1hH1(Ω)
le (C2k(τnη))Pn(I minus Pn+1)micro(tn+)2Hminus1(Ω) + (η4)
int tn
tnminus1r1h2H1(Ω)dt
where at the last step we have also used Youngrsquos inequality Collecting the last two estimates andequation (3252) we obtain the desired estimate upon summation and standard
Remark 3219 If the same subspaces are being used every time step ie Unh equiv Uh sub H10 (Ω) then we
observe that there is no contribution from the summation term in Theorem 3218 Indeed inspectingthe above proof we note that for i = 1 N the local L2(Ω) projection Pi equiv Pi+1 equiv PL2 L2(Ω)rarr Uhis the same at each time step Therefore rnh+ isin Uh implies that
((I minus Pn+1)micro(tn+) rn1h
)equiv((I minus PL2)micro(tn+) rn1h
)equiv 0
Hence (3252) takes the form
minus(12)rn1h+2L2(Ω) + (12)[rn1h]2L2(Ω) + (12)rnminus11h+2L2(Ω) + (η2)
int tn
tnminus1r1h2H1(Ω)dt
le Cint tn
tnminus1
((C2
c η)rp2H1(Ω) + (1η)e12L2(Ω)
)dt
Working similarly for the forward (in time) problem we obtain the following estimates
ηe12L2[0T H1(Ω)] +Nminus1sum
i=0[ei1]2L2(Ω) le C
(e0
12L2(Ω) + (C2c η)ep2L2[0T H1(Ω)]
)
ηr12L2[0T H1(Ω)] +Nsum
i=1[ri1]2L2(Ω) le C
((1η)e12L2[0T L2(Ω)] + (C2
c η)rp2L2[0T H1(Ω)]
)
Subsequently an estimate on the Linfin[0 T L2(Ω)] norm is derived using the approximation of thediscrete characteristic see Appendix Arsquo3 and the subsequent Theorem 3228 Since an estimate onthe L2[0 T H1(Ω)] norm is already obtained and the auxiliary optimality system is now essentiallyuncoupled the techniques of [31 Section 2] can be applied directly
Theorem 3220 Let wh zh isin Uh be the solutions of (3247)-(3248) computed using the DGscheme Denote by e1 = y minus wh r1 = microminus zh and suppose that the assumptions of Theorem 3218
32 Error estimates 191
hold Then there exists a constant C depending on CkΩ such that
e12Linfin[0T L2(Ω)] le C[ep2Linfin[0T L2(Ω)] + e0
12L2(Ω) + (C2c η)ep2L2[0T H1(Ω)]
+Nminus1sum
i=02 min
((I minus Pi)y(ti)2L2(Ω) (1(τi+1η))Pi+1(I minus Pi)y(ti)2Hminus1(Ω)
)]
r12Linfin[0T L2(Ω)] le C[rp2Linfin[0T L2(Ω)] + (1η)e12L2[0T L2(Ω)] + (C2
c η)rp2L2[0T H1(Ω)]
+Nsum
i=12 min
((I minus Pi+1)micro(ti)2L2(Ω) (1(τiη))Pi(I minus Pi+1)micro(ti)2Hminus1(Ω)
)]
Proof Splitting the error as in the previous theorem ie e1 = e1h + ep it suffices to bound the termsuptnminus1lttletn e1h(t)2L2(Ω) This is done in [31 Theorem 25] (note that the orthogonality condition isuncoupled) The estimate for the adjoint variable can be derived similarly starting from orthogonalitycondition (3251) and using a suitable approximation for the discrete characteristic for the backwardsin time problem
Remark 3221 Similar to Remark 3219 an improved bound holds when Unh = Uh n = 1 N In particular
e12Linfin[0T L2(Ω)] le C(ep2Linfin[0T L2(Ω)] + e0
12L2(Ω) + (C2c η)ep2L2[0T H1(Ω)]
)
r12Linfin[0T L2(Ω)] le C(rp2Linfin[0T L2(Ω)] + (1η)e12L2[0T L2(Ω)] + (C2
c η)rp2L2[0T H1(Ω)]
)
Remark 3222 The combination of the last two Theorems implies the ldquosymmetricrdquo structure ofour estimate In particular let ( )X ( )X1 be defined by
(e1 r1)2X equiv e12X + r12X equiv e12L2[0T H1(Ω)] + r12L2[0T H1(Ω)]
+e12Linfin[0T L2(Ω)] + r12Linfin[0T L2(Ω)]
and
(e1 r1)2X1 equiv e12X1 + r12X1
equivNminus1sum
i=02 min
((I minus Pi)y(ti)2L2(Ω) (1(τi+1η))Pi+1(I minus Pi)y(ti)2Hminus1(Ω)
)
+Nsum
i=12 min
((I minus Pi+1)micro(ti)2L2(Ω) (1(τiη))Pi(I minus Pi+1)micro(ti)2Hminus1(Ω)
)
Then using Theorems 3218 3220 we obtain an estimate of the form
error X le C(in data error L2(Ω) + best approx error X
+subsp errorX1
)
The above estimate indicates that the error is as good as the approximation properties enables it tobe and it is applicable for higher order elements under the natural parabolic regularity assumptionsIf Unh equiv Uh for n = 1 N then the subspace error can be dropped and thus we obtain symmetricestimate of the form
error X le C(in data error L2(Ω) + best approx error X
)
(3253)
which can be viewed as the fully-discrete analogue of Ceacutearsquos Lemma see eg ([34])
192 3 Approximation and Numerical Analysis
It remains to compare the discrete optimality system (3115)-(3116) to the auxiliary system (3247)-(3248) In the remaining of this work we denote by e2h equiv wh minus yh and by r2h equiv zh minus microh Webegin by establishing an auxiliary bound for e2h2L2[0T L2(Ω)] and (1α)r2h2L2[0T L2(Ω)] in termsof α12e2h2L2[0T H1(Ω)] and projection terms e1 r1 Here we note that without loss of generalitywe assume α lt 1 which corresponds to the physical case
Lemma 3223 Suppose that Assumptions 211-315-3215 hold Let yh microhwhzh isin Uh bethe solutions the optimality system (3115)-(3116) and of the auxiliary system (3247)-(3248)respectively computed using the discontinuous Galerkin scheme Denote by e1 equiv y minuswh r1 equiv microminus zhand let e2h equiv wh minus yh r2h equiv zh minus microh Then there exists constant C depending on η CL Cc and theconstants Cd Cst of Assumption 3215 and Lemma 317 respectively such that for τ satisfying theAssumptions of Lemmas 317 and 3118 and for α lt CCL the following estimate holds
int T
0e2h2L2(Ω)dt+ (1α)
int T
0r2h2L2(Ω)dt
le Cint T
0
((1α)e12H1(Ω) + r12H1(Ω)
)dt+ Cα12
int T
0e2h2H1(Ω)dt
Proof Subtracting (3116) from (3248) we obtain the equation
minus(rn2h+ vn) +
int tn
tnminus1
(〈r2h vht〉+ a(r2h vh) + 〈φprime(y)microminus φprime(yh)microh vh〉
)dt
= minus(rnminus12h+ v
nminus1+ ) +
int tn
tnminus1(e2h vh)dt forall vh isin Pk[tnminus1 tnUnh ] (3254)
Subtracting (3115) from (3247) we obtain the equation
(en2h vn) +int tn
tnminus1
(minus 〈e2h vht〉+ a(e2h vh) + 〈φ(y)minus φ(yh) vh〉
)dt
= (enminus12h vnminus1
+ ) +int tn
tnminus1minus(1α)(microminus microh vh)dt forall vh isin Pk[tnminus1 tnUnh ] (3255)
We will obtain an auxiliary bound for e2h2L2[0T L2(Ω)] and (1α)r2h2L2[0T L2(Ω)] in terms ofα12e2h2L2[0T H1(Ω)] and projection terms For this purpose we set vh = e2h into (3254) to obtain
minus(rn2h+ en2h) +
int tn
tnminus1
(〈r2h e2ht〉+ a(r2h e2h) + 〈φprime(y)microminus φprime(yh)microh e2h〉
)dt+ (rnminus1
2h+ enminus12h+)
=int tn
tnminus1e2h2L2(Ω)dt (3256)
and vh = r2h into (3255)
(en2h rn2h) +int tn
tnminus1
(minus 〈e2h r2ht〉+ a(e2h r2h) + 〈φ(y)minus φ(yh) vh〉
)dtminus (enminus1
2h rnminus12h+)
=int tn
tnminus1minus(1α)(r1 r2h)minus (1α)r2h2L2(Ω)dt (3257)
Integrating by parts with respect to time in (3257) and subtracting the resulting equation from(3256) we arrive to
(rn2h+ en2h)minus (enminus1
2h rnminus12h+) +
int tn
tnminus1
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt
=int tn
tnminus1(〈φprime(y)microminus φprime(yh)microh e2h〉 minus 〈φ(y)minus φ(yh) r2h〉) dtminus (1α)
int tn
tnminus1(r1 r2h)dt (3258)
32 Error estimates 193
We need to bound the three terms of the right hand side We begin by estimating the last two termsFor this purpose note that
∣∣∣∣∣(1α)int tn
tnminus1(r1 r2h)dt
∣∣∣∣∣ le (14α)int tn
tnminus1r2h2L2(Ω)dt+ (1α)
int tn
tnminus1r12L2(Ω)dt
while Assumption 315 (note that there exists ε gt 0 such that yh minus yL2[tnminus1tnL2(Ω)] le ε) andYoungrsquos inequality imply thatint tn
tnminus1|〈φ(y)minus φ(yh) r2h〉| dt le C2
Lα
int tn
tnminus1
(e2h2L2(Ω) + e12L2(Ω)
)dt+ (14α)
int tn
tnminus1r2h2L2(Ω)dt
Furthermore for the final term we may bound
Inl equivint tn
tnminus1|〈φprime(y)microminus φprime(yh)microh e2h〉| dt
leint tn
tnminus1|〈φprime(y)(microminus microh) e2h〉| dt+
int tn
tnminus1|〈(φprime(y)minus φprime(yh))microh e2h〉| dt equiv I1
nl + I2nl
For integral I1nl adding and subtracting φprime(0)
I1nl =
int tn
tnminus1|〈φprime(y)(microminus microh) e2h〉| dt
leint tn
tnminus1(|〈(φprime(y)minus φprime(0))(microminus microh) e2h〉|+ |〈φprime(0)(microminus microh) e2h〉|) dt
Hence using the Lipschitz continuity of φprime the uniform bound on φprime(0) the embeddingH1(Ω) sub L4(Ω)and Youngrsquos inequality with suitable δ gt 0 we obtain
I1nl le CCL
int tn
tnminus1yL4(Ω)r2h + r1L2(Ω)e2hL4(Ω)dt
+Cint tn
tnminus1r2h + r1L2(Ω)e2hL2(Ω)dt
le (1α)int tn
tnminus1r12L2(Ω)dt+ (14α)
int tn
tnminus1r2h2L2(Ω)dt
+αC(CL)y2Linfin[0T L4(Ω)]
int tn
tnminus1e2h2H1(Ω)dt+ Cα
int tn
tnminus1e2h2L2(Ω)dt
le (1α)int tn
tnminus1r12L2(Ω)dt+ (14α)
int tn
tnminus1r2h2L2(Ω)dt
+α12C(CL Cd)int tn
tnminus1e2h2H1(Ω)dt+ Cα
int tn
tnminus1e2h2L2(Ω)dt
where at the last inequality we have used Assumption 3215 Here C(CL Cd) denote constantdepending upon CL the data f y0 yd η and Ω In addition the Lipschitz continuity of φprime and thegeneralized Houmllderrsquos inequality imply that
I2nl =
int tn
tnminus1|〈(φprime(y)minus φprime(yh))microh e2h〉| dt
le CLint tn
tnminus1e1L4(Ω)microhL2(Ω)e2hL4(Ω)dt+
int tn
tnminus1e2hL4(Ω)microhL2(Ω)e2hL4(Ω)dt
194 3 Approximation and Numerical Analysis
The first part of I2nl can be bounded by using the embedding H1(Ω) sub L4(Ω) and Youngrsquos inequality
int tn
tnminus1e1H1(Ω)microhL2(Ω)e2hH1(Ω)dt le (CDmicrostα
12)int tn
tnminus1e12H1(Ω)dt+ α12
int tn
tnminus1e2h2H1(Ω)dt
where here we denote by Dmicrost the stability constant of Lemma 3118 Finally observe that interpo-lation inequality 2L4(Ω) le CL2(Ω)H1(Ω) the stability inequality of microh of Lemma 3118 andYoungrsquos inequality with appropriate δ imply that
int tn
tnminus1e2hL4(Ω)e2hL4(Ω)microhL2(Ω)dt le microhLinfin[tnminus1tnL2(Ω)]
int tn
tnminus1e2hL2(Ω)e2hH1(Ω)dt
le (14)int tn
tnminus1e2h2L2(Ω)dt+ Cmicroh2Linfin[tnminus1tnL2(Ω)]
int tn
tnminus1e2h2H1(Ω)dt
le (14)int tn
tnminus1e2h2L2(Ω)dt+ CCstα
12int tn
tnminus1e2h2H1(Ω)dt
Substituting the above bounds into (3258) and adding the resulting inequalities from 1 to N notingthat
sumNn=1
((rn2h+ e
n2h)minus (enminus1
2h rnminus12h+)
)= 0 (since e0
2h equiv 0 rN2h+ = 0) and choosing α lt C(CL) tohide
int tntnminus1 e2h2L2(Ω)dt we obtain the desired estimate
Remark 3224 In the above proof we have use the Lipschitz continuity of φprime to avoid any additionaltechnicalities The assumption that y isin Linfin[0 T L4(Ω)] will require to impose additional regularityassumptions on the data in particular y0 isin H1
0 (Ω) f isin L2[0 T L2(Ω)] but not additional regularityon the control and the target
Estimates follow using projection techniques of Theorem 3218 which allow to treat the forward andbackward (in time) coupled PDErsquos together with a ldquoboot-straprdquo argument
Theorem 3225 Let Assumptions 211-315-3215 hold Let yh microh whzh isin Uh be the solutionsof the optimality system (3115)-(3116) and of the auxiliary system (3247)-(3248) respectivelycomputed using the discontinuous Galerkin scheme Denote by e1 equiv y minus wh r1 equiv micro minus zh and lete2h equiv wh minus yh r2h equiv zh minus microh Then there exists constant D depending on yLinfin[0T L2(Ω)]η theconstant C of Lemma 3223 and ρ equiv CC2
stη+βCη4+CC2
stη+βC lt 1 (for β gt 0) such that for τ satisfying theassumptions of Lemmas 317 and 3118 the following estimate holds
eN2h2L2(Ω) + η
int T
0e2h2H1(Ω)dt+
Nminus1sum
i=0[ei2h]2L2(Ω)
+(ηα)int T
0r2h2H1(Ω)dt+ (1α)r0
2h+2L2(Ω) + (1α)Nsum
i=1[ri2h]2L2(Ω)
le D(1α2)int T
0
(e12H1(Ω) + r12H1(Ω)
)dt
Here the constant D is independent of τ h α
Remark 3226 We note that we are interested in the case where the values of α are small andpossibly comparable to h which guarantee fast convergence to the target yd Hence great care isexercised to avoid the use of Groumlnwallrsquos type arguments which typically lead to constants of the formexp(1α)
Proof Step 1 Preliminary estimates for the state Setting vh = e2h into (3255) and noting that
32 Error estimates 195
microminus microh = r1 + r2h we obtain
12e
n2h2L2(Ω) + 1
2[enminus12h ]2L2(Ω) minus
12e
nminus12h 2L2(Ω) + η
int tn
tnminus1e2h2H1(Ω)dt
+int tn
tnminus1〈φ(y)minus φ(yh) e2h〉dt le minus
1α
int tn
tnminus1(r1 + r2h e2h)dt (3259)
For the first term on the right hand side note that
∣∣∣(1α)int tn
tnminus1(r1 e2h)dt
∣∣∣ le(η4)
int tn
tnminus1e2h2H1(Ω)dt+ (Cηα2)
int tn
tnminus1r12L2(Ω)dt
Next we focus on the nonlinear terms Notice that the monotonicity of φ implies that
Inl equivint tn
tnminus1〈φ(y)minus φ(yh) e2h〉dt ge
int tn
tnminus1〈φ(y)minus φ(wh) e2h〉dt
and hence we moving the above term on the right hand side we may bound the term by usingAssumption 315 Poincareacute inequality and Youngrsquos inequality as follows
∣∣∣Inl∣∣∣ le CL
int tn
tnminus1e1L2(Ω)e2hL2(Ω)dt le (η4)
int tn
tnminus1e2h2H1(Ω)dt+ (CCLη)
int tn
tnminus1e12H1(Ω)dt
Therefore collecting the above bounds into (3259) and multiplying by α12 we obtain
α12(en2h2L2(Ω) + [enminus1
2h ]2L2(Ω) minus enminus12h 2L2(Ω) + (η4)
int tn
tnminus1e2h2H1(Ω)dt
)
leint tn
tnminus1
((Cηα32)r12H1(Ω) + (CCLα12η)e12H1(Ω)
)dtminus (1α12)
int tn
tnminus1(r2h e2h)dt
(3260)
Step 2 Preliminary estimates for the adjoint Setting vh = r2h into (3254) we obtain
minus(12)rn2h+2L2(Ω) + (12)[rn2h]2L2(Ω) + (12)rnminus12h+2L2(Ω) + η
int tn
tnminus1r2h2H1(Ω)dt
+int tn
tnminus1〈φprime(y)microminus φprime(yh)microh r2h〉dt le
int tn
tnminus1(e2h r2h)dt (3261)
Using the monotonicity of φ and noting that micro minus microh = r1 + r2h the nonlinearity of the adjointequation can be written asint tn
tnminus1〈φprime(y)microminus φprime(yh)microh r2h〉dt =
int tn
tnminus1〈φprime(y)microminus φprime(y)microh r2h〉dt+
int tn
tnminus1〈φprime(y)microh minus φprime(yh)microh r2h〉dt
geint tn
tnminus1〈φprime(y)r1 r2h〉dt+
int tn
tnminus1〈φprime(y)microh minus φprime(yh)microh r2h〉dt
Moving the last two integrals on the right hand side we derive appropriate bounds For the firstintegral using the Lipschitz continuity of φprime the uniform bound on φprime(0) the generalized Houmllderrsquosinequality and the embedding H1(Ω) sub L4(Ω) we easily obtain
∣∣∣int tn
tnminus1〈φprime(y)r1 r2h〉dt
∣∣∣ le∣∣∣int tn
tnminus1〈(φprime(y)minus φprime(0))r1 r2h〉dt
∣∣∣+∣∣∣int tn
tnminus1〈φprime(0)r1 r2h〉dt
∣∣∣
le (η4)int tn
tnminus1r2h2H1(Ω)dt+ (Cyη)
int tn
tnminus1r12H1(Ω)dt
196 3 Approximation and Numerical Analysis
∣∣∣int tn
tnminus1〈φprime(y)r1 r2h〉dt
∣∣∣ le∣∣∣int tn
tnminus1〈(φprime(y)minus φprime(0))r1 r2h〉dt
∣∣∣+∣∣∣int tn
tnminus1〈φprime(0)r1 r2h〉dt
∣∣∣
le (η4)int tn
tnminus1r2h2H1(Ω)dt+ (Cyη)
int tn
tnminus1r12H1(Ω)dt
where Cy depends only on yLinfin[0T L2(Ω)] and the domain Similarly for the second integral theLipschitz continuity of φprime the generalized Houmllder inequality and the fact that yminus yh = e1 + e2h imply
∣∣∣int tn
tnminus1〈(φprime(y)minus φprime(yh))microh r2h〉dt
∣∣∣ le CLint tn
tnminus1microhL2(Ω)e1 + e2hL4(Ω)r2hL4(Ω)dt le II1
nl + II2nl
It remains to bound the last two integrals Starting from II2nl using the interpolation inequality
2L4(Ω) le CL2(Ω)H1(Ω) and stability estimates on microh we obtain
II2nl le CL
int tn
tnminus1microhL2(Ω)e2hL4(Ω)r2hL4(Ω)dt
le η4int tn
tnminus1microh2L2(Ω)r2hH1(Ω)e2hH1(Ω)dt
+(CCLη)int tn
tnminus1e2hL2(Ω)r2hL2(Ω)dt
le η4int tn
tnminus1r2h2H1(Ω)dt+ microh4Linfin[tnminus1tnL2(Ω)]η16
int tn
tnminus1e2h2H1(Ω)dt
+(CCLη)int tn
tnminus1
(α12e2h2L2(Ω) + (1α12)r2h2L2(Ω)
)dt
le η4int tn
tnminus1r2h2H1(Ω)dt+ (CC2
stαη16)int tn
tnminus1e2h2H1(Ω)dt
+(CCLη)int tn
tnminus1
(α12e2h2L2(Ω) + (1α12)r2h2L2(Ω)
)dt
where we have used the stability bound of Lemma 3118 For II1nl using the Houmllderrsquos inequality and
the embedding H1(Ω) sub L4(Ω) we obtain
II1nl le C
int tn
tnminus1microhL2(Ω)e1H1(Ω)r2hH1(Ω)dt
le (η4)int tn
tnminus1r2h2H1(Ω)dt+ (CCLCstα12η)
int
tnminus1e12H1(Ω)dt
Inserting the bounds on II1nl II2
nl into (3261) and multiplying by (1α12) we obtain
minus(12α12)rn2h+2L2(Ω) + (12α12)[rn2h]2L2(Ω) + (12α12)rnminus12h+2L2(Ω)
+(η2α12)int tn
tnminus1r2h2H1(Ω)dt
le Dint tn
tnminus1
(e12H1(Ω) + (1α12)r12H1(Ω)
)dt+ (1α12)
int tn
tnminus1(e2h r2h)dt
+CC2stα
12η
int tn
tnminus1e2h2H1(Ω)dt+ CCLη
int tn
tnminus1
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt (3262)
where D depends upon CCLCstη and CyηStep 3 Combination of (3260)-(3262) Next we will form the convex combination of (3260)-(3262) by multiplying 1 minus ρ equation (3262) and by ρ equation (3260) 0 lt ρ lt 1 (ρ to be
32 Error estimates 197
determined later ) and we add the resulting equations
ρα12(en2h2L2(Ω) + [enminus1
2h ]2L2(Ω) minus enminus12h 2L2(Ω)
)+ (ρηα124)
int tn
tnminus1e2h2H1(Ω)dt
((1minus ρ)2α12)(minusrn2h+2L2(Ω) + [rn2h]2L2(Ω) + rnminus1
2h+2L2(Ω)
)
+((1minus ρ)η4α12)int tn
tnminus1r2h2H1(Ω)dt
le D(1α32)int tn
tnminus1
(r12H1(Ω) + e12H1(Ω)
)dt+ (1minus ρ)CC2
stα12η
int tn
tnminus1e2h2H1(Ω)dt
+(1minus ρ)(CCLη)int tn
tnminus1
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt
+(1minus ρ)α12int tn
tnminus1(e2h r2h)dtminus (ρα12)
int tn
tnminus1(e2h r2h)dt (3263)
There are two distinct cases If 0 lt ρ le (12) then ρ le (1 minus ρ) and we may bound the last twoterms by 2(1minus ρ)α12 int tn
tnminus1 |(e2h r2h)|dt and hence using Youngrsquos inequality
2(1minus ρ)α12int tn
tnminus1
(α12e2h2L2(Ω) + (1α12)r2h2L2(Ω)
)dt
Substituting the last inequality into (3263) and summing from 1 to N we deduce
ρα12eN2h2L2(Ω) + ρα12Nsum
i=1[eiminus1
2h ]2L2(Ω) + (ρηα124)int T
0e2h2H1(Ω)dt
+(1minus ρ)2α12Nsum
i=1[ri2h]2L2(Ω) + ((1minus ρ)2α12)r0
2h+2L2(Ω) + ((1minus ρ)η4α12)int T
0r2h2H1(Ω)dt
le D(1α32)int T
0
(r12H1(Ω) + e12H1(Ω)
)dt+ (1minus ρ)CC2
stα12η
int T
0e2h2H1(Ω)dt
+(1minus ρ)CCLηint T
0
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt
+2(1minus ρ)int T
0
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt (3264)
where D depends only upon the stability constant Cst η CL Note that we may use Lemma 3223to replace the last two integrals by projection terms e1 r1 and α12e2h2L2[0T H1(Ω)] Thus
ρα12eN2h2L2(Ω) + ρα12Nsum
i=1[eiminus1
2h ]2L2(Ω) + (ρηα124)int T
0e2h2H1(Ω)dt
+((1minus ρ)2α12)Nsum
i=1[ri2h]2L2(Ω) + ((1minus ρ)2α12)r0
2h+2L2(Ω) + ((1minus ρ)η4α12)int T
0r2h2H1(Ω)dt
le D(ρ)(1α32)int T
0
(r12H1(Ω) + e12H1(Ω)
)dt
+(1minus ρ)CC2stα
12η
int T
0e2h2H1(Ω)dt+ (1minus ρ)3Cα12
int T
0e2h2H1(Ω)dt (3265)
Here C denotes the constant of Lemma 3223 Then choosing ρ in order to hide the terme2hL2[0T H1(Ω)] on the left ie
(1minus ρ)(CC2stη + 3C)α12 = ρηα124 ρ equiv CC2
stη + 3Cη4 + CC2
stη + 3C lt 1
198 3 Approximation and Numerical Analysis
(noting that ρ is independent of α) we arrive at the desired estimate We also note that so far wehave treated the case 0 lt ρ le 12 which implies an assumption on the size of data and in particularCC2
stη + 3C lt η4 It remains to treat the case where 12 lt ρ lt 1 Again we are interested intreating the last two terms of (3263) For this purpose note that
(1minus ρ)α12int tn
tnminus1(e2h r2h)dtminus (ρα12)
int tn
tnminus1(e2h r2h)dt le |(1minus 2ρ)|α12
int tn
tnminus1|(e2h r2h)|dt
Since 12 lt ρ lt 1 we deduce |(1 minus 2ρ)| = (2ρ minus 1) le β(1 minus ρ) for some β gt 0 Indeed we notethat if β gt 0 big enough then ρ asymplt 1 since ρ le (1 + β)(2 + β) asymplt 1 The remaining of the proofremains the same The analog of (3265) takes the form
ρα12eN2h2L2(Ω) + ρα12Nsum
i=1[eiminus1
2h ]2L2(Ω) + (ρηα124)int T
0e2h2H1(Ω)dt
+((1minus ρ)2α12)Nsum
i=1[ri2h]2L2(Ω) + ((1minus ρ)2α12)r0
2h+2L2(Ω)
+((1minus ρ)η4α12)int T
0r2h2H1(Ω)dt
le D(ρ)(1α32)int T
0
(r12H1(Ω) + e12H1(Ω)
)dt
+(1minus ρ)CC2stα
12η
int T
0e2h2H1(Ω)dt+ β(1minus ρ)Cα12
int T
0e2h2H1(Ω)dt
Then choosing ρ (independent of α) in order to hide the last two terms on the left hand side ie for
(1minus ρ)(CC2stη + βC)α12 = ρηα124 ρ equiv CC2
stη + βCη4 + CC2
stη + βC lt 1
we obtain the desired estimate
Remark 3227 In most practical situations such as short time-setting or not very large data Cstwe note that the values of the parameters ρ or 1 minus ρ are not comparable to a12 ltlt 1 hence thedependence of the estimate upon α does not deteriorate further
Based on the estimates at the energy norms we proceed to derive estimates at arbitrary timesSince an estimate on the energy norm r1L2[0T H1(Ω)] is already obtained in Theorem 3225 theoptimality system is now essentially uncoupled An estimate at arbitrary time points for the forwardin time equation can be derived by applying the approximation of the discrete characteristic techniqueof [31] into the semi-linear case Here the stability estimate at arbitrary time-points will be alsoneeded
Theorem 3228 Let yh microh isin Uh be the solutions of (3115)-(3116) If in addition to theassumptions of Theorems 3218 3225 τ satisfies τ le Ckη then there exists a constant Ddepending on the ratios (Cyη) (Ccη) eTCkη and the constant D of Theorem 3225 such that
e2h2Linfin[0T L2(Ω)] le D(1α2)int T
0
(e12H1(Ω) + r12H1(Ω)
)dt
Here D is also independent of τ h α
Proof We begin by integrating by parts with respect to time in (3255) and substituting vh = e2hwhere e2h denotes the approximation of the discrete characteristic function χ[tnminus1t)e2h (for any fixedt isin [tnminus1 tn)) as constructed in Appendix Arsquo3 The definition of the e2h (see Appendix Arsquo3) and the
32 Error estimates 199
fact that e2ht isin Pkminus1[tnminus1 tnUnh ] implies thatint tntnminus1(e2ht e2h)dt =
int ttnminus1(e2ht eeh)dt which implies
(12)e2h(t)2L2(Ω) + (12)[enminus12h ]2L2(Ω) +
int tn
tnminus1
(a(e2h e2h) + 〈φ(y)minus φ(yh) e2h〉
)dt
= (12)enminus12h 2L2(Ω) minus
int tn
tnminus1(1α)(r1 + r2h e2h)dt
Recall also that the continuity property on a( ) and Proposition A31 imply
∣∣∣int tn
tnminus1a(e2h e2h)dt
∣∣∣ le C(Ck Cc)int tn
tnminus1e2h2H1(Ω)dt
while the coupling term can be bounded as
∣∣∣ 1α
int tn
tnminus1(r1 + r2h e2h)dt
∣∣∣ le (Ckα2)int tn
tnminus1
(r2h2L2(Ω) + r12L2(Ω)
)dt+ Ck
int tn
tnminus1e2h2L2(Ω)dt
Here we have used Youngrsquos inequality with appropriate δ gt 0 and Proposition A31 For thesemilinear term recall that the growth condition and generalized Houmllder inequality the embeddingH1(Ω) sub L4(Ω) imply
int tn
tnminus1〈φ(y)minus φ(yh) e2h〉dt le CL
int tn
tnminus1y minus yhH1(Ω)e2hH1(Ω)dt
Using Youngrsquos inequality we finally arrive atint tn
tnminus1〈φ(y)minus φ(yh) e2h〉dt le Ck(Cy + CL)
int tn
tnminus1
(e12H1(Ω) + e2h2H1(Ω)
)dt
where Cy depends only upon yLinfin[0T L2(Ω)] Hence substituting the above estimates into (3266)we obtain an inequality of the form (1minusCτn)an le anminus1 +fn where an = supsisin(tnminus1tn] e2h(s)2L2(Ω)Indeed let t isin (tnminus1 tn] to be chosen as an equiv e2h(t)2L2(Ω) and note that Ck
int tntnminus1 e2h2L2(Ω)dt le
Ckτnan for τn satisfying τnCk lt 14 the desired estimate follows by the discrete Groumlnwall Lemma
upon using the previous bounds of Lemma 3223 Theorems 3218 3225 and standard algebra
Estimate on the adjoint variable micro follow using similar techniques and the previously derived estimateson the primal variable Below we state the relevant estimate
Theorem 3229 Let yh microh isin Uh be the solutions of (3115)-(3116) Suppose that the Assumptionsof Theorems 3225-3228 hold Then there exists a constant D gt 0 (similar to Theorem 3228) suchthat
r2h2Linfin[0T L2(Ω)] le Dint T
0
(e12H1(Ω) + r12H1(Ω)
)dt
Various estimates can be derived using results of the previous Section and standard approximationtheory results We begin by stating symmetric error estimates
Theorem 3230 Suppose that Assumptions 211-315-3215 hold Let yh microh isin Uh denote theapproximate solutions of the optimality system (3115)-(3116) computed using the discontinuousGalerkin scheme Suppose that τ = maxi=1n τn h satisfy the conditions of Lemmas 317 3118
200 3 Approximation and Numerical Analysis
and Theorem 3228 Then the following estimate holds
e2X + (1α)r2X le C(1α2)(e02L2(Ω) + ep2X + rp2X
)
+Nminus1sum
i=02 min
((I minus Pi)y(ti)2L2(Ω) (1τ i+1η)Pi+1(I minus Pi)y(ti)2Hminus1(Ω)
)
+Nsum
i=12 min
((I minus Pi+1)micro(ti)2L2(Ω) (1τ iη)Pi(I minus Pi+1)micro(ti)2Hminus1(Ω)
)
where C depends upon the stability constants of Lemmas 317 3118 and the constants C D D ofLemma 3223 and Theorems 3225 3228 respectively but is independent of τ h α In additionsuppose that the same subspaces are being used ie Unh = Uh Then
e2X + (1α)r2X le C(1α2)(e02L2(Ω) + ep2X + rp2X
)
Proof The first estimate follows by using triangle inequality and previous estimates of Theorems3218-3225 The second estimate follows by Remark 3219
Using now standard regularity and approximation theory results we obtain convergence rates Belowwe state convergence rates in two distinct cases depending on the available regularity
Proposition 3231 Suppose that the assumptions of Theorems 3218-3225 hold Suppose alsothat y micro satisfy
(y micro) isin Linfin[0 T H l+1 capH10 (Ω)] (y(k+1) micro(k+1)) isin Linfin[0 T H1(Ω)]
Assume that piecewise polynomials of degree l are being used to construct the subspaces Unh sub H1(Ω)in each time step where h denotes the spacial discretization parameter Then the following estimateholds
e2X + (1α)r2X le C(1α2)(h2l + τ2(k+1) + h2l minh4(τ2η) h2τ
)
Here the constant C denotes the constant of Theorem 3230 In case that Unh = Uh then the followingestimate is valid
e2X + (1α)r2X le C(1α2)(h2l + τ2(k+1)
)
Proof It remains to estimate ep rp Using [33 Corollary 48] and the standard approximationproperties of Pn we obtain
y minus P locn yL2[tnminus1tnH1(Ω)] le C(y minus PnyL2[tnminus1tnH1(Ω)] + τk+1Pny(k+1)L2[tnminus1tnH1(Ω)]
)
le C(hlyL2[tnminus1tnHl+1(Ω)] + τk+1y(k+1)L2[tnminus1tnH1(Ω)]
)
Therefore y minus P loch yL2[0T H1(Ω)] le C(hlyL2[0T Hl+1(Ω)] + τk+1y(k+1)L2[0T H1(Ω)]
)
Working similarly we also obtain that
y minus P loch yLinfin[0T L2(Ω)] le C(hl+1yLinfin[0T Hl+1(Ω)] + τk+1y(k+1)Linfin[0T H1(Ω)]
)
Similar estimates also hold for rp It remains to bound the error terms due to the change of subspaces
32 Error estimates 201
For that purpose it is easy to see that
Nminus1sum
i=02 min
((I minus Pi)y(ti)2L2(Ω) (1τ i+1η)Pi+1(I minus Pi)y(ti)2Hminus1(Ω)
)
le Cy2C[0T Hl+1(Ω)] minh2l+4
τ2ηh2+2l
τ
while a similar estimates also holds for the terms involving the adjoint variable
Our last result concerns error estimates under more restrictive regularity assumptions on the solutionand in particular on the time-derivative
Proposition 3232 Suppose that the assumptions of Theorems 3218-3225 hold Suppose alsothat y micro satisfy
(y micro) isin Linfin[0 T H l+1 capH10 (Ω)] (y(k+1) micro(k+1)) isin Linfin[0 T L2(Ω)]
Assume that the same subspaces are being used in every time-step Unh = Uh and piecewise polynomialsof degree l are being used to construct the subspace Uh sub H1(Ω) where h denotes the spacialdiscretization parameter Suppose that the assumptions of Theorem 3230 hold Then we obtain
e2X + (1α)r2X le C(1α2)(h2l + (τ2k+2h2)
)
where C denote the constant of Theorem 3230
Proof Working similar to the previous theorem and an inverse estimate lead to
y minus P locn y2L2[tnminus1tnH1(Ω)] le Cy minus Pny2L2[tnminus1tnH1(Ω)] + Ckτ2(k+1)Pny(k+1)2L2[tnminus1tnH1(Ω)]
le C(y minus Pny2L2[tnminus1tnH1(Ω)] + τ2(k+1)h2Pny(k+1)2L2[tnminus1tnL2(Ω)]
)
The projection error in Linfin[tnminus1 tnL2(Ω)] can be treated similarly The adjoint variable can betreated similarly Thus using the stability of the orthogonal projection we obtain the desiredestimate
Remark 3233 It is clear from the proofs of Propositions 3231 and 3232 that the enhancedregularity assumptions on (y micro) is only needed to obtain (optimal) rates with respect to Linfin[0T L2(Ω)]part of the corresponding X norm Indeed if we choose the same subspaces in each time stepUnh = Uh then there is no contribution from the jump-terms and hence we may combine the resultsor Remark 3219 and Theorem 3225 to relate the errors eL2[0T H1(Ω)] and rL2[0T H1(Ω)]with projection errors y minus P loch y and micro minus P loch micro at the same norms As a consequence the ratesof convergence of Proposition 3232 with respect to L2[0T H1(Ω)] norms only require (y micro) isinL2[0 T H l+1(Ω)] capHk+1[0 T L2(Ω)] regularity
Remark 3234 Due to the absence of control constraints an estimate on the controls g minus ghfollow directly from the estimate on the adjoint microminus microhX using the optimality condition Howeveras it is indicated in the subsequent numerical experiments an improved rate of convergence in theL2[0 T L2(Ω)] norm is expected for the controls This issue will be investigated elsewhere
324 Stokes distributed optimal control problem
Suchlike we extend our study to Stokes evolutionary problems and to spaces we mentioned beforeFirst an auxiliary system which plays the role of a global space-time dG projection is defined
202 3 Approximation and Numerical Analysis
Throughout the remaining of our paper we will work with weak formulations that assume theexistence of a pressure p isin L2[0 T L2
0(Ω)] (and hence of yt isin L2[0 T Hminus1(Ω)]) Hence the continuityof optimality system consists of equations (2320)-(2321) and (2318) or (2319) and the discreteoptimality system by (3122)-(3123) and (3120) or (3121)
3241 The fully-discrete projection
Given data f y0 and initial conditions w0h = y0
h where y0h equiv Phy0 denote the initial approximation
of y0 zN+ = 0 we seek (wh p1h)(zh φ1h) isin Uh times Qh such that for n = 1 N and for all vh isinPk[tnminus1 tn Yh] qh isin Pk[tnminus1 tnQh]
(wnh vnh)minusint tn
tnminus1
(〈wh vht〉 minus a(wh vh)minus b(vh p1h)
)dt = (wnminus1
h vnminus1h+ ) +
int tn
tnminus1
(〈f vh〉+ (g vh
)dt
int tn
tnminus1b(wh qh)dt = 0
(3266)
minus(znh+ vnh) +
int tn
tnminus1
(〈zh vht〉+ a(zh vh) + b(vh φ1h)
)dt = minus(znminus1
h+ vnminus1h+ ) +
int tn
tnminus1(wh minus yd vh)dt
int tn
tnminus1b(zh qh)dt = 0
(3267)The solutions wh zh isin Uh exist for any given data f isin L2[0 T V(Ω)lowast] y0 isin W(Ω) and yd isinL2[0 T L2(Ω)] In particular the stability estimates imply that wh zh isinWS(0 T ) In addition dueto the enhanced regularity of wh minus yd we also obtain that zh isin Linfin[0 T H1(Ω)]
The solutions of the auxiliary optimality system play the role of ldquoglobal projectionsrdquo onto Uh Thebasic estimate on the energy norm of y minus wh microminus zh will be derived in terms of local L2 projectiontechniques into the auxiliary system The following standard projection associated to discontinuoustime-stepping methods for the Navier-Stokes equations (see eg [32 Definitions 41 42]) is needed
Definition 3235 (1) The projection P locn C[tnminus1 tn L2(Ω)] rarr Pk[tnminus1 tn Uh] satisfies(P locn v)n = Phv(tn) and
int tn
tnminus1(v minus P locn v vh) = 0 forall vh isin Pkminus1[tnminus1 tn Uh] (3268)
Here we have used the convention (P locn v)n equiv (P locn v)(tn) and Ph L2(Ω) rarr Uh is the orthogonalprojection operator onto discrete divergence free subspace Uh(2) The projection P loch C[0 T L2(Ω)]rarr Uh satisfies
P loch v isin Uh and (P loch v)|(tnminus1tn] = P locn (v|[tnminus1tn])
Due to the lack of regularity and the coupling between the time-derivative and the pressure we willalso need the following generalized dG projection which will be applicable when p isin L2[0 T L2
0(Ω)]yt isin L2[0 T Hminus1(Ω)] In particular we construct a space-time generalized L2 divergence freeprojection (see also eg [30]) which combines the standard dG time stepping projection and thegeneralized L2 projection Qh Hminus1(Ω) rarr Uh For various properties of Qh see for instance [69Section 2] Recall that the definition of Qh states that 〈v minus Qhv vh〉 = 0 for all v isin Hminus1(Ω) andvh isin Uh The projection is well defined in Hminus1(Ω) and coincides to Ph for v isin L2(Ω)
Definition 3236 (1) The projection Qlocn C[tnminus1 tn Hminus1(Ω)] rarr Pk[tnminus1 tn Uh] satisfies
32 Error estimates 203
(Qlocn v)n = Qhv(tn) andint tn
tnminus1〈v minusQlocn v vh〉 = 0 forall vh isin Pkminus1[tnminus1 tn Uh]
Here we also use the convention (Qlocn v)n equiv (Qlocn v)(tn) and Qh Hminus1(Ω)rarr Uh is the generalizedorthogonal projection operator onto Uh(2) The projection Qloch C[0 T Hminus1(Ω)]rarr Uh satisfies
Qloch v isin Uh and (Qloch v)|(tnminus1tn] = Qlocn (v|[tnminus1tn])
For k = 0 the projection Qloch C[0 T Hminus1(Ω)] rarr Uh reduces to Qloch v(t) = Qhv(tn) for allt isin (tnminus1 tn] n = 1 N
In the same way as Robin by definition Qloch coincides to P loch when v isin L2[0 T L2(Ω)] ieP loch v = Qloch v when v isin L2[0 T L2(Ω)] and hence exhibits best approximation properties Howeverwe emphasize that is also applicable for v equiv yt isin L2[0 T Hminus1(Ω)] For the backwards in timeproblem a modification of the above projections (still denoted by P locn Qlocn respectively) is definedin a similar manner For example in addition to relation (3268) we need to impose the ldquomatchingconditionrdquo on the left ie (P locn v)nminus1
+ = Phv(tnminus1+ ) instead of imposing the condition on the right
In the following Lemma we collect several results regarding (optimal) rates of convergence for theabove projection Here the emphasis is placed on the approximation properties of the generalizedprojection Qloch under minimal regularity assumptions ie for v isin L2[0 T V(Ω)]capH1[0 T Hminus1(Ω)]for the lowest order scheme
Lemma 3237 Let Uh sub H1(Ω) and P loch Qloch defined in Definitions 3235 and 3236 respectivelyThen for all v isin L2[0 T Hl+1(Ω) capV(Ω)] capHk+1[0 T L2(Ω)] there exists constant C independentof h τ such that
v minus P loch vL2[0T L2(Ω)] le C(hl+1vL2[0T Hl+1(Ω)] + τk+1v(k+1)L2[0T L2(Ω)]
)
v minus P loch vL2[0T H1(Ω)] le C(hlvL2[0T Hl+1(Ω)] + τk+1hv(k+1)L2[0T L2(Ω)]
)
Let k = 0 l ge 1 and v isin L2[0 T H2(Ω) cap V (Ω)] capH1[0 T L2(Ω)] Then there exists constant cindependent of h τ such that
v minus P loch vL2[0T H1(Ω)] le C(hvL2[0T H2(Ω)] + τ12(vtL2[0T L2(Ω)] + vL2[0T H2(Ω)])
)
Let k = 0 l ge 1 and v isin L2[0 T V(Ω)] capH1[0 T Hminus1(Ω)] Then there exists a constant C gt 0independent of h τ such that
v minusQloch vL2[0T L2(Ω)] le C(hvL2[0T H1(Ω)] + τ12vtL2[0T Hminus1(Ω)]
)
v minusQloch vL2[0T H1(Ω)] le C(vL2[0T H1(Ω)] + (τ12h)(vtL2[0T Hminus1(Ω)] + vL2[0T H1(Ω)])
)
Proof See Appendix Arsquo1
Remark 3238 The stability estimate in L2[0 T H1Ω)] requires the time-step restriction of τ le Ch2
due to the lack of regularity with respect to time For the second estimate we also note that if moreregularity is available the inverse estimate is not necessary In particular if v(k+1) isin L2[0 T H1(Ω)]then the improved rate of O(hl + τk+1) holds in L2[0T H1(Ω)] norm However we note that forthe lowest order scheme k = l le 1 the increased regularity vt isin L2[0 T H1(Ω)] is not available atleast in presence of control constraints Hence we emphasize that the lack of regularity acts as abarrier for developing a true higher order scheme Working similarly we also obtain an estimate atarbitrary time-points (see for instance [32]) Finally it is worth noting that approximation propertiesof Qloch in L2[0T Hminus1(Ω)] norm (see for instance [69 Proposition 212]) hold only on the divergence
204 3 Approximation and Numerical Analysis
free subspace Vminus1 equiv v isin Hminus1(Ω) divv = 0 endowed with the norm Vminus1 = Hminus1 Here thedivergence free condition is understood as follows
〈vnablaφ〉 = 0 forallφ in H20 (Ω) equiv φ isin H2(Ω) capH1
0 (Ω) (nablaφ)|Γ = 0
where 〈 〉 equiv 〈 〉Hminus1H10 We refer the reader to [69 Section 23] for a detailed analysis of the
projection and its properties but we point out that in the subsequent analysis the use of L2[0T Hminus1(Ω)]projection estimates is not needed
The next result states that the error related to the auxiliary projection is as good as the local dGprojection error allows it to be and hence it is optimal in the sense of the available regularity
Theorem 3239 Let f isin L2[0 T Hminus1(Ω)] and y0 isinW(Ω) be given and (y p) (micro φ) isinWS(0 T )timesL2[0 T L2
0(Ω)] be the solutions of (2320)-(2321)-(2319) or (2320) and wh zh isin Uh be thesolutions of (3266)-(3267) Denote by e = yminuswh r = microminuszh and let ep equiv yminusQloch y rp = microminusP loch microwhere P loch Qloch are defined in Definitions 3235 and 3236 Then there exists an algebraic constantC gt 0 depending only on Ω such that for any qh isin L2[0 T L2
0(Ω)]
1) e2W (0T ) +Nminus1sum
i=0[ei]2L2(Ω) le C
(e02L2(Ω) + (1ν)
(ep2W (0T ) + pminus qh2L2[0T L2(Ω)]
))
2) r2W (0T ) +Nsum
i=1[ri]2L2(Ω) le C(1ν)
(e2L2[0T L2(Ω)]+rp2W (0T ) + φminus qh2L2[0T L2(Ω)]
)
3) eL2[0T L2(Ω)] le C(1ν)(νepL2[0T L2(Ω)] + τ12(epL2[0T H1(Ω)] + pminus qhL2[0T L2(Ω))
)
4) rL2[0T L2(Ω)] le C(νeL2[0T L2(Ω)] + rpL2[0T L2(Ω)]
+τ12(rpL2[0T H1(Ω)] + φminus qhL2[0T L20(Ω)])
)
Here w0h = y0
h where y0h denotes an approximation of y0 and C a constant depending upon on the
domain Ω
Proof Estimates (1)-(2) Throughout this proof we denote by e = y minus wh r = microminus zh and we splite r to e equiv e1h+ep equiv (Qloch yminuswh)+(yminusQloch y) r equiv r1h+rp equiv (P loch microminuszh)+(microminusP loch micro) where P loch Qloch are defined in Definitions 3235 and 3236 Subtracting (3266) from (2320) and (3267) from(2321) we obtain the orthogonality condition For n = 1 N and for all vh isin Pk[tnminus1 tn Yh]qh isin Pk[tnminus1 tnQh]
(en vnh) +int tn
tnminus1
(minus 〈e vht〉+ a(e vh) + b(vh pminus p1h)
)dt = (enminus1 vnminus1
h+ )int tn
tnminus1b(y minus wh qh)dt = 0
(3269)
minus(rn+ vnh) +int tn
tnminus1
(〈r vht〉+ a(r vh) + b(vh φminus φ1h)
)dt = minus(rnminus1
+ vnminus1h+ ) +
int tn
tnminus1(e vh)dt
int tn
tnminus1b(microminus zh qh)dt = 0
(3270)Note that the orthogonality condition (3269) is essentially uncoupled and identical to the orthogo-nality condition of [32 Equation (44)] Hence applying [32 Theorems 46 and 47] we derive thefirst estimate For the second estimate we note that the orthogonality condition (3270) is equivalent
32 Error estimates 205
to For n = 1 N and for all vh isin Pk[tnminus1 tn Yh] qh isin Pk[tnminus1 tnQh]
minus(rn1h+ vnh) +
int tn
tnminus1
(〈r1h vht〉+ a(r1h vh) + b(vh φminus φ1h)
)dt
= minus(rnminus11h+ v
nminus1h+ ) +
int tn
tnminus1
((e vh)minus a(rp vh)
)dt
int tn
tnminus1b(microminus zh qh)dt = 0
(3271)
Here we have used the Definition 3235 of the projection P loch which implies thatint tntnminus1〈rp vht〉dt = 0
and (rnp+ vn) = 0 Setting vh = r1h isin Uh into (3271) using the incompressibility constraint to writeint tntnminus1 b(r1h φminus φ1h) =
int tntnminus1 b(r1h φminus qh) we obtain
minus(12)rn1h+2L2(Ω) + (12)[rn1h]2L2(Ω) + (12)rnminus11h+2L2(Ω) + (ν4)
int tn
tnminus1r1h2H1(Ω)dt
le Cint tn
tnminus1
((1ν)e2L2(Ω) + (1ν)rp2H1(Ω) + φminus qh2L2(Ω)
)dt (3272)
Summing inequalities (3272) we obtain the estimate at partition points and at the L2[0 T H1(Ω)]using triangle inequality Once the estimate for rL2[0T H1(Ω)] is obtained the estimate atLinfin[0 T L2(Ω)] follows using the arguments of Theorem [32 Theorem 47] modified to handlethe backwards in time Stokes equationEstimates (3) and (4) We turn our attention to the last two estimates In order to obtain theimproved rate for the L2[0 T L2(Ω)] norm we employ a duality argument to derive a better boundfor the quantity e1h2L2[0T L2(Ω)] For this purpose we generalize the duality argument of theproof of [14 Section 3] or [30 Lemma 43] in order to handle arbitrary order schemes and thediscrete incompressibility constraint We define a backwards in time evolutionary problem withright hand side e1h isin L2[0 T L2(Ω)] and zero terminal data ie for n = 1 N and for allv isin L2[0 T H1(Ω)] capH1[0 T Hminus1(Ω)] we seek (z ψ) isinW (0 T )times L2[0 T L2
0(Ω)] such thatint T
0
(〈z vt〉+ a(v z) + b(v ψ)
)dt+ (φ(tnminus1) v(tnminus1)) =
int T
0(e1h v)dt
int T
0b(z q)dt = 0 forall q isin L2[0 T L2
0(Ω)](3273)
Note that since e1h isin Linfin[0 T W(Ω)] then Remark 228 implies that the following estimate hold
zL2[0T H2(Ω)] + ztL2[0T L2(Ω)] + ψL2[0T H1(Ω)] le Ce1hL2[0T L2(Ω)] (3274)
The lack of regularity of the right hand side of (3273) due to the presence of discontinuities impliesthat we can not improve regularity of z in [0 T ] The associated discontinuous time-stepping schemecan be defined as follows Given terminal data zNh+ = 0 we seek (zh ψh) isin Uh timesQh such that for allvh isin Pk[tnminus1 tn Yh] qh isin Pk[tnminus1 tnQh]
minus(znh+ vnh) +
int tn
tnminus1
((zh vht) + a(zh vh) + b(ψh vh)
)dt+ (znminus1
h+ vnminus1h+ ) =
int tn
tnminus1(e1h vh)dt
int tn
tnminus1b(zh qh)dt = 0
(3275)Hence using Lemma 3123 we obtain zhLinfin[0T H1(Ω)] le Cke1hL2[0T L2(Ω)] It is now clear thatwe have the following estimate for z minus zh which is a straightforward application of the previousestimates in L2[0 T H1(Ω)] the approximation properties of Lemma 3237 of projections P loch Qloch
206 3 Approximation and Numerical Analysis
(see for instance [32 Theorem 46])
νz minus zhL2[0T H1(Ω)] le C(h+ τ12
) (zL2[0T H2(Ω)] + ztL2[0T L2(Ω)] + ψL2[0T H1(Ω)]
)
le C(h+ τ12)e1hL2[0T L2(Ω)] (3276)
We note that the lack of regularity on the right hand side restricts the rate of convergence to therate given by the lowest order scheme l ge 1 k = 0 even if high order schemes (in time) are chosenSetting vh = e1h into (3275) and using the fact that
int tntnminus1 b(e1h ψh)dt = 0 we obtain
minus(znh+ en1h) +
int tn
tnminus1(zh e1ht) + a(e1h zh)dt+ (znminus1
h+ enminus11h+) =
int tn
tnminus1e1h2L2(Ω)dt
Integrating by parts in time we deduce
minus(znh+ en1h) + (znh en1h) +
int tn
tnminus1
(minus (zht e1h) + a(zh e1h)
)dt =
int tn
tnminus1e1h2L2(Ω)dt (3277)
Setting vh = zh into (3269) and using e = ep + e1h the definition of projection Qloch of Definition3236 and the fact that
int tntnminus1 b(zh pminus p1h)dt =
int tntnminus1 b(zh pminus qh)dt we obtain
(en1h znh ) +int tn
tnminus1
(minus (e1h zht) + a(e1h zh)
)dtminus (enminus1
1h znminus1h+ ) = minus
int tn
tnminus1
(a(ep zh) + b(zh pminus qh))dt
(3278)
Here we have also used the fact that the definition of projection Qloch of Definition 3236 impliesthat (enp znh ) = 0
int tntnminus1(ep vht)dt = 0 and (enminus1
p znminus1h+ ) = 0 Using (3277) to replace the first three
terms of (3278) we arrive to
(znh+ en1h)minus (enminus1
1h znminus1h+ ) +
int tn
tnminus1e1h2L2(Ω)dt = minus
int tn
tnminus1
(a(ep zh) + b(zh pminus qh))dt
= minusint tn
tnminus1
(a(ep zh minus z) + a(ep z) + b(zh minus z pminus qh)
)dt
= minusint tn
tnminus1
(a(ep zh minus z) + ν(ep∆z) + b(zh minus z pminus qh)
)dt
where at the last two equalities we have used integration by parts (in space) and the incompressibilityconstraint which implies that
int tntnminus1 b(z pminus qh)dt = 0 Therefore
int tn
tnminus1e1h2L2(Ω)dt+ (znh+ e
n1h)minus (enminus1
1h znminus1h+ ) le
int tn
tnminus1ν(zh minus zH1(Ω)epH1(Ω)dt
+int tn
tnminus1
(epL2(Ω)∆zL2(Ω) + z minus zhH1(Ω)pminus qhL2(Ω)
)dt
Then summing the above inequalities and using the fact that φN+ equiv 0 and e01hminus = 0 (by definition )
and rearranging terms we obtain
(12)e1h2L2[0T L2(Ω)] le C(νepL2[0T L2(Ω)]zL2[0T H2(Ω)]
+νzh minus zL2[0T H1(Ω)](epL2[0T H1(Ω)] + (1ν)pminus qhL2[0T L2(Ω)]
)
le C(νepL2[0T L2(Ω)]e1hL2[0T L2(Ω)]
+(1ν)(h+ τ12)e1hL2[0T L2(Ω)](epL2[0T H1(Ω)] + (1ν)pminus qhL2[0T L2(Ω)]
))
Here we have used the Cauchy-Schwarz inequality the stability bounds of dual equation (3274) ie
32 Error estimates 207
and the error estimates (3276) on zh minus z Finally the estimate onrL2[0T L2(Ω)] follows by using a similar duality argument
Remark 3240 The combination of the last two Theorems implies the ldquosymmetric regularity freerdquostructure of our estimate In particular suppose that the initial data y0 isinW(Ω) and the forcing termf isin L2[0 T Hminus1(Ω)] and we define the natural energy norm|(v1 v2)|WS(0T ) equiv v1WS(0T ) + v2WS(0T ) endowed by the weak formulation Then the es-timate under minimal regularity assumptions can be written as follows
|(e r)|WS(0T ) le C(|(ep rp)|WS(0T ) + pminus qhL2[0T L2(Ω)] + φminus qhL2[0T L2(Ω)])
The above estimate indicates that the error is as good as the approximation properties enablesit to be under the natural parabolic regularity assumptions and it can be viewed as the fully-discrete analogue of Ceacutearsquos Lemma Ceacutea see eg [34] Hence the rates of convergence for e rdepend only on the approximation and regularity results via the projection error ep as indicatedin Lemma 3237 and Remark 3238 For example if the Taylor-Hood element is being used andy isin L2[0 T V(Ω)] capH1[0 T Hminus1(Ω)] p isin L2[0 T L2
0(Ω)] then for τ le Ch2 we obtain that
1 epL2[0T H1(Ω)] le C pminus qhL2[0T L2(Ω)] le C
2 epL2[0T L2(Ω)] le ChyL2[0T H1(Ω)] + τ12ytL2[0T Hminus1(Ω)]
Therefore the above estimates and Theorem 3239 imply eL2[0T L2(Ω)] asymp O(h) for τ le Ch2Obviously the estimate of Theorem 3239 is applicable even in case more regular solutions Forexample for smooth solutions the Taylor-Hood element combined with the dG time-stepping schemeof order k will allow the following rates
1 epL2[0T H1(Ω)] le C(h2 + τk+1)
2 epL2[0T L2(Ω)] le C(h3 + τk+1)
Thus Theorem 3239 implies that for τ le Ch2
eL2[0T H1(Ω)] asymp O(h2 + τk+1)
rL2[0T H1(Ω)] asymp O(h2 + τk+1)
eL2[0T L2(Ω)] asymp O(h3 + τk+1)
rL2[0T L2(Ω)] asymp O(h3 + τk+1)
3242 Symmetric estimates for the optimality system
It remains to compare the discrete optimality system (3122)-(3123)-(3120) to the auxiliary system(3266)-(3267)
Lemma 3241 Let (yh ph) (microh φh) (wh p1h) (zh φ1h) isin Uh timesQh be the solutions the discreteoptimality system (3122)-(3123)-(3120) and of the auxiliary system (3266)-(3267) respectivelyDenote by e equiv y minuswh r equiv microminus zh and let e2h equiv wh minus yh r2h equiv zh minus microh Then there exists algebraicconstant C gt 0 such that
e2hL2[0T L2(Ω)] + (1α12)r2hL2[0T L2(Ω)] le C(1α12)rL2[0T L2(Ω)]
208 3 Approximation and Numerical Analysis
In addition the following estimates holds Then the following estimate holds
eN2h2L2(Ω) +Nminus1sum
i=0[ei2h]2L2(Ω) + ν
int T
0e2h2H1(Ω)dt le (Cα32)
int tn
tnminus1r2L2(Ω))dt
r02h+2L2(Ω) +
Nsum
i=1[ri2h]2L2(Ω) + ν
int T
0r2h2H1(Ω)dt le (Cα12)
int T
0r2L2(Ω)dt
where C is constant depending only upon Ω
Proof Subtracting (3123) from (3267) we obtain the equation For n = 1 N vh isin Pk[tnminus1 tnYh]qh isin Pk[tnminus1 tnQh]
minus(rn2h+ vn) + (rnminus1
2h+ vnminus1+ ) +
int tn
tnminus1
(〈r2h vht〉+ a(r2h vh) + b(vh φ1h minus φh)
)dt =
int tn
tnminus1(e2h vh)dt
int tn
tnminus1b(r2h qh)dt = 0
(3279)Subtracting (3122) from (3266) and using (2318)-(3120) we obtain For n = 1 N for allvh isin Pk[tnminus1 tnYh] qh isin Pk[tnminus1 tnQh]
(en2h vn) +int tn
tnminus1
(minus 〈e2h vht〉+ a(e2h vh) + b(vh p1h minus ph)
)dt
= (enminus12h vnminus1
+ ) +int tn
tnminus1minus(1α)(microminus microh vh)dt
int tn
tnminus1b(e2h qh)dt = 0
(3280)
We set vh = e2h into (3279) and note thatint tntnminus1 b(e2h φ1h minus φh)dt = 0 to obtain
minus(rn2h+ en2h) +
int tn
tnminus1
(〈r2h e2ht〉+ a(r2h e2h)
)dt+ (rnminus1
2h+ enminus12h+) =
int tn
tnminus1e2h2L2(Ω)dt (3281)
Setting vh = r2h into (3280) and notingint tntnminus1 b(r2h p1h minus ph)dt = 0 we deduce
(en2h rn2h) +int tn
tnminus1
(minus 〈e2h r2ht〉+ a(e2h r2h)
)dtminus (enminus1
2h rnminus12h+)
=int tn
tnminus1
(minus (1α)〈r r2h〉 minus (1α)r2h2L2(Ω)
)dt (3282)
Integrating by parts with respect to time in (3282) and subtracting the resulting equation from(3281) we arrive to
(rn2h+ en2h)minus (enminus1
2h rnminus12h+) +
int tn
tnminus1
(e2h2L2(Ω) + (1α)r2h2L2(Ω)
)dt = minus(1α)
int tn
tnminus1〈r r2h〉dt
(3283)
Using Youngrsquos inequality to bound the right hand side adding the resulting inequalities from 1 to N and noting that
sumNn=1
((rn2h+ e
n2h)minus (enminus1
2h rnminus12h+)
)= 0 (since e0
2h equiv 0 rN2h+ = 0) we obtain the firstestimate For the second estimate we simply set vh = e2h into (3280) and use the previous estimateon r2h Finally the third estimate easily follows by setting vh = r2h into (3279) the estimate one2hL2[0T L2(Ω)] and standard algebra
Various estimates can be derived using results of Theorem 3239 and Lemma 3241 and standard
32 Error estimates 209
approximation theory results We begin by stating an almost symmetric error estimates which canbe viewed as the analogue of the classical Ceacutearsquos Lemma
Theorem 3242 Let (yh ph) (microh φh) isin Uh timesQh and (y p) (micro φ) isinWS(0 T )times L2[0 T L20(Ω)]
denote the approximate solutions of the discrete and continuous optimality systems (3122)-(3123)-(3120) and (2316)-(2317)-(2318) respectively Let ep = y minusQloch y rp = microminus P loch micro denote theprojection error where P loch Qloch defined in Definition of 3235 and 3236 respectively Then thefollowing estimate holds for the error e = y minus yh and r = microminus microh
|(e r)|WS(0T ) le C(1α32)(|(ep rp)|WS(0T ) + pminus qhL2[0T L2(Ω)] + φminus qhL2[0T L2(Ω)])
where C depends upon constants of Theorem 3239 and Lemma 3241 1ν2 and is independent ofτ h α and qh isin Qh arbitrary
Proof First we observe that an estimate for e2hLinfin[0T L2(Ω)] and r2hLinfin[0T L2(Ω)] can be derivedidentical to [32 Theorem 46] since the (3278)-(3279) are uncoupled due to the estimate of Lemma3241 Therefore the estimate follows by using triangle inequality and previous estimates of Theorem3239 and Lemma 3241
An improved estimate for the L2[0 T L2(Ω)] norm for the state and adjoint follow by combining theestimates of Theorem 3239 and the first estimate of Lemma 3241
Theorem 3243 Suppose that y0 isinW(Ω) f isin L2[0 T Hminus1(Ω)] and the assumptions of Theorem3239 and Lemma 3241 hold Let ep = yminusQloch y rp = microminusP loch micro denote the projection error whereP loch Qloch defined in Definition of 3235 and 3236 respectively Then there exists a constant Cdepending upon Ω 1ν such that
eL2[0T L2(Ω)] le C(1α12)(epL2[0T L2(Ω)] + rpL2[0T L2(Ω)]
+τ12(epL2[0T H1(Ω)] + pminus qhL2[0T L2(Ω)])
+τ12(rpL2[0T H1(Ω)] + φminus qhL2[0T L2(Ω)]))
rL2[0T L2(Ω)] le C(epL2[0T L2(Ω)] + rpL2[0T L2(Ω)]
+τ12(epL2[0T H1(Ω)] + pminus qhL2[0T L2(Ω)])
+τ12(rpL2[0T H1(Ω)] + φminus qhL2[0T L2(Ω)]))
Proof The first estimate follows by using triangle inequality and previous estimates of Theorem3239 and Lemma 3241
We close this subsection by stating convergence rates in two cases for the Taylor-Hood elementdepending on the available regularity Obviously a variety of other estimates can be derived dependingon the chosen elements
Proposition 3244 Suppose that the assumptions of Theorem 3239 and Lemma 3241 hold1) Let y0 isin W(Ω) f isin L2[0 T Hminus1(Ω)] and there exists p isin L2[0 T L2
0(Ω)] such that the weakformulation (2320) is valid Assume that the Taylor-Hood element are being used to constructthe subspaces and piecewise constants polynomials k = 0 for the temporal discretization Then forτ le Ch2 we obtain
eL2[0T L2(Ω)] le Ch and rL2[0T L2(Ω)] le Ch
2) Let y micro isin L2[0 T H3(Ω) capV(Ω)] capHk+1[0 T H1(Ω)] p φ isin L2[0 T H2(Ω) cap L20(Ω) Suppose
that the Taylor-Hood element combined with piecewise polynomials of degree k for the temporal
210 3 Approximation and Numerical Analysis
discretization are being used then the following rates hold
(e r)W (0T ) le C(1α32)(h2 + τk+1)
eL2[0T L2(Ω)] le C(1α12)(h3 + τk+1 + τ12(h2 + τk+1)
)
rL2[0T L2(Ω)] le C(h3 + τk+1 + τ12(h2 + τk+1)
)
Proof The rates directly follow from Theorem 3239 Theorem 3243 Lemma 3237 and Remark3240
3243 Control Constraints The variational discretization approach
We demonstrate that the variational discretization approach of Hinze ([65]) can be used within ourframework In the variational discretization approach the control is not discretized explicitly andin particular we define Adad equiv Aad Thus our discrete optimal control problem now coincides toMinimize functional
Jh(yh(g) g) =int T
0yh(g)minus yd2L2(Ω)dt+ α
int T
0g2L2(Ω)dt
subject to (312) where yh(g) isin Uh denotes the solution of (312) with right hand side given controlg isin L2[0 T L2(Ω)] The optimal control (abusing the notation denoted again by gh) satisfies thefollowing first order optimality condition
Jprimeh(gh)(uminus gh) ge 0 for all u isin L2[0 T L2(Ω)]
where gh takes the form gh = Proj[gagb](minus 1α microh(gh)) similar to continuous case We note that the
gh is not in general a finite element function corresponding to our finite element mesh Thus itsalgorithmic construction requires extra care (see eg [65]) However in most cases the quantityof interest is the state variable and not the control For the second derivative we easily obtain anestimate independent of g gh and in particular
Jprimeprimeh (u)(u u) ge αu2L2[0T L2(Ω)] for all u isin L2[0 T L2(Ω)]
Theorem 3245 Let y0 isin W(Ω) f isin L2[0 T Hminus1(Ω)] and yd isin L2[0 T L2(Ω)] and the thereexists an associated pressure p isin L2[0 T L2
0(Ω)] Suppose that Adad equiv Aad and let g gh denote thesolutions of the corresponding continuous and discrete optimal control problems Then the followingestimate hold
g minus ghL2[0T L2(Ω)] le C(1α)micro(g)minus microh(g)L2[0T L2(Ω)]
le C(epL2[0T L2(Ω)] + rpL2[0T L2(Ω)]
+τ12(epL2[0T H1(Ω)] + pminus qhL2[0T L2(Ω)])+τ12(rpL2[0T H1(Ω)] + φminus qhL2[0T L2(Ω)])
where (microh(g) φh(g)) and (micro(g) φ) denote the solutions of (3119) and (2315) respectively andep equiv y(g) minus Qloch y(g) rp = micro(g) minus P loch micro(g) the corresponding projection errors Furthermore ifτ le Ch2
g minus ghL2[0T L2(Ω)] le Ch
Proof We note that Adad equiv Aad and hence the first order necessary conditions imply that
Jprimeh(gh)(g minus gh) ge 0 and J
prime(g)(g minus gh) le 0 (3284)
32 Error estimates 211
Therefore using the second order condition and the mean value theorem we obtain for any u isinL2[0 T L2(Ω)] (and hence for the one resulting from the mean value theorem) and inequalities(3284)
αg minus gh2L2[0T L2(Ω)] le Jprimeprimeh (u)(g minus gh g minus gh) = J
primeh(g)(g minus gh)minus J primeh(gh)(g minus gh)
le J primeh(g)(g minus gh)minus J prime(g)(g minus gh) =int T
0
int
Ω(micro(g)minus microh(g))(g minus gh)dxdt
le Cmicro(g)minus microh(g)L2[0T L2(Ω)]g minus ghL2[0T L2(Ω)]
which clearly implies the first estimate Now a rate of convergence can be obtained using similararguments to Theorem 3239 Indeed note that subtracting (3119) from (2315) and settingr = microh(g) minus micro(g) and e = yh(g) minus y(g) Using the estimates of Theorem 3239 and the rates ofProposition 3244 we obtain the desired estimate after noting the reduced regularity of e
After studying the convergence rates in the relevant norms for each of the studied problems in thefollowing chapters we describe the corresponding experimental results and verify the correspondingtheoretical results
4Robin Boundary Control
Experiment in Linear ParabolicPdes
This chapter presents the theoretical principles and the experimental results for a boundary controlproblem for linear parabolic partial differential equations with Robin boundary conditions
Contents41 Robin boundary conditions setting the model 214
411 Smooth initial data 214412 Nonsmooth initial data 219413 Experiment using linear polynomials in space and time 219
214 4 Robin Boundary Control Experiment in Linear Parabolic Pdes
41 Robin boundary conditions setting the model
According to the theory in previous chapters related to Robin boundary control problem we want tominimize the functional
J(y g) = 12
int T
0y minus yd2L2(Ω)dt+ α
2
int T
0g2L2(Γ)dt
with constraints
yt minus∆y = f in (0 T )times Ω
y + λminus1 party
partn = g in (0 T )times Γ (411)
y(0 x) = y0 in Ω
We consider numerical examples for the model problem in space Ωtimes I = Ωtimes [0 T ] = [0 1]2 times [0 01]in cases of
a) Smooth initial data for the state variable (with known analytical solution) using constant polyno-mials in time and linear polynomials in space
b) Discontinuous initial data y0 isin L2(Ω) - in this case we mention that we have not known analyticalsolution and we consider exact solution the solution to space - time mesh dt = 271267eminus 05h = 520833eminus 03 (3687 and 37249 degrees of freedom respectively) and
c) Smooth initial data for the state variable (with known analytical solution) using linear polynomialsin time and space
Note that the boundary control function does not have continuous first derivatives at certain points
We stabilize the regularization parameter of the functional with α = πminus4 The boundary optimalcontrol problem is solved with the software package FreeFem ++ see eg [64] using a gradientalgorithm to a 4 Six-Core AMD Opteron (tm) Processor 8431 96 GB RAM computer
411 Smooth initial data
Let a = minusradic
5 We choose force
f(t x1 x2) = π2eaπ2t(
2(x22 minus x2 + x2
1) cos(πx1x2) cos(πx1(x2 minus 1))
minus(2x22 minus 2x2 + 2x2
1 + a+ 1)sin(πx1x2) sin(πx1(x2 minus 1)))
initial data y0(x1 x2) = sin(π(1 + x1x2))sin(πx1(x2 minus 1)) with optimal pair (y g) and
y(t x1 x2) = exp(aπ2t)sin(π(1 + x1x2))sin(πx1(x2 minus 1))
while g has been calculated using the Robin boundary condition in each component of the square Γi
41 Robin boundary conditions setting the model 215
i = 1 4 (starting from the bottom) side of the boundary with
g(t x1 x2) = eπ2at
0 in Γ1
πx2 sin(πx2 minus π) + π(1minus x2) sin(πx2)cos(π (x2 minus 1)) in Γ2
0 in Γ3
0 in Γ4
For this data option and target function yd(t x1 x2) = 05 the corresponding errors for the statevariable and the control function for different meshes are shown in Table 41
Table 41 Rates of Convergence for the two-dimensional solution with k = 0 tau = h22 smooth initialdata and yd = 05
Descritization Errorsτ = h22 eL2[0T L2(Ω)] eL2[0T H1(Ω)] J(y g)
h = 02357022 0018310605 0070340370 0002395820h = 01178511 0004085497 0031958661 0001857961h = 00589255 0001335615 0016375314 0001738954h = 00294627 0000766443 0008819160 0001711876h = 00147313 0000676697 0005626214 0001705198
Rates 1526118558 0998546583 -
The convergence rates we can see above is according to the theory and equal to 15 for L2[0 T L2(Ω)]norm and 1 for L2[0 T H1(Ω)] norm (O(τ + h32) and O(τ + h) respectively in accordance withtheoretical results of Proposition 3213) In particular the convergence rate 15 for L2[0 T L2(Ω)]norm is the best we can get with these boundary data since from the projection definition is theL2[0 T L2(Γ)] norm that limits the size of the convergence rate on the boundary So instead of havingconvergence rate 2 as we have in the distributed control with zero Dirichlet boundary conditions theconvergence rate decreases in value 15
Similar results have been obtained for target functions 0 and 05 cos(πx1) cos(πx2) More specificallyobserving the results shown in Tables 41 42 43 for different target functions we can see almostthe same convergence rates for the state variable errors in spaces L2[0 T L2(Ω)] and L2[0 T H1(Ω)]and similar values for the functional
Table 42 Convergence rates for the 2d solution with k = 0 τ = h22 smooth initial data and yd = 0
Discretization Errorτ = h22 eL2[0T L2(Ω)] eL2[0T H1(Ω)] J(y g)
h = 02357022 0018437187 0070206813 0003505277h = 01178511 0004163875 0036356131 0002718328h = 00589255 0001477032 0017039099 0002520912h = 00294627 0000961147 0010077840 0002473947h = 00147313 0000883837 0007476681 0002462163
Rate 1420572191 0875175799 -
A 3d Figure 41 shows from a different view how the errors vary in spaces L2[0 T H1(Ω)] andL2[0 T L2(Ω)] as τ h change In particular starting with h = 02350722 and τ = 005555449we have relatively large errors for the L2[0 T H1(Ω)] norm error and enough smaller for theL2[0 T L2(Ω)] 0070 and 0018 respectively
As the experiment progresses the errors are reduced until they become 00056 and 000067 respectivelywhere at this point they begin to stabilize because of the very dense spatial and temporal discretization
216 4 Robin Boundary Control Experiment in Linear Parabolic Pdes
Table 43 Convergence rates for the 2d solution with k = 0 τ = h22 smooth initial data and yd =05 cos(πx1) cos(πx2)
Discretization Errorτ = h22 eL2[0T L2(Ω)] eL2[0T H1(Ω)] J(y g)
h = 02357022 0018033381 0070977749 0004957926h = 01178511 0003666894 0032317405 0004953116h = 00589255 0001015930 0016629768 0004905743h = 00294627 0000821597 0009086474 0004909695h = 00147313 0000879346 0005954120 0004907448
Rates 1485364815 0988524738 -
Figure 41 Errors for the state and control variable for τ = h22
and therefore the integration and rounding errors In the above graph it is clear also that the errorsfor the control function stabilized faster since the gradient algorithm ldquoworkrdquo more in the early stepsto have a desired control A 2d Figure 42 shows how g(t)L2(Ω) norm for the control functionvaries as time passes in τ h different meshes The left Figure of 43 shows how the distance from thetarget y(t)minus yd(t)L2(Ω) varies as time passes in different meshes and more particularly the moredense mesh we use the smaller distance from the target we get
Figure 42 Norm for the control function g(t)L2(Ω)
41 Robin boundary conditions setting the model 217
Figure 43 Distance from target y(t)minus yd(t)L2(Ω) a) Smooth data b) Nonsmooth data - disconti-nuity
Figure 44 Effects to the control g(t)L2(Ω) as regularization parameter α varies with fixed mesh48times 48
Effects to the functional as regularization parameter α changes Figure 44 shows that for smallvalues of α gradient method uses big control values and vise versa small control for big values for αWe also noted that itrsquos better to take 10minus1 lt α lt 10minus5
Distance between numerical solution and target function An important observation is that wedidnrsquot notice change in the progress of the distance of the numerical solution from the target for thedifferent values of alpha as shown in Figure 45
The algorithm for piecewise constant polynomials in time For the above results we used thefollowing code after we initialized n = 0 ε = 1 tolerance tol and initial control g0|Γ We note thateg yn is a sequence of piecewise linear polynomials in time (and every term of this sequence isanother sequence piecewise in space) in nth iteration of the gradient method
bull Step 0 (Initial state) For g|Γ = g0|Γ y = y0 solve the system
yt minus∆y = f
y|Γ + λminus1 party
partn = g|Γy(0 x) = y0
218 4 Robin Boundary Control Experiment in Linear Parabolic Pdes
Figure 45 Effects to the numerical solution and target function distance y(t) minus yd(t)L2(Ω) as αvaries
bull Step 1 (Conjugate equation) Solve for micro = micron
microt + ∆micro = y minus yd
micro|Γ + λminus1 partmicro
partn = 0
micro(T x) = 0
bull Step 2 (New descent direction) Choose as descent direction the negative gradient of the costfunctional
minusJ prime(g|Γ) = minus(αg|Γ + micro|Γ)
bull Step 3 (Checking step εn) Find optimal size of εn
J(gn|Γ + εn(αg|Γ + micro|Γ)
)= min
εgt0J(gn|Γ + ε(αg|Γ + micro|Γ)
)
bull Step 4 (New control function) Set
gn+1|Γ = gn|Γ + εn(αgn|Γ + micron|Γ)
bull Step 5 (New state) Check if Jn le Jnminus1 and set ε = 15ε If Jn ge Jnminus1 set ε = 05ε Go toStep 0 with g|Γ = gn+1|Γ for y = yn and n = n+ 1 Stop if |Jn minus Jnminus1|Jn le tol
Please note that for the solution of the state equation you need to write the basic equation in suitablediscontinuous in time Galerkin form Specifically the approximation functions are piecewise constantpolynomials in time so the method turns to the modified backward Euler (method dG0)
(I + dtA)yi+1 + yi+1|Γ = yi + gi+1|Γ +int ti+1
ti
fds
Similarly for the solution of the conjugate equation we need to write the backward in time equationin the form
(I + dtA)microi + microi|Γ = microi+1 +int ti+1
ti
(yi minus yd)ds
Where operator A corresponds to the Laplace operator
41 Robin boundary conditions setting the model 219
412 Nonsmooth initial data
This experiment has the same Ω T as in the first example eg Ω = [0 1] times [0 1] T = 01 Thedifference is that the initial data y0 is a discontinuous function defined by
y0 =sin(π(1 + x1x2))sin(πx1(x2 minus 1)) if x1 x2 ge 05
10 + sin(π(1 + x1x2))sin(πx1(x2 minus 1)) else
For this experiment the error results are shown in the Table 44 where the rate of O(h) when τ le Ch2for the L2[0 T L2(Ω)] norm is verified for the state and adjoint variable Comparing the convergencerate results and the expected convergence rate we see better rates because of the way of the ldquoexactsolutionrdquo construction Comparing also this example with the smooth data example we observe thatthe functional has bigger values and the error eg in h = 0014 is also larger The results give a little
Table 44 Convergence rates for the 2-d solution with k = 0 τ = h22 and nonsmooth initial data
Discretization Errorsτ = h22 eL2[0T L2(Ω)] rL2[0T L2(Ω)] J(y g)
h = 02357022 04093275092 0008552165422 09411555956h = 01178511 01555909764 0005056762072 08225865966h = 00589255 00714820269 0002440981965 07424795375h = 00294627 00302970740 0001179518135 07066657202h = 001473139 00100448501 0001097951813 06883517113
Rate 12520017243 0952697386266 -
bit better rate of convergence due to the constructive way of the state variable Obviously the errornorm L2[0 T H1(Ω)] doesnrsquot give a rate since the data y0 isin L2(Ω) and the initial discontinuity isdisseminated through characteristics in the whole exact solution Finally the right graph in Figure43 shows how the distance from target function reduces as time evolves and as we expected it ismore difficult the state variable to reach the target (under the control function effect)
413 Experiment using linear polynomials in space and time
To illustrate the potential applicability of higher order time stepping schemes we consider a coarsetime-stepping approach based on the k = 1 time stepping scheme Here we return to the Example 411with the known smooth solution y given by y(t x1 x2) = exp(aπ2t)sin(π(1 +x1x2))sin(πx1(x2minus 1))for k = 1 l = 1 Note that despite the fact that we have chosen smooth state variable the presence ofa Robin boundary control limits the regularity at least near by the boundary for the time derivativeof the adjoint and control variables However overall we expect that the parabolic regularity willappear as time progresses Our best approximation type estimates for ldquosmoothrdquo state adjoint andcontrol variables yield a convergence rate with respect to L2[0 T H1(Ω)] norm of order O(τ2 + h)when piecewise linears are considered for both time and space ie k = 1 l = 1
In the following experiments we present the rate based on a coarse time stepping approach Inparticular for τ = h12 and τ = h34 which corresponds to very few time steps compared to thestandard approaches the Tables 45 46 clearly indicate that we still obtain a rate of almost O(h)Of course it is expected that the rate is suboptimal due to the lack of smoothness near the boundaryPlease note that for the solution of the state equation you need to write the state equation in suitable
220 4 Robin Boundary Control Experiment in Linear Parabolic Pdes
Table 45 Convergence rates for the 2-d solution with k = 1 l = 1 τ = O(h34) smooth initial data andyd = 0
Discretization Errorτ = h3416 eL2[0T L2(Ω)] eL2[0T H1(Ω)] J(y g)h = 02357022 0007064919 0071348872 0002392313h = 01178511 0002639725 0031653985 0002355530h = 00589255 0001462584 0017397858 0002305098h = 00294627 0000873854 0009497292 0002258746h = 00147313 0000566631 0005500319 0002230101h = 00073656 0000410072 0003614028 0002214837
Rate 0910047586 0924325857 -
Table 46 Convergence rates for the 2-d solution with k = 1 l = 1 τ = O(h12) smooth initial data andyd = 0
Discretization Errorτ = h1216 eL2[0T L2(Ω)] eL2[0T H1(Ω)] J(y g)h = 02357022 0008385394 0068070558 0002676642h = 01178511 0004769310 0040332082 0002579619h = 00589255 0002736129 0019010050 0002468955h = 00294627 0001954915 0012117836 0002384007h = 00147313 0001398719 0008222888 0002322462h = 00073656 0001003904 0005980212 0002276926
Rate 0645943041 0762328463 -
discontinuous in time Galerkin form dG1 Specifically the approximation functions are piecewiselinear polynomials in time and space so the method turns to
(ynminus1h+ vnminus1
h+ ) +int tn
tnminus1
(minus 〈yht vh〉+ a(yh vh) + λ〈yh vh〉Γ
)dt
= (ynminus1h vnminus1
h+ ) +int tn
tnminus1
(〈f vh〉+ λ〈g vh〉Γ
)dtforallvh isin Pk[tnminus1 tnUh] 1 le n le N
y0 = y0
So if k = 1 eg linear polynomial in time t we can write yh(t) = Y n0 + Y n1 (tminus tnminus1)τ in (tnminus1 tn]with τ = tnminus tnminus1 and for test function vh = τminusl(sminus tnminus1)l for l = 0 1 after integration and denotingY n0 = Y0 Y n1 = Y1 we take the appropriate system (see the following algorithm) with yi = Y0 + Y1Similarly for the solution of the conjugate equation we need to write the backward in time equationwith microi = M0 +M1
The algorithm for piecewise linear polynomial in time Working similarly with the previousalgorithm for the above results we used the following code after initializing n = 0 ε = 1 tolerancetol and the control function g0|Γ We note that eg yn is a sequence of piecewise linear polynomialsin time (and every term of this sequence is another sequence piecewise in space) in nth iteration ofthe gradient method
41 Robin boundary conditions setting the model 221
bull Step 0 (Initial state) For g|Γ = g0|Γ solve the system y = y0
(I + dtA)Y0 + (I + 12dtA)Y1 + (Y0 + 1
2Y1)|Γ = gi+1|Γ + yi +int ti+1
ti
fds
12dtAY0 + (1
2I + 13dtA)Y1 + (1
2Y0 + 13Y1)|Γ = 1
2gi+1|Γ + 1dt
int ti+1
ti
(sminus ti)fds
with y = Y0 + Y1
bull Step 1 (Conjugate equation) Solve for micro = micron
(I + dtA)M0 + (I + 12dtA)M1 + (M0 + 1
2M1)|Γ = microi +int ti+1
ti
(yi minus yd)ds
12dtAM0 + (1
2I + 13dtA)M1 + (1
2M0 + 13M1)|Γ = 1
dt
int ti+1
ti
(yi minus yd)(sminus ti)ds
with micro = M0 +M1
bull Step 2 (New descent direction) Choose as descent direction the negative gradient of the costfunctional
minusJ prime(g|Γ) = minus(αg|Γ + micro|Γ)
bull Step 3 (Checking step εn) Find optimal size of εn
J(gn|Γ + εn(αg|Γ + micro|Γ)
)= min
εgt0J(gn|Γ + ε(αg|Γ + micro|Γ)
)
bull Step 4 (New control) Set
gn+1|Γ = gn|Γ + εn(αgn|Γ + micron|Γ)
bull Step 5 (New state) Check if Jn le Jnminus1 and set ε = 15ε If Jn ge Jnminus1 set ε = 05ε Go toStep 0 with g|Γ = gn+1|Γ for y = yn and n = n+ 1 Stop if |Jn minus Jnminus1|Jn le tol
Remark 411 This gradient method is based on the steepest-descentprojected gradient methodIts convergence is slow but it is easy to implement and so suitable for numerical exams Alsobecause evolutionary problems require great computational effort because of the time change gradientmethods are very useful alternatives methods with them with higher convergence order requiring lesscomputational resources The projection step εn is necessary since the term gi
n + εn(γigi + microi) itmay not be advisable In particular the reduced negative slope is used as search direction and thenwe calculate the step in this direction The step εn is derived from a suitable linear search strategy(line search strategy) A typical gradient method has good prospect to lead to the solution in the firstiterations while decreasing their effectiveness in subsequent iterations However in the next section(distributed control case in a semilinear parabolic problem) we will improve the code by using StrongWolfe-Powel conditions and instead of negative derivative directions we will use the Fletcher-Reevesdirection
Remark 412 In Figures 46 47 we present some instances for the state and conjugate variable
Remark 413 It is reasonable to compare these results to that with smooth data in case of k = 0and k = 1 Specifically let us compare for example the results of Tables 43 and 45 We note thatalthough the convergence order is much smaller for the case k = 1 errors eg for h = 0014 althoughremain the same for the L2[0 T H1(Ω)] and approximately equal to 0005 they are smaller for theL2[0 T L2(Ω)] norm and equal to 0008 for k = 0 and 0005 for k = 1 ie we have better resultsIt is also noteworthy that in the case k = 1 due to coarse - time stepping although we use the samePC memory we can continue to more dense partitioning This is possible since we have used less
222 4 Robin Boundary Control Experiment in Linear Parabolic Pdes
Figure 46 Instance of the state variable
Figure 47 Instance of the conjugate variable
41 Robin boundary conditions setting the model 223
data storage memory size since time points is much less and it plays a crucial role in computermemory allocation So we can continue into more dense partitioning which allows us to take evenbetter results for the error norm L2[0 T H1(Ω)] from 0005 for k = 0 to 00036 for k = 1 and forthe L2[0 T L2(Ω)] norm from 0008 if k = 0 to 00004 if k = 1 Finally note that for the minimizedfunctional J from 00049 (in the case of k = 0) we achieve much lower value of the functional in thecase k = 1 and equal to 00022
Next we report that the degrees of freedom in the case of coarse time stepping example k = 1τ = O(h34) (see Table 45) for every variable of the 5 system variables - 2 for the state 2 for theconjugate problem and 1 for the control is
bull for the spatial part the degrees of freedom we use successively in each mesh are 49 169 6252401 9409 37249 (148225)
bull for the time part the degrees of freedom we use successively in each mesh are 5 8 14 23 3864 (108)
while in the case of k = 0 τ = O(h2) for every variable of the 3 system variables
bull for the spatial part the degrees of freedom we use successively in each mesh are 49 169 6252401 9409 (37249)
bull for the time part the degrees of freedom we use successively in each mesh are 4 15 58 231922 (3687)
5Distributed Control Experiment
In Semilinear Parabolic PdesThis chapter presents the basic concepts and the numerical results for a semilinear parabolic equationwith distributed control and zero Dirichlet boundary
Contents51 Distributed control - Description of the model 226
511 Constant polynomials in time and linear in space 226512 Strong Wolfe-Powel conditions 227
226 5 Distributed Control Experiment In Semilinear Parabolic Pdes
51 Distributed control - Description of the model
We described in previous chapters the theory for semilinear problems with distributed control Nowwe will verify numerically the posteriori error estimates for k = 0 l = 1 in the cases of τ = h2 andτ = h for the error control state and conjugate variable and we will introduce the strong Wolfe-Powelconditions
We construct the following numerical example for the model problem with known exact solution inΩtimes (0 T ) = (0 1)2 times (0 01) and homogenous Dirichlet boundary condition similar with this in thework [94] Specifically we minimize the functional
J(y g) = 12
int T
0y minus yd2L2(Ω)dt+ α
2
int T
0g2L2(Ω)dt
subject toyt minus ∆y + (13)y3 = f + g in (0 T )times Ω
y = 0 on (0 T )times Γy(0 x) = y0 in Ω
We choose regularization parameter α = πminus4 force
f(t x1 x2) = minusπ4eminusradic
5π2T sin(πx1)sin(πx2) + 13( minus1
2minusradic
5π2eminus
radic5π2tsin(πx1)sin(πx2))3
target function
yd(t x1 x2) =(
2π2eminusradic
5π2T minus π4
(2minusradic
5)2
(eminusradic
5π2tsin(πx1)sin(πx2))2
(eminusradic
5π2t minus eminusradic
5π2T))
sin(πx1)sin(πx2)
and initial data y0(x1 x2) = minus12minusradic
5π2sin(πx1)sin(πx2) with a way that the optimal solution (y micro g)
to bey(t x1 x2) = minus1
2minusradic
5π2eminus
radic5π2tsin(πx1)sin(πx2)
micro(t x1 x2) = (eminusradic
5π2t minus eminusradic
5π2T )sin(πx1)sin(πx2)
g(t x1 x2) = minusπ4(eminusradic
5π2t minus eminusradic
5π2T )sin(πx1)sin(πx2)
511 Constant polynomials in time and linear in space
We used the following code after initializing n = 0 ε = 1 tolerance tol and control g0|Γ We notethat eg yn is a sequence of piecewise linear polynomials in time (and every term of this sequence isanother sequence piecewise in space) in nth iteration of the gradient method
bull Step 0 (Initial state) For g = g0 solve y = y0
yt minus∆y + 13y
3 = g + f
yΓ = 0y(0 x) = y0
51 Distributed control - Description of the model 227
bull Step 1 (Conjugate equation) Find micro = micron
microt + ∆micro+ y2micro = y minus ydmicroΓ = 0micro(T x) = 0
bull Step 2 (New descent direction) Choose as descent direction the negative gradient of the costfunctional
minusJ prime(g) = minus(αg + micro)
bull Step 3 (Checking step εn) Find optimal size of εn
J(gn + εn(αg + micro)
)= min
εgt0J(gn + ε(αg + micro)
)
bull Step 4 (New control function) Set
gn+1 = gn + εn(αgn + micron)
bull Step 5 (New state) Check if Jn le Jnminus1 then set ε = 15ε If Jn ge Jnminus1 set ε = 05ε Go toStep 0 with g = gn+1| for y = yn and n = n+ 1 Stop if |Jn minus Jnminus1|Jn le tol
Please note similarly with the previous chapter that for the solution of the state equation we need towrite the basic equation in suitable discontinuous in time Galerkin form
(I + dtA)yi+1 + 13yi+1
3 = yi +int ti+1
ti
(f + g)ds
and for the solution of the conjugate equation we need to write the backward in time equation in theform
(I + dtA)microi + y2i microi = microi+1 +
int ti+1
ti
(yi minus yd)ds
The semilinear term was handled with linerization and with fixed point method too and we sawsimilar results
Table 51 Convergence Rates for the 2-d solution in the case of k = 0 l = 1 (h = τ)
Discretization Errorh = τ eL2[0T H1
0 (Ω)] rL2[0T H10 (Ω)] g minus ghL2[0T L2(Ω)]
h = 002946280 3631050 005551130 002498330h = 001473140 1508560 002618430 001082740h = 000736570 0772711 001454260 000561528h = 000368285 0391391 000758848 000281426
Rate 1071233 095696566 105004366
512 Strong Wolfe-Powel conditions
As in previous chapter we use an algorithm based on steepest - descent projected gradient method The projection step εn is necessary since the direction term it might not be advisable
228 5 Distributed Control Experiment In Semilinear Parabolic Pdes
Table 52 Convergence Rates for the 2-d solution in the case of k = 0 l = 1 (h2 = τ)
Discretization Errorh2 = τ eL2[0T H1
0 (Ω)] rL2[0T H10 (Ω)] g minus ghL2[0T L2(Ω)]
h = 01178510 2254550 004141390 007661170h = 00589256 1003230 001943350 002208320h = 00294628 0470049 000914215 000546600h = 00147314 0229416 000445367 000135706
Rate 1051790 106430666 189617666
We used the Fletcher-Reeves conjugate direction as search direction and then we computed the stepfor this direction The step εn derived from a suitable linear search (line search strategy) Notethat the experiments in this paragraph (see Table 53) and specifically when k = 0 although we
Table 53 Convergence rate for the 2-d problem with k = 0 l = 1 (h2 = τ)
Discretization Errorh2 = τ eL2[0T H1
0 (Ω)] rL2[0T H10 (Ω)] g minus ghL2[0T L2(Ω)]
h = 01178510 2195070 00411142 0348617h = 00589256 0989756 00192208 0098052h = 00294628 0467749 00091017 0027175h = 00147314 0229123 00044466 0008308
Rate 1086690 10695966 1796943
wasted more computational resources in memory we were able to reduce significantly the number ofiterations of the double iteration loop of the gradient method from an average of 31 iterations to23 (keeping almost the same convergence classes and similar effects) using the strong Wolfe - Powelconditions
1 J(yk+1 gk+1) le J(yk gk) + σεkJprimeTkdk (Armijo rule)
2 |J primek+1dk| le minusρJ primekdkwith 0 lt ρ le σ lt 1 and dk+1 = minusJ primek+1 + βk+1dk d0 = minusJ primek and choosing the Fletcher-Reevesconjugate directions βk = JprimeTk Jprimek
Jprimekminus12
6Experiment for Stokes Equations
with Distributed controlThis chapter presents the basic concepts and the related test results for a distributed control problemin evolutionary Stokes equations with zero Dirichlet boundary conditions
Contents61 Distributed control in Stokes - description of the model 230
611 Smooth data 2316111 Time k = 0 and TaylorHood space discretization 2316112 Time k = 1 and TaylorHood space discretization 231
612 Rough initial data (discontinuity of y0 yd g) 2336121 Discretization without control constraints 2336122 Discretization with control constraints 234
230 6 Experiment for Stokes Equations with Distributed control
61 Distributed control in Stokes - description of the model
In this paragraph we examine the mathematical model and the theoretical rates of convergence whichexamined in previous chapters related to evolutionary Stokes with distributed control
The examples are based on [60 Section 3] The pressure and the velocity need to discretized insuitable finite element spaces with the necessary inf-sup conditions Such spaces include eg TaylorHood P2P1 elements for the space approximation of velocitypressure For the time approximationwe will use dG time stepping schemes k = 0 k = 1 eg piecewise constants and piecewise linearsrespectively Our example focus on the unconstrained and constrained control case where a classicalboot-strap argument implies smooth solutions for the state and adjoint variables for smooth and nonsmooth data
We consider numerical tests in the case k = 0 and some examples for the more difficult to computebut with better rates of convergence case of k = 1 for the model problem Our space is Ωtimes [0 T ] =[0 2]2 times [0 01] choosing y|Γ = 0 with known exact solution
y = (y1 y2) = ((cos(2kx)minus 1) sin(2my) sin(2mx)(1minus cos(2ky)))eminusνt2
p = eminusνt((sin(kx)2 sin(my)2)k2 + (cos(2kx)minus 1)2 sin(2my)2
+ sin(2mx)2(1minus cos(2ky))2)2g = (g1 g2)
where
g1 = ((((kν sin(kx)2 minus kν cos(kx)2 + kν) cos(my) sin(my) + ((minus8km2 minus 8k3) sin(kx)2
+(8km2 + 8k3) cos(kx)2 minus 8km2) cos(my) sin(my)))keminusνt2g2 = (((k2ν sin(2mx) cos(2ky)minus k2ν sin(2mx)) + (minus8k2m2 minus 8k4) sin(2mx) cos(2ky)
+8k2m2 sin(2mx)))(2k2))eminusνt2
initial velocity y0 = ((cos(2kx) minus 1) sin(2my) sin(2mx)(1 minus cos(2ky))) and target function yd =(yd1 yd2) = (05 05)
The force term f = (f1 f2) can easily computed from the state equation if we substitute the aboveexact solution to the equation and particularly
f1 = (((cos(kx) sin(kx) sin(my)2 + (16k2 cos(kx) sin(kx)3 + (16k2 cos(kx)minus16k2 cos(kx)3) sin(kx)) cos(my)2 sin(my)2 + ((16km cos(mx) sin(mx)3
minus16km cos(mx)3 sin(mx)) cos(ky)2 minus 8km cos(mx) sin(mx)3
+8km cos(mx)3 sin(mx)) sin(ky)2 + (8km cos(mx) sin(mx)3
minus8km cos(mx)3 sin(mx)) cos(ky)2 minus 8km cos(mx) sin(mx)3
+8km cos(mx)3 sin(mx)))k)eminusνtf2 = (((2m sin(kx)2 cos(my) sin(my) + (minus4k2m sin(2kx)2 minus 8k2m cos(2kx)
+8k2m) cos(2my) sin(2my) + (4k3 sin(2mx)2 minus 4k3 sin(2mx)2 cos(2ky)) sin(2ky)))(2k2))eminusνt
For the velocity we expect O(h3 + τk+1) and O(h2 + τk+1) rates of convergence in L2[0 T L2(Ω)]and L2[0 T H1(Ω)] norms respectively
We choose constant regularisation parameter in the functional α = 10minus4 and the free parameterssimilar to [32] ν = 1 k = π m = π and λ = 1 The optimal control problem is solved with the
61 Distributed control in Stokes - description of the model 231
finite elements software package FreeFem++ see eg [64] using a gradient algorithm for the controlfunction
611 Smooth data
In this section we study the case of smooth initial data and we know the (exact) optimal solutionWe choose a larger step h = 047 comparing to the previous examples because of the bigger Ω (squarewith edge 2) so it is allowed to take such big step In the end of this chapter we will show the relateddegrees of freedom
All the examples present the expected -due to theory- rates of convergence In general it is difficultto solve numerically the system and specially for k = 1 where we have a system of 4 equations egonly for the velocity vector (similar to each other variable)
6111 Time k = 0 and TaylorHood space discretization
Example 1 (k = 0 for τ = h28) Let τ = h28 We expect
eL2[0T L2(Ω)] = O(h2) and eL2[0T H1(Ω)] = O(h2)
For this mesh choise the related errors are in Table 61
Table 61 Convergence rates with k = 0 and τ = h28
Discretization Errorsτ = h28 eL2[0T L2(Ω)] eL2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]
h = 04714050 0110215 181853 533150h = 02357022 0011512 043118 063211h = 01178511 0002031 011109 011369h = 00589255 0001255 002922 007081
Rate 2152143 198600 207596
6112 Time k = 1 and TaylorHood space discretization
Example 2 (k = 1 for τ = h16) Let τ = h16 We expect
eL2[0T L2(Ω)] = O(h2) eL2[0T H1(Ω)] = O(h2)
For this mesh choise the related errors are in Table 62 We emphasize that the coarse time steppingτ asymp h still gives the expected theoretical rates which highlights the implicit nature of dG timestepping schemes Here we also note that the penalty parameter satisfies α ltlt h in all mesh-sizechoices
232 6 Experiment for Stokes Equations with Distributed control
Table 62 Convergence rates with k = 1 and τ = h16
Discretization Errorsτ = h16 eL2[0T L2(Ω)] eL2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]
h = 04714050 0108866 2315120 5470750h = 02357022 0010535 0453111 0607322h = 01178511 0001838 0113375 0083115h = 00589255 0000832 0028927 0020270
Rate 2343953 2107000 2686666
Example 3 (k = 1 for τ = h3210) Let τ = h3210 We expect
eL2[0T L2(Ω)] = O(h3) eL2[0T H1(Ω)] = O(h2)
For this mesh choise the errors are in Table 63 Here we take the errors in L2[0 T L2(Ω)] normwith an almost coarse choice of time-stepping
Table 63 Convergence rates with k = 1 and τ = h3210
Discretization Errorτ = h3210 eL2[0T L2(Ω)] eL2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]h = 04714050 01138780 2420150 5718610h = 02357022 00104282 0455479 0610602h = 01178511 00014891 0112681 0082763h = 00589255 00004965 0028212 0020051
Rate 26137833 2140366 2718333
Example 4 (k = 1 and τ = h28) Let τ = h28 We expect
eL2[0T L2(Ω)] = O(h3) eL2[0T H1(Ω)] = O(h2)
For this mesh choice we take the results as shown in Table 64
Table 64 Convergence rate with k = 1 and τ = h28
Discretization Errorτ = h28 eL2[0T L2(Ω)] eL2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]
h = 04714050 0105817 2251280 5320290h = 02357022 0010357 0461360 0618637h = 01178511 0001298 0112730 0082865h = 00589255 0000355 0028156 0020091
Rate 2739333 2106666 2671000
Remark 611 We can notice that comparing the cases of k = 0 and k = 1 see eg Tables 61 64we have almost the same errors in L2[0 T H1(Ω)] norm and almost equal with 002922 for k = 0 and0028156 for k = 1 We also see smaller errors for the L2[0 T L2(Ω)] norm equal to 0001 if k = 0to 00003 for k = 1 The minimizing functional is better minimized when k = 1 and particularly hasvalue 007 if k = 0 while if k = 1 it is 002
61 Distributed control in Stokes - description of the model 233
612 Rough initial data (discontinuity of y0 yd g)
Finally we close this section by presenting a computational example with rough (discontinuous) data y0yd and unknown true solution Once again the model problem is posed in Ωtimes [0 T ] = [0 2]2times [0 01]Here the obvious choice for the discretization in time is piecewise constants (in time) k = 0 combinedwith the standard TaylorHood element in space
We consider as solution the solution computed in the most advanced partitioned grid of the square(namely 96 times 96) comparing it with our computations in each one of the previous meshes usinginterpolation between different Uhrsquos
6121 Discretization without control constraints
We apply discontinuity on initial data and on target function yd too
Example 5 (k = 0 for τ = h28 and discontinuity) The predicted convergence rates in this exampleis
eL2[0T L2(Ω)] = O(h) rL2[0T L2(Ω)] = O(h)
We have force f = (f1 f2) like before but with discontinuity on target function control and statevariable y and on conjugate micro as below
yd(x1 x2) = (yd1(x1 x2) yd2(x1 x2))
whereyd1(x1 x2) = yd2(x1 x2) =
05 + 6 y ge 05 and x ge 05
05 y lt 05 and x lt 05
y0(x1 x2) = (y01(x1 x2) y02(x1 x2))
andy01(x1 x2) =
6 + (cos(2kx)minus 1)sin(2my) y ge 05 and x ge 05
(cos(2kx)minus 1)sin(2my) y lt 05 and x lt 05
y02(x1 x2) =
6 + sin(2mx)(1minus cos(2ky)) y ge 05 and x ge 05sin(2mx)(1minus cos(2ky)) y lt 05 and x lt 05
In order to start the gradient algorithm method we used initial control
g0(x1 x2) = (g01(x1 x2) g02(x1 x2))
with
g01(x1 x2) =
6 + ((((kνsin(kx)2 minus kνcos(kx)2 + kν)cos(my)sin(my)minus((8km2 + 8k3)sin(kx)2 + (8km2 + 8k3)cos(kx)2 minus 8km2)cos(my)sin(my)))k)
for y ge 05 and x ge 05((((kνsin(kx)2 minus kνcos(kx)2 + kν)cos(my)sin(my)minus((8km2 + 8k3)sin(kx)2 + (8km2 + 8k3)cos(kx)2 minus 8km2)cos(my)sin(my)))k)
for y lt 05 and x lt 05
234 6 Experiment for Stokes Equations with Distributed control
g02(x1 x2) =
6 + ((((k2νsin(2mx)cos(2ky)minus k2νsin(2mx)) + (minus8k2m2
minus8k4)sin(2mx)cos(2ky) + 8k2m2sin(2mx))(2k2))y ge 05 and x ge 05
((((k2νsin(2mx)cos(2ky)minus k2νsin(2mx)) + (minus8k2m2
minus8k4)sin(2mx)cos(2ky) + 8k2m2sin(2mx))(2k2))y lt 05 and x lt 05
Table 65 Convergence rates with k = 0 and τ = h28 with discontinuity on initial data and on targetfunction too
Discretization Errorτ = h28 eL2[0T L2(Ω)] rL2[0T L2(Ω)] J(yg)
h = 04714050 0126828 00079597 1480282h = 0235702 0036255 00015081 9742095h = 0117851 0014052 00004364 9608375h = 0058925 0004472 00000703 9619787h = 0029462 - - 9612306
Rate 1608596 22742714 -
6122 Discretization with control constraints
In this subsection we study the case of rough initial data and rough target function and the exactsolution is unknown In Examples 6 7 we also examine the case of control constraints into two casesrelaxed constraints minus85 le gi le 85 and more restricted constraints minus05 le gi le 05 In both cases weapply discontinuity on data and on target yd as before
Example 6 (k = 0 and τ = h28 with discontinuity and relaxed control constraints) The predictedconvergence rates from the theory are
eL2[0T L2(Ω)] = O(h) rL2[0T L2(Ω)] = O(h)
We choose f = (f1 f2) like Example 5 with discontinuity on target control state y and conjugatevariable micro (the results are in Table 66)
For the gradient algorithm starting we used control
g0(x1 x2) = (g01(x1 x2) g02(x1 x2)) = (0 0)
Example 7 (k = 0 for τ = h28 and discontinuity and strict control constraints) We also expectconvergence rates
eL2[0T L2(Ω)] = O(h) rL2[0T L2(Ω)] = O(h)
We choose f = (f1 f2) like before applying discontinuity on control state y but not on target function(the results are in Table 67)
We started the gradient method using initial control
g0(x1 x2) = (g01(x1 x2) g02(x1 x2)) = (6 6)
61 Distributed control in Stokes - description of the model 235
Table 66 Convergence rates with k = 0 and τ = h28 with discontinuity on initial data and on targetfunction and weak control constraints
Discretization Errorτ = h28 eL2[0T L2(Ω)] J(yg)
h = 0471405 0125484 1435750h = 0235702 0038590 9417572h = 0117851 0014412 9289013h = 0058925 0004503 9299375h = 0029462 - 9291695
Rate 1600097 -
Table 67 Convergence rate with k = 0 and τ = h28 and discontinuity on initial data and strict controlconstraints
Discretization Errorτ = h28 eL2[0T L2(Ω)] J(yg)
h = 0471405 0125664 2265422h = 0235702 0038621 1478615h = 0117851 0014417 1455425h = 0058925 0004504 1455310h = 0029462 - 1453629
Rate 1600733 -
Remark 612 Concerning the examples with unconstrained controls and the examples with strictcontrol constraints for rough initial data as we can see in Tables 65 and 67 we notice similar valuesfor the L2[0 T L2(Ω)] error norm and the same convergence rate as it was predicted from the theorywhile the minimizing functional has bigger values in the case of strict control constraints
Remark 613 About Figures 61 62 we can see some snapshots of the state variable for examplewith smooth data in two different meshes We note that on the bases of the Figures are shown therespective velocity vectors while the three-dimensional imaging above the basis of figure represents thepressure About Figures 63 64 65 we can see some snapshots of the state variable for the examplewith rough data for the state and adjoint variable at the beginning as the algorithm starts and aftersome time while the state variable is close to the target
Remark 614 We mention that the degrees of freedom of the above examples for each partitiondeveloped as follows
bull If τ = O(h2)8 is [Uhndof Phndof T imendof)] = [169 49 72] [625 169 288] [2401 625 1152][9409 2401 4608] ([37249 9409 18432]) for each mesh
bull If τ = O(h)16 is [Uhndof Phndof T imendof)] = [169 49 68] [625 169 136] [2401 625 272][9409 2401 544] ([37249 9409 1087])
bull If τ = O(h32)10 is [Uhndof Phndof T imendof)] = [169 49 43] [625 169 85] [2401 625 170][9409 2401 340] ([37249 9409 679])
we also note thato if k = 0 we have to solve the system and find 8 variables - 3 for the state 3 forthe adjoint and 2 for the control while for k = 1 we have to solve the system and find 14 variables -6 for the state 6 for the adjoint and 2 for the control We recall that each variable is sequence ofpolynomials in space (values at each grid point)
236 6 Experiment for Stokes Equations with Distributed control
Figure 61 State variable snapshot on mesh 12x12 and smooth initial data
Figure 62 State variable snapshot on mesh 24x24 and smooth initial data
61 Distributed control in Stokes - description of the model 237
Figure 63 State variable snapshot for rough initial data as the algorithm starts
Figure 64 State variable snapshot for rough initial data as the algorithm finishes
238 6 Experiment for Stokes Equations with Distributed control
Figure 65 Conjugate variable snapshot for rough initial data
Remark 615 Finally we recall that in the last examples (nonsmooth case) we considered as solutionthe solution in advanced grid and the degrees of freedom in that grid is the numbers enclosed inparentheses as the above remark indicates
7An Application In Biology
Experiment With DistributedControl in Semilinear Parabolic
Systems Of PdesIn this chapter we present the basic theoretical concepts and the experimental results for a distributedcontrol problem with zero Dirichlet boundary condition for a FitzHugh-Nagumo system (parabolicequations)
Contents71 Distributed control subject to FitzHugh-Nagumo systems 240
711 Introduction - Related results 240712 Description of the model 241713 Weak form 241714 The full discretized system 242715 Numerical Experiments 243
2407 An Application In Biology Experiment With Distributed Control in Semilinear
Parabolic Systems Of Pdes
71 Distributed control subject to FitzHugh-Nagumo systems
711 Introduction - Related results
The optimal control theory has a lot of useful applications in many scientific fields such as biologymedicine engineering and sociology Here we present an application related to biology that shows ushow important and directly applicable is the optimal control theory to real problems
One of the most important discoveries of the 20th century in biophysics is the understanding ofthe way that nerves carry information The basic invention is related to transportation of sodiumand potassium ions (also sodium and calcium) along the outer membrane of a cell of the nerve toelectrical signals which may propagate along the membrane after appropriate stimulation The AlanHodqkin and Andrew Huxley (working early in 1950) described the theory of ion transport theycreated a mathematical model and interpreted the experimental data for electrical signals stimulatedin squid giant axons and they were awarded the Nobel Prize in Physiology or Medicine in 1963 Theoriginal Hodgkin-Huxley model consists of a system with four odes Simplifications of the basic modelmodifications adaptable to other excitable media (eg muscle cells) and spatial dependence on spacehave been studied extensively
One of the most significant simplifications of the Hodgkin-Huxley model presented by RichardFitzhugh from the side of the mathematical and numerical analysis An electrical circuit for thismodel built by Jin-Ichi Nagumo This model of two states which is still used extensively describesthe qualitative electrical behavior of stimulated nerve cells We will study this model However weare far from fully understanding the biological excitable media Many modern studies are focusing onion transport Live membranes containing various ion channels (along the membrane) and is selectivein specific ions The transfers and switches that open and close ion channels are fundamental tothe functioning of many biological processes Also nerve cell networks and other excitable mediaare ubiquitous in biology The study of such networks can lead to understand how the brain worksMathematics are playing an increasing important role in this interdisciplinary research area
The variable state y1 represents the voltage and also called action or membrane potential andy2 called recovery variable (a voltage variable exhibits a cubic nonlinearity allowing regenerativeself-stimulation through positive feedback and the recovery variable has a linear dynamics thatprovides a slower negative feedback)
The Fitzhugh-Nagumo model is not constructed to make prediction but to capture quality character-istics of the electrical activity along a neuron
The most important provision of the model (which agrees with experimental data) is the existence ofa limit pulse stimulus that produces travelling electrical voltage (and recovery) waves that propagateaway from the spatial location of the stimulus The traveling wave membrane potential travels and itis the mechanism responsible for the transferring of information along the neuron
The Hodgkin-Huxley circuit supposedly models the electrical activity at a point of a nerve Theprocess of opening and closing ion channels is modeled by diffusion of the voltage (which correspondsto the dimensionless state y1) The spatial dependence is modeled as diffusion whereδ is the diffusivityAdding this term in the right-hand side of the circuit model and also by changing the spatial variablewe obtain the dimensionless form of Fitzhugh-Nagumo equations The Fitzhugh-Nagumo diffusionequations models the spatial coupling between ion channels along the nerve
It is noteworthy that for δ ltlt 1 our system is similar to that described in recent work [78]
71 Distributed control subject to FitzHugh-Nagumo systems 241
712 Description of the model
In this section we present a mathematical model that relates to the above description and particularlywe want to minimize the functional
J(y g) = 12
int T
0y1 minus y1d2L2(Ω) dt+ γ1
2
int T
0g12L2(Ω) dt
+ 12
int T
0y2 minus y2d2L2(Ω))dt+ γ2
2
int T
0g22L2(Ω) dt (711)
subject to
party1parttminus∆y1 + y3
1 minus y1 = minusy2 + g1 + f1 in (0 T ]times Ω y1 = 0 on (0 T ]times Γ
party2parttminus δ∆y2 + εa1y2 = εy1 + g2 + f2 in (0 T ]times Ω y2 = 0 on (0 T ]times Γ (712)
y1(0 x) = y10 y2(0 x) = y20 in Ω
and the control constraints
gia le gi(t x) le gib for ae (t x) isin (0 T )times Ω where gia gib isin R i = 1 2
713 Weak form
We begin by stating the weak formulation of the state equation Given f1 f2 isin L2 [0 T Hminus1(Ω)]
controls g1 g2 isin L2 [0 T L2(Ω)] and states y10 y20 isin L2(Ω) we seek y1 y2 isin L2[0 T H1
0 (Ω)] capH1[0 T Hminus1(Ω)] such that for ae t isin (0 T ] and for all v isin H1(Ω)
〈y1t v〉+ α(y1 v) +langy3
1 minus y1 vrang
= 〈f1 v〉+ 〈g1 v〉 and (y1(0) v) = (y10 v)〈y2t v〉+ δα(y2 v) = ε(y1 minus a1y2 v) + 〈g2 v〉+ 〈f2 v〉 and (y2(0) v) = (y20 v)
(713)
An equivalent weak formulation which is more suitable for the analysis of dG schemes is to seekunique optimal pairs (ygi gi) equiv (yi gi) isin W (0 T ) times Aad i = 1 2 Then there exists an adjointmicro1 micro2 isinW (0 T ) = L2[0 T H1(Ω)] capH1[0 T Hminus1(Ω)] satisfying micro1(T ) = micro2(T ) = 0 such that forall v isin L2[0 T H1(Ω)] capH1[0 T Hminus1(Ω)]
(y1(T ) v(T )) +int T
0
(minus〈y1 vt〉+ α (y1 v) +
(y3
1 minus y1 v))dt
= (y10 v(0)) +int T
0(〈f1 minus y2 v〉)dt+
int T
0(〈g1 v〉)dt (714)
(y2(T ) v(T )) +int T
0(minus〈y2 vt〉+ δα (y2 v))dt
= (y20 v(0)) +int T
0(〈ε(y1 minus a1y2) v〉+ 〈f2 v〉)dt+
int T
0(〈g2 v〉)dt (715)
2427 An Application In Biology Experiment With Distributed Control in Semilinear
Parabolic Systems Of Pdesint T
0
(〈micro1 vt〉+ α (micro1 v) +
lang(3y2
1 minus 1)micro1 vrang)dt
= minus(micro1(0) v(0)) +int T
0((y1 minus y1d v)) dt (716)
int T
0(〈micro2 vt〉+ α (micro2 v)minus 〈εa1micro2 v〉) dt
= minus(micro2(0) v(0)) +int T
0((y2 minus y2d v)) dt (717)
with control constraintsint T
0
int
Ω
((αg1 + micro1) (u1 minus g1) (αg2 + micro2) (u2 minus g2)
)dxdt ge 0 forallu1 u2 isin Aad (718)
In addition yit microit isin L2[0 T Hminus1(Ω)] and note that (718) is equivalent to
gi(t x) = Proj[giagib]
(minus 1αmicroi(t x)
)
for ae (t x) isin (0 T ]times Ω In addition microit isin L2[0 T H2(Ω)] cap L2[0 T L2(Ω)] i = 1 2
714 The full discretized system
Let (yh(gih) gih) equiv (yih gih) isin Uh times L2[0 T Uh] i = 1 2 denote the unique optimal pairsThenthere exists an adjoint micro1 micro2 isin Uh satisfying microN1h+ = microN2h+ = 0 such that for all υh isin Pk[tnminus1 tnUh]and for all n = 1 N
(yn1 υn) +int tn
tnminus1
(minus〈y1h υht〉+ α (y1h υh) +
(y3
1h minus y1h υh))dt
= (y1nminus1 υnminus1
+ ) +int tn
tnminus1(〈f1 minus y2h υh〉)dt+
int tn
tnminus1(〈g1 υh〉)dt (719)
(yn2 υn) +int tn
tnminus1(minus〈y2h υht〉+ δα (y2h υh))dt
= (y2nminus1 υnminus1
+ ) +int tn
tnminus1(〈ε(y1h minus a1y2h) υh〉+ 〈f2 υh〉)dt+
int tn
tnminus1(〈g2 υh〉)dt(7110)
(micron1+ υn) +
int tn
tnminus1
(〈micro1h υht〉+ α (micro1h υh) +
lang(3y2
1h minus 1)micro1h vrang)dt
= minus(micronminus11+ υnminus1
+ ) +int tn
tnminus1((y1h minus y1d v)) dt (7111)
(micron2+ υn) +
int tn
tnminus1(〈micro2h υht〉+ α (micro2h υh)minus 〈εa1micro2h υh〉) dt
= minus(micronminus12+ υnminus1
+ ) +int tn
tnminus1((y2h minus y2d v)) dt (7112)
with control constraintsint T
0
int
Ω
((αg1h + micro1h) (u1h minus g1h) (αg2h + micro2h) (u2h minus g2h)
)dxdt ge 0 (7113)
forallu1h u2h isin Adad
71 Distributed control subject to FitzHugh-Nagumo systems 243
In addition (7113) is equivalent to
gih(t x) = Proj[giagib]
(minus 1αmicroih(t x)
) i = 1 2
for ae (t x) isin (0 T ]times Ω
Due to the limits gia gib for the control variable a projection to the set of admissible controls isneeded which is given by the cutoff function
P[giagib](g) = maxgiamingib g
715 Numerical Experiments
In this section we are going to validate numerically a priori error estimates for k = 0 l = 1 (constantin time and linear in space polynomials) in the cases τ = O(h2) and τ = O(h) for the state andconjugate variable in L2[0 T H1
0 (Ω)] norm and the control in L2[0 T L2(Ω)] norm
We use an algorithm based in a steepest - descend (projected gradient) method after we initializedn = 0 ε = 1 tol g1
0| and g20 We note that eg yni is a sequence of piecewise linear polynomials in
time (and every term of this sequence is another sequence piecewise in space) in nth iteration of thegradient method
In the case of unconstrained control we assume that gia rarr minusinfin gib rarrinfin Specifically we use thecode
bull Step 0 (Initial state) For g1 = g10 g2 = g2
0 solve the system y1 = y10 y2 = y2
0
y1t minus∆y1 + y31 minus y1 = minusy2 + g1 + f1
y2t minus δ∆y2 + εa1y2 = εy1 + g2 + f2
y1Γ = y2Γ = 0y1(0 x) = y10 y2(0 x) = y20
bull Step 1 (Conjugate equation) Find micro1 = micro1n micro2 = micro2
n after solving the system
micro1t + ∆micro1 + (3y21 minus 1)micro1 = y1 minus y1d
micro2t + δ∆micro2 + εa1micro2 = y2 minus y2d
micro1Γ = micro2Γ = 0micro1(T x) = micro2(T x) = 0
bull Step 2 (New descent direction) Choose as descent direction the negative gradient of the costfunctional
minusJ prime(g1 g2) = minus(γ1g1 + micro1 γ2g2 + micro2)
bull Step 3 (Checking step εn) Find optimal size of εn
J(P[g1ag1b]g1
n + εn(γ1g1 + micro1)P[g2ag2b]g2n + εn(γ2g1 + micro2))
)=
= minεgt0
J(P[g1ag1b]g1
n + ε(γ1g1 + micro1)P[g2ag2b]g2n + ε(γ2g1 + micro2)
)
2447 An Application In Biology Experiment With Distributed Control in Semilinear
Parabolic Systems Of Pdes
bull Step 4 (New control) Set
g1n+1 = P[g1ag1b]g1
n + εn(γ1g1n + micro1
n)
g2n+1 = P[g2ag2b]g2
n + εn(γ2g2n + micro2
n)
bull Step 5 (New state) Check if Jn le Jnminus1 then set ε = 15ε If Jn ge Jnminus1 then set ε = 05εGo to Step 0 with g1 = g1
n+1 g2 = g2n+1 y1 = y1
n y2 = y2n and do n = n+ 1 Stop if
|Jn minus Jnminus1|Jn le tol
We consider the following numerical examples for the model problem with known analytical exactsolution on Ωtimes(0 T ) = (0 001)2times(0 001) and homogeneous Dirichlet boundary conditions similarlywith Chapter 5 and the one presented in [27]
We will chose parameters δ = 4 a1 = 2 L = 001 H = 001 ε = 00001 due to the example in [24]and for the size of the control regularization parameters in functional we choose γ1 = γ2 = 10minus4
Example 1 We assume target function
y1d(t x1 x2) = minus(eminusεt(ε sin(πyH)H2 sin(πxL)L2 minus sin(πyH)H2 sin(πxL)L2
+ π2 sin(πyH) sin(πxL)L2 minus sin(πyH)H2 sin(πxL)L2
+ π2 sin(πyH)H2sin(πxL)) + 3 sin(πyH)3H2 sin(πxL)3L2eminus3εt
minus 3eminusεTminus2εt sin(πyH)3H2 sin(πxL)3L2 + eminusεT (sin(πyH)H2 sin(πxL)L2
minus π2 sin(πyH) sin(πxL)L2 minus π2 sin(πyH)H2 sin(πxL))))(H2L2)y2d(t x1 x2) = ((((((2a1ε
2 minus 1) sin(πyH)H2 minus 2δεπ2sin(πyH)) sin(πxL)+ 2εsin(πyH)H2 sin(πxL))L2 minus 2δεπ2sin(πyH)H2 sin(πx)L)eT(2ε)
+ (2δεπ2et(2ε) sin(πyH)minus 2a1ε2et(2ε) sin((πy)H)H2)sin(πxL)L2
+ 2δεπ2et(2ε) sin(πyH)H2 sin(πxL))eminusT(2ε)minust(2ε))(2εH2L2)
and initial conditions
y10(x1 x2) = sin(πx1L)) sin(πx2H)y20(x1 x2) = sin(πx1L) sin(πx2H)
in a way to guarantee that the optimal solution triples (y1 micro1 g1) (y2 micro2 g2) of the above problemis given by
y1(t x1 x2) = eminusεt sin(πx1L) sin(πx2H)y2(t x1 x2) = eminust(2ε)(sin(πx1L))(sin(πx2H))micro1(t x1 x2) = (eεt minus eεT ) sin(πx1L) sin(πx2H)micro2(t x1 x2) = (et(2ε) minus eT(2ε)) sin(πx1L) sin(πx2H)
g1(t x1 x2) = PQad(
(eminus3εtminust(2ε) sin(πyH) sin((πx)L)(et(2ε) sin(πyH)2
sin((πx)L)2 minus εe2εt+t(2ε)))))
g2(t x1 x2) = PQad(a1εe
minust(2ee) sin((πy)H) sin(πxL))
We emphasize that we have limitations in control and specifically gi isin [gia gib]
71 Distributed control subject to FitzHugh-Nagumo systems 245
Table 71 Convergence Rates for the 2-d solution with control constraints in the case of k = 0 l = 1(τ = O(h)) for the control state and conjugate variable
Discretization Errorsh = 2τ eL2[0T H1
0 (Ω)] rL2[0T H10 (Ω)] g minus ghL2[0T L2(Ω)]
h = 0002357022 00439518 886349 425156e-005h = 0001178511 00214931 314208 120440e-005h = 0000589255 00108039 120744 441810e-006h = 0000294627 00054238 555306 326909e-006h = 0000147313 00027193 282740 307129e-006
Rate 10036512 124257 0947767750
Table 72 Convergence Rates for the 2-d solution with control constraints in the case of k = 0 l = 1(τ = O(h2)) for the control and conjugate variable
Discretization Errorh = τ1216 eL2[0T H1
0 (Ω)] rL2[0T H10 (Ω)] g minus ghL2[0T L2(Ω)]
h = 000235702 00448696 962116 43365e-005h = 000138889 00216560 253040 12195e-005h = 000058925 00109022 111981 44012e-006h = 000029462 00054459 571635 31558e-006
Rate 10141566 135768 126015110
Example 2 Here we concern unconstrained control function with forces
f1(t x1 x2) = (eminus3εtminust(2ε) sin(πyH) sin(πxL)(minuse2εt+t(2ε)H2L2 + e3εt
+π2e2εt+t(2ε)H2 + π2e2εt+t(2ε)L2))f2(t x1 x2) = (eminusεtminust(2ε) sin(πyH) sin(πxL)(minuseεt minus 2ε2et(2ε)
+2π2δεeεtH2 + 2π2δεeεtL2))(2ε)
target functions
y1d(t x1 x2) = 2minus cos(πxL) sin(πyH)y2d(t x1 x2) = 2minus sin(πxL) cos(πyH)
and initial conditions
y10(x1 x2) = sin(πx1L)) sin(πx2H)y20(x1 x2) = sin(πx1L) sin(πx2H)
in a way to guarantee that the optimal solution triples (y1 g1) (y2 g2) are
y1(t x1 x2) = eminusεt sin(πx1L) sin(πx2H)y2(t x1 x2) = eminust(2ε)(sin(πx1L))(sin(πx2H))g1(t x1 x2) = eminus3εtminust(2ε) sin(πx2H) sin(πx1L)(et(2ε) sin((πx2)H)2 sin((πx1)L)2
minusεe2εt+t(2ε))g2(t x1 x2) = a1εe
minust(2ε) sin(πx2H) sin(πx1L)
This optimal control problem has solved as the examples in previous chapters with package softwareFreeFem++ too see eg [64]
2467 An Application In Biology Experiment With Distributed Control in Semilinear
Parabolic Systems Of Pdes
Table 73 Functional values and convergence Rates for the 2-d solution without control constraints in thecase of k = 0 l = 1 (τ = O(h)) for the control and state variable
Discretization Errorh = 2τ eL2[0T H1
0 (Ω)] g minus ghL2[0T L2(Ω)] J(y g)h = 0002357022 00544954 474548e-005 565672e-006h = 0001178511 00219039 102414e-005 364340e-006h = 0000589255 00107374 260774e-006 349583e-006h = 0000294627 00054011 716507e-007 352582e-006h = 0000147313 00027120 246111e-007 353950e-006
Rate 10815777 18972500000 -
Table 74 Functional values and convergence Rates for the 2-d solution without control constraints in thecase of k = 0 l = 1 (τ = O(h2)) for the control and state variable
Discretization Errorh = τ1222 eL2[0T L2(Ω)] eL2[0T H1
0 (Ω)] g minus ghL2[0T L2(Ω)] J(y g)h = 0002357022 628133e-005 00544269 473965e-005 564252e-006h = 0001388890 130951e-005 00218849 102321e-005 363497e-006h = 0000589250 327452e-006 00108686 263420e-006 355844e-006h = 0000294627 819355e-007 00054478 720667e-007 355338e-006
Rate 20868133333 11068586 20131000000 -
Example 3 In this example we have constrained control function in the interval [ga gb] and withforces
f1(t x1 x2) = (eminus3εtminust(2ε)(et(2ε) sin(πyH)3H2 sin(πxL)3L2 minus εe2εt+t(2ε)
sin(πyH)H2 sin(πxL)L2 minus e2εt+t(2ε) sin(πyH)H2 sin(πxL)L2
+e3εt sin(πyH)H2 sin(πxL)L2 + π2e2εt+t(2ε) sin(πyH) sin(πxL)L2
minusPQad(eminus3εt sin(πyH) sin(πxL)(sin(πyH)2 sin(πxL)2 minus εe2εt)
)
e3εt+t(2ε)H2L2 + π2e2εt+t(2ε) sin(πyH)H2 sin(πxL)))(H2L2)f2(t x1 x2) = (eminusεtminust(2ε)(2a1ε
2eεt sin(πyH)H2 sin(πxL)L2 minus eεt sin(πyH)H2 sin(πxL)L2 minus 2ε2et(2ε) sin(πyH)H2 sin(πxL)L2 + 2π2δεeεt
sin(πyH) sin(πxL)L2 minus 2εPQad(a1εe
minust(2ε) sin(πyH) sin(πxL))
eεt+t(2ε)H2L2 + 2π2δεeεt sin(πyH)H2 sin(πxL)))(2εH2L2)
the same target function and initial conditions as Example 2 in a way to guarantee that the optimalsolution pairs (y1 g1) (y2 g2) of the above problem is given by
y1(t x1 x2) = eminusεt sin(πx1L) sin(πx2H)y2(t x1 x2) = eminust(2ε)(sin(πx1L))(sin(πx2H))
g1(t x1 x2) = PQad(eminus3εtminust(2ε) sin(πx2H) sin(πx1L)(et(2ε) sin(πx2H)2
sin(πx1L)2 minus εe2εt+t(2ε)))
g2(t x1 x2) = PQad(a1εe
minust(2ε) sin(πx2H) sin(πx1L))
71 Distributed control subject to FitzHugh-Nagumo systems 247
For this choice of data the corresponding errors for the state and the control variable for differentmeshes are shown in Tables 75 and 76
Table 75 Rates of convergence for the 2d solution with k = 0 l = 1 τ = O(h))
Discretization Errorh = τ eL2[0T H1
0 (Ω)] g minus ghL2[0T L2(Ω)] J(y g)h = 0002357022 00544956 526533e-005 565673e-006h = 0001178511 00219040 120416e-005 364340e-006h = 0000589255 00107375 321396e-006 349583e-006h = 0000294620 00054011 106383e-006 352583e-006h = 0000147310 00027120 396590e-007 353950e-006
Rate 10821677 17631825000 -
Table 76 Rates of convergence for the 2d solution with k = 0 l = 1 (τ = O(h2))
Discretization Errorh = τ1222 eL2[0T L2(Ω)] eL2[0T H1
0 (Ω)] g minus ghL2[0T L2(Ω)] J(y g)h = 0002357022 628160e-005 00544271 525886e-005 564252e-006h = 0001388890 130974e-005 00218850 120306e-005 363497e-006h = 0000589250 327688e-006 00108686 324638e-006 355844e-006h = 0000294627 821734e-007 00054478 106902e-006 355339e-006
Rate 20854400000 11068586 18734666666 -
Example 4 In this example the target function has very high values and ldquoawayrdquo from the valuesof the state variable We note that in this example the control is unconstrained The forces on theright-hand side are
f1(t x1 x2) = minus(minus(π2e(minusεt) sin(πx2H) sin(πx1L))H2) + eminus3εt sin(πx2H)3 sin(πx1L)3
minusεeminusεt sin(πx2H) sin(πx1L)minus eminusεt sin(πx2H) sin(πx1L)+eminust(2ε) sin(πx2H) sin(πx2L)
f2(t x1 x2) = (π2δeminust(2ε) sin(πx2H) sin(πx1L))H2 minus εeminusεt sin(πx2H) sin(πx1L)+a1εe
minust(2ε) sin(πx2H) sin(πx1L)minus (eminust(2ε) sin(πx2H) sin(πx1L))(2ε)
target functions
y1d(t x1 x2) = minus sin(πx2H) sin(πx1L)eminusεTminus3εt(minusεH2L2eεT+2εt minus 2H2L2eεT+2εt + π2L2eεT+2εt
+π2H2eεT+2εt + 3 sin(πx2H)2H2 sin(πx1L)2L2eεT
minus3eεt sin(πx2H)2H2 sin(πx1L)2L2 + e3εtH2L2 minus π2e3εtL2 minus π2e3εtH2))(H2L2)y2d(t x1 x2) = eminusT(2ε)minust(2ε)(2εH2L2)(((((2a1ε
2 + 2ε+ 1) sin(πx2)H)H2
minus2π2δε sin(πx2H)) sin(πx1L)L2 minus 2π2δε sin(πx2H)H2 sin(πx1L))eT(2ε)
+(2π2δεet(2ε) sin(πx2H)minus 2a1ε2et(2ε) sin(πx2H)H2) sin(πx1L)L2
+2π2δε exp(t(2ε)) sin(πx2H)H2 sin(πx1L))
2487 An Application In Biology Experiment With Distributed Control in Semilinear
Parabolic Systems Of Pdes
and he same initial conditions as Example 2 in a way to guarantee that the optimal solution triples(y1 micro1 g1) (y2 micro2 g2) of the above problem is given by
y1(t x1 x2) = eminusεt sin(πx1L) sin(πx2H)y2(t x1 x2) = eminust(2ε)(sin(πx1L))(sin(πx2H))micro1(t x1 x2) = (eεT minus eεt)eminusεTminusεt sin(πx2H) sin(πx1L)micro2(t x1 x2) = (eT(2ε) minus et(2ε))eminusT(2ε)minust(2ε) sin(πx2H) sin(πx1L)g1(t x1 x2) = π2eminusεt sin(πx2H) sin(πx1L)L2
g2(t x1 x2) = π2δeminust(2ε) sin(πx2H) sin(πx1L)L2
For this choice of data the corresponding errors for the state and the control variable for differentmeshes are shown in Tables 77 and 78
Table 77 Rates of convergence for the 2d solution with k = 0 l = 1 (τ = O(h))
Descritization Errorh = τ ey1L2[0T H1(Ω)] ey2L2[0T H1
0 (Ω)] emicro1L2[0T H1(Ω)] emicro2L2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]
h = 00023570 007174 00457565 164568e-006 0017634 929315h = 00013888 002924 00192318 674248e-007 0007384 196774h = 00005892 001438 00096866 332127e-007 0003687 050788h = 00002946 000723 00048361 162793e-007 0001809 014044h = 00001473 000362 00024077 807215e-008 0000890 004936
Rate 107636 10620475 1086875 107702 -
Table 78 Rates of convergence for the 2d solution with k = 0 l = 1 (τ = O(h2))
Discretization Errorh = τ1222 ey1L2[0T H1(Ω)] ey2L2[0T H1
0 (Ω)] emicro1L2[0T H1(Ω)] emicro2L2[0T H1(Ω)] g minus ghL2[0T L2(Ω)]
h = 00023570 0071655 0044594 197478e-006 00225159 9087240h = 00013888 0029221 0019430 669304e-007 00074020 1985270h = 00005892 0014532 0009640 321201e-007 00035714 0506377h = 00002946 0007271 0004792 158142e-007 00017506 0139421h = 00001473 0003634 0002391 792880e-008 00008706 0049084
Rate 1075285 10552 115961 1173165 -
Remark 711 It should be noted that in all examples in this chapter the values for h are smallerthan those of the examples in the previous chapters This is because the experiment occurs in a moremicroscopic level and particularly to the square with edge length 001 The time step values τ issmaller too since we perform experiments with the choices τ = O(h) and τ = O(h2) This does notaffect the number of space-time degrees of freedom in each grid which is similar to previous chaptersand also similar to the size of tables which is need to be stored in computer memory
Nevertheless the expected convergence rates for errors that are observed in L2[0 T H1(Ω)] are thesame as those in the semilinear optimal control problem in Chapter 6 Thatrsquos because this problemis also an equation system with semilinear term see also the same rates in the work [24] (Fitzugh-Nagumo system without control) However in the last example using more extreme target extremevalues for control and making a more detailed study on each variable we observe much larger errorsfor control but it is noteworthy that we have again the expected convergence rates as shown in Tables78 and 77
Remark 712 Finally note that as expected comparing the problems with control constraints withthe corresponding unconstrained control problems we have similar error rates of convergence for state
71 Distributed control subject to FitzHugh-Nagumo systems 249
and conjugate variables but higher values for the control errors as well as the minimization functional(see similar phenomena and examples in evolutionary Stokes problems with constrained control inChapter 7)
List of Tables41 Rates of Convergence for the two-dimensional solution with k = 0 tau = h22 smooth
initial data and yd = 05 21542 Convergence rates for the 2d solution with k = 0 τ = h22 smooth initial data and
yd = 0 21543 Convergence rates for the 2d solution with k = 0 τ = h22 smooth initial data and
yd = 05 cos(πx1) cos(πx2) 21644 Convergence rates for the 2-d solution with k = 0 τ = h22 and nonsmooth initial data21945 Convergence rates for the 2-d solution with k = 1 l = 1 τ = O(h34) smooth initial
data and yd = 0 22046 Convergence rates for the 2-d solution with k = 1 l = 1 τ = O(h12) smooth initial
data and yd = 0 220
51 Convergence Rates for the 2-d solution in the case of k = 0 l = 1 (h = τ) 22752 Convergence Rates for the 2-d solution in the case of k = 0 l = 1 (h2 = τ) 22853 Convergence rate for the 2-d problem with k = 0 l = 1 (h2 = τ) 228
61 Convergence rates with k = 0 and τ = h28 23162 Convergence rates with k = 1 and τ = h16 23263 Convergence rates with k = 1 and τ = h3210 23264 Convergence rate with k = 1 and τ = h28 23265 Convergence rates with k = 0 and τ = h28 with discontinuity on initial data and on
target function too 23466 Convergence rates with k = 0 and τ = h28 with discontinuity on initial data and on
target function and weak control constraints 23567 Convergence rate with k = 0 and τ = h28 and discontinuity on initial data and strict
control constraints 235
71 Convergence Rates for the 2-d solution with control constraints in the case of k = 0l = 1 (τ = O(h)) for the control state and conjugate variable 245
72 Convergence Rates for the 2-d solution with control constraints in the case of k = 0l = 1 (τ = O(h2)) for the control and conjugate variable 245
73 Functional values and convergence Rates for the 2-d solution without control con-straints in the case of k = 0 l = 1 (τ = O(h)) for the control and state variable 246
74 Functional values and convergence Rates for the 2-d solution without control con-straints in the case of k = 0 l = 1 (τ = O(h2)) for the control and state variable 246
75 Rates of convergence for the 2d solution with k = 0 l = 1 τ = O(h)) 24776 Rates of convergence for the 2d solution with k = 0 l = 1 (τ = O(h2)) 24777 Rates of convergence for the 2d solution with k = 0 l = 1 (τ = O(h)) 24878 Rates of convergence for the 2d solution with k = 0 l = 1 (τ = O(h2)) 248
List of Figures41 Errors for the state and control variable for τ = h22 21642 Norm for the control function g(t)L2(Ω) 21643 Distance from target y(t) minus yd(t)L2(Ω) a) Smooth data b) Nonsmooth data -
discontinuity 21744 Effects to the control g(t)L2(Ω) as regularization parameter α varies with fixed mesh
48times 48 21745 Effects to the numerical solution and target function distance y(t)minus yd(t)L2(Ω) as α
varies 21846 Instance of the state variable 22247 Instance of the conjugate variable 222
61 State variable snapshot on mesh 12x12 and smooth initial data 23662 State variable snapshot on mesh 24x24 and smooth initial data 23663 State variable snapshot for rough initial data as the algorithm starts 23764 State variable snapshot for rough initial data as the algorithm finishes 23765 Conjugate variable snapshot for rough initial data 238