Permalink
Cannot retrieve contributors at this time
\ifcsname ispublic\endcsname | |
\documentclass[11pt,a4paper,notitlepage,fleqn,final]{article} | |
\else | |
\documentclass[11pt,a4paper,notitlepage,fleqn,final]{article} | |
\fi | |
\input{preambles/preamble2017.tex} | |
\title{Αριθμητική Ανάλυση | |
\\ | |
{ | |
\normalsize Σημειώσεις από τις παραδόσεις | |
}} | |
\date{2017 | |
\\ | |
{ | |
\small Τελευταία ενημέρωση: \today | |
} | |
} | |
\author{ | |
Για τον κώδικα σε \LaTeX, ενημερώσεις και προτάσεις: | |
\\ | |
\url{https://github.com/kongr45gpen/ece-notes}} | |
\setmainfont{Linux Libertine O} | |
\setsansfont{Ubuntu} | |
%\newfontfamily\greekfont[Script=Greek]{Linux Libertine O} | |
%\newfontfamily\greekfontsf[Script=Greek]{Linux Libertine O} | |
\usepackage{polyglossia} | |
\newfontfamily\greekfont[Script=Greek,Scale=0.95]{GFS Artemisia} | |
\hypersetup{ | |
pdftitle = {Αριθμητική Ανάλυση} | |
} | |
\begin{document} | |
\maketitle | |
\tableofcontents | |
\vspace{50pt} | |
\textbf{Αριθμητική ανάλυση - Numerical Analysis} | |
Μάθημα 4 ώρες την εβδομάδα - δεν υπάρχει διάκριση μεταξύ θεωρίας και ασκήσεων. | |
Και τα δύο βιβλία προτείνονται, το μάθημα γίνεται περισσότερο με βάση το βιβλίο του κ. | |
Πιτσούλη, του κ. Δούγαλη είναι περισσότερο μαθηματικό. | |
Στις εξετάσεις δεν θα υπάρχει τυπολόγιο/βιβλίο, αλλά θα δίνονται τύποι που χρειάζονται | |
στα θέματα. Απαραίτητο το κομπιουτεράκι. | |
\section{Εισαγωγή} | |
Η αριθμητική ανάλυση μάς δίνει \textit{προσεγγιστικές} λύσεις σε μοντέλα και μαθηματικά | |
προβλήματα. | |
Σε δύσκολα προβλήματα, ζητάμε: | |
\begin{itemize} | |
\item \textbf{Ακρίβεια} αποτελέσματος | |
\item \textbf{Ταχύτητα} υπολογισμού | |
\end{itemize} | |
Θα δούμε τα εξής προβλήματα: | |
\begin{itemize} | |
\item \textbf{Επίλυση εξισώσεων} | |
\paragraph{Παράδειγμα} | |
Ένας πελάτης θέλει να καταθέσει \( P \) € για \( N \) χρόνια στην τράπεζα, και εγώ | |
του λέω ότι θα του επιστρέψω \( A \) € από την κατάθεση. Ο πελάτης όμως ενδιαφέρεται | |
για το ετήσιο επιτόκιο \( R \). | |
Προκύπτει μια εξίσωση της μορφής: | |
\begin{gather*} | |
A = P + P \left( 1 + \frac{R}{12} \right) + \dots \\ | |
f(R) = \frac{P}{\sfrac{R}{12}} \left[ | |
\left(1+\frac{R}{12}\right)^N -1 | |
\right] = 0, \quad R = ? | |
\end{gather*} | |
Θυμόμαστε ότι μπορούμε να χρησιμοποιήσουμε το θεώρημα Bolzano για να βρούμε ότι | |
υπάρχει μια τουλάχιστον λύση μέσα σε ένα διάστημα, οπότε μπορούμε να "φανταστούμε" | |
έναν αριθμό κοντά στη λύση, και να κλείνουμε συνεχώς ένα διάστημα γύρω από αυτήν (το | |
διάστημα στις εξετάσεις θα δίνεται, π.χ. \textit{βρείτε μία λύση στο διάστημα | |
\( [2.5,\ 3.5] \) με ακρίβεια \( 10^{-5} \)}), αν και αυτό δεν θα γίνεται στον πραγματικό κόσμο. | |
\item \textbf{Παρεμβολή} | |
Σε έναν σταθμό διοδίων μετράω πόσα αυτοκίνητα περνάν το κάθε λεπτό (π.χ. το | |
11\textsuperscript{ο} λεπτό περνάν 4, το 12\textsuperscript{ο} περνάν 7, κλπ.) | |
\begin{center} | |
\begin{tikzpicture}[scale=1] | |
\matrix (values) [matrix of nodes, | |
nodes={align=center,text width=0.7cm} | |
] { | |
11 & 12 & 13 & 14 & 15 \\ | |
4 & 7 & 11 & 1 & 22 \\ | |
}; | |
\draw (values-1-1.south west)--(values-1-5.south east); | |
\draw (values-1-1.north west) -- (values-2-1.south west); | |
\foreach \x in {1,2,...,5} | |
\draw (values-1-\x.north east) -- (values-2-\x.south east); | |
\draw[thick,->] (4,0) -- ++(1.7,0); | |
\begin{scope}[xshift=7cm,yshift=-1cm] | |
\draw (-0.5,0) -- (2,0); | |
\draw (0,-0.5) -- (0,2); | |
\begin{scope}[yshift=2mm,xshift=3mm,yscale=.5,xscale=.5] | |
\coordinate (A) at (0,1); | |
\coordinate (B) at (1,2); | |
\coordinate (C) at (2,3); | |
\coordinate (D) at (3,0.3); | |
\coordinate (E) at (4,4); | |
\draw[thick,blue] | |
plot [smooth] coordinates { (A) (B) (C) (D) (E) }; | |
\foreach \p in {(A),(B),(C),(D),(E)} | |
\filldraw \p circle (2pt); | |
\end{scope} | |
\end{scope} | |
\end{tikzpicture} | |
\end{center} | |
Θέλω να βρω ένα πολυώνυμο που να συνδέει όλα τα σημεία μεταξύ τους (θα αποδείξουμε | |
ότι τέτοιο πολυώνυμο πάντα υπάρχει), ή ένα πολυώνυμο (αρκετά χαμηλού βαθμού, ώστε | |
να μην γίνονται πολλές πράξεις) με αρκετά καλή προσέγγιση. | |
Με αυτόν τον τρόπο θα μπορώ να προσεγγίσω τιμές που δεν γνωρίζω, π.χ. αν πήγα για | |
καφέ στο 13\textsuperscript{ο} λεπτό. | |
\item \textbf{Προσέγγιση} | |
\item \textbf{Αριθμητική Γραμμική Άλγεβρα} | |
Exact και προσεγγιστικές λύσεις συστημάτων πολλών αγνώστων. | |
\item \textbf{Ολοκλήρωση} | |
\item \textbf{Υπολογισμός ιδιοτιμών \& ιδιοδιανυσμάτων} | |
\item \textbf{Παραγοντοποίηση πινάκων σε γινόμενο πινάκων} | |
Βολεύει κυρίως για την επίλυση συστημάτων. | |
\item \textbf{Επίλυση κανονικών διαφορικών εξισώσεων} | |
\item \textbf{Βελτιστοποίηση} | |
Για παράδειγμα, να πρέπει να ελαχιστοποιήσω μια συνάρτηση τη στιγμή που πρέπει να | |
τηρούνται κάποιες συνθήκες. | |
\end{itemize} | |
\subsection{Ακρίβεια vs Ταχύτητα} | |
Απόλυτο Σφάλμα: \( \displaystyle | |
\left| X_t - X_c \right| | |
\) \quad (απόσταση της λύσης που βρήκα από την πραγματική) | |
\vspace{5pt} | |
Σχετικό Σφάλμα: \( \displaystyle | |
\frac{\left|X_t - X_c\right|}{\left|X_t\right|} | |
\) | |
Επειδή δεν θα γνωρίζουμε την πραγματική λύση \( X_t \), θα βρίσκουμε το μέγιστο σφάλμα. | |
Για παράδειγμα, σε υπολογιστές έχουμε σφάλματα στρογγύλευσης και αποκοπής: | |
\[ | |
\begin{array}{ll} | |
0.66666 & \\ | |
0.66 & \leftarrow \text{αποκοπή} \\ | |
0.67 & \leftarrow \text{στρογγύλευση} | |
\end{array} | |
\] | |
\newpage | |
% Set counters so that they match the book | |
\setcounter{section}{2} | |
\section{Επίλυση Εξισώσεων} | |
\begin{center} | |
\( \displaystyle \mathlarger{ | |
f(x): \qquad \text{βρείτε $\bar x$ έτσι ώστε \( f(\bar x) = 0 \).}} | |
\) | |
\end{center} | |
Η επίλυση είναι εύκολη όταν η \( f \) είναι πολυώνυμο μέχρι 2\textsuperscript{ου} βαθμού, | |
όχι όμως όταν είναι μεγαλύτερου, ή όταν έχει κι άλλους όρους (π.χ. εκθετικούς) μέσα. | |
Ο τρόπος που θα ακολουθήσουμε για να λύνουμε τέτοια προβλήματα είναι: | |
\begin{itemize} | |
\item Δημιουργούμε μια ακολουθία \( x_1, \dots, x_n \) προσέγγισης της \( \bar x \). | |
\item Σε κάθε βήμα κάνουμε έλεγχο σύγκλισης για να δούμε πόσο κοντά είμαστε. | |
\end{itemize} | |
\subsection{Μέθοδος Διχοτόμησης} | |
Θα χρησιμοποιήσω θεώρημα Bolzano (\( \mathsmaller{f(a) \cdot f(b) < 0} \)): | |
\begin{center} | |
\begin{tikzpicture}[scale=1.9] | |
\draw (0,-0.5) -- (0,2); | |
\draw (-1,0) -- (3,0); | |
\draw[thick, orange, | |
mark position=0.5(c), | |
mark position=0.3(a), | |
mark position=0.8(b), | |
mark position={0.55}(c1), | |
mark position={(0.55/2+0.8/2)}(c2), | |
mark position={(0.55/4+0.8/4+0.55/2)}(c3) | |
] plot[smooth,tension=0.7] | |
coordinates {(-0.5,0.7) (0.5,1.5) (2.2,-0.7) (3.2,-0.9)}; | |
\draw[orange!90!black] (c) node[above] {$f$}; | |
\draw[dashed] (a) -- (a |- 0,0) node[below] {$a$}; | |
\draw[dashed] (b) -- (b |- 0,0) node[above] {$b$}; | |
\draw[thick,gray!50!blue] (c1) -- (c1 |- 0,0) node[below] {$c_1$}; | |
\draw[thick,gray!35!blue] (c2) -- (c2 |- 0,0) node[above] {$c_2$}; | |
\draw[thick,gray!20!blue!60!green] (c3) -- (c3 |- 0,0) node[below] {$\mathsmaller{c_3}$}; | |
\draw (1,-1.5) node {$\displaystyle c_1 = \frac{a+b}{2}$}; | |
\draw (1,-2) node {$\displaystyle c_2 = \frac{c_1+b}{2}$}; | |
\end{tikzpicture} | |
\end{center} | |
Ξεκινάω από μία αρχική προσέγγιση/διάστημα (η μέθοδος διχοτόμησης δεν δίνει λύση | |
συγκεκριμένη, αλλά διάστημα - τη λύση την παίρνω σαν το μέσο του διαστήματος). | |
Συνέχεια κόβω το διάστημα στη μέση, έτσι ώστε \( f(\text{των άκρων}) \) να είναι | |
ετερόσημα, και παίρνω συνεχώς ένα μικρότερο διάστημα. | |
Σταματάω όταν είναι επιτυχής ο έλεγχος σύγκλισης, π.χ | |
\( \mathlarger{\left|c_{k+1}-c_k\right| < \epsilon \rightarrow 10^{-5}} \), δηλαδή | |
το διάστημα στο οποίο βρίσκεται η ρίζα είναι αρκετά μικρό. | |
Θα διαπιστώσουμε ότι, αν και αυτή η μέθοδος λειτουργεί πάντα, είναι αρκετά αργή. | |
\paragraph{Παράδειγμα} | |
Να βρεθεί ρίζα της εξίσωσης | |
\( \mathlarger{ | |
\mathlarger{f(x) = x^3+x-1} } | |
\) στο διάστημα \( [0,1] \) με ακρίβεια \( 10^{-3} \). | |
\begin{gather*} | |
f(0) \cdot f(1) < 0 \\ | |
k=1,\ a_1=0,\ b_1=1,\ m_1=\frac{a_1+b_1}{2} = 0.5 \\ | |
\quad f(m_1) = -0.375 < 0 \\ | |
\quad f(0.5) \cdot f(1) < 0 | |
\end{gather*} | |
Άρα η λύση βρίσκεται μεταξύ \( 0.5 \) και \( 1 \). | |
Για το επόμενο βήμα: | |
\begin{gather*} | |
k = 2,\ m_2 = \frac{0.5+1}{2} = 0.75 \\ | |
\quad f(m_2) = 0.172 > 0 \\ | |
\quad f(m_1)f(m_2) < 0 \\[3ex] | |
k=3,\ m_3 = \frac{0.5+0.75}{2} = 0.625 \\ | |
\quad f(m_3) = -0.131 \\ | |
\quad f(m_2)f(m_3) < 0 \\[3ex] | |
\mathlarger{\mathlarger{\vdots}} | |
\end{gather*} | |
\subsubsection{Σύγκλιση} | |
Όπου \( r \) και \( m_n \) η πραγματική και προσεγγιστική λύση αντίστοιχα: | |
\begin{align*} | |
\left|r - m_n\right| \leq \left(\frac{1}{2}\right)^n (b-a) | |
\end{align*} | |
επειδή στη \( n- \)οστή επανάληψη έχω κόψει \( n \) φορές το διάστημα στα 2. | |
Για σφάλμα \( 10^{-5} \), θέλουμε \( |r-m_n| = 10^{-5} \): | |
\begin{align*} | |
&10^{-5} \leq \left(\frac{1}{2}\right)^n (1-0) \implies | |
\\ \implies & n \simeq 16.667 \implies \mathlarger{n = 17} | |
\end{align*} | |
\subsection{Μέθοδος Χορδής ή Τέμνουσας} | |
Σαν τη μέθοδο Bolzano, όμως δεν παίρνουμε το μέσο του διαστήματος, αλλά κάποια άλλη τιμή. | |
Παρατηρείται ότι αυτή η μέθοδος συγκλίνει γρηγορότερα. | |
\begin{tikzpicture}[scale=2] | |
\draw (0,-0.2) -- (0,2); | |
\draw (-0.5,0) -- (3,0); | |
\draw[dashed] (2.7,1.7) node [right] {$\left(b_1,f(b_1)\right)$} | |
-- (2.7,0); | |
\draw[very thick, blue!50!magenta] plot[smooth,tension=1] | |
coordinates {(0.5,-0.4) (2,0.3) (2.7,1.7)}; | |
\draw[blue!50!magenta] (2.11,0.2) node {$f$}; | |
\draw[dashed] (0.5,-0.4) node[below left] {$\left(a_1,f(a_1)\right)$} -- (0.5,0) node[above] {$a_1$}; | |
\draw[cyan,thick] (0.5,-0.4) -- (2.7,1.7); | |
\draw[dashed] (0.93,-0.3) node[below,yshift=-2mm] {$\left(a_2,f(a_2)\right)$} -- (0.93,0) node[above] {$a_2$}; | |
\draw [cyan,thick] (0.93,-0.3) -- (2.7,1.7); | |
\draw[dashed] (1.2,0) -- (1.2,-0.2); | |
\draw [cyan,thick] (1.2,-0.2) -- (2.7,1.7); | |
\end{tikzpicture} | |
Πρέπει να βρούμε τη ρίζα εντός του διαστήματος \( (a_1,b_1) \). | |
\begin{itemize} | |
\item Παίρνουμε τη χορδή που ενώνει τα \( a_1, b_1 \). | |
\item Η χορδή αυτή τέμνει τον άξονα των \( x \) στο σημείο \( a_ 2\), | |
επομένως η ρίζα βρίσκεται μεταξύ των \( a_2, b_1 \). | |
\item Παίρνουμε τη χορδή που ενώνει τα \( a_2, b_2 \) | |
\item Η χορδή αυτή τέμνει τον άξονα των \( x \) στο σημείο \( a_3 \), | |
επομένως η ρίζα βρίσκεται μεταξύ των \( a_3,b_1 \) | |
\item \( \cdots \) | |
\end{itemize} | |
Παρατηρούμε ότι η μέθοδος χορδής λειτουργεί για | |
κυρτές συναρτήσεις. | |
\begin{infobox}{Κυρτές συναρτήσεις} | |
Όταν λέμε ότι μια συνάρτηση είναι κυρτή, | |
εννοούμε ότι η καμπύλη της είναι κυρτή, | |
δηλαδή για δύο σημεία της, η χορδή που τα ενώνει | |
δεν τέμνει κάποιο σημείο της \( f \). Στην αντίθετη περίπτωση, | |
η συνάρτηση λέγεται μη κυρτή. | |
\end{infobox} | |
\paragraph{} | |
\( a_1,b_1 \) όπου \( f(a_1)f(b_1) < 0 \) for | |
\( k=1,2,\dots \) | |
\begin{align*} | |
& \left(a, f(a)\right) \qquad \left(b,f(b)\right) | |
\\ | |
y-f(b) &= \frac{f(b)-f(a)}{(b-a)}(x-b) \\ | |
\text{Σημείο τομής με άξονα } x: | |
\Aboxed{x &= \frac{af(b)-bf(a)}{f(b)-f(a)}} | |
\\ | |
c &= \frac{a_kf(b_k)-b_kf(a_k)}{f(b_k)-f(a_k)} | |
\\ f: \quad f(a_k)f(c) < 0 &\implies | |
a_{k+1} = a_k, \quad b_{k+1}=c \\ | |
\text{else} &\implies | |
a_{k+1} = c, \quad b_{k+1} = b_k | |
\end{align*} | |
Αν και η μέθοδος χορδής είναι αργή, συνεχίζει να | |
είναι γρηγορότερη από τη μέθοδο διχοτόμησης. | |
\subsection{Μέθοδος Μεταβαλλόμενης Χορδής} | |
\begin{tikzpicture}[scale=2] | |
\draw (0,-0.2) -- (0,2); | |
\draw (-0.5,0) -- (3,0); | |
\draw[dashed] (2.7,1.7) node [right] {$\left(b_1,f(b_1)\right)$}-- (2.7,0); | |
\draw[very thick, blue!50!magenta] plot[smooth,tension=1] | |
coordinates {(0.5,-0.4) (2,0.3) (2.7,1.7)}; | |
\draw[dashed] (0.5,-0.4) -- (0.5,0) node[above] {$a_1$}; | |
\draw[draw=cyan,thick] (0.5,-0.4) -- (2.7,1.7); | |
\draw[dashed] (0.93,-0.3) -- (0.93,0) node[above,yshift=1mm] {$a_2$}; | |
\draw [draw=cyan,thick] (0.93,-0.3) -- (2.7,0.85) | |
node[right] {$ \left(b_1,\frac{f(b_1)}{2}\right)$}; | |
\draw (1.4,0) node[above] {$a_3$} -- (1.4,-0.12); | |
\end{tikzpicture} | |
Όπως η μέθοδος χορδής, αλλά μεταβάλλουμε την κλίση | |
της χορδής γρηγορότερα, ώστε να φτάσει πιο κοντά | |
στη ρίζα. | |
Αυτό μπορούμε να το πετύχουμε π.χ. θεωρώντας | |
ως 2\textsuperscript{ο} σημείο το \( \left(b_1,\frac{f(b_1)}{2}\right) \) | |
αντί για το \( \left( b_1,f(b_1) \right) \), όπως φαίνεται στο | |
σχήμα. Αντί για να διαιρέσουμε με 2, μπορούμε να επιλέξουμε έναν | |
άλλον αριθμό, π.χ. \( 4 \) για συναρτήσεις που έχουν πιο κάθετες | |
χορδές. | |
\subsection{Μέθοδος Newton} | |
Αν και η μέθοδος Newton δεν συγκλίνει πάντα και απαιτεί παραγωγισιμότητα, | |
είναι πολύ πιο γρήγορη από τις προηγούμενες μεθόδους, και χρησιμοποιείται | |
πολύ πιο συχνά. | |
Παίρνουμε το ανάπτυγμα Taylor της \( f \): | |
\begin{gather*} | |
f(x) = f(x_0) + (x-x_0)f'(x_0) \\ | |
f(x_0) + (x-x_0) f'(x_0) = 0 \\ | |
\boxed{x = x_0 - \frac{f(x_0)}{f'(x_0)}} | |
\end{gather*} | |
\paragraph{} | |
for \( \kappa = 1,2,\dots \) | |
\[ | |
x_{\kappa+1} = x_\kappa - \frac{f(x_1)}{f'(x_1)} \ | |
\rightarrow \text{ΕΠΑΝΑΛΗΠΤΙΚΗ} | |
\] | |
\begin{gather*} | |
\mathlarger{\text{if }} \left|x_{\kappa+1}-x_\kappa\right|<\epsilon \ | |
\rightarrow \text{ΚΡΙΤΗΡΙΟ ΤΕΡΜΑΤΙΣΜΟΥ} \\ | |
\mathlarger{\text{stop}}, \text{ αλλιώς } \kappa = \kappa+1 | |
\end{gather*} | |
Η μέθοδος Newton έχει αρκετά περίπλοκες συνθήκες | |
σύγκλισης που δεν θα μελετήσουμε. | |
\subsection{Μέθοδος Σταθερού Σημείου} | |
Ένα σημείο \(\bar x \) της \( f(x) \) λέγεται | |
\textbf{σταθερό σημείο} αν \( f(\bar x)=\bar x \). | |
\begin{defn}{Σταθερό Σημείο}{} | |
\[ | |
\begin{array}{ll} | |
f(x) & \quad \text{το $\bar{x}$ σταθερό σημείο} | |
\\ | |
\text{ανν} & \quad f(\bar x) = \bar x | |
\end{array} | |
\] | |
\end{defn} | |
Μπορώ να βρω μια ρίζα \( \bar x \) της \( f(x) \) στο \( (a,b) \) | |
αν κατασκευάσω \( g(x) \) τέτοια ώστε το \(\bar x \) να είναι σταθερό σημείο | |
της \( g \): | |
\[ | |
\bar x = g(\bar x) \iff f(\bar x) = 0 | |
\] | |
\paragraph{Παράδειγμα} | |
\[ | |
\mathlarger{f(x) = x^2-x-2} | |
\] | |
Μπορούμε να θέσουμε: | |
\begin{gather*} | |
g(x) = x^2 - 2 \\ | |
g(x) = \sqrt{x+2} \\ | |
g(x) = 1 - \frac{2}{x} | |
\end{gather*} | |
Αντί να λύσω την \( f \), βρίσκω υποψήφιες λύσεις | |
μέσω της \(g\), όπως φαίνεται παρακάτω. | |
Αν η εύρεση μιας κατάλληλης συνάρτησης είναι δύσκολη στις | |
εξετάσεις, θα δίνεται η \( g(x) \). | |
\paragraph{Μέθοδος} | |
\hspace{0pt} | |
for \(i=1,2,\dots \qquad \left(x_0,g(x),\epsilon\right) \) | |
\[ | |
\mathlarger{\mathlarger{x_i = g\left( x_{i-1} \right)}} | |
\] | |
\[ | |
\begin{array}{rl} | |
\mathlarger{\text{if }} | |
\left|x_i-g(x_i)\right| < \epsilon | |
& \rightarrow \text{ΚΡΙΤΗΡΙΟ ΤΕΡΜΑΤΙΣΜΟΥ} | |
\end{array} | |
\] | |
\paragraph{Προϋποθέσεις σύγκλισης} | |
\begin{enumerate} | |
\item Για αρχικό \( x_0 \), τα \( x_1,x_2,\dots \) να | |
είναι υπολογίσιμα στην \( g(x) \) | |
\subparagraph{π.χ.} | |
\( g(x) = -\sqrt{x} \quad \) για \( x_0 > 0 \) | |
\begin{gather*} | |
x_1 = g(x_0) = -\sqrt{x_0} \\ | |
x_2 = g(x_1) = -\sqrt{x_1} | |
\end{gather*} | |
\item \( x_1,x_2,\dots \) να συγκλίνουν σε ένα | |
\( \bar x \) | |
\item Το σημείο σύγκλισης \( \gamma \) να είναι σταθερό | |
σημείο της \( g(x) \). | |
\end{enumerate} | |
Τα παραπάνω μετασχηματίζονται σε 3 κριτήρια σύγκλισης: | |
\paragraph{Κριτήρια Σύγκλισης} | |
\begin{enumerate} | |
\item Υπάρχει \( [a,b] \) στο οποίο ορίζεται η | |
\( g(x) \) και \( g(x) \in [a,b] \), δηλαδή: | |
\[ | |
g: [a,b] \to [a,b] | |
\] | |
\item \( g(x) \) συνεχής στο \( [a,b] \) | |
\item \( g(x) \) παραγωγίσιμη και να υπάρχει \(k<1\): | |
\[ | |
\forall x \in [a,b], \ | |
\left|g'(x)\right| \leq k | |
\] | |
\end{enumerate} | |
\paragraph{Θεώρημα} | |
Αν ισχύουν οι 3 παραπάνω προϋποθέσεις, τότε στο διάστημα | |
\( [a,b] \) υπάρχει ακριβώς ένα σταθερό σημείο \(\gamma\) | |
της \(g\), και η μέθοδος σταθερού σημείου συγκλίνει σε αυτό | |
το \( \gamma \). | |
\subsection{Ασκήσεις} | |
\paragraph{Άσκηση} | |
\[ | |
\mathlarger{x^3+2x-1=0} | |
\] | |
Να αποδειχθεί ότι έχει μια μόνο ρίζα στο \( \left[0,\frac{1}{2}\right] \) και | |
να προσεγγιστεί με τη μέθοδο σταθερού σημείου. | |
\subparagraph{Λύση} | |
\[ \left. | |
\begin{array}{l} | |
f(0) = -1,\ f\left(\frac{1}{2}\right) = \frac{1}{8} \implies | |
f(0)f\left(\frac{1}{2}\right) < 0 \\ | |
f'(x) = 3x^2 + 2 > 0 | |
\end{array} \right\rbrace \text{μοναδικότητα} | |
\] | |
\begin{gather*} | |
g(x) = x \iff f(x) = 0 \\ | |
g(x) = \frac{1}{2} (1-x^3) \text{ (περιμένω να δουλέψει, δηλαδή να ικανοποιούνται | |
τα κριτήρια σύγκλισης)} | |
\end{gather*} | |
\begin{align*} | |
&\mathrm Y_1 \ \checkmark \\ | |
&\mathrm Y_2 \ \checkmark \\ | |
&\mathrm Y_3:\ g'(x) = \frac{-3}{2} x^2 \\ | |
&\ \left|g'(x)\right| = \frac{3}{2} x^2 \leq \frac{3}{2}\left(\frac{1}{2}\right)^2 | |
= \frac{3}{8} < 1 \\ | |
\text{Άρα: } & \mathrm Y_3 \ \checkmark | |
\end{align*} | |
(όπου \( \mathrm Y \) τα κριτήρια σύγκλισης) | |
Επομένως, η \( g(x) \) που επέλεξα ικανοποιεί τη σύγκλιση. | |
Επιλέγω: \( x_0 = 0 \) | |
\begin{align*} | |
x_1 &= g(x_0) = g(0) = \frac{1}{2} \\ | |
x_2 &= g(x_1) = g\left(\frac{1}{2}\right) = \frac{1}{2}\left( | |
1-\left(\frac{1}{2}\right)^3 | |
\right) = 0.4375 \\ | |
x_3 &= g(x_2) = \frac{1}{2} \left(1 - 0.4375^3\right) = 0.4581298 \\ | |
x_4 &= g(x_3) = \frac{1}{2} \left(1-0.4581298^3\right) = 0.451923191 | |
\end{align*} | |
\paragraph{Άσκηση} | |
Να υπολογιστεί ένας τύπος με τη μέθοδο Newton που θα βρίσκει την τετραγωνική ρίζα θετικού | |
αριθμού. | |
\subparagraph{Λύση} | |
\begin{gather*} | |
x = \sqrt{a} \implies x^2=a \\[0.3ex] \\ | |
f(x) = x^2-a \\ | |
f'(x) = 2x \\ | |
x_{n+1} = x_n - \frac{f(x_n)}{f'(x_n)} = x_n - \frac{x_n^2-a}{2x_n} | |
= \frac{1}{2} \left( x_n + \frac{a}{x_n} \right) | |
\end{gather*} | |
\subparagraph{Παράδειγμα} | |
\[ | |
\mathlarger{\sqrt{3} = ?, \qquad \text{με } x_0 = 1.5} | |
\] | |
\begin{gather*} | |
x_1 = \frac{1}{2} \left(x_0+\frac{3}{x_0}\right) | |
= \frac{1}{2} \left(1.5+\frac{3}{1.5}\right) = 1.75 \\ | |
x_2 = \frac{1}{2} \left(x_1+\frac{3}{x_1}\right) = 1.7321428 \\ | |
\intertext{Υπολογισμός με ακρίβεια 3 δεκαδικών ψηφίων (δύο διαδοχικές ρίζες | |
να απέχουν \( 0.5\cdot 10^{-3} \implies \)) | |
(σφάλμα) \(\to 0.5\cdot 10^{-3}\) } | |
x_3 = \frac{1}{2} \left( x_2 + \frac{3}{x_2} \right) = 1.7320528 \\ | |
\left|x_3-x_2\right| < 0.5\cdot 10^{-3} \text{ (ικανοποίηση κριτηρίου τερματισμού)} | |
\end{gather*} | |
Άρα: | |
\[ | |
\boxed{x_3 = 1.7320528} | |
\] | |
\paragraph{Άσκηση} | |
\[ | |
\mathlarger{x^3+2x^2+10x-20=0} | |
\] | |
Να προσεγγιστεί μια ρίζα της παραπάνω εξίσωσης (π.χ. για 3 επαναλήψεις) | |
\subparagraph{Λύση} | |
\begin{gather*} | |
x_{n+1} = x_n - \frac{f(x_n)}{f'(x_n)} = \frac{2x_n^3+2x_n^2+20}{3x_n^2+4x_n+10} \\ | |
x_0 = 1 \\ | |
x_1 = \frac{2\cdot 1^3 + 2\cdot 1^2 + 20}{3\cdot 1^2 + 4\cdot 1 + 10} | |
= \dots = 1.41764706 \\ | |
x_2 = \frac{2x_1^3+2x_1^2+20}{3x_1^2+4x_1+20} = 1.369336471 \\ | |
x_3 = \frac{2x_2^3+2x_2^2+20}{3x_2^2+4x_2+10} = 1.368908108 | |
\end{gather*} | |
\paragraph{Άσκηση} | |
Να βρεθεί μια λύση της εξίσωσης | |
\[ | |
\mathlarger{x^3+x-1} | |
\] | |
στο διάστημα \( (0,1) \) | |
με ακρίβεια 2 δεκαδικών ψηφίων χρησιμοποιώντας τη μέθοδο | |
χορδής, και να συγκριθεί με τη μέθοδο Newton. | |
\subparagraph{Λύση (με μέθοδο χορδής)} | |
\begin{align*} | |
x_{n+1} &= x_n - f(x_n)\frac{x_n-x_{n-1}}{f(x_n)-f(x_{n-1})} | |
\\ | |
x_2 &= x_1 - f(x_1) \frac{x_1-x_0}{f(x_1)-f(x_0)} | |
= 1-1\frac{1}{2} = 0.5 | |
\\ | |
x_3 &= x_2 - f(x_2) \frac{x_2-x_1}{f(x_2)-f(x_1)} = 0.636 | |
\\ | |
x_4 &= x_3 - f(x_3) \frac{x_3-x_2}{f(x_3)-f(x_2)} = 0.606 | |
\\ | |
\vdots | |
\\ x_6 &= \dots = 0.687 | |
\\ x_7 &= \dots = 0.682 | |
\end{align*} | |
Άρα με ακρίβεια 2 δεκαδικών ψηφίων, \( \rho=0.68 \), και | |
χρησιμοποιήσαμε 7 επαναλήψεις. | |
\subparagraph{Λύση με μέθοδο Newton} | |
\begin{align*} | |
x_{n+1} &= x_n - \frac{f(x_n)}{f'(x_n)} \\ | |
x_{n+1} &= x_n - \frac{x_n^3+x_n-1}{3x_n^2+1} \\ | |
x_{n+1} &= \frac{2x_n^3+1}{3x_n^2+1} \\ | |
\intertext{\(x_0 = 0.5\)} | |
x_1 &= \frac{2\cdot 0.5^2 + 1}{3\cdot 0.5^2+1} | |
= 0.714 \\ | |
x_2 &= 0.683 \\ | |
x_3 &= 0.682 | |
\end{align*} | |
\paragraph{Άσκηση} | |
Να βρεθεί μια λύση της: | |
\[ | |
\mathlarger{f(x) = x^{10} -1} \qquad (0,1.3) | |
\] | |
\begin{tikzpicture}[scale=.7] | |
\begin{axis}[samples=30,very thick,domain=0:1.3,no marks] | |
\addplot+{x^10-1}; | |
\end{axis} | |
\end{tikzpicture} | |
\subparagraph{Λύση με διχοτόμηση} | |
Με τη μέθοδο της διχοτόμησης έχουμε: | |
\[ | |
\begin{array}{c|c|c} | |
a_k & b_k & c \\ \hline | |
0 & 1.3 & 0.65 \\ | |
0.65 & 1.3 & 0.975 \\ | |
0.975 & 1.3 & 1.1375 \\ | |
0.975 & 1.1375 & 1.05625 \\ | |
0.975 & 1.05625 & 1.015625 | |
\end{array} | |
\] | |
\subparagraph{Λύση με μέθοδο χορδής} | |
Με τη μέθοδο της χορδής έχουμε (εφαρμόζοντας τον τύπο | |
όπως και στην προηγούμενη άσκηση): | |
\[ | |
\begin{array}{c|c|c} | |
a_k & b_k & c \\ \hline | |
0 & 1.3 & 0.09430 \\ | |
0.09430 & 1.3 & 0.18176 \\ | |
0.18176 & 1.3 & 0.26287 \\ | |
0.26287 & 1.3 & 0.33811 \\ | |
0.33811 & 1.3 & 0.40708 | |
\end{array} | |
\] | |
Παρατηρούμε ότι σε αυτήν την περίπτωση, η μέθοδος χορδής | |
είναι αρκετά πιο αργή. Για να το αποτρέψουμε αυτό, μπορούμε | |
να χρησιμοποιήσουμε μεταβαλλόμενη χορδή. | |
\subparagraph{Λύση με μέθοδο Newton} | |
\[ | |
x_{i+1} = x_i - \frac{x_i^{10}-1}{10x_i^9} | |
\] | |
\[ | |
\begin{array}{c|c} | |
i & x_i \\ \hline | |
0 & 0.5 \\ | |
1 & 51.65 \\ | |
2 & 46.485 \\ | |
3 & 41.8365 \\ | |
4 & 37.65285 \\ | |
\vdots & \vdots \\ | |
40 & 1.002316 | |
\end{array} | |
\] | |
\paragraph{Άσκηση} | |
Να βρεθεί μία ρίζα της εξίσωσης | |
\[ | |
\mathlarger{f(x) = x^3-2x-5} | |
\] | |
στο διάστημα \( [2,3] \) χρησιμοποιώντας τη μέθοδο της | |
διχοτόμησης, με ακρίβεια \( \epsilon = 10^{-6} \). | |
\subparagraph{Λύση} | |
\[ | |
\begin{array}{r|c|c|c} | |
i & a_k & b_k & c \\ \hline | |
1 & 2 & 3 & 2.5 \\ | |
2 & 2 & 2.5 & 2.25 \\ | |
3 & 2 & 2.25 & 2.125 \\ | |
\vdots & \vdots & \vdots & \vdots \\ | |
19 & & & 2.0945530 | |
\end{array} | |
\] | |
\section{Παρεμβολή} | |
\subsection{Το πρόβλημα} | |
Έστω μια άγνωστη \( f(x) \) ορισμένη στο \( [a,b] \) και οι τιμές | |
\( x_i\ (i=0,\dots,n-1) \). Επίσης, έστω μια \( p(x) \) που | |
παρεμβάλλει την \( f(x) \), δηλαδή: | |
\[ | |
p(x_i) = f(x_i). | |
\] | |
Θα ψάξω να βρω την \( p(x) \) με βάση τις τιμές \( p(x_i) \). | |
Όταν ψάχνω να βρω μια προσέγγιση για κάποια τιμή \( \bar x \ | |
(\bar x \in \left[x_0,x_{n-1}\right]) \) με βάση την \( p(x) \) που | |
προκύπτει με δεδομένες τιμές για \( x_i \), λέγεται ότι κάνω | |
\textbf{intrapolation}. \\ | |
Για \( \bar x \notin \left[x_0,x_{n-1}\right] \) (πιο επικίνδυνη | |
περίπτωση), ονομάζεται \textbf{extrapolation}. | |
\begin{theorem}{}{Weierstrass} | |
Για οποιαδήποτε συνάρτηση, υπάρχει ένα πολυώνυμο που την | |
παρεμβάλλει, δηλαδή: | |
\[ | |
\lim_{n\to \infty} P_n(x) = f(x) | |
\] | |
\end{theorem} | |
\begin{tikzpicture} | |
\draw (-1,0) -- (3,0); | |
\draw (0,0) -- (0,3); | |
\draw[green!50!black,very thick] plot[smooth] coordinates {(-0.7,0.8) (-0.5,1) (1,1) (2,1.2) (2.5,1.3)} | |
node[below right] {$f(x)$}; | |
\draw[cyan!50!black,very thick] plot[smooth] coordinates {(-0.8,0.9) (-0.5,1.2) (1,1.1) (2,1.3) (2.5,1.7)} | |
node[right] {$p(x)$}; | |
\end{tikzpicture} | |
Και μάλιστα: | |
\[ | |
\left|P_n(x)-f(x)\right| \leq \epsilon \quad | |
\text{$\epsilon$ δεδομένη ακρίβεια} | |
\] | |
Όσο το \( \epsilon \) μικραίνει, ο βαθμός του \( P_n(x) \) αυξάνεται. | |
Για παράδειγμα, αν έχουμε μερικά σημεία της \( f \): | |
\[ | |
\begin{array}{c|c|c|c|c} | |
x_i & 1 & 2 & 3 & 4 \\ \hline | |
f(x_i) & 7 & 12 & 21 & 20 | |
\end{array} | |
\] | |
ψάχνω ένα πολυώνυμο (κάποιου βαθμού) που να περνάει από αυτά τα | |
σημεία. | |
\begin{tikzpicture} | |
\draw (-1,0) -- (3,0); | |
\draw (0,-0.5) -- (0,2); | |
\filldraw[cyan] (0.5,0.5) circle (2.5pt) | |
(0.9,1) circle (2.5pt) | |
(1.5,1.5) circle (2.5pt) | |
(2.4,0.7) circle (2.5pt); | |
\draw[green!30!black,very thick] plot[smooth,tension=0.7] | |
coordinates {(0.1,0,1) (0.5,0.5) (0.9,1) (1.5,1.5) (2.4,0.7) (2.6, 0.2)} | |
node[right,scale=0.6] {$p(x)$}; ; | |
\end{tikzpicture} | |
Αν έχω δύο σημεία, το ζητούμενο πολυώνυμο είναι μια ευθεία, δηλαδή | |
ένα πολυώνυμο 1\textsuperscript{ου} βαθμού. Για τρία σημεία, θα | |
χρειαστώ πολυώνυμο 2\textsuperscript{ου} βαθμού, και γενικά έχω | |
ένα μοναδικό | |
πολυώνυμο \( n \) βαθμού για \( n+1 \) διακριτά σημεία, | |
όπως θα δούμε αργότερα. | |
\begin{tikzpicture}[scale=1.3] | |
\draw (-1,0) -- (1,0); | |
\draw (0,-0.5) -- (0,1.5); | |
\filldraw[cyan!50!blue] (-0.5,1) circle (2pt) | |
(0,0) circle (2pt) | |
(0.5,1) circle (2pt); | |
\draw[red!90!blue,very thick] (0,0) -- (0.5,1) --(0.7,1.4); | |
\draw[green!30!black,very thick] plot[smooth,tension=0.7] | |
coordinates {(-0.5,1) (0,0) (0.5,1)}; | |
\begin{scope}[xshift=2.5cm] | |
\draw (-0.2,0) -- (2,0); | |
\draw (0,-0.5) -- (0,1.5); | |
\draw[red!90!blue,very thick] (0.1,-0.2) -- (2.2,2.2); | |
\draw[green!70!black,thick] plot[smooth,tension=0.7] | |
coordinates {(0.25,0) (0.5,0.25) (0.75,1.2) (1.25,0.8) (1.5,1.45) (2,2)}; | |
\filldraw[green!50!red] (0.5,0.25) circle (1pt) (1.5,1.45) circle (1pt); | |
\end{scope} | |
\end{tikzpicture} | |
Η πραγματική συνάρτηση μπορεί να έχει διαφορετική συμπεριφορά | |
ανάμεσα στα σημεία της τα οποία γνωρίζουμε. | |
Στο επόμενο κεφάλαιο θα μάθουμε την προσέγγιση, δηλαδή την εύρεση | |
ενός πολυωνύμου συγκεκριμένου βαθμού που να φτάνει κοντά στην | |
\( f \), έτσι ώστε να είναι πιο εύκολα υπολογίσιμο αν π.χ. έχουμε | |
300 σημεία της συνάρτησης. | |
\subsection{Μορφές Αναπαράστασης Πολυωνύμου} | |
\paragraph{Εκθετική μορφή} | |
\( | |
\displaystyle P_n(x) = a_0 + a_1x+a_2x^2 + \dots + a_nx^n | |
\) | |
\paragraph{Μορφή κέντρων} | |
\( | |
\displaystyle P_n(x) = b_0 + b_1(x-c) + b_2(x-c)^2 + \dots | |
+ b_n(x-c)^n | |
\) | |
\paragraph{Μορφή Newton} | |
\( | |
\displaystyle P_n(x) = a_0 + a_1(x-c_1) + a_2(x-c_1)(x-c_2) | |
+ \dots + a_n(x-c_1)(x-c_2)\cdots(x-c_n) | |
= a_0 + \sum_{k=1}^{n} a_k \prod_{i+1}^{k} (x-c_i) | |
\) | |
\paragraph{Φωλιασμένη μορφή Newton} | |
\begin{align*} | |
P_n(x) &= a_0 + (x-c_1)\left[a_1 | |
+ a_2(x-c_2) + a_3(x-c_2)(x-c_3) + \dots + a_n(x-c_2)\cdots(x-c_n) | |
\right] = \dots \\ &= a_0 + (x-c_1)\left[a_1+(x-c_2) | |
\left[a_2+ (x-c_3)\left[a_3+\dots + (x-c_{n-1})\left[ | |
a_{n-1}+(x-c_n)a_n | |
\right]\right]\right] | |
\right] | |
\end{align*} | |
\paragraph{Μορφή Lagrange} | |
Δεδομένων \( n+1 \) σημείων \( x_0,x_1,\dots,x_n \), έχουμε | |
τα πολυώνυμα: | |
\begin{align*} | |
l_j(x) &= \frac{ | |
(x-x_0)(x-x_1)\cdots(x-x_{j-1})(x-x_{j+1})\cdots(x-x_n) | |
}{ | |
(x_j-x_0)(x_j-x_1)\cdots(x_j-x_{j-1})(x_j-x_{j+1}) | |
\cdots (x_j-x_n) | |
} \\ | |
&= | |
\prod_{\substack{i=0\\i\neq j}}^{n}\frac{(x-x_i)}{(x_j-x_i)} | |
\end{align*} | |
για \( j=0,1,\dots,n \) ονομάζονται \textbf{πολυώνυμα Lagrange} (ο | |
παρονομαστής σταθερός). | |
Παρατηρούμε ότι τα πολυώνυμα είναι φτιαγμένα με τέτοιον τρόπο ώστε: | |
\[ | |
l_j(x_i) = \begin{cases} | |
0 & \quad i \neq j \\ | |
1 & \quad i = j | |
\end{cases} \ = \delta_{ij} | |
\] | |
Άρα για σταθερές \( a_0,a_1,\dots,a_n \) και σημεία \( x_0,x_1, | |
\dots,x_n \), το πολυώνυμο \[ | |
P_n(x) = a_0l_0(x) + a_1l_1(x) + \dots + a_nl_n(x) | |
\] | |
ονομάζεται \textbf{πολυώνυμο σε μορφή Lagrange}. | |
\subsection{Μέθοδοι Παρεμβολής} | |
\begin{gather*} | |
P(x_i) = f(x_i) \\ | |
P(x_i) = \sum_{k=0}^{n} a_kl_k(x_i) = a_i \\[.3ex] | |
\boxed{P(x) = \sum_{k=0}^n f(x_k)l_k(x)} | |
\end{gather*} | |
\paragraph{Παράδειγμα} | |
Έχουμε τη συνάρτηση: | |
\[ | |
\begin{array}{r|c|c|c} | |
i & 0 & 1 & 2 \\ \hline | |
x_i & -1 & 0 & 1 \\ \hline | |
f(x_i) & 1 & 1 & 2 | |
\end{array} | |
\] | |
Αναζητώ πολυώνυμο που να παρεμβάλλει την \( f \) σε | |
\begin{enumgreekpar} | |
\item μορφή Lagrange | |
\item εκθετική μορφή | |
\end{enumgreekpar} | |
\subparagraph{Λύση} | |
\begin{align*} | |
l_0(x) &= | |
\frac{(x-0)(x-1)}{(-1-0)(-1-1)} = \frac{x(x-1)}{2} \\ | |
l_1(x) &= | |
\frac{(x+1)(x-1)}{(0+1)(0-1)} = 1-x^2 \\ | |
l_2(x) &= \frac{(x+1)(x-0)}{(1+1)(1-0)} = \frac{x(x+1)}{2} \\ | |
\Aboxed{P(x) &= 1l_0(x)+1l_1(x)+2l_2(x)} | |
\quad \leftarrow \text{ μορφή Lagrange} | |
\\ &= \frac{1}{2}x^2 + \frac{1}{2}x + 1 | |
\quad \leftarrow \text{ εκθετική μορφή} | |
\end{align*} | |
Ένας άλλος τρόπος θα ήταν να θεωρήσουμε πολυώνυμο | |
2\textsuperscript{ου} βαθμού με 3 άγνωστους συντελεστές, και να λύσω | |
το σύστημα για να τους βρω, κάτι που θα χρησιμεύει αργότερα στην | |
προσέγγιση: | |
\begin{align*} | |
P(x) &= a_0 + a_1x + a_2x^2 \\ | |
P(-1) &= a_0 - a_1 + a_2 = 1 \\ | |
P(0) &= a_0 = 1 \\ | |
P(1) &= a_0 + a_1 + a_2 = 2 | |
\end{align*} | |
\subsubsection{Μέθοδος διηρημένων διαφορών} | |
Η ιδέα είναι να ξεκινάμε από τον μικρό βαθμό, και να χτίζουμε το | |
ζητούμενο πολυώνυμο βαθμό-βαθμό. | |
\begin{align*} | |
P_{k+1}(x) &= | |
\underbrace{a_0+a_1(x-x_0)+\dots+a_k(x-x_0)\cdots(x-x_{k-1})}_{% | |
P_k(x)} + a_{k+1} (x-x_0)\cdots(x-x_k) \\[.4ex] | |
f(x_{k+1}) &= P_{k+1}(x_{k+1}) | |
= P_k(x_{k+1}) + a_{k+1}\prod_{i=0}^{k} \left(x_{k+1}-x_i\right) \\ | |
a_{k+1} &= \frac{f(x_{k+1}) - P_k(x_{k+1})}{ | |
\prod_{i=0}^{k} \left(x_{k+1}-x_i\right) | |
} | |
\end{align*} | |
Για να διευκολύνω τις πράξεις ορίζω: | |
\begin{defn}{Πρώτη Διηρεμένη Διαφορά}{} | |
\[ | |
\mathlarger{ | |
f\left[x_i,\ x_{i+1}\right] = | |
\frac{f(x_{i+1})-f(x_i)}{x_{i+1}-x_i} | |
} | |
\] | |
\end{defn} | |
Η \( k \)-οστή Διηρεμένη Διαφορά είναι: | |
\begin{defn}{k-οστή Διηρεμένη Διαφορά}{} | |
\[ | |
\mathlarger{ | |
f\left[x_i,\ x_{i+1}, \dots,\ x_{i+k}\right] = | |
\frac{ | |
f[x_{i+1},x_{i+2},\dots,x_{i+k}] | |
- f[x_i,x_{i+1},\dots,x_{i+k-1}] | |
}{x_{i+k}-x_i} | |
} | |
\] | |
\end{defn} | |
Για διευκόλυνσή μας, αντί να χρησιμοποιούμε τους τύπους, μπορούμε | |
να χρησιμοποιήσουμε τον Πίνακα Διηρημένων Διαφορών. | |
\paragraph{Πίνακας ΔΔ} | |
\[ | |
\begin{array}{llllll} | |
& & 1^{\text{η}} & 2^\text{η} & 3^\text{η} & 4^\text{η}\\ | |
x_0 & f(x_0) & f[x_0,x_1] & = \frac{f(x_1)-f(x_0)}{x_1-x_0} & \\ | |
x_1 & f(x_1) & f[x_1,x_2] & f[x_0,x_1,x_2] & = | |
\frac{f[x_1,x_2]-f[x_0,x_1]}{x_2-x_0} \\ | |
x_2 & f(x_2) & f[x_2,x_3] & f[x_1,x_2,x_3] & f[x_0,x_1,x_2,x_3] & | |
=\frac{f[x_1,x_2,x_3]-f[x_0,x_1,x_2]}{x_3-x_0} \\ | |
x_3 & f(x_3) & f[x_3,x_4] & f[x_2,x_3,x_4] & f[x_1,x_2,x_3,x_4] | |
& f[x_0,x_1,x_2,x_3,x_4] | |
\\ | |
x_4 & f(x_4) & & | |
\end{array} | |
\] | |
Τότε το πολυώνυμο θα είναι: | |
\begin{align*} | |
P_k(x) &= f(x_0) + f[x_0,x_1](x-x_0) + | |
f[x_0,x_1,x_2](x-x_0)(x-x_1) | |
\\ & + \dots + | |
f[x_0,x_1,\dots,x_k](x-x_0)(x-x_1)\cdots(x-x_{k-1}) | |
\end{align*} | |
\paragraph{Παράδειγμα} | |
\hspace{0pt} | |
\begin{tabular}{|c|c|c|c|c|} | |
\hline | |
\(i\) & 0 & 1 & 2 & 3 \\ | |
\hline | |
\(x_i\) & 0 & 1 & 2 & 4 \\ | |
\hline | |
\(f(x_i)\) & 1 & 1 & 2 & 5 \\ | |
\hline | |
\end{tabular} | |
Πίνακας ΔΔ: | |
\[ | |
\begin{array}{ccccc} \cline{2-2} | |
0 & \multicolumn{1}{|c|}{1 \searrow} & & & \\ \cline{2-3} | |
& & \multicolumn{1}{|c|}{\frac{1-1}{1-0} \searrow} & & \\ \cline{3-4} | |
1 & 1 \nesearrow & & | |
\multicolumn{1}{|c|}{\frac{1}{2} \searrow} & \\ \cline{4-5} | |
& & 1 \nesearrow & & \multicolumn{1}{|c|}{-\frac{1}{12}}\\ \cline{5-5} | |
2 & 2 \nesearrow & & \frac{1}{6} \nearrow & \\ | |
& & \frac{3}{2} \nearrow & & \\ | |
4 & 5 \nearrow & & & | |
\end{array} | |
\] | |
Άρα: | |
\begin{align*} | |
P_3(x) &= 1 + 0(x-0) + \frac{1}{2}(x-0)(x-1)-\frac{1}{12} | |
(x-0)(x-1)(x-2) \\ &= \frac{1}{12} (-x^3+9x^2-8x+12) | |
\end{align*} | |
\begin{tikzpicture} | |
\begin{axis}[grid=both,ymin=0,ymax=10,xmax=7,xmin=-3,xticklabel=\empty,yticklabel=\empty, | |
minor tick num=1,axis lines = middle,xlabel=$x$,ylabel=$y$,label style = | |
{at={(ticklabel cs:1.1)}}] | |
\addplot[blue,thick,samples=50,domain=-3:7] {1/12*(-x^3+9*x^2-8*x+12)}; | |
\filldraw [fill=gray!30, draw=black, thick] (axis cs:0,1) circle [radius=3pt]; | |
\filldraw [fill=gray!30, draw=black, thick] (axis cs:1,1) circle [radius=3pt]; | |
\filldraw [fill=gray!30, draw=black, thick] (axis cs:2,2) circle [radius=3pt]; | |
\filldraw [fill=gray!30, draw=black, thick] (axis cs:4,5) circle [radius=3pt]; | |
% nice node: node [label={[inner sep=1pt, fill=white,text=black, fill opacity=0.75, text opacity=1]above left:$(65, 35)$}] {}; | |
\end{axis} | |
\end{tikzpicture} | |
\subsubsection{Μέθοδος πεπερασμένων διαφορών} | |
Για τη μέθοδο αυτή, θεωρούμε ότι τα σημεία της \( f \) | |
που έχουμε ισαπέχουν μεταξύ τους: | |
\begin{gather*} | |
x_0,x_1,\dots,x_n \ \in [a,b] \\ | |
x_i = x_0 + ih \quad \text{όπου } h=\frac{b-a}{n} | |
\\[.4ex] | |
f\left[x_i,x_{i+1}\right] = | |
\frac{f(x_{i+1})-f(x_i)}{h} | |
\end{gather*} | |
Ορίζω συμβολισμούς για ευκολία: | |
\begin{align*} | |
\Delta^0 f(x_i) &= f(x_i) \\ | |
\Delta^1 f(x_i) &= | |
f(x_{i+1}) - f(x_i) = f(x_i+h) - f(x_i) \\ | |
\vdots \\ | |
\Delta^k f(x_i) &= | |
\Delta \left(\Delta^{k-1}\left(f(x_i)\right)\right) | |
= \Delta^{k-1} f(x_{i+1}) - \Delta^{k-1} f(x_i) | |
\end{align*} | |
\begin{defn}{k-οστή πεπερασμένη διαφορά}{} | |
\[ | |
f\left[x_i,x_{i+1},\dots,x_{i+k}\right] | |
= \frac{\Delta^k f(x_i)}{k! h^k} | |
\qquad \text{προκύπτει μετά από πράξεις} | |
\] | |
\end{defn} | |
Άρα το πολυώνυμο γίνεται: | |
\begin{align*} | |
P_n(x) &= f(x_0) + f[x_0,x_1](x-x_0) + \dots | |
\\ & \quad \dots + | |
f[x_0,x_1,\dots,x_n](x-x_0)(x-x_1)\dots(x-x_{n-1}) | |
\\ &= f(x_0) + \frac{\Delta^1 f(x_0)}{1!h^1}(x-x_0) | |
+ \frac{\Delta^2 f(x_0)}{2!h^2}(x-x_0)(x-x_1) + \dots \\ | |
& \quad \dots + \frac{\Delta^n f(x_n)}{n!h^n} | |
(x-x_0)(x-x_1)\cdots | |
(x-x_{n-1}) | |
\end{align*} | |
Θα βρούμε μια διαδικασία ώστε να υπολογίζουμε το πολυώνυμο | |
γρηγορότερα. Αν \( x = x_0+rh \), αποδεικνύεται πως | |
(οι πράξεις υπάρχουν στο βιβλίο): | |
\[ | |
\mathlarger{ | |
\boxed{ | |
P_n(x_0+rh) = \sum_{i=0}^{n} | |
\left(\begin{matrix} | |
r\\i | |
\end{matrix}\right) | |
\Delta^i f(x_0) | |
} | |
} | |
\] | |
όπου \( \displaystyle \binom{r}{i} = | |
\frac{r(r-1)\cdots\left(r-(i-1)\right)}{i!} \) | |
\paragraph{Παράδειγμα} | |
\hspace{0pt} | |
\begin{tabular}{|c|c|c|c|c|c|} | |
\hline | |
\(i\) & 0 & 1 & 2 & 3 & 4\\ | |
\hline | |
\(x_i\) & 1 & 2 & 3 & 4 & 5\\ | |
\hline | |
\(f(x_i)\) & 1 & -1 & 1 & -1 & 1\\ | |
\hline | |
\end{tabular} | |
\[ | |
\begin{array}{|c|c|c|c|c|c|} | |
\hline | |
x_0 & f(x_0) \searrow & & & & \\ \hline | |
& & \Delta^1 f(x_0) \searrow & & & \\ \hline | |
x_1 & f(x_1) \nesearrow & & \Delta^2 f(x_0) \searrow & & \\ \hline | |
& & \Delta^1 f(x_1) \nesearrow & & \Delta^3 f(x_0) \searrow & \\ \hline | |
x_2 & f(x_2) \nesearrow & & \Delta^2 f(x_1) \nesearrow & & \Delta^4 f(x_0) \\ \hline | |
& & \Delta^1 f(x_2) \nesearrow & & \Delta^3 f(x_1) \nearrow & \\ \hline | |
x_3 & f(x_3) \nesearrow & & \Delta^2 f(x_2) \nearrow & & \\ \hline | |
& & \Delta^1 f(x_3) \nearrow & & & \\ \hline | |
x_4 & f(x_4) \nearrow & & & & \\ \hline | |
\vdots & & & & & \\ \hline | |
\end{array} | |
\] | |
όπου τα στοιχεία \( \Delta^1 f(x_0), \ \Delta^2 f(x_0),\ \dots \) είναι ίσα | |
με \textbf{τη διαφορά των δύο προηγούμενων στοιχείων}, δηλαδή: | |
\begin{align*} | |
\Delta^1 f(x_0) &= f(x_1) - f(x_0) \\ | |
\Delta^1 f(x_1) &= f(x_2) - f(x_1) \\ | |
\Delta^1 f(x_2) &= f(x_3) - f(x_2) \\ | |
\Delta^2 f(x_0) &= \Delta^1 f(x_1) - \Delta^1 f(x_0) | |
\\ \text{κλπ.} | |
\intertext{και γενικά:} | |
\Delta^k f(x_i) &= \Delta^{k-1} f(x_{i+1}) - \Delta^{k-1} f(x_i) | |
\end{align*} | |
\[ | |
\begin{array}{cccccc} | |
\cellcolor{blue!25}1 & \cellcolor{blue!25} 1 \searrow & & & & \\ | |
& & \cellcolor{blue!25} -2 \searrow & & & \\ | |
2 & -1 \nesearrow & & \cellcolor{blue!25} 4 \searrow & & \\ | |
& & 2 \nesearrow & & \cellcolor{blue!25}-8 \searrow & \\ | |
3 & 1 \nesearrow & & -4 \nesearrow & & \cellcolor{blue!25}1 \\ | |
& & -2 \nesearrow & & 8 \nearrow & \\ | |
4 & -1 \nesearrow & & 4 \nearrow & & \\ | |
& & 2 \nearrow & & & \\ | |
5 & 1 \nearrow & & & & | |
\end{array} | |
\] | |
\begin{align*} | |
P_4(1+r) &= 1-2\binom{r}{1}+4\binom{r}{2}-8\binom{r}{3} | |
+6\binom{r}{4} | |
\intertext{όπου \( x = x_0+rh \implies | |
r=1.5 \text{ για } x = 2.5 \)} | |
\\ | |
P(2.5) &= 1 -2 \binom{1.5}{1} + 4\binom{1.5}{2} | |
-8\binom{1.5}{3} + 16\binom{1.5}{4} | |
\end{align*} | |
\subsubsection{Μέθοδος Aitken} | |
Έστω \( p,q \) δύο πολυώνυμα παρεμβολής μικρότερου | |
βαθμού (για \( m+2 \) σημεία), | |
και \( r \) το πολυώνυμο παρεμβολής για όλα | |
τα σημεία (\( m+3 \) σημεία) \( \qquad x_0,x_1,\dots, | |
x_m,y,z \), και γνωρίζω: | |
\begin{itemize} | |
\item \( p(x_i)=q(x_i)=r(x_i)=f(x_i) | |
\text{ για } i=0,1,\dots,m \) | |
\item \( p(y) = r(y) = f(y) \) | |
\item \( q(z) = r(z) = f(z) \) | |
\end{itemize} | |
Τότε η \( r(x) \) που είναι η συνάρτηση που θέλω να | |
παρεμβάλλει την \( f \) είναι: | |
\[ | |
\boxed{ | |
r(x) = \frac{(y-x)q(x) - (z-x)p(x)}{y-z} | |
} | |
\] | |
\paragraph{} | |
Έστω \( A_{k,r} \) η τιμή στο \( \bar x \) του πολυωνύμου | |
παρεμβολής της \( f(x) \) στα σημεία \( x_0,x_1, | |
\dots,x_{k-1},x_r \): | |
\begin{align*} | |
A_{k,r} &= f[x_0] + f[x_0,x_1](\bar x-x_0) | |
+ f[x_0,x_1,x_2](\bar x-x_0)(\bar x-x_1) + \dots | |
\\ &\quad \dots + f[x_0,x_1,\dots,x_k](\bar x-x_0) | |
(\bar x-x_1)\cdots(\bar x-x_{k-1}) \\ | |
A_{k,r} &= \frac{(x_{k-1}-\bar x)A_{k-1,r} | |
-(x_r-\bar x)A_{k-1,k-1}}{x_{k-1}-x_r} | |
\end{align*} | |
\begin{tikzpicture} | |
\begin{scope}[yscale=-0.6,xscale=1] | |
\foreach \i in {0,1,...,4} { | |
\draw (0,\i) node {$x_\i$}; | |
\draw (1,\i) node {$A_{0,\i}$}; | |
\draw (7,\i) node {$x_\i - \bar x$}; | |
} | |
\foreach \i in {1,...,4} { | |
\draw (2,\i-0.5) node {$A_{1,\i}$}; | |
} | |
\foreach \i in {2,...,4} { | |
\draw (3,\i-1) node {$A_{2,\i}$}; | |
} | |
\foreach \i in {3,...,4} { | |
\draw (4,\i-1.5) node {$A_{3,\i}$}; | |
} | |
\foreach \i in {4,...,4} { | |
\draw (5,\i-2) node {$A_{4,\i}$}; | |
} | |
\end{scope} | |
\end{tikzpicture} | |
\paragraph{π.χ.} | |
\begin{align*} | |
A_{2,3} &= | |
\frac{(x_1-\bar x)A_{1,3}-(x_3-\bar x)A_{1,1}}{x_1-x_3} | |
\end{align*} | |
\subsection{Ασκήσεις} | |
\paragraph{Άσκηση} | |
Να βρεθεί πολυώνυμο Lagrange που να παρεμβάλλει την | |
\( \mathlarger{f(x)=e^x} \) στα σημεία \( x_0=-1,\ x_1=0,\ x_2=1 \). | |
\subparagraph{Λύση} | |
Θυμόμαστε ότι το πολυώνυμο Lagrange δίνεται από τους τύπους: | |
\begin{align*} | |
P_n(x) &= l_0(x)f(x_0)+l_1(x)f(x_1)+l_2(x)f_2(x_2) \\ | |
l_0(x) &= \frac{(x-x_1)(x-x_2)}{(x_0-x_1)(x_0-x_2)} | |
= \frac{(x-0)(x-1)}{(-1)(-2)} = \frac{1}{2}(x^2 - x) \\ | |
l_1(x) &= \frac{(x-x_0)(x-x_2)}{(x_1-x_0)(x_1-x_2)} | |
= \frac{(x+1)(x-1)}{1\cdot (-1)} = -x^2+1 \\ | |
l_2(x) &= \frac{(x-x_0)(x-x_1)}{(x_2-x_0)(x_2-x_1)} = \frac{1}{2} | |
(x^2+x) | |
\intertext{Άρα} | |
P_2(x) &= \frac{1}{2e}(x^2-x)+ (-x^2+1) + \frac{e}{2}(x^2+x) | |
\\ &= | |
\left(1+\frac{e}{2}+\frac{1}{2e}\right)x^2 | |
+\left(\frac{e}{2}-\frac{1}{2e}\right)x -1 | |
\quad \text{(δεν είναι απαραίτητο να το φτάσουμε μέχρι εδώ)} | |
\end{align*} | |
\begin{tikzpicture}[scale=.8] | |
\begin{axis}[samples=30,very thick,domain=-1.5:1.5,no marks,grid=both,axis lines = middle,clip=false] | |
\addplot+{e^x} node[above right] {$e^x$}; | |
\addplot+{(x^2-x)/(2*e) + (1-x^2) + (e/2)*(x^2+x) } | |
node[above right] {$P_2(x)$}; | |
\filldraw [fill=red!50!gray!30, draw=black, thick, fill opacity=.7] | |
(axis cs:-1,1/e) circle [radius=3pt] (axis cs:0,1) circle [radius=3pt] (axis cs:1,e) circle [radius=3pt]; | |
\end{axis} | |
\end{tikzpicture} | |
\paragraph{Άσκηση} | |
Να βρεθεί πολυώνυμο Newton που να παρεμβάλλει την παρακάτω \( f \) | |
με τη μέθοδο διηρημένων διαφορών: | |
\[ | |
f(-1) = 1,\quad f(1) = 2 \quad \text{και} \quad f(2)=-1 | |
\] | |
\subparagraph{Λύση} | |
\[ | |
\begin{array}{cccc} | |
x_i&f(x_i)&1\textsuperscript{η}&2\textsuperscript{η} \\ | |
-1 & 1 \searrow & & \\ | |
& & \frac{1}{2} \searrow & \\ | |
1 & 2 \nesearrow & & \frac{-3-\sfrac{1}{2}}{2-(-1)} = -\frac{7}{6} \\ | |
& & -3 \nearrow & \\ | |
2 & -1 \nearrow | |
\end{array} | |
\] | |
\[ | |
P_2(x) = 1 + \frac{1}{2}(x+1) - \frac{7}{6}(x+1)(x-1) | |
\] | |
\paragraph{Άσκηση} | |
Να βρεθεί η τιμή \( f(0.5) \) (intrapolation) | |
χρησιμοποιώντας τη μέθοδο πεπερασμένων διαφορών. Δίνεται ο πίνακας | |
τιμών της \( f \) | |
\[ | |
\begin{array}{r|c|c|c|c|c} | |
x_i & 0 & 1 & 2 & 3 & 4 \\ \hline | |
f(x_i) & 1 & 0 & -1 & 1 & 2 | |
\end{array} | |
\] | |
\subparagraph{Λύση} | |
Οι τύποι για τις \( k \)-οστές διαφορές θα δίνονται στις εξετάσεις, | |
αλλά είναι πιο κομψό και εύκολο να χρησιμοποιήσουμε τον πίνακα: | |
\[ | |
\begin{array}{cccccc} | |
x_i & f(x_i) & & & & \\ | |
\cellcolor{blue!25}0 & \cellcolor{blue!25} 1 \searrow & & & &\\ | |
& & \cellcolor{blue!25} -1 \searrow & & &\\ | |
1 & 0 \nesearrow& & \cellcolor{blue!25} 0 \searrow & &\\ | |
& &-1 \nesearrow & & \cellcolor{blue!25}3 \searrow &\\ | |
2 &-1 \nesearrow& & 3 \nesearrow&& \cellcolor{blue!25}-7 \\ | |
&&2 \nesearrow&& -4 \nearrow &\\ | |
3 & 1 \nesearrow& & -1 \nearrow &&\\ | |
&& 1 \nearrow&&&\\ | |
4 & 2 \nearrow & &&& | |
\end{array} | |
\] | |
\begin{align*} | |
P_4(\overset{\mathclap{\substack{x=x_0+rh\\\uparrow}}}{x}) &= | |
f(x_0) + \binom{r}{1}\Delta f(x_0) + \binom{r}{2}\Delta^2 f(x_0) | |
+ \binom{r}{3}\Delta^3 f(x_0) + \binom{r}{4} \Delta^4 f(x_0) | |
\intertext{\( 0.5 = 0 + r\cdot 1 \implies r=0.5 \)} | |
&= 1-\binom{0.5}{1}+0\binom{0.5}{2}+3\binom{0.5}{3}-7\binom{0.5}{4} | |
= 0.9609375 | |
\intertext{όπου | |
\( \binom{r}{k} = \frac{r(r-1)\cdots\left(r-(k-1)\right)}{k!} \) | |
} | |
\end{align*} | |
\paragraph{Άσκηση} | |
Να βρεθεί η τιμή του πολυωνύμου παρεμβολής \( P(5) \) για τα σημεία | |
\( x_i \) και τις αντίστοιχες τιμές της συνάρτησης \( f(x_i) \) που | |
δίνονται στον πίνακα με τη μέθοδο Aitken: | |
\[ | |
\begin{array}{r|cccc} | |
x_i & 2 & 4 & 6 & 8 \\ \hline | |
f(x_i) & 1 & -2 & 3 & 5 | |
\end{array} | |
\] | |
\subparagraph{Λύση} | |
\begin{align*} | |
x_i - \underbrace{\bar x}_{5} & \\ | |
2-5 &= -3 \\ 4-5 &= -1 \\ 6-5 &= 1 \\ 8-5 &= 3 | |
\end{align*} | |
\begin{tikzpicture}[scale=1] | |
\def\fs{22pt} | |
\draw (0,0) node{$8$}; | |
\draw (0,\fs) node {$6$}; | |
\draw (0,2*\fs) node {$4$}; | |
\draw (0,3*\fs) node {$2$}; | |
\draw[green!70!black] (0,3*\fs) circle (7pt); | |
\draw[green!70!black] (0,2*\fs) circle (7pt); | |
\draw[thick,cyan!70!black] (0,2*\fs) circle (9pt); | |
\draw[thick,cyan!70!black] (0,1*\fs) circle (8pt); | |
\draw (0.9,0) node {$5$}; | |
\draw (0.9,1*\fs) | |
node[thick,draw=cyan!70!black,shape=rectangle] {$-3$}; | |
\draw (0.9,2*\fs) node[draw=green!70!black,minimum width=6mm,shape=rectangle] {$-2$}; | |
\draw (0.9,2*\fs) | |
node[thick,draw=cyan!70!black,minimum width=9mm,minimum height=7mm,shape=rectangle] {$\phantom{-2}$}; | |
\draw (0.9,3*\fs) node[draw=green!70!black,minimum width=6mm,shape=rectangle] {$1$}; | |
\draw[->,green!70!black] (1.2,3*\fs+2mm) -- ++(1.5,0) node[right,scale=.7] {$\cdot (-3)$} -- ++(0,-2.5mm); | |
\draw[->,green!70!black] (1.3,2*\fs+2mm) -- ++(0,0.4) -- ++(0.7,0) | |
node[above left,scale=.6,yshift=-1mm] {$\cdot(-1)$}; | |
\draw[->,cyan!70!black] (1.35,2*\fs+2mm) -- ++(0.3,0) -- ++(0,-0.4) | |
node[below,scale=.6,xshift=1mm] {$\cdot(-1)$} -- ++(0.35,0); | |
\draw[->,cyan!70!black] (0.9,1*\fs-3mm) -- ++(0,-2mm) -- ++(1.1,0) | |
node[below left,scale=.7] {$\cdot 1$}; | |
\draw (2.5,2.5*\fs) node[right,xshift=-5mm,scale=0.5] {$\frac{(-2)(-3)-(-1)\cdot1}{2-4}=$}; | |
\draw (3.8,2.5*\fs) node {$-\frac{7}{2}$}; | |
\draw (2.5,1.5*\fs) node[right,xshift=-2mm,scale=0.5] {$\frac{3\cdot(-3)-(1)\cdot1}{2-6}=$}; | |
\draw (3.8,1.5*\fs) node {$\frac{5}{2}$}; | |
\draw (2.5,0.5*\fs) node[right,xshift=0mm,scale=0.5] {$\frac{5\cdot(-3)-1\cdot3}{2-8}=$}; | |
\draw (3.8,0.5*\fs) node {$3$}; | |
\draw (2,2.1*\fs) rectangle (4.2,2.9*\fs); | |
\draw (2,1.1*\fs) rectangle (4.2,1.9*\fs); | |
\draw (2,0.1*\fs) rectangle (4.2,0.9*\fs); | |
\draw (5.2,1*\fs) node[draw,rectangle,minimum width=12mm,yshift=-1mm] {$-\frac{1}{2}$}; | |
\draw (5.2,2*\fs) node[draw,rectangle,minimum width=12mm,yshift=1mm] {$-\frac{15}{8}$}; | |
\draw (6.2,1.5*\fs) node[right,scale=0.5,xshift=1mm,yshift=1mm] | |
{$\frac{-\frac{15}{8}\cdot1-\left(-\frac{1}{2}\right)\cdot3}{6-8}=$}; | |
\draw (7.9,1.5*\fs) node {$\frac{3}{16}$}; | |
\draw (6.2,1.1*\fs) rectangle (8.2,1.9*\fs); | |
\draw[->] (9,-0.2) node[below] {Λύση $p(5)$} -- (8,0.7); | |
\end{tikzpicture} | |
Άρα \( P(5) = \frac{3}{16} \), λύση που φαίνεται λογική, αφού | |
βρίσκεται ανάμεσα στο -2 και το 3. | |
\section{Προσέγγιση} | |
Η προσέγγιση μοιάζει με την παρεμβολή, με τη διαφορά ότι δεν | |
επιθυμούμε το πολυώνυμο που βρούμε να περνάει από όλα τα σημεία της | |
αρχικής συνάρτησης, αλλά να έχει την ελάχιστη απόσταση από αυτά. Το | |
κέρδος μας με αυτόν τον τρόπο είναι ότι το πολυώνυμο που θα βρούμε | |
είναι μικρότερου βαθμού. | |
\begin{tikzpicture}[scale=0.6] | |
\draw (0,2) node {ΠΑΡΕΜΒΟΛΗ}; | |
\draw (0,1) node {+}; | |
\draw (0,0) node {ΠΡΟΣΕΓΓΙΣΗ}; | |
\draw[->] (3,2) -- ++(0.8,0); | |
\draw[->] (3,0) -- ++(0.8,0); | |
\draw (4,2) node[right] {$f(x_i) = p(x_i)$}; | |
\draw (4,0) node[right] {$ | |
\underbrace{\left|f(x_i)-p(x)\right|}_{ | |
\mathclap{\text{πολυώνυμο μικρότερου βαθμού}}}$ | |
ελάχιστη}; | |
\end{tikzpicture} | |
\paragraph{} | |
Έστω οι τιμές μιας συνάρτησης: | |
\[ | |
\begin{array}{r|c|c|c|c} | |
x_i & x_0 & x_1 & \dots & x_{m-1} \\ \hline | |
f(x_i) & f(x_0) & f(x_1) & \dots & f(x_{m-1}) | |
\end{array} | |
\] | |
\begin{tikzpicture}[scale=1] | |
\draw (-0.5,0) -- (3,0); | |
\draw (0,-0.5) -- (0,3); | |
\draw[thick,blue!50!black,mark position=0.8(a)] (-1,2) -- ++(15:4); | |
\draw[thick,blue!50!black,mark position=0.1(b)] (0.5,-0.5) -- ++(70:3); | |
\draw[thick,blue!50!black,mark position=0.9(c)] (-1,-0.5) -- ++(30:5); | |
\draw[<-,cyan] (a) -- ++(-40:0.5) node[below,rotate=30] {κακή προσέγγιση}; | |
\draw[<-,cyan] (b) -- ++(-40:0.5) node[below,rotate=20] {μέτρια προσέγγιση}; | |
\draw[<-,cyan] (c) -- ++(-40:0.5) node[below,rotate=30] {καλύτερη προσέγγιση}; | |
\filldraw (0.3,0.3) circle (1pt) (0.4,0.5) circle (1pt) (0.8,0.6) circle (1pt) | |
(rand,rand) circle (1pt) (0.7,2) circle (1pt) (1,1.5) circle (1pt) | |
(1.5,1) circle (1pt) (2,1.2) circle (1pt) (2.5,1) circle (1pt); | |
\end{tikzpicture} | |
Αν ζητάμε η προσέγγιση \( P(x) \) να είναι μια ευθεία, τότε στην | |
ιδανική περίπτωση: | |
\[ | |
P(x_i) = a_0 + a_1x_i = f(x_i) \quad \forall x_i | |
\] | |
τότε έχουμε ένα σύστημα: | |
\[ | |
\left[ | |
\begin{matrix} | |
1 & x_0 \\ 1 & x_1 \\ 1 & x_2 \\ \vdots & \vdots \\ 1 & x_{m-1} | |
\end{matrix} | |
\right] \left[ | |
\begin{matrix} | |
a_0 \\ a_1 | |
\end{matrix} | |
\right] = \left[ | |
\begin{matrix} | |
f(x_0) \\ f(x_1) \\ f(x_2) \\ \vdots \\ f(x_{m-1}) | |
\end{matrix} | |
\right] | |
\] | |
που είναι σύστημα 2 αγνώστων αλλά \( m \) εξισώσεων, κάτι που μάλλον | |
θα είναι αδύνατο. | |
Επομένως αντί να λύσω την εξίσωση: | |
\[ | |
Ax = b | |
\] | |
θα λύσω την: | |
\[ | |
A\bar x \simeq b | |
\] | |
με σκοπό να ελαχιστοποιήσω την απόσταση (υπόλοιπο): | |
\[ | |
A\bar x -b. | |
\] | |
Η παραπάνω σχέση όμως δεν εκφράζει έναν αριθμό, αλλά έναν πίνακα! | |
Για να "ελαχιστοποιήσουμε" αυτόν τον πίνακα θα ορίσουμε κάποια | |
μεγέθη. | |
\subsection{Στοιχεία Αριθμητικής Γραμμικής Άλγεβρας} | |
\subsubsection{Εσωτερικό γινόμενο} | |
\textit{Εσωτερικό γινόμενο} σε χώρο \( V \) είναι μια \textbf{πράξη} | |
για κάθε \( x,y \in V \) | |
(συμβολίζεται με \( (x,y) \) ή \( \langle x,y \rangle \)) | |
ορίζει έναν \textbf{αριθμό} που ικανοποιεί: | |
\begin{enumroman} | |
\item \( (x,x) \geq 0 \), ισότητα μόνο αν \( x=0 \) | |
\item \( (x,y) = (y,x) \quad \forall x,y\in V \) | |
\item \( (ax+by,z) = a(x,z)+b(y,z) \) | |
\end{enumroman} | |
Πιο συγκεκριμένα, για κάποιους χώρους ορίζουμε: | |
\begin{align*} | |
\mathbb R^n &: \ (x,y) = x^{\mathrm T}y \quad | |
\text{για } x,y \in \mathbb R^n | |
\\ | |
\mathbb R^{m\times n} &: (A,B) = | |
\sum_{i=1}^{m}\sum_{j=1}^{n} a_{ij}b_{ij} | |
\end{align*} | |
Για συναρτήσεις, έχουμε \( (f,g) = \int f(x)g(x)\dif x \) | |
Δύο διανύσματα \( x,y \in V \) λέγονται \textbf{ορθογώνια} όταν | |
\( (x,y) = 0\), και γράφουμε \( x \perp y \). | |
\subsubsection{Μήκος - Νόρμα (norm) διανύσματος} | |
Ως νόρμα μπορούμε να επιλέξουμε οποιαδήποτε συνάρτηση που καλύπτει | |
κάποια αξιώματα (για παράδειγμα, νόρμα ενός διανύσματος μπορεί να | |
είναι το μέγιστο στοιχείο ενός διανύσματος). | |
Ένας χώρος \( V \) είναι εφοδιασμένος με \textbf{μήκος} ή | |
\textbf{νόρμα} αν για κάθε \( x \in V \) υπάρχει αριθμός | |
\( \Vert x\Vert \) που ικανοποιεί: | |
\begin{enumroman} | |
\item \( \Vert x\Vert > 0 \) με ισότητα μόνο εάν \( x=0 \) | |
\item \( \Vert ax\Vert = |a|\,\Vert x\Vert \) για κάθε σταθερά \( a \) | |
\item \( \Vert x+y\Vert \leq \Vert x\Vert+\Vert y\Vert \ \forall x,y\in V \) | |
\end{enumroman} | |
\paragraph{Είδη νορμών} | |
Για ένα διάνυσμα \( x=(x_1,x_2,\dots,x_n)^{\mathrm T} \) | |
\begin{align*} | |
l_{\infty} &: \Vert x\Vert _{\infty} = \max_{1\leq i \leq n}|x_i| | |
\qquad \text{ (άπειρη νόρμα)} | |
\\ | |
l_p &: \Vert x\Vert _{p} = | |
\left(\sum_{i=1}^n |x_i|^p\right)^{\frac{1}{p}} | |
\quad \text{ ($p$-οστή νόρμα)} | |
\\ | |
l_2 &: \Vert x\Vert _2 = \sqrt{x^{\mathrm T}x} = | |
\sqrt{x_1^2 + \dots + x_n^2} | |
\quad \text{ (ευκλείδια νόρμα)} | |
\end{align*} | |
\paragraph{Απόσταση} | |
μεταξύ διανυσμάτων \( x,y \in \mathbb R \) είναι ο αριθμός: | |
\[ | |
\mathlarger{\Vert x-y\Vert } | |
\] | |
\paragraph{Θεωρήματα} | |
\[ | |
\Vert x+y\Vert ^2 = \Vert x\Vert ^2 + \Vert y\Vert ^2 | |
\] | |
Cauchy-Schwartz: | |
\[ | |
\left\Vert(x,y)\right\Vert \leq \Vert x\Vert \,\Vert y\Vert | |
\] | |
\subsubsection{Ορθογώνιοι Υποχώροι} | |
\begin{defn}{Ορθογώνιοι Υποχώροι}{} | |
Δύο υποχώροι \( X,Y \) του \( \mathbb R^n \) λέγονται | |
\textbf{ορθογώνιοι}, αν \( x^{\mathrm T}y = 0 \) \textbf{για | |
κάθε} \( x \in X \) και \( y \in Y \). | |
Γράφουμε: \( \mathlarger{X \perp Y} \) | |
\end{defn} | |
\begin{defn}{Ορθογώνιο Συμπλήρωμα}{} | |
Το σύνολο: | |
\[ | |
\mathlarger{ | |
Y^\perp | |
} = \left\lbrace | |
x \in \mathbb R^n : x^{\mathrm T}y = 0 \quad | |
\forall y \in Y | |
\right\rbrace | |
\] | |
είναι το \textbf{ορθογώνιο συμπλήρωμα} του \( Y \). | |
Για παράδειγμα, το ορθογώνιο συμπλήρωμα του πίνακα στην αίθουσα | |
Α3 είναι ο κάθετος τοίχος. | |
\end{defn} | |
\begin{defn}{}{} | |
Για \( A \in \mathbb R^{m \times n} \): | |
\begin{itemize} | |
\item \textbf{Μηδενοχώρος} του \( A \): | |
\( \mathrm N(A) = \left\lbrace x\in\mathbb R^n: Ax=0 | |
\right\rbrace \) | |
\item \textbf{Χώρος των στηλών} του \( A \): | |
\( \mathrm R(A) = \left\lbrace | |
b \in \mathbb R^m: b = Ax \text{ για } | |
x \in \mathbb R^n \right\rbrace | |
\) | |
\item \textbf{Χώρος των γραμμών} του \( A \): | |
\( \mathrm R(A^{\mathrm T}) = \left\lbrace | |
y \in \mathbb R^n: y = A^{\mathrm T}x \text{ για } | |
x \in \mathbb R^m | |
\right\rbrace \) | |
\end{itemize} | |
\end{defn} | |
\begin{theorem}{Θεμελιώδες Θεώρημα Γραμμικής Άλγεβρας}{} | |
\begin{align*} | |
\mathlarger{N(A)} &\mathlarger{= R(A^{\mathrm T})^\perp} | |
\\ | |
\mathlarger{N(A^{\mathrm T})} &\mathlarger{= R(A)^\perp} | |
\end{align*} | |
\end{theorem} | |
\subsection{Πίσω στο αρχικό πρόβλημα} | |
Ορίζω: | |
\begin{align*} | |
\text{διαφορά } r(x) &= b - Ax \\ | |
\left\Vert r(x)\right\Vert &= \Vert b-Ax\Vert | |
\end{align*} | |
\begin{tikzpicture} | |
\filldraw[fill=gray!30] (0,0) -- (1,3) -- (6,3) -- (5,0) -- cycle; | |
\draw[thick,cyan!50!blue] (3,1.5) --++(0,1) node[midway,right] {$b-A\bar x=r(x)$}; | |
\draw[->] (2,1.5) -- ++(0:1) node[below] {$A\bar x$}; | |
\draw[->] (2,1.5) -- ++(1,1) node[left] {$b$}; | |
\end{tikzpicture} | |
Το διάνυσμα \( r(x) \) ανήκει στο ορθογώνιο συμπλήρωμα του χώρου | |
των στηλών, άρα στο μηδενοχώρο του \( A^{\mathrm T} \) (από το | |
Θεμελιώδες Θεώρημα Γραμμικής Άλγεβρας), επομένως: | |
\begin{align*} | |
A^{\mathrm T} r(x) &= 0 \\ | |
A^{\mathrm T} (b-A\bar x) &= 0 | |
\end{align*} | |
Άρα: \[ | |
\boxed{ | |
\mathlarger{\mathlarger{\mathlarger{ | |
Α^{\mathrm T}Ax = A^{\mathrm T}b | |
}}}} \quad \xleftarrow{\hspace{5pt}} \text{ κανονικές εξισώσεις} | |
\] | |
\paragraph{Παράδειγμα} | |
Να προσεγγιστεί η \( f(x) \) με πολυώνυμο πρώτου βαθμού, όπου: | |
\[ | |
\begin{array}{r|ccc} | |
x_i & 0 & 3 & 6 \\ \hline | |
f(x_i) & 1 & 4 & 5 | |
\end{array} | |
\] | |
\subparagraph{Λύση} | |
\[ | |
A = \left[ \begin{matrix} | |
1 & 0 \\ 1 & 3 \\ 1 & 6 | |
\end{matrix} \right], \quad x = \left[ \begin{matrix} | |
a_0 \\ a_1 | |
\end{matrix}\right], \quad b = \left[\begin{matrix} | |
1 \\ 4 \\ 5 | |
\end{matrix} \right] | |
\] | |
\begin{align*} | |
A^{\mathrm T} A &= \left[\begin{matrix} | |
3 & 9 \\ 9 & 45 | |
\end{matrix} \right] \\ | |
A^{\mathrm T} b &= \left[ \begin{matrix} | |
10 \\ 42 | |
\end{matrix} \right] | |
\end{align*} | |
Άρα πρέπει να λύσουμε το σύστημα: | |
\[ | |
\left[\begin{matrix} | |
3 & 9 \\ 9 & 45 | |
\end{matrix}\right] \left[\begin{matrix} | |
a_0 \\ a_1 | |
\end{matrix}\right] = \left[\begin{matrix} | |
10 \\ 42 | |
\end{matrix}\right] | |
\] | |
\( a_0 = \sfrac{4}{3},\ a_1 = \sfrac{2}{3} \) | |
Επομένως \( \displaystyle P_1(x) = \frac{4}{3} + \frac{2}{3}x \). | |
\paragraph{Άσκηση} | |
Να προσεγγιστούν τα παρακάτω σημεία με μία παραβολή, χρησιμοποιώντας | |
τη μέθοδο ελαχίστων τετραγώνων: | |
\[ | |
\begin{array}{r|ccccc} | |
x_i & 0 & 1 & 2 & 3 & 4 \\ \hline | |
f(x_i) & 1 & 2 & 2 & 4 & 5 | |
\end{array} | |
\] | |
\subparagraph{Λύση} | |
\begin{align*} | |
A &= \left[\begin{matrix} | |
1 & 0 & 0 \\ 1 & 1 & 1 \\ 1 & 2 & 4 \\ 1 & 3 & 9 \\ 1 & 4 & 16 | |
\end{matrix}\right] \\ | |
x &= \left[\begin{matrix} | |
a_0 \\ a_1 \\ a_2 | |
\end{matrix}\right] \qquad P(x) = a_0+a_1x+a_2x^2 \\ | |
b &= \left[ | |
\begin{matrix} | |
1 \\ 2 \\ 2 \\ 4 \\ 5 | |
\end{matrix} | |
\right] | |
\end{align*} | |
\[ | |
\left[ | |
A^{\mathrm T} | |
\right] \left[ A \right]\left[ | |
\begin{matrix} | |
a_0 \\ a_1 \\ a_2 | |
\end{matrix} | |
\right] = \left[A^{\mathrm T}\right] \left[b\right] | |
\] | |
\section{Αριθμητική Ολοκλήρωση} | |
Πολλές φορές δεν μπορούμε να υπολογίσουμε αναλυτικά ένα ολοκλήρωμα, | |
ή αυτός ο υπολογισμός είναι υπολογιστικά δύσκολος, επομένως σε αυτό το | |
κεφάλαιο θα αναπτύξουμε τεχνικές για αριθμητική ολοκλήρωση. | |
\begin{gather*} | |
f(x) \quad [a,b] \\ | |
\mathlarger{\int_a^b f(x) \dif x} | |
\end{gather*} | |
\begin{tikzpicture}[scale=1.2] | |
\begin{scope} | |
\clip plot [smooth,tension=1] | |
coordinates {(0.2,2) (1.5,1.7) (2.8,2.2)} | |
-- (2.8,0) -- (0,0) -- (0,2); | |
\fill[green!30,postaction={pattern=north east lines,opacity=.15}] (0.7,0) rectangle (2,2.2); | |
\draw[dashed] (0.7,0) -- ++(0,2.2); | |
\draw[dashed] (2,0) -- ++(0,2.2); | |
\end{scope} | |
\draw (0.7,0) node[below] {$\vphantom{b}a$}; | |
\draw (2,0) node[below] {$b$}; | |
\draw (-0.5,0) -- (3,0); | |
\draw (0,-0.2) -- (0,2.5); | |
\draw[very thick,draw=blue] plot [smooth,tension=1] | |
coordinates {(0.2,2) (1.5,1.7) (2.8,2.2)} node[above right] {$f(x)$}; | |
\end{tikzpicture} | |
Ο πιο απλός τρόπος να υπολογίσουμε το ολοκλήρωμα μιας συνάρτησης | |
είναι να πάρουμε τον εμβαδόν της συνάρτησης μεταξύ δύο σημείων | |
(κατά Riemann). | |
Σε αυτό το κεφάλαιο η γενική ιδέα είναι να παρεμβάλλουμε την \( f \) | |
με ένα πολυώνυμο \( p \): | |
\[ | |
f \rightarrow p | |
\] | |
και να υπολογίσουμε το ολοκλήρωμα του \( p \). Κάτι τέτοιο έχει | |
νόημα επειδή το ολοκλήρωμα είναι μια γραμμική διαδικασία: | |
\begin{align*} | |
I(f) &= \int_{a}^{b} f(x)\dif x\\ | |
I\left(f(x)+g(x)\right) &= I\left(f(x)\right)+I\left(g(x)\right) | |
\\ I\left(af(x)\right) &= aI\left(f(x)\right) | |
\end{align*} | |
Επίσης θα υπολογίζουμε το σφάλμα (ή πιο συγκεκριμένα, το μέγιστο | |
σφάλμα) της προσέγγισής μας: | |
\begin{align*} | |
f(x) &= p(x) + \overbrace{e(x)}^{\mathclap{\text{σφάλμα}}} | |
\\ | |
I\left(f(x)-p(x)\right) &= I\left(e(x)\right) | |
\end{align*} | |
\paragraph{} | |
Για πολυώνυμα σε μορφή Lagrange έχουμε: | |
\begin{align*} | |
P_n(x) &= \sum_{k=0}^{n} f(x_k) \cdot l_k(x) \\ | |
I\left(p_n(x)\right) &= I\left(\sum_{k=0}^{n}f(x_k)l_k(x)\right) | |
= \sum_{k=0}^n f(x_k) \cdot I\left(l_k(x)\right) \\ | |
I(f) &= \int_{a}^{b} f(x) \dif x \simeq | |
\sum_{k=0}^n f(x_k) \cdot I\left(l_k(x)\right) | |
\end{align*} | |
Γενικά θα χρησιμοποιούμε πολυώνυμα το πολύ 2\textsuperscript{ου} | |
βαθμού: | |
\begin{itemize} | |
\item \( n=0,1,2,\dots \rightarrow \) \textbf{απλός κανόνας} | |
\item \textbf{Σύνθετος κανόνας:} Εφαρμόζουμε τον απλό κανόνα σε | |
πολλά διαστήματα της \( f \). | |
\end{itemize} | |
\subsection{Κανόνας Παραλληλογράμμου} | |
\( \mathsmaller{(n = 0)} \) | |
\begin{tikzpicture}[scale=1.5] | |
\begin{scope} | |
\clip plot [smooth,tension=1] | |
coordinates {(0.2,2) (1.5,2) (2.2,3)} | |
-- (2.8,0) -- (0,0) -- (0,2); | |
\fill[yellow!40] (0.7,0) rectangle (2,2.5); | |
\draw[dashed] (0.7,0) -- ++(0,3); | |
\draw[dashed] (2,0) -- ++(0,3); | |
\end{scope} | |
\filldraw[fill=yellow!80!black,fill opacity=.5,postaction={pattern=north east lines,opacity=.15}] | |
(0.7,0) rectangle (2,1.89); | |
\draw[dashed] (0.7,1.89) -- ++(-0.7,0) node[left] {$f(a)$}; | |
\draw (0.7,0) node[below] {$\vphantom{b}a$}; | |
\draw (2,0) node[below] {$b$}; | |
\draw (-0.5,0) -- (3,0); | |
\draw (0,-0.2) -- (0,2.5); | |
\draw[very thick,draw=blue!50!black] plot [smooth,tension=1] | |
coordinates {(0.2,2) (1.5,2) (2.2,3)} node[above right] {$f(x)$}; | |
\end{tikzpicture} | |
\paragraph{Απλός κανόνας παραλληλογράμμου/ορθογωνίου} | |
Για να εφαρμόσω τον κανόνα του παραλληλογράμμου, θα παρεμβάλλω την | |
\( f \) σε ένα σημείο. | |
Ας υποθέσω ότι παρεμβάλλω την \( f \) στο σημείο \( \left(a,f(a) | |
\right) \): | |
\begin{align*} | |
p_0(x) &= f(a) \\ | |
I\left(p_0(x)\right) &= \int_{a}^{b} f(a)\dif x \\ | |
&= (b-a)f(a) = I_{\mathrm R \ \leftarrow \text{Rectangle}} | |
\end{align*} | |
\begin{align*} | |
\text{Σφάλμα } E_{\mathrm R} &= I\left(f(x)\right) - | |
I_{\mathrm R} | |
\\ &= \frac{(b-a)^2}{2} f'(z) \quad \text{(με βάση πράξεις του | |
βιβλίου, για κάποιο $z: a<z<b$)} | |
\end{align*} | |
Για να φράξω το σφάλμα (να βρω την μέγιστη δηλαδή τιμή του): | |
\begin{align*} | |
|E_\mathrm{R}| = \frac{(b-a)^2}{2} \left|f'(z)\right| &\leq | |
\frac{(b-a)^2}{2} \max_{a<z<b} \left|f'(z)\right| | |
\end{align*} | |
\paragraph{Σύνθετος κανόνας παραλληλογράμμου} | |
Ο σύνθετος κανόνας λειτουργεί σαν τον απλό, με τη διαφορά ότι | |
διαμερίζει το διάστημα ολοκλήρωσης \( [a,b] \) σε \( N \) ίσα | |
τμήματα: | |
\begin{align*} | |
\overset{\substack{\mathclap{\text{απόσταση}}\\\uparrow}}{h} = | |
\frac{b-a}{N} | |
\hspace{70pt} | |
I_{\mathrm R, N} &= hf(x_0) + hf(x_1) + \dots + hf(x_{N-1}) = | |
\\ &= h \sum_{i=0}^{N-1} f(x_i) | |
\end{align*} | |
Για το σφάλμα απλά αθροίζουμε το σφάλμα του κάθε ορθογωνίου: | |
\begin{align*} | |
E_{\mathrm R, N} &= \frac{h^2}{2} f'(z_1) + \frac{h^2}{2} f'(z_2) | |
+ \dots + \frac{h^2}{2} f'(z_N) = | |
\\ &= \frac{h^2}{2} \sum_{i=1}^{N} f'(z_i) | |
\\ &= \frac{h^2}{2} N f'(z) \quad \mathsmaller{\left( | |
\text{\small όπου } f'(z) = \frac{\sum f'(z_i)}{N}, | |
\text{\small δηλ. ο μέσος όρος} \right)} | |
\\ &= \frac{h}{2}(b-a)f'(z)\\ | |
\left|E_{\mathrm R,N}\right| &\leq \frac{h}{2} (b-a) | |
\max_{a<z<b} \left|f'(z)\right| | |
\end{align*} | |
\paragraph{Παράδειγμα} | |
Να υπολογιστεί το ολοκλήρωμα της \( \mathlarger{f(x)=x^3} \) στο | |
διάστημα \( \mathlarger{[1,2]} \) για \( N=1 \text{ και } N=8 \). | |
\subparagraph{Λύση για \( N=1 \)} | |
\begin{align*} | |
I_R &= f(a)\big(b-a\big) = f(1)\big(2-1\big) = 1\cdot 1 = 1 \\ | |
E_R &= \frac{(2-1)^2}{2} f'(z) \quad 1<z<2 \\ | |
\left|E_R\right| &\leq \frac{1}{2}\max_{1<z<2} 3z^2 = | |
\frac{1}{2} \cdot 3 \cdot 2^2 = 6 | |
\end{align*} | |
\subparagraph{Λύση για \( N=8 \)} | |
\begin{align*} | |
I_{R,8} &= hf(x_0) + h_1f(x_1) + \dots + hf(x_7) = | |
\\ &= \frac{1}{8}f(1) + \frac{1}{8}f\left(\sfrac{9}{8} \right) | |
+ \dots + \frac{1}{8}\left(\sfrac{15}{8}\right) = 3.32 | |
\\ \left|E_{R,8}\right| &\leq \frac{1}{8}\cdot\frac{1}{2}\cdot 1 | |
\max_{1<z<2} \left|3z^2\right| = 0.75 | |
\end{align*} | |
\subsection{Κανόνας Τραπεζίου} | |
\( \mathsmaller{(n = 1)} \) | |
Παρεμβάλλω την \( f \) σε δύο σημεία για να πάρω ένα πολυώνυμο | |
1\textsuperscript{ου} βαθμού: | |
\begin{tikzpicture}[scale=1.8] | |
\filldraw[fill=yellow!80!black,fill opacity=.9,postaction={pattern=north east lines,opacity=.15}] | |
(0.7,0) -- (0.7,1.89) node[above]{$a$} -- (2,2.5) node[above,xshift=-1mm] {$b$} -- (2,0) -- cycle; | |
\draw[dashed] (0.7,1.89) -- ++(-0.7,0); | |
\begin{scope} | |
\clip plot [smooth,tension=1] | |
coordinates {(0.2,2) (1.5,2) (2.2,3)} | |
-- (2.8,0) -- (0,0) -- (0,2); | |
\fill[yellow!40,opacity=.5] (0.7,0) rectangle (2,2.5); | |
\draw[dashed] (0.7,0) -- ++(0,3); | |
\draw[dashed] (2,0) -- ++(0,3); | |
\end{scope} | |
\draw (-0.5,0) -- (3,0); | |
\draw (0,-0.2) -- (0,2.5); | |
\draw[very thick,draw=blue!50!black] plot [smooth,tension=1] | |
coordinates {(0.2,2) (1.5,2) (2.2,3)} node[above right] {$f(x)$}; | |
\end{tikzpicture} | |
\paragraph{Απλός κανόνας τραπεζίου} | |
\[x_0 = a \hspace{50pt} x_1=b \] | |
\begin{align*} | |
p_1(x) &= f(a)l_0(x) + f(b)l_1(x) \qquad | |
\text{($l_i$ πολυώνυμα Lagrange)} \\ | |
&= f(a)\frac{(x-b)}{a-b} + f(b)\frac{x-a}{b-a} \\ | |
I\left(p_1(x)\right) &= \int_{a}^{b} p_1(x) | |
\\ &= \dots = \frac{b-a}{2}\left(f(a)+f(b)\right) = | |
I_{\mathrm T \ \leftarrow \text{Trapezoid}} | |
\end{align*} | |
Για το σφάλμα έχουμε: | |
\begin{align*} | |
E_{\mathrm T} &= I\left(f(x)\right) - I\left(p_1(x)\right) | |
= \dots \\ &= | |
-\frac{(b-a)^3}{12}f''(z) \qquad a<z<b \\ | |
\left|E_{\mathrm T}\right| &\leq \frac{(b-a)^3}{12} | |
\max_{a<z<b} f''(z) | |
\end{align*} | |
\paragraph{Σύνθετος κανόνας τραπεζίου} | |
Όπως και προηγουμένως, διαμερίζουμε το τραπέζιο σε \( N \) τμήματα, | |
και εφαρμόζουμε τον απλό κανόνα σε καθ' ένα από αυτά: | |
\begin{gather*} | |
h = \frac{b-a}{N} \\ | |
a = x_0,x_1,\dots,x_N=b | |
\end{gather*} | |
\begin{align*} | |
I_{\mathrm T,N} &= \frac{h}{2} \left(f(x_0)+f(x_1)\right) | |
+ \frac{h}{2} \left(f(x_1)+f(x_2)\right) + \dots + \frac{h}{2} | |
\left(f(X_{N-1})+f(x_N)\right) | |
\\ &= \frac{h}{2} \left[ | |
f(x_0)+2f(x_1)+2f(x_2)+\dots+2f(x_{N-1})+f(x_N) | |
\right] | |
\end{align*} | |
Αντίστοιχα με παραπάνω, για το σφάλμα θα αθροίσω τα επιμέρους | |
σφάλματα: | |
\begin{align*} | |
E_{\mathrm T,N} &= \sum_{i=1}^{N} -\frac{h^3}{12} f''(z_i) | |
\qquad x_{i-1} < z_i < x_i | |
\\ &= - \frac{h^3}{12} N f''(z) \qquad a<z<b | |
\\ &= -\frac{h^2}{12}(b-a)f''(z) \\ | |
|E_{\mathrm T,N}| &\leq \frac{h^2}{12}(b-a)\max_{a<z<b} | |
\left|f''(z)\right| | |
\end{align*} | |
\paragraph{Παράδειγμα} | |
Να υπολογιστεί με τον κανόνα τραπεζίου για \( N=4,\ 8 \) το | |
ολοκλήρωμα: | |
\[ | |
\mathlarger{\int_{1}^{2} x^3\dif x} | |
\] | |
\subparagraph{Λύση για \( N=4 \)} | |
\begin{align*} | |
I_{T,4} &= \frac{h}{2} \left[ | |
f(x_0)+2f(x_1)+2f(x_2)+2f(x_3)+f(x_4) | |
\right] \\ &= \frac{\sfrac{1}{4} }{2}\left[ | |
f(1)+2f\left(\sfrac{5}{4}\right)+2f\left(\sfrac{6}{4}\right) | |
+2f\left(\sfrac{7}{4}\right)+f\left(\sfrac{8}{4}\right) | |
\right] | |
\\ &= 3.7969 \\[3ex] | |
E_{T,4} &= -\frac{h^2}{12}(2-1)f''(z) \qquad 1<z<2 \\ | |
&= - \frac{\sfrac{1}{16} }{12} \cdot 6z = -\frac{1}{32}z | |
\\ \left|E_{T,4}\right| &\leq \frac{1}{32}\cdot 2 | |
=\frac{1}{16} = 0.0625 | |
\end{align*} | |
\subparagraph{Λύση για \( N=8 \)} | |
\begin{align*} | |
I_{T,8} &= \frac{h}{2} \left[ | |
f(x_0)+2f(x_1)+2f(x_2)+\dots+2f(x_7)+f(x_8) | |
\right] \\ &= \frac{\sfrac{1}{8} }{2}\left[ | |
f(1)+2f\left(\sfrac{9}{8}\right)+2f\left(\sfrac{10}{8}\right) | |
+\dots+f\left(\sfrac{16}{8}\right) | |
\right] | |
\\ &= 3.7617 \\[3ex] | |
E_{T,8} &= -\frac{h^2}{12}(2-1)f''(z) \qquad 1<z<2 \\ | |
&= -\frac{\sfrac{1}{8^2} }{12}\cdot 6z=-\frac{1}{128}z \\ | |
|E_{T,8}| &\leq \frac{1}{128}z=\frac{1}{64}=0.01562 | |
\end{align*} | |
\subsection{Κανόνας Simpson} | |
\( \mathsmaller{(n = 2)} \) | |
\begin{tikzpicture} | |
\draw[dashed] (0.7,0) node[below] {$\vphantom{b}a$} -- ++(0,1.6); | |
\draw (1.35,0) node[below] {$\frac{a+b}{2}$}; | |
\draw[dashed] (2,0) node[below] {$b$} -- ++(0,2.24); | |
\draw (-0.5,0) -- (3,0); | |
\draw (0,-0.2) -- (0,3); | |
\draw[very thick] plot [smooth,tension=0.7] | |
coordinates {(0.3,1) (0.7,1.6) (1.5,1.7) (2.2,2.5) (2.5,2.7)}; | |
\end{tikzpicture} | |
\paragraph{Απλός κανόνας Simpson} | |
\begin{align*} | |
P_2(x) &= f(a)l_0(x) +f\left(\frac{a+b}{2}\right)l_1(x)+f(b) | |
l_2(x) \\ &= f(a) \frac{(x-x_1)(x-x_2)}{(x_0-x_1)(x_0-x_2)} | |
+ f\left(\frac{a+b}{2}\right) | |
\frac{(x-x_0)(x-x_2)}{(x_1-x_0)(x_1-x_2)} | |
+ f(b) \frac{(x-x_0)(x-x_1)}{(x_2-x_0)(x_2-x_1)} | |
\\[3ex] | |
I_{\mathrm S} &= \int_a^b P_2(x)\dif x | |
\\ &= \dots = \frac{b-a}{6} \left[ | |
f(a)+4f\left(\frac{a+b}{2}\right)+f(b) \right] \\[3ex] | |
E_{\mathrm S} &= I\left(f(x)\right)-I\left(P_2(x)\right) = \dots | |
\\ &= -\frac{\left(\frac{b-a}{2}\right)^5}{90} f^{(4)}(z) \\ | |
\left|E_{\mathrm S}\right| &\leq | |
\frac{\left(\frac{b-a}{2}\right)^5}{90}\max_{a<z<b}\left\lvert f^{(4)}(z)\right\rvert | |
\end{align*} | |
\paragraph{Σύνθετος κανόνας Simpson} | |
Το αρχικό διάστημα χωρίζεται σε \( 2N \) τμήματα: | |
\begin{tikzpicture}[scale=.7,xscale=1.4] | |
\draw (0,0) -- (0,-1) node[below] {$x_0$}; | |
\draw (0.5,0) -- ++(0,-0.7) node[below] {$x_1$}; | |
\draw (1,0) -- ++(0,-1) node[below] {$x_2$}; | |
\draw (1.5,0) -- ++(0,-0.7) node[below] {$x_3$}; | |
\draw (2,0) -- ++(0,-1) node[below] {$x_4$}; | |
\draw (2.5,0) -- ++(0,-0.7) node[below] {$x_5$}; | |
\draw (3,0) -- ++(0,-1) node[below] {$x_6$}; | |
\end{tikzpicture} | |
Εφαρμόζουμε τον απλό κανόνα Simpson σε πολλά διαστήματα: | |
\[ | |
a = x_0 \ < x_1 < x_2 < \cdots < x_{2N-1} < \ x_{2N} = b | |
\] | |
με απόσταση: | |
\[ | |
h = \frac{b-a}{N} \qquad x_i = x_0 + i\frac{h}{2} | |
\] | |
και διαστήματα: | |
\[ | |
\left[x_i,\ x_{i+2}\right], \qquad i=0,2,4,\dots,2N-2 | |
\] | |
Οπότε τελικά έχουμε: \begin{align*} | |
I_{\mathrm S,2N} &= \frac{h}{6} \left[f(x_0)+4f(x_1)+f(x_2) | |
+f(x_2)+4f(x_3)+f(x_4)+\dots + f(x_{2N-2}) + 4f(x_{2N-1}) | |
+f(x_{2N})\right] \\ &= | |
\frac{h}{6} \left[f(x_0)+4f(x_1)+2f(x_2)+4f(x_3)+2f(x_4)+\dots | |
+ 2f(x_{2N-2}) + 4f(x_{2N-1})+f(x_{2N})\right] | |
\end{align*} | |
Και για το σφάλμα, με αρκετές πράξεις προκύπτει: | |
\begin{align*} | |
E{\mathrm S,2N} &= -n \frac{\left(\frac{h}{2}\right)^5}{90} | |
f^{(4)}(z),\quad a<z<b \\ | |
&= -\frac{\left(\frac{h}{2}\right)^4}{180}(b-a)f^{(4)}(z) \\ | |
\left|E_{\mathrm S,2N}\right| &\leq | |
\frac{\left(\frac{h}{2}\right)^4}{180}(b-a) | |
\max_{a<z<b} \left\lvert f^{(4)}(z)\right\rvert | |
\end{align*} | |
\subsection{Κανόνας Μέσου Σημείου} | |
Ανοικτοί τύποι Newton-Cotes (μέχρι στιγμής έχουμε ασχοληθεί με | |
κλειστούς τύπους Newton-Cotes). | |
\paragraph{Απλός κανόνας μέσου σημείου} | |
Η ιδέα είναι να παίρνουμε ένα παραλληλόγραμμο με ύψος όμως που να | |
μην αντιστοιχεί στο άκρο του διαστήματος, αλλά στο μέσον του: | |
\begin{center} | |
\begin{tikzpicture}[scale=1.7] | |
\filldraw[draw=gray,fill=green!80!blue!50!white] (0.8,0) rectangle (1.8,1.3); | |
\draw (-0.5,0) -- (2.3,0); | |
\draw (0,-0.5) -- (0,2.2); | |
\draw (0.8,0) node[below] {$a$} -- ++(0,0.85); | |
\draw[dashed] (0.8,0.85) -- (0,0.85) node[left] {$f(a)$}; | |
\draw[dashed] (1.3,0) node[below] {$\frac{a+b}{2}$} -- ++(0,1.3) -- (0,1.3); | |
\draw[dashed] (1.3,1.3) -- (1.8,1.3); | |
\draw[dashed] (0.8,0.85) -- (1.8,0.85); | |
\draw (1.8,0) node[below] {$b$} -- ++(0,2); | |
\draw[dashed] (1.8,2) -- (0,2) node[left] {$f(b)$}; | |
\draw[very thick,blue] plot [smooth,tension=1] coordinates {(-0.2,0.5) (1,1) (1.9,2.2)}; | |
\end{tikzpicture} | |
\end{center} | |
\begin{align*} | |
I_{\mathrm M} &= (b-a)\cdot f\left(\frac{a+b}{2}\right) \\ | |
E_{\mathrm M} &= \frac{(b-a)^3}{24}f''(z) \quad a<z<b | |
\end{align*} | |
\paragraph{Σύνθετος κανόνας μέσου σημείου} | |
\begin{align*} | |
I_{\mathrm M, N} &= hf\left(x_0+\frac{h}{2}\right) | |
+hf\left(x_1+\frac{h}{2}\right)+\dots | |
+hf\left(x_{N-1}+\frac{h}{2}\right) | |
\\ &= h \sum_{i=0}^{N-1} f\left(x_i+\frac{h}{2}\right) \\ | |
E_{\mathrm M, N} &= \frac{h^2}{24} (b-a) f''(z) \qquad a<z<b | |
\\ \left|E_{\mathrm M,N}\right| &\leq \frac{h^2}{24}(b-a) | |
\max_{a<z<b}\left|f''(z)\right| | |
\end{align*} | |
\subsection{Ασκήσεις} | |
\paragraph{Άσκηση} | |
Να υπολογιστεί το ολοκλήρωμα | |
\[ | |
\mathlarger{I=\int_{0}^{1} \frac{1}{1+x}\dif x} | |
\] | |
με τον κανόνα του παραλληλογράμμου για \( N=1 \) και \( N=10 \) | |
διαστήματα. | |
\subparagraph{Λύση για \( N=1 \)} | |
\begin{align*} | |
I_R &= f(0)\big(1-0\big) = 1\cdot 1 = 1 \\[3ex] | |
\left|E_R\right| &\leq \frac{(b-a)^2}{2}\max_{0<z<1}\left| | |
f(z)\right| \\ f'(z) &= \frac{1}{(1+z)^2} \\ | |
\max_{0<z<1} \left|f'(z)\right| &= 1 \intertext{Άρα} | |
\left|E_R\right| &\leq \frac{(b-a)^2}{2}\max_{0<z<1}\left| | |
f(z)\right| = \frac{1}{2}\cdot 1 = \frac{1}{2} | |
\end{align*} | |
\subparagraph{Λύση για \( N=10 \)} | |
\begin{align*} | |
I_{R,10} &= h\left(f(x_0)+f(x_1)+\dots+f(x_{N-1})\right) \\ | |
\end{align*} | |
\[ | |
\begin{array}{r|c|c|c|c|c|c|c} | |
x_k & 0 & 0.1 & 0.2 & 0.3 & \cdots & 0.9 & 1 \\ \hline | |
f(x_k) & 1 & 0.9091 & 0.8333 & 0.7692 & \cdots & 0.5263 & 0.5 | |
\end{array} | |
\] | |
\begin{align*} | |
I_{R,10} &= 0.1\big( | |
1+0.9091+0.8333+0.7962+\dots+0.5263 | |
\big) = 0.7188 \\ \left|E_{R,10}\right| &\leq \frac{h}{2} | |
(b-a) \max_{a<z<b}\left|f'(z)\right| = \frac{0.1}{2}\cdot | |
1\cdot 1 = 0.05 | |
\end{align*} | |
\subparagraph{Λύση με κανόνα μέσου σημείου} | |
\begin{align*} | |
I_M &= (b-a) \cdot f\left(\frac{a+b}{2}\right) | |
= 1 \cdot f\left(\frac{1}{2}\right) = 0.6667 \\ | |
|E_M| &\leq \frac{(b-a)^3}{24} \max_{a<z<b} \left|f''(z)\right| | |
\intertext{\( | |
\max\limits_{0<z<1}\left|f''(z)\right|= | |
\max\limits_{0<z<1}\left| | |
\frac{2}{(1+x)^3} | |
\right| = 2\) για $x=0$} | |
&= \frac{1}{24}\cdot 2 = 0.0833 | |
\end{align*} | |
\begin{tabular}{c|c|c} | |
Τύπος & Τιμή & Σφάλμα \\ | |
\begin{tikzpicture}[scale=0.3] | |
\draw (0,0) -- (0.3,0.7) -- (1.3,0.7) -- (1,0) -- cycle; | |
\draw (1.2,0.35) node[right] {$N=1$}; | |
\end{tikzpicture}& 1 & 0.5 \\ | |
\hline | |
\begin{tikzpicture}[scale=0.3] | |
\draw (0,0) -- (0.3,0.7) -- (1.3,0.7) -- (1,0) -- cycle; | |
\draw (1.2,0.35) node[right] {$N=10$}; | |
\end{tikzpicture}& 0.7188 & 0.05 \\ | |
\hline | |
Μέσου Σημείου & 0.6667 & 0.0833 \\ | |
\end{tabular} | |
\paragraph{Άσκηση} | |
Να υπολογιστεί το ολοκλήρωμα | |
\[ | |
I = \mathlarger{\int_{1}^{3} | |
\left(x+\frac{1}{x^2}\right)\dif x | |
} | |
\] | |
με τη μέθοδο τραπεζίου για \( N=6 \). | |
\subparagraph{Λύση} | |
\( 1=x_0<x_1<\dots<x_6=3 \) | |
\begin{align*} | |
I_{T,6} &= \frac{h}{2}\left[ | |
f(x_0)+2f(x_1)+2f(x_2)+2f(x_3)+2f(x_4)+2f(x_5)+f(x_6) | |
\right] | |
\end{align*} | |
\(h=\frac{b-a}{N}=\frac{3-1}{6}=\frac{1}{3}\) | |
\[ | |
\begin{array}{r|c|c|c|c|c|c|c} | |
x_i & 1 & 1+\sfrac{1}{3} & 1+\sfrac{2}{3} & 2 & 2+\sfrac{1}{3} | |
& 2+\sfrac{2}{3} & 3 \\ \hline | |
f(x_i) & 2 & \sfrac{91}{48} & \sfrac{152}{75} & \sfrac{9}{4} & | |
\sfrac{370}{147} & \sfrac{532}{192} & \sfrac{28}{9} | |
\end{array} | |
\] | |
Άρα: | |
\begin{align*} | |
I_{T,6} &= \frac{1}{6} \left[ | |
2+2\cdot\frac{91}{48}+2\cdot\frac{152}{75}+2\cdot\frac{9}{4} | |
+2\cdot\frac{370}{147}+2\cdot\frac{532}{192}+\frac{28}{9} | |
\right] = 4.684 \\ | |
E_{T,6} &\leq \frac{h^2}{12}(b-a)\max_{a<z<b}\left|f''(z)\right| | |
= \frac{\left(\sfrac{1}{2} \right)^2}{12}\cdot(3-1) | |
\cdot\max_{1<z<3}\frac{6}{z^4} = \frac{1}{9} \simeq 0.1111 | |
\end{align*} | |
\paragraph{Άσκηση} | |
Για τη συνάρτηση \( f \) γνωρίζουμε τον παρακάτω πίνακα τιμών: | |
\[ | |
\begin{array}{r|c|c|c|c|c|c|c} | |
& x_0 & x_1 & x_2 & x_3 & x_4 & x_5 & x_6 \\[2ex] | |
x_i & 1 & 2 & 3 & 4 & 5 & 6 & 7 \\ \hline | |
f(x_i) & -1 & 0 & 0.5 & 2 & 1.5 & 3 & 5 | |
\end{array} | |
\] | |
Ζητείται να βρεθεί το ολοκλήρωμα \( \displaystyle \int_1^7 f(x) | |
\dif x \) με κανόνα Simpson. | |
\subparagraph{Λύση} | |
Για να εφαρμόσουμε κανόνα Simpson, το κάθε διάστημα πρέπει να | |
καταλαμβάνει 3 σημεία (τα δύο άκρα και το μέσο). | |
\begin{tikzpicture}[scale=2.5,every node/.style={scale=1},xscale=.9] | |
\draw (0,0) node[above] {$x_0$} -- +(0,-0.15) -- ++(0.6,-0.15) --++(0,0.15); | |
\draw (0.7,0) -- +(0,-0.15) -- ++(0.6,-0.15) --++(0,0.15); | |
\draw (1.4,0) -- +(0,-0.15) -- ++(0.6,-0.15) --++(0,0.15) node[above] {$x_6$}; | |
\draw (0.65,0) node[above] {$x_2$}; | |
\draw (1.3,0) node[above] {$x_4$}; | |
\draw(0.3,0.1) node[above] {$x_1$}; | |
\draw(1.0,0.1) node[above] {$x_3$}; | |
\draw(1.7,0.1) node[above] {$x_5$}; | |
\end{tikzpicture} | |
Επομένως: | |
\begin{gather*} | |
N = 3 \\ | |
h=\frac{7-1}{3} | |
\end{gather*} | |
Άρα έχουμε: | |
\begin{align*} | |
I &= \frac{h}{6} \left[ | |
f(x_0)+4f(x_1)+2f(x_2)+4f(x_3)+2f(x_4)+4f(x_5)+f(x_6) | |
\right] \\ &= \frac{1}{3} \left[ | |
-1+4\cdot 0 + 2\cdot 0.5 + 4\cdot 2 + 2\cdot 1.5 + 4\cdot 3+5 | |
\right] \\ &= 9.333 | |
\end{align*} | |
\section{Υπολογισμός Ιδιοτιμών} | |
Δομή της ενότητας: | |
\begin{itemize} | |
\item Εισαγωγή | |
\item Μέθοδος Δύναμης | |
\item Μετασχηματισμοί Householder | |
\item Παραγοντοποίηση QR | |
\end{itemize} | |
\textbf{Το πρόβλημα που καλούμαστε να λύσουμε είναι:} Δεδομένου | |
ενός πίνακα \( A \in \mathbb R^{n\times n} \), να υπολογιστούν οι | |
ιδιοτιμές \( \lambda_i \in \mathbb R \), και τα αντίστοιχα | |
ιδιοδιανύσματα \( x_i \in \mathbb R^n \), \underline{\( x_i\neq 0 \)} | |
τα οποία ικανοποιούν: | |
\[ | |
Ax_i = \lambda x_i \quad \text{για } i =1,2,\dots,n | |
\] | |
\subsection{Εισαγωγή} | |
\[ | |
\boxed{Ax = | |
\underset{\substack{\downarrow\\\mathclap{\text{ιδιοτιμές}}}}{ | |
\lambda} | |
\overset{\substack{\mathclap{\text{ιδιοδιανύσματα}}\\\uparrow}}{ | |
x}\hspace{25pt} | |
} | |
\] | |
ή: | |
\begin{align*} | |
(A-\lambda I)x &= 0 \\ | |
\det(A-\lambda I) &= 0, \text{ δηλαδή } x \in N(A-\lambda I), | |
\text{ όπου } N \text{ ο μηδενοχώρος} | |
\end{align*} | |
Δηλαδή πρέπει να λύσουμε ένα σύστημα \( n \) εξισώσεων και αγνώστων. | |
Ορίζουμε και το χαρακτηριστικό πολυώνυμο ως: | |
\[ | |
P(\lambda) = \det(A-\lambda I) | |
\] | |
\paragraph{Παράδειγμα} | |
\[ | |
A = \left[\begin{matrix} | |
3&2\\3&-2 | |
\end{matrix}\right] | |
\] | |
Τότε: | |
\begin{gather*} | |
|A-\lambda I| = \left|\begin{matrix} | |
3-\lambda & 2 \\ 3 & -2-\lambda | |
\end{matrix}\right| = \lambda^2 -\lambda-12 \\ | |
\lambda^2-\lambda-12 = 0 \implies\begin{cases} | |
\lambda_1 &= 4 \\ \lambda_2&=-3 | |
\end{cases} | |
\end{gather*} | |
Τα παραπάνω \( \lambda \) είναι οι ιδιοτιμές, και τα ιδιοδιανύσματα | |
είναι, για \( \lambda_1 = 4 \): | |
\begin{gather*} | |
(A-4I)x = 0 \iff \left[\begin{matrix} | |
-1&2\\3&-6 | |
\end{matrix}\right]x = 0 \\ N(A-4I)= \left\lbrace | |
a\left[\begin{matrix} | |
2\\1 | |
\end{matrix}\right]: a \in\mathbb R, a\neq 0 | |
\right\rbrace | |
\end{gather*} | |
Αντίστοιχα προκύπτει: | |
\[ | |
N(A+3I) = \left\lbrace a\left[ | |
\begin{matrix} | |
-1\\3 | |
\end{matrix} | |
\right] : a \in\mathbb R, a\neq 0 \right\rbrace | |
\] | |
\paragraph{} | |
Αν ο πίνακας είναι τριγωνικός, οι ιδιοτιμές είναι μόνο τα διαγώνια | |
στοιχεία του: | |
\[ | |
\lambda_i = a_{ii} | |
\] | |
\begin{defn}{Φάσμα}{} | |
Το σύνολο όλων των ιδιοτιμών ενός πίνακα \( A \) ονομάζεται | |
\textbf{ΦΑΣΜΑ} του \( A \): | |
\[ | |
\sigma(a) | |
\] | |
\end{defn} | |
\begin{defn}{Φασματική ακτίνα}{} | |
Το μέγιστο κατ' απόλυτη τιμή στοιχείο του φάσματος ονομάζεται | |
\textbf{φασματική ακτίνα} του \( A \) και συμβολίζεται: | |
\[ | |
P(A) = \max\left\lbrace |\lambda|:\lambda \in \sigma(A) | |
\right\rbrace | |
\] | |
Δηλαδή είναι η μέγιστη κατ' απόλυτη τιμή ιδιοτιμή του \( A \). | |
\end{defn} | |
Επειδή ο υπολογισμός ορίζουσας είναι δύσκολη υπολογιστική διαδικασία, | |
θα βρούμε αριθμητικούς τρόπους να τις βρίσκουμε/προσεγγίζουμε. | |
\subsubsection{Άνω Φράγματα} | |
\begin{defn}{}{} | |
Ορίζουμε: | |
\begin{align*} | |
r_i(A) &= \sum_{j=1}^{n} \left|a_{ij}\right|, \ \forall i\\ | |
c_j(A) &= \sum_{i=1}^{n} \left|a_{ij}\right|, \ \forall j | |
\intertext{(τα αθροίσματα των απόλυτων τιμών των στοιχείων | |
κάθε γραμμής \& στήλης)} | |
r(A) &= \max\left\lbrace r_i(A): \forall i \right\rbrace\\ | |
c(A) &= \max\left\lbrace c_j(A): \forall j \right\rbrace | |
\intertext{(το μέγιστο άθροισμα)} | |
\end{align*} | |
\end{defn} | |
\begin{theorem}{Gerschgorin}{} | |
Για πίνακα \( A \in \mathbb R^{n\times n} \), έστω ότι, για | |
κάθε γραμμή: | |
\[ | |
R_i = r_i(A) - \left|a_{ii}\right| \ \forall i | |
\] | |
και έστω δίσκος \( C_i \) με ακτίνα \( R_i \) και κέντρο | |
\( a_{ii} \) (\( a_{ii}\in\mathbb C \)). | |
Τότε για κάθε \( \lambda \in \sigma(A) \) υπάρχει \( i \) όπου | |
\( \lambda \in C_i \), δηλαδή: | |
\[ | |
\left|\lambda - a_{ii}\right| \leq R_i | |
\] | |
\end{theorem} | |
\paragraph{Συνέπεια} | |
Έστω: | |
\begin{align*} | |
\lambda &\in \sigma(A) \text{ ενός } A \in \mathbb R^{n\times n} | |
\\ | |
\lvert\lambda\rvert &\leq r(A) \\[3ex] | |
\left|\lambda - a_{kk}\right| &\leq R_k \\ | |
\left|(\lambda - a_{kk})+a_{kk}\right| &\leq | |
\left|\lambda - a_{kk}\right|+\left|a_{kk}\right| | |
\leq R_k + \left|a_{kk}\right| = r_k(A) \leq r(A) | |
\end{align*} | |
Επειδή \( r(A^{\mathrm T}) = c(A) \), ισχύει ότι: | |
\[ | |
|\lambda| \leq \min\left\lbrace r(A),c(A) \right\rbrace | |
\] | |
Επομένως για το προηγούμενο παράδειγμα: | |
\begin{align*} | |
A&=\left[\begin{matrix} | |
3&2\\3&-2 | |
\end{matrix}\right] | |
\\ \left.\begin{array}{rr} | |
r_1(A) &= 5 \\ r_2(A) &= 5 | |
\end{array}\right\rbrace r(A) &= 5 \\ | |
\left.\begin{array}{rr} | |
c_1(A) &= 6 \\ c_2(A) &= 4 | |
\end{array}\right\rbrace c(A) &= 6 \\ | |
|\lambda| &\leq \min\left\lbrace 5,6 \right\rbrace = 5 | |
\end{align*} | |
\subsection{Μέθοδος δύναμης} | |
Έχουμε έναν πίνακα \( A \) και κατατάσσουμε τις ιδιοτιμές του: | |
\[ | |
\left|\lambda_1\right| \geq \left|\lambda_2\right| | |
\geq \dots \geq \left|\lambda_n\right| | |
\] | |
με ιδιοδιανύσματα: | |
\[ | |
x_1,x_2,\dots,x_n | |
\] | |
που γνωρίζουμε από τη θεωρία γραμμικής άλγεβρας ότι είναι γραμμικά | |
ανεξάρτητα, επομένως σχηματίζουν μία βάση, με ένα τυχαίο διάνυσμα: | |
\begin{align*} | |
v_0 &= a_1x_1+a_2x_2+\dots+a_nx_n | |
\intertext{πολλαπλασιάζουμε με \( A \):} | |
Av_0 &= a_1Ax_1+a_2Ax_2+\dots + a_nAx_n \\ | |
&= a_1\lambda_1 x_1+a_2\lambda_2 x_2 +\dots + a_n\lambda_n | |
x_n \\ | |
A^2v_0 &= a_1\lambda_1^2 x_1 +a_2\lambda_2^2 x_2+\dots + | |
a_n\lambda_n^2x_n \\ | |
&\vdots \\ | |
\underbrace{A^kv_0}_{v_k} &= a_1\lambda_1^k | |
x_1+a_2\lambda_2^kx_2+\dots + | |
a_n\lambda_n^k x_n \\ | |
\frac{1}{\lambda_1^k} v_k &= | |
a_1x_1 + a_2\left(\frac{\lambda_2}{\lambda_1}\right)^k | |
x_2+\dots + a_n\left(\frac{\lambda_n}{\lambda_1}\right)^k x_n \\ | |
\lim_{k\to \infty} \frac{1}{\lambda_1^k} v_k &= a_1x_1 | |
\end{align*} | |
Επειδή \( k\to \infty \) και μπορεί να εμφανιστούν πολύ μεγάλοι ή | |
πολύ μικροί αριθμοί, θα κανονικοποιήσω το \( v_k \). | |
\subsubsection{Αλγόριθμος} | |
\textbf{Είσοδος:} \( A \in \mathbb R^{n\times n}, | |
u_0 \in \mathbb R^n \): | |
\begin{algorithm}[H] | |
\For{k=0,1,\dots}{ | |
\( v_{k+1} := A u_k \)\; | |
\( u_{k+1} := \frac{1}{\left\Vert v_{k+1}\right\Vert_\infty} | |
v_{k+1} \)\; | |
\If{\( \left\Vert u_{k+1}-u_k \right\Vert_\infty < | |
\epsilon \)}{go to 6} | |
} | |
\end{algorithm} | |
\paragraph{Παράδειγμα} | |
\begin{alignat*}{4} | |
A&=\begin{bmatrix} | |
2&1\\1&2 | |
\end{bmatrix},\quad u_0=\left[\begin{matrix} | |
2\\1 | |
\end{matrix}\right] \\ | |
v_1 &= Au_0 = \left[\begin{matrix} | |
5\\4 | |
\end{matrix}\right] && \implies u_1 && = \frac{1}{5}v_1 && = \left[ | |
\begin{matrix} | |
1.0\\0.8 | |
\end{matrix}\right] \\ | |
v_2 &= Au_1 = \left[\begin{matrix} | |
2.8\\2.6 | |
\end{matrix}\right] && \implies u_2 && = \frac{1}{2.8}v_2 && = \left[\begin{matrix} | |
1.0\\0.93 | |
\end{matrix}\right] \\ | |
v_3 &= Au_2 = \left[\begin{matrix} | |
2.92\\2.85 | |
\end{matrix}\right] && \implies u_3 && = \frac{1}{2.92} v_3 && = \left[\begin{matrix} | |
1.0\\0.98 | |
\end{matrix}\right] \\ | |
v_4 &= Au_3 = \left[\begin{matrix} | |
2.98\\2.95 | |
\end{matrix}\right] | |
\end{alignat*} | |
\subsection{Μετασχηματισμοί Householder} | |
Από τη γραμμική άλγεβρα γνωρίζουμε ότι οι όμοιοι πίνακες έχουν ίδιες | |
ιδιοτιμές: | |
\begin{gather*} | |
A,B \in \mathbb R^{n\times n} \\ | |
\boxed{B = S^{-1}AS} | |
\end{gather*} | |
Αν για τον \( A \) έχω υπολογίσει την \( \lambda_1 \), θα είναι χρήσιμο | |
να μπορώ να βρω έναν πίνακα: | |
\[ | |
HAH^{-1} = \left[ \begin{array}{c|ccccc} | |
\lambda_1 & x & x & x & \dots & x \\ \hline | |
0 & & & & & \\ | |
0 & & & A_1 & & \\ | |
\vdots & & & & & \\ | |
0 & & & & & | |
\end{array} \right] | |
\] | |
\begin{align*} | |
\det(A-\lambda I) \overset{\text{όμοιοι}}{=} | |
\det(HAH^{-1}-\lambda I) = | |
(\lambda_1-\lambda)\det(A_1 - \lambda I) | |
\end{align*} | |
Αν \( e_1=\left[\begin{matrix} | |
1\\0\\ \vdots \\ 0 | |
\end{matrix}\right] \) | |
\begin{align*} | |
HAH^{-1} e_1 &= \lambda_1 e_1 \\ | |
A(H^{-1}e_1) &= \lambda_1 (H^{-1}e_1) | |
\end{align*} | |
Δηλαδή ψάχνω \( H \) ώστε: | |
\begin{align*} | |
H^{-1}e_1 &= x_1 \\ | |
\Aboxed{Hx_1 &= e_1} | |
\end{align*} | |
κάτι που θα μου δώσει ο Householder. | |
\subsection{Παραγοντοποίηση QR (Εισαγωγή)} | |
Μετατρέπω έναν πίνακα \( A \) σε γινόμενο 2 πινάκων \( Q \) και | |
\( R \), όπου ο \( Q \) ορθογώνιος και ο \( R \) άνω τριγωνικός: | |
\[ | |
A = | |
\underset{\substack{\downarrow\\\mathclap{\text{ορθογώνιος}}}}{Q} | |
\cdot | |
\overset{\substack{\mathclap{\text{άνω τριγωνικός}}\\\uparrow}}{R} | |
\] | |
Για κάποιες επαναλήψεις: | |
\[ | |
A_0 = A | |
\] | |
\[ | |
\begin{cases} | |
A_0 = Q_1R_1, &\quad \text{θέτω } A_1 = R_1Q_1 \\ | |
A_1 = Q_2R_2, &\quad \text{θέτω } A_2 = R_2Q_2 \\ | |
\quad \vdots &\quad \quad \vdots \\ | |
A_{k-1} = Q_kR_k, &\quad \text{θέτω } A_k = R_kQ_k \\ | |
\end{cases} | |
\] | |
Η μέθοδος αυτή συγκλίνει σε έναν ημιτριγωνικό πίνακα (τον | |
\( A_k \)). Από τον \( A_0 \) ξεκινώ, τον παραγοντοποιώ σε | |
\( Q_1R_1 \) και βρίσκω τον \( A_1 = R_1Q_1 \). Παραγοντοποιώ τον | |
\( A_1 \) σε γινόμενο \( QR \) κ.ό.κ. | |
\textbf{Για έναν ημιτριγωνικό πίνακα:} | |
\[ \left[ | |
\begin{matrix} | |
\circ & & & & \\ | |
& \circ & & & \\ | |
& & \Box & & \\ | |
& & & \Box & \\ | |
& & & & \ddots | |
\end{matrix} \right] | |
\] | |
Ο πίνακας αυτός είναι άνω τριγωνικός, απλά σε κάποιες θέσεις στη | |
διαγώνιο έχει \( 2\times 2 \) πίνακες. | |
\paragraph{Παράδειγμα} | |
Να βρεθούν οι ιδιοτιμές του πίνακα \( A \) με παραγοντοποίηση | |
\( QR \): | |
\[ | |
A = \left[\begin{matrix} | |
1&2&3 \\ 0 & 1 & 5 \\ 0 & -3 & 2 | |
\end{matrix}\right] | |
\] | |
\subparagraph{Λύση} | |
Ο \( A \) είναι ήδη ημιτριγωνικός (ουσιαστικά είναι ο \( A_k \)): | |
\[ | |
A = \left[\begin{matrix} | |
1 & \\ 0 & \boxed{B} | |
\end{matrix} | |
\right] \quad \text{όπου } B = \left[ | |
\begin{matrix} | |
1 & 5 \\ -3 & 2 | |
\end{matrix}\right] | |
\] | |
Η μία ιδιοτιμή είναι το \( \lambda_1 = 1 \). | |
Οι μιγαδικές ιδιοτιμές θα προκύψουν από τον πίνακα \( B \): | |
\begin{align*} | |
\det(B-\lambda I) = 0 \implies | |
\left|\begin{matrix} | |
1-\lambda & 5 \\ -3 & 2-\lambda | |
\end{matrix} | |
\right| = 0 \implies \lambda^2 -3\lambda + 17 = 0 | |
\implies \lambda_{2,3} =\frac{3}{2} \pm i\frac{\sqrt{59}}{2} | |
\end{align*} | |
\paragraph{Παράδειγμα} | |
Να βρεθούν οι ιδιοτιμές του \( A \) με τη μέθοδο παραγοντοποίησης | |
\( QR \): | |
\[ | |
A = \left[\begin{matrix} | |
6&-1& 5 \\ -3 & 2 & -1 \\ 2 & 4 & 2 | |
\end{matrix} | |
\right] | |
\] | |
\subparagraph{Λύση} | |
Σύμφωνα με τη μέθοδο: | |
\begin{gather*} | |
A = A_0 \\ | |
A_0 = Q_1R_1 = \left[\begin{matrix} | |
0.85&-0.11&0.50\\ | |
-0.42&0.38&0.81\\ | |
0.28&0.91&-0.28 | |
\end{matrix}\right] \cdot \left[\begin{matrix} | |
7&-0.57&5.28\\ | |
0&4.54&6.88\\ | |
0&0&1.13 | |
\end{matrix} | |
\right] | |
\intertext{(Θα δούμε αργότερα πώς βρίσκουμε τους \( Q_1R_1 \))} | |
A_1=R_1Q_1 = \left[\begin{matrix} | |
7.75&5.83&1.55\\-1.69&2.56&3.46\\0.32&1.03&-0.31 | |
\end{matrix}\right] | |
\end{gather*} | |
Τώρα παραγοντοποιώ τον \( A_1 \) σε γινόμενο QR: | |
\[ | |
A_1 = Q_2R_2 \implies A_2 = R_2Q_2 | |
\] | |
Μετά από 6 επαναλήψεις προκύπτει: | |
\[ | |
A_6 = \left[\begin{matrix} | |
6.06 & 5.30 & 1.05 \\ | |
-0.17 & 5.07 & -2.63 \\ | |
0 & 0 & -1.13 | |
\end{matrix}\right] | |
\] | |
Ο πίνακας \( A_6 \) είναι ημιτριγωνικός. Στην διαγώνιο βρίσκουμε | |
ότι \( \lambda_3 = -1.13 \). Ύστερα μέσω του \( B = \left[ | |
\begin{matrix} | |
6.06&5.30 \\ -0.17&5.07 | |
\end{matrix} | |
\right] \) | |
θα βρω τις | |
\( \lambda_{1,2} \): | |
\[ | |
\det(B-\lambda I) = 0 \implies \lambda_{1,2} = 5.57 | |
\pm i0.81 | |
\] | |
\subsection{Παραγοντοποίηση QR} | |
\paragraph{Το πρόβλημα} | |
Δεδομένου ενός πίνακα \( A \), να βρεθούν 2 πίνακες | |
\( Q \) (ορθογώνιος), \( R \) (άνω τριγωνικός), έτσι ώστε: | |
\[ | |
\mathlarger{A = Q \cdot R} | |
\] | |
\subsubsection{Εισαγωγή} | |
Ένα σύνολο διανυσμάτων \( \left\lbrace x_1,x_2,\dots, | |
x_n \right\rbrace \) του χώρου \( V \) λέγονται ορθογώνια αν ανά | |
2 μεταξύ τους είναι κάθετα: | |
\[ | |
(x_i,x_j) = 0 \quad \forall i \neq j | |
\] | |
Τα διανύσματα \( x_1,x_2,\dots, x_n \) λοιπόν είναι μεταξύ τους | |
γραμμικά ανεξάρτητα. Εάν σε αυτά τα διανύσματα προσθέσω (εκτός | |
της ορθογωνιότητας) την ιδιότητα της | |
\textbf{μοναδιαίας νόρμας/μήκους/μέτρου}, ονομάζω τα \( x_1,x_2, | |
\dots, x_n \) \textbf{ορθοκανονικά}. Τότε ισχύει και η παρακάτω | |
ιδιότητα: | |
\paragraph{Kroenecker Delta} | |
Όταν έχω μία σχέση μεταξύ δύο αντικειμένων: | |
\begin{align*} | |
(x_i,x_j) &= 0 \quad \text{για } i \neq j \\ | |
&= 1 \quad \text{για } i = j | |
\end{align*} | |
αυτή αναπαριστά το δέλτα του Kroenecker: | |
\[ | |
(x_i,x_j) = \delta_{ij} | |
\] | |
Για να μετατρέψω το ορθογώνιο σύστημα σε ορθοκανονικό, αρκεί | |
να πάρω κάθε διάνυσμα βάσης, και να το "μειώσω" ώστε να έχει | |
μέτρο τη μονάδα (\textbf{κανονικοποίηση}): | |
\[ | |
x_i := \frac{x_i}{\Vert x_i \Vert} | |
\] | |
Για παράδειγμα, αν \( x_i=\left[\begin{matrix} | |
x_1\\x_2\\x_3 | |
\end{matrix}\right] \), τότε: | |
\begin{align*} | |
\Vert x_i \Vert^2 &= x_1^2+x_2^2+x_3^2 \\ | |
\Vert x_i \Vert &= \sqrt{x_1^2+x_2^2+x_3^2} \\ | |
x_i &= \left[ | |
\begin{matrix} | |
\frac{x_1}{\sqrt{x_1^2+x_2^2+x_3^2}} \\ | |
\frac{x_2}{\sqrt{x_1^2+x_2^2+x_3^2}} \\ | |
\frac{x_3}{\sqrt{x_1^2+x_2^2+x_3^2}} | |
\end{matrix} | |
\right] | |
\end{align*} | |
\paragraph{} | |
Ας υποθέσουμε ότι έχουμε \( n \) ορθοκανονικά διανύσματα βάσης | |
σε έναν χώρο διάστασης \( n \): | |
\[ | |
\left\lbrace x_1,x_2,\dots,x_n \right\rbrace | |
\] | |
Επομένως κάθε διάνυσμα \( X \) του χώρου γράφεται σαν γραμμικός | |
συνδυασμός των διανυσμάτων βάσης: | |
\[ | |
X = \sum_{i=1}^{n} c_i x_i | |
\] | |
και επειδή η βάση είναι ορθοκανονική, αποδεικνύεται ότι οι | |
συντελεστές \( c_i \) προκύπτουν από το εσωτερικό γινόμενο: | |
\[ | |
c_i = (x_i,X) | |
\] | |
\textit{Πράγματι:} | |
\begin{align*} | |
\left(x_i,X\right) &= \left( | |
x_i, \sum_{j=1}^{n} c_j x_j \right) | |
\intertext{Από ιδιότητα του εσωτερικού γινομένου | |
\( (ax+by,z)=a(x,y)+b(y,z) \)} | |
&= \sum_{j=1}^{n} c_j(x_i,x_j) | |
\\ &= \sum_{j=1}^{n} c_i \cdot \delta_{ij} = c_i. | |
\end{align*} | |
\subsubsection{Ορθογώνιος πίνακας} | |
Έστω ότι στον χώρο \( \mathbb R^n \) έχουμε \( n \) ορθοκανονικά | |
διανύσματα \( q_1,q_2,\dots,q_n \). | |
Τον πίνακα που φτιάχνουμε με αυτά τα διανύσματα: | |
\[ | |
Q = \left[\begin{matrix} | |
& & & \\ q_1 & q_2 & \dots & q_n \\ & & & | |
\end{matrix}\right] | |
\] | |
τον ονομάζουμε \textbf{ορθογώνιο} πίνακα. | |
Για αυτόν προκύπτει αν δούμε τις πράξεις: | |
\[ | |
\boxed{Q^{\mathrm T}Q = I}, | |
\] | |
δηλαδή ο \textit{ανάστροφός του} είναι ο \textit{αντίστροφός} του: | |
\[ | |
Q^{-1} = Q^{\mathrm T} | |
\] | |
\paragraph{Εσωτερικά γινόμενα} | |
Θα δείξουμε ότι το εσωτερικό γινόμενο δύο διανυσμάτων \( x,y \) ενός χώρου | |
δεν αλλάζει αν τα πολλαπλασιάσουμε με τον \( Q \), δηλαδή | |
\( \mathlarger{(Qx,Qy) = (x,y)} \): | |
\begin{align*} | |
(Qx,Qy) &= (Qx)^{\mathrm T}Qy \\ | |
&= x^{\mathrm T} \underbrace{Q^{\mathrm T}Q}_{I} y\\ | |
&= x^T \, y = (x,y). | |
\end{align*} | |
Επομένως, παρατηρώ ότι: | |
\[ | |
\left\Vert Qx \right\Vert^2 | |
= (Qx,Qx) = (x,x) = \left\Vert x \right\Vert^2 | |
\] | |
\paragraph{Συγκεντρωτικά οι ιδιότητες του \( Q \in \mathbb | |
R^{n\times n} \)} | |
\begin{enumerate} | |
\item Στήλες \( Q \) είναι μια ορθοκανονική βάση του | |
\( \mathbb R \) | |
\item \( Q^{\mathrm T} Q = I \) | |
\item \( Q^{-1} = Q^{\mathrm T} \) | |
\item \( (Qx,Qy) = (x,y) \) | |
\item \( \left\Vert Qx \right\Vert = \Vert x\Vert \) | |
\end{enumerate} | |
\subsection{Μετασχηματισμοί Householder} | |
Ο μετασχηματισμός Householder είναι ένας πίνακας που μετασχηματίζει | |
ένα διάνυσμα, ώστε π.χ. να έχει ίδια κατεύθυνση αλλά διαφορετικό | |
μέτρο. | |
\paragraph{Το πρόβλημα} | |
Δεδομένου ενός διανύσματος \( x \in \mathbb R^n \) και σταθεράς | |
\( k \in \left\lbrace 1,2,\dots,n \right\rbrace \), να βρεθεί ένας | |
\underline{πίνακας} \( H \), τέτοιος ώστε οι τελευταίες \( n-k \) | |
συνιστώσες του διανύσματος \( Hx \) να είναι μηδέν. | |
Δηλαδή οι τιμές του \( Hx \), κάτω από μία θέση που θέλω εγώ, να | |
είναι μηδενικές. | |
Αυτό το πρόβλημα θα λύσουν οι μετασχηματισμοί Householder: | |
\begin{defn}{}{} | |
Για κάποιο διάνυσμα \( u \in \mathbb R^n \) με | |
\underline{μοναδιαίο} μήκος (\( \Vert u\Vert_2 = 1 \)), ο πίνακας | |
\[ | |
\boxed{H = I - 2uu^{\mathrm T}} | |
\] | |
ονομάζεται \textbf{μετασχηματισμός Householder}. | |
\end{defn} | |
Παρατηρούμε ότι (και προκύπτει με πράξεις), ότι ο \( H \) είναι | |
\textbf{συμμετρικός}. | |
Θα αποδείξουμε ότι ο \( H \) είναι \textbf{ορθογώνιος}! | |
\begin{align*} | |
HH^{\mathrm T} &= | |
(I-2uu^{\mathrm T})(I-2uu^{\mathrm T})^T \\ | |
&= (I-2uu^{\mathrm T})(I-2uu^{\mathrm T}) \\ | |
&= I-4uu^{\mathrm T} + | |
\underbrace{4u\underbrace{u^{\mathrm T} u}_1 | |
u^{\mathrm T}uu^{\mathrm T}}_1 \\ | |
&= I | |
\end{align*} | |
\paragraph{} | |
Έχω: | |
\begin{gather*} | |
Hx =y \text{ όπου για τον $y$, από την $k+1$ θέση και κάτω, | |
μηδενικά} \\ | |
Hx = (I-2uu^{\mathrm T}) x = x-2uu^{\mathrm T}x=x-2(u^{\mathrm T}x)u | |
\end{gather*} | |
Όμως, το \( u^{\mathrm T}x \) είναι η προβολή του \( x \) στο \( u \). | |
Όπως ξέρω, η προβολή του διανύσματος \( \vec b \) πάνω στο διάνυσμα | |
\( \vec a \) γράφεται: | |
\[ | |
\vec \rho = \frac{a^{\mathrm T}b}{a^{\mathrm T} a}\vec a | |
\] | |
Άρα για εμάς: | |
\[ | |
\vec \rho = \frac{u^{\mathrm T}x}{\cancelto{1 \text{ αφού μοναδιαίο}}{ | |
u^{\mathrm T}u}} = (u^{\mathrm T}x)u | |
\] | |
Για να βρω τον \( Η \) ψάχνω το \( u \) στη σχέση | |
\( I-2uu^{\mathrm T} \). | |
Ορίζω το διάνυσμα \( y \) με την ίδια νόρμα (ευκλείδια) με το \( x \): | |
\[ | |
\Vert x \Vert_2 = \Vert y \Vert_2 | |
\] | |
Έτσι, ορίζω ακόμα το μοναδιαίο (κανονικοποιημένο) διάνυσμα \( u \) ως: | |
\[ | |
u = \frac{x-y}{\Vert x-y \Vert} | |
\] | |
Θα δείξω ότι αυτό το \( u \) είναι μια πάρα πολύ καλή επιλογή: | |
\[ | |
(I-2uu^{\mathrm T})x = y | |
\] | |
\subparagraph{Θέλω} | |
\[ | |
x=\left[\begin{matrix} | |
x_1\\x_2\\ \vdots \\ x_k \\ \vdots \\ x_n | |
\end{matrix}\right] | |
\rightarrow | |
y=\left[\begin{matrix} | |
x_1 \\ x_2 \\ \vdots \\ x_{k-1} | |
\\ \pm \sqrt{x_k^2+x_{k+1}^2+\dots + x_n^2} \\ | |
0 \\ 0 \\ \vdots \\ 0 | |
\end{matrix}\right] \quad \text{(από το $k+1$ και κάτω, 0)} | |
\] | |
Αυτό γίνεται με το: | |
\[ | |
u = \frac{x-y}{\Vert x-y \Vert} | |
\] | |
Θα βρω ακριβώς το \( u \): | |
\begin{gather*} | |
(x-y) = \left[\begin{matrix} | |
0 \\ 0 \\ \vdots \\ \mathsmaller{x_k - | |
\left(-\sgn(x_k)\cdot\sqrt{x_k^2+x_{k+1}^2+\dots + x_n^2} \right) | |
} | |
\\ x_{k+1} \\ \vdots \\ \vdots \\ x_n | |
\end{matrix} | |
\right] | |
\end{gather*} | |
Για ευκολία θέτω: \begin{equation} | |
\label{s_formula} | |
\boxed{s=\sqrt{x_k^2+x_{k+1}^2+\dots + x_n^2} | |
}\end{equation} | |
\begin{align} | |
\label{xy_formula} | |
\Vert x-y \Vert &= \sqrt{ | |
\left(x_k+\sgn(x_k)s\right)+x_{k+1}^2+\dots + x_n^2 | |
} \nonumber \\ &= \sqrt{2s\left(s+|x_k|\right)} | |
\end{align} | |
Τελικά: \[ | |
\label{u_matrix} | |
u = \frac{1}{\sqrt{2s\left(s+|x_k|\right)}} \left[ | |
\begin{matrix} | |
0 \\ 0 \\ \vdots \\ \mathsmaller{x_k - | |
\left(-\sgn(x_k)\cdot\sqrt{x_k^2+\dots + x_n^2} \right) | |
} | |
\\ x_{k+1} \\ \vdots \\ \vdots \\ x_n | |
\end{matrix} | |
\right] | |
\] | |
\paragraph{Παράδειγμα} | |
Επιθυμώ το παρακάτω \( x \) να έχει μηδέν στην 3\textsuperscript{η} | |
συνιστώσα: \[ | |
x = \left[\begin{matrix} | |
7\\4\\3 | |
\end{matrix}\right] | |
\] | |
\subparagraph{Επίλυση} | |
Είναι \( k=2 \). Θα χρησιμοποιήσω τις \eqref{s_formula} και \eqref{xy_formula}: | |
\begin{gather*} | |
s = \sqrt{x_2^2+x_3^2} = \sqrt{4^2+3^2} = 5\\ | |
\Vert u \Vert = \Vert x-y \Vert = \sqrt{2\cdot 5 | |
\left(s+|x_k|\right)}= \sqrt{10(5+4)} = \sqrt{90} | |
\intertext{$\sgn(x_k) = {\color{green} +}$} | |
u = \frac{1}{\sqrt{90}} \left[\begin{matrix} | |
0\\4 + {\color{green} + } 5 \\3 | |
\end{matrix}\right] = \frac{1}{\sqrt{90}} \left[\begin{matrix} | |
0\\9\\3 | |
\end{matrix}\right] | |
\end{gather*} | |
Άρα: | |
\begin{align*} | |
H &= I-2uu^{\mathrm T} = I - \frac{2}{90}\left[\begin{matrix} | |
0\\9\\3 | |
\end{matrix}\right]\left[\begin{matrix} | |
0&9&3 | |
\end{matrix}\right] = I-\frac{2}{90}\left[\begin{matrix} | |
0&0&0\\0&81&27\\0&27&9 | |
\end{matrix}\right] \\ &= \left[\begin{matrix} | |
1&0&0\\0&1&0\\0&0&1 | |
\end{matrix}\right] - \frac{2}{90}\left[\begin{matrix} | |
0&0&0\\0&81&27\\0&27&9 | |
\end{matrix}\right] = \frac{1}{5}\left[\begin{matrix} | |
5&0&0\\0&-4&-3\\0&-3&4 | |
\end{matrix}\right] \\ | |
H\cdot x &= \dots = \left[\begin{matrix} | |
7\\-5\\0 | |
\end{matrix}\right] \quad \text{(επαλήθευση)} | |
\end{align*} | |
\paragraph{} | |
Για να γράψω έναν πίνακα \( A \) με μορφή: | |
\[ | |
A = Q \cdot R | |
\] | |
λειτουργώ ως εξής: | |
\begin{gather*} | |
H_1 \cdot A = \left[\begin{matrix} | |
H_1a_1 & H_1a_2 & \dots & H_1 a_n | |
\end{matrix}\right] = \left[\begin{matrix} | |
* & * & * & \hdots & * \\ | |
0 & * & * & \hdots & * \\ | |
0 & * & * & \hdots & * \\ | |
\vdots & \vdots & \vdots & \ddots & \vdots \\ | |
0 & * & * & \hdots & * | |
\end{matrix}\right] = A_1. | |
\intertext{Βρίσκω τον $A_1$, από αυτόν υπολογίζω τον $H_2$, και | |
ύστερα βρίσκω το γινόμενο $H_2\cdot A_1$} | |
H_2 \cdot A_1 = \left[\begin{matrix} | |
* & * & * & * & \hdots & * \\ | |
0 & * & * & * & \hdots & * \\ | |
0 & 0 & * & * & \hdots & * \\ | |
0 & 0 & * & * & \hdots & * \\ | |
\vdots & & \vdots & \vdots & \ddots & \vdots \\ | |
0 & 0 & * & * & \hdots & * | |
\end{matrix}\right] = A_2 \\ | |
H_{n-1}A_{n-2} = \left[\begin{matrix} | |
* & * & * & * & \hdots & * \\ | |
0 & * & * & * & \hdots & * \\ | |
0 & 0 & * & * & \hdots & * \\ | |
0 & 0 & 0 & * & \hdots & * \\ | |
\vdots & & \vdots & \vdots & \ddots & \vdots \\ | |
0 & 0 & 0 & 0 & \hdots & * | |
\end{matrix}\right] = A_{n-1} = R | |
\end{gather*} | |
Τελικά δηλαδή: | |
\[ | |
\boxed{H_{n-1}H_{n-2}\cdots H_1\, A = R} | |
\] | |
\[ | |
H \begin{matrix} | |
\nearrow \text{ \small συμμετρικός} \\ \searrow \text{\small ορθογώνιος} | |
\end{matrix} | |
\]\[ | |
H^{\mathrm T} = H^{-1} | |
\]\begin{align*} | |
A &= H_1^{\mathrm T} H_2^{\mathrm T}\dots | |
H_{n-1}^{\mathrm T}R \\ | |
A &= \underbrace{H_1H_2\dots H_{n-1}}_QR | |
\intertext{Δηλαδή φτάνουμε στο πολυπόθητο:} | |
\Aboxed{A &= QR} \\ | |
\underset{m\times n}{A} &= \underset{m\times m}{Q} \times | |
\underset{m\times n}{\vphantom{Q}R} \rightarrow | |
\left[\begin{matrix} | |
n\times n \text{ άνω τριγωνικός } \\ \hline | |
\underset{\text{$m\times n$ γραμμές}}{0} | |
\end{matrix}\right] | |
\end{align*} | |
\paragraph{Άσκηση} | |
Δίνεται ο πίνακας \( \mathlarger{X=\left[\begin{matrix} | |
-3\\4\\12 \end{matrix} | |
\right]} \). Να βρεθεί πίνακας \( H \) ώστε ο \( Hx \) να έχει μηδέν | |
τις τελευταίες 2 συνιστώσες. | |
\subparagraph{Λύση} | |
\begin{gather*} | |
k=1 \\ s=\sqrt{x_1^2+x_2^2+x_3^2} = \sqrt{(-3)^2+4^2+12^2} = 13 | |
\\ u = \frac{1}{\sqrt{2\cdot 13\cdot (13+3)}}\left[ | |
\begin{matrix} | |
x_1+\mathrm{sgn}(x_1)\cdot s\\ x_2 \\ x_3 | |
\end{matrix}\right] \overset{\cdots}{=} \frac{1}{\sqrt{26}} \left[ | |
\begin{matrix} | |
-4\\1\\3 | |
\end{matrix}\right] \\ | |
H = I-2uu^{\mathrm T} = \left[\begin{matrix} | |
1&0&0\\0&1&0\\0&0&1 | |
\end{matrix}\right] - 2\frac{1}{\sqrt{26}}\left[\begin{matrix} | |
-4\\1\\3 | |
\end{matrix}\right]\frac{1}{\sqrt{26}}\left[\begin{matrix} | |
-4&1&3 | |
\end{matrix}\right] | |
= \frac{1}{13}\left[\begin{matrix} | |
-3&4&12\\4&12&-3\\12&-3&4 | |
\end{matrix}\right] | |
\end{gather*} | |
Όντως, για επαλήθευση παρατηρούμε ότι: | |
\[ | |
Hx = \left[\begin{matrix} | |
13\\0\\0 | |
\end{matrix}\right] | |
\] | |
\paragraph{Άσκηση} | |
Να παραγοντοποιηθεί/γραφεί σε μορφή \( QR \) ο πίνακας \( A = | |
\left[\begin{matrix} | |
1&5&6\\2&-4&-5\\2&3&17 | |
\end{matrix}\right] \). | |
\subparagraph{Λύση} | |
Στην πρώτη στήλη: | |
\begin{gather*} | |
a_1 = \left[\begin{matrix} | |
1\\2\\2 | |
\end{matrix}\right] \qquad k=1 \\ | |
s=\sqrt{1^2+2^2+2^2}=3 \\ | |
u_1 = \frac{1}{\sqrt{2s(s+|x_1|)}}\left[\begin{matrix} | |
x_1+s\\x_2\\x_3 | |
\end{matrix}\right] = \frac{1}{\sqrt{24}}\left[\begin{matrix} | |
4\\2\\2 | |
\end{matrix}\right] \\ | |
H_1 = I-2u_1u_1^{\mathrm T} \overset{\cdots}{=} | |
\frac{1}{3}\left[\begin{matrix} | |
-1&-2&-2\\-2&2&-1\\-2&-1&2 | |
\end{matrix}\right] = Q \\ | |
H_1A = \left[\begin{matrix} | |
-3&-1&-10\\0&-7&-13\\0&0&9 | |
\end{matrix}\right] = R | |
\end{gather*} | |
\paragraph{Άσκηση} | |
Να βρεθεί η παραγοντοποίηση QR του πίνακα \( A \): | |
\[ | |
A = \left[\begin{matrix} | |
+1&+2&3\\+2&9&2\\+2&2&1 | |
\end{matrix}\right] | |
\] | |
\subparagraph{Λύση} | |
\begin{itemize} | |
\item Για \( k=1 \) Householder: | |
\begin{gather*} | |
Q_1 = \left[\begin{matrix} | |
1\\2\\2 | |
\end{matrix}\right] \\ | |
H_1 = \frac{1}{3} \left[\begin{matrix} | |
-1&-2&-2\\-2&2&-1\\2&-1&2 | |
\end{matrix}\right] \\ | |
A_1 = H_1A = \left[\begin{matrix} | |
-3 & -8 & -3 \\ 0 &4 & -1 \\ 0 & -3 & -2 | |
\end{matrix}\right] | |
\end{gather*} | |
\item Για \( k=2 \) Householder: | |
\begin{gather*} | |
Q_2' = \left[\begin{matrix} | |
-8 \\ 4 \\ -3 | |
\end{matrix}\right] \quad s=\sqrt{x_2^2+x_3^2}= | |
\sqrt{4^2+(-3)^2}=5 | |
\end{gather*} | |
Προκύπτει: | |
\begin{gather*} | |
H_2 = I-2uu^{\mathrm T} = \left[\begin{matrix} | |
1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 | |
\end{matrix}\right] -2\frac{1}{\sqrt{10}} \left[\begin{matrix} | |
0\\3\\-1 | |
\end{matrix}\right]\frac{1}{\sqrt{10}}\left[\begin{matrix} | |
0&3&-1 | |
\end{matrix}\right] = \frac{1}{5}\left[\begin{matrix} | |
5&0&0\\0&-4&3\\0&3&4 | |
\end{matrix}\right] \\ | |
A_2 = H_2A_1 = \left[\begin{matrix} | |
-3&-8&-3\\0&-5&-\sfrac{2}{5} \\0&0&-\sfrac{11}{5} | |
\end{matrix}\right] \mathlarger{= R} \\ | |
Q = H_1H_2 = \frac{1}{15} \left[\begin{matrix} | |
-1&-2&-2\\-2&2&-1\\-2&-1&2 | |
\end{matrix}\right]\left[\begin{matrix} | |
5&0&0\\0&-4&3\\0&3&4 | |
\end{matrix}\right] = \frac{1}{15}\left[\begin{matrix} | |
-5&2&-14\\-10&-11&2\\-10&10&5 | |
\end{matrix}\right] | |
\end{gather*} | |
\end{itemize} | |
\paragraph{Άσκηση} | |
Να παραγοντοποιηθεί ο πίνακας: | |
\[ | |
A = \left[\begin{matrix} | |
1&1\\2&4\\2&-3 | |
\end{matrix}\right] | |
\] | |
\subparagraph{Λύση} | |
\[ | |
\underset{\substack{\downarrow\\\mathclap{\text{ορθογώνιος}}}}{Q} | |
\cdot | |
\overset{\substack{\mathclap{\text{άνω τριγωνικός}}\\\uparrow}}{R} | |
\xrightarrow{\hspace{20pt}} | |
\left[\begin{matrix} | |
n\times n \text{ άνω τριγωνικός } \\ \hline | |
\underset{\text{$m\times n$ γραμμές}}{0} | |
\end{matrix}\right] | |
\] | |
Στον πίνακα: \( \left[\begin{matrix} | |
1\\2\\2 | |
\end{matrix}\right] \) εφαρμόζω Householder για \( k=1 \). | |
\begin{gather*} | |
H_1 = \frac{1}{3} \left[\begin{matrix} | |
-1&-2&-2\\-2&2&-1\\-2&-1&2 | |
\end{matrix}\right] \\ | |
A_1 = H_1A = \left[\begin{matrix} | |
-3&-1\\0&3\\0&-4 | |
\end{matrix}\right] | |
\end{gather*} | |
Householder στον \( \left[\begin{matrix} | |
-1\\3\\4 | |
\end{matrix}\right] \) για \( k=2 \): | |
\begin{gather*} | |
s=\sqrt{3^2+4^2}=5 \\ | |
u_2 = \frac{1}{\sqrt{10\cdot 8}}\left[\begin{matrix} | |
0\\8\\=4 | |
\end{matrix}\right] = \frac{1}{\sqrt{5}}\left[\begin{matrix} | |
0\\2\\-1 | |
\end{matrix}\right] \\ | |
H_2 = I -2u_2u_2^{\mathrm T} = \left[\begin{matrix} | |
1&0&0\\0&1&0\\0&0&1 | |
\end{matrix}\right] - \frac{2}{5}\left[\begin{matrix} | |
0&0&0\\0&4&-2\\0&-2&1 | |
\end{matrix}\right] = \left[\begin{matrix} | |
1 & 0 & 0 \\ 0 & \frac{-3}{5} & \frac{4}{5} \\ | |
0 & \frac{4}{5} & \frac{3}{5} | |
\end{matrix}\right] \\ | |
H_2A_1 = \left[\begin{matrix} | |
-3 & -1 \\ 0 & -5 \\ \hline 0 & 0 | |
\end{matrix}\right] = R \\ | |
Q = H_1H_2 = \dots | |
\end{gather*} | |
\setcounter{section}{8} | |
\section{Επίλυση Γραμμικών Συστημάτων} | |
Η μέθοδος Cramer βρίσκει λύσεις στα γραμμικά συστήματα, αλλά λόγω του | |
υπολογισμού ορίζουσας είναι πολύ αργή. Γι' αυτό μπορούμε να | |
χρησιμοποιήσουμε την απαλοιφή Gauss και παραλλαγές της για να βρούμε | |
ακριβείς λύσεις στο σύστημα. | |
Για την επίλυση γραμμικών συστημάτων μπορούμε να χρησιμοποιήσουμε | |
\textbf{δύο είδη μεθόδων:} | |
\begin{itemize} | |
\item Ακριβείς Μεθόδους | |
\item Επαναληπτικές Μεθόδους | |
\end{itemize} | |
Γενικά οι μέθοδοι αυτές προσπαθούν να μας οδηγήσουν σε ένα ισοδύναμο | |
τριγωνικό σύστημα (\( A_1x=b_1 \sim A_2x=b_2 \)): | |
\begin{align*} | |
a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n &= b_1 \\ | |
a_{22}x_2 + \dots + a_{2n}x_n &= b_2 \\ | |
\ddots \qquad &=\ \vdots \\ | |
a_{nn}x_n &= b_n | |
\end{align*} | |
επειδή τότε η λύση μπορεί να βρεθεί ως εξής: | |
\begin{align*} | |
x_n &= \frac{b_n}{a_{nn}} \\ | |
x_{n-1} &= \frac{b_{n-1}-a_{n-1,\, n}\,x_n}{a_{n-1,\ n-1}} \\ | |
\vdots &=\ \vdots | |
\end{align*} | |
και αναδρομικά έχω: | |
\[ | |
x_k = \frac{b_k - \sum_{j=k+1}^{n} a_{kj}x_j}{a_{kk}} | |
\] με \( k=n,\ n-1,\ \dots,\ 1 \). | |
\subsection{Ακριβής επίλυση με παραγοντοποίηση QR} | |
Η λύση με παραγοντοποίηση QR δίνει ένα ακριβές αποτέλεσμα, αλλά είναι | |
\textit{ακριβή} σε χρόνο, επομένως χρησιμοποιείται αν έχουμε έτοιμη την | |
παραγοντοποίηση, οπότε: | |
\begin{align*} | |
Ax &= b \\ | |
QRx &= b \\ | |
\underset{\substack{\downarrow\\\mathclap{\text{άνω τριγωνικός}}}}{R} | |
x = Q^{\mathrm T} b | |
\end{align*} | |
\subsection{Ακριβής επίλυση με απαλοιφή Gauss} | |
\subsubsection{Στοιχειώδεις πράξεις} | |
\begin{itemize} | |
\item \textbf{Ανταλλαγή} δύο γραμμών \( R_i \) και \( R_j \). | |
Θα το συμβολίζουμε: | |
\[ | |
R_i := R_j \text{ ή } R_i \leftarrow R_j | |
\] | |
\item \textbf{Πολλαπλασιασμός} γραμμής \( R_i \) με μια σταθερά | |
\( a\in | |
\mathbb R \). | |
Θα το συμβολίζουμε: | |
\[ | |
R_i := aR_i \text{ ή } R_i \leftarrow aR_i | |
\] | |
\item \textbf{Πρόσθεση} σε μια γραμμή \( R_i \) το γινόμενο της | |
γραμμής | |
\( R_j \) με μια σταθερά \( a \in \mathbb R \). | |
Θα το συμβολίζουμε: | |
\[ | |
R_i := R_i + aR_j \text{ ή } R_i \leftarrow R_i + aR_j | |
\] | |
\subsubsection{Κλιμακωτή Μορφή} | |
\paragraph{Παράδειγμα} | |
Αν έχουμε το σύστημα: | |
\begin{align*} | |
x_1+2x_2-4x_3 &= -4 \\ | |
5x_1+11x_2-21x_3 &= -22 \\ | |
3x_1 - 2x_2 + 3x_3 &= 11 | |
\end{align*} | |
\subparagraph{Λύση} | |
Τοποθετώ τους συντελεστές σε έναν πίνακα ώστε να μην γράφω συνέχεια | |
τα ονόματα των μεταβλητών: | |
\[ | |
\left[\begin{array}{ccc|c} | |
1 & 2 & -4 & -4 \\ 5 & 11 & -21 & -22 \\ 3 & -2 & 3 & 11 | |
\end{array}\right] | |
\] | |
και προσπαθώ να τον φέρω σε \textbf{κλιμακωτή μορφή}, | |
εκτελώντας τις παραπάνω γραμμοπράξεις. | |
\begin{defn}{Κλιμακωτή μορφή ενός ΠΙΝΑΚΑ}{} | |
\begin{enumerate} | |
\item Το πρώτο μη μηδενικό στοιχείο κάθε μη μηδενικής γραμμής | |
να είναι 1. | |
\item Εάν η γραμμή \( k \) έχει μη μηδενικά στοιχεία, τα | |
αρχικά μηδενικά στοιχεία της γραμμής \( k+1 \) να είναι | |
περισσότερα από αυτά της γραμμής \( k \). | |
\item Αν υπάρχουν μηδενικές γραμμές, αυτές να βρίσκονται στο | |
τέλος του πίνακα. | |
\end{enumerate} | |
\tcblower | |
\paragraph{Παράδειγμα} | |
\[ | |
\left[\begin{matrix} | |
1 & & & & \\0 & 0 & 1 & & \\ | |
0 & 0 & 0 & 0 & 1 \\ | |
0 & 0 & 0 & 0 & 0 \\ | |
0 & 0 & 0 & 0 & 0 | |
\end{matrix}\right] | |
\] | |
\end{defn} | |
\[ | |
\left[\begin{array}{c|c} | |
A & b\end{array} | |
\right] | |
\xrightarrow{\text{Απαλοιφή Gauss}} \left[\begin{array}{c|c} | |
\bar A & \bar b | |
\end{array} | |
\right] | |
\] | |
\begin{defn}{Πρωτεύουσες \& Δευτερεύουσες Μεταβλητές}{} | |
\[ | |
\left[\begin{array}{ccccccc|c} | |
\boxed{1}&x&x&x&\hdots &x&x&x \\ | |
0 & 0 & \boxed{1} & x & \hdots & x & x & x \\ | |
0 & 0 & 0 & \boxed{1} & \hdots & x & x & x \\ | |
0 & 0 & 0 & 0 & \hdots & 0 & \boxed{1} & x | |
\end{array}\right] | |
\] | |
\tcblower | |
Στον παραπάνω κλιμακωτό πίνακα, οι στήλες αναπαριστούν τους | |
συντελεστές της κάθε μεταβλητής, ενώ οι γραμμές την κάθε | |
εξίσωση. | |
\end{defn} | |
\begin{defn}{Ανηγμένη Κλιμακωτή μορφή πίνακα}{} | |
\begin{enumerate} | |
\item Είναι κλιμακωτή μορφή | |
\item Το πρώτο μη μηδενικό στοιχείο κάθε γραμμής είναι και το | |
μοναδικό μη μηδενικό στοιχείο στη στήλη | |
\end{enumerate} | |
\end{defn} | |
\paragraph{Παράδειγμα} | |
\begin{align*} | |
\left[\begin{array}{ccccc|c} | |
1&1&1&1&1&2\\0&0&0&1&1&1\\0&0&0&0&1&-1 | |
\end{array}\right] &\xrightarrow[R_1:=R_1-R_3]{R_2:=R_2-R_3} | |