1. Introduction et bibliographie 3-a : Relation de récurrence 3-b : Formule de Christoffel-Darboux 3-c : Noyau 5. Les zéros des polynômes orthogonaux (1) 6. Approximation 6-a : Théorème fondamental 6-b : Formule de quadrature de Gauss 6-c : Nombres de Christoffel 6-d : Evaluation de l’erreur 6-e : Formule d’interpolation d’Hermite 7. Les zéros des polynômes orthogonaux (2) |
10. Un exemple : le produit hermitien et les inégalités de Heisenberg 10-a : Produit scalaire hermitien 10-b : Inégalités de Heisenberg 11-a : Aperçu de la question 11-b : La méthode de Fredholm 12. Noyaux de Fourier 12-a : Transformée de Mellin 12-b : Exemples de noyaux de Fourier 12-c : Formules d’inversion non symétriques 13. Convolution |
Nous avons vu dans le livre une approche du théorème à partir des pôlynômes de Bernstein sous une forme probabiliste. Améliorons ceci en faisant la démonstration…
Prenons donc lesdits polynômes
avec x dans [0, 1] (on peut toujours se ramener à l’intervalle [a, b] moyennant une transformation affine : et réciproquement). Il nous faut donc montrer que ces polynômes convergent simplement vers la fonction f (continue), soit que pour tout , il existe N tel que pour tout n supérieur à N, .
Prenons tout d’abord f=1 :
(développement du binôme) et tout va bien. Un peu plus loin avec f(x)=x :
.
Plus complexe avec :
, bof…
Dérivons par rapport à x puis multiplions par x/n : on a
,
redérivons cette relation et remultiplions par x/n, on a alors :
.
Remplaçons y par 1 – x : ; par conséquent
(la fonction x(1–x) est inférieure à 1/4 sur [0, 1]).
Passons au cas général : f est uniformément continue, donc bornée ; il existe donc M tel que , par conséquent ; par ailleurs pour tout , il existe tel que si alors . Prenons un ; pour notre polynôme Bn, il existe des points k/n pour lesquels les valeurs de Bn sont à une distance inférieure à de f et d’autres pour lesquels cette distance est supérieure, nous pouvons donc écrire
La première somme se majore facilement par ; pour la deuxième, nous avons
d’où en développant le terme carré :
.
En choisissant , on obtient . Cette démonstration est constructive puisqu’on sait à peu près quel polynôme de Bernstein on devra utiliser pour approcher f. Par contre, comme on le voit ci-dessous la vitesse de convergence est particulièrement lente.
fig. 1 : Approximation de cosx par les polynômes de Bernstein, n = 180
fig. 2 : écart entre cos x et Bn
Les polynômes étant de degré n, ils ont n zéros complexes ou réels (aux ordres de multiplicité près), mais nous allons montrer que ces zéros sont tous réels, simples et dans [a, b] !
Supposons que nous ayons k < n zéros réels pour , alors le polynôme
sera tel que .
Le produit ne contiendra que des termes au carré multipliés par une expression de signe constant ; supposons que ce produit est positif, nous aurons alors
;
il y a donc une contradiction qui ne peut être levée qu’en prenant k = n. Il y a donc n zéros simples dans [a, b].
Un autre résultat intéressant est que en et en+1 ne s’annulent pas simultanément et que les zéros de en+1 séparent ceux de en : reprenons la relation de récurrence du 3-a : soient xm et xm+1 deux zéros successifs de en, on a
donc
,
.
Comme on a deux zéros consécutifs, et sont de signes opposés ; il en est alors de même pour et , donc doit s’annuler au moins une fois entre les deux zéros.
De la même manière en doit s’annuler entre deux zéros de en+1.
Montrons que ces zéros ne sont pas identiques : si c’était le cas on aurait également et ainsi de suite en descendant les valeurs de n ; mais comme e0 > 0 c’est impossible.
Nous verrons d’autres propriétés de ces zéros ultérieurement.
Le théorème fondamental de l’approximation des fonctions est le suivant :
Parmi tous les polynômes de degré n, il en existe un rendant minimum la distance
pour la norme du p.s. défini précédemment.
Le polynôme en question est donné par avec .
Cette approximation n’a de sens que pour la fonction poids w et sur l’intervalle [a, b].
Prenons qn un polynôme quelconque et pn celui du théorème ; nous avons et nous posons : pour ,
Par conséquent ; de plus
et la plus petite valeur de cette norme est , minimum atteint lorsque pour tout x. Comme g est orthogonal avec tous les ej, on peut appliquer ce qu’on a dit sur les zéros en considérant g comme en, donc g s’annule n fois et change de signe n+1 fois (ou bien g est nul).
Nous avons parlé brièvement dans le livre de la formule d’interpolation de Lagrange qui permet d’obtenir un polynôme passant exactement par n points donnés de f. Précisons ce point :
prenons la suite de points xj, j=1...n, zéros du polynôme orthogonal en, d’images f(xj) par f continue et considérons : F est un polynôme de degré n–1 et en plus ; si f est un polynôme de degré n–1, alors f = F.
Prenons f un polynôme de degré 2n–1, F(x) – f(x) est également de degré 2n–1 et s’annule pour les xj, la fonction est alors un polynôme de degré n–1 et nous pouvons écrire , soit
(1) .
Intégrons cette relation, histoire de faire réapparaître nos p.s. :
,
posons et remarquons que (la remarque sur le degré de r sert ici) ; les nombres sont appelés les nombres de Christoffel, sont indépendants de f et donnent la formule de quadrature de Gauss :
.
On pourrait se dire que sachant à priori calculer l’intégrale d’un polynôme sans trop de mal la formule précédente ne sert pas à grand chose, mais heureusement elle reste à peu près valable même si f n’est pas un polynôme.
Par exemple avec n = 2 et le poids w(x)=1 nous avons , d’où sur [–1 ; 1] les nombres de Christoffel ; calculons par exemple
,
proche du ln2 obtenu par calcul direct.
On trouve d’autres définitions des nombres de Christoffel n’utilisant pas d’intégrale : reprenons le noyau hilbertien et appliquons le à un zéro de en :
(2)
d’où
et en remplaçant dans la définition des nombres de Christoffel :
(la dernière intégrale vaut 1).
De même si on fait tendre x vers xk dans (2) on a d’où
.
Si nous appliquons la formule de quadrature de Gauss à la fonction nous obtenons
(tous les termes dans le carré sont nuls).
Dans tout ce qui précède nous n’avons utilisé que la continuité et la dérivée première des ej, mais ces derniers sont davantage dérivables, aussi peut-on voir si on n’obtiendrait pas une évaluation de l’erreur commise (en remplaçant f par pn) à l’aide des dérivées d’ordre supérieur, un peu à la manière de Taylor. Reprenons (1) et considérons
;
la fonction g a au moins les mêmes zéros que en et pour une valeur X fixée, nous pouvons trouver une constante K telle que s’annule en X : convient d’ailleurs très bien. Dérivons n fois cette relation : , mais comme s’annule au moins n+1 fois, sa dérivée n-ième doit s’annuler au moins une fois, pour une valeur u par exemple : ; on a donc (la fonction est un polynôme de degré n–1 et sa dérivée n-ième est nulle).
Finalement nous avons
,
soit la formule de Lagrange avec reste (le x de la formule correspond en fait au X précédent, ce qui donne la formule).
Dans la formule précédente on obtient un polynôme qui suit les points de f, mais on ne s’est pas occupé de la forme du polynôme : il serait (très) intéressant d’obtenir en plus des tangentes identiques pour f et pour le polynôme… grosso-modo dans la formule de Lagrange on remplace la fonction f par des segments de droite puisqu’on utilise la dérivée première des en ; pour obtenir des courbes nous allons utiliser des arcs de parabole et donc utiliser les dérivées secondes.
Nous cherchons donc un polynôme de degré 2n–1 (on va réutiliser Gauss) tel que ses valeurs et celles de sa dérivée coïncident avec celles de f en x1, x2, …, xn (le lecteur peut penser aux B-splines pour lesquelles on trace des arcs de courbe successifs avec une fonction de degré 3 = 2.2–1).
Il faut ici que nous arrivions à écrire f sous la forme
;
supposons que nous ayons trouvé nos fonctions et , posons
,
on doit alors avoir et ainsi que et ; comme Rn est lié aux en, il faut faire intervenir le carré des en afin d’assurer la nullité, aussi écrivons ; le même raisonnement que précédemment donne la valeur de K : et .
Pour les fonctions et nous devons avoir
et qu’ils s’annulent pour tous les autres zéros ; il faut également que ce soient des polynômes donc nous devons retrouver dans chacun le terme .
Posons , comme nous devons avoir ; dérivons :
d’où
;
calculons la dérivée de :
qui ne s’annule évidemment pas en xj, donc en multipliant par nous obtenons
.
Le même type de raisonnement permet d’obtenir . Nous avons finalement obtenu la forme cherchée, nous calculons alors :
puisque le terme de gauche du p.s. est de degré n–1. De même nous obtenons
Finalement nous récupérons la formule de Gauss avec un reste d’évaluation de l’erreur commise :
.
En reprenant la démonstration du § 5 avec n+m au lieu de n+1, on montre de la même manière que s’annule au moins une fois entre deux zéros de en. Par contre on dispose de quelques résultats sur la distribution des zéros : considérons la fonction f définie par
Grâce au théorème de Weierstrass nous savons qu’il existe un polynôme p tel que
pour x dans ]a, b[ ; pour e suffisamment petit f est positive et ainsi que (alors que p est négatif par construction en dehors de [a, b]) ; prenons maintenant en avec n assez grand, tel que degré(p) 2n – 1 et que en ne s’annule pas dans [a, b].
La formule de quadrature de Gauss donne alors
qui est strictement positif, mais si tous les xj sont en dehors de [a, b], les p(xj) sont négatifs et comme les nombres de Christoffel sont positifs, la somme précédente doit être négative. On a donc une contradiction et en s’annule au moins une fois dans [a, b], ce que nous traduisons en disant que en s’annule au moins une fois dans tout intervalle inclus dans [a, b] pour n suffisamment grand.
Théorème de séparation : prenons maintenant la suite strictement croissante avec u0 = a et un= b telle que uk soit l’unique valeur pour laquelle ; alors les zéros de en s’insèrent exactement entre les termes de la suite :
a = u0 < x1 < u1 < x2 <… < un–1 < xn < un = b.
Prenons un polynôme q(x) de degré 2n – 2 défini par les 2n – 1 conditions suivantes :
Comme il y a 2n–1 conditions, notre polynôme q
est défini de manière unique et est de degré
2n–2, sa dérivée est de degré 2n–3 et s’annule pour tous les xj
sauf un donc n–1 fois ; de plus entre deux xj
avec j inférieur à k elle doit s’annuler au moins une fois (q
passe de 1 à 1, q’ s’annule donc au moins k–1 fois), enfin quand q
est nul sa dérivée est nulle (elle s’annule au moins n–k–1
fois) ; conclusion q’ s’annule au moins n–1+n–2 fois,
soit 2n–3 fois.
Mais comme q’ est de degré 2n–3, elle s’annule exactement 2n–3 fois.
Supposons maintenant que pour , comme , q est croissante donc .
|
Comme , pour qu’il n’y ait pas d’incohérence dans le comportement de q, q’ devrait s’annuler entre xk et xk+1 mais comme on a compté tous les zéros de q’ c’est impossible.
Conclusion, q(x)>1 pour .
On obtient donc que et que
;
finalement
.
De la même manière en utilisant le polynôme défini par
nous obtiendrons que .