1. Les singes savants

Nous voici en 2642, alors qu’un débat enflammé agite le 23 quai de Conti dans le 6ème arrondissement de Paris.

Les jeunes auteurs d’aujourd’hui n’ont plus aucune originalité lance Jean comme pour exprimer ce que tous dans la pièce pensent.

C’est comme si nous avions épuisé tous les sujets, ils ne trouvent plus rien pour nous surprendre acquiesce Simone. Je suis pourtant convaincue qu’un texte complètement novateur est possible et ne demande qu’à être écrit.

Nos académiciens éternels font aujourd’hui un bien triste constat {:} les écrivains contemporains manquent cruellement d’inspiration. Le sage Henri qui venait d’intégrer ce cercle très fermé lance alors {:}

Eh bien, puisque nous sommes immortels Simone, tu n’as qu’à taper complètement au hasard sur ton dactylographe jusqu’à ce que ce que tu aies écrit soit ce texte révolutionnaire auquel tu penses !

L’audience reste alors pantoise. En effet, Simone a beau être une immortelle, comment espérer qu’elle arrive à ce texte idéal un jour, malgré l’éternité qui l’attend ?

Henri a en fait mis le doigt sur un vieux paradoxe de la théorie des probabilités que l’on appelle communement le paradoxe du singe savant.

Singe savant

2. Solution dynamique

Celui-ci peut en fait s’expliquer par un argument de dynamique, comme le pensait sans doute Henri en proposant cette idée. Formalisons un peu.

Notons {m} le texte idéal de Simone composé de {n} caractères choisis dans un alphabet à {a} symboles. Et {{(u_i )}_{i\geq0}} la suite de caractères tapés par Simone.

Ce qu’affirme Henri, c’est que {m} se trouvera dans la suite {u}. Donc que {m} coïncidera avec les {n} premières lettres d’une des suites {(u_i)_{i \geq N}} pour un {N} quelconque – la suite tapée par Simone à partir d’un certain temps N. Autrement dit, si l’on note {\sigma} la transformation de décalage qui à {(u_i)_{i \geq 0 }} associe {(u_i)_{i \geq 1}} cela signifie que les {n} premiers caractères d’un {\sigma^N u} coïncident avec {m}.

Cette application vérifie en fait une propriété très intéressante pour l’étude dynamique, elle est ergodique par rapport à la mesure de probabilité considérée ici. Cela signifie entre autre que si l’on regarde la moyenne d’une fonction sur des itérés de {\sigma} en {x}, la valeur de cette moyenne tendra presque sûrement (avec probabilité 1) vers l’intégrale de la fonction. Traduit de manière formelle, \frac 1 n \sum_{i=0}^n \mathbf{f}( \sigma^i u) \rightarrow \int \mathbf{f} (u) \mathrm{d}Pu.

De manière intuitive, les images itérées par {\sigma} sont réparties de manière parfaitement homogène dans l’espace des suites de lettres {{(u_i )}_{i\geq0}}.

Ainsi, si l’on applique cette propriété à la fonction

\displaystyle \mathbf{1}(u) = \left\{ \begin{array}{ll} 1 & \text{si } u_0 \dots u_{n-1} = m \\ 0 & \text{sinon} \end{array} \right.

Alors formellement on a, pour presque tout {u}

\displaystyle \frac 1 n \sum_{i=0}^n \mathbf{1}( \sigma^i u) \rightarrow \int \mathbf{1} (u) \mathrm{d}Pu = P( u_0 \dots u_{n-1} = m)

Cela signifie que la fréquence d’apparition du texte dans la suite est égale à la probabilité qu’il apparaisse dès les premières n lettres tapées. Or cette probabilité vaut {\frac 1 {a^n}} qui est certes très petite mais encore non nulle. Ainsi, le texte apparaîtra dans la suite non seulement une mais une infinité de fois avec cette fréquence !

 

3. La loi forte des grands nombres par un argument de dynamique

On peut remarquer que ce résultat, induit par le théorème de Birkhoff, ressemble de près à la loi des grands nombres qui dit que la moyenne de variables aléatoires indépendantes (bien qu’ici nos {u} décalés ne le soient pas), de même loi, tend presque sûrement vers l’espérance pour cette loi. On peut donc se demander quel est le lien entre ces deux théorèmes. En fait le théorème de Birkhoff est plus fort, et la loi des grands nombres en est un corollaire.

En effet, soient {(X_n)_{n\geq0}} une suite de variables aléatoires indépendantes de même loi. Si l’on note {P^ 0} la projection des suites sur leur première coordonnée, on a {X_n = P^0 (\sigma^n X)}. Comme les {X_n} sont supposées indépendantes et identiquement distribuées, si l’on note {\nu_0} la loi de {X_0}, la loi de {X} est la loi produit {\nu^\mathbb{N}} pour laquelle {\sigma} est encore ergodique. Alors par le théorème de Birkhoff, on a presque sûrement

\displaystyle \frac{1}{n} \sum_{i=0}^n X_i \rightarrow \int P^0 X \mathrm{d}\nu = \int X_0 \mathrm d \nu_0 = E \left[ X_0 \right]

Publicités