Deeder.fr

Tribulations d'un geek...

Aller au contenu | Aller au menu | Aller à la recherche

2 septembre 2014

Prouvons le paradoxe de Monty Hall

Il y a très exactement 5 ans, sur ce blog, je vous parlais du paradoxe de Monty Hall que je vous prouvais avec les mains. Comme tout paradoxe mathématique, il parait au premier abord quelque peu contrintuitif jusqu'à ce qu'on se penche vraiment sur le problème. Je vous propose de revenir sur ce problème et de le prouver de deux façons : une approche pratique à l'aide d'une simulation informatique pour vérifier ou infirmer notre intuition, et une approche mathématique un peu plus formelle à l'aide du théorème de Bayes.

Chèvre

L'énoncé

Le problème énoncé pour la première fois en 1975 est le suivant : un jeu télévisé met en scène 3 portes. Derrière deux d'entre elles se cachent une chèvre et derrière la troisième se cache une voiture, réparties au hasard. Le candidat (sauf s'il s'agit d'un véritable ami des bêtes) va donc tenter de deviner derrière quelle porte se cache la voiture pour tenter de la gagner. Le présentateur sait ce qui se trouve derrière chacune des portes et le jeu se déroule en plusieurs temps :

  • Le joueur choisit tout d'abord une porte au hasard
  • Sur les deux portes restantes, le présentateur en dévoile une derrière laquelle se trouve une des chèvres
  • Puis on demande alors au candidat s'il souhaite conserver son choix ou changer pour sélectionner l'autre porte

La question est alors la suivante : le joueur a-t-il intérêt à changer de porte ?

La première idée qui vient à l'esprit est que le choix est équiprobable et que, peu importe son choix, le joueur a 50% de chances de gagner. Mais est-ce aussi simple que ça ?

Simulation

Pour vérifier notre intuition, créons une simulation simple à l'aide d'un petit script simple en python. Ce script assez simple se déroule en 4 étapes principales :

  • On simule le placement de la voiture grace à \(repartirVoiture()\). Le choix est fait au hasard entre les 3 portes, avec une probabilité identique pour toutes les portes.
  • On simule le choix du candidat avec \(simulerChoixCandidat()\). Là, on peut faire un peu ce qu'on veut : rendre le choix aléatoire, choisir toujours la même porte ou s'en remettre aux astres si vous le voulez, ça ne changera pas le résultat.
  • On simule l'ouverture d'une porte derrière laquelle se trouve une chèvre avec \(ouvrirPorte()\). On considère que le présentateur sait ce qui se cache derrière chacune des portes, il ouvre donc la première porte derrière laquelle se trouve une chèvre. Mais on pourrait très bien choisir une des deux portes restantes aléatoirement également si on le voulait.
  • On simule le changement d'avis du candidat par \(changerChoix()\) le cas échéant

Ensuite, on compare tout simplement les résultats pour un grand nombre de candidats entre le choix initial et le changement de choix et on regarde les résultats. Voici donc les détails du code de la simulation :

import numpy as np

def repartirVoiture(n):
    '''Repartition aleatoire des voitures pour n emissions'''
    voitures = np.random.randint(0, 3, n)
    return voitures

def simulerChoixCandidat(n, mode='random'):
    '''Simulation des choix des candidats pour n emissions (soit aleatoire, soit toujours le meme)'''
    if mode is not 'random':
        choix = np.array([1]*n)
    else:
        choix = np.random.randint(0, 3, n)
    return choix

def ouvrirPorte(prix, choix):
    '''Ouverture d'une porte par le presentateur en fonction de la position de la voiture et du choix du candidat'''
    portesOuvertes = np.zeros(choix.shape)
    for i, x in enumerate(prix):
        for k in [0, 1, 2]:
            if k != x and k != choix[i]:
                portesOuvertes[i] = k
    return portesOuvertes

def changerChoix(choix, portesOuvertes):
    '''Le candidat decide de changer de choix apres l'ouverture de la porte par le presentateur'''
    secondChoix = np.zeros(choix.shape)
    for i, x in enumerate(portesOuvertes):
        for k in [0, 1, 2]:
            if k != x and k != choix[i]:
                secondChoix[i] = k
    return secondChoix

def afficherResultats(choixFinal, prix):
    '''Afficher les taux de gain en pourcentages'''
    mask = choixFinal == prix
    pc = mask.sum() / float(len(mask)) * 100
    return pc

n = 10000
choix          = simulerChoixCandidat(n)
prix           = repartirVoiture(n)
portesOuvertes = ouvrirPorte(prix, choix)
secondChoix    = changerChoix(choix, portesOuvertes)
print 'Reussite sans changement : %0.2f%%' % afficherResultats(choix, prix)
print 'Reussite avec changement : %0.2f%%' % afficherResultats(secondChoix, prix)

Quand on lance le script, il nous retourne les résultats suivants:

Reussite sans changement : 32.90%
Reussite avec changement : 67.10%

Contrairement à nos premières intuitions, il semblerait que les candidats qui choisissent de changer de porte soient plus chanceux que les autres : 67% de gagnants contre 33% pour ceux qui campent sur leurs positions ! Je vous l'accorde, c'est un peu contre-intuitif, mais ça n'est pas complètement aberrant. Essayons de comprendre pourquoi avec quelques équations...

Mise en équations

En fait, généralement, on part du principe que la voiture a autant de chance de se trouver derrière n'importe quelle porte puisqu'elle est répartie de façon aléatoire. Du coup, si l'on note \(P(V_i)\) la probabilité que la voiture se trouve derrière la porte \(i\), on a \(P(V_1) = P(V_2) = P(V_3) = \frac{1}{3}\). Jusque là, le raisonnement est vrai, du moins au début, pour le premier choix !

Cependant, on néglige un point particulièrement important : la suite des évènements nous apporte des informations supplémentaires sur le jeu. En effet, le présentateur, qui sait ce qui se trouve derrière les portes, ouvre délibérément une des deux portes restantes. Du coup, il nous apporte une information supplémentaire sur la porte qu'il n'a pas ouverte : s'il ne l'a pas ouverte, c'est qu'il y a plus de chances que la voiture se cache derrière. Par contre, il n'apporte aucune information sur la première porte choisie puisque de toute façon il ne peut pas l'ouvrir.

Du coup, admettons que nous ayons choisi la porte 1 et que le présentateur ouvre la porte 2. Alors \(P(V_1) = \frac{1}{3}\) reste inchangée par rapport au choix initial. La porte 2 est ouverte par le présentateur, du coup \(P(V_2) = 0\). Et enfin \(P(V_3) = 1 - P(V_2) - P(V_3) = \frac{2}{3}\) augmente du même coup.

Essayons de valider notre nouveau raisonnement mathématiquement à l'aide du théorème de Bayes. Pour rappel, son énoncé est le suivant :

Soit \(P(A|B)\), la probabilité de A sachant B et \(P(A)\) la probabilité de A. Alors,

\[P(A|B) = \frac{P(B|A)P(A)}{P(B)}\]

Utilisons d'appliquer ce théorème de Bayes à la résolution de notre petit problème. Comme tout à l'heure, au hasard, choisissons la porte 1. Puis, considérons que le présentateur, lui, nous montre une chèvre derrière la porte 2. Soit \(V_1\) l'évènement "la voiture se trouve derrière la porte 1" et \(C_2\) "le présentateur montre la chèvre derrière la porte 2". Alors, en utilisant la formule ci-dessus, on peut calculer \(P(V_1|C_2)\) la probabilité que la voiture soit derrière la porte 1 sachant que le présentateur ouvre la porte 2 :

\[P(V_1|C_2) = \frac{P(C_2|V_1)P(V_1)}{P(C_2)}\]

A ce point, il y a plusieurs subtilités :

  • Le présentateur, sachant que la voiture est derrière la porte 1 choisie par le candidat, peut ouvrir indifféremment la porte 2 ou la porte 3. On a donc \(P(C_2|V_1) = P(C_3|V_1) = \frac{1}{2}\)
  • \(P(V_1) = \frac{1}{3}\) car à la base, la voiture est répartie de manière équiprobable derrière l'une des 3 portes.
  • Le plus compliqué reste de calculer le dernier terme, ce que je vais tâcher de vous expliquer juste après.

Une astuce consiste à se rappeler que l'on peut décomposer le dénominateur comme suit : \(P(C_2) = P(C_2|V_1)P(V_1) + P(C_2|V_2)P(V_2) + P(C_2|V_3)P(V_3)\). En effet, la probabilité \(P(C_2)\) est la somme de chacune des probabilités conditionnelles multipliée par la probabilité de cette condition.

Or, \(P(V_1) = P(V_2) = P(V_3) = \frac{1}{3}\) car la voiture est encore une fois positionnée au hasard selon une loi uniforme.

Enfin, nous avons déjà déterminé que \(P(C_2|V_1) = \frac{1}{2}\). De même \(P(C_2|V_2) = 0\) car le présentateur ne va pas ouvrir la porte si la voiture se trouve derrière ! \(P(C_2|V_3) = 1\) car si le candidat choisit la première porte et que la voiture est derrière la troisième, le présentateur n'a d'autre choix que d'ouvrir la porte du milieu.

Du coup, on obtient :

\[P(V_1|C_2) = \frac{\frac{1}{2} \times \frac{1}{3}}{\frac{1}{2} \times \frac{1}{3} + 0 \times \frac{1}{3} + 1 \times \frac{1}{3}} = \frac{1}{3}\]

On a donc 33% de chance de gagner en campant sur nos positions originelles. On peut faire un calcul analogue pour \(P(V_3|C_2)\) et sans surprise on obtient :

\[P(V_3|C_2) = \frac{P(C_2|V_3)P(V_3)}{P(C_2)} = \frac{1 \times \frac{1}{3}}{\frac{1}{2} \times \frac{1}{3} + 0 \times \frac{1}{3} + 1 \times \frac{1}{3}} = \frac{2}{3}\]

Et tout ça colle bien avec notre simulation ! On retombe donc sur nos pieds.

Conclusion

On vient donc de voir comment une simple information donnée par le présentateur change totalement la donne et permet d'établir une stratégie gagnante. Attention, ça ne veut pas dire qu'en adoptant la stratégie adaptée vous gagnerez, mais vous maximisez vos chances de gagner. Et ces probabilités de gain peuvent se calculer relativement facilement à l'aide du théorème de Bayes qui est finalement un outil assez simple tant qu'on comprend les probabilités que l'on manipule et que l'on calcule. Alors à vos équations... Prêts ? Partez !

4 février 2014

Revues scientifiques et universités : la guerre est déclarée...

Un article de Rue89 a attiré mon attention sur un sujet dont j'ignorais jusqu'à présent l'existence : la guerre entre universités et revues scientifiques. Alors que ces dernières profitent du fait de prendre pleinement part au processus d'évaluation et de classement des universités pour augmenter continuellement (et de manière parfois abusive) leurs tarifs, les établissements universitaires du monde entier voient sans cesse leur budget être révisé à la baisse. Cela conduit à des situations ubuesques.

research.jpg

C'est ainsi que l'université Pierre et Marie Curie (UPMC) ou encore l'université Paris-V décident d'arrêter leur abonnement à certaines de ces revues. Mais les contentieux ne se cantonnent pas à nos frontières puisque le syndrome semble être le même en Belgique ou encore à l'université de Montréal.

On peut alors se demander comment vont évoluer les conditions de travail des chercheurs qui ont besoin de ces revues afin d'effectuer une veille permanente sur leurs domaines d'activité respectifs, de se comparer à leurs pairs et même de s'en inspirer afin de dépasser leurs performances. La solution réside peut-être dans une refonte du système d'évaluation de la recherche dans son intégralité, mais ce processus sera sans doute long et fastidieux.

Certaines initiatives telles Google Scholar vont déjà dans ce sens, mais cela sera-t-il suffisant ? A l'heure de l'internet et de la libre circulation des idées et des savoirs, il serait probablement temps d'entreprendre ce chantier, mais cela ne se fera probablement pas sans casse lors de la période transitoire qui mènera à cette nouvelle organisation...

Source : Dans les universités, désabonnements en masse aux revues scientifiques

28 juillet 2011

Les dauphins, ces mammifères pas comme les autres

Douglas Adams l’avait souligné il y a déjà plus d’une trentaine d’année[1], les dauphins sont sans conteste l’espèce la plus intelligente de l’univers. On les savait déjà capable de se repérer grâce aux ultrasons, mais il semblerait en fait que les dauphins nous cachent bien des choses et possèdent des dons bien utiles, tel l’électro-sensitivité et le pouvoir de guérir régénérer certaines parties de leur corps.

Dauphin

En effet, une récente étude de la Royal Society montre la présence chez les dauphins de petits poils, disposés dans des pores présents sur la partie supérieure de leur "nez" et sensibles au champ électrique environnant. Ce dispositif, bien que déjà connu chez certains amphibiens, est unique chez un mammifère. Les dauphins obtiennent ainsi la capacité de capter des très faibles champs électriques, de l’ordre de 4,6 microvolts par cm², leur permettant ainsi de localiser des proies enfouies sous le sable.

Une autre de leurs particularités, encore plus intéressante que la précédente, est leur faculté de régénération. Si un dauphin se fait attaquer par un requin, il semblerait que celui-ci puisse guérir ses blessures sans douleur et en régénérant ses tissus sans aucune déformation. Ils fabriquent des cellules souches qui permettent de remplacer le tissus à l’endroit de la morsure. De plus, sa graisse comportant des composants agissant comme des antibiotiques naturels, le dauphin blessé ne subira aucune hémorragie ni ne sera victime d’une infection d’aucune sorte.

Ces nouvelles découvertes ont de quoi réjouir les scientifiques, puisque la compréhension de tels phénomènes biologiques sont d’autant de pistes pour développer de nouveaux médicaments et de nouveaux traitements à assimiler aux personnes blessées. Décidément, les dauphins ont encore beaucoup à nous apprendre… ;-)

Source : Popsci

Notes

[1] Sa théorie est développée dans le quatrième tome de la trilogie en 5 volumes H2G2 intitulé Salut, et merci bien pour le poisson

22 juin 2011

La révolution photographique est en marche...

Depuis 1839, la photographie fait son bout de chemin, du daguerréotype au numérique, de la photo en noir et blanc à la photo en couleurs, elle permet chaque fois de figer un instant. Malgré les évolutions technologiques, le procédé est toujours resté plus ou moins le même en projetant l’image d’un monde en 3 dimensions sur un support en 2D. Mais contre toute attente, la nature de la photographie est peut être sur le point de changer…

En effet, un concept vieux de quelques centaines d’années et remis au goût du jour vient désormais changer la donne : le concept de champ lumineux ("light field" en anglais). Ce champ permet, en grossissant les traits, de définir la dynamique de la lumière sur une scène donnée, c’est à dire comment cette dernière se propage (absorptions, réflexions, etc). Les images ainsi capturées ne se contentent plus de caractériser un unique plan, mais les données enrichies qu’elles contiennent permettent d’effectuer des manipulations un peu plus complexes.

Plus besoin de faire le focus en prenant une photo ! Il suffit d’appuyer sur le déclencheur et le champ lumineux est instantanément capturé. L’analyse et le traitement de ce champ permettant de restituer la photo finale permet ensuite de régler le focus a posteriori comme on le désire… Terminés également les problèmes d’exposition, les difficultés de capture liées aux basses luminosités, etc. Il est même possible, et c’est d’ailleurs ça le plus bluffant, de modifier la perspective ou encore d’effectuer des légères modifications 3D de la scène ! Bref, vos photos ne seront plus jamais ratées (à part si vous cadrez comme un pied, mais là, la science ne peut plus rien pour vous… ;) )…

La miniaturisation de cette nouvelle génération de capteurs permet désormais d’envisager des applications grand public de cette technologie. C’est ainsi que l’un des doctorants de l’université de Standford a eu l’idée de créer Lytro, la première société à commercialiser d’ici peu des appareils photo d’un nouveau genre. La société a déjà levé 50 millions de dollars lors de son premier tour de table, ce qui prouve que de nombreux espoirs se fondent sur cette technologie

Il est à parier que les premiers modèles de ce genre d’appareils se vendront à prix d’or, mais si la mayonnaise prend, il est possible de voir émerger dans les prochaines années une nouvelle tendance technologique qui pourrait bel et bien révolutionner la photographie. Soyons rassurés, ce n’est pas encore demain la veille que les clichés de Mme Michu seront élevés au rang de ceux de Willy Ronis. Cependant, c’est une affaire à suivre, et de très près…

Pour en savoir plus :

12 février 2010

Et sinon, c'est quoi un trou noir au juste ?

La question est récurrente et la réponse parfois difficile à comprendre pour le commun des mortels : mais bon sang, qu’est-ce donc que ces fameux trous noirs dont on parle sans pour autant savoir les définir ? Je vous propose une petite vidéo de vulgarisation qui assouvira, je l’espère, en partie votre curiosité.


Qu’est-ce qu’un trou noir ?

Via Pierre Thomas

- page 1 de 6