« Il en est qui naissent grands, d'autres qui conquièrent les grandeurs, et d'autres à qui elles s'imposent ». a dit William Shakespeare. Vraiment ? Certains se demandent si Shakespeare a bien écrit les œuvres qui portent son nom ou même s'il a réellement existé. Ils pensent que Shakespeare était le pseudonyme d'un autre écrivain, ou d'un groupe d'écrivains. Parmi les candidats au titre de véritable Shakespeare, on trouve d'autres grands dramaturges, des hommes politiques et même quelques femmes célèbres. Serait-il possible que le plus grand des écrivains de la langue anglaise soit aussi fictif que ses pièces ? La plupart des spécialistes de Shakespeare rejettent ces théories en se basant sur des faits historiques et bibliographiques. Mais il existe un autre moyen pour vérifier si les célèbres vers de Shakespeare ont en fait été écrits par quelqu'un d'autre. L'étude du language, la linguistique, en dit long sur la manière dont nous écrivons et dont nous parlons par l'analyse de la syntaxe, de la grammaire, de la sémantique et du vocabulaire. Et à la fin du 18ème siècle, le philosophe polonais Wincenty Lutosławski, créa une méthode appelée la stylométrie, qu'il appliqua pour résoudre les problèmes de paternité d'oeuvres littéraires. Alors comment ça marche ? On part du principe que le style de chaque auteur a certaines caractéristiques qui demeurent passablement constantes dans l’œuvre d'un seul et même auteur. Parmi ces caractéristiques, on trouve la longueur moyenne des phrases, l'ordre des mots, et même le nombre d'occurrences d'un mot en particulier. Regardons l'utilisation du mot "thee" et prenons-le comme axe. Chacune des œuvres de Shakespeare peut être placée dessus, à la manière d'un graphique basé sur le nombre d'occurrences de "thee." En statistique, le faible écart entre ces points correspond à ce qu'on appelle la variance et va servir de gamme de valeur pour nos données. Mais ce n'est qu'une étape d'un processus multidimensionnel. L'outil de regroupement appelé Analyse des composantes principales permet de réduire l'espace multidimensionnel à de simples composantes principales, qui, ensemble, mesurent la variance dans l'œuvre de Shakespeare. Nous pouvons alors mettre les œuvres de nos candidats à l'épreuve de ces composantes. Par exemple, si suffisamment d’œuvres de Francis Bacon se retrouvent dans la variance shakespearienne, ce serait une preuve indiscutable que Francis Bacon et Shakespeare sont en fait une seule et même personne. Quels ont été les résultats ? Eh bien, les experts en stylométrie qui ont enquêté en sont venus à la conclusion que Shakespeare n'est autre que Shakespeare. Le Barde est le Barde. On n'a pas retrouvé la patte de Shakespeare dans les œuvres des prétendants au titre. En revanche, nos intrépides statisticiens on découvert des preuves irréfutables de collaborations. Par exemple, une étude récente a démontré que Shakespeare a collaboré avec le dramaturge Christopher Marlowe sur la pièce "Henry VI", pour la partie 1 et la partie 2. Mais la stylométrie permet bien plus que d'enquêter sur l'identité de Shakespeare. Elle aide à déterminer quand une œuvre a été écrite, si un texte ancien est un faux, si un étudiant est coupable de plagiat, ou si l'email que vous venez de recevoir est d'une grande priorité ou un spam. Mais les vers intemporels de Shakespeare peuvent-ils être réduits en une bouillie de chiffres et de statistiques ? Pas tout à fait. L'analyse stylométrique peut révéler ce qui distingue le style de Shakespeare des autres, mais elle ne peut pas capturer la beauté des émotions qu'il fait naître en nous, ou expliquer pourquoi il nous touche comme cela. Enfin, pas pour le moment.