ristretto: Solipsisme (1). Comment peut-on dire que deux récits racontent la même histoire ?

Attention : cet article contient une quantité substantielle de notations mathématiques, et il part loin dans des "on pourrait essayer de..." qui n'aboutissent à rien. C'est un article à la fois très concret et très inapplicable.

Je ne conseille la deuxième partie de cet article à personne, sauf peut-être Valentin, une certaine Marine qui se reconnaîtra et des mathématicien-nes ou linguistes de tout bord. D'éventuels autres articles avec ce genre de restriction porteront comme celui-ci le titre de "Solipsismes" pour indiquer essentiellement que j'écris pour écrire, pour organiser mes idées et les fixer clairement, et pas nécessairement pour être lu, sans pour autant en fermer la possibilité.

Ceci est un article de narratologie non connecté au jeu de rôle. Il s'agit de revenir sur cette distinction entre récit et histoire, séparés par une tension très fertile. Les définitions que j'utilise ici sont par défaut celles de Genette telles que je les comprends et que je les ai légèrement réinterprétées. Pour rappel donc,
+ le récit est le texte même de l'oeuvre littéraire, la suite des mots dont il est constitué, ordonnés par un certain agencement typographique. C'est le signifiant de l'oeuvre littéraire et il existe objectivement.
+ l'histoire est la suite des événements fictionnels qui se déroulent dans le récit. On peut par convention les remettre dans un ordre chronologique. Contrairement au récit, l'histoire est un objet éminemment subjectif, puisqu'il suppose un sujet qui fait le tri entre les parties importantes de l'histoire et les détails secondaires qu'on peut élaguer. Loin de rendre cette notion moins pertinente, cela fait de l'histoire une sorte de témoin expérimental de ce qu'une personne a saisi comme important dans le déroulement du récit.

La subjectivité de l'histoire pourrait amener deux personnes distinctes à produire pour un même récit deux histoires radicalement différentes. Par exemple, l'épisode de l'Odyssée où Ulysse rencontre et bat le cyclope peut pourrait être tout autant résumé par Ulysse rencontre et bat le cyclope ou par Ulysse est rusé, ce dernier énoncé pouvant d'ailleurs être vu comme un résumé de l'intégralité de l'Odyssée. Ces histoires différentes permettent de mettre en lumière des aspects différents du récit, et sont certainement toutes les deux sujettes à des analyses intéressantes pour elles-mêmes. Une conséquence rigolotte de ces constats, c'est qu'on pourrait considérer que la quatrième de couverture ou même le titre d'un roman sont des récits alternatifs de la même histoire !

On pourrait sûrement objecter que dans une oeuvre littéraire, tout est potentiellement signifiant et donc le seul résumé qui ne soit pas effectivement une déformation subjective du récit, c'est le récit tout entier, auquel on n'ait rien enlevé... mais c'est donc abandonner toute ambition analytique. C'est un peu comme dire que la meilleure projection cartographique possible, c'est le globe parce qu'il ne déforme rien, ce qui est à la fois parfaitement exact, factuel et inutile.

Parfois, on croirait presque que ce blog est écrit par un mathématicien.

Si je m'étends autant sur l'idée des différents résumés possibles, c'est parce qu'elle va m'être bien utile pour répondre à la question posée dans le titre de cet article : Comment peut-on dire que deux récits racontent la même histoire ? En effet, un intérêt de la distinction entre les deux notions est de permettre de voir deux récits différents comme basés sur une même histoire. Par exemple, cette vidéo de la série Le boloss des belles lettres, mettant en scène Jean Rochefort racontant Madame Bovary avec un langage djeuns et actuel raconterait la même histoire que le roman de Flaubert.

Mais le critère permettant de l'affirmer n'est pas clair. Comme me l'a fait remarquer Victor Féasson, elle semble faire appel à une sorte d'histoire idéale qui appartiendrait au monde des idées, dans un sens platonicien, et dont les récits ne seraient en quelque sorte que des projections dans le monde réel, des transmissions à travers un langage humain. Ce n'est pas très convainquant. Ici, je propose donc deux critères qui sont ceux que j'utilise (ou pense utiliser) quand je dis que tel et tel récit racontent la même histoire,

Critère sociologique/herméneutique

Le premier n'est pas très compliqué à énoncer, mais sûrement pénible à formaliser. Je ne vais pas m'y étendre parce que je n'en n'ai pas les compétences, mais il me semble simplement trop gros pour être éludé.

Il s'agit de dire qu'un ensemble de critères sociaux liés à nos mécanismes (construits) d'interprétation nous poussent, venant d'une société donnée et ayant certaines compétences culturelles données, à considérer deux récits comme provenant de la même histoire. Un cas très simple et factuel, c'est quand deux récits sont connectés par des entités (personnages, lieux) nommés de la même façon, constituant donc un réseau d'indices permettant d'identifier les deux oeuvres. Dans la vidéo du boloss des belles lettres, il s'agit évidemment du fait que Jean Rochefort parle de l'histoire de Madame Bovary (même nom que dans le roman de Flaubert) et qu'on peut identifier quelques faits communs (elle se marie, elle a des amants, elle meurt). Ca commence dès le paratexte, puisque la vidéo nous dit qu'il sera question de Madame Bovary.

Si on veut être extrêmement rigoureux et ne jamais faire intervenir sa propre intuition, on peut refuser d'admettre que ces faits soient effectivement les mêmes puisqu'ils ne sont pas formulés de la même façon. Mais cela reste vrai pour les sujets qui identifient des histoires, et cela revient surtout à dire que déterminer précisément les critères qui font que ces faits sont identifiés et sont considérés comme suffisants pour rapprocher deux histoires est en soi le travail de l'anthropologue. Le critère est l'objet étudié et le but de l'analyse est de faire émerger les conditions sociologiques et les mécanismes d'interprétation qui poussent une certaine personne à voir ou non deux récits comme relevant de la même histoire, pour une personne donnée, selon son milieu sociologique, ses expériences, etc.

Le critère qui émerge n'a donc évidemment aucun caractère universel inné, et il s'agit moins de savoir si l'histoire de Jean Rochefort est bien celle du livre de Flaubert que de chercher qui reconnaît cette identification ou la rejette et quels mécanismes justifient cette identité ou ce rejet.

Bon, j'avoue la supercherie : dans cette partie je promettais un critère et je ne donne finalement que les idées qui permettraient après beaucoup d'études sociologiques, anthropologiques et herméneutiques de construire des critères. J'ai bien peur, en plus, que la partie suivante soit du même acabit ; si vous voulez mieux, payez-moi un emploi à plein temps dans une université de sciences humaines !

En attendant, il ne me reste plus qu'à souhaiter que ce genre de discussions ait quand même une valeur en soi pour vous. C'est d'ailleurs, à la réflexion, une caractéristique assez générale de ce blog. (Et c'est aussi l'occasion de constater que j'ai emprunté à Genette pas seulement quelques définitions de narratologie mais aussi une certaine tendance à la digression...)

2 Critère linguistique/textuel

Voici quelques idées pour construire un outil objectif qui déterminerait une sorte de degré de proximité entre deux récits. Attention, il s'agit de construire un outil qui vérifie objectivement un critère, pas qui vérifie objectivement que deux textes sont les récits d'une même histoire. Si on poussait tout ça jusqu'au bout, on pourrait imaginer donner à une machine deux textes à manger et en ressortir un chiffre, une distance comme un pourcentage qui dirait si deux textes racontent plus ou moins la même histoire. Les calculs de distances entre textes sont d'ailleurs sujets à un paquet de publications académiques en linguistique informatique, que je connais très mal, mais je ne suis pas sûr qu'il en existe qui se pose effectivement la question de l'histoire et du contenu narratif - mais plutôt du style du vocabulaire, etc.

On pourrait construire non pas le mais les résumés d'un texte avec l'algorithme suivant :
0) soit T le texte intégral à résumer et F un ensemble de transformations possibles, agissant disons à l'échelle des phrases, qui réduisent la longueur du texte : supprimer un mot, comme un adjectif, ou carrément supprimer une proposition, voire toute la phrase, l'essentiel étant de laisser à chaque étape des phrases sémantiquement viables ;
1) pour chaque transformation f dans F qui peut effectivement lui être appliquée, je constitue le texte f(T) qui est un peu plus court que T ; j'obtiens ainsi un ensemble de textes, qu'on pourrait encore noter F(T) ;
2) pour chaque texte T' dans F(T), je peux constituer l'ensemble des textes construits à partir de T' à l'aide d'une des transformations de F, c'est-à-dire l'ensemble des textes de la forme f(T). On peut noter le (gros) ensemble ainsi créé F(F(T)) ; si on fait en sorte que F contienne la transformation identité, celle qui ne change rien (notée i, c'est celle qui fait i(T)=T), alors F(F(T)) contient bien une copie de F(T), donc c'est un ensemble plus gros que F(T).
3) on prend cet ensemble et on retourne en 2) jusqu'à ce que l'application de F ne change plus rien à F(T). Ce moment existe forcément puisque chaque opération diminue ou conserve les textes ; je vous laisse y réfléchir un peu.

Le résultat final, c'est un très gros ensemble - appelons-le R[F](T) comme Résumés - de textes qui sont tous des "résumés" de T, et qui est de la forme F(F( ..... F(T) ...)) avec un nombre fini mais inconnu à l'avance de parenthèses. Les plus gros textes contenus dans R sont T lui-même, puis des version de T où tout est conservé sauf un mot, puis des version où tout T est conservé sauf deux mots, etc. et ce jusqu'aux plus petits textes qui sont des mots isolés. Attention, pas n'importe quels mots : l'exigence de contenus sémantiquement viables implique que des noms seuls soient acceptables (ce sont des phrases nominales, comme Ruse) mais un mot de liaison seul comme de ne peut pas être contenu dans R[F](T) car, n'étant pas sémantiquement viable, il ne peut pas apparaître.

Cette construction appelle à un certain nombre d'objections ; la plus forte à mon sens c'est cette notion de sémantiquement viable comme si cette notion était bien définie, avec des phrases correctes et des phrases fausses, ce qui ne relève pas de l'usage concret de la langue. Il faudrait donc fixer une fois pour toutes ce qu'on considère comme une grammaire valide de la langue française, ce qui est normatif et arbitraire. Ceci dit, ça ne bloque pas l'algorithme qui reste capable de réduire de telles phrases en contenus sémantiquement viables (par exemple en les supprimant complètement). Du reste, je ne crois pas que ça rendrait le résultat vraiment inexploitable, étant donné que la langue écrite dans un vaste pan de la littérature est quand même concrètement et généralement très proche de la grammaire institutionnelle de son époque. D'accord, on ne pourrait rien faire avec les poèmes de Cummings, mais tant pis.

Il y a d'autres objections d'ordre technique, comme la façon de choisir les transformations F (on en rediscute un peu plus tard) ou la complexité calculatoire ahurissante de l'algorithme dès l'instant où F est un peu grand, qui le rend complètement inapplicable à des textes longs. Si on voulait le coder il faudrait sans doute se limiter à des textes de quelques phrases, ou trouver une façon de ne considérer à chaque étape qu'un petit nombre de transformations F en se faisant une idée a priori de quelles réductions sont plus pertinentes que d'autres. Cela réintroduit un critère intuitif et subjectif dans la construction, mais à ce stade c'est certainement salutaire si on veut pouvoir faire des calculs concrets. Plus concrètement, si on estime que l'algorithme agit phrase par phrase comme je l'ai décrit (ce qui peut être une limite), on peut plutôt l'appliquer indépendamment à chaque phrase - ce qui est computationnellement raisonnable - et réfléchir ensuite à la façon de combiner des phrases pour former l'ensemble de textes F(T).

Maintenant qu'on a une construction d'un ensemble des résumés possibles d'un texte, il ne reste plus qu'à voir ce qui se passe quand on compare l'ensemble des résumés de deux textes différents qu'on veut comparer à un niveau narratif. Pour la simplicité, je vais continuer l'exemple de Madame Bovary même si je la comparais à une vidéo qui n'est pas un texte écrit ; on va donc imaginer travailler avec non pas la vidéo de Jean Rochefort mais une transcription textuelle de ce qu'il dit dedans.

Si B0 désigne le texte de Madame Bovary écrit par Flaubert, et B1 la transcription du texte de Jean Rochefort, alors on pourrait comparer R[F](B0) et R[F](B1). Plus il existe de phrases communes à l'un et l'autre, plus on concluera à la similarité entre les textes. Je peux transformer cette quantité en une mesure par exemple entre 0% et 100%, en regardant le ratio entre les cardinaux :

#{ R[F](B0)∩ R[F](B1) } / #R[F](B0)

qui est la proportion de résumés de B0 communs à B1. On peut de même regarder la proportion de résumés de B1 communs à B0, qui peut être très différente en général (si un texte est très long, c'est intuitif qu'énormément de résumés ne peuvent pas être communs à l'autre texte puisqu'ils seront plus longs que l'autre texte entier ; c'est le cas ici). Intuitivement, si on fait cette comparaison avec deux fois le même texte, on trouve 100% dans les deux calculs.

Je suis conscient que cette mesure répond très imparfaitement à la question originelle. Je pense qu'on peut l'arranger sur énormément d'aspects techniques jusqu'à obtenir quelque chose de vraiment exploitable, mais ça n'aurait pas de sens de brasser en détail les réponses possibles aux objections. Voici quand même quelques pistes :
+ il faudrait élargir le set des transformations F à plus que des suppressions de mots ou groupes de mots, pour rendre compte de la synonymie, ou alors lemmatiser les mots lexicaux en mettant dans la même classe les synonymes avérés. Cela permettrait à l'algo de comprendre que le mot "go" dans B1 est équivalent au mot "femme" dans B0. Si on choisit la solution qui n'identifie pas les synonymes, il y a un risque que l'algorithme ne finisse jamais (car remplacer finir par mettre fin à augmente le nombre de mots, et la propriété de finitude qui était claire devient incertaine). Cela implique aussi de choisir un moyen de reconnaître des relations de synonymie...
+ il y a en fait tout un tas d'autres reformulations qui seraient pertinentes à intégrer à F, comme pouvoir dériver l'équivalence entre elle se fait chier et l'ennui la dévorait. Mais ça rend les choses très compliquées et on peut se dire que l'outil précédent, bien qu'il perde de l'information, peut déjà être assez performant pour faire des comparaisons (c'est-à-dire que les différences relatives entre les ratios de plusieurs comparaisons importent plus que la valeur concrète des ratios).

Revenons à des interrogations plus riches de sens, maintenant.

A défaut d'avoir proposé une méthode facilement implémentable, j'ai surtout voulu ici donner l'intuition générale que j'entends quand je parle de vérifier méthodiquement si deux récits relèvent de la même histoire. Un tel outil ne se substitue jamais à la pensée, mais il l'étaye ; il faut s'attendre à des "bugs" sous la forme de récits apparemment proches que l'outil n'arrive pas du tout à rapprocher, mais il pourrait être mis en perspective avec une analyse plus sociologique/herméneutique pour regarder la corrélation entre récits identifiés ou non et proportion de cohérence entre les ensembles de résumés des textes.

Quand je parlerai d'histoire(s) et de récit, je le dirai donc en sous-entendant les difficultés inhérentes à la notion d'histoire(s) et les possibilités ci-dessus de constituer quand même des histoires à partir d'un récit, quitte à ce que ces considérations distancient d'autant plus ma notion d'histoire de celle de Genette. Les choses qui m'intéressent vraiment, c'est paradoxalement plutôt la partie herméneutique qui promet de trouver dans les mécanismes d'interprétation des révélateurs certes sociologiques, mais aussi esthétiques, philosophiques, poétiques... et constituant des construction de sens non évidentes qui sont, à mon sens, des formes d'art.

Il paraît que c'est Deleuzien, mais ce sera pour une autre fois.