Cette couche ajoute à l’atlas une capacité de recherche sémantique au-dessus de ses pages publiées. Sa fonction n’est pas de fournir une réponse définitive sur Shahrur, mais d’ouvrir un chemin vers les passages proches de la question du lecteur : un concept, un témoin, une piste de lecture ou une source.
Comment cela fonctionne-t-il ?
Les pages de l’atlas sont découpées en courts segments : sources, particules de preuve, agrégats, relations conceptuelles, lexique, centres conceptuels et pistes de lecture. Ces segments sont ensuite transformés en représentations numériques, stockées dans une base de vecteurs sur Cloudflare.
Lorsque le lecteur rédige une question, celle-ci est transformée de la même manière, puis les segments les plus proches sont récupérés. Dans la recherche, les segments et leurs liens apparaissent. Dans le format question-réponse, on ne demande pas au modèle de répondre à partir de sa mémoire générale, mais uniquement à partir des segments récupérés.
Qu’apporte-t-elle à l’atlas ?
- Elle aide le lecteur qui ne connaît pas le terme exact à accéder à l’entrée la plus proche.
- Elle révèle les chemins possibles entre une question ordinaire et des pages structurées à l’intérieur de l’atlas.
- Elle relie la question à des passages vérifiables au lieu de se contenter d’une synthèse générale.
- Elle met en évidence les lacunes éditoriales lorsque la recherche ne trouve pas d’appui suffisant pour une question importante.
Elle ajoute aussi la couche générateur de piste de lecture selon la question, pour un usage plus orienté : elle ne fournit pas une réponse définitive, mais propose l’ordre même de lecture : un concept de départ, une piste publiée, des témoins, puis un point de tension.
Elle ajoute également le miroir coranique de l’atlas Shahrur, un volet spécifique pour les questions proches des passages coraniques : il présente des versets utilisés, proches ou en tension au sein de l’atlas, comme des témoins à examiner et non comme une interprétation automatique ni un jugement final.
Quelles sont ses limites ?
La recherche sémantique mesure la proximité entre une question et des segments, non la validité d’une idée. Elle peut donc récupérer un segment linguistiquement proche mais insuffisant pour juger. De plus, la qualité du résultat dépend de celle des textes sources, du découpage et de l’exhaustivité des pages de l’atlas.
C’est pourquoi le résultat reste une porte d’entrée vers la lecture, et non un substitut à la lecture. Si les segments récupérés ne suffisent pas, cela doit apparaître clairement, au lieu de construire une réponse à partir de matériaux extérieurs.
Qu’est-ce que cette page ne conserve pas ?
Cette page ne conserve pas de clés API ni de valeurs secrètes. Les secrets sont gérés en dehors du contenu publié, et ils ne sont mentionnés ici que pour leur fonction : relier l’atlas à la base de vecteurs, exécuter les modèles d’embedding et protéger le flux d’ingestion des segments.
Quand l’index parle-t-il ?
Dans la phase de construction active, l’index sémantique se met à jour après chaque publication qui modifie une matière publiée dans l’atlas : piste de lecture, centre conceptuel, lexique, particule, agrégat, source ou page de verset. Ainsi, ce que le lecteur interroge reste proche de la version publiée sur le site.
L’index n’a pas besoin d’être mis à jour lors d’une modification purement visuelle, d’un changement sur une page qui ne fait pas partie de la matière publiée, ou d’un travail technique qui ne modifie pas les textes que le lecteur recherche.
Lorsque la structure de l’atlas se stabilise et que les modifications deviennent pour l’essentiel linguistiques ou mineures, la mise à jour peut passer d’un rythme à chaque publication à un rythme plus léger : hebdomadaire, avant le lancement d’une grande piste, ou après tout changement qui modifie la réponse attendue du lecteur.
Règle éditoriale
Toute utilisation de cette couche doit mener à une page, un témoin ou une piste à l’intérieur de l’atlas. Si la réponse finit par remplacer la source, la couche a quitté sa fonction. En revanche, si elle ouvre un espace d’examen, de comparaison et de contestation, elle agit alors comme partie intégrante de la structure de l’atlas.
Cela vaut particulièrement pour le miroir coranique : la valeur du résultat tient au fait qu’il indique au lecteur où examiner le verset ou son usage dans le projet Shahrur, et non ce que doit être le sens du verset.