EVK · ERK · MRK — Architecture mathématique complète et fondements physiques d'un nouveau paradigme informationnel pour la biologie moléculaire
Les modèles conventionnels de l'information biologique traitent l'ADN comme un alphabet quaternaire {A, T, G, C}. Cette formalisation, bien que féconde, fait abstraction des interactions physiques intramoléculaires — notamment les liaisons hydrogène — qui constituent le substrat physique réel de la stabilité de la double hélice. Nous proposons Qudits-36, un cadre mathématique original reposant sur trois constructions distinctes : l'Espace Vectoriel du Codon (EVK), l'Espace de Résonance du Codon (ERK) et la Matrice de Résonance du Codon (MRK). Les paires AT (2 liaisons H) et CG (3 liaisons H) définissent des espaces vectoriels T₃² et T₃³ en logique ternaire équilibrée {−1, 0, +1}. L'espace d'un codon est la somme directe de ces espaces, générant jusqu'à 19 683 états par codon — facteur ×307 par rapport au modèle classique. Les états sont fondés sur les asymétries de transfert de proton calculées en MP2/DFT pour les paires Watson-Crick, et les énergies sur le champ de forces harmonique CHARMM36. La matrice MRK, construite par blocs garantissant la symétrie et la semi-définie positivité, encode les couplages intra-paires (κ_AT = 0.30, κ_CG = 0.50) et inter-bases (λ = 0.12). Cette hypothèse invite la communauté scientifique mondiale à validation expérimentale.
Depuis Watson et Crick (1953), l'ADN est décrit comme une séquence de quatre bases azotées — adénine (A), thymine (T), cytosine (C), guanine (G) — appariées selon des règles de complémentarité strictes. Ce paradigme quaternaire a conduit à des avancées extraordinaires : décryptage du code génétique, séquençage haut débit, édition génomique. Il constitue la fondation de toute la bioinformatique moderne.
Cependant, ce modèle traite chaque base comme un symbole discret équivalent. Il fait abstraction de la richesse physique des liaisons hydrogène qui stabilisent la double hélice. Ces liaisons ne sont pas des entités binaires on/off — elles sont dynamiques, caractérisées par des longueurs variables, des asymétries de densité électronique, et des couplages mutuels mesurables par spectroscopie et cristallographie.
Qudits-36 propose de répondre à cette question par une formalisation mathématique rigoureuse. L'hypothèse n'est pas que l'ADN est un ordinateur quantique — c'est une proposition plus modeste et plus précise : les états de résonance des liaisons hydrogène constituent une couche informationnelle supplémentaire, encodable en logique ternaire équilibrée, dont la richesse dépasse de plusieurs ordres de grandeur le modèle quaternaire classique.
La double hélice d'ADN est stabilisée par deux familles d'interactions non-covalentes : les interactions de stacking π-π entre bases empilées le long de l'axe hélicoïdal, et les liaisons hydrogène entre bases complémentaires sur un même plan perpendiculaire à cet axe. Ce sont ces dernières qui constituent le substrat de Qudits-36.
Les deux familles de paires de bases se distinguent par le nombre de leurs liaisons hydrogène, déterminé par la géométrie de reconnaissance moléculaire :
La liaison hydrogène X─H···Y est un système dynamique dont la longueur r(H···Y) fluctue en fonction de la température, du pH, et des interactions avec des protéines avoisinantes. Les données cristallographiques de la PDB (résolution ≤ 1.5 Å) montrent des distributions approximativement gaussiennes centrées autour de 2.0 Å avec un écart-type σ ≈ 0.15–0.20 Å.
La discrétisation ternaire de Qudits-36 propose de regrouper ces états continus en trois classes discrètes selon leur écart à la longueur d'équilibre :
| État ternaire | Longueur H···Y | Signification physique | Énergie ΔE |
|---|---|---|---|
−1 Comprimée |
~1.80 Å | Compression — répulsion de Pauli + terme harmonique | +0.800 kcal/mol |
0 Équilibre |
~2.00 Å | État de repos — énergie de référence | 0.000 kcal/mol |
+1 Étirée |
~2.20 Å | Extension — terme harmonique seul | +0.400 kcal/mol |
L'alphabet ternaire équilibré T₃ = {−1, 0, +1} est muni d'une loi d'addition définie par :
La table de vérité complète confirme la clôture de T₃ sous ⊕₃ :
| ⊕₃ | −1 | 0 | +1 |
|---|---|---|---|
| −1 | +1 | −1 | 0 |
| 0 | −1 | 0 | +1 |
| +1 | 0 | +1 | −1 |
À chaque paire de bases on associe un espace vectoriel ternaire dont la dimension est égale au nombre de ses liaisons hydrogène :
L'espace d'un codon B₁B₂B₃ est la somme directe des espaces de ses trois bases. Cette construction est algébriquement rigoureuse — la somme directe de deux espaces vectoriels V ⊕ W est l'espace produit cartésien V × W muni des opérations composante par composante.
| Composition | Espace | Dimension | États | ×ADN classique |
|---|---|---|---|---|
| AT+AT+AT | T₃² ⊕ T₃² ⊕ T₃² | ℝ⁶ | 729 | ×11 |
| AT+AT+CG | T₃² ⊕ T₃² ⊕ T₃³ | ℝ⁷ | 2 187 | ×34 |
| AT+CG+CG | T₃² ⊕ T₃³ ⊕ T₃³ | ℝ⁸ | 6 561 | ×103 |
| CG+CG+CG | T₃³ ⊕ T₃³ ⊕ T₃³ | ℝ⁹ | 19 683 | ×307 |
L'assignation des états de repos de chaque liaison H repose sur l'asymétrie de transfert de proton δ, calculée en MP2/DFT pour les paires Watson-Crick en géométrie optimisée. Cette asymétrie mesure la localisation préférentielle du proton dans le double puits de potentiel de la liaison.
| Liaison | Atomes | δ (MP2) | État | ρBCP (e/a₀³) | Référence |
|---|---|---|---|---|---|
| AT · H₁ | N6(A)─H···O4(T) | −0.08 | 0 | 0.031 | Hobza & Šponer 1999 |
| AT · H₂ | N1(A)···H─N3(T) | −0.15 | −1 | 0.038 | Hobza & Šponer 1999 |
| CG · H₁ | O6(G)···H─N4(C) | +0.12 | +1 | 0.042 | Šponer et al. 2018 |
| CG · H₂ | N1(G)─H···N3(C) | −0.20 | −1 | 0.045 | Šponer et al. 2018 |
| CG · H₃ | N2(G)─H···O2(C) | −0.06 | 0 | 0.028 | Šponer et al. 2018 |
Pour un vecteur d'état v = (t₁, t₂, ..., tₙ) ∈ T₃ⁿ, l'énergie de résonance du codon est la somme des contributions individuelles de chaque liaison H :
Les probabilités d'occupation à l'équilibre thermique (300K, kBT = 0.596 kcal/mol) sont données par la distribution de Boltzmann :
La MRK est la contribution originale centrale de Qudits-36. Aucun outil bioinformatique existant ne calcule cet opérateur. Elle encode les dépendances entre les états de liaisons H adjacentes dans le codon — une information absente du modèle quaternaire classique.
Pour un codon de bases B₁B₂B₃ avec n₁, n₂, n₃ liaisons H respectivement, la matrice MRK de dimension n×n (n = n₁+n₂+n₃) est construite par blocs :
Blocs diagonaux (intra-paire) :
Blocs hors-diagonaux (inter-bases) :
Une matrice de couplage physiquement valide doit satisfaire trois propriétés :
Régularisation de Tikhonov :
| Invariant | Formule | Signification physique |
|---|---|---|
| Trace | tr(M) = Σᵢ M[i][i] |
Énergie d'auto-couplage totale — somme des auto-énergies des liaisons H |
| Déterminant | det(M) |
Indépendance des états. det = 0 si deux liaisons H ont des états parfaitement corrélés → redondance informationnelle |
| Frobenius | ‖M‖_F = √(Σᵢⱼ M[i][j]²) |
Intensité globale des couplages. Sensible aux configurations extrêmes. Utilisable comme signature de séquence. |
| Spectre | λ₁ ≥ λ₂ ≥ ... ≥ λₙ |
Modes propres de couplage. Chaque valeur propre correspond à un mode de corrélation indépendant entre liaisons H. |
| Anisotropie | λ_max / λ_min |
Ratio d'anisotropie informationnelle. Élevé : couplages très directionnels. Faible : couplages isotropes. |
| Signature | (n⁺, n⁰, n⁻) |
Nombre de valeurs propres positives, nulles, négatives. Caractérise la géométrie de l'espace de couplage. |
Un résultat concret sur l'insuline humaine (19 premiers codons) : rang moyen = 5.16 sur 9 possible, anisotropie moyenne = 3.67, toutes les matrices sont symétriques et semi-définies positives. La norme de Frobenius moyenne est de 2.54. Ces valeurs constituent la première signature MRK d'une protéine humaine dans le cadre Qudits-36.
Une distinction fondamentale structure l'implémentation de Qudits-36 : les états des liaisons H peuvent être assignés théoriquement depuis la chimie quantique (mode de référence quantique) ou mesurés expérimentalement (mode expérimental). Ces deux modes ont des statuts épistémiques différents et ne doivent jamais être confondus dans un rapport scientifique.
| Critère | Mode référence quantique | Mode expérimental |
|---|---|---|
| Source des états | Asymétrie δ, MP2/DFT, calculs ab initio publiés | Mesure directe : spectroscopie FTIR, cristallographie X ≤ 1.0 Å |
| Statut | Prédiction théorique | Donnée expérimentale |
| Usage | Simulation, exploration, comparaison, première approximation | Validation de l'hypothèse, analyse de données réelles |
| Dépendance de la séquence | Déterministe depuis l'identité de la base | Indépendant — les états peuvent différer de la prédiction théorique |
| Validation croisée | Comparable à ρBCP (AIM) | Référence pour affiner les calculs théoriques |
Le schéma de chiffrement MICA-OTP est un masque jetable (One-Time Pad) opérant dans T₃ⁿ. Il hérite de la sécurité inconditionnelle au sens de Shannon (1949) : si la clé K est uniformément distribuée dans T₃ⁿ et utilisée une seule fois, aucune information sur le message M n'est extraite du chiffré C, quelle que soit la puissance de calcul de l'adversaire.
La MRK peut être intégrée comme terme supplémentaire dans un Hamiltonien de structure protéique. Pour chaque codon i avec matrice MRK M_i :
La perturbation ERK sur les angles de Ramachandran traduit l'état dominant de résonance en déformation locale de la chaîne principale : état −1 (tendu) pousse vers la région hélice α (φ ≈ −65°, ψ ≈ −40°) ; état +1 (étiré) pousse vers le feuillet β (φ ≈ −120°, ψ ≈ +120°). Cette perturbation est de l'ordre de 5–15° selon la configuration, ce qui reste dans les tolérances de Ramachandran mais différencie statistiquement deux populations de structures.
La capacité d'encodage théorique du système Qudits-36 en mode CG+CG+CG est :
La rigueur scientifique exige d'énoncer explicitement les limites du modèle. Les points suivants constituent des hypothèses de travail qui requièrent validation expérimentale.
| Hypothèse | Statut | Test proposé |
|---|---|---|
| 3 clusters discrets de longueurs H | Non vérifiée | Analyse statistique de structures PDB (résolution ≤ 1.5 Å) — test de trimodalité Hartigan + GMM |
| États thermodynamiquement stables | Non vérifiée | Simulations MD 100 ns en solution, analyse des distributions à l'équilibre |
| Couplages κ et λ dans la MRK | Estimés | DFT explicite sur paires AT/CG isolées et en contexte de stacking |
| Répulsion de Pauli E_Pauli = 0.40 kcal/mol | Estimée | Calcul MP2/aug-cc-pVTZ sur H₂O···H₂O et N─H···N à courte distance |
| MRK influence la structure 3D | Non vérifiée | Comparaison de structures PDB pour protéines de même séquence, conditions différentes |
| MRK corrèle avec la fonction biologique | Non vérifiée | Analyse statistique sur UniProt — corrélation signature MRK / annotation fonctionnelle GO |