Retour au Blog
GROW FAST LTD.
Détection IA

Tiret cadratin et ChatGPT : pourquoi l'IA en abuse et comment le supprimer

ChatGPT abuse du tiret cadratin (—), un signal qui trahit immédiatement le texte IA. Pourquoi cela arrive, prompts qui l'arrêtent et nettoyage du texte déjà généré.


Tiret cadratin et ChatGPT : pourquoi l'IA en abuse et comment le supprimer

Réponse courte : ChatGPT choisit le tiret cadratin (—), aussi appelé tiret long ou em dash, comme connecteur préféré à une fréquence qu'aucun correcteur du Monde ou de chez Gallimard ne laisserait passer — environ trois à quatre fois plus dense que la prose française rédigée par un humain. La cause est dans les données d'entraînement : littérature éditée chez Gallimard, Seuil et Actes Sud, journalisme culturel du Monde et de Libération, essais universitaires. Dans tout ce corpus, le tiret cadratin signale la prose soignée, et le modèle a intégré cette association sans intégrer la règle de modération. Les correctifs rapides : instruction explicite dans le prompt ("N'utilise pas de tirets cadratins. Remplace-les par des virgules, des deux-points ou un point final."), prompts système enregistrés et chercher-remplacer dans le texte déjà généré. Attention : supprimer les tirets cadratins n'efface qu'un signal visible. Les détecteurs lisent aussi des caractères Unicode invisibles qui survivent à toute relecture.

Pourquoi ChatGPT utilise-t-il autant de tirets cadratins ?

Dans la tradition typographique française — codifiée par le Lexique des règles typographiques en usage à l'Imprimerie nationale et reprise par les manuels de style du Monde et de Libération — le tiret cadratin est un signe de prose mûre, réservé aux incises fortes, aux dialogues et aux pauses dramatiques délibérées. Sartre l'utilisait, Camus l'utilisait, Annie Ernaux l'utilise. Mais c'est précisément le type de texte sur lequel ChatGPT a été entraîné, et le modèle a assimilé l'association "tiret cadratin = prose de qualité" sans assimiler la règle de modération.

Les modèles de langage produisent du texte token par token, prédisant le plus probable selon le contexte précédent. À chaque point d'inflexion syntaxique — là où un rédacteur humain hésiterait entre virgule, point-virgule ou point final — les poids du modèle pointent fortement vers le tiret cadratin. Le token sort avec une probabilité élevée. Sur un paragraphe entier, les tirets cadratins s'accumulent à une densité que tout correcteur expérimenté identifie immédiatement comme artificielle.

Sur les forums de copywriters francophones et dans les groupes de rédaction publicitaire au Québec, en France et en Belgique, le sujet revient régulièrement depuis 2024. Les professionnels rapportent qu'ils évitent désormais le tiret cadratin parce que clients et éditeurs ont commencé à l'associer à du texte IA mal édité. C'est un vrai déplacement de perception, causé par le biais statistique d'un seul modèle.

Le tiret cadratin est-il un indicateur fiable de ChatGPT ?

Un tiret cadratin isolé par paragraphe est normal en français. Trois ou quatre tirets cadratins en six phrases, tous dans la même position grammaticale, fonctionnant comme connecteur général, c'est le motif que les correcteurs repèrent et que les détecteurs stylométriques comptabilisent.

Les écrivains humains utilisent le tiret cadratin avec un objectif rhétorique défini : marquer une incise plus forte que ne le feraient des virgules, ouvrir une réplique de dialogue, créer une pause dramatique délibérée. ChatGPT l'utilise comme connecteur universel, souvent là où une virgule, des deux-points ou un point final seraient plus nets. La surutilisation est la plus visible dans les constructions qui préparent une énumération, où le modèle écrit une phrase introductive, place un tiret cadratin et enchaîne avec l'explication.

Des détecteurs comme GPTZero et Turnitin intègrent l'usage intensif du tiret cadratin comme une variable stylométrique parmi plusieurs. Un texte n'est pas signalé pour les seuls tirets cadratins, mais ils contribuent à l'empreinte statistique que les classifieurs lisent. Pour comprendre comment fonctionne cette lecture, voyez notre guide sur comment fonctionnent les outils de détection IA.

Tirets cadratins visibles versus caractères invisibles

Les tirets cadratins sont visibles et modifiables. Les caractères Unicode invisibles sont une couche distincte et plus sérieuse du même problème, qui voyage souvent avec les tics stylistiques visibles de l'IA.

Quand ChatGPT, Claude ou Gemini génèrent du texte, la sortie peut contenir des espaces de largeur nulle (U+200B), des liaisons de largeur nulle (U+200D) et des caractères de contrôle ASCII complètement invisibles dans n'importe quel éditeur standard. Ils survivent au copier-coller, paraissent propres dans Word et Google Docs, et n'attaquent que lorsque le texte est traité par un ATS de recrutement, soumis à une plateforme académique, ou passé dans un détecteur IA. Un document peut sembler parfaitement édité et porter encore des dizaines de marqueurs invisibles.

Ce problème est distinct de celui du tiret cadratin, mais les deux voyagent souvent ensemble : on nettoie les tics visibles (on remplace les tirets cadratins, on coupe les formules creuses, on varie le rythme) et on rend un texte qui contient encore des watermarks Unicode au niveau caractère. C'est précisément pour cette couche invisible que notre outil est conçu, avec un traitement entièrement dans le navigateur — votre texte ne quitte jamais l'appareil.

Comment arrêter ChatGPT d'utiliser des tirets cadratins

La méthode la plus fiable consiste à inclure une instruction explicite dans le prompt système ou au début du message utilisateur. ChatGPT respecte bien les contraintes de style quand elles sont formulées clairement.

Des prompts qui fonctionnent vraiment

Ajoutées à n'importe quel prompt, ces instructions réduisent significativement la fréquence des tirets cadratins dans la sortie en français :

  • N'utilise pas de tirets cadratins (—). Remplace-les par des virgules, des deux-points ou un point final.
  • Écris en prose directe. Pas de tirets cadratins, pas de listes à puces, pas de parenthèses dramatiques.
  • Utilise uniquement la ponctuation standard : point, virgule, deux-points, point-virgule. Pas de tirets cadratins.
  • Écris dans un ton conversationnel et direct. Pas de tirets cadratins ni de pauses dramatiques.

La clé est la précision. Demander d'"écrire naturellement" ne sert à rien — "naturellement" pour un modèle de langage signifie "comme j'ai appris", ce qui inclut le tic du tiret cadratin. Lister explicitement ce qui est interdit et offrir les alternatives autorisées donne au modèle les contraintes dont il a besoin.

Custom GPT ou instructions persistantes

Pour quiconque utilise ChatGPT régulièrement en travail de contenu, la voie la plus propre est un Custom GPT ou des instructions enregistrées au niveau du compte. Dans "Custom Instructions", on ajoute "n'utilise jamais de tirets cadratins" une fois pour toutes, et la règle s'applique à chaque nouvelle conversation. Les rédacteurs qui produisent un volume élevé de texte assisté par IA trouvent cette approche plus fiable que d'ajouter l'instruction à chaque prompt, parce que les instructions ponctuelles se diluent dans les conversations longues.

Chercher-remplacer dans le texte déjà généré

Pour du texte déjà produit, chercher-remplacer est la correction manuelle la plus rapide. Dans Word, Google Docs et LibreOffice, on cherche le caractère tiret cadratin (—) et on le remplace par la ponctuation qui convient à chaque cas.

Le remplacement dépend du contexte :

  • Si le tiret cadratin introduit une proposition qui éclaire la précédente, deux-points font souvent mieux.
  • Si le tiret cadratin relie deux idées indépendantes, divisez en deux phrases séparées par un point.
  • Si le tiret cadratin marque une incise, virgules ou parenthèses sont plus discrètes.

Le remplacement mécanique produit des phrases boiteuses si on ne révise pas cas par cas. Traitez la première passe de chercher-remplacer comme un signalement, pas une correction — passez ensuite sur chaque occurrence et décidez selon le contexte.

Quand ChatGPT recommence à mettre des tirets cadratins en cours de conversation

Les conversations longues souffrent de la dérive de la fenêtre de contexte : plus la conversation est longue, moins les instructions initiales pèsent face aux défauts entraînés. ChatGPT retombe dans ses réflexes de tiret cadratin après 15-20 réponses, même si vous l'aviez interdit au début.

La solution pratique consiste à réaffirmer la contrainte dès que vous voyez le motif revenir. Un message bref comme "Rappel : aucun tiret cadratin. Utilise des virgules ou des deux-points." suffit à réinitialiser le comportement pour plusieurs réponses suivantes. Sur de longues séances de rédaction, glissez ce rappel toutes les cinq à sept échanges.

Alternative : demander au modèle lui-même de relire sa sortie à la fin. "Relis ta dernière réponse et remplace chaque tiret cadratin par une autre ponctuation appropriée." Capture souvent plus de cas qu'essayer de prévenir pendant la génération, parce que le modèle lit le texte complet au lieu de prédire token par token.

Ce que le tic du tiret cadratin révèle sur les empreintes stylistiques de l'IA

Le tiret cadratin est l'exemple le plus visible d'un phénomène plus large : les modèles IA développent des empreintes stylistiques qui reflètent les propriétés statistiques de leurs données d'entraînement, pas les intentions d'un auteur particulier. D'autres marqueurs fréquents dans le français de ChatGPT incluent l'abus de "en outre" et "par ailleurs" en ouverture de phrase, la préférence pour les listes de trois éléments même quand le contenu ne se divise pas naturellement en trois, et le réflexe d'ouvrir un paragraphe en reformulant la question qu'on vient de poser.

Aucun n'est une faute au sens strict — ce sont des propriétés du style prosaïque appris par le modèle qui deviennent visibles dès qu'on sait quoi chercher. Notre guide sur les mots typiques de l'IA à éviter couvre l'équivalent lexical du même problème : mots et expressions qui apparaissent avec une telle densité dans la sortie IA que leur seule présence relève la probabilité de détection même dans un texte raisonnablement édité.

Problème du tiret cadratin versus problème du caractère invisible

Quiconque relit la sortie de ChatGPT se concentre souvent sur les problèmes visibles — tirets cadratins, formules toutes faites, rythmes plats — et considère le travail fait après deux ou trois passes de relecture. Le problème des caractères invisibles opère à un autre niveau et demande un autre outil.

Les espaces de largeur nulle et les liaisons de largeur nulle sont insérés dans le texte pendant la génération. Ce ne sont pas des choix stylistiques du modèle comme l'est le tiret cadratin. Ils sont enchâssés au niveau Unicode, invisibles à l'œil humain et survivent intacts à tout flux de relecture standard. Un document qui se lit parfaitement après édition manuelle peut encore porter 20 ou 30 caractères invisibles qui déclenchent les systèmes automatiques.

Pour les étudiants, les candidats et les rédacteurs qui envoient leur travail à des portails académiques, des systèmes ATS de recrutement ou des CMS qui exécutent des vérifications d'encodage, les caractères Unicode invisibles causent un vrai problème technique. Un décryptage long se trouve dans notre article sur comment fonctionnent les filigranes de texte IA.

GPT Watermark Remover détecte plus de 40 types de caractères Unicode invisibles — espaces de largeur nulle, liaisons de largeur nulle, caractères de contrôle ASCII. L'outil a déjà traité plus de 50 000 nettoyages et tout tourne localement dans votre navigateur. Rien n'est envoyé à un serveur. Si vous faites une passe complète de nettoyage sur du contenu IA, exécuter un scan Unicode après vos éditions stylistiques attrape la couche que chercher-remplacer ne peut pas atteindre.

Devriez-vous abandonner le tiret cadratin dans votre propre écriture ?

Non. Le problème est la fréquence et le contexte, pas le signe lui-même. Le tiret cadratin est un signe de ponctuation légitime aux usages rhétoriques bien définis. Annie Ernaux, Patrick Modiano, Mathias Énard restent intouchés. Ce qui marque un texte comme généré par IA, c'est le motif de surutilisation, pas l'occurrence isolée. Un texte avec un tiret cadratin bien placé se lit humain. Un texte avec sept tirets cadratins en 400 mots se lit généré, peu importe à quel point le reste a été édité.

Les rédacteurs les plus touchés sont ceux qui utilisaient le tiret cadratin fréquemment dans leur travail pré-IA et qui remarquent maintenant que les lecteurs associent le signe à du texte de chatbot. L'association est réelle, conséquence directe du biais statistique d'un seul modèle. La réponse pratique consiste soit à continuer d'utiliser le tiret cadratin à fréquence humaine normale et accepter que certains lecteurs vont tiquer, soit à passer temporairement à des constructions alternatives jusqu'à ce que l'association se dissipe.

Ce que la suppression du tiret cadratin règle réellement

Supprimer les tirets cadratins de la sortie de ChatGPT améliore la lisibilité de surface et réduit un signal stylométrique que les détecteurs lisent. Supprimer les tirets cadratins seul ne transforme pas un texte IA en texte qui passe toutes les méthodes de détection.

Les détecteurs de Turnitin, GPTZero et autres analysent plusieurs signaux en même temps : distribution lexicale, variation de longueur de phrase, structure de paragraphe et propriétés d'encodage du texte. Résoudre le problème du tiret cadratin couvre un signal visible. Les propriétés statistiques sous-jacentes — les motifs de distribution des tokens qui ont conduit le modèle à produire des tirets cadratins en premier lieu — restent présentes dans les choix de vocabulaire, le rythme des phrases et les habitudes structurelles.

Un nettoyage complet exige les deux couches : édition stylistique (remplacer les tirets cadratins, réécrire les formules plates, varier la structure des phrases) et nettoyage au niveau caractère (retirer les marqueurs Unicode invisibles). Notre guide pour humaniser le texte IA couvre les deux couches en détail, y compris les modifications d'édition qui produisent la plus grande réduction de probabilité de détection.

Foire aux questions

Pourquoi ChatGPT utilise-t-il autant de tirets cadratins ?

ChatGPT a été entraîné sur de gros volumes de texte édité — journalisme, livres, essais longs — où le tiret cadratin apparaissait fréquemment comme marque de prose soignée. Le modèle a appris à reproduire le signe comme signal stylistique, ce qui produit une densité bien supérieure à l'écriture humaine typique en français. C'est un biais statistique de l'entraînement, pas une décision de conception délibérée.

Comment faire arrêter ChatGPT d'utiliser des tirets cadratins ?

Ajoutez une instruction explicite à votre prompt : "N'utilise pas de tirets cadratins. Remplace-les par des virgules, des deux-points ou un point final." Pour un usage continu, enregistrez la règle dans les "Custom Instructions" de votre compte ChatGPT et elle s'appliquera à chaque nouvelle conversation. Des instructions vagues comme "écris naturellement" n'annulent pas le défaut entraîné.

Le tiret cadratin est-il un signe fiable que le texte a été écrit par ChatGPT ?

La densité de tirets cadratins est un signal parmi plusieurs — fort quand il se combine à d'autres motifs. Un tiret cadratin isolé dans un paragraphe est normal. Trois ou quatre tirets cadratins en six phrases, tous comme connecteur général, c'est un motif que les correcteurs humains et les détecteurs stylométriques reconnaissent comme typique de ChatGPT. Le tiret cadratin seul ne confirme pas une paternité IA.

Supprimer les tirets cadratins rend-il le texte IA indétectable ?

Supprimer les tirets cadratins couvre un signal stylométrique visible. Les détecteurs analysent simultanément la distribution lexicale, le rythme des phrases, la structure des paragraphes et l'encodage au niveau caractère. Résoudre le tic du tiret cadratin est une étape d'édition utile, mais le nettoyage complet exige aussi de traiter les caractères Unicode invisibles (espaces et liaisons de largeur nulle) qui survivent à l'édition standard et peuvent encore déclencher les systèmes automatiques.

Quelle est la différence entre suppression de tiret cadratin et suppression de filigrane Unicode ?

Les tirets cadratins sont des signes de ponctuation visibles que vous trouvez et remplacez manuellement. Les filigranes Unicode sont des caractères invisibles — espaces et liaisons de largeur nulle, caractères de contrôle ASCII — enchâssés dans le texte IA au niveau de l'encodage. Ils sont invisibles dans les éditeurs standard, survivent au copier-coller et exigent un scanner dédié. GPT Watermark Remover s'occupe de la couche invisible ; l'édition standard de la couche visible.

Puis-je utiliser GPT Watermark Remover pour nettoyer les tirets cadratins aussi ?

GPT Watermark Remover est conçu spécifiquement pour détecter et retirer les caractères Unicode invisibles — espaces et liaisons de largeur nulle, caractères de contrôle ASCII — du texte généré par IA. Les tirets cadratins sont des caractères visibles, mieux gérés via chercher-remplacer dans votre éditeur ou via instructions de prompt. Faire tourner l'outil après vos éditions manuelles attrape la couche du problème que l'édition visuelle ne peut pas atteindre.

Prêt à supprimer les filigranes IA ?

Essayez notre outil gratuit de suppression de filigrane IA. Détectez et nettoyez les caractères invisibles de vos textes et documents en quelques secondes.

Essayer le suppresseur de filigrane GPT