Volver al Blog
GROW FAST LTD.
Detección IA

Raya (—) y ChatGPT: por qué la IA la abusa y cómo eliminarla del texto

ChatGPT usa la raya (guion largo) con una frecuencia que delata el texto como IA. Por qué ocurre, prompts que lo cortan y cómo limpiar texto ya generado.


Raya (—) y ChatGPT: por qué la IA la abusa y cómo eliminarla del texto

La respuesta corta: ChatGPT escoge la raya (—), también llamada guion largo o em dash, como conector preferido con una frecuencia que ningún corrector de la RAE o de El País dejaría pasar — entre tres y cuatro veces más densa que en prosa española redactada por humanos. La causa está en los datos de entrenamiento: literatura editada por Anagrama o Tusquets, periodismo cultural de El País y La Nación, ensayos académicos. En todos esos materiales la raya marca prosa cuidada, y el modelo asimiló la asociación sin asimilar la regla de moderación. Soluciones rápidas: instrucción explícita en el prompt ("No uses rayas. Sustituye por comas, dos puntos o punto y aparte."), prompts de sistema guardados y "buscar y reemplazar" en el texto ya generado. Aviso importante: eliminar rayas solo borra una señal visible. Los detectores también leen caracteres Unicode invisibles que sobreviven a cualquier revisión.

¿Por qué ChatGPT usa tanto la raya?

En la tradición editorial hispana — desde la Ortografía de la RAE hasta los manuales de estilo de El País, La Nación y Clarín — la raya es signo de prosa madura, reservado para incisos fuertes, diálogo, o pausas dramáticas deliberadas. Cortázar la usaba, García Márquez la usaba, Roberto Bolaño la usaba. Justo el tipo de material sobre el que se entrenó ChatGPT, y el modelo aprendió la asociación "raya = prosa de calidad" sin aprender la regla de moderación.

Los modelos de lenguaje generan texto token por token, prediciendo el más probable según el contexto previo. En cada punto de inflexión sintáctica — donde un redactor humano dudaría entre coma, punto y coma o punto final — los pesos del modelo apuntan con fuerza hacia la raya. El token sale con alta probabilidad. A lo largo de un párrafo entero, las rayas se acumulan a una densidad que cualquier corrector experimentado identifica de inmediato como artificial.

En los foros de redactores publicitarios en España, México y Argentina, el tema se ha vuelto recurrente desde 2024. Profesionales del copywriting comentan que evitan la raya porque clientes y editores empezaron a asociarla con texto de IA mal editado. Es un desplazamiento real de percepción, causado por el sesgo estadístico de un único modelo.

¿Es la raya un indicador fiable de ChatGPT?

Una raya aislada por párrafo es normal en español. Tres o cuatro rayas en seis frases, todas en la misma posición gramatical y funcionando como conector general, es el patrón que los correctores notan y que los detectores estilométricos contabilizan.

Los escritores humanos usan la raya con propósito retórico concreto: marcar un inciso que pide más peso del que dan las comas, abrir un diálogo en novela, crear una pausa dramática deliberada. ChatGPT la usa como conector universal, a menudo donde una coma, dos puntos o un punto final serían más limpios. El uso excesivo es más visible en construcciones que preparan una enumeración, donde el modelo escribe una frase introductoria, mete una raya y sigue con la explicación.

Detectores como GPTZero y Turnitin incorporan el uso intensivo de raya como una variable estilométrica entre varias. Un texto no se marca solo por las rayas, pero contribuyen a la huella estadística que los clasificadores leen. Para entender mejor cómo funciona esa lectura, conviene nuestro artículo sobre cómo funcionan los detectores de IA.

Rayas visibles versus caracteres invisibles

Las rayas son visibles y editables. Los caracteres Unicode invisibles son una capa distinta y más seria del mismo problema, que suele aparecer junto con los tics estilísticos visibles de la IA.

Cuando ChatGPT, Claude o Gemini generan texto, la salida puede contener espacios de ancho cero (U+200B), uniones de ancho cero (U+200D) y caracteres de control ASCII completamente invisibles en cualquier editor estándar. Sobreviven al copia y pega, parecen limpios en Word y Google Docs y solo atacan cuando el texto pasa por un ATS de reclutamiento, un portal académico o un detector de IA. Un documento puede leerse impecable y aún cargar decenas de marcadores invisibles.

Este problema es distinto del de la raya, pero suelen viajar juntos: el redactor limpia los tics visibles (cambia rayas, recorta frases manidas, varía el ritmo) y entrega un texto que aún contiene watermarks Unicode a nivel de carácter. Es justamente para esa capa invisible para la que está construida nuestra herramienta, con procesamiento totalmente en el navegador — el texto nunca sale del dispositivo.

Cómo conseguir que ChatGPT deje de usar rayas

La manera más fiable es incluir una instrucción explícita en el prompt de sistema o al principio del mensaje del usuario. ChatGPT respeta las restricciones de estilo cuando se formulan con claridad.

Prompts que de verdad funcionan

Añadidas a cualquier prompt, estas instrucciones reducen significativamente la frecuencia de raya en la salida en español:

  • No uses rayas ni guiones largos (—). Sustitúyelos por comas, dos puntos o punto y aparte.
  • Escribe en prosa directa. Sin rayas, sin listas con guiones, sin paréntesis dramáticos.
  • Usa solo puntuación estándar: punto, coma, dos puntos y punto y coma. Nada de rayas.
  • Escribe en tono conversacional y directo. Sin rayas ni pausas dramáticas.

La clave es la concreción. Pedir "escribe de forma natural" no sirve — "natural" para un modelo de lenguaje significa "como aprendí", lo que incluye el vicio de raya. Listar explícitamente lo prohibido y ofrecer alternativas le da al modelo las restricciones que necesita.

Custom GPT o instrucciones persistentes

Para quien usa ChatGPT regularmente en trabajo de contenido, la vía más limpia es un Custom GPT o instrucciones guardadas a nivel de cuenta. En "Custom Instructions" añades "nunca uses rayas" una vez y la regla aplica a cada nueva conversación. Redactores que producen volumen alto de texto asistido por IA encuentran este método más fiable que añadir la instrucción a cada prompt, porque las instrucciones puntuales se diluyen en conversaciones largas.

Buscar y reemplazar en el texto ya generado

Para texto ya producido, "buscar y reemplazar" es la corrección manual más rápida. En Word, Google Docs y LibreOffice se busca el carácter de raya (—) y se sustituye por la puntuación que encaje en cada caso.

La sustitución depende del contexto:

  • Si la raya introduce una oración que aclara la anterior, los dos puntos suelen funcionar mejor.
  • Si la raya une dos ideas independientes, divide en dos frases separadas con punto.
  • Si la raya marca un inciso, las comas o los paréntesis quedan más discretos.

La sustitución mecánica produce frases torcidas si no se revisa caso por caso. Trata la primera pasada de "buscar y reemplazar" como señalización, no como corrección — después pasa por cada ocurrencia y decide según el contexto.

Cuando ChatGPT vuelve a meter rayas a media conversación

Las conversaciones largas sufren la deriva de la ventana de contexto: cuanto más larga la conversación, menos peso relativo tienen las instrucciones iniciales frente a los defaults entrenados. ChatGPT vuelve a los reflejos de raya tras 15-20 respuestas, aunque al principio se lo hayas prohibido.

La solución práctica es reafirmar la restricción cuando notes que el patrón vuelve. Un mensaje breve como "Recordatorio: nada de rayas. Usa comas o dos puntos." basta para resetear el comportamiento durante varias respuestas. En sesiones largas de redacción, mete ese recordatorio cada cinco o siete intercambios.

Otra opción: pedirle al propio modelo que revise su salida al final. "Relee tu última respuesta y sustituye cada raya por otra puntuación adecuada." Suele capturar más casos que intentar prevenir durante la generación, porque el modelo lee el texto completo en vez de predecir token por token.

Qué dice el vicio de la raya sobre las huellas estilísticas de IA

La raya es el ejemplo más visible de un fenómeno más amplio: los modelos de IA desarrollan huellas estilísticas que reflejan las propiedades estadísticas del material de entrenamiento, no las intenciones de ningún autor concreto. Otros marcadores frecuentes en el español de ChatGPT incluyen el abuso de "además" y "asimismo" como aperturas de frase, la preferencia por listas de tres elementos aunque el contenido no se divida naturalmente en tres, y el reflejo de abrir párrafo repitiendo la pregunta recién planteada.

Ninguno es un error en sentido estricto — son propiedades del estilo aprendido por el modelo que se vuelven visibles cuando sabes qué buscar. Nuestra guía sobre palabras típicas de IA que conviene evitar cubre el equivalente vocabular del mismo problema: palabras y expresiones que aparecen con tanta densidad en la salida de IA que su mera presencia eleva la probabilidad de detección incluso en texto razonablemente editado.

Problema de la raya versus problema del carácter invisible

Quien revisa salida de ChatGPT suele centrarse en los problemas visibles — rayas, frases manidas, ritmos planos — y dar la tarea por hecha tras dos o tres pasadas de revisión. El problema de los caracteres invisibles opera en otro nivel y exige otra herramienta.

Los espacios de ancho cero y las uniones de ancho cero se insertan en el texto durante la generación. No son una elección estilística del modelo como lo es la raya. Están incrustados a nivel Unicode, son invisibles al ojo humano y sobreviven intactos a cualquier flujo de revisión estándar. Un documento que se lee perfecto tras edición manual puede aún cargar 20 o 30 caracteres invisibles que disparan sistemas automáticos.

Para estudiantes, candidatos y redactores que envían trabajo a portales académicos, sistemas ATS de selección o CMS que ejecutan comprobaciones de encoding, los caracteres Unicode invisibles causan problema técnico real. Hay un desglose largo en nuestro artículo sobre cómo funcionan las marcas de agua de texto IA.

GPT Watermark Remover detecta más de 40 tipos de caracteres Unicode invisibles — incluyendo espacios y uniones de ancho cero y caracteres de control ASCII. La herramienta ha procesado más de 50.000 limpiezas y todo corre localmente en el navegador. Nada se envía a servidor. Si estás haciendo una limpieza completa de contenido de IA, ejecutar un scan Unicode tras tus ediciones estilísticas pesca la capa que "buscar y reemplazar" no alcanza.

¿Deberías abandonar la raya en tu propia escritura?

No. El problema es la frecuencia y el contexto, no el signo en sí. La raya es un signo de puntuación legítimo con usos retóricos bien definidos. Cortázar, García Márquez y Bolaño siguen intocables. Lo que marca el texto como generado por IA es el patrón de sobreuso, no ninguna ocurrencia aislada. Un texto con una raya bien colocada se lee humano. Un texto con siete rayas en 400 palabras se lee generado, por mucho que el resto haya sido editado.

Los redactores más afectados son los que usaban la raya con frecuencia en su escritura pre-IA y ahora notan que los lectores asocian el signo con texto de chatbot. La asociación es real, consecuencia directa del sesgo estadístico de un único modelo. La respuesta práctica es seguir usando raya con frecuencia humana normal y aceptar que algún lector se quedará pensando, o abandonarla temporalmente en favor de construcciones alternativas hasta que la asociación se diluya.

Qué resuelve realmente eliminar las rayas

Quitar rayas del output de ChatGPT mejora la legibilidad superficial y reduce una señal estilométrica que los detectores leen. Eliminar rayas por sí solo no convierte un texto de IA en texto que supere todos los métodos de detección.

Los detectores de Turnitin, GPTZero y otros analizan varias señales a la vez: distribución de vocabulario, variación de longitud de frase, estructura de párrafo y propiedades de encoding del texto. Resolver el problema de la raya cubre una señal visible. Las propiedades estadísticas subyacentes — los patrones de distribución de tokens que llevaron al modelo a producir rayas en primer lugar — siguen presentes en las elecciones de vocabulario, el ritmo frasal y los hábitos estructurales.

Una limpieza completa exige ambas capas: edición estilística (sustituir rayas, reescribir frases manidas, variar estructura frasal) y limpieza a nivel de carácter (quitar marcadores Unicode invisibles). Nuestra guía para humanizar texto de IA cubre ambas capas en detalle, incluyendo qué cambios de edición producen la mayor reducción de probabilidad de detección.

Preguntas frecuentes

¿Por qué ChatGPT usa tantas rayas?

ChatGPT se entrenó con grandes volúmenes de texto editado — periodismo, libros, ensayos largos — donde la raya aparecía con frecuencia como marca de prosa cuidada. El modelo aprendió a reproducir el signo como señal estilística, lo que produce una densidad muy superior a la escritura humana típica en español. Es un sesgo estadístico del entrenamiento, no una decisión deliberada de diseño.

¿Cómo hago que ChatGPT deje de usar rayas?

Añade instrucción explícita al prompt: "No uses rayas. Sustitúyelas por comas, dos puntos o punto y aparte." Para uso continuo, guarda la regla en "Custom Instructions" de tu cuenta ChatGPT y aplicará a cada nueva conversación. Instrucciones vagas como "escribe de forma natural" no anulan el default entrenado.

¿Es la raya señal segura de que el texto lo escribió ChatGPT?

La densidad de raya es una señal entre varias — fuerte cuando se combina con otros patrones. Una raya aislada en un párrafo es normal. Tres o cuatro rayas en seis frases, todas como conector general, es patrón que tanto correctores como detectores estilométricos reconocen como típico de ChatGPT. La raya por sí sola no confirma autoría de IA.

¿Eliminar las rayas hace que el texto de IA sea indetectable?

Eliminar rayas cubre una señal estilométrica visible. Los detectores analizan a la vez distribución de vocabulario, ritmo frasal, estructura de párrafo y encoding a nivel de carácter. Resolver el vicio de raya es un paso útil de edición, pero la limpieza completa exige también tratar los caracteres Unicode invisibles (espacios y uniones de ancho cero) que sobreviven a la edición estándar y aún pueden disparar sistemas automáticos.

¿Cuál es la diferencia entre eliminar rayas y eliminar watermarks Unicode?

Las rayas son signos de puntuación visibles que se encuentran y sustituyen manualmente. Los watermarks Unicode son caracteres invisibles — espacios y uniones de ancho cero, caracteres de control ASCII — incrustados en el texto de IA a nivel de encoding. Son invisibles en editores estándar, sobreviven al copia y pega y requieren un escáner dedicado. GPT Watermark Remover se ocupa de la capa invisible; la edición estándar de la visible.

¿Puedo usar GPT Watermark Remover para limpiar rayas también?

GPT Watermark Remover está construido específicamente para detectar y eliminar caracteres Unicode invisibles — espacios y uniones de ancho cero, caracteres de control ASCII — en texto generado por IA. Las rayas son caracteres visibles, mejor tratados con "buscar y reemplazar" en tu editor o con instrucciones de prompt. Ejecutar la herramienta tras tus ediciones manuales atrapa la capa del problema que la edición visual no alcanza.

¿Listo para Eliminar Marcas de Agua de IA?

Prueba nuestra herramienta gratuita de eliminación de marcas de agua de IA. Detecta y limpia caracteres invisibles de tu texto y documentos en segundos.

Probar Removedor de Marcas de Agua GPT