Kembali ke Blog
GROW FAST LTD.
AI Detection

Sengkang Em (Em Dash) dalam ChatGPT: Kenapa AI Suka Pakai dan Cara Buang

ChatGPT guna sengkang em (—) terlalu kerap sampai jadi tanda teks AI. Sebab ia berlaku, prompt untuk hentikan dan cara bersihkan teks siap.


Sengkang Em (Em Dash) dalam ChatGPT: Kenapa AI Suka Pakai dan Cara Buang

Jawapan ringkas: ChatGPT memilih sengkang em (—), yang ramai kenali sebagai em dash, sebagai penyambung ayat dengan kekerapan jauh lebih tinggi daripada tulisan Bahasa Melayu biasa — kira-kira tiga hingga empat kali lebih padat berbanding prosa terbitan Dewan Bahasa atau ruangan kolumnis akhbar tempatan. Sebabnya ada pada data latihan: buku-buku terbitan terbitan terjemahan, jurnalisme bermutu, esei akademik. Dalam bahan-bahan itu sengkang em dianggap penanda prosa terurus, dan model belajar mengaitkan tanda ini dengan "tulisan baik" tanpa belajar kaedah penggunaan terhad. Penyelesaian pantas: arahan jelas dalam prompt ("Jangan guna em dash. Gantikan dengan koma, titik bertindih, atau noktah."), system prompt yang disimpan, dan cari-ganti pada teks siap. Tetapi ingat — buang sengkang em hanya menghapus satu isyarat yang kelihatan. Pengesan juga membaca aksara Unicode halimunan yang tahan walau selepas semakan biasa.

Kenapa ChatGPT Guna Sengkang Em Begitu Kerap?

Dalam tradisi penerbitan Bahasa Melayu, sengkang em digunakan dengan terhad — untuk sisipan kuat, jeda dramatik, atau peralihan pemikiran. Manual gaya Berita Harian dan Utusan, serta buku-buku terbitan ITBM, semuanya menghadkan penggunaannya. Tetapi inilah jenis bahan latihan yang menjadi asas ChatGPT: terjemahan sastera, kolum analisis, makalah akademik dalam Bahasa Inggeris dan beberapa bahasa lain. Model belajar bahawa sengkang em adalah tanda prosa berkualiti, tanpa menyerap peraturan kekerapan.

Model bahasa besar menghasilkan teks dengan meramal token paling mungkin berdasarkan konteks sebelumnya. Pada setiap titik pertemuan sintaktik — tempat penulis manusia akan teragak-agak antara koma, titik bertindih, atau noktah — pemberat model menunjukkan kecondongan kuat kepada sengkang em. Token itu keluar dengan kebarangkalian tinggi. Sepanjang satu perenggan, sengkang em terkumpul pada kepadatan yang penyunting Bahasa Melayu akan kenal segera sebagai tidak semulajadi.

Dalam kumpulan penulis kandungan tempatan dan komuniti copywriting di Malaysia dan Singapura, isu ini sudah menjadi perbualan tetap sejak 2024. Penulis bebas melaporkan mereka kini mengelak sengkang em kerana klien dan editor mula mengaitkannya dengan teks AI yang tidak disunting dengan teliti. Ini peralihan persepsi yang nyata, akibat kecondongan statistik satu model tunggal.

Adakah Sengkang Em Tanda Pasti ChatGPT?

Satu sengkang em dalam satu perenggan adalah perkara biasa dalam tulisan Bahasa Melayu. Tiga atau empat sengkang em dalam enam ayat, semuanya pada kedudukan tatabahasa yang sama, berfungsi sebagai penyambung umum — itulah corak yang penyunting terlatih akan perasan dan yang pengesan stylometrik akan kira.

Penulis manusia menggunakan sengkang em dengan tujuan retorik yang jelas: untuk menandakan sisipan yang lebih kuat daripada koma, untuk membuka dialog dalam novel, atau untuk mencipta jeda dramatik yang disengajakan. ChatGPT menggunakannya sebagai penyambung universal, selalunya di mana koma, titik bertindih, atau noktah lebih sesuai. Penggunaan berlebihan paling ketara dalam binaan yang bersedia untuk senarai, di mana model menulis frasa pengenalan, meletak sengkang em, kemudian menyambung dengan penjelasan.

Pengesan seperti GPTZero dan Turnitin memasukkan penggunaan sengkang em yang berat sebagai satu pembolehubah stylometrik antara banyak. Teks tidak ditanda hanya kerana sengkang em, tetapi tanda itu menyumbang kepada cap jari statistik yang pengklasifikasi baca. Untuk faham mekanik bacaan ini, sila rujuk panduan kami tentang cara alat pengesanan AI berfungsi.

Sengkang Em yang Kelihatan Berbanding Aksara Halimunan

Sengkang em kelihatan dan boleh disunting. Aksara Unicode halimunan adalah lapisan berasingan dan lebih serius dalam masalah yang sama, yang biasa muncul bersama tic stilistik AI yang kelihatan.

Apabila ChatGPT, Claude, atau Gemini menjana teks, output mungkin mengandungi ruang lebar sifar (U+200B), penyambung lebar sifar (U+200D), dan aksara kawalan ASCII yang sepenuhnya halimunan dalam mana-mana editor teks biasa. Aksara-aksara ini tahan salin-tampal, kelihatan bersih dalam Word dan Google Docs, dan hanya menyerang apabila teks diproses oleh ATS pengambilan kerja, dihantar ke portal akademik, atau dilarikan melalui pengesan AI. Satu dokumen mungkin kelihatan tersusun tetapi masih membawa berpuluh penanda halimunan.

Masalah ini berbeza daripada masalah sengkang em, tetapi keduanya sering muncul bersama: penulis bersihkan tanda AI yang kelihatan (gantikan sengkang em, buang frasa klise, ubah rentak ayat) lalu hantar teks yang masih mengandungi watermark Unicode pada paras aksara. Untuk lapisan halimunan inilah alat kami dibina khusus, dengan pemprosesan sepenuhnya dalam pelayar — teks anda tidak pernah keluar daripada peranti.

Cara Hentikan ChatGPT daripada Guna Sengkang Em

Cara paling boleh dipercayai ialah memasukkan arahan jelas dalam system prompt atau pada permulaan mesej pengguna. ChatGPT mematuhi kekangan gaya dengan baik apabila ia dinyatakan dengan jelas.

Prompt yang Benar-benar Berkesan

Arahan-arahan ini, ditambah pada mana-mana prompt, mengurangkan kekerapan sengkang em dengan ketara dalam output Bahasa Melayu:

  • Jangan guna em dash. Gantikan dengan koma, titik bertindih, atau noktah.
  • Tulis dalam prosa langsung. Tiada em dash, tiada senarai bintik, tiada kurungan dramatik.
  • Guna hanya tanda baca standard: noktah, koma, titik bertindih, dan koma bertindih. Tiada em dash.
  • Tulis dalam nada perbualan dan langsung. Tiada em dash atau jeda dramatik.

Kuncinya ialah ketepatan. Memberitahu model untuk "tulis secara semulajadi" tidak membantu — "semulajadi" untuk model bahasa bermaksud "seperti yang saya pelajari", iaitu termasuk tabiat em dash. Senaraikan secara jelas apa yang dilarang dan sediakan alternatif yang dibenarkan, supaya model dapat kekangan yang ia perlukan.

Custom GPT atau System Prompt yang Disimpan

Untuk pengguna yang menggunakan ChatGPT secara tetap untuk kerja kandungan, jalan paling bersih ialah Custom GPT atau arahan yang disimpan di peringkat akaun. Dalam "Custom Instructions", tambah "jangan sekali-kali guna em dash" sekali sahaja, dan peraturan itu terpakai pada setiap perbualan baru. Penulis yang menghasilkan kandungan AI bervolume tinggi mendapati cara ini lebih boleh dipercayai daripada menambah arahan pada setiap prompt, kerana arahan satu-satu hilang dalam perbualan panjang.

Cari-Ganti untuk Teks yang Sudah Dijana

Untuk teks yang sudah dihasilkan, cari-ganti adalah pembetulan manual paling pantas. Dalam Microsoft Word, Google Docs, dan LibreOffice, anda boleh mencari aksara em dash (—) dan menggantikannya dengan tanda baca yang sesuai untuk setiap ayat.

Penggantian bergantung kepada konteks:

  • Jika em dash memperkenalkan klausa yang menerangkan klausa sebelumnya, titik bertindih biasanya lebih sesuai.
  • Jika em dash menghubungkan dua idea bebas, pisahkan kepada dua ayat berasingan dengan noktah.
  • Jika em dash menandakan sisipan, koma atau kurungan lebih bersahaja.

Penggantian mekanikal menghasilkan ayat janggal jika anda tidak menyemak satu per satu. Anggap pusingan pertama cari-ganti sebagai penanda, bukan pembetulan — kemudian lalui setiap kejadian dan buat keputusan ikut konteks.

Apabila ChatGPT Mula Pakai Sengkang Em Lagi di Tengah Perbualan

Perbualan panjang mengalami hanyutan tetingkap konteks: semakin panjang perbualan, semakin kurang berat arahan awal berbanding default yang dilatih. ChatGPT kembali kepada refleks sengkang em selepas 15-20 respons, walaupun anda mengharamkannya pada permulaan.

Penyelesaian praktikal ialah mengulang kekangan apabila anda perasan corak itu kembali. Mesej ringkas seperti "Peringatan: tiada em dash. Guna koma atau titik bertindih." mencukupi untuk menetapkan semula tingkah laku model untuk beberapa respons seterusnya. Untuk sesi penulisan panjang, sisipkan peringatan ini setiap lima ke tujuh pertukaran.

Alternatif: minta model sendiri menyemak outputnya pada akhir. "Baca semula respons terakhir anda dan gantikan setiap em dash dengan tanda baca lain yang sesuai." Biasanya menangkap lebih banyak kejadian berbanding cuba menghalang semasa generasi, kerana model membaca teks lengkap dan bukan meramal token demi token.

Apa Tabiat Em Dash Mendedahkan tentang Cap Jari Stilistik AI

Sengkang em adalah contoh paling kelihatan untuk fenomena yang lebih luas: model AI membangunkan cap jari stilistik yang mencerminkan ciri-ciri statistik data latihan, bukan niat mana-mana penulis individu. Penanda lain yang biasa dalam Bahasa Melayu ChatGPT termasuk penggunaan berlebihan "tambahan pula" dan "selanjutnya" sebagai pembukaan ayat, kecenderungan menulis dalam senarai tiga walaupun kandungan tidak terbahagi secara semulajadi kepada tiga, dan refleks membuka perenggan dengan mengulang soalan yang baru ditanya.

Tiada satu pun daripada ini ialah kesilapan dalam erti kata yang ketat — ia adalah ciri gaya prosa yang dipelajari oleh model yang menjadi jelas apabila anda tahu apa yang dicari. Panduan kami tentang perkataan AI biasa yang patut dielak meliputi padanan kosa kata bagi masalah yang sama: perkataan dan frasa yang muncul dengan kepadatan tinggi dalam output AI sehingga kehadirannya sahaja meningkatkan kebarangkalian pengesanan walaupun dalam teks yang telah disunting dengan baik.

Masalah Sengkang Em Berbanding Masalah Aksara Halimunan

Mereka yang membersihkan output ChatGPT selalunya menumpukan pada masalah yang kelihatan — em dash, frasa klise, struktur ayat datar — dan menganggap kerja sudah selesai selepas dua atau tiga pusingan penyuntingan. Masalah aksara halimunan beroperasi pada tahap yang berbeza dan memerlukan alat yang berbeza.

Ruang lebar sifar dan penyambung lebar sifar dimasukkan ke dalam teks semasa proses generasi. Ia bukan pilihan stilistik model seperti em dash. Ia terbenam pada paras Unicode, halimunan kepada mata manusia, dan tahan keseluruhan aliran kerja penyuntingan biasa. Satu dokumen yang membaca dengan sempurna selepas penyuntingan manual masih mungkin membawa 20 atau 30 aksara halimunan yang akan mencetuskan sistem automatik.

Untuk pelajar, calon kerja, dan penulis yang menghantar kerja ke platform akademik, sistem ATS pengambilan, atau CMS yang menjalankan semakan pengekodan, aksara Unicode halimunan menyebabkan masalah teknikal yang sebenar. Penjelasan terperinci ada dalam pos kami tentang bagaimana tanda air teks AI berfungsi.

GPT Watermark Remover mengesan lebih daripada 40 jenis aksara Unicode halimunan — termasuk ruang lebar sifar, penyambung lebar sifar, dan aksara kawalan ASCII. Alat ini telah memproses lebih daripada 50,000 pembersihan teks setakat ini, dan semua pemprosesan berjalan secara tempatan dalam pelayar anda. Tiada apa-apa dihantar ke pelayan. Jika anda membuat pusingan pembersihan penuh pada kandungan AI, menjalankan imbasan Unicode selepas suntingan stilistik anda menangkap lapisan masalah yang cari-ganti tidak dapat capai.

Patutkah Anda Elakkan Em Dash Sepenuhnya dalam Penulisan Anda?

Tidak. Masalahnya adalah kekerapan dan konteks, bukan tanda itu sendiri. Em dash adalah tanda baca sah dengan kegunaan retorik yang spesifik. Isunya ialah ChatGPT menggunakannya pada kepadatan dan kedudukan struktur yang tiada penulis manusia berhati-hati akan menghasilkan secara semulajadi.

Jika anda menulis kandungan anda sendiri dan menggunakan em dash dengan sengaja — satu atau dua kali setiap 500 perkataan untuk kesan khusus — tiada alasan stilistik untuk membuangnya. Isyarat yang menandakan teks sebagai AI adalah corak penggunaan berlebihan, bukan mana-mana kejadian tunggal. Satu teks dengan satu em dash yang sesuai ditempatkan membaca seperti manusia. Satu teks dengan tujuh em dash dalam 400 perkataan membaca seperti dijana, walau apa pun selebihnya telah disunting.

Penulis yang paling terkesan adalah mereka yang kerap menggunakan em dash dalam kerja pra-AI mereka dan kini mendapati pembaca mengaitkan tanda dengan teks chatbot. Pengaitan itu nyata, akibat langsung kecondongan statistik satu model tunggal. Respons praktikal ialah teruskan menggunakan em dash pada kekerapan normal manusia dan terima bahawa sesetengah pembaca akan perasan, atau beralih sementara kepada binaan alternatif sehingga pengaitan itu pudar.

Apa Sebenarnya Pembuangan Em Dash Membaiki

Membuang em dash daripada output ChatGPT meningkatkan kebolehbacaan permukaan dan mengurangkan satu isyarat stylometrik yang pengesan ambil kira. Membuang em dash sahaja tidak mengubah teks AI sepenuhnya kepada teks yang lulus semua kaedah pengesanan.

Pengesan AI daripada Turnitin, GPTZero, dan lain-lain menganalisis pelbagai isyarat serentak: taburan kosa kata, variasi panjang ayat, struktur perenggan, dan ciri-ciri pengekodan teks. Membaiki masalah em dash menangani satu isyarat yang kelihatan. Ciri-ciri statistik asas — corak taburan token yang mendorong model menghasilkan em dash pada mulanya — tetap kekal dalam pilihan kosa kata, rentak ayat, dan tabiat struktur output.

Pembersihan lengkap memerlukan kedua-dua lapisan: penyuntingan stilistik (menggantikan em dash, menulis semula frasa datar, mengubah struktur ayat) dan pembersihan pada paras aksara (membuang penanda Unicode halimunan). Panduan kami tentang cara manusiakan teks AI meliputi kedua-dua lapisan secara terperinci, termasuk perubahan suntingan yang menghasilkan pengurangan paling bermakna dalam kebarangkalian pengesanan.

Soalan Lazim

Kenapa ChatGPT guna em dash begitu kerap?

ChatGPT dilatih dengan volume besar teks yang disunting — jurnalisme, buku, esei panjang — di mana em dash kerap muncul sebagai tanda prosa terurus. Model belajar mengeluarkan tanda itu sebagai isyarat stilistik, menghasilkan output di mana em dash muncul dengan kepadatan jauh lebih tinggi daripada penulisan manusia biasa. Corak ini adalah kecondongan statistik daripada latihan, bukan keputusan reka bentuk yang disengajakan.

Bagaimana saya hentikan ChatGPT daripada guna em dash?

Tambah arahan jelas pada prompt anda: "Jangan guna em dash. Gantikan dengan koma, titik bertindih, atau noktah." Untuk kegunaan berterusan, tambah peraturan ini pada Custom Instructions akaun ChatGPT anda supaya ia terpakai untuk setiap perbualan baru secara automatik. Arahan kabur seperti "tulis secara semulajadi" tidak mengatasi default yang dilatih.

Adakah em dash tanda yang boleh dipercayai bahawa teks ditulis oleh ChatGPT?

Kepadatan em dash adalah satu isyarat antara beberapa, dan kuat apabila digabungkan dengan corak lain. Satu em dash dalam perenggan adalah perkara biasa. Tiga atau empat em dash dalam enam ayat, semua sebagai penyambung umum, adalah corak yang kedua-dua penyunting manusia dan alat pengesanan AI mengiktiraf sebagai ciri output ChatGPT. Em dash sahaja tidak dapat mengesahkan kepengarangan AI.

Adakah membuang em dash membuatkan teks AI tidak boleh dikesan?

Membuang em dash menangani satu isyarat stylometrik yang kelihatan. Alat pengesanan AI menganalisis taburan kosa kata, rentak ayat, struktur perenggan, dan pengekodan pada paras aksara serentak. Membaiki penggunaan berlebihan em dash adalah langkah suntingan yang berguna, tetapi pembersihan lengkap juga memerlukan menangani aksara Unicode halimunan (ruang lebar sifar, penyambung lebar sifar) yang tahan suntingan standard dan masih boleh mencetuskan sistem pengesanan automatik.

Apa perbezaan antara pembuangan em dash dan pembuangan watermark Unicode?

Em dash adalah tanda baca yang kelihatan yang boleh anda cari dan ganti secara manual. Watermark Unicode adalah aksara halimunan — ruang lebar sifar, penyambung lebar sifar, aksara kawalan ASCII — terbenam dalam teks AI pada paras pengekodan. Ia halimunan dalam editor standard, tahan salin-tampal, dan memerlukan pengimbas khusus untuk dikesan. GPT Watermark Remover mengendalikan lapisan halimunan; suntingan standard mengendalikan yang kelihatan.

Bolehkah saya guna GPT Watermark Remover untuk bersihkan em dash juga?

GPT Watermark Remover dibina khusus untuk mengesan dan membuang aksara Unicode halimunan — ruang lebar sifar, penyambung lebar sifar, dan aksara kawalan ASCII — daripada teks yang dijana AI. Em dash adalah aksara yang kelihatan, paling baik dikendalikan melalui cari-ganti dalam editor teks anda atau melalui arahan prompt. Menjalankan alat selepas suntingan manual anda menangkap lapisan masalah yang suntingan visual tidak dapat capai.

Bersedia untuk Membuang Tanda Air AI?

Cuba alat percuma kami untuk membuang tanda air AI. Kesan dan bersihkan aksara halimunan daripada teks dan dokumen anda dalam beberapa saat.

Cuba Penyingkir Tanda Air GPT