Товчхон хариулт: Хиймэл оюун ухааны илрүүлэгч нь хэн ямар нэгэн зүйлийг бичсэнийг "нотлох" биш; тэд хэсэг нь танил хэлний загварын хэв маягтай хэр нягт тохирч байгааг тооцоолдог. Ихэнх нь ангилагч, урьдчилан таамаглах дохио (төөрөгдөлт/огцом өөрчлөлт), стилометр, ховор тохиолдолд усны тэмдгийн шалгалтын холимогт найддаг. Түүвэр нь богино, маш албан ёсны, техникийн эсвэл ESL зохиогч бичсэн бол оноог дүгнэлт биш, харин хянаж үзэх дохио гэж үздэг.
Гол дүгнэлтүүд:
Нотолгоо биш, магадлал : Хувь хэмжээг баталгаа биш, харин "хиймэл оюун ухаантай төстэй" эрсдэлийн дохио гэж үз.
Хуурамч эерэг талууд : Албан ёсны, техникийн, загварчилсан эсвэл төрөлх хэлнээс өөр бичвэрийг буруу тэмдэглэх нь элбэг байдаг.
Аргуудын холимог : Хэрэгслүүд нь ангилагч, төөрөгдөл/хэт ихсэлт, стилометр болон ер бусын усны тэмдгийн шалгалтыг хослуулдаг.
Ил тод байдал : Зөвхөн ганц тоогоор хязгаарлагдахгүй, гадаргуугийн цар хүрээ, онцлог шинж чанар, тодорхойгүй байдлыг хамарсан илрүүлэгчийг илүүд үздэг.
Маргаантай байдал : Маргаан болон давж заалдах хүсэлтийн хувьд ноорог/тэмдэглэл хөтөлж, нотлох баримтыг гартаа байлгана.

Үүний дараа таны унших дуртай нийтлэлүүд:
🔗 Хамгийн сайн хиймэл оюун ухааны илрүүлэгч юу вэ?
Нарийвчлал, онцлог, хэрэглээний тохиолдлоор нь харьцуулсан шилдэг хиймэл оюун ухааны илрүүлэх хэрэгслүүд.
🔗 Хиймэл оюун ухаан илрүүлэгч найдвартай юу?
Найдвартай байдал, хуурамч эерэг үр дүн, үр дүн нь яагаад ихэвчлэн өөр өөр байдгийг тайлбарладаг.
🔗 Турнитин хиймэл оюун ухааныг илрүүлж чадах уу?
Turnitin AI илрүүлэлт, хязгаарлалт болон шилдэг туршлагын талаарх бүрэн гарын авлага.
🔗 QuillBot хиймэл оюун ухаан илрүүлэгч үнэн зөв үү?
Нарийвчлал, давуу болон сул талууд болон бодит ертөнцийн туршилтуудын нарийвчилсан тойм.
1) Хялбар санаа - хиймэл оюун ухааны илрүүлэгч үнэндээ юу хийдэг вэ ⚙️
Ихэнх хиймэл оюун ухааны илрүүлэгчид загас барьж буй тор шиг "хиймэл оюун ухааныг барьдаггүй". Тэд илүү энгийн зүйл хийж байна:
-
(эсвэл хэлний загвараас ихээхэн тусалсан) мэт харагдах магадлалыг тооцоолсон LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа ; OpenAI )
-
сургалтын өгөгдөлд харагдаж буй хэв маягтай (хүний бичвэр болон загвараар үүсгэсэн бичвэр) харьцуулдаг. ( LLM-ээр үүсгэсэн текст илрүүлэлтийн судалгаа )
-
Тэд оноо (ихэвчлэн хувь) гаргадаг ч ихэвчлэн тийм биш байдаг. ( Turnitin Guides )
Үнэнийг хэлэхэд хэрэглэгчийн интерфэйс дээр "92% хиймэл оюун ухаан" гэх мэт зүйл бичигдэх бөгөөд таны тархи "За, энэ бол баримт" гэж бодох болно. Энэ бол баримт биш. Энэ бол өөр загвар өмсөгчийн хурууны хээний талаарх таамаглал юм. Энэ нь нохой нохой үнэрлэж байгаа мэт бага зэрэг инээдтэй юм 🐕🐕
2) Хиймэл оюун ухаант илрүүлэгч хэрхэн ажилладаг вэ: хамгийн түгээмэл "илрүүлэх хөдөлгүүрүүд" 🔍
Илрүүлэгчид ихэвчлэн дараах аргуудын аль нэгийг (эсвэл холимог) ашигладаг: ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
А) Ангилагч загварууд (хамгийн түгээмэл)
Ангилагчийг шошготой жишээнүүд дээр сургасан болно:
-
Хүний бичсэн дээжүүд
-
Хиймэл оюун ухаанаар үүсгэгдсэн дээжүүд
-
Заримдаа "эрлийз" дээжүүд (хүний засварласан хиймэл оюун ухааны текст)
Дараа нь бүлгүүдийг тусгаарладаг хэв маягийг сурдаг. Энэ бол сонгодог машин сургалтын арга бөгөөд гайхалтай сайн байж болно... тийм биш болтол. ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
B) Гайхах болон "огцом" оноо авах 📈
Зарим илрүүлэгч нь текстийг хэр "урьдчилан таамаглах боломжтой" болохыг тооцоолдог.
-
Гайхах байдал : ойролцоогоор хэлний загвар дараагийн үгэнд хэр их гайхдаг вэ. ( Бостоны Их Сургууль - Гайхах байдлын бичлэгүүд )
-
Бага зэрэг төөрөгдөл нь текстийг урьдчилан таамаглах боломжтойг илтгэж болно (энэ нь хиймэл оюун ухааны гаралттай холбоотой байж болно). ( DetectGPT )
-
“Burstiness” нь өгүүлбэрийн нарийн төвөгтэй байдал болон хэмнэлд хэр их хэлбэлзэл байгааг хэмжихийг оролддог. ( GPTZero )
Энэ арга нь энгийн бөгөөд хурдан юм. Хүмүүс ч гэсэн урьдчилан таамаглахуйц бичиж чаддаг тул үүнийг төөрөлдүүлэхэд хялбар байдаг (корпорацийн имэйлүүд сайн уу). ( OpenAI )
C) Стилометр (бичих хурууны хээг шалгах) ✍️
Стилометр нь дараах хэв маягийг хардаг
-
дундаж өгүүлбэрийн урт
-
цэг таслалын хэв маяг
-
функцийн үгийн давтамж (the, and, but…)
-
үгсийн сангийн олон янз байдал
-
уншигдахуйц байдлын оноо
Энэ нь текстээс бусад тохиолдолд "гар бичмэлийн шинжилгээ" шиг юм. Заримдаа энэ нь тусалдаг. Заримдаа энэ нь хэн нэгний гутлыг хараад ханиад оношлохтой адил юм. ( Стилометр ба шүүх эмнэлгийн шинжлэх ухаан: Уран зохиолын тойм ; Зохиогчийн эрхэд хамаарах функцийн үгс )
D) Усны тэмдэг илрүүлэх (байгаа үед) 🧩
Зарим загвар нийлүүлэгчид үүсгэсэн текстэнд нарийн хээ ("усны тэмдэг") оруулж болно. Хэрэв илрүүлэгч нь усны тэмдгийн схемийг мэдэж байвал үүнийг баталгаажуулахыг оролдож болно. ( Том хэлний загваруудад зориулсан усны тэмдэг ; SynthID текст )
Гэхдээ ... бүх загварууд усан тэмдэгтэй байдаггүй, бүх гаралтууд засвар хийсний дараа усны тэмдгийг хадгалдаггүй, мөн бүх илрүүлэгч нууц үгэнд хандах эрхтэй байдаггүй. Тиймээс энэ нь бүх нийтийн шийдэл биш юм. ( Том хэлний загваруудын усан тэмдгийн найдвартай байдлын тухай ; OpenAI )
3) Хиймэл оюун ухаан илрүүлэгчийн сайн хувилбарыг юу бүрдүүлдэг вэ ✅
"Сайн" илрүүлэгч (миний туршлагаас харахад тэдгээрээс хэд хэдэнийг нь редакцийн ажлын урсгалд зэрэгцүүлэн туршиж үзсэн) хамгийн чанга хашгирдаг нь биш, харин хариуцлагатай ханддаг нь юм.
Хиймэл оюун ухааны илрүүлэгчийг бат бөх болгодог зүйл энд байна:
-
Тохируулсан итгэл үнэмшил : 70% нь гараараа даллах биш, харин тогтвортой гэсэн үг юм. ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
-
Хуурамч эерэг үр дүн багатай : Англи хэлний төрөлх бус хэл, хууль эрх зүйн бичиг баримт эсвэл техникийн гарын авлагыг цэвэрхэн гээд л "хиймэл оюун ухаан" гэж тэмдэглэж болохгүй. ( Стэнфорд HAI ; Лян нар (arXiv) )
-
Ил тод хязгаарлалт : энэ нь тодорхойгүй байдлыг хүлээн зөвшөөрч, хүрээг харуулах ёстой, бүхнийг мэдэгч мэт дүр эсгэх ёсгүй. ( OpenAI ; Turnitin )
-
Домэйн мэдлэг : энгийн блог дээр сургагдсан илрүүлэгчид ихэвчлэн эрдэм шинжилгээний тексттэй тэмцдэг бөгөөд эсрэгээрээ ч бас. ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
-
Богино текст боловсруулах : сайн хэрэгслүүд нь жижиг түүвэр дээр хэт өөртөө итгэлтэй оноо авахаас зайлсхийдэг (догол мөр бол ертөнц биш). ( OpenAI ; Turnitin )
-
Засварын мэдрэмж : энэ нь утгагүй үр дүнд шууд унахгүйгээр хүний засварыг зохицуулах ёстой. ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
Миний харсан хамгийн шилдэг нь жаахан даруухан байх хандлагатай байдаг. Хамгийн муу нь бодлыг уншиж байгаа юм шиг жүжиглэдэг 😬
4) Харьцуулсан хүснэгт - хиймэл оюун ухааны илрүүлэгчийн нийтлэг "төрлүүд" ба тэдгээр нь хаана гэрэлтдэг вэ 🧾
Доор практик харьцуулалт байна. Эдгээр нь брэндийн нэр биш - эдгээр нь таны тааралдах гол ангилалууд юм. ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
| Багажны төрөл (ижил) | Шилдэг үзэгчид | Үнийн мэдрэмж | Яагаад ажилладаг вэ (заримдаа) |
|---|---|---|---|
| Төөрөгдөл шалгагчийн энгийн хувилбар | Багш нар аа, хурдан шалгалтууд | Чөлөөт маягийн | Урьдчилан таамаглах боломжтой байдлын талаар хурдан дохио - гэхдээ цочирдож болно .. |
| Ангилагч сканнер Pro | Редакторууд, Хүний нөөц, хууль эрх зүйн зохицуулалт | Захиалга | Шошготой өгөгдлөөс загваруудыг сурдаг - дунд зэргийн урттай текст дээр сайн |
| Стилометрийн анализатор | Судлаачид, шүүх эмнэлгийн мэргэжилтнүүд | $$$ эсвэл тусгай зориулалтаар | Хурууны хээг харьцуулдаг - өвөрмөц боловч урт хэлбэрээр бичихэд тохиромжтой |
| Усны тэмдэг хайгч | Платформууд, дотоод багууд | Ихэнхдээ багцалсан | Усны тэмдэг байгаа үед хүчтэй - хэрэв байхгүй бол энэ нь үндсэндээ мөрөө хавчиж байгаатай адил юм |
| Холимог Энтерпрайз Сүлжээ | Том байгууллагууд | Суудал тус бүрт, гэрээ | Олон дохиог нэгтгэдэг - илүү сайн хамрах хүрээ, тохируулах илүү олон товчлуур (мөн буруу тохируулах илүү олон арга замууд, өө) |
"Үнийн мэдрэмж" гэсэн буланг анхаарна уу. Тийм ээ, энэ шинжлэх ухааны үндэслэлгүй. Гэхдээ энэ бол илэн далангүй 😄
5) Илрүүлэгчид хайдаг гол дохионууд - "мэдээлдэг" зүйлс 🧠
Олон мэдрэгч бүрээсний доор хэмжихийг оролддог зүйлс энд байна:
Урьдчилан таамаглах чадвар (токен магадлал)
Хэлний загварууд нь дараагийн токенуудыг урьдчилан таамаглах замаар текст үүсгэдэг. Энэ нь дараах зүйлсийг бий болгох хандлагатай байдаг:
-
илүү жигд шилжилтүүд
-
гэнэтийн үгийн сонголтууд цөөрсөн
-
хачин шүргэгч цөөн (хэрэв асуугаагүй бол)
-
тогтвортой өнгө аяс ( Бостоны Их Сургууль - Perplexity Posts ; DetectGPT )
Нөгөөтэйгүүр, хүмүүс ихэвчлэн зигзаг хэлбэртэй байдаг. Бид өөрсөдтэйгөө зөрчилдөж, санамсаргүй байдлаар тайлбар нэмж, бага зэрэг гаж зүйрлэл ашигладаг - жишээлбэл, хиймэл оюун ухааны илрүүлэгчийг яруу найргийг шүүдэг талх шарагчтай харьцуулдаг. Энэ зүйрлэл муу ч гэсэн та ойлгож байна.
Давталт ба бүтцийн хэв маяг
Хиймэл оюун ухаанаар бичих нь нарийн давталт харуулж чадна:
-
давтагдсан өгүүлбэрийн тулгуурууд ("Дүгнэж хэлэхэд...", "Нэмж хэлэхэд...", "Цаашилбал...")
-
ижил төстэй догол мөрийн урт
-
тогтмол хэмнэл ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
Гэхдээ бас олон хүн, ялангуяа сургууль эсвэл корпорацийн орчинд ингэж бичдэг. Тиймээс давталт бол нотолгоо биш, харин сэжүүр юм.
Хэт тодорхой, "хэт цэвэрхэн" үг хэллэг ✨
Энэ бол хачин зүйл. Зарим илрүүлэгчид "маш цэвэрхэн бичвэр"-ийг сэжигтэй гэж шууд бусаар авч үздэг. ( OpenAI )
Энэ нь эвгүй юм, учир нь:
-
сайн зохиолчид байдаг
-
редакторууд байдаг
-
зөв бичгийн алдаа шалгагч байдаг
Тэгэхээр хэрэв та хиймэл оюун ухааны илрүүлэгч хэрхэн ажилладаг талаар бол хариултын нэг хэсэг нь: заримдаа тэд барзгар байдлыг шагнадаг. Энэ нь ... нэг талаараа эсрэгээрээ юм.
Утга зүйн нягтрал ба ерөнхий хэллэг
Илрүүлэгчид дараах мэдрэмжийг төрүүлдэг текстийг тэмдэглэж болно:
-
хэт ерөнхий
-
тодорхой амьдралын дэлгэрэнгүй мэдээлэл багатай
-
Тэнцвэртэй, төвийг сахисан мэдэгдлүүдэд хэт их анхаарал хандуулдаг ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
Хиймэл оюун ухаан нь ихэвчлэн боломжийн сонсогдож байгаа ч бага зэрэг хиймэл контент гаргадаг. Яг л сайхан харагдаж байгаа ч ямар ч хувийн шинж чанаргүй зочид буудлын өрөө шиг 🛏️
6) Ангилагчийн арга - үүнийг хэрхэн сургасан (мөн яагаад эвдэрдэг) 🧪
Ангилагч илрүүлэгчийг ихэвчлэн дараах байдлаар сургадаг
-
Хүний текстийн мэдээллийн санг цуглуулах (эссэ, нийтлэл, форум гэх мэт)
-
Хиймэл оюун ухааны текст үүсгэх (олон заавар, хэв маяг, урт)
-
Дээжийг шошголох
-
Онцлог шинж чанар эсвэл оруулга ашиглан загварыг ялгаж сургах
-
Үүнийг хадгалагдсан өгөгдөл дээр баталгаажуулна уу
-
Үүнийг илгээх... тэгээд бодит байдал нүүр рүү нь цохино ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
Бодит байдал яагаад үүнийг цохиж байна вэ:
-
Домэйн шилжилт : сургалтын өгөгдөл нь жинхэнэ хэрэглэгчийн бичвэртэй таарахгүй байна
-
Загварын шилжилт : шинэ үеийн загварууд нь өгөгдлийн багцад байгаа загваруудтай адил ажиллахгүй байна
-
Засварлах эффектүүд : хүний засвар нь илэрхий хэв маягийг арилгаж болох ч нарийн хэв маягийг хадгалж чадна
-
Хэлний хувилбарууд : аялгуу, англи хэлний бичгийн хэл, албан ёсны хэв маягийг буруу уншдаг ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа ; Лян нар (arXiv) )
Би өөрсдийн туршилтын багц дээрээ "маш сайн" байсан ч ажлын байран дээрх бодит бичлэг дээр эвдэрсэн детекторуудыг харсан. Энэ нь үнэрч нохойг зөвхөн нэг брэндийн жигнэмэгээр сургаад, дэлхийн бүх зуушийг олно гэж хүлээхтэй адил юм 🍪
7) Төөрөгдөл ба дэлбэрэлт - математикийн товчлол 📉
Энэхүү илрүүлэгч гэр бүл нь хэлний загварын оноог ашиглах хандлагатай байдаг:
-
Тэд таны текстийг дараагийн токен бүр хэр магадлалтай болохыг тооцоолсон загвараар дамжуулан ажиллуулдаг.
-
Тэд нийт "гайхшрал"-ыг (төөрөгдөл) тооцоолдог. ( Бостоны Их Сургууль - Төөрөгдлийн бичлэгүүд )
-
Тэд хэмнэл нь хүнийх шиг санагдаж байгаа эсэхийг харахын тулд хувьсах хэмжигдэхүүн ("тэсрэлт") нэмж болно. ( GPTZero )
Энэ нь яагаад заримдаа ажилладаг вэ:
-
Түүхий хиймэл оюун ухааны текст нь маш жигд бөгөөд статистикийн хувьд урьдчилан таамаглах боломжтой ( DetectGPT )
Яагаад бүтэлгүйтсэн бэ:
-
богино дээжүүд чимээ шуугиантай байна
-
албан ёсны бичвэр урьдчилан таамаглах боломжтой
-
техникийн бичвэрийг урьдчилан таамаглах боломжтой
-
Төрөлх бус бичвэрийг урьдчилан таамаглах боломжтой
-
Хэт их засварласан хиймэл оюун ухааны текст хүнийх шиг харагдаж болно ( OpenAI ; Turnitin )
Тиймээс хиймэл оюун ухаан илрүүлэгч хэрхэн ажилладаг вэ гэдэг нь заримдаа дугуй болон мотоциклийг төөрөлдүүлдэг хурдны буутай төстэй байдаг. Нэг зам, өөр хөдөлгүүр 🚲🏍️
8) Усны тэмдэг - “бэхэн дээрх хурууны хээ” гэсэн санаа 🖋️
Усны тэмдэглэгээ нь цэвэр шийдэл мэт сонсогдож байна: хиймэл оюун ухааны текстийг үүсгэх үед тэмдэглээд дараа нь илрүүлнэ. ( Том хэлний загваруудад зориулсан усны тэмдэг ; SynthID текст )
Практикт усны тэмдэг нь эмзэг байж болно:
-
Дахин тайлбарлах нь тэднийг сулруулж болзошгүй
-
орчуулга тэднийг эвдэж чадна
-
хэсэгчилсэн ишлэл нь тэдгээрийг арилгаж чадна
-
Олон эх сурвалжийг холих нь хэв маягийг бүдгэрүүлж болзошгүй ( Том хэлний загваруудын усны тэмдгийн найдвартай байдлын тухай )
Мөн усны тэмдэг илрүүлэх нь зөвхөн дараах тохиолдолд л ажиллана:
-
усны тэмдэг ашиглагдаж байна
-
Детектор үүнийг хэрхэн шалгахаа мэддэг
-
Текстийг нэг их өөрчлөөгүй байна ( OpenAI ; SynthID Текст )
Тийм ээ, усны тэмдэг нь хүчтэй байж болох ч цагдаагийн бүх нийтийн тэмдэг биш юм.
9) Хуурамч эерэг үр дүн болон тэдгээрийн шалтгаан (өвдөлттэй хэсэг) 😬
Энэ нь өөрийн гэсэн хэсэгтэй байх ёстой, учир нь энд хамгийн их маргаан өрнөдөг.
Нийтлэг хуурамч эерэг өдөөгч хүчин зүйлүүд:
-
Маш албан ёсны өнгө аястай (академик, хууль эрх зүй, нийцлийн бичвэр)
-
Төрөлх англи хэл биш (хялбар өгүүлбэрийн бүтэц нь "загвар шиг" харагдаж болно)
-
Загвар дээр суурилсан бичих (хавааны захидал, Үйл ажиллагааны хөтөлбөр, лабораторийн тайлан)
-
Богино текстийн жишээ (хангалттай дохио алга)
-
Сэдвийн хязгаарлалт (зарим сэдвүүд давтагдах хэллэгийг шаарддаг) ( Liang et al. (arXiv) ; Turnitin )
Хэрэв та хэн нэгнийг хэт сайн бичсэн гэж тэмдэглэгдэж байхыг харж байсан бол... тийм ээ. Ийм зүйл тохиолддог. Энэ бол харгис хэрцгий явдал.
Илрүүлэгчийн оноог дараах байдлаар авч үзэх хэрэгтэй
-
Утааны дохиолол, шүүхийн шийдвэр биш 🔥
Энэ нь танд "хэрэг хаагдсан" гэж хэлэхгүй, харин "магадгүй шалгасан" гэж хэлдэг. ( OpenAI ; Turnitin )
10) Насанд хүрсэн хүн шиг илрүүлэгчийн оноог хэрхэн тайлбарлах вэ 🧠🙂
Үр дүнг унших практик арга энд байна:
Хэрэв хэрэгсэл нь ганц хувийг өгвөл
Үүнийг эрсдэлийн дохио гэж үз:
-
0-30%: хүний эсвэл их засварласан байх магадлалтай
-
30-70%тодорхойгүй бүс - юу ч битгий таамагла
-
70-100% : хиймэл оюун ухаантай төстэй хэв маяг байх магадлал өндөр боловч нотлогдоогүй хэвээр байна ( Turnitin Guides )
Өндөр оноо ч гэсэн буруу байж болно, ялангуяа:
-
стандартчилагдсан бичвэр
-
тодорхой төрөл (товчлол, тодорхойлолт)
-
Англи хэлний шууд бус хэл бичих ( Lian et al. (arXiv) )
Зөвхөн тоо биш, тайлбар хайж олоорой
Илүү сайн илрүүлэгч нь дараахь зүйлийг хангадаг
-
тодруулсан зай
-
онцлог тэмдэглэл (урьдчилан таамаглах чадвар, давталт гэх мэт)
-
Итгэлцлийн интервал эсвэл тодорхойгүй байдлын хэл ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
Хэрэв хэрэгсэл юу ч тайлбарлахаас татгалзаад духан дээр чинь тоо цохивол... би үүнд итгэхгүй байна. Та ч бас итгэх ёсгүй.
11) Хиймэл оюун ухааны илрүүлэгч хэрхэн ажилладаг вэ: энгийн сэтгэцийн загвар 🧠🧩
Хэрэв та цэвэрхэн дүгнэлт хийхийг хүсч байвал энэ сэтгэцийн загварыг ашиглаарай:
-
машин үүсгэсэн текстэд түгээмэл тохиолддог статистик болон хэв маягийн хэв маягийг хайдаг LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
-
Тэд эдгээр хэв маягийг сургалтын жишээнээс сурсан зүйлтэйгээ харьцуулдаг. ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
-
Тэд бодит гарал үүслийн түүх биш, харин магадлалтай төстэй таамаглал OpenAI )
-
Таамаглал нь төрөл, сэдэв, урт, засварлалт болон илрүүлэгчийн сургалтын өгөгдөлд . ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
Өөрөөр хэлбэл, хиймэл оюун ухааны илрүүлэгч хэрхэн ажилладаг вэ гэдэг нь тэд зохиогчийнх биш харин "ижил төстэй байдлыг" шүүдэгт оршино. Хэн нэгэн үеэлтэйгээ адилхан харагдаж байна гэж хэлэхтэй адил. Энэ нь ДНХ-ийн шинжилгээтэй адил биш... тэр ч байтугай ДНХ-ийн шинжилгээнүүд ч гэсэн давуу талуудтай байдаг.
12) Санамсаргүй тохиолдлын алдааг багасгах практик зөвлөмжүүд (тоглоом тоглохгүйгээр) ✍️✅
"Детекторыг хэрхэн хуурах вэ" биш. Жинхэнэ зохиогчийн мөн чанарыг тусгасан, хачин буруу уншлагаас зайлсхийх байдлаар хэрхэн бичихтэй илүү төстэй.
-
Тодорхой зүйлсийг нэмж оруулна уу: таны үнэхээр ашигласан ойлголтуудын нэрс, хийсэн алхамууд, авч үзсэн буултууд
-
Байгалийн хувилбаруудыг ашигла: богино ба урт өгүүлбэрүүдийг хольж бич (хүмүүс бодож байхдаа хийдэг шиг)
-
Бодит хязгаарлалтуудыг оруулна уу: цагийн хязгаарлалт, ашигласан хэрэгслүүд, юу буруу болсон, та юуг өөрөөр хийх байсан бэ
-
Хэтэрхий загвар үг хэллэг хэрэглэхээс зайлсхий: "Мөн түүнчлэн" гэдэг үгийг өөрийн хэлэх зүйлээр солино уу
-
Ноорог болон тэмдэглэл хөтлөөрэй: хэрэв маргаан гарвал үйл явцын нотлох баримт нь зөн совингийн мэдрэмжээс илүү чухал юм
Үнэндээ хамгийн сайн хамгаалалт бол зүгээр л... чин сэтгэлээсээ байх явдал юм. Төгс бус чин сэтгэлээсээ байхаас гадна "төгс товхимол"-ын жинхэнэ биш юм.
Хаалтын тэмдэглэл 🧠✨
Хиймэл оюун ухааны илрүүлэгч нь үнэ цэнэтэй байж болох ч үнэн машин биш юм. Тэд бол төгс бус өгөгдөл дээр сургагдсан, бичих хэв маяг байнга давхцдаг ертөнцөд ажилладаг загвар тохируулагчид юм. ( OpenAI ; LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
Товчхондоо:
-
Илрүүлэгчид нь ангилагч, төөрөгдөл/хэт ихсэлт, стилометр, заримдаа усны тэмдэг дээр тулгуурладаг 🧩 ( LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа )
-
Тэд тодорхой байдлыг биш, харин "хиймэл оюун ухаантай төстэй байдлыг" үнэлдэг ( OpenAI )
-
Хуурамч эерэг үр дүн нь албан ёсны, техникийн эсвэл төрөлх бус бичвэрт их тохиолддог 😬 ( Liang et al. (arXiv) ; Turnitin )
-
Илрүүлэгчийн үр дүнг дүгнэлт биш, харин хянах дохио болгон ашиглаарай ( Turnitin )
Тийм ээ... хэрэв хэн нэгэн дахин "Хиймэл оюун ухаан илрүүлэгч хэрхэн ажилладаг вэ " гэж асуувал та тэдэнд "Тэд хэв маяг дээр үндэслэн таамагладаг - заримдаа ухаалаг, заримдаа тэнэг, үргэлж хязгаарлагдмал байдаг" гэж хэлж болно. 🤖
Түгээмэл асуултууд
Хиймэл оюун ухааны илрүүлэгч практик дээр хэрхэн ажилладаг вэ?
Ихэнх хиймэл оюун ухааны илрүүлэгчид зохиогчийн эрхийг "батладаггүй". Тэд таны текст хэлний загваруудын нийтлэг гаргадаг хэв маягтай хэр төстэй болохыг тооцоолж, дараа нь магадлалтай төстэй оноо гаргадаг. Тэд ангилагч загвар, төөрөгдөл маягийн урьдчилан таамаглах чадварын оноо, стилометрийн онцлог эсвэл усны тэмдгийн шалгалтыг ашиглаж болно. Үр дүнг эцсийн шийдвэр биш харин эрсдэлийн дохио гэж үзэх нь хамгийн сайн арга юм.
Хиймэл оюун ухааны илрүүлэгчид бичгээр ямар дохиог хайдаг вэ?
Нийтлэг дохионуудад урьдчилан таамаглах чадвар (загвар таны дараагийн үгсэд хэр их "гайхаж" байгаа), өгүүлбэрийн шатлал дахь давталт, ер бусын тогтвортой хэмнэл, тодорхой нарийн ширийн зүйл багатай ерөнхий хэллэг орно. Зарим хэрэгслүүд нь өгүүлбэрийн урт, цэг таслалын зуршил, функц-үгсийн давтамж зэрэг стилометрийн тэмдэглэгээг шалгадаг. Эдгээр дохионууд нь хүний бичвэртэй, ялангуяа албан ёсны, эрдэм шинжилгээний эсвэл техникийн төрөлд давхцаж болно.
Хиймэл оюун ухааны илрүүлэгчид яагаад хүний бичвэрийг хиймэл оюун ухаан гэж тэмдэглэдэг вэ?
Хүний бичвэр статистикийн хувьд "гөлгөр" эсвэл загвар шиг харагдах үед хуурамч эерэг үр дүн гардаг. Албан ёсны өнгө аяс, нийцлийн хэв маягийн үг хэллэг, техникийн тайлбар, богино түүвэр, төрөлх бус англи хэл нь хувьсах чанарыг бууруулдаг тул хиймэл оюун ухаан шиг гэж буруу ойлгогдож болно. Тийм ч учраас цэвэрхэн, сайн засварласан догол мөр нь өндөр оноо авахад хүргэдэг. Илрүүлэгч нь гарал үүслийг баталгаажуулах биш, харин ижил төстэй байдлыг харьцуулж байна.
Төөрөгдөл болон "тэсрэлт" мэдрэгчүүд найдвартай юу?
Текст түүхий, өндөр урьдчилан таамаглах боломжтой хиймэл оюун ухааны гаралттай үед төөрөгдөлд суурилсан аргууд ажиллаж болно. Гэхдээ тэдгээр нь эмзэг байдаг: богино хэсгүүд нь шуугиантай байдаг бөгөөд олон хууль ёсны хүний төрөл (товчлол, тодорхойлолт, корпорацийн имэйл, гарын авлага) нь байгалийн жамаар урьдчилан таамаглах боломжтой байдаг. Засварлах, өнгөлөх нь мөн оноог эрс өөрчилж чадна. Эдгээр хэрэгслүүд нь өндөр эрсдэлтэй шийдвэрүүдэд биш, харин хурдан ангилахад тохирдог.
Ангилагч илрүүлэгч ба стилометрийн хэрэгслүүдийн хооронд ямар ялгаа байдаг вэ?
Ангилагч илрүүлэгч нь хүний болон хиймэл оюун ухаан (заримдаа эрлийз) текстийн шошготой өгөгдлийн багцаас суралцаж, таны текст аль саванд хамгийн төстэй болохыг урьдчилан таамагладаг. Стилометрийн хэрэгслүүд нь үг сонгох хэв маяг, функцийн үгс, уншигдахуйц дохио зэрэг "хурууны хээ"-г бичихэд анхаарлаа төвлөрүүлдэг бөгөөд энэ нь урт хэлбэрийн шинжилгээнд илүү мэдээлэл сайтай байж болно. Хоёр арга хоёулаа домэйны шилжилтээс болж зовж шаналж, бичих хэв маяг эсвэл сэдэв нь сургалтын өгөгдлөөсөө ялгаатай үед бэрхшээлтэй тулгардаг.
Усны тэмдэг нь хиймэл оюун ухааны илрүүлэлтийг бүрмөсөн шийддэг үү?
Усны тэмдэг нь загварт ашиглагдаж, илрүүлэгч нь усны тэмдгийн схемийг мэддэг үед хүчтэй байж болно. Бодит байдал дээр бүх үйлчилгээ үзүүлэгчийн усны тэмдэг, нийтлэг хувиргалтууд - дахин бичих, орчуулах, хэсэгчлэн иш татах, эсвэл эх сурвалжийг холих - нь хэв маягийг сулруулж эсвэл эвдэж чадахгүй. Усны тэмдэг илрүүлэх нь бүхэл бүтэн гинжин хэлхээний нарийн тохиолдолд хүчтэй боловч бүх нийтийн хамрах хүрээ биш юм.
“X% AI” оноог би хэрхэн тайлбарлах ёстой вэ?
Нэг хувийг хиймэл оюун ухааны зохиогчийн нотолгоо биш, харин "хиймэл оюун ухаантай төстэй" гэсэн барагцаалан үзүүлэлт гэж үз. Дунд түвшний оноо нь ялангуяа хоёрдмол утгатай бөгөөд өндөр оноо ч стандартчилагдсан эсвэл албан ёсны бичвэрт буруу байж болно. Илүү сайн хэрэгслүүд нь тодруулсан хугацаа, онцлог тэмдэглэл, тодорхойгүй хэл зэрэг тайлбарыг өгдөг. Хэрэв илрүүлэгч өөрийгөө тайлбарлахгүй бол тоог баталгаатай гэж үзэж болохгүй.
Сургууль эсвэл редакцийн ажлын урсгалд зориулсан сайн хиймэл оюун ухааны илрүүлэгчийг юу болгодог вэ?
Хатуу детекторыг тохируулж, хуурамч эерэг үр дүнг багасгаж, хязгаарыг тодорхой мэдээлдэг. Энэ нь богино дээжинд хэт итгэлтэй байгаагаа илэрхийлэхээс зайлсхийх, өөр өөр салбаруудыг (академик, блог, техникийн) зохицуулах, хүмүүс текстийг засварлах үед тогтвортой байх ёстой. Хамгийн хариуцлагатай хэрэгслүүд нь даруухан ажилладаг: тэд оюун ухаан уншигч шиг ажиллахын оронд нотлох баримт, тодорхойгүй байдлыг санал болгодог.
Системийг "тоглоом" хийхгүйгээр санамсаргүй хиймэл оюун ухааны тугуудыг хэрхэн багасгах вэ?
Заль мэх гэхээсээ илүү жинхэнэ зохиогчийн дохионуудад анхаарлаа төвлөрүүл. Тодорхой зүйлсийг (хийсэн алхамууд, хязгаарлалтууд, буултууд) нэмж, өгүүлбэрийн хэмнэлийг байгалийн жамаар өөрчилж, ердийн үед ашигладаггүй хэт загварчилсан шилжилтээс зайлсхий. Ноорог, тэмдэглэл, засварласан түүхийг хадгал - маргаантай үед нотлох баримтыг боловсруулах нь илрүүлэгч онооноос илүү чухал байдаг. Зорилго нь төгс товхимолын үг биш, харин хувь хүний тодорхой байдал юм.
Лавлагаа
-
Тооцооллын Хэл шинжлэлийн Холбоо (ACL Тэмдэглэл) - LLM-ээр үүсгэгдсэн текст илрүүлэлтийн судалгаа - aclanthology.org
-
OpenAI - Хиймэл оюун ухаанаар бичсэн текстийг заах шинэ хиймэл оюун ухааны ангилагч - openai.com
-
Turnitin Guides - Сонгодог тайлангийн харагдац дахь хиймэл оюун ухааны бичлэг илрүүлэлт - guides.turnitin.com
-
Turnitin Guides - Хиймэл оюун ухааны бичлэг илрүүлэх загвар - guides.turnitin.com
-
Turnitin - Хиймэл оюун ухааны бичлэг илрүүлэх чадварын доторх хуурамч эерэг үр дүнг ойлгох нь - turnitin.com
-
arXiv - DetectGPT - arxiv.org
-
Бостоны Их Сургууль - Гайхалтай бичлэгүүд - cs.bu.edu
-
GPTZero - Төөрөгдөл ба хагарал: энэ юу вэ? - gptzero.me
-
PubMed Central (NCBI) - Стилометр ба шүүх эмнэлгийн шинжлэх ухаан: Уран зохиолын тойм - ncbi.nlm.nih.gov
-
Тооцооллын Хэл шинжлэлийн Холбоо (ACL Тэмдэглэл) - Зохиогчийн эрхэд хамаарах функциональ үгс - aclanthology.org
-
arXiv - Том хэлний загваруудад зориулсан усан тэмдэг - arxiv.org
-
Хөгжүүлэгчдэд зориулсан Google хиймэл оюун ухаан - SynthID Текст - ai.google.dev
-
arXiv - Том хэлний загваруудын усны тэмдгийн найдвартай байдлын тухай - arxiv.org
-
OpenAI - Бидний онлайнаар харж, сонсдог зүйлийн эх сурвалжийг ойлгох нь - openai.com
-
Стэнфордын HAI - Хиймэл оюун ухааны илрүүлэгчид төрөлх англи хэлгүй зохиолчдын эсрэг байр суурьтай байна - hai.stanford.edu
-
arXiv - Лян нар. - arxiv.org