Хиймэл оюун ухаан хэр нарийвчлалтай вэ?

Хиймэл оюун ухаан хэр нарийвчлалтай вэ?

"Нарийвчлал" нь таны ямар төрлийн хиймэл оюун ухааныг хэлж байгаа, та түүнээс юу хийхийг хүсч байгаа, ямар өгөгдөл харж байгаа, мөн амжилтыг хэрхэн хэмжиж байгаагаас хамаарна

Доор хиймэл оюун ухааны нарийвчлалын практик задаргаа байна - энэ нь та хэрэгслүүд, үйлдвэрлэгчид эсвэл өөрийн системийг үнэлэхэд ашиглаж болох төрөл юм.

Үүний дараа унших дуртай нийтлэлүүд:

🔗 Хиймэл оюун ухааныг алхам алхмаар хэрхэн сурах вэ
Хиймэл оюун ухааныг өөртөө итгэлтэйгээр сурч эхлэхэд зориулсан анхан шатны хүмүүст ээлтэй замын зураг.

🔗 Хиймэл оюун ухаан өгөгдөл дэх гажигийг хэрхэн илрүүлдэг вэ
Хиймэл оюун ухаан ер бусын хэв маягийг автоматаар илрүүлэхийн тулд ашигладаг аргуудыг тайлбарладаг.

🔗 Яагаад хиймэл оюун ухаан нийгэмд муугаар нөлөөлж болох вэ
Нэгэнт ялгаварлан гадуурхах байдал, ажлын байрны нөлөөлөл, хувийн нууцын асуудал зэрэг эрсдэлүүдийг хамарна.

🔗 Хиймэл оюун ухааны өгөгдлийн багц гэж юу вэ, яагаад чухал вэ
Өгөгдлийн багц болон тэдгээр нь хиймэл оюун ухааны загваруудыг хэрхэн сургаж, үнэлдэгийг тодорхойлдог.


1) Тэгэхээр... Хиймэл оюун ухаан хэр нарийвчлалтай вэ? 🧠✅

нарийн, сайн тодорхойлсон даалгаварт, ялангуяа "зөв хариулт" нь хоёрдмол утгагүй бөгөөд оноо авахад хялбар үед маш байж чаддаг

Гэхдээ нээлттэй даалгаварт (ялангуяа генератив хиймэл оюун ухаанд ) "нарийвчлал" хурдан гулгамтгай болдог, учир нь:

  • хэд хэдэн хүлээн зөвшөөрөгдсөн хариулт байж болно

  • гаралт нь чөлөөтэй байж болох ч баримтад үндэслээгүй байж болно

  • загварыг хатуу зөв байдалд биш, харин "тусламжийн" мэдрэмжид тохируулсан байж магадгүй юм

  • дэлхий ертөнц өөрчлөгдөж, системүүд бодит байдлаас хоцорч магадгүй

Хэрэгтэй сэтгэцийн загвар: нарийвчлал бол таны "байгаа" шинж чанар биш. Энэ бол тодорхой орчинд, тодорхой хэмжилтийн тохиргоотойгоор тодорхой даалгаврын төлөө "олж авдаг" шинж чанар юм . Тийм ч учраас ноцтой удирдамж нь үнэлгээг нэг удаагийн онооны самбарын мөч биш, харин амьдралын мөчлөгийн үйл ажиллагаа гэж үздэг. [1]

 

Хиймэл оюун ухааны нарийвчлал

2) Нарийвчлал бол нэг зүйл биш - энэ бол бүхэл бүтэн алагласан гэр бүл 👨👩👧👦📏

Хүмүүс "нарийвчлал" гэж хэлэхдээ эдгээрийн аль нэгийг нь хэлж байж магадгүй (мөн тэд ихэвчлэн анзааралгүйгээр нэг дор хоёрыг нь

  • Зөв байдал : зөв шошго/хариулт өгсөн үү?

  • Нарийвчлал ба эргэн санах : энэ нь хуурамч дохиололоос зайлсхийсэн үү, эсвэл бүх зүйлийг барьж чадсан уу?

  • Тохируулга : "Би 90% итгэлтэй байна" гэж хэлэхэд энэ нь үнэндээ ~90% тохиолдолд зөв үү? [3]

  • Бат бөх чанар : оролт бага зэрэг өөрчлөгдсөн ч (шуугиан, шинэ хэллэг, шинэ эх сурвалж, шинэ демографик) ажиллах уу?

  • Найдвартай байдал : хүлээгдэж буй нөхцөлд тогтвортой ажилладаг уу?

  • Үнэнч байдал / бодит байдал (үйлдвэрлэх хиймэл оюун ухаан): энэ нь өөртөө итгэлтэй өнгө аястайгаар юм зохиож (хий үзэгдэл үзүүлж) байна уу? [2]

Тийм ч учраас итгэлцэлд төвлөрсөн хүрээнүүд нь "нарийвчлал"-ыг ганцаарчилсан баатрын хэмжүүр гэж үздэггүй. Тэд хүчин төгөлдөр байдал, найдвартай байдал, аюулгүй байдал, ил тод байдал, бат бөх байдал, шударга байдал гэх мэт олон зүйлийг цогц байдлаар авч үздэг - учир нь та нэгийг нь "оновчтой" болгож, нөгөөг нь санамсаргүйгээр эвдэж болно. [1]


3) "Хиймэл оюун ухаан хэр нарийвчлалтай вэ?" хэмжилтийн сайн хувилбарыг юу тодорхойлдог вэ? 🧪🔍

"Сайн хувилбар"-ын шалгах жагсаалт энд байна (хүмүүс алгасаад дараа нь харамсдаг):

✅ Даалгаврын тодорхой тодорхойлолт (өөрөөр хэлбэл турших боломжтой болгох)

  • "Товчлон дүгнэх" гэдэг нь тодорхойгүй байна.

  • “5 цэг дээр нэгтгэн дүгнэж, эх сурвалжаас 3 тодорхой тоо оруулж, ишлэл зохиож болохгүй” гэсэн дүрмийг шалгаж болно.

✅ Төлөөллийн тестийн өгөгдөл (өөрөөр хэлбэл хялбар горим дээр үнэлгээг зогсоох)

Хэрэв таны тестийн багц хэтэрхий цэвэрхэн байвал нарийвчлал нь хуурамч харагдах болно. Бодит хэрэглэгчид бичгийн алдаа, хачин ирмэгийн жижиг үсэг, "Би үүнийг утсан дээрээ шөнийн 2 цагт бичсэн" гэсэн энергийг авчирдаг.

✅ Эрсдэлтэй тохирох үзүүлэлт

Мемийг буруу ангилах нь эмнэлгийн сэрэмжлүүлгийг буруу ангилахтай адил биш юм. Та уламжлал дээр үндэслэн хэмжүүрийг сонгодоггүй - та тэдгээрийг үр дагаварт нь үндэслэн сонгодог. [1]

✅ Түгээлтийн бус туршилт (өөрөөр хэлбэл "бодит байдал гарч ирэхэд юу болох вэ?")

Хачин хэллэг, тодорхойгүй оролт, сөргөлдөөнтэй асуултууд, шинэ ангилал, шинэ цагийн үе шатуудыг туршиж үзээрэй. Энэ нь чухал, учир нь тархалтын шилжилт нь загваруудыг үйлдвэрлэлд нүүр тулан байрлуулах сонгодог арга юм. [4]

✅ Үргэлжилсэн үнэлгээ (өөрөөр хэлбэл нарийвчлал гэдэг нь "тохируулаад март" гэсэн онцлог биш)

Системийн хэлбэлзэл. Хэрэглэгчид өөрчлөгддөг. Өгөгдөл өөрчлөгддөг. Хэрэв та үүнийг тасралтгүй хэмжихгүй бол таны "гайхалтай" загвар чимээгүйхэн доройтдог. [1]

Таны таних жижигхэн бодит ертөнцийн хэв маяг: багууд ихэвчлэн өндөр "демо нарийвчлалтай" илгээдэг бөгөөд дараа нь тэдний жинхэнэ бүтэлгүйтлийн хэлбэр нь биш , харин "өөртөө итгэлтэйгээр, өргөн хүрээнд өгсөн буруу хариултууд" гэдгийг олж мэддэг. Энэ бол зөвхөн загварын асуудал биш, үнэлгээний дизайны асуудал юм.


4) Хиймэл оюун ухаан ихэвчлэн маш нарийвчлалтай байдаг (яагаад) 📈🛠️

Асуудал нь дараах тохиолдолд хиймэл оюун ухаан гялалзах хандлагатай байдаг:

  • нарийн

  • сайн шошготой

  • цаг хугацааны явцад тогтвортой

  • сургалтын хуваарилалттай төстэй

  • автоматаар оноо авахад хялбар

Жишээ нь:

  • Спам шүүлтүүр

  • Тогтмол байрлалд баримт бичгийг гаргаж авах

  • Олон тооны санал хүсэлтийн дохио бүхий зэрэглэл/санал болгох гогцоо

  • Хяналттай орчинд харааны ангиллын олон даалгавар

Эдгээр ялалтын ихэнхийн ард байгаа уйтгартай супер хүч: тодорхой үндэслэлтэй үнэн + олон холбогдох жишээ . Тансаг биш - маш үр дүнтэй.


5) Хиймэл оюун ухааны нарийвчлал ихэвчлэн алдагддаг газар 😬🧯

Энэ бол хүмүүсийн яс махаараа мэдэрдэг хэсэг юм.

Бүтээлч хиймэл оюун ухаан дахь хий үзэгдэл 🗣️🌪️

үнэмшилтэй боловч баримтгүй гаргаж чаддаг бөгөөд "үнэмжтэй" хэсэг нь яг яагаад аюултай вэ гэдэг нь энэ юм. Энэ нь хиймэл оюун ухааны эрсдэлийн удирдамж нь газардуулга, баримтжуулалт, хэмжилтэд . [2]

Түгээлтийн ээлж 🧳➡️🏠

Нэг орчинд сургагдсан загвар өөр орчинд бүдэрч болзошгүй: өөр хэрэглэгчийн хэл, өөр бүтээгдэхүүний каталог, өөр бүс нутгийн хэм хэмжээ, өөр цаг хугацааны үе. WILDS гэх мэт жишиг үзүүлэлтүүд нь үндсэндээ "түгээлтийн доторх гүйцэтгэл нь бодит ертөнцийн гүйцэтгэлийг эрс хэтрүүлж чадна" гэж хашгирах зорилгоор оршин байдаг. [4]

Өөртөө итгэлтэй таамаглалыг шагнах урамшуулал 🏆🤥

Зарим тохиргоо нь "зөвхөн мэдэж байхдаа л хариул" гэсэн зан үйлийг санамсаргүйгээр шагнадаг. Тиймээс системүүд байхын оронд зөв сонсогдож . Тиймээс үнэлгээнд зөвхөн түүхий хариултын хувь хэмжээ биш, харин түдгэлзсэн / тодорхойгүй зан үйлийг багтаах ёстой. [2]

Бодит ертөнцийн осол аваар болон үйл ажиллагааны доголдол 🚨

Хүчтэй загвар ч гэсэн систем хэлбэрээр бүтэлгүйтэж болно: муу сэргээлт, хуучирсан өгөгдөл, эвдэрсэн хашлага, эсвэл загварыг аюулгүй байдлын шалгалтаар чимээгүйхэн чиглүүлдэг ажлын урсгал. Орчин үеийн удирдамж нь нарийвчлалыг системийн өргөн хүрээтэй найдвартай байдлын . [1]


6) Дутуу үнэлэгдсэн супер хүч: тохируулга (өөрөөр хэлбэл "мэдэхгүй зүйлээ мэдэх") 🎚️🧠

Хоёр загвар ижил "нарийвчлалтай" байсан ч гэсэн нэг нь илүү аюулгүй байж болно, учир нь:

  • тодорхойгүй байдлыг зохих ёсоор илэрхийлдэг

  • хэт өөртөө итгэлтэй буруу хариултаас зайлсхийдэг

  • бодит байдалтай нийцэх магадлалыг өгдөг

Тохируулга нь зөвхөн эрдэм шинжилгээний шинж чанартай биш - энэ нь итгэлийг үйлдэлд оруулах боломжтой . Орчин үеийн мэдрэлийн сүлжээний сонгодог олдвор бол та тодорхой тохируулга хийхгүй эсвэл хэмжихгүй бол итгэлийн оноог жинхэнэ зөв байдалтай тааруулах

Хэрэв таны дамжуулах хоолой "0.9-өөс дээш автоматаар батлах" гэх мэт босго утгыг ашигладаг бол тохируулга нь "автоматжуулалт" болон "автоматжуулсан эмх замбараагүй байдал"-ын хоорондох ялгаа юм


7) Хиймэл оюун ухааны янз бүрийн төрлүүдэд хиймэл оюун ухааны нарийвчлалыг хэрхэн үнэлдэг вэ 🧩📚

Сонгодог таамаглалын загваруудын хувьд (ангилал/регресс) 📊

Нийтлэг үзүүлэлтүүд:

  • Нарийвчлал, нарийвчлал, эргэн санах, F1

  • ROC-AUC / PR-AUC (ихэвчлэн тэнцвэргүй асуудлуудад илүү сайн)

  • Тохируулгын шалгалт (найдвартай байдлын муруй, хүлээгдэж буй тохируулгын алдааны хэв маягийн сэтгэлгээ) [3]

Хэлний загвар болон туслахуудад зориулсан 💬

Үнэлгээ нь олон талт шинж чанартай байдаг:

  • зөв байдал (даалгавар нь үнэний нөхцөлтэй үед)

  • зааврыг дагаж мөрдөх

  • аюулгүй байдал ба татгалзах зан байдал (сайн татгалзал хачин хэцүү байдаг)

  • баримтын үндэслэл / ишлэлийн сахилга бат (таны хэрэглээний тохиолдолд шаардлагатай үед)

  • хүсэлт болон хэрэглэгчийн хэв маягийн дагуу бат бөх чанар

"Цогц" үнэлгээний сэтгэлгээний томоохон хувь нэмрүүдийн нэг нь дараах зүйлийг тодорхой болгох явдал юм: буулт хийх нь бодитой байдаг тул танд олон хувилбарын дагуу олон үзүүлэлт хэрэгтэй. [5]

LLM дээр суурилсан системүүдийн хувьд (ажлын урсгал, агентууд, сэргээх) 🧰

Одоо та бүхэл бүтэн дамжуулах хоолойг үнэлж байна:

  • Сэргээх чанар (зөв мэдээллийг авч чадсан уу?)

  • хэрэгслийн логик (энэ нь үйл явцыг дагасан уу?)

  • гаралтын чанар (зөв бөгөөд хэрэгтэй юу?)

  • хашлага (эрсдэлтэй зан авираас зайлсхийсэн үү?)

  • хяналт (та байгальд алдаа илрүүлсэн үү?) [1]

Хаана ч байсан сул холбоос нь үндсэн загвар нь дажгүй байсан ч бүхэл системийг "буруу" харагдуулж болзошгүй.


8) Харьцуулсан хүснэгт: “Хиймэл оюун ухаан хэр нарийвчлалтай вэ?”-ийг үнэлэх практик аргууд 🧾⚖️

Хэрэгсэл / арга барил Хамгийн сайн нь Зардлын уур амьсгал Яагаад ажилладаг вэ
Хэрэглээний тохиолдлын туршилтын багцууд LLM аппликейшнууд + захиалгат амжилтын шалгуурууд Чөлөөт маягийн санамсаргүй тэргүүлэгчдийн самбар биш, харин ажлын урсгалаа шалгадаг .
Олон хэмжигдэхүүнтэй, нөхцөл байдлын хамрах хүрээ Загваруудыг хариуцлагатайгаар харьцуулах Чөлөөт маягийн Та ганц шидэт тоо биш, харин чадварын "профайл"-ыг авах болно. [5]
Амьдралын мөчлөгийн эрсдэл + үнэлгээний сэтгэлгээ Өндөр эрсдэлтэй системүүд нь нарийн чанд байдлыг шаарддаг Чөлөөт маягийн Таныг тасралтгүй тодорхойлох, хэмжих, удирдах, хянахад түлхэц болдог. [1]
Тохируулгын шалгалт Итгэлцлийн босгыг ашигладаг аливаа систем Чөлөөт маягийн "90% итгэлтэй" гэдэг нь ямар нэгэн утгатай эсэхийг шалгадаг. [3]
Хүний хяналтын самбарууд Аюулгүй байдал, өнгө аяс, нарийн мэдрэмж, "энэ хортой санагдаж байна уу?" $$ Хүмүүс автоматжуулсан хэмжүүрүүд анзаараагүй нөхцөл байдал болон хор хөнөөлийг ойлгодог.
Ослын хяналт + санал хүсэлтийн давталт Бодит ертөнцийн алдаанаас суралцах нь Чөлөөт маягийн Бодит байдал нь баримттай байдаг бөгөөд үйлдвэрлэлийн өгөгдөл нь танд санал бодлоос илүү хурдан заадаг. [1]

Хуурамч хүлээн зөвшөөрөлтийг форматлах нь: "Free-ish" нь энд маш их ажил хийж байгаа, учир нь бодит өртөг нь ихэвчлэн лиценз биш харин хүний ​​цаг байдаг 😅


9) Хиймэл оюун ухааныг хэрхэн илүү нарийвчлалтай болгох вэ (практик хөшүүргүүд) 🔧✨

Илүү сайн өгөгдөл, илүү сайн тестүүд 📦🧪

  • Ирмэгийн тохиолдлуудыг дэлгэх

  • Ховор боловч чухал нөхцөл байдлыг тэнцвэржүүл

  • Бодит хэрэглэгчийн зовлонг илэрхийлсэн "алтан багц"-ыг хадгал (мөн үүнийгээ байнга шинэчилж байгаарай)

Бодит даалгавруудын үндэслэл 📚🔍

Хэрэв танд бодит найдвартай байдал хэрэгтэй бол итгэмжлэгдсэн баримт бичгүүдээс иш татаж, тэдгээрт үндэслэн хариулт өгдөг системийг ашиглаарай. Хиймэл оюун ухааны эрсдэлийн удирдамжийн ихэнх нь загвар нь "ажиллаж байгаа" гэж найдахаас илүү зохиомол агуулгыг бууруулдаг баримтжуулалт, гарал үүсэл, үнэлгээний тохиргоонд

Илүү хүчтэй үнэлгээний давталтууд 🔁

  • Утга учиртай өөрчлөлт бүр дээр evals ажиллуулна уу

  • Регрессийг ажиглаарай

  • Хачирхалтай өдөөлт болон хортой оролтын стрессийн тест

Тохируулсан зан үйлийг урамшуул 🙏

  • "Би мэдэхгүй" гэж хэтэрхий хатуу шийтгэх хэрэггүй

  • Зөвхөн хариултын түвшинг бус, харин татгалзах чанарыг үнэл

  • Өөртөө итгэх итгэлийг өөрийн хэмжиж, баталгаажуулдаг , харин сэтгэл хөдлөлөөрөө хүлээн авдаг зүйл биш [3]


10) Мэдлэгээ хурдан шалгах: Хиймэл оюун ухааны нарийвчлалд хэзээ итгэх ёстой вэ? 🧭🤔

Дараах үед илүү итгээрэй:

  • даалгавар нь нарийн бөгөөд давтагдах боломжтой

  • гаралтыг автоматаар шалгаж болно

  • системийг хянаж, шинэчилж байна

  • өөртөө итгэх итгэлийг тохируулсан бөгөөд үүнээс татгалзаж болно [3]

Дараах тохиолдолд бага итгэ:

  • эрсдэл өндөр бөгөөд үр дагавар нь бодитой

  • асуулт нь нээлттэй байна ("надад бүх зүйлийн талаар яриач...") 😵💫

  • газардуулга, баталгаажуулалтын алхам, хүний ​​хяналт байхгүй

  • систем анхдагчаар итгэлтэй ажилладаг [2]

Бага зэрэг алдаатай зүйрлэл: өндөр эрсдэлтэй шийдвэр гаргахдаа баталгаажаагүй хиймэл оюун ухаанд найдах нь наранд байгаа суши идэхтэй адил юм... зүгээр байж магадгүй ч таны ходоод таны бүртгүүлээгүй мөрийтэй тоглоомд автаж байна.


11) Хаалтын тэмдэглэл ба товч хураангуй 🧃✅

Тэгэхээр, хиймэл оюун ухаан хэр нарийвчлалтай вэ?
Хиймэл оюун ухаан гайхалтай нарийвчлалтай байж болно - гэхдээ зөвхөн тодорхойлсон даалгавар, хэмжилтийн арга, түүнийг байрлуулсан орчинтой харьцуулахад л . Мөн үүсгэгч хиймэл оюун ухааны хувьд "нарийвчлал" нь ихэвчлэн ганц онооноос илүү найдвартай системийн загвар болох газардуулга, тохируулга, хамрах хүрээ, хяналт, шударга үнэлгээнээс хамаардаг. [1][2][5]

Товч хураангуй 🎯

  • "Нарийвчлал" гэдэг нь ганцхан оноо биш - энэ нь зөв байдал, тохируулга, бат бөх чанар, найдвартай байдал болон (үйлдвэрлэлийн хиймэл оюун ухааны хувьд) үнэн зөв байдал юм. [1][2][3]

  • Бенчмаркууд тусалдаг ч хэрэглээний тохиолдлын үнэлгээ нь таныг шударга байлгадаг. [5]

  • Хэрэв танд баримтын найдвартай байдал хэрэгтэй бол үндэслэл + баталгаажуулалтын алхамууд + түдгэлзсэн байдлыг үнэлэхийг нэмж оруулна уу. [2]

  • Амьдралын мөчлөгийн үнэлгээ бол насанд хүрэгчдийн арга барил юм... хэдийгээр энэ нь тэргүүлэгчдийн самбарын дэлгэцийн агшингаас бага сонирхолтой байсан ч гэсэн. [1]


Лавлагаа

[1] NIST AI RMF 1.0 (NIST AI 100-1): Амьдралын мөчлөгийн туршид хиймэл оюун ухааны эрсдэлийг тодорхойлох, үнэлэх, удирдах практик хүрээ. дэлгэрэнгүй унших
[2] NIST Үүсгэх хиймэл оюун ухааны профайл (NIST AI 600-1): Үүсгэх хиймэл оюун ухааны системд хамаарах эрсдэлийн талаарх асуудлуудад чиглэсэн хиймэл оюун ухааны RMF-ийн хамтрагч профайл. дэлгэрэнгүй унших
[3] Гуо нар. (2017) - Орчин үеийн мэдрэлийн сүлжээний тохируулга: Орчин үеийн мэдрэлийн сүлжээг хэрхэн буруу тохируулж болох, тохируулгыг хэрхэн сайжруулж болохыг харуулсан үндсэн баримт бичиг. дэлгэрэнгүй унших
[4] Кох нар. (2021) - WILDS бенчмарк: Бодит ертөнцийн тархалтын өөрчлөлтийн үед загварын гүйцэтгэлийг шалгахад зориулагдсан бенчмаркийн багц. дэлгэрэнгүй унших
[5] Лян нар. (2023) - HELM (Хэлний загваруудын цогц үнэлгээ): Бодит буултуудыг илрүүлэхийн тулд хэлний загваруудыг хувилбарууд болон үзүүлэлтүүдийн дагуу үнэлэх хүрээ. дэлгэрэнгүй унших

Албан ёсны AI Assistant дэлгүүрээс хамгийн сүүлийн үеийн хиймэл оюун ухааныг олоорой

Бидний тухай

Блог руу буцах