тайлбарлаж болох хиймэл оюун ухаан гэж юу вэ?

Тайлбарлах боломжтой хиймэл оюун ухаан гэж юу вэ?

"Тайлбарлаг хиймэл оюун ухаан" гэдэг нь оройн хоолны үеэр сайхан сонсогддог хэллэгүүдийн нэг бөгөөд алгоритм эмнэлгийн онош тавих, зээлийг батлах эсвэл ачааг тэмдэглэх мөчид маш чухал болдог. Хэрэв та хэзээ нэгэн цагт "за, гэхдээ яагаад загвар үүнийг хийсэн юм бэ" гэж бодож байсан бол та аль хэдийн "Тайлбарлаг хиймэл оюун ухааны" хүрээнд орсон байна. Энэ санааг энгийн хэлээр тайлбарлая - ид шидгүй, зүгээр л аргууд, буултууд болон хэдэн хатуу үнэн.

Үүний дараа таны унших дуртай нийтлэлүүд:

🔗 Хиймэл оюун ухааны хэвийлт гэж юу вэ?
Хиймэл оюун ухааны гажуудал, түүний эх үүсвэр, нөлөөлөл, бууруулах стратегиудыг ойлгох.

🔗 Урьдчилан таамаглах хиймэл оюун ухаан гэж юу вэ?
Урьдчилан таамаглах хиймэл оюун ухаан, нийтлэг хэрэглээ, ашиг тус, практик хязгаарлалтуудыг судлаарай.

🔗 Хүн дүрст робот хиймэл оюун ухаан гэж юу вэ?
Хиймэл оюун ухаан хүн дүрст роботуудыг хэрхэн хүчирхэгжүүлдэг, чадварууд, жишээнүүд болон сорилтуудыг мэдэж аваарай.

🔗 Хиймэл оюун ухааны сургагч гэж юу вэ?
Хиймэл оюун ухааны сургагч багш нар юу хийдэг, шаардлагатай ур чадвар, ажил мэргэжлийн замналыг олж мэдээрэй.


Тайлбарлах боломжтой хиймэл оюун ухаан үнэндээ юу гэсэн үг вэ

Тайлбарлах боломжтой хиймэл оюун ухаан гэдэг нь хиймэл оюун ухааны системийг зохион бүтээх, ашиглах практик бөгөөд ингэснээр тэдгээрийн гаралтыг зөвхөн математикийн шидтэнүүд төдийгүй шийдвэрт нөлөөлж буй эсвэл хариуцлага хүлээдэг хүмүүс ойлгож чадна. NIST үүнийг дөрвөн зарчимд хуваадаг: тайлбар өгөх , үзэгчдэд утга учиртай болгох тайлбарын нарийвчлалыг (загварт үнэнч байх), мэдлэгийн хязгаарыг (системийн мэддэг зүйлийг хэтрүүлж болохгүй) [1].

гүйцэтгэлийг алдагдуулахгүйгээр ашиглах боломжтой тайлбарыг өөрчлөөгүй


Яагаад тайлбарлах боломжтой хиймэл оюун ухаан таны бодож байгаагаас илүү чухал вэ 💡

  • Итгэлцэл ба үрчлэлт - Хүмүүс асууж, эргэлзэж, залруулж чадах системүүдийг хүлээн зөвшөөрдөг.

  • Эрсдэл ба аюулгүй байдал - Гадаргуугийн эвдрэлийн горимуудын тайлбарыг тэд таныг гайхшруулахаас өмнө тайлбарлана уу.

  • Зохицуулалтын хүлээлт - Европын Холбоонд хиймэл оюун ухааны тухай хууль нь тодорхой ил тод байдлын үүргийг тогтоосон байдаг - жишээлбэл, тодорхой нөхцөлд хүмүүст хиймэл оюун ухаантай харилцаж байгаа үед нь мэдэгдэх, хиймэл оюун ухаанаар үүсгэгдсэн эсвэл өөрчлөгдсөн контентыг зохих ёсоор шошголох [2].

Үнэнийг хэлэхэд гайхалтай хяналтын самбарууд нь тайлбар биш юм. Сайн тайлбар нь хүнд цаашид юу хийхээ шийдэхэд тусалдаг.


Тайлбарлах боломжтой хиймэл оюун ухааныг юу ашигтай болгодог вэ ✅

Та ямар нэгэн XAI аргыг үнэлэхдээ дараах зүйлийг асууна уу:

  1. Үнэнч байдал - Тайлбар нь загвар өмсөгчийн зан авирыг тусгасан уу эсвэл зүгээр л тайвшруулах түүхийг өгүүлж байна уу?

  2. Үзэгчдэд ашигтай байдал - Өгөгдлийн эрдэмтэд градиент хүсдэг; эмч нар эсрэг баримт эсвэл дүрмийг хүсдэг; үйлчлүүлэгчид энгийн хэлээр тайлбарласан шалтгаан болон дараагийн алхмуудыг хүсдэг.

  3. Тогтвортой байдал - Бага зэрэг оролтын өөрчлөлт нь түүхийг А-аас Я болгон өөрчлөх ёсгүй.

  4. Үйлдэл хийх чадвар - Хэрэв гаралт нь хүсээгүй бол юу өөрчлөгдөж болох байсан бэ?

  5. Тодорхой бус байдлын талаар шударга байх - Тайлбар нь хязгаарыг илчлэх ёстой болохоос биш тэдгээрийг будгаар будах ёсгүй.

  6. Хамрах хүрээний тодорхой байдал - Энэ нь нэг таамаглалын орон нутгийн загварын зан үйлийн талаарх дэлхийн

Хэрэв та зөвхөн нэг зүйлийг санаж байвал: хэрэгтэй тайлбар нь хэн нэгний шийдвэрийг өөрчилдөг, зөвхөн тэдний сэтгэл санааг биш.


Таны их сонсох гол ойлголтууд 🧩

  • Тайлбарлах чадвар ба тайлбарлах чадвар - Тайлбарлах чадвар: загвар нь уншихад хангалттай энгийн (жишээ нь, жижиг мод). Тайлбарлах чадвар: нарийн төвөгтэй загварыг уншигдахуйц болгохын тулд дээр нь арга нэмнэ үү.

  • Орон нутгийн болон дэлхийн - Орон нутгийн гэдэг нь нэг шийдвэрийг тайлбарладаг; дэлхийн гэдэг нь зан үйлийг ерөнхийд нь нэгтгэн дүгнэдэг.

  • Post-hoc ба intrinsic - Post-hoc нь сургагдсан хар хайрцгийг тайлбарладаг; intrinsic нь мөс чанараараа тайлбарлагдах загваруудыг ашигладаг.

Тийм ээ, эдгээр мөрүүд бүдгэрч байна. Зүгээр дээ; хэл хөгждөг; таны эрсдэлийн бүртгэл хөгждөггүй.


Алдартай тайлбарлаж болох хиймэл оюун ухааны аргууд - аялал 🎡

Музейн аудио хөтөч шиг боловч богинохон мэдрэмж төрүүлэм шуурганы аялал энд байна.

1) Нэмэлт шинж чанаруудын хамаарлууд

  • SHAP - Тоглоомын онолын санаануудаар дамжуулан тодорхой таамаглалд хувь нэмэр оруулдаг онцлог шинж чанар бүрийг оноодог. Тодорхой нэмэлт тайлбар болон загваруудын хоорондын нэгдмэл үзэл бодлоороо алдартай [3].

2) Орон нутгийн орлуулагч загварууд

  • LIME - Тайлбарлах ёстой тохиолдлын эргэн тойронд энгийн, орон нутгийн загварыг сургадаг. Ойролцоо чухал ач холбогдолтой функцуудын хурдан, хүнд ойлгомжтой хураангуй. Демо хувилбаруудад маш сайн, практикт ажиглах тогтвортой байдалд тустай [4].

3) Гүн торны градиент дээр суурилсан аргууд

  • Интеграцчилагдсан градиентууд - Суурь шугамаас градиентуудыг оролт руу нэгтгэснээр ач холбогдлыг тодорхойлдог; ихэвчлэн хараа болон текстэд ашиглагддаг. Ухаалаг аксиомууд; суурь шугам болон шуугиантай холбоотой болгоомжтой байх шаардлагатай [1].

4) Жишээн дээр суурилсан тайлбарууд

  • Эсрэг баримтууд - “Ямар бага өөрчлөлт үр дүнг өөрчлөх байсан бэ?” Шийдвэр гаргахад төгс тохиромжтой, учир нь энэ нь байгалийн жамаар хэрэгжих боломжтой - Y авахын тулд X-ийг хий [1].

5) Прототипүүд, дүрэм журам, хэсэгчилсэн хамаарал

  • Прототипүүд нь төлөөллийн жишээнүүдийг харуулдаг; дүрмүүд нь орлого > X ба түүх = цэвэр байвал батлах ; хэсэгчилсэн хамаарал нь тухайн хүрээний онцлог шинж чанарын дундаж нөлөөг харуулдаг. Энгийн санаанууд нь ихэвчлэн дутуу үнэлэгддэг.

6) Хэлний загваруудын хувьд

  • Токен/хамаарал нь хамаарал, авсан жишээ, бүтэцлэгдсэн үндэслэлийг хамардаг. Ердийн анхааруулгыг дагаад тустай: цэвэр дулааны зураглал нь учир шалтгааны үндэслэлийг баталгаажуулдаггүй [5].


Талбайгаас авсан хурдан (нийлмэл) тохиолдол 🧪

Дунд хэмжээний зээлдүүлэгч нь зээлийн шийдвэр гаргахдаа градиент нэмэгдүүлсэн загварыг илгээдэг. Орон нутгийн SHAP нь агентуудад сөрөг үр дүнг тайлбарлахад тусалдаг ("Өрийн орлого болон зээлийн сүүлийн үеийн ашиглалт нь гол хөдөлгөгч хүчин зүйл байсан.") [3]. Эсрэг баримтын давхарга нь боломжит нөөцийг санал болгодог ("Эргэлтийн ашиглалтыг ~10% -иар бууруулах эсвэл шийдвэрийг өөрчлөхийн тулд баталгаажсан хадгаламжид 1500 фунт стерлинг нэмэх.") [1]. Дотооддоо баг нь санамсаргүй байдлаар шалгах туршилтыг [5]. Ижил загвар, өөр өөр үзэгчдэд зориулсан өөр өөр тайлбар - үйлчлүүлэгчид, үйл ажиллагаа эрхлэгчид, аудиторууд.


Хачирхалтай хэсэг нь: тайлбар нь төөрөгдүүлж болзошгүй 🙃

Зарим онцлох аргууд нь сургагдсан загвар эсвэл өгөгдөлтэй холбоогүй байсан ч үнэмшилтэй харагддаг. Эрүүл мэндийн шалгалтаар тодорхой техникүүд үндсэн туршилтуудад унадаг нь буруу ойлголт төрүүлдэг болохыг харуулсан. Орчуулга: хөөрхөн зургууд нь цэвэр театр байж болно. Тайлбарлах аргууддаа баталгаажуулалтын тестүүдийг нэмж оруулаарай [5].

Мөн сийрэг ≠ шударга. Нэг өгүүлбэрт үндэслэсэн шалтгаан нь томоохон харилцан үйлчлэлийг нууж магадгүй юм. Тайлбар дахь бага зэргийн зөрчилдөөн нь бодит загварын тодорхойгүй байдлыг эсвэл зүгээр л чимээ шуугианыг илтгэж болно. Таны ажил бол аль нь аль нь болохыг хэлэх явдал юм.


Засаглал, бодлого, ил тод байдлын өсөн нэмэгдэж буй түвшин 🏛️

Бодлого боловсруулагчид нөхцөл байдалд тохирсон ил тод байдлыг хүлээж байна. Европын Холбоонд хиймэл оюун ухааны тухай хуульд тодорхой тохиолдолд хүмүүст хиймэл оюун ухаантай харьцах үед нь мэдэгдэх, хиймэл оюун ухаанаар үүсгэгдсэн эсвэл өөрчлөгдсөн контентыг зохих мэдэгдэл болон техникийн хэрэгслээр шошголох зэрэг үүргүүдийг тодорхой заасан байдаг бөгөөд эдгээр нь үл хамаарах зүйлс (жишээлбэл, хууль ёсны хэрэглээ эсвэл хамгаалагдсан илэрхийлэл)-д хамаарна [2]. Инженерийн тал дээр NIST нь багуудад хүмүүсийн бодитоор ашиглаж болох тайлбарыг боловсруулахад туслах зарчимд чиглэсэн удирдамжийг өгдөг [1].


Тайлбарлаж болох хиймэл оюун ухааны аргыг хэрхэн сонгох вэ - хурдан газрын зураг 🗺️

  1. Шийдвэрээс эхэл - Хэнд, ямар арга хэмжээ авахын тулд тайлбар хэрэгтэй вэ?

  2. Аргыг загвар болон орчинтой тохируулна уу

    • Харааны гүний тор эсвэл NLP-ийн градиент аргууд [1].

    • Онцлог шинж чанаруудын хамаарал шаардлагатай үед хүснэгтэн загваруудад SHAP эсвэл LIME ашиглах [3][4].

    • Үйлчлүүлэгчтэй тулгарсан залруулга болон давж заалдах гомдол гаргахын эсрэг баримтууд [1].

  3. Чанарын хаалгыг тохируулах - Үнэнч байдлын шалгалт, тогтвортой байдлын туршилт, хүний ​​​​давталт дахь тоймууд [5].

  4. Хэмжээний төлөвлөгөө - Тайлбарууд нь бүртгэгдэх, шалгах, аудит хийх боломжтой байх ёстой.

  5. Баримт бичгийн хязгаар - Төгс арга гэж байдаггүй; мэдэгдэж буй алдааны горимуудыг бичнэ үү.

Жижигхэн ч гэсэн - хэрэв та загваруудыг туршиж үздэг шигээ тайлбарыг туршиж чадахгүй бол танд тайлбар байхгүй, зүгээр л чичиргээ байж магадгүй юм.


Харьцуулсан хүснэгт - нийтлэг тайлбарлаж болох хиймэл оюун ухааны сонголтууд 🧮

Бага зэрэг санаатайгаар хачин жигтэй; бодит амьдрал замбараагүй.

Хэрэгсэл / Арга Шилдэг үзэгчид Үнэ Энэ нь яагаад тэдэнд үр дүнтэй байдаг вэ
ШАП Өгөгдлийн эрдэмтэд, аудиторууд Үнэгүй/нээлттэй Нэмэлт хамаарлууд - тууштай, харьцуулж болохуйц [3].
Лайм Бүтээгдэхүүний багууд, шинжээчид Үнэгүй/нээлттэй Хурдан орон нутгийн орлуулагчид; амархан идэж уудаг; заримдаа чимээ шуугиантай байдаг [4].
Интегралчилсан градиентууд Гүн сүлжээний ML инженерүүд Үнэгүй/нээлттэй Ухаалаг аксиомтой градиент дээр суурилсан атрибутууд [1].
Эсрэг баримтууд Эцсийн хэрэглэгчид, нийцэл, үйл ажиллагаа Холимог Юуг өөрчлөх ёстойг шууд хариулдаг; маш үр дүнтэй [1].
Дүрмийн жагсаалт / Моднууд Эрсдэлийн эзэд, менежерүүд Үнэгүй/нээлттэй Дотоод тайлбар хийх чадвар; дэлхийн хураангуй.
Хэсэгчилсэн хамаарал Загвар хөгжүүлэгчид, чанарын хяналт Үнэгүй/нээлттэй Хүрээ хоорондын дундаж эффектүүдийг дүрслэн харуулна.
Прототипүүд ба жишээнүүд Дизайнерууд, шүүмжлэгчид Үнэгүй/нээлттэй Бодит, хүнд ээлтэй жишээнүүд; ойлгомжтой.
Багаж хэрэгслийн тавцангууд Платформын багууд, засаглал Арилжааны Хяналт + тайлбар + аудит нэг дор.

Тийм ээ, эсүүд тэгш бус. Энэ бол амьдрал.


Үйлдвэрлэлд тайлбарлах боломжтой хиймэл оюун ухааны энгийн ажлын урсгал 🛠️

Алхам 1 - Асуултыг тодорхойл.
Хэний хэрэгцээ хамгийн чухал болохыг шийд. Өгөгдөл судлаачийн хувьд тайлбарлах чадвар нь үйлчлүүлэгчийн хувьд давж заалдах захидалтай адил биш юм.

2-р алхам - Арга зүйгээ нөхцөл байдлаас нь хамааруулан сонгоно уу.

  • Зээлийн хүснэгтэн эрсдэлийн загвар - орон нутгийн болон дэлхийн эрсдэлийн загварт SHAP-аас эхэлнэ; нөхөн төлбөрийн хувьд эсрэг баримтуудыг нэмнэ үү [3][1].

  • Алсын хараа ангилагч - Integrated Gradients эсвэл ижил төстэй хэрэгслийг ашиглах; соргог бэрхшээлээс зайлсхийхийн тулд эрүүл мэндийн шалгалтыг нэмээрэй [1][5].

Алхам 3 - Тайлбарыг баталгаажуулна уу.
Тайлбарын тогтвортой байдлын тест хийх; оролтыг өөрчлөх; чухал шинж чанарууд нь тухайн салбарын мэдлэгтэй тохирч байгаа эсэхийг шалгана уу. Хэрэв таны шилдэг шинж чанарууд давтан сургалт бүрт огцом хэлбэлзэж байвал түр зогсоо.

Алхам 4 - Тайлбарыг ашиглахад хялбар болго.
Хүснэгтүүдийн хамт энгийн хэл дээрх шалтгаануудыг оруулна уу. Дараагийн хамгийн сайн үйлдлүүдийг оруулна уу. Шаардлагатай үед үр дүнг эсэргүүцэх холбоосуудыг санал болгоно уу - энэ бол ил тод байдлын дүрмийн дэмжих зорилготой яг тэр зүйл юм [2].

5-р алхам - Хянаж, тэмдэглэ.
Тайлбарын тогтвортой байдлыг цаг хугацааны явцад хяна. Төөрөгдүүлсэн тайлбар нь эрсдэлийн дохио болохоос гоо сайхны алдаа биш юм.


Гүнзгий судлах 1: Практикт орон нутгийн болон дэлхийн тайлбарууд 🔍

  • Орон нутгийн шүүх нь мэдрэмтгий нөхцөл байдалд тэдний шийдвэр гаргасныг ойлгоход тусалдаг

  • Global нь танай багт загварын сурсан зан төлөв нь бодлого болон салбарын мэдлэгтэй нийцэж байгаа эсэхийг баталгаажуулахад тусалдаг.

Хоёуланг нь хий. Та үйлчилгээний үйл ажиллагаанд зориулж орон нутгийн хяналтыг эхлүүлж, дараа нь хэлбэлзэл болон шударга ёсны хяналтыг дэлхийн хэмжээнд нэмж болно.


Гүнзгий шумбалт 2: Эрх чөлөө болон давж заалдах гомдлын эсрэг баримтууд 🔄

Хүмүүс илүү сайн үр дүнд хүрэхийн тулд хамгийн бага өөрчлөлтийг мэдэхийг хүсдэг. Эсрэг баримтын тайлбарууд яг үүнийг хийдэг - эдгээр тодорхой хүчин зүйлсийг өөрчлөхөд үр дүн нь өөрчлөгддөг хэрэгжих боломж , шударга ёсыг хүндэтгэх ёстой . Хэн нэгэнд өөрчлөгдөшгүй шинж чанарыг өөрчлөхийг хэлэх нь төлөвлөгөө биш, энэ бол аюултай дохио юм.


Гүнзгий шумбалт 3: Эрүүл ахуйн шалгалтын ач холбогдол 🧪

Хэрэв та тод байдлын газрын зураг эсвэл градиент ашигладаг бол эрүүл мэндийн шалгалтыг ажиллуул. Зарим техникүүд нь загварын параметрүүдийг санамсаргүй байдлаар сонгох үед ч бараг ижил газрын зургийг гаргадаг - өөрөөр хэлбэл тэдгээр нь сурсан нотолгоог биш харин ирмэг болон бүтцийг тодруулж байж магадгүй юм. Гайхалтай дулааны газрын зураг, төөрөгдүүлсэн түүх. CI/CD-д автомат шалгалтыг бий болго [5].


Уулзалт бүрт байнга асуудаг асуултууд 🤓

А: Тайлбарлах боломжтой хиймэл оюун ухаан нь шударга ёстой адилхан уу?
харахад тусалдаг ; шударга ёс бол таны туршиж, хэрэгжүүлэх . Холбоотой, ижил биш.

А: Энгийн загварууд үргэлж илүү сайн байдаг уу?
А: Заримдаа. Гэхдээ энгийн бөгөөд буруу нь буруу хэвээр байна. Гүйцэтгэл болон засаглалын шаардлагыг хангасан хамгийн энгийн загварыг сонгоорой.

А: Тайлбарууд IP нууцлал алдагдуулах уу?
А: Тэд алдагдаж магадгүй. Үзэгчид болон эрсдэлээр дэлгэрэнгүй мэдээллийг тохируулна уу; юуг, яагаад задруулж байгаагаа баримтжуулна уу.

А: Бид зүгээр л онцлог шинж чанаруудын ач холбогдлыг харуулаад дууссан гэж хэлж болох уу?
А: Үгүй ээ. Ач холбогдолгүй эсвэл эх сурвалжгүй ач холбогдлын мөрүүд нь чимэглэл юм.


Хэтэрхий урт байна, хувилбар болон эцсийн тайлбарыг уншаагүй байна 🌯

Тайлбарлах боломжтой хиймэл оюун ухаан бол загварын зан төлөвийг түүнд найддаг хүмүүст ойлгомжтой, ашигтай болгох сахилга бат юм. Хамгийн сайн тайлбарууд нь үнэнч байдал, тогтвортой байдал, тодорхой үзэгчидтэй байдаг. SHAP, LIME, Интеграцчилагдсан градиент, эсрэг баримтууд гэх мэт аргууд нь тус бүр давуу талуудтай - тэдгээрийг зориудаар ашиглаж, сайтар туршиж, хүмүүсийн үйлдэж чадах хэлээр танилцуул. Мөн гялгар дүрслэл нь театр болж чадна гэдгийг санаарай; таны тайлбар нь загварын жинхэнэ зан төлөвийг тусгасан нотолгоог шаардах. Загварын амьдралын мөчлөгтөө тайлбарлах чадварыг бий болго - энэ нь гялгар нэмэлт биш, энэ нь таны хариуцлагатайгаар хэрхэн илгээх нэг хэсэг юм.

Үнэнийг хэлэхэд энэ нь загвар өмсөгчдөө дуу хоолойгоо өгөхтэй адил юм. Заримдаа бувтнадаг; заримдаа хэт тайлбарладаг; заримдаа таны сонсохыг хүссэн зүйлийг яг таг хэлдэг. Таны ажил бол түүнд зөв зүйлийг, зөв ​​хүнд, зөв ​​цагт нь хэлэхэд нь туслах явдал юм. Мөн нэг эсвэл хоёр сайн шошго оруулаарай. 🎯


Лавлагаа

[1] NIST IR 8312 - Тайлбарлаж болох хиймэл оюун ухааны дөрвөн зарчим . Үндэсний стандарт, технологийн хүрээлэн. дэлгэрэнгүй унших

[2] 2024/1689 дугаар дүрэм (ЕХ) - Хиймэл оюун ухааны тухай хууль (Албан ёсны сэтгүүл/EUR-Lex) . дэлгэрэнгүй унших

[3] Лундберг ба Ли (2017) - “Загварын таамаглалыг тайлбарлах нэгдсэн арга барил.” arXiv. дэлгэрэнгүй унших

[4] Рибейро, Сингх ба Гуестрин (2016) - “Би яагаад чамд итгэх ёстой вэ?” Аль ч ангилагчийн таамаглалыг тайлбарлах нь. arXiv. дэлгэрэнгүй унших

[5] Адебайо нар (2018) - “Аюулгүй байдлын газрын зургийн эрүүл ахуйн шалгалт.” NeurIPS (цаасан PDF). дэлгэрэнгүй унших

Албан ёсны хиймэл оюун ухааны туслах дэлгүүрээс хамгийн сүүлийн үеийн хиймэл оюун ухааныг олоорой

Бидний тухай

Блог руу буцах