AI дахь мэдрэлийн сүлжээ гэж юу вэ?

AI дахь мэдрэлийн сүлжээ гэж юу вэ?

Мэдрэлийн сүлжээ нь нууцлагдмал сонсогддог. Хэрэв та хиймэл оюун ухаан дахь мэдрэлийн сүлжээ гэж юу вэ гэж бодож байсан бол? Мөн энэ нь зүгээр л гоёмсог малгайтай математик юм уу, та зөв газартаа байна. Бид үүнийг практик болгож, жижиг тойрог замд цацна, тийм ээ - цөөн хэдэн эможи. Та эдгээр системүүд гэж юу болох, яагаад ажилладаг, хаана бүтэлгүйтдэг, тэдгээрийн талаар гар даллахгүйгээр хэрхэн ярихыг мэдэж байх болно.

Үүний дараа унших дуртай нийтлэлүүд:

🔗 AI хазайлт гэж юу вэ
Шударга байдлыг хангахын тулд AI систем, стратеги дахь гажуудлыг ойлгох.

🔗 Урьдчилан таамаглах хиймэл оюун ухаан гэж юу вэ
Урьдчилан таамаглахуйц хиймэл оюун ухаан ирээдүйн үр дүнг урьдчилан таамаглахад хэв маягийг хэрхэн ашигладаг вэ?

🔗 AI дасгалжуулагч гэж юу вэ
AI-г сургадаг мэргэжилтнүүдийн үүрэг, хариуцлагыг судлах.

🔗 AI дахь компьютерийн хараа гэж юу вэ
AI нь компьютерийн хараагаар дамжуулан харааны өгөгдлийг хэрхэн тайлбарлаж, дүн шинжилгээ хийдэг.


AI дахь мэдрэлийн сүлжээ гэж юу вэ? 10 секундын хариулт ⏱️

Мэдрэлийн сүлжээ нь тоонуудыг урагшлуулж, сургалтын явцад холболтын хүчийг тохируулж, өгөгдөл дэх хэв маягийг аажмаар сурдаг нейрон гэж нэрлэгддэг энгийн тооцооллын нэгжүүдийн стек юм. гүнзгий суралцахыг сонсоход энэ нь ихэвчлэн олон давхарласан давхаргууд бүхий мэдрэлийн сүлжээ бөгөөд та тэдгээрийг гараар кодлохын оронд автоматаар суралцах боломжуудыг хэлнэ. Өөрөөр хэлбэл: маш олон жижиг математикийн хэсгүүдийг ухаалаг зохион байгуулж, ашиг тустай болтол өгөгдөл дээр сургасан [1].


Мэдрэлийн сүлжээг юу ашигтай болгодог вэ? ✅

  • Төлөөлөх чадвар : Зөв бүтэц, хэмжээтэйгээр сүлжээнүүд нь маш нарийн төвөгтэй функцуудыг ойролцоолуулж чаддаг (Бүх нийтийн ойролцоолсон теоремыг үзнэ үү) [4].

  • Төгсгөлд суралцах : Загвар нь гар аргаар хийх боломжуудын оронд тэдгээрийг олж илрүүлдэг [1].

  • Дүгнэлт : Зохицуулалт сайтай сүлжээ нь зүгээр л цээжилдэггүй, шинэ, үл үзэгдэх өгөгдөл дээр ажилладаг [1].

  • Өргөтгөх чадвар : Том өгөгдлийн багц ба том загварууд нь ихэвчлэн үр дүнгээ сайжруулсаар байдаг... тооцоолол, өгөгдлийн чанар [1] зэрэг практик хязгаар хүртэл.

  • Шилжүүлэх чадвар : Нэг даалгавраар сурсан шинж чанарууд нь нөгөөд нь тусалж чадна (суралцах, нарийн тааруулах) [1].

Бяцхан талбарын тэмдэглэл (жишээ хувилбар): Бүтээгдэхүүний ангилалын жижиг баг нь гараар бүтээгдсэн функцуудыг авсаархан CNN-д сольж, энгийн өргөтгөлүүдийг (хэвлэх/тайрах) нэмж, баталгаажуулалтын алдаа буурахыг ажигладаг - энэ нь сүлжээ нь "ид шидтэй" учраас биш, харин илүү ашигтай функцуудыг пикселээс шууд сурсан учраас.


"AI дахь мэдрэлийн сүлжээ гэж юу вэ?" энгийн англи хэлээр, бүдүүлэг зүйрлэлээр 🍞

Талх нарийн боовны шугамыг дүрсэл. Найрлага нь орж, ажилчид жорыг өөрчилж, амт шалгагчид гомдоллож, багийнхан жороо дахин шинэчилдэг. Сүлжээнд оролтууд давхаргуудаар урсаж, алдагдлын функц нь гаралтыг үнэлж, дараагийн удаа илүү сайн болгохын тулд градиентууд нь жинг нухдаг. Зүйрлэлээр төгс биш - талхыг ялгах боломжгүй - гэхдээ энэ нь наалддаг [1].


Мэдрэлийн сүлжээний анатоми 🧩

  • Нейрон : Жинлэсэн нийлбэр ба идэвхжүүлэх функцийг ашигладаг жижиг тооны машинууд.

  • Жин ба хазайлт : Дохио хэрхэн нийлдэгийг тодорхойлдог тохируулгатай товчлуурууд.

  • Давхаргууд : Оролтын давхарга нь өгөгдлийг хүлээн авдаг, далд давхарга нь түүнийг хувиргадаг, гаралтын давхарга нь таамаглал гаргадаг.

  • Идэвхжүүлэх функцууд : ReLU, sigmoid, tanh, softmax гэх мэт шугаман бус эргэлтүүд нь суралцах уян хатан болгодог.

  • Алдагдлын функц : Урьдчилан таамаглал хэр буруу болохыг харуулсан оноо (ангиллыг хөндлөн энтропи, регрессийн хувьд MSE).

  • Optimizer : SGD эсвэл Адам зэрэг алгоритмууд жинг шинэчлэхийн тулд градиент ашигладаг.

  • Тогтмол байдал : Загварыг хэт тааруулахгүйн тулд сургуулиа орхих, жин хасах гэх мэт аргууд.

Хэрэв та албан ёсны эмчилгээ хийлгэхийг хүсч байгаа бол (гэхдээ унших боломжтой) нээлттэй сурах бичиг Гүнзгий суралцах нь математикийн үндэс, оновчлол, ерөнхий ойлголтыг бүрэн багтаасан болно [1].


Идэвхжүүлэх функцууд, товч боловч тустай ⚡

  • ReLU : Сөрөг бол тэг, эерэг бол шугаман. Энгийн, хурдан, үр дүнтэй.

  • Sigmoid : 0-ээс 1-ийн хоорондох утгыг дардаг - ашигтай боловч ханаж чаддаг.

  • Танх : Сигмоид шиг боловч тэг орчим тэгш хэмтэй.

  • Softmax : Ангиудын түүхий оноог магадлал болгон хувиргадаг.

Та муруй хэлбэр бүрийг цээжлэх шаардлагагүй - зүгээр л тохирол болон нийтлэг өгөгдмөлүүдийг мэдэхэд л хангалттай [1, 2].


Сурах нь үнэндээ хэрхэн болдог вэ: арын тулгуур, гэхдээ аймшигтай биш 🔁

  1. Урагшаа дамжуулалт : Өгөгдөл нь урьдчилан таамаглахын тулд давхаргаар дамждаг.

  2. Тооцоолох алдагдал : Таамаглалыг үнэнтэй харьцуулах.

  3. Буцах тархалт : Гинжин дүрмийг ашиглан жин тус бүрийн алдагдлыг градиентээр тооцоол.

  4. Шинэчлэлт : Optimizer жинг бага зэрэг өөрчилдөг.

  5. Давтах : Олон эрин үе. Загвар нь аажмаар суралцдаг.

Визуал болон кодын хавсаргасан тайлбар бүхий практик зөн совингийн хувьд арын тулгуур болон оновчлолын талаархи сонгодог CS231n тэмдэглэлийг үзнэ үү [2].


Мэдрэлийн сүлжээний үндсэн бүлгүүдийг нэг дороос харвал 🏡

  • Дамжуулах сүлжээ (MLPs) : Хамгийн энгийн төрөл. Өгөгдөл зөвхөн урагшилна.

  • Convolutional Neural Networks (CNNs) : Ирмэг, бүтэц, хэлбэрийг илрүүлдэг орон зайн шүүлтүүрийн ачаар зураг авахад тохиромжтой [2].

  • Давтагдах мэдрэлийн сүлжээ (RNN) ба хувилбарууд : Текст эсвэл цагийн цуваа зэрэг дараалалд зориулж дарааллын мэдрэмжийг хадгалан бүтээгдсэн [1].

  • Трансформаторууд : Байрлал хоорондын харилцааг нэг дор загварчлахад анхаарлаа хандуулаарай; хэл болон түүнээс цааш давамгайлсан [3].

  • График мэдрэлийн сүлжээ (GNNs) : Графикийн зангилаа ба ирмэг дээр ажиллах - молекул, нийгмийн сүлжээ, зөвлөмж [1].

  • Autoencoders & VAEs : Шахсан дүрслэлд суралцаж, өөрчлөлтүүдийг үүсгэнэ [1].

  • Генератив загварууд : GAN-аас эхлээд зураг, аудио, тэр ч байтугай код хийхэд ашигладаг тархалтын загвар хүртэл.

CS231n тэмдэглэлүүд нь ялангуяа CNN-д ээлтэй байдаг бол Transformer цаас нь анхаарлын төвд суурилсан загваруудын гол эх сурвалж болдог [2, 3].


Харьцуулах хүснэгт: нийтлэг мэдрэлийн сүлжээний төрлүүд, тэдгээр нь хэнд зориулагдсан, өртөг өндөртэй, яагаад ажилладаг вэ 📊

Хэрэгсэл / Төрөл Үзэгчид Үнэтэй Яагаад ажилладаг вэ
Дамжуулах (MLP) Эхлэгчид, шинжээчид Бага-дунд Энгийн, уян хатан, зохистой суурь үзүүлэлтүүд
CNN Алсын хараатай багууд Дунд зэрэг Орон нутгийн хэв маяг + параметр хуваалцах
RNN / LSTM / GRU Ард түмэн Дунд зэрэг Түр зуурын санах ой нь... дарааллыг тогтооно
Трансформатор NLP, multimodal Дунд зэргийн өндөр Холбогдох харилцаанд анхаарлаа хандуулдаг
GNN Эрдэмтэд ээ Дунд зэрэг Графикаар дамжуулж буй мессеж нь бүтцийг харуулдаг
Автомат кодлогч / VAE Судлаачид Бага-дунд Шахсан дүрслэлийг сурдаг
GAN / тархалт Бүтээлч лаборатори Дунд зэргийн өндөр Эсэргүүцсэн эсвэл давтагдах ид шид

Тайлбар: үнэ нь тооцоолол, цаг хугацаатай холбоотой; таны миль харилцан адилгүй байна. Ганц хоёр эс зориудаар чатладаг.


"AI дахь мэдрэлийн сүлжээ гэж юу вэ?" сонгодог ML алгоритмуудын эсрэг ⚖️

  • Онцлог инженерчлэл : Сонгодог ML нь ихэвчлэн гарын авлагын онцлогт тулгуурладаг. Мэдрэлийн тор нь функцуудыг автоматаар сурдаг нь нарийн төвөгтэй өгөгдлийн хувьд том ялалт юм [1].

  • Өгөгдлийн өлсгөлөн : Сүлжээ нь ихэвчлэн илүү их өгөгдөлтэй байдаг; жижиг өгөгдөл нь энгийн загваруудыг илүүд үздэг [1].

  • Тооцоолол : Сүлжээ нь GPU гэх мэт хурдасгуурт дуртай.

  • Гүйцэтгэлийн дээд хязгаар : Бүтэцгүй өгөгдлийн хувьд (зураг, аудио, текст) гүн сүлжээ давамгайлах хандлагатай байдаг [1, 2].


Практикт хэрэгждэг сургалтын ажлын урсгал 🛠️

  1. Зорилгоо тодорхойлох : Ангилал, регресс, эрэмбэлэх, үүсгэх - тохирох алдагдлыг сонгох.

  2. Өгөгдлийн маргаан : Галт тэрэг/баталгаажуулалт/тест гэж хуваана. Онцлогуудыг хэвийн болгох. Тэнцвэрийн ангиуд. Зургийн хувьд эргүүлэх, тайрах, жижиг чимээ шуугиан зэрэг томруулалтыг анхаарч үзээрэй.

  3. Архитектурын сонголт : Энгийнээр эхэл. Зөвхөн шаардлагатай үед хүчин чадлыг нэмнэ.

  4. Сургалтын давталт : Өгөгдлийг багцлах. Урагшаа дамжуулалт. Алдагдлыг тооцоол. Арын тулгуур. Шинэчлэх. Бүртгэлийн хэмжүүр.

  5. Тогтмол болгох : Сургуулиа орхих, жин хасах, эрт зогсоох.

  6. Үнэлгээ : Гиперпараметрийн баталгаажуулалтын багцыг ашиглана уу. Эцсийн шалгалтанд зориулж тестийн багцыг барина уу.

  7. Болгоомжтой тээвэрлэх : Зөрчлийг хянах, хазайлтыг шалгах, буцаалтыг төлөвлөх.

Хатуу онолтой, кодчилсон хичээлүүдийн хувьд нээлттэй сурах бичиг болон CS231n тэмдэглэл нь найдвартай зангуу юм [1, 2].


Хэт зохицох, ерөнхийд нь дүгнэх болон бусад гремлинууд 👀

  • Хэт зохицох : Загвар нь бэлтгэл сургуулилт хийх сонирхолтой зүйлсийг цээжилдэг. Илүү их өгөгдөл, илүү хүчтэй зохицуулалт эсвэл энгийн архитектурын тусламжтайгаар засаарай.

  • Тохиромжгүй байдал : Загвар нь хэтэрхий энгийн эсвэл сургалтанд хэт ичимхий байна. Хүчин чадлыг нэмэгдүүлэх эсвэл удаан сургах.

  • Өгөгдлийн алдагдлыг : Туршилтын багцын мэдээлэл сургалт руу сэмхэн ордог. Хуваалтаа гурав дахин шалгана уу.

  • Шалгалт тааруу : Өөртөө итгэлтэй мөртлөө буруу загвар нь аюултай. Шалгалт тохируулга эсвэл өөр жингийн алдагдалыг анхаарч үзээрэй.

  • Түгээлтийн шилжилт : Бодит ертөнц дэх өгөгдөл шилжих. Хянаж, дасан зохицох.

Дүгнэлт ба зохицуулалтын онолын хувьд стандарт эшлэлийг [1, 2] ашиглана уу.


Аюулгүй байдал, тайлбарлах боломжтой, хариуцлагатай байршуулалт 🧭

Мэдрэлийн сүлжээ нь өндөр эрсдэлтэй шийдвэр гаргах боломжтой. Тэд тэргүүлэгчдийн самбарт сайн тоглодог нь хангалтгүй. Танд амьдралын мөчлөгийн туршид засаглал, хэмжилт, нөлөөллийг бууруулах алхмууд хэрэгтэй. NIST AI Эрсдэлийн удирдлагын тогтолцоо нь УДИРДАХ, ГАЗРЫН ЗУРГИЙГ АВАХ, ХЭМЖҮҮЛЭХ, УДИРДАХ зэрэг бөгөөд багуудад эрсдэлийн удирдлагыг дизайн, ашиглалтад оруулахад туслах болно [5].

Хэд хэдэн хурдан нудрах:

  • Хязгаарлалтын шалгалт : Тохиромжтой, хууль ёсны тохиолдолд хүн ам зүйн зүсмэлүүдийг үнэл.

  • Тайлбарлах чадвар : Үзэсгэлэнт байдал эсвэл онцлог шинж чанар зэрэг техникийг ашигла. Тэд төгс бус боловч ашигтай байдаг.

  • Хяналт : Гэнэтийн хэмжигдэхүүн уналт эсвэл өгөгдлийн шилжилтийн талаар сэрэмжлүүлэг тохируулна уу.

  • Хүний хяналт : Хүнд нөлөөлөл ихтэй шийдвэр гаргахад хүмүүсийг хяналтанд байлга. Ямар ч баатарлаг зүйл байхгүй, зөвхөн эрүүл ахуй.


Таны нууцаар асуудаг байнга асуудаг асуултууд 🙋

Мэдрэлийн сүлжээ нь үндсэндээ тархи мөн үү?

Тархинаас өдөөгдсөн, тийм ээ, гэхдээ хялбаршуулсан. Сүлжээний мэдрэлийн эсүүд нь математикийн функцууд юм; биологийн мэдрэлийн эсүүд нь нарийн төвөгтэй динамик бүхий амьд эсүүд юм. Ижил төстэй чичиргээ, тэс өөр физик [1].

Надад хэдэн давхарга хэрэгтэй вэ?

Жижигээс эхэл. Хэрэв та тохирохгүй бол өргөн эсвэл гүнийг нэмнэ үү. Хэрэв та хэт их ачаалалтай байгаа бол хүчин чадлыг тогтмолжуулж эсвэл багасга. Ямар ч ид шидийн тоо байхгүй; Баталгаажуулах муруй ба тэвчээр л байдаг [1].

Надад үргэлж GPU хэрэгтэй юу?

Үргэлж биш. Даруухан өгөгдөл дээр суурилсан жижиг загварууд нь CPU дээр ажиллах боломжтой боловч зураг, том текст загвар эсвэл том өгөгдлийн багцын хувьд хурдасгуур нь олон тонн цаг хэмнэдэг [1].

Хүмүүс яагаад анхаарал хүчтэй гэж хэлдэг вэ?

Анхаарал татах нь загвар өмсөгчдөд дарааллаар нь заахгүйгээр оролтын хамгийн хамааралтай хэсгүүдэд анхаарлаа төвлөрүүлэх боломжийг олгодог. Энэ нь хэл яриа болон олон талт даалгаврын хувьд том асуудал болох дэлхийн харилцааг дүрсэлдэг [3].

"AI дахь мэдрэлийн сүлжээ гэж юу вэ?" "Гүнзгий суралцах" гэж юу вэ?

Гүнзгий суралцах нь гүн мэдрэлийн сүлжээг ашигладаг өргөн хүрээний арга юм. AI дахь мэдрэлийн сүлжээ гэж юу вэ ? гол дүрийн талаар асуухтай адил; гүн гүнзгий суралцах нь бүхэл бүтэн кино [1].


Бодит, бага зэрэг санал бодолтой зөвлөмжүүд 💡

  • энгийн суурь үзүүлэлтүүдийг илүүд үзээрэй . Жижиг олон давхаргат перцептрон хүртэл өгөгдөл сурах боломжтой эсэхийг хэлж чадна.

  • Өгөгдлийн шугамаа давтагдах боломжтой байлгах . Хэрэв та үүнийг дахин ажиллуулж чадахгүй бол та үүнд итгэж чадахгүй.

  • Сурах түвшин нь таны бодож байгаагаас илүү чухал юм. Хуваарь гаргаж үзээрэй. Халалт нь тусалж чадна.

  • Багцын хэмжээг өөрчлөх боломжууд байдаг. Том багцууд нь градиентийг тогтворжуулдаг боловч өөрөөр ерөнхийлөж болно.

  • Андуурах үед алдагдлын муруй болон жингийн нормыг . Хариулт нь зохиол дээр хэр олон удаа байгааг та гайхах болно.

  • Баримт бичгийн таамаглал. Ирээдүй - та бүх зүйлийг мартдаг - хурдан [1, 2].


Гүн шумбах тойрог зам: өгөгдлийн үүрэг, эсвэл яагаад хог хаягдал байна гэдэг нь хог хаягдлаа гэсэн үг 🗑️➡️✨

Мэдрэлийн сүлжээ нь алдаатай өгөгдлийг ид шидийн аргаар засдаггүй. Хажуу шошго, тэмдэглэгээний алдаа эсвэл нарийн түүвэрлэлт бүгд загварт цуурайтах болно. Эрхлэх, аудит хийх, нэмэгдүүлэх. Хэрэв танд илүү их өгөгдөл эсвэл илүү сайн загвар хэрэгтэй эсэхээ мэдэхгүй байгаа бол хариулт нь ядаргаатай энгийн байдаг: хоёулаа - гэхдээ өгөгдлийн чанараас эхэл [1].


"AI дахь мэдрэлийн сүлжээ гэж юу вэ?" - Та дахин ашиглаж болох богино тодорхойлолтууд 🧾

  • Мэдрэлийн сүлжээ нь градиент дохио [1, 2] ашиглан жинг тохируулах замаар нарийн төвөгтэй хэв маягийг сурдаг давхаргат функцийн ойролцоологч юм.

  • Энэ нь алдагдлыг багасгахын тулд бэлтгэгдсэн дараалсан шугаман бус алхмуудаар орцыг гаралт болгон хувиргадаг систем юм [1].

  • Энэ нь зураг, текст, аудио гэх мэт бүтэцгүй оролтууд дээр хөгждөг уян хатан, өгөгдөлд шунасан загварчлалын арга юм [1, 2, 3].


Хэт удаан, уншаагүй ба эцсийн тайлбар 🎯

Хэрэв хэн нэгэн танаас хиймэл оюун ухаанд мэдрэлийн сүлжээ гэж юу вэ? Энэ бол дууны хазалт юм: мэдрэлийн сүлжээ нь өгөгдлийг алхам алхмаар хувиргадаг энгийн нэгжүүдийн стек бөгөөд алдагдлыг багасгах, градиентийг дагаж хувиргахад суралцдаг. Тэд томруулж, автоматаар онцлог шинж чанаруудыг сурч, маш нарийн төвөгтэй функцуудыг төлөөлж чаддаг тул хүчирхэг юм [1, 4]. Хэрэв та өгөгдлийн чанар, засаглал, хяналтыг үл тоомсорловол тэдгээр нь эрсдэлтэй байдаг [5]. Мөн тэд ид шид биш. Зүгээр л математик, тооцоолол, сайн инженерчлэл - бага зэрэг амттай.


Цааш унших, анхааралтай сонгосон (ишлэлгүй нэмэлт)


Лавлагаа

[1] Goodfellow, I., Bengio, Y., & Courville, A. Deep Learning . MIT хэвлэл. Үнэгүй онлайн хувилбар: дэлгэрэнгүй

[2] Стэнфорд CS231n. Харааны танилтад зориулсан эвдэрсэн мэдрэлийн сүлжээ (хичээлийн тэмдэглэл): дэлгэрэнгүй

[3] Vaswani, A., Shazeer, N., Parmar, N., et al. (2017). Анхаарал л танд хэрэгтэй . NeurIPS. arXiv: дэлгэрэнгүй уншина уу

[4] Cybenko, G. (1989). Сигмоид функцийн хэт байрлалаар ойртох . Удирдлага, дохио ба системийн математик , 2, 303–314. Спрингер: дэлгэрэнгүй уншина уу

[5] NIST. AI эрсдэлийн удирдлагын тогтолцоо (AI RMF) : дэлгэрэнгүй


Албан ёсны AI Assistant дэлгүүрээс хамгийн сүүлийн үеийн хиймэл оюун ухааныг олоорой

Бидний тухай

Блог руу буцах