Хиймэл оюун ухааны загварууд гэж юу вэ? Гүнзгий судлах.

Шөнийн 2 цагт хиймэл оюун ухааны загварууд гэж юу вэ , яагаад хүн бүр тэдний талаар ид шидийн шившлэг шиг ярьдаг юм бэ гэж асууж байсан уу? Үүнтэй адил. Энэ нийтлэл бол миний хэтэрхий албан бус, заримдаа нэг талыг барьсан гарын авлага бөгөөд таныг "аа, ямар ч ойлголтгүй"-ээс "оройн үдэшлэг дээр аюултай өөртөө итгэлтэй" болгоход туслах болно. Бид дараах зүйлсийг авч үзэх болно: тэд юу вэ, тэднийг үнэхээр хэрэгтэй (зүгээр л гялалзсан биш), тэднийг хэрхэн сургадаг, шийдэмгий бус байдалд автахгүй байх, мөн өвдсөний дараа л мэддэг хэдэн урхи.

Үүний дараа таны унших дуртай нийтлэлүүд:

🔗 Хиймэл оюун ухааны арбитраж гэж юу вэ: Энэ үгийн цаана байгаа үнэн
Хиймэл оюун ухааны арбитраж, түүний шуугиан болон бодит боломжуудыг тайлбарладаг.

🔗 Симбол хиймэл оюун ухаан гэж юу вэ: Таны мэдэх ёстой бүх зүйл
Симбол хиймэл оюун ухаан, түүний аргууд болон орчин үеийн хэрэглээг хамардаг.

🔗 Хиймэл оюун ухааны өгөгдөл хадгалах шаардлага: Таны мэдэх ёстой зүйлс
Хиймэл оюун ухааны өгөгдөл хадгалах хэрэгцээ болон практик асуудлуудыг задлан шинжилнэ.

Тэгэхээр... хиймэл оюун ухааны загварууд гэж үнэндээ юу вэ? 🧠

Хамгийн товчхондоо: хиймэл оюун ухааны загвар бол зүгээр л сурсан. Та түүнд оролт өгөхөд энэ нь гаралтыг гаргадаг. Гол нь энэ нь хэрхэн хийхийг . Үүнийг хангалттай давтахад таны тэнд байгааг ч мэдээгүй байсан хэв маягийг олж харж эхэлдэг.

Хэрэв та шугаман регресс, шийдвэрийн мод, мэдрэлийн сүлжээ, трансформатор, диффузийн загвар, эсвэл бүр k-хамгийн ойрын хөрш гэх мэт нэрсийг сонссон бол - тийм ээ, эдгээр нь бүгд нэг сэдэвтэй риффүүд юм: өгөгдөл оруулна, загвар зураглалыг сурна, үр дүн гарна. Өөр өөр хувцас, нэг шоу.

Тоглоомыг жинхэнэ хэрэгслээс юугаараа ялгадаг вэ ✅

Олон загварууд үзүүлбэр дээр гайхалтай харагддаг ч үйлдвэрлэл дээр бүтэлгүйтдэг. Үлдсэн загварууд нь ихэвчлэн насанд хүрэгчдийн шинж чанаруудын богино жагсаалтыг хуваалцдаг:

Ерөнхийлөн дүгнэх - Хэзээ ч харагдахгүй өгөгдлийг задралгүйгээр боловсруулдаг.
Найдвартай байдал - оролт хачин болоход зоос шидэх шиг ажилладаггүй.
Аюулгүй байдал ба хамгаалалт - тоглоход эсвэл буруу ашиглахад илүү хэцүү.
Тайлбарлах боломжтой байдал - үргэлж тодорхой байдаггүй ч ядаж алдааг нь засах боломжтой.
Нууцлал ба шударга байдал - өгөгдлийн хил хязгаарыг хүндэтгэдэг бөгөөд нэг талыг барьсан зүйлгүй.
Үр ашиг - бодит хэмжээнд ажиллуулахад хангалттай боломжийн үнэтэй.

Энэ бол үндсэндээ угаалгын жагсаалтын зохицуулагчид болон эрсдэлийн хүрээнүүд бөгөөд мөн хүчин төгөлдөр байдал, аюулгүй байдал, хариуцлага, ил тод байдал, шударга ёс гэх мэт хамгийн гайхалтай үр дүнгүүд юм. Гэхдээ үнэнийг хэлэхэд эдгээр нь тийм ч сайн зүйл биш; хэрэв хүмүүс таны системээс хамааралтай бол тэд ширээний гадас болно.

Эрүүл мэндийн хурдан шалгалт: загварууд ба алгоритмууд ба өгөгдөл 🤷

Гурван хэсэгт хуваагдсан нь энд байна:

Загвар - оролтыг гаралт болгон хувиргадаг сурсан "зүйл".
Алгоритм - загварыг сургах эсвэл ажиллуулах жор (градиентийн уналт, цацрагийн хайлт гэж бодоорой).
Өгөгдөл - загварт хэрхэн ажиллахыг заадаг түүхий жишээнүүд.

Бага зэрэг болхи зүйрлэл: өгөгдөл бол таны орц найрлага, алгоритм бол жор, загвар бол бялуу. Заримдаа энэ нь амттай байдаг бол заримдаа та хэтэрхий эрт шагайснаас болж голд нь живдэг.

Таны үнэхээр уулзах хиймэл оюун ухааны загваруудын гэр бүлүүд 🧩

Төгсгөлгүй ангилалууд байдаг ч практик жагсаалт энд байна:

Шугаман болон логистик загварууд - энгийн, хурдан, тайлбарлах боломжтой. Хүснэгтийн өгөгдлийн хувьд одоо хүртэл ялагдашгүй суурь шугамууд.
Мод болон тэдгээрийн хослолууд - шийдвэр гаргах моднууд нь "хэрэв-тэгвэл" хуваагддаг; ойг нэгтгэх эсвэл нэмэгдүүлэхэд тэдгээр нь цочирдом хүчтэй байдаг.
Эргэлт мэдрэлийн сүлжээ (CNN) - дүрс/видео таних гол тулгуур. Шүүлтүүрүүд → ирмэгүүд → дүрсүүд → объектууд.
Дарааллын загварууд: RNN ба трансформаторууд - текст, яриа, уургууд, кодын хувьд. Трансформаторуудын өөртөө анхаарал хандуулах нь тоглоомын дүрмийг өөрчилсөн [3].
Диффузийн загварууд - үүсгэгч, санамсаргүй шуугианыг алхам алхмаар уялдаа холбоотой дүрс болгон хувиргах [4].
Графын мэдрэлийн сүлжээ (GNNs) - сүлжээ болон харилцаанд зориулагдсан: молекулууд, нийгмийн графикууд, луйврын цагиргууд.
Баяжуулах сургалт (RL) - шагналыг оновчтой болгох туршилт ба алдааны агентууд. Робот техник, тоглоом, дараалсан шийдвэрүүдийн талаар бод.
Хуучин найдвартай мэдээлэл: kNN, Naive Bayes - өчигдөр хариулт хэрэгтэй үед, ялангуяа мессеж бичихэд зориулсан хурдан суурь мэдээлэл .

Хажуугийн тэмдэглэл: хүснэгтийн өгөгдөл дээр хэт төвөгтэй болгож болохгүй. Логистик регресс эсвэл нэмэгдсэн моднууд нь ихэвчлэн гүн торыг хаадаг. Трансформаторууд сайн байдаг, гэхдээ хаа сайгүй байдаггүй.

Бэлтгэл ажил ямархуу харагдаж байна вэ 🔧

Орчин үеийн ихэнх загварууд нь алдагдлын функцийг градиентийн бууралтын ямар нэгэн хэлбэрээр багасгах замаар суралцдаг . Буцах тархалт нь залруулгыг арагш түлхдэг тул параметр бүр хэрхэн хөдлөхийг мэддэг. Эмх замбараагүй байдалд орохгүйн тулд эрт зогсоох, тогтмолжуулах эсвэл ухаалаг оновчлогчид гэх мэт аргуудыг нэмж оруулдаг.

Ширээн дээрээ бичлэг хийх нь зүйтэй бодит байдлын шалгалтууд:

Өгөгдлийн чанар > загварын сонголт. Үнэхээр.
Үргэлж энгийн зүйлээр суурь шугамыг зур. Хэрэв шугаман загвар нь хүчин чадалтай бол таны өгөгдлийн дамжуулах хоолой ч бас хүчин чадалтай байх магадлалтай.
Баталгаажуулалтыг ажиглаарай. Хэрэв сургалтын алдагдал буурсан ч баталгаажуулалтын алдагдал нэмэгдвэл - сайн уу, хэт тохируулга хийгээрэй.

Загваруудыг үнэлэх нь: нарийвчлал гэдэг нь оршдог 📏

Нарийвчлал нь сайхан сонсогдож байгаа ч энэ нь аймшигтай ганц тоо юм. Таны даалгавраас хамааран:

Нарийвчлал - Та эерэг гэж хэлэхдээ хэр олон удаа зөв байдаг вэ?
Санаж байна уу - бүх бодит эерэг талуудаас та хэдийг нь олсон бэ?
F1 - нарийвчлал болон санах ойг тэнцвэржүүлдэг.
PR муруй - ялангуяа тэнцвэргүй өгөгдөл дээр ROC-оос хамаагүй илүү шударга байдаг [5].

Нэмэлт: тохируулгыг (магадлал ямар нэгэн утгатай юу?) болон шилжилтийг (оролтын өгөгдөл чинь хөл доор чинь шилжиж байна уу?) шалгана уу. "Маш сайн" загвар ч гэсэн хуучирдаг.

Засаглал, эрсдэл, замын хөдөлгөөний дүрэм 🧭

Таны загвар хүмүүст хүрсэн л бол нийцэл чухал юм. Хоёр том зангуу:

NIST-ийн AI RMF - сайн дурын боловч практик, амьдралын мөчлөгийн алхмууд (удирдах, зураглах, хэмжих, удирдах) болон найдвартай байдлын багцуудтай [1].
Европын Холбооны хиймэл оюун ухааны тухай хууль - эрсдэлд суурилсан зохицуулалт, 2024 оны 7-р сараас эхлэн хуульчлагдсан бөгөөд өндөр эрсдэлтэй системүүд болон зарим ерөнхий зориулалттай загваруудад хатуу үүрэг ногдуулдаг [2].

Прагматик гол санаа: юу бүтээснээ, хэрхэн туршиж үзсэнээ, ямар эрсдэл байгааг шалгаснаа баримтжуулна. Шөнө дундын яаралтай тусламжийн дуудлагаас хожимдохоос сэргийлнэ.

Ухаан алдахгүйгээр загвараа сонгох 🧭➡️

Дахин давтагдах боломжтой үйл явц:

Шийдвэрийг тодорхойл - сайн алдаа ба муу алдаа гэж юу вэ?
Аудитын өгөгдөл - хэмжээ, тэнцвэр, цэвэр байдал.
Хязгаарлалтуудыг тогтоох - тайлбарлах боломж, хоцрогдол, төсөв.
Суурь шугамуудыг ажиллуулах - шугаман/логистик эсвэл жижиг модоор эхлэх.
Ухаалаг давталт - функцуудыг нэмж, тохируулж, дараа нь тогтвортой байдалд хүрвэл гэр бүлүүдийг соль.

Уйтгартай ч энд уйтгартай байх нь сайхан.

Харьцуулсан агшин зураг 📋

Загварын төрөл	Үзэгчид	Үнэтэй	Яагаад ажилладаг вэ
Шугаман ба Логистик	шинжээчид, эрдэмтэд	бага-дунд	тайлбарлах боломжтой, хурдан, хүснэгтийн хүч чадал
Шийдвэрийн мод	холимог багууд	намхан	хүний унших боломжтой хуваалтууд, шугаман бус боловсруулалт
Санамсаргүй ой	бүтээгдэхүүний багууд	дунд зэргийн	чуулга нь дисперсийг бууруулдаг, хүчтэй ерөнхий үзэлтнүүд
Градиентаар сайжруулсан моднууд	өгөгдлийн эрдэмтэд	дунд зэргийн	Хүснэгт дээрх SOTA, хүчтэй, замбараагүй шинж чанаруудтай
CNN-үүд	алсын хараатай хүмүүс	дунд-өндөр	мушгиралт → орон зайн шатлал
Трансформерууд	NLP + олон төрлийн	өндөр	Өөртөө анхаарал хандуулах нь гайхалтай хэмжүүртэй [3]
Диффузийн загварууд	бүтээлч багууд	өндөр	Дуу чимээг бууруулах нь генератив ид шидийг бий болгодог [4]
GNN-үүд	графикийн нердүүд	дунд-өндөр	мессеж дамжуулах нь харилцааг кодлодог
kNN / Найв Бэйс	яарч буй хакерууд	маш бага	энгийн суурь шугамууд, шуурхай байршуулалт
Бэхжүүлэх сургалт	судалгаа ихтэй	дунд-өндөр	дараалсан үйлдлүүдийг оновчтой болгодог боловч номхруулахад илүү хэцүү

Практик дахь "мэргэжлүүд" 🧪

Зураг → CNN-үүд орон нутгийн хэв маягийг илүү том хэв маягт нэгтгэснээрээ онцгой амжилт гаргадаг.
Хэл → Өөртөө анхаарал хандуулсан Трансформерууд урт хугацааны нөхцөл байдлыг зохицуулдаг [3].
Графикууд → Холболт чухал үед GNN-үүд гялалздаг.
Үүсгэх орчин → Диффузийн загварууд, шаталсан шуугиангүйжүүлэлт [4].

Өгөгдөл: чимээгүй MVP 🧰

Загварууд муу өгөгдлийг хадгалж чадахгүй. Үндсэн ойлголтууд:

Өгөгдлийн санг зөв хуваах (алдагдал гарахгүй, цагийг хүндэтгэх).
Тэнцвэргүй байдлыг зохицуулах (дахин дээж авах, жин, босго).
Инженерийн онцлогуудыг сайтар нягталж үздэг - гүн гүнзгий загварууд ч ашиг тусаа өгдөг.
Эрүүл мэндийн хувьд хөндлөн баталгаажуулалт хийх.

Өөрийгөө хууралгүйгээр амжилтыг хэмжих нь 🎯

Хэмжүүрүүдийг бодит зардалтай тохируулна уу. Жишээ нь: дэмжлэгийн тасалбарын ангилалт.

Буцаан татах нь яаралтай тасалбараар баривчлах түвшинг нэмэгдүүлдэг.
Нарийвчлал нь агентуудыг чимээ шуугианд живэхээс сэргийлдэг.
F1 нь хоёуланг нь тэнцвэржүүлдэг.
Систем чимээгүйхэн ялзрахгүйн тулд шилжилт болон тохируулгыг хянана уу.

Эрсдэл, шударга ёс, баримт бичиг - эртхэн хий 📝

Баримт бичгийг хүнд суртал биш, харин даатгал гэж бодоорой. Нэг талыг барьсан шалгалт, найдвартай байдлын тест, өгөгдлийн эх сурвалж - үүнийг бичиж тэмдэглэ. Хиймэл оюун ухааны RMF [1] зэрэг хүрээ, Европын Холбооны Хиймэл оюун ухааны тухай хууль [2] зэрэг хуулиуд ямар ч байсан ширээний гадас болж байна.

Хурдан эхлэх замын зураг 🚀

Шийдвэр болон хэмжүүрийг зөв тооцоол.
Цэвэр өгөгдлийн багц цуглуул.
Шугаман/модтой суурь шугам.
Загварын зөв гэр бүл рүү очно уу.
Тохирох үзүүлэлтүүдээр үнэл.
Тээвэрлэлтийн өмнө эрсдэлийг баримтжуулна уу.

Түгээмэл асуултууд аянга цахилгаан тойрог⚡

Хүлээгээрэй, дахиад л хиймэл оюун ухааны загвар гэж юу вэ?
Оролт ба гаралтыг хооронд нь холбодог өгөгдөл дээр сургагдсан функц. Шидэт нь цээжлэх биш, ерөнхийлөн дүгнэх явдал юм.
Том загварууд үргэлж ялдаг уу?
Хүснэгт дээр биш - моднууд давамгайлсаар байна. Текст/зураг дээр тийм ээ, хэмжээ нь ихэвчлэн тусалдаг [3][4].
Тайлбарлах чадвар ба нарийвчлалын хоорондын ялгаа юу?
Заримдаа буулт хийх хэрэгтэй. Холимог стратеги ашигла.
Нарийн тохируулга хийх үү эсвэл шуурхай инженерчлэл хийх үү?
Төсөв болон ажлын цар хүрээнээс хамаарна. Хоёулаа өөрийн гэсэн байр суурьтай.

TL;DR 🌯

Хиймэл оюун ухааны загварууд = өгөгдлөөс суралцдаг функцууд. Тэдгээрийг ашигтай болгодог зүйл бол зөвхөн нарийвчлал төдийгүй итгэлцэл, эрсдэлийн удирдлага, сайтар бодож боловсруулсан байршуулалт юм. Энгийнээс эхэлж, чухал зүйлийг хэмжиж, муухай хэсгүүдийг нь баримтжуулаад (зөвхөн дараа нь) гоёл чимэглэл рүү шилж.

Хэрэв та зөвхөн нэг өгүүлбэрийг баримталбал: Хиймэл оюун ухааны загварууд нь сурсан функцууд, оновчлолоор сургагдсан, контекстэд тохирсон хэмжигдэхүүнээр шүүгдсэн, хашлагатайгаар байрлуулсан байдаг. Энэ бол бүхэл бүтэн асуудал юм.

Лавлагаа

NIST - Хиймэл оюун ухааны эрсдэлийн удирдлагын хүрээ (AI RMF 1.0)
NIST AI RMF 1.0 (PDF)
Европын Холбооны Хиймэл Оюун Ухааны тухай хууль - Албан ёсны сэтгүүл (2024/1689, 2024 оны 7-р сарын 12)
EUR-Lex: Хиймэл Оюун Ухааны тухай хууль (Албан ёсны PDF)
Трансформерууд / Өөртөө анхаарал хандуулах нь - Васвани нар, Анхаарал бол танд хэрэгтэй бүх зүйл (2017).
arXiv:1706.03762 (PDF)
Диффузийн загварууд - Хо, Жайн, Аббил, Дуу чимээг бууруулах диффузийн магадлалын загварууд (2020).
arXiv:2006.11239 (PDF)
Тэнцвэргүй байдлын талаарх PR ба ROC-ийн харьцуулалт - Сайто ба Ремсмейер, PLOS ONE (2015).
DOI: 10.1371/journal.pone.0118432

Албан ёсны хиймэл оюун ухааны туслах дэлгүүрээс хамгийн сүүлийн үеийн хиймэл оюун ухааныг олоорой

Бидний тухай

Блог руу буцах