үнэхээр яаж ажилладаг вэ? Сайн мэдээ. Бид үүнийг хөвсгөргүйгээр задалж, практик хэвээр үлдээж, товшилтыг бий болгодог цөөн хэдэн төгс бус зүйрлэлүүдийг шидэх болно. Хэрэв та зүгээр л гол зүйлийг хүсч байвал доорх нэг минутын хариулт руу очно уу; гэхдээ үнэнийг хэлэхэд гэрлийн чийдэн хаана асч байгааг нарийн ширийн зүйл нь 💡.
Үүний дараа унших дуртай нийтлэлүүд:
🔗 GPT нь юу гэсэн үг вэ?
GPT товчлол ба түүний утгыг товч тайлбарлах.
🔗 AI мэдээллээ хаанаас авдаг вэ
Сурах, сургах, асуултуудад хариулахад AI ашигладаг эх сурвалжууд.
🔗 AI-г бизнестээ хэрхэн оруулах вэ
AI-г үр дүнтэй нэгтгэх практик алхмууд, багаж хэрэгсэл, ажлын урсгалууд.
🔗 AI компанийг хэрхэн эхлүүлэх вэ
Санаанаас эхлүүлэх хүртэл: баталгаажуулалт, санхүүжилт, баг, гүйцэтгэл.
AI хэрхэн ажилладаг вэ? Нэг минутын хариулт ⏱️
AI нь таамаглал гаргах эсвэл контент үүсгэхийн тулд өгөгдлөөс хэв маягийг сурдаг - гараар бичсэн дүрэм шаардлагагүй. Систем жишээнүүдийг авч, алдагдлын функцээр хэр буруу болохыг хэмжиж, дотоод товчлуурууд параметрүүдээ алдаа гаргах бүрт бага зэрэг түлхэж өгдөг. Угаах, давтах, сайжруулах. Хангалттай мөчлөгтэй бол энэ нь ашигтай болно. Та и-мэйл ангилах, хавдар илрүүлэх, ширээний тоглоом тоглох, хайку бичих зэрэгтэй ижил түүхтэй. “Машины сургалт”-ыг энгийн хэлээр үндэслэхийн тулд IBM-ийн тойм нь баттай [1].
Орчин үеийн хиймэл оюун ухааны ихэнх нь машин сургалт юм. Энгийн хувилбар: өгөгдөлд оруулах, оролтоос гаралт хүртэлх зураглалыг сурч, дараа нь шинэ зүйлд нэгтгэх. Ид шид биш-математик, тооцоолол, хэрэв бид үнэнийг хэлвэл чимх урлаг.
"AI хэрхэн ажилладаг вэ?" ✅
Хүмүүс google-ээр асуувал AI хэрхэн ажилладаг вэ? , тэд ихэвчлэн хүсдэг:
-
Тэд итгэж болох дахин ашиглах боломжтой сэтгэцийн загвар
-
Сургалтын үндсэн төрлүүдийн газрын зураг, ингэснээр үг хэллэг аймшигтай байхаа болино
-
төөрөлгүй мэдрэлийн сүлжээнүүдийг харах
-
Яагаад трансформаторууд одоо дэлхийг удирдаж байгаа юм шиг санагддаг
-
өгөгдлөөс байршуулах хүртэлх практик шугам
-
дэлгэцийн агшинг авч хадгалах боломжтой хурдан харьцуулах хүснэгт
-
Ёс зүй, хэвийсэн байдал, найдвартай байдлын талаар гараараа долгионгүй хашлага
Үүнийг л эндээс авах болно. Хэрвээ би тэнүүчлэх юм бол энэ нь байгалийн үзэсгэлэнт газраар явж, дараагийн удаа гудамжийг ямар нэгэн байдлаар илүү сайн санаж байгаатай адил юм. 🗺️
Ихэнх AI системүүдийн үндсэн найрлага 🧪
AI системийг гал тогооны өрөө шиг төсөөлөөд үз дээ. Дөрвөн найрлага дахин дахин гарч ирдэг:
-
Өгөгдөл - шошготой эсвэл шошгогүй жишээнүүд.
-
Загвар - тохируулж болох параметр бүхий математик функц.
-
Зорилго - таамаглал хэр муу болохыг хэмжих алдагдлын функц.
-
Оновчлол - алдагдлыг багасгахын тулд параметрүүдийг түлхэх алгоритм.
Гүнзгий суралцахад тэр нудрах нь ихэвчлэн буцах тархалттай градиент уруудах явдал бөгөөд энэ нь аварга том дууны самбарын аль товчлуур нь чичирч, дараа нь үсээ доошлуулсныг олж мэдэх үр дүнтэй арга юм [2].
Жижиг хэрэг: Бид дүрэмд суурилсан хэврэг спам шүүлтүүрийг хяналттай жижиг загвараар сольсон. Долоо хоногийн дараа шошго → хэмжилт → шинэчлэх гогцоо, хуурамч эерэг үзүүлэлтүүд буурч, дэмжлэгийн тасалбарууд унасан. Гоёмсог зүйл байхгүй - зүгээр л илүү цэвэр зорилтууд ("хамгийн" имэйлийн нарийвчлал), илүү сайн оновчлол.
Парадигмуудыг нэг дороос сурах нь 🎓
-
Хяналттай сургалт
Та оролт-гаралтын хос (шошго бүхий зураг, спам/спам биш гэж тэмдэглэсэн имэйл) өгдөг. Загвар нь оролт → гаралтыг сурдаг. Олон практик системийн үндэс суурь [1]. -
Хяналтгүй суралцах
Шошго байхгүй. Бүтэц-кластер, шахалт, далд хүчин зүйлийг олох. Хайгуул хийх эсвэл бэлтгэл сургуулилт хийхэд тохиромжтой. -
Бие даан удирдах сургалт
Загвар нь өөрөө шошго хийдэг (дараагийн үг, дутуу зургийн нөхөөсийг урьдчилан таамаглах). Түүхий өгөгдлийг масштабтай сургалтын дохио болгон хувиргадаг; орчин үеийн хэл, харааны загваруудыг үндэслэдэг. -
Бататгах сургалт
Агент үйлдэл хийж, шагнал , хуримтлагдсан шагналыг нэмэгдүүлэх бодлогыг сурдаг. Хэрэв "үнэ цэнийн үйл ажиллагаа", "бодлого", "цаг хугацааны ялгааг судлах" хонх дуугарвал энэ бол тэдний гэр [5].
Тийм ээ, практик дээр ангилал бүдгэрч байна. Гибрид аргууд нь хэвийн байдаг. Бодит амьдрал замбараагүй; Сайн инженер нь хаана байгаа бол түүнийг хангадаг.
Толгой өвдөхгүй мэдрэлийн сүлжээ дотор 🧠
Мэдрэлийн сүлжээ нь математикийн жижиг нэгжүүдийн (нейрон) давхаргуудыг овоолдог. Давхарга бүр нь орцыг жин, хазайлт, ReLU эсвэл GELU гэх мэт шугаман бус байдлаар хувиргадаг. Эрт давхарга нь энгийн шинж чанаруудыг сурдаг; гүн гүнзгий нь хийсвэрлэлийг кодлодог. Хэрэв бид үүнийг "ид шид" гэж нэрлэж болох юм бол энэ нь найрлага : жижиг функцүүдийг гинжин хэлхээнд оруулснаар та маш нарийн төвөгтэй үзэгдлүүдийг загварчилж чадна.
Сургалтын гогцоо, зөвхөн чичиргээ:
-
таамаг → хэмжилтийн алдаа → backprop-ээр дамжуулан шинж чанарыг буруутгах → жинг нугалах → давт.
Үүнийг хэд хэдэн удаа хий, дуу бүрээ сайжруулж байгаа болхи бүжигчин шиг загвар өмсөгч таны хөлийн хуруун дээр гишгэхээ болино. Нөхөрсөг, хатуу арын тулгуур бүлгийг [2] үзнэ үү.
Трансформаторууд яагаад өөрчилсөн бэ, мөн "анхаарал" гэж юу гэсэн үг вэ 🧲
Трансформаторууд оролтын аль хэсэг нь бие биедээ хамааралтай болохыг нэг дор жинлэхийн тулд өөртөө анхаарал Хуучин загварууд шиг өгүүлбэрийг зүүнээс баруун тийш уншихын оронд трансформатор нь хаа сайгүй харж, хэн хэнтэй ярьж байгааг харахын тулд хөл хөдөлгөөн ихтэй өрөөг сканнердах шиг динамик байдлаар харилцааг үнэлэх боломжтой.
Энэхүү загвар нь дарааллын загварчлалын давталт, эргэлтийг бууруулж, асар их параллелизм, маш сайн масштабыг бий болгосон. Үүнийг эхлүүлсэн цаас - Анхаарал танд хэрэгтэй бүх зүйл - архитектур, үр дүнг харуулсан [3].
Нэг мөрөнд өөртөө анхаарал хандуулах: жетон бүрийн хувьд query , key , болон утгын анхаарлыг татахын тулд ижил төстэй байдлыг тооцоолох; зохих утгыг холино. Нарийвчилсан байдлаар дэгжин, дэгжин.
Анхааруулга: Трансформаторууд монопольчлох биш давамгайлдаг. CNN, RNN болон модны чуулга нь тодорхой өгөгдлийн төрөл, хоцрогдол/зардлын хязгаарлалт дээр ялсан хэвээр байна. Хий шуугиан биш харин ажлын архитектурыг сонго.
AI хэрхэн ажилладаг вэ? Таны үнэхээр ашиглах практик шугам хоолой 🛠️
-
Асуудлыг тодорхойлох
Та юуг урьдчилан таамаглаж байна вэ, мөн амжилтыг хэрхэн хэмжих вэ? -
Мэдээлэл
цуглуулах, шаардлагатай бол шошголох, цэвэрлэж, хуваах. Алга болсон утгууд болон захын тохиолдлуудыг хүлээж байна. -
Загварчлах нь
энгийн. Суурь үзүүлэлтүүд (логистик регресс, градиент нэмэгдүүлэх эсвэл жижиг трансформатор) ихэвчлэн баатарлаг нарийн төвөгтэй байдлыг даван туулдаг. -
Сургалт
Зорилгоо сонгох, оновчтой болгох, гиперпараметрүүдийг тохируулах. Давтах. -
Үнэлгээ
Бодит зорилгодоо (нарийвчлал, F1, AUROC, BLEU, төөрөгдөл, хоцрогдол) холбоотой хэмжигдэхүүн, хөндлөн баталгаажуулалт, хэмжүүрүүдийг ашиглана уу. -
Байрлуулалт
API-ийн ард үйлчлэх эсвэл апп дотор оруулах. Хоцролт, зардал, дамжуулах чадварыг хянах. -
Хяналт ба засаглал
Дрифт, шударга байдал, бат бөх байдал, аюулгүй байдлыг ажигла. NIST AI эрсдэлийн удирдлагын тогтолцоо (GOVERN, MAP, MEASURE, MANAGE) нь найдвартай системүүдийг эцэс төгсгөл хүртэл шалгах практик хяналтын хуудас юм [4].
Бяцхан кейс: Харааны загвар лабораторид ажиллаж, дараа нь гэрэлтүүлэг солигдох үед талбайд эргэлдэж байв. Оролтын гистограммд тэмдэглэсэн шилжилтийг хянах; хурдан нэмэгдүүлэх + нарийн тааруулах овойлт сэргээгдсэн гүйцэтгэл. Уйтгартай юу? Тиймээ. Үр дүнтэй юу? Бас тийм.
Харьцуулалтын хүснэгт - арга барил, тэд хэний төлөө, бүдүүлэг зардал, яагаад ажилладаг вэ 📊
Зорилгодоо төгс бус: бага зэрэг жигд бус хэллэг нь хүн шиг санагддаг.
| Арга барил | Хамгийн тохиромжтой үзэгчид | Үнэтэй | Яагаад ажилладаг вэ / тэмдэглэл |
|---|---|---|---|
| Хяналттай суралцах | Шинжээчид, бүтээгдэхүүний баг | бага-дунд | Шууд зураглалын оролт→шошго. Шошго байгаа үед гайхалтай; суурилуулсан олон системийн тулгуур хэсгийг бүрдүүлдэг [1]. |
| Хяналтгүй | Өгөгдөл судлаачид, R&D | намхан | Кластер/шахалт/далд хүчин зүйлсийг олдог-олон илрүүлэх, урьдчилан бэлтгэхэд тохиромжтой. |
| Өөрийгөө хянадаг | Платформ багууд | дунд | Тооцоолол, өгөгдөл бүхий түүхий өгөгдлийн масштабаас өөрийн шошгыг хийдэг. |
| Бататгах сургалт | Робот техник, үйл ажиллагааны судалгаа | дунд-өндөр | Шагналын дохионоос бодлогод суралцдаг; Канон [5]-д зориулж Саттон & Бартог уншина уу. |
| Трансформаторууд | NLP, алсын хараа, олон талт | дунд-өндөр | Өөртөө анхаарал хандуулах нь холын зайн гүнийг барьж, сайн зэрэгцдэг; эх цаасыг үзнэ үү [3]. |
| Сонгодог ML (мод) | Хүснэгтийн бизнес програмууд | намхан | Бүтэцлэгдсэн өгөгдлийн талаархи хямд, хурдан, ихэвчлэн цочирдом хүчтэй суурь үзүүлэлтүүд. |
| Дүрэмд суурилсан/бэлэгдлийн | Дагаж мөрдөх, тодорхойлогч | маш бага | Ил тод логик; аудит хийх шаардлагатай үед эрлийзүүдэд ашигтай. |
| Үнэлгээ ба эрсдэл | Хүн бүр | харилцан адилгүй байдаг | NIST-ийн ЗАСГИЙН ГАЗРЫН ЗУРАГ-ХЭМЖЭЭ-УДИРДЛАГА-г ашиглан үүнийг аюулгүй, хэрэгцээтэй байлгаарай [4]. |
Үнэ-ish = өгөгдлийн шошгололт + тооцоолол + хүмүүс + үйлчилгээ.
Гүн шумбах 1 - алдагдал функц, градиент, бүх зүйлийг өөрчилдөг жижиг алхамууд 📉
Байшингийн үнийг хэмжээнээс нь урьдчилан таамаглах шугамыг тааруулж төсөөлөөд үз дээ. Та (w) ба (b) параметрүүдийг сонгож, таамаглах (\hat{y} = wx + b) болон алдааг дундаж квадрат алдагдалаар хэмжинэ. Градиент нь аль чиглэлд шилжихийг (w) болон (b) алдагдлыг багасгахын тулд манан дунд уруудаж алхахтай адил газар аль тал руугаа налууг мэдрэхийг хэлж өгнө. Багц бүрийн дараа шинэчлээрэй, таны шугам бодит байдалд ойртоно.
Deep nets-д энэ нь илүү том хамтлагтай ижил дуу юм. Backprop нь давхарга бүрийн параметрүүд эцсийн алдаанд хэрхэн үр дүнтэй нөлөөлсөнийг тооцоолдог тул та сая сая (эсвэл тэрбум) товчлууруудыг зөв чиглэлд түлхэх боломжтой [2].
Гол мэдрэмжүүд:
-
Алдагдал нь ландшафтыг бүрдүүлдэг.
-
Градиент бол таны луужин юм.
-
Сурах хурд нь алхамын хэмжээ-хэт том бөгөөд чи ганхаж, хэтэрхий жижиг, унтаж унтдаг.
-
Тогтмол байдал нь төгс санах чадвартай боловч ямар ч ойлголтгүй тоть шиг сургалтын багцыг цээжлэхээс сэргийлдэг.
Гүн шумбах 2 - оруулах, сануулах, сэргээх 🧭
нь үг, зураг эсвэл зүйлсийг ижил төстэй зүйлс бие биенийхээ ойролцоо буудаг вектор орон зайд буулгана. Ингэснээр танд:
-
утгын хувьд ижил төстэй хэсгүүдийг олоорой
-
утгыг ойлгодог хүчирхэг хайлт
-
Хэлний загвар нь бичихээсээ өмнө баримтуудыг хайж олохын тулд хайлтыг нэмэгдүүлсэн генераци (RAG)-ийг залгана уу
Сануулах гэдэг нь үүсгэгч загваруудыг хэрхэн удирдан чиглүүлэх явдал юм-даалгаврыг тайлбарлах, жишээ өгөх, хязгаарлалт тавих. Үүнийг маш хурдан дадлагажигчдад зориулж маш нарийн тодорхойлолт бичих шиг бодоорой: хүсэл эрмэлзэлтэй, хааяа өөртөө хэт итгэлтэй байдаг.
Практик зөвлөгөө: Хэрэв таны загвар хий үзэгдэлтэй байвал хайлтыг нэмж, мөрийг чангатгаж эсвэл "чичиргээ"-ийн оронд үндэслэлтэй хэмжүүрээр үнэлээрэй.
Гүн шумбах 3 - хуурмаг зүйлгүй үнэлгээ 🧪
Сайн үнэлгээ нь уйтгартай санагддаг - энэ нь яг чухал зүйл юм.
-
Түгжигдсэн туршилтын багцыг ашиглана уу.
-
Хэрэглэгчийн өвдөлтийг тусгах хэмжигдэхүүнийг сонго.
-
Чухам юу тусалсаныг мэдэхийн тулд абляци хий.
-
Алдаа дутагдлыг бодит, эмх замбараагүй жишээгээр бүртгээрэй.
Үйлдвэрлэлийн хувьд хяналт гэдэг бол хэзээ ч зогсдоггүй үнэлгээ юм. Дрифт тохиолддог. Шинэ хэллэг гарч ирж, мэдрэгчийг дахин тохируулж, өчигдрийн загвар нь бага зэрэг гулсдаг. NIST-ийн тогтолцоо нь байнгын эрсдэлийн удирдлага, засаглалын практик лавлагаа болохоос бодлогын баримт бичиг биш [4].
Ёс зүй, буруу хандлага, найдвартай байдлын талаархи тэмдэглэл ⚖️
AI системүүд нь тэдний өгөгдөл болон байршуулалтын нөхцөл байдлыг тусгадаг. Энэ нь эрсдэлийг авчирдаг: хэвийсэн байдал, бүлэг хоорондын жигд бус алдаа, хуваарилалтын өөрчлөлтийн үед хэврэг байдал. Ёс суртахууны хэрэглээ нь сонголт биш юм - энэ нь ширээний гадас юм. NIST тодорхой практикийг онцолж байна: эрсдэл, нөлөөллийг баримтжуулж, хор хөнөөлтэй байдлыг хэмжиж, нөөцийг бий болгож, эрсдэл өндөр байх үед хүмүүсийг хяналтанд байлгах [4].
Туслах бетон хөдөлгөөнүүд:
-
төрөл бүрийн, төлөөллийн мэдээлэл цуглуулах
-
дэд популяци хоорондын гүйцэтгэлийг хэмжих
-
баримт бичгийн загвар карт, мэдээллийн хуудас
-
эрсдэл өндөр байгаа газарт хүний хяналтыг нэмнэ
-
систем нь тодорхойгүй үед бүтэлгүйтлийн аюулгүй дизайн
AI хэрхэн ажилладаг вэ? Оюун санааны загвар болгон та дахин ашиглах боломжтой 🧩
Бараг бүх AI системд хэрэглэж болох авсаархан шалгах хуудас:
-
Зорилго нь юу вэ? Урьдчилан таамаглах, эрэмбэлэх, үүсгэх, хянах уу?
-
Сурах дохио хаанаас ирдэг вэ? Шошго, өөрөө удирдах ажил, шагнал?
-
Ямар архитектур ашигладаг вэ? Шугаман загвар, модны чуулга, CNN, RNN, трансформатор [3]?
-
Үүнийг хэрхэн оновчтой болгосон бэ? Градиент буурах хувилбарууд/арын тулгуур [2]?
-
Ямар мэдээллийн горим вэ? Жижиг шошготой багц, шошгогүй текстийн далай, дууриамал орчин?
-
Гэмтлийн горим, хамгаалалт юу вэ? NIST-ийн ЗАСГИЙН ГАЗРЫН ЗУРАГ-ХЭМЖЭЭ-УДИРДЛАГА [4]-д хэвийх, зөрөх, хий үзэгдэл, хоцролт, зардлын зураглал.
Хэрэв та эдгээрт хариулж чадвал системийг үндсэндээ ойлгох болно - үлдсэн хэсэг нь хэрэгжилтийн дэлгэрэнгүй мэдээлэл, домэйны мэдлэг юм.
Хавчуурга тэмдэглэх нь зүйтэй хурдан эх сурвалжууд 🔖
-
Машин сургалтын үзэл баримтлалын (IBM) энгийн хэлний танилцуулга [1]
-
Диаграмм болон зөөлөн математикийн тусламжтайгаар буцаан тархалт [2]
-
Дарааллын загварчлалыг өөрчилсөн трансформаторын цаас [3]
-
NIST-ийн AI эрсдэлийн удирдлагын тогтолцоо (практик засаглал) [4]
-
Каноник бататгах сурах бичиг (үнэгүй) [5]
Түгээмэл асуултууд аянга ⚡
AI зүгээр л статистик мөн үү?
Энэ нь статистик дээр нэмээд оновчлол, тооцоолол, өгөгдлийн инженерчлэл, бүтээгдэхүүний дизайн юм. Статистик бол араг яс юм; үлдсэн хэсэг нь булчин юм.
Том загвар өмсөгчид үргэлж ялдаг уу?
Томруулах нь тусалдаг боловч өгөгдлийн чанар, үнэлгээ, байршуулалтын хязгаарлалт нь ихэвчлэн илүү чухал байдаг. Таны зорилгод хүрэх хамгийн жижиг загвар нь ихэвчлэн хэрэглэгчид болон түрийвчний хувьд хамгийн тохиромжтой байдаг.
AI ойлгож чадах уу?
Ойлгохыг тодорхойл . Загварууд нь өгөгдлийн бүтцийг авч, гайхалтай нэгтгэдэг; гэхдээ тэд сохор толботой бөгөөд итгэлтэйгээр буруу байж болно. Тэдэнд мэргэд биш хүчирхэг хэрэгсэл мэт ханд.
Трансформаторын эрин үе мөнх мөн үү?
Үүрд биш байх. Анхны баримт бичигт [3] харуулсанчлан анхаарал зэрэгцэж, сайн масштабтай байдаг тул энэ нь одоо давамгайлж байна. Гэхдээ судалгаа үргэлжилсээр байна.
AI хэрхэн ажилладаг вэ? Хэт удаан, уншаагүй 🧵
-
AI нь өгөгдлөөс хэв маягийг сурч, алдагдлыг багасгаж, шинэ оролтыг нэгтгэдэг [1,2].
-
Хяналттай, хараа хяналтгүй, бие даасан, бататгасан сургалт нь сургалтын үндсэн тохиргоо юм; RL шагналаас суралцдаг [5].
-
Мэдрэлийн сүлжээ нь сая сая параметрүүдийг үр дүнтэй тохируулахын тулд буцах тархалт ба градиент уналтыг ашигладаг [2].
-
Өөртөө анхаарал хандуулах нь харилцааг масштабаар зэрэгцүүлэн авч үздэг тул трансформаторууд дараалсан олон ажлуудыг давамгайлдаг [3].
-
Бодит ертөнцийн хиймэл оюун ухаан нь асуудлыг тодорхойлохоос эхлээд байршуулалт, засаглалаар дамждаг бөгөөд NIST-ийн тогтолцоо нь таныг эрсдэлийн талаар үнэнчээр хангадаг [4].
Хэрэв хэн нэгэн дахин асуувал AI хэрхэн ажилладаг вэ? , та инээмсэглэж, кофегоо балгаж, өгөгдлөөс суралцаж, алдагдлыг оновчтой болгож, асуудлаас хамааран трансформатор эсвэл модны чуулга зэрэг архитектурыг ашигладаг гэж хэлж болно. Дараа нь нүдээ ирмээрэй, учир нь энэ нь энгийн бөгөөд бүрэн гүйцэд зүйл юм. 😉
Лавлагаа
[1] IBM - Машины сургалт гэж юу вэ?
дэлгэрэнгүй уншина уу
[2] Майкл Нилсен - Буцах тархалтын алгоритм хэрхэн ажилладаг талаар
дэлгэрэнгүй уншина уу
[3] Васвани нар. - Анхаарал л хэрэгтэй (arXiv)
дэлгэрэнгүй
[4] NIST - Хиймэл оюун ухааны эрсдэлийн удирдлагын тогтолцоо (AI RMF 1.0)
дэлгэрэнгүй
[5] Саттон & Барто - Сургалтыг бэхжүүлэх: Удиртгал (2-р хэвлэл)
дэлгэрэнгүй