Хэрхэн хиймэл оюун ухаан хөгжүүлэгч болох вэ. The Lowdown.

Чи энд сэвсгэр гэж ирээгүй. хязгааргүй таб, үг хэллэг шөл, анализын саажилтанд живэхгүйгээр хэрхэн хиймэл оюун ухаан хөгжүүлэгч болох талаар тодорхой замыг хүсч байна Сайн байна. Энэхүү гарын авлага нь ур чадварын газрын зураг, үнэхээр чухал хэрэглүүр, буцаан дуудлагыг хүлээн авдаг төслүүд, тээвэрлэлтийг тээвэрлэхээс салгах дадал зуршлыг өгдөг. Чамайг барьж өгье.

Үүний дараа унших дуртай нийтлэлүүд:

🔗 AI компанийг хэрхэн эхлүүлэх вэ
AI-ийн гарааны бизнесийг бий болгох, санхүүжүүлэх, эхлүүлэх алхам алхмаар зааварчилгаа.

🔗 Компьютер дээрээ хиймэл оюун ухаан хэрхэн хийх вэ
AI загваруудыг дотооддоо хялбархан үүсгэж, сургаж, ажиллуулж сур.

🔗 Хиймэл оюун ухааны загварыг хэрхэн хийх вэ
Үзэл баримтлалаас эхлээд байршуулах хүртэлх AI загвар бүтээх үйл явцын иж бүрэн задаргаа.

🔗 Билэгдлийн хиймэл оюун ухаан гэж юу вэ
Билэгдлийн хиймэл оюун ухаан хэрхэн ажилладаг, яагаад өнөөг хүртэл чухал байдгийг олж мэдээрэй.

AI хөгжүүлэгчийг юугаараа сайн хийдэг вэ✅

Сайн хиймэл оюун ухаан хөгжүүлэгч бол оптимизатор болгоныг цээжилдэг хүн биш юм. түүнийгээ хүрээлж , өгөгдөл, загваруудыг хооронд нь холбож, ямар нэгэн үр дүнтэй зүйлийг илгээж, үнэн зөв хэмжиж, жүжиглэлтгүйгээр давтаж чаддаг хүн юм Хэд хэдэн тэмдэглэгээ:

Бүхэл бүтэн давталттай ая тухтай байдал: өгөгдөл → загвар → үнэлэх → байршуулах → хяналт.
Онгон онолоос хурдан туршилт хийх тал дээр... тодорхой урхинаас зайлсхийх хангалттай онолтой.
Зөвхөн дэвтэр биш, үр дүнд хүрч чадна гэдгийг батлах багц.
Эрсдэл, хувийн нууцлал, шударга байдлын талаархи хариуцлагатай сэтгэлгээ нь гүйцэтгэл биш, практик биш юм. NIST AI Эрсдэлийн удирдлагын тогтолцоо , ЭЗХАХБ-ын AI зарчмууд зэрэг салбарын шат дамжлага нь танд шүүмжлэгч болон оролцогч талуудтай ижил хэлээр ярихад тусална. [1][2]

Жижигхэн хүлээн зөвшөөрөх: заримдаа та загвараа илгээж, дараа нь үндсэн үзүүлэлт нь ялах болно. Энэ даруу байдал нь хачирхалтай нь супер хүч юм.

Шуурхай винет: баг дэмжлэг үзүүлэх зорилгоор гоёмсог ангилагчийг бүтээсэн; үндсэн түлхүүр үгийн дүрмүүд нь эхний хариу өгөх үед үүнийг давсан. Тэд дүрэм журмыг сахиж, захын гэрүүдэд загварыг ашиглаж, хоёуланг нь тээвэрлэсэн. Ид шид бага, илүү үр дүн.

Хэрхэн хиймэл оюун ухаан хөгжүүлэгч болох замын зураг 🗺️

Энд туранхай, давталттай зам байна. Түвшин ахихдаа үүнийг хэд хэдэн удаа давт:

програмчлах чадвар : NumPy, pandas, scikit-learn. Албан ёсны гарын авлагыг гүйлгээд дараа нь хуруугаараа мэдэх хүртэл жижиг скриптүүдийг бүтээгээрэй. Scikit-learn хэрэглэгчийн гарын авлага нь гайхалтай практик сурах бичгийн үүрэг гүйцэтгэдэг. [3]
Бүтэцлэгдсэн сургалтын хөтөлбөрөөр дамжуулан ML-ийн үндэс Сонгодог лекцийн тэмдэглэлүүд болон практик сургалтуудын хослол сайн ажилладаг.
Гүнзгий суралцах хэрэгсэл : PyTorch эсвэл TensorFlow-ийг сонгоод загваруудыг сургах, хадгалах, ачаалахад хангалттай суралцах; өгөгдлийн багцыг зохицуулах; болон нийтлэг хэлбэрийн алдааг засах. Хэрэв та "эхлээд кодлох" дуртай бол албан ёсны PyTorch хичээлээс [4]
Үнэн хэрэгтээ нийлүүлдэг төслүүд : Docker-оор багцлах, гүйлтийг хянах (CSV бүртгэл ч гэсэн юу ч давахгүй), хамгийн бага API-г байршуулах. Нэг хайрцагт байршуулалтаас давж гарах үедээ Kubernetes сурах; Эхлээд Докер. [5]
Хариуцлагатай AI давхарга : NIST/OECD-ээс санаа авсан эрсдэлийн хяналтын хуудас (хүчин төгөлдөр байдал, найдвартай байдал, ил тод байдал, шударга байдал). Энэ нь хэлэлцүүлгийг тодорхой болгож, аудитыг уйтгартай болгодог (сайн байдлаар). [1][2]
Бага зэрэг мэргэшээрэй : Transformers-тэй NLP, орчин үеийн хувиргагч/ViT-тэй алсын хараа, зөвлөгч эсвэл LLM програм, агентууд. Нэг эгнээ сонгож, хоёр жижиг төсөл барьж, дараа нь салбарлана.

Та 2-6-р алхамуудыг үүрд дахин үзэх болно. Үнэнийг хэлэхэд энэ бол ажил.

Таны ихэнх өдөр ашиглах ур чадварын багц 🧰

Python + Өгөгдлийн маргаан : массивуудыг зүсэх, нэгдэх, группууд, векторжуулалт. Хэрэв та пандаг бүжиглэж чадвал сургалт илүү хялбар, үнэлгээ нь илүү цэвэр болно.
Гол ML : галт тэрэгний туршилтын хуваагдал, гоожихоос зайлсхийх, хэмжүүрийн бичиг үсгийн мэдлэг. Scikit-learn гарын авлага нь намуухан дээрх хамгийн шилдэг текстүүдийн нэг юм. [3]
DL хүрээ : аль нэгийг нь сонгоод, төгсгөл хүртэл нь ажиллуулж, дараа нь нөгөөг нь хараарай. PyTorch-ийн баримт бичгүүд нь сэтгэцийн загварыг яруу болгодог. [4]
Туршилтын эрүүл ахуй : гүйлтийн зам, парам, эд өлгийн зүйлс. Ирээдүй - та археологийг үзэн яддаг.
Контейнержуулалт ба зохион байгуулалт : Өөрийн стекийг багцлах Docker; Хуулбарлах, автоматаар масштаблах, шинэчлэх шаардлагатай үед Kubernetes. Эндээс эхэл. [5]
GPU-ийн үндсэн ойлголтууд : хэзээ түрээслэх, багцын хэмжээ дамжуулах чадварт хэрхэн нөлөөлдөг, яагаад зарим үйлдлийн системүүд санах ойд холбогддог болохыг мэдэх.
Хариуцлагатай AI : өгөгдлийн эх сурвалжийг баримтжуулж, эрсдэлийг үнэлж, тодорхой шинж чанаруудыг (хүчин төгөлдөр байдал, найдвартай байдал, ил тод байдал, шударга байдал) ашиглан бууруулах арга хэмжээг төлөвлөх. [1]

Анхан шатны сургалтын хөтөлбөр: жингээсээ давсан цөөн хэдэн холбоосууд 🔗

ML-ийн үндэс : онол ихтэй тэмдэглэл + практик дампуурлын курс. Тэдгээрийг scikit-learn дээр дадлага хийхтэй хослуул. [3]
Хүрээ : PyTorch хичээлүүд (эсвэл та Керасыг илүүд үздэг бол TensorFlow гарын авлага). [4]
Өгөгдлийн шинжлэх ухааны зайлшгүй шаардлагатай зүйлс хэмжигдэхүүн, дамжуулах хоолой, үнэлгээг дотооддоо оруулах scikit-learn хэрэглэгчийн гарын авлага [3]
Хүргэлт : Докерын Эхлэх зам нь "миний машин дээр ажилладаг" нь "хаа сайгүй ажилладаг" болж хувирдаг. [5]

Эдгээрийг тэмдэглэ. Гацсан үедээ нэг хуудас уншаад нэг юм оролдоод давт.

Ярилцлага авдаг гурван багц төсөл 📁

Өөрийнхөө мэдээллийн багц дээр хариулах нэмэлт асуултын хариулт
- Мэдлэгийн баазыг хусах/импортлох, суулгалт хийх + татаж авах, хөнгөн UI нэмнэ үү.
- Хоцролт, хүлээгдэж буй асуулт, хариултын нарийвчлал, хэрэглэгчийн санал хүсэлтийг хянах.
- "Бүтэлгүйтлийн тохиолдол" гэсэн богино хэсгийг оруулна уу.
Бодит байршуулалтын хязгаарлалт бүхий харааны загвар
- Ангилагч эсвэл илрүүлэгчийг сургаж, FastAPI-ээр үйлчилж, Docker-ээр контейнер хийж, хэрхэн масштаблахаа бичээрэй. [5]
- Баримт бичгийн шилжилтийг илрүүлэх (онцлогууд дээрх хүн амын энгийн статистик нь сайн эхлэл юм).
Хариуцлагатай хиймэл оюун ухааны кейс судалгаа
- Эмзэг шинж чанартай олон нийтийн мэдээллийн багцыг сонго. NIST шинж чанаруудтай (хүчин төгөлдөр байдал, найдвартай байдал, шударга байдал) нийцүүлэн хэмжигдэхүүн болон бууруулах бичгийг хийх. [1]

Төсөл бүрд: 1 хуудас README, диаграмм, хуулбарлах боломжтой скриптүүд, жижиг өөрчлөлтийн тэмдэглэл хэрэгтэй. Хүмүүс ч бас эдгээрийг уншдаг тул эможи нэмээрэй 🙂

MLOps, байршуулалт, хэн ч танд заадаггүй хэсэг 🚢

Хүргэлт бол ур чадвар юм. Хамгийн бага урсгал:

Docker so dev ≈ prod ашиглан өөрийн аппликейшнийг саванд хийнэ үү Эхлэх албан ёсны баримт бичгүүдээс эхлэх; Олон үйлчилгээний тохиргоонд зориулж Зохиох руу шилжинэ. [5]
Туршилтыг хянах (орон нутгийн хэмжээнд ч гэсэн). Парам, хэмжигдэхүүн, олдвор, "ялагч" гэсэн шошго нь аблляцийг шударга, хамтран ажиллах боломжтой болгодог.
Хэмжээ эсвэл тусгаарлах шаардлагатай үед Кубернетестэй хамт найрал хөгжим хий Эхлээд Байрлуулалт, Үйлчилгээ болон тунхаглалын тохиргоог сур; сарлагийн үсээ хусах хүслийг эсэргүүцэх.
Үүлэн ажиллах хугацаа : Прототип хийх Colab; тоглоомын програмуудыг дамжуулсны дараа удирддаг платформууд (SageMaker/Azure ML/Vertex).
GPU-ийн мэдлэг : та CUDA цөм бичих шаардлагагүй; Өгөгдөл ачаалагч таны саад тотгор болж байгааг та мэдэх хэрэгтэй.

Бяцхан алдаатай зүйрлэл: MLOps-ийг исгэлэн зуурмагийн эхлэл мэт бодоорой - автоматжуулалт, хяналтаар тэжээх, эсвэл үнэртэх болно.

Хариуцлагатай хиймэл оюун ухаан бол таны өрсөлдөх чадвартай шуудан 🛡️

Багууд найдвартай гэдгээ батлахын тулд дарамт шахалтанд ордог. Эрсдэл, баримтжуулалт, засаглалын талаар тодорхой ярьж чадвал та өрөөндөө хүмүүсийн хүсэн хүлээдэг хүн болно.

Тогтсон тогтолцоог ашиглана уу : NIST шинж чанаруудад тавигдах газрын зургийн шаардлагууд (хүчин төгөлдөр байдал, найдвартай байдал, ил тод байдал, шударга байдал), дараа нь тэдгээрийг шалгах хуудас болон PR-д хүлээн авах шалгуур болгон хувирга. [1]
Зарчмуудаа зангуулаарай : ЭЗХАХБ-ын AI зарчмууд нь хүний эрх, ардчиллын үнэт зүйлсийг онцолдог. [2]
Мэргэжлийн ёс зүй : Дизайны баримт бичигт ёс зүйн дүрмийг товчхон дохих нь ихэвчлэн "бид энэ тухай бодож байсан" болон "бид үүнийг жигүүрлэсэн" хоёрын ялгаа юм.

Энэ бол улаан тууз биш. Энэ бол гар урлал.

Бага зэрэг мэргэших: эгнээ сонгож, түүний хэрэгслийг сур 🛣️

LLMs & NLP : токенжуулалтын алдаанууд, контекст цонхнууд, RAG, BLEU-ээс гадуурх үнэлгээ. Өндөр түвшний шугам хоолойноос эхэлж, дараа нь тохируулна уу.
Алсын хараа : өгөгдлийг нэмэгдүүлэх, эрүүл ахуйн шошгололт, хоцролт нь хамгийн дээд түвшний төхөөрөмжүүдэд байршуулах.
Зөвлөмж : RMSE-тэй тохирохгүй далд санал хүсэлт, хүйтэн эхлэх стратеги, бизнесийн KPI-ууд.
Агентууд ба багаж хэрэгслийн хэрэглээ : функцийг дуудах, хязгаарлагдмал код тайлах, аюулгүйн зам.

Үнэнийг хэлэхэд, Ням гарагийн өглөө таныг сонирхож буй домэйныг сонгоорой.

Харьцуулах хүснэгт: AI хөгжүүлэгч болох арга замууд 📊

Зам / хэрэгсэл	Хамгийн сайн нь	Зардлын уур амьсгал	Энэ нь яагаад ажилладаг вэ - мөн хачирхалтай
Бие даан суралцах + склерн дасгал	Бие даан суралцагчид	чөлөөт маягийн	Rock-sid fundamentals ба scikit-learn дахь практик API; Та үндсэн ойлголтуудыг хэтрүүлэн сурах болно (сайн зүйл). [3]
PyTorch хичээлүүд	Код бичиж сурдаг хүмүүс	үнэгүй	Таныг хурдан дасгалжуулах; тензор + автоградын сэтгэцийн загвар хурдан дардаг. [4]
Докерын үндэс	Ачихаар төлөвлөж буй барилгачид	үнэгүй	Хуулбарлах боломжтой, зөөврийн орчин нь таныг хоёр сард эрүүл саруул байлгах; Дараа зохио. [5]
Курс + төслийн гогцоо	Визуал + практик хүмүүс	үнэгүй	Богино хичээл + 1-2 бодит репо нь 20 цагийн идэвхгүй видеог давдаг.
Удирдлагатай ML платформууд	Цаг хугацаа алдсан дадлагажигчид	харилцан адилгүй байдаг	Инфра хялбар байдлын үүднээс доллар арилжаалах; Тоглоомын аппликейшнээс давсан бол гайхалтай.

Тийм ээ, зай нь бага зэрэг тэгш бус байна. Жинхэнэ ширээ төгс төгөлдөр байх нь ховор.

Үнэхээр наалддаг судалгааны гогцоонууд 🔁

Хоёр цагийн мөчлөг : 20 минут баримт бичгийг унших, 80 минут кодлох, 20 минут юу эвдэрсэнийг бичих.
Нэг пейжерээр бичих : мини төсөл бүрийн дараа асуудлын хүрээ, суурь үзүүлэлт, хэмжүүр, бүтэлгүйтлийн горимуудыг тайлбарлана уу.
Санаатай хязгаарлалтууд : зөвхөн CPU дээр сургах, эсвэл урьдчилан боловсруулахад зориулсан гадаад libs байхгүй, эсвэл яг 200 мөр төсөвлөх. Хязгаарлалт нь ямар нэгэн байдлаар бүтээлч байдлыг бий болгодог.
Цаасан спринт : зүгээр л алдагдал эсвэл өгөгдөл ачаалагчийг хэрэгжүүл. Нэг тонн сурахын тулд танд SOTA хэрэггүй.

Хэрэв анхаарал алдвал энэ нь хэвийн үзэгдэл юм. Хүн бүр ганхаж эхэлдэг. Алхаж, буцаж ир, жижиг зүйл тээвэрлэ.

Ярилцлагын бэлтгэл, театрын тоглолтыг хассан 🎯

Эхний багц : бодит репо нь слайд тавцанг давсан. Дор хаяж нэг жижиг демо суулгаарай.
Тохиромжтой талуудыг тайлбарла : хэмжүүрийн сонголтууд болон бүтэлгүйтлийг хэрхэн дибаг хийх талаар явахад бэлэн байгаарай.
Системийн сэтгэлгээ : өгөгдөл → загвар → API → монитор диаграммыг зурж, өгүүлэх.
Хариуцлагатай хиймэл оюун ухаан : энгийн хяналтын хуудсыг NIST AI RMF-д нийцүүлэн хадгалаарай - энэ нь шуугиан тарьсан үгс биш харин төлөвшсөний дохио юм. [1]
Хүрээний ур чадвар : нэг хүрээг сонгоод түүнд аюултай байх. Албан ёсны баримт бичиг бол ярилцлагад шударга тоглоом юм. [4]

Бяцхан хоолны дэвтэр: Амралтын өдрүүд дэх таны анхны төгсгөл хүртэлх төсөл 🍳

Өгөгдөл : цэвэр мэдээллийн багц сонгоно уу.
Суурь : хөндлөн баталгаажуулалт бүхий scikit-learn загвар; үндсэн хэмжүүрүүдийг бүртгэх. [3]
DL дамжуулалт : PyTorch эсвэл TensorFlow дээрх ижил даалгавар; алимыг алимтай харьцуул. [4]
Хяналт : бичлэгийн гүйлтүүд (бүр энгийн CSV + цагийн тэмдэг). Ялагчийг тэмдэглээрэй.
Үйлчлэх : FastAPI чиглүүлэлтийн таамаглалыг боож, докер болгох, орон нутагт ажиллуулах. [5]
Хэрэглэгчийн хувьд ямар хэмжүүр чухал вэ, ямар эрсдэлүүд байгаа, ашиглалтад орсны дараа юуг хянах талаар тусгах [1]

Энэ төгс мөн үү? Үгүй ээ. Энэ нь төгс курс хүлээж байснаас дээр гэж үү? Мэдээжийн хэрэг.

Та эртхэн зайлж болох нийтлэг бэрхшээлүүд ⚠️

Сурах хичээлээ хичээлд хэт тохируулах нь : эхлэхэд маш сайн, гэхдээ удахгүй асуудалд анхаарлаа хандуулаарай.
Үнэлгээний загварыг алгасах : сургалтын өмнө амжилтыг тодорхойлох. Цаг хэмнэдэг.
Өгөгдлийн гэрээг үл тоомсорлох : схемийн шилжилт нь загвараас илүү олон системийг эвддэг.
Байршуулахаас айх : Докер харагдахаас илүү найрсаг. Бага багаар эхлэх; Эхний бүтээцийг хүлээн зөвшөөрөх нь ээдрээтэй байх болно. [5]
Ёс суртахуун хамгийн сүүлд : үүнийг дараа нь боолт хийж, энэ нь дагаж мөрдөх ажил болж хувирдаг. Үүнийг загвар болгон жигнэх - илүү хөнгөн, илүү сайн. [1][2]

TL;DR 🧡

Хэрэв та нэг зүйлийг санаж байгаа бол: Хэрхэн AI хөгжүүлэгч болох вэ гэдэг нь онол цуглуулах, гялалзсан загваруудыг хөөцөлдөх явдал биш юм. Бодит асуудлуудыг давтан давтан, хатуу хэлхээ, хариуцлагатай сэтгэлгээгээр шийдэх тухай юм. Өгөгдлийн стекийг сурч, нэг DL хүрээ сонгож, жижиг зүйлсийг Docker-оор дамжуулж, юу хийж байгаагаа хянаж, сонголтоо NIST болон OECD зэрэг нэр хүндтэй удирдамжид тохируулаарай. Гурван жижиг, дур булаам төслүүдийг бүтээж, тэдний тухай ид шидтэн биш, багийн анд шиг ярь. Энэ бол - ихэнхдээ.

Тиймээ, хэрэв энэ нь тусалж байвал энэ хэллэгийг чангаар хэлээрэй: Би хэрхэн хиймэл оюун ухаан хөгжүүлэгч болохыг мэднэ . Тэгвэл өнөөдөр нэг цаг төвлөрсөн барилгын ажил хийснээр үүнийг батал.

Лавлагаа

[1] NIST. Хиймэл оюун ухааны эрсдэлийн удирдлагын тогтолцоо (AI RMF 1.0) . (PDF) - Холбоос
[2] OECD. OECD AI зарчмууд - Тойм - Холбоос
[3] scikit-learn. Хэрэглэгчийн гарын авлага (тогтвортой) - Холбоос
[4] PyTorch. Хичээлүүд (Үндсэн ойлголтуудыг сурах гэх мэт) - Холбоос
[5] Docker. Эхлэх - Холбоос

Албан ёсны AI Assistant дэлгүүрээс хамгийн сүүлийн үеийн хиймэл оюун ухааныг олоорой

Бидний тухай

Блог руу буцах

Улс/бүс нутаг