Товч хариулт: Үүлэн тооцооллын хиймэл оюун ухаан нь үүлэн платформуудыг ашиглан өгөгдөл хадгалах, тооцоолол түрээслэх, загваруудыг сургах, тэдгээрийг үйлчилгээ болгон байршуулах, үйлдвэрлэлд хяналт тавих тухай юм. Энэ нь чухал бөгөөд учир нь ихэнх алдаа нь математик биш харин өгөгдөл, байршуулалт, үйл ажиллагааны эргэн тойронд бөөгнөрдөг. Хэрэв танд хурдан өргөтгөл эсвэл давтагдах хувилбарууд хэрэгтэй бол cloud + MLOps нь практик зам юм.
Гол дүгнэлтүүд:
Амьдралын мөчлөг : Газрын өгөгдөл, барилгын онцлог шинж чанарууд, сургах, байршуулах, дараа нь шилжилт, хоцрогдол болон зардлыг хянах.
Засаглал : Хандалтын хяналт, аудитын бүртгэл, орчны тусгаарлалтыг эхнээс нь суулгана уу.
Давтах чадвар : Өгөгдлийн хувилбарууд, код, параметрүүд болон орчныг тэмдэглэснээр гүйцэтгэлүүд давтагдах боломжтой хэвээр байна.
Зардлын хяналт : Төлбөрийн цочролоос зайлсхийхийн тулд багцлах, кэшлэх, автомат масштаблах хязгаарлалт, цэгэн/урьдчилан сэргийлэх сургалтыг ашиглана уу.
Байршуулалтын хэв маяг : Багийн бодит байдалд үндэслэн удирддаг платформууд, нуурын байшингийн ажлын урсгал, Kubernetes эсвэл RAG-г сонгоно уу.

Үүний дараа таны унших дуртай нийтлэлүүд:
🔗 Шилдэг хиймэл оюун ухаантай үүлэн бизнесийн удирдлагын хэрэгслүүд
Үйл ажиллагаа, санхүү, багуудыг оновчтой болгодог тэргүүлэгч үүлэн платформуудыг харьцуул.
🔗 Том хэмжээний генератив хиймэл оюун ухаанд шаардлагатай технологиуд
GenAI-г байршуулахад шаардлагатай гол дэд бүтэц, өгөгдөл болон засаглал.
🔗 Өгөгдлийн шинжилгээнд зориулсан үнэгүй хиймэл оюун ухааны хэрэгслүүд
Өгөгдлийн санг цэвэрлэх, загварчлах, дүрслэх хамгийн сайн, үнэ төлбөргүй хиймэл оюун ухааны шийдлүүд.
🔗 Үйлчилгээний хувьд хиймэл оюун ухаан гэж юу вэ?
AIaaS, ашиг тус, үнийн загварууд болон бизнесийн нийтлэг хэрэглээний тохиолдлуудыг тайлбарладаг.
Үүлэн тооцоолол дахь хиймэл оюун ухаан: Энгийн тодорхойлолт 🧠☁️
Үүлэн тооцооллын хиймэл оюун ухаан үндсэндээ үүлэн платформ ашиглан дараах зүйлсийг ашиглахыг хэлнэ:
-
Тооцооллын хүч (CPU, GPU, TPU) Google Cloud: Хиймэл оюун ухааны Cloud-д зориулсан GPU TPU баримт бичиг
-
Хадгалалт (өгөгдлийн нуур, агуулах, объект хадгалах) AWS: Өгөгдлийн нуур гэж юу вэ? AWS: Өгөгдлийн агуулах гэж юу вэ? Amazon S3 (объект хадгалах)
-
Хиймэл оюун ухааны үйлчилгээ (загварын сургалт, байршуулалт, хараа, яриа, NLP-д зориулсан API) AWS Хиймэл оюун ухааны үйлчилгээ Google Cloud Хиймэл оюун ухааны API-ууд
-
MLOps хэрэгслүүд (хоолой, хяналт, загварын бүртгэл, ML-д зориулсан CI-CD) Google Cloud: MLOps гэж юу вэ? Vertex хиймэл оюун ухаант загварын бүртгэл
Та үнэтэй тоног төхөөрөмжөө худалдаж авахын оронд хэрэгтэй зүйлээ хэрэгтэй үедээ түрээслүүлнэ үү л гараашдаа фитнесс заал бариад гүйлтийн замаа дахин ашиглахгүй байхын оронд ганцхан удаа эрчимтэй дасгал хийхээр фитнесс заал түрээслэхтэй адил. Бидний хамгийн шилдэг нь ч бас ийм зүйлтэй тулгардаг 😬
Товчхондоо: NIST SP 800-145 .
Хиймэл оюун ухаан + Үүлэн технологи яагаад ийм том асуудал вэ 🚀
Шударгаар хэлэхэд ихэнх хиймэл оюун ухааны төслүүд математикийн тооцоолол хэцүү учраас бүтэлгүйтдэггүй. Тэд "загварын эргэн тойрон дахь зүйлс" орооцолдсоноос болж бүтэлгүйтдэг:
-
өгөгдөл тархай бутархай байна
-
орчин таарахгүй байна
-
загвар нь хэн нэгний зөөврийн компьютер дээр ажилладаг боловч өөр хаана ч байхгүй
-
байршуулалтыг дараа нь бодож үзсэн мэтээр авч үздэг
-
Аюулгүй байдал болон дүрэм журмын хэрэгжилт урилгагүй үеэл шиг оройтож ирдэг 😵
Үүлэн платформууд нь дараах зүйлсийг санал болгодог тул тусалдаг:
1) Уян хатан жин 📈
Загварыг том кластер дээр богино хугацаанд сургаад дараа нь NIST SP 800-145- .
2) Илүү хурдан туршилт ⚡
Удирдлагатай зөөврийн компьютер, урьдчилан бүтээгдсэн дамжуулах хоолой болон GPU инстансуудыг хурдан эргүүлээрэй Google Cloud: Хиймэл оюун ухаанд зориулсан GPU .
3) Илүү хялбар байршуулалт 🌍
Загваруудыг API, багц ажлууд эсвэл суулгагдсан үйлчилгээ болгон байршуулах Red Hat: REST API гэж юу вэ? SageMaker Batch Transform .
4) Нэгдсэн өгөгдлийн экосистем 🧺
Таны өгөгдлийн дамжуулах хоолой, агуулах болон аналитик нь ихэвчлэн үүлэн дээр байрладаг. AWS: Өгөгдлийн агуулах ба өгөгдлийн нуур .
5) Хамтын ажиллагаа ба засаглал 🧩
Зөвшөөрөл, аудитын бүртгэл, хувилбаржуулалт болон хуваалцсан хэрэгслүүд нь (заримдаа хэцүү ч гэсэн) Azure ML бүртгэлүүд (MLOps) .
Үүлэн тооцоолол дахь хиймэл оюун ухаан практик дээр хэрхэн ажилладаг вэ (Бодит урсгал) 🔁
Энэ бол нийтлэг амьдралын мөчлөг юм. "Төгс диаграмм" хувилбар биш... дотор нь байсан хувилбар.
Алхам 1: Өгөгдөл үүлэн санах ойд бууна 🪣
Жишээ нь: объект хадгалах сав, өгөгдлийн нуур, үүлэн мэдээллийн сан Amazon S3 (объект хадгалах) AWS: Өгөгдлийн нуур гэж юу вэ? Google Cloud Storage-ийн тойм .
Алхам 2: Өгөгдөл боловсруулах + онцлог шинж чанаруудыг бий болгох 🍳
Та үүнийг цэвэрлэж, өөрчилж, функцуудыг бүтээж, магадгүй шууд дамжуулж болно.
Алхам 3: Загвар өмсөгчийн сургалт 🏋️
Google Cloud-д зориулсан GPU-уудыг сургахын тулд үүлэн тооцоолол (ихэвчлэн GPU) ашигладаг :
-
сонгодог ML загварууд
-
гүнзгий сургалтын загварууд
-
суурь загварын нарийн тохируулга
-
Хайлтын системүүд (RAG хэв маягийн тохиргоо) Хайлтын-Өргөтгөсөн Үе (RAG) цаас
Алхам 4: Байршуулалт 🚢
Загваруудыг дараах байдлаар савлаж, хүргэнэ:
-
REST APIs Red Hat: REST API гэж юу вэ?
-
сервергүй төгсгөлийн цэгүүд SageMaker Сервергүй дүгнэлт
-
Kubernetes контейнерууд Kubernetes: Хэвтээ под автомат масштабжуулалт
-
багцын дүгнэлтийн дамжуулах хоолойнууд SageMaker багцын хувиргалт Vertex хиймэл оюун ухааны багцын таамаглалууд
Алхам 5: Хяналт + шинэчлэлтүүд 👀
Дууны зам:
-
хоцрогдол
-
Нарийвчлалын шилжилт SageMaker загварын хяналт
-
Vertex хиймэл оюун ухааны загварын өгөгдлийн
-
нэг таамаглалын өртөг
-
"Энэ боломжгүй байх ёсгүй..." гэж шивнэхэд хүргэдэг захын кейсүүд 😭
Энэ бол хөдөлгүүр. Энэ бол зүгээр нэг тодорхойлолт биш, харин үүлэн тооцооллын хөдөлгөөн дэх хиймэл оюун ухаан юм.
Үүлэн тооцоололд хиймэл оюун ухааны сайн хувилбарыг юу бүрдүүлдэг вэ? ✅☁️🤖
Хэрэв та "сайн" хэрэгжилтийг (зүгээр л гял цал демо биш) хүсч байвал эдгээрт анхаарлаа хандуулаарай:
А) Санаа зовнилыг тодорхой ялгаж салгах 🧱
-
өгөгдлийн давхарга (хадгалалт, засаглал)
-
сургалтын давхарга (туршилт, дамжуулах хоолой)
-
үйлчлэх давхарга (API, масштаб)
-
хяналтын давхарга (хэмжүүр, бүртгэл, анхааруулга) SageMaker Model Monitor
Бүх зүйл нэг дор холилдоход алдааг олж засварлах нь сэтгэл санааны хохирол болдог.
B) Анхдагчаар давтах чадвар 🧪
Сайн систем нь гараараа даллахгүйгээр дараах зүйлийг хэлэх боломжийг танд олгоно:
-
энэ загварыг сургасан өгөгдөл
-
кодын хувилбар
-
гиперпараметрүүд
-
хүрээлэн буй орчин
Хэрэв хариулт нь "ааан, би Мягмар гарагийн гүйлт байсан гэж бодож байна..." бол та аль хэдийн асуудалд орсон байна 😅
C) Зардал хэмнэсэн дизайн 💸
Үүлэн хиймэл оюун ухаан хүчирхэг боловч энэ нь таны амьдралын сонголтод эргэлзэхэд хүргэдэг санамсаргүй байдлаар хуулийн төсөл үүсгэх хамгийн хялбар арга юм.
Сайн тохиргоонд дараахь зүйлс орно
-
автомат масштабжуулалт : Хэвтээ под автомат масштабжуулалт
-
жишээ хуваарь
-
боломжтой үед цэгэн урьдчилан сэргийлэх сонголтууд Amazon EC2 цэгэн жишээнүүд Google Cloud Preemptible VMs
-
SageMaker Багц Хувиргалт болон кэш хийх дүгнэлт
D) Аюулгүй байдал болон хууль тогтоомжийн хэрэгжилт 🔐
Гоожсон хоолой дээрх наалдамхай тууз шиг дараа нь боолтоор бэхлээгүй.
E) Туршилтаас үйлдвэрлэл хүртэлх бодит зам 🛣️
Энэ бол хамгийн том нь. Үүлэн дэх хиймэл оюун ухааны сайн "хувилбар" нь MLOp, байршуулалтын загвар, эхнээсээ хяналтыг агуулдаг. Google Cloud: MLOp гэж юу вэ? . Үгүй бол энэ нь гоёмсог нэхэмжлэхтэй шинжлэх ухааны үзэсгэлэнгийн төсөл юм.
Харьцуулсан хүснэгт: Үүлэн доторх хиймэл оюун ухааны түгээмэл сонголтууд (мөн тэдгээр нь хэнд зориулагдсан бэ) 🧰📊
Доор товч бөгөөд бага зэрэг санал бодолтой хүснэгт байна. Үүлэн үнийг зориудаар өргөнөөр оруулсан болно, учир нь үүлэн үнэ нь кофе захиалахтай адил юм - суурь үнэ хэзээ ч үнэ биш юм 😵💫
| Хэрэгсэл / Платформ | Үзэгчид | Үнэтэй | Энэ яагаад ажилладаг вэ (өвөрмөц тэмдэглэлүүд багтсан) |
|---|---|---|---|
| AWS SageMaker | Машины сургалтын багууд, аж ахуйн нэгжүүд | Хэрэглэх үедээ төлөх | Бүрэн хэмжээний ML платформ - сургалт, төгсгөлийн цэгүүд, дамжуулах хоолойнууд. Хүчирхэг боловч хаа сайгүй цэснүүд байдаг. |
| Google Vertex хиймэл оюун ухаан | Машины сургалтын багууд, өгөгдлийн шинжлэх ухааны байгууллагууд | Хэрэглэх үедээ төлөх | Хүчтэй удирдлагатай сургалт + загварын бүртгэл + интеграцчилал. Дарахад л жигд мэдрэгддэг. |
| Azure машин сургалт | Аж ахуйн нэгжүүд, MS төвтэй байгууллагууд | Хэрэглэх үедээ төлөх | Azure экосистемтэй сайн зохицдог. Сайн засаглалын сонголтууд, олон товчлуурууд. |
| Датабрикс (ML + Lakehouse) | Өгөгдлийн инженерчлэлийн хүнд багууд | Захиалга + хэрэглээ | Өгөгдлийн дамжуулах хоолой + машин механизмыг нэг дор холиход маш тохиромжтой. Практик багуудад ихэвчлэн таалагддаг. |
| Snowflake хиймэл оюун ухааны онцлогууд | Аналитикийн тэргүүлэх байгууллагууд | Хэрэглээнд суурилсан | Таны ертөнц аль хэдийн агуулахад байгаа үед сайн. "ML лаборатори" бага, "SQL маягийн хиймэл оюун ухаан" илүү их |
| IBM watsonx | Зохицуулалттай салбарууд | Байгууллагын үнэ | Засаглал болон аж ахуйн нэгжийн хяналт нь гол анхаарал хандуулдаг. Ихэнхдээ бодлогоор хүндэрсэн байгууллагуудад сонгогддог. |
| Удирдлагатай Kubernetes (DIY ML) | Платформын инженерүүд | Хувьсагч | Уян хатан бөгөөд захиалгаар хийх боломжтой. Мөн... эвдэрсэн үед өвдөлтийг нь өөрөө мэдэрдэг 🙃 |
| Сервергүй дүгнэлт (функц + төгсгөлийн цэгүүд) | Бүтээгдэхүүний багууд | Хэрэглээнд суурилсан | Хурц хөдөлгөөнд тохиромжтой. Хүйтэн эхлэх болон хоцрогдолыг харцага шиг ажиглаарай. |
Энэ бол "хамгийн шилдэг"-ийг сонгох тухай биш - харин багийнхаа бодит байдалтай нийцүүлэх тухай юм. Энэ бол чимээгүй нууц юм.
Үүлэн тооцоололд хиймэл оюун ухааныг ашиглах нийтлэг тохиолдлууд (Жишээтэй хамт) 🧩✨
Үүлэн доторх хиймэл оюун ухааны тохиргоо энд давуу талтай байна:
1) Харилцагчийн дэмжлэгийн автоматжуулалт 💬
-
чатын туслахууд
-
тасалбарын чиглүүлэлт
-
хураангуй
-
сэтгэл хөдлөл болон зорилгыг илрүүлэх Cloud Natural Language API
2) Зөвлөмжийн системүүд 🛒
-
бүтээгдэхүүний санал
-
контентын тэжээл
-
"Хүмүүс бас худалдаж авсан".
Эдгээр нь ихэвчлэн өргөтгөх боломжтой дүгнэлт болон бараг бодит цагийн шинэчлэлтүүдийг шаарддаг.
3) Луйврын илрүүлэлт болон эрсдэлийн оноо 🕵️
Үүлэн технологи нь цуврал үйл явдлуудыг зохицуулах, үйл явдлуудыг дамжуулах, хамтлагуудыг ажиллуулахад хялбар болгодог.
4) Баримтжуулалтын тагнуул 📄
-
OCR дамжуулах хоолой
-
аж ахуйн нэгжийн олборлолт
-
гэрээний шинжилгээ
-
Нэхэмжлэхийн задлан шинжлэх Цасан ширхэг Cortex хиймэл оюун ухааны функцууд
Олон байгууллагад цаг хугацаа чимээгүйхэн буцаагддаг үе энэ байдаг.
5) Урьдчилан таамаглал болон мэргэжлийн чиг баримжаа олгох оновчлол 📦
Эрэлтийн урьдчилсан мэдээ, бараа материалын төлөвлөлт, маршрутын оновчлол. Өгөгдөл нь том бөгөөд давтан сургалт байнга явагддаг тул үүлэн технологи тусалдаг.
6) Бүтээлч хиймэл оюун ухааны аппликейшнууд 🪄
-
контентын төсөл боловсруулах
-
кодын тусламж
-
Дотоод мэдлэгийн роботууд (RAG)
-
Синтетик өгөгдөл үүсгэх Нөхөн сэргээх-өргөтгөсөн үе (RAG) баримт бичиг
Энэ бол компаниуд эцэст нь "Бид өгөгдөлд хандах дүрмүүдээ мэдэх хэрэгтэй" гэж хэлдэг мөч юм. 😬
Хаа сайгүй харагдах архитектурын хэв маяг 🏗️
1-р хэв маяг: Удирдлагатай машин механизмын платформ ("бид толгой өвдөхөө багасгахыг хүсч байна" гэсэн зам) 😌
-
өгөгдөл байршуулах
-
удирддаг ажлын байртай сургах
-
удирддаг төгсгөлийн цэгүүдэд байршуулах
-
Платформ хянах самбар дахь монитор SageMaker Model Monitor Vertex AI Model Monitoring
Хурд чухал бөгөөд та дотоод багаж хэрэгслийг эхнээс нь угсрахыг хүсэхгүй байгаа үед сайн ажилладаг.
Хээ 2: Лэйкхаус + ML (“өгөгдөл нэн тэргүүнд” гэсэн маршрут) 🏞️
-
Өгөгдлийн инженерчлэл + Машины машин механизмын ажлын урсгалыг нэгтгэх
-
Өгөгдлийн ойролцоо зөөврийн компьютер, дамжуулах хоолой, функцын инженерчлэл ажиллуулах
-
Том аналитик системд аль хэдийн ажиллаж байгаа байгууллагуудад хүчтэй Databricks Lakehouse
3-р загвар: Kubernetes дээрх контейнержуулсан ML (“бид хяналтыг хүсч байна” гэсэн маршрут) 🎛️
-
савлагаатай багцын загварууд
-
Автомат масштабын бодлого ашиглан масштаблах Kubernetes: Хэвтээ Pod автомат масштаблах
-
үйлчилгээний торыг нэгтгэх, ажиглагдах байдал, нууцлалын менежмент
Мөн "Бид өөртөө итгэлтэй бөгөөд хааяа нэг цагт дибаг хийх дуртай" гэж нэрлэдэг
Хээ 4: RAG (Нэмэлт мэдээлэл цуглуулах замаар нэмэгдүүлсэн үе) (“мэдлэгээ ашиглах” зам) 📚🤝
-
үүлэн сан дахь баримт бичгүүд
-
оруулга + векторын дэлгүүр
-
сэргээх давхарга нь контекстийг загварт дамжуулдаг
-
хашлага + хандалтын хяналт + бүртгэл Retrieval-Augmented Generation (RAG) цаас
Энэ нь орчин үеийн үүлэн доторх хиймэл оюун ухааны харилцан ярианы гол хэсэг юм, учир нь олон бодит бизнесүүд генератив хиймэл оюун ухааныг аюулгүй байдлаар ашиглаж байгаа нь чухал юм.
MLOps: Хүн бүрийн дутуу үнэлдэг хэсэг 🧯
Хэрэв та үүлэн дэх хиймэл оюун ухааныг үйлдвэрлэлд ажиллуулахыг хүсч байвал танд MLOp хэрэгтэй. Энэ нь загварлаг учраас биш - загварууд өөрчлөгдөж, өгөгдөл өөрчлөгдөж, хэрэглэгчид хамгийн муу аргаар бүтээлч байдаг учраас . Google Cloud: MLOp гэж юу вэ?
Гол хэсгүүд:
-
Туршилтын хяналт : MLflow Tracking-д
-
Загварын бүртгэл : батлагдсан загварууд, хувилбарууд, мета өгөгдөл MLflow Загварын бүртгэл Vertex AI Загварын бүртгэл
-
Машины ур чадварт зориулсан CI-CD : туршилт + байршуулалтын автоматжуулалт Google Cloud MLOps (CD & автоматжуулалт)
-
Онцлог дэлгүүр : сургалт болон дүгнэлтийн туршид тогтвортой онцлогууд SageMaker Онцлог дэлгүүр
-
Хяналт : гүйцэтгэлийн хэлбэлзэл, хазайлтын дохио, хоцрогдол, зардал SageMaker Model Monitor Vertex AI Model Monitoring
-
Буцаах стратеги : тийм ээ, ердийн програм хангамж шиг
Хэрэв та үүнийг үл тоомсорловол бүх зүйл амьд, юу ч шошгогүй, хаалгыг нь онгойлгохоос айдаг "загвар амьтны хүрээлэн" 🦓-тай болно.
Аюулгүй байдал, Нууцлал болон Дүрэм журмын хэрэгжилт (Хөгжилтэй хэсэг биш ч гэсэн... Тийм ээ) 🔐😅
Үүлэн тооцооллын хиймэл оюун ухаан нь хэд хэдэн сонирхолтой асуултыг бий болгодог:
Өгөгдлийн хандалтын хяналт 🧾
Сургалтын өгөгдөлд хэн хандах боломжтой вэ? Дүгнэлтийн бүртгэлүүд? Санал хүсэлтүүд? Гаралтууд?
Шифрлэлт ба нууцууд 🗝️
Түлхүүр, жетон болон итгэмжлэлүүдийг зөв зохицуулах шаардлагатай. “Тохиргооны файл дотор” гэдэг нь зохицуулагдаагүй байна.
Тусгаарлалт ба түрээс 🧱
Зарим байгууллагууд хөгжүүлэлт, тайз, продакшнд тусдаа орчин шаарддаг. Үүлэн технологи тусалдаг - гэхдээ та үүнийг зөв тохируулсан тохиолдолд л хангалттай.
Аудит хийх чадвар 📋
Зохицуулалттай байгууллагууд ихэвчлэн дараах зүйлсийг харуулах шаардлагатай байдаг:
-
ямар өгөгдөл ашигласан бэ
-
шийдвэрүүд хэрхэн гарсан бэ
-
хэн юуг байршуулсан
-
IBM watsonx.governance- ийг хэзээ өөрчилсөн бэ
Эрсдэлийн удирдлагын загвар ⚠️
Үүнд дараах зүйлс орно:
-
алдааны шалгалт
-
сөргөлдөөний туршилт
-
шуурхай тарилгын хамгаалалт (генератив хиймэл оюун ухааны хувьд)
-
аюулгүй гаралтын шүүлтүүр
Энэ бүхэн гол санаа руугаа эргэн орж байна: энэ нь зөвхөн “онлайнаар байршуулсан хиймэл оюун ухаан” биш. Энэ бол бодит хязгаарлалтын дор ажилладаг хиймэл оюун ухаан юм.
Зардал болон гүйцэтгэлийн зөвлөмжүүд (Хожим нь уйлахгүйн тулд) 💸😵💫
Тулааны туршсан хэдэн зөвлөгөө:
-
Хэрэгцээг хангасан хамгийн жижиг загварыг ашиглаарай.
Том байх нь үргэлж сайн байдаггүй. Заримдаа зүгээр л ... том байдаг. -
Боломжтой үед багцын дүгнэлт
Илүү хямд бөгөөд илүү үр ашигтай SageMaker багцын хувиргалт . -
Кэшийг идэвхтэйгээр хадгална.
Ялангуяа давтагдсан асуулга болон оруулгуудад. -
Автомат масштабтай, гэхдээ
хязгаартай Хязгааргүй масштабтай байх нь хязгааргүй зардал гэсэн үг юм. Kubernetes: Хэвтээ Pod автомат масштабтай . Надаас яаж мэдэж байгаагаа асуугаарай... үнэндээ битгий 😬 -
Төгсгөлийн цэг болон функц тус бүрийн зардлыг хянах.
Үгүй бол та буруу зүйлийг оновчтой болгоно. -
Сургалтад цэгэн урьдчилан тооцоолол ашиглах
Хэрэв таны сургалтын ажлууд тасалдал зохицуулж чадвал маш их хэмнэлт гарна Amazon EC2 цэгэн жишээнүүд Google Cloud Preemptible VMs .
Хүмүүсийн гаргадаг алдаанууд (ухаалаг багууд ч гэсэн) 🤦♂️
-
Үүлэн хиймэл оюун ухааныг "зүгээр л загвар залгах" гэж үзэх
-
Сүүлийн мөч хүртэл өгөгдлийн чанарыг үл тоомсорлох
-
SageMaker Model Monitor-г хянахгүйгээр загварыг тээвэрлэх
-
каденсийг давтан сургах төлөвлөгөөгүй байна : MLOps гэж юу вэ?
-
Аюулгүй байдлын багууд нээлтийн долоо хоног хүртэл байдаг гэдгийг мартаж байна 😬
-
Эхний өдрөөсөө хэт инженерчлэл хийх (заримдаа энгийн суурь үзүүлэлт ялдаг)
Мөн чимээгүйхэн харгис нэгэн жишээ бий: багууд хэрэглэгчид хоцрогдолыг хэр их үзэн яддагийг дутуу үнэлдэг. Арай бага нарийвчлалтай боловч хурдан загвар нь ихэвчлэн ялдаг. Хүн төрөлхтөн бол тэвчээргүй бяцхан гайхамшгууд юм.
Гол санаанууд 🧾✅
Үүлэн тооцоолол дахь хиймэл оюун ухаан нь үүлэн дэд бүтцийг ашиглан хиймэл оюун ухааныг бүтээх, ажиллуулах бүрэн дадал юм - сургалтыг өргөжүүлэх, байршуулалтыг хялбарчлах, өгөгдлийн дамжуулах хоолойг нэгтгэх, загваруудыг MLOps, аюулгүй байдал, засаглалтайгаар ажиллуулах. Google Cloud: MLOps гэж юу вэ? NIST SP 800-145 .
Товч тойм:
-
Үүлэн технологи нь хиймэл оюун ухаанд өргөжиж, түгээх дэд бүтцийг өгдөг 🚀 NIST SP 800-145
-
Хиймэл оюун ухаан нь үүлэн ажлын ачаалалд шийдвэрийг автоматжуулдаг "тархи" өгдөг 🤖
-
Ид шид нь зөвхөн сургалт биш - энэ бол байршуулалт, хяналт, засаглал юм 🧠🔐 SageMaker Model Monitor
-
Маркетингийн мананцар биш, харин багийн хэрэгцээнд үндэслэн платформуудыг сонгоорой 📌
-
Нүдний шил зүүсэн харцага шиг зардал болон үйл ажиллагааг ажигла 🦅👓 (муу зүйрлэл гэхдээ чи ойлгож байна)
Хэрэв та энд "Үүлэн тооцооллын хиймэл оюун ухаан бол зүгээр л загвар API" гэж бодож ирсэн бол үгүй ээ - энэ бол бүхэл бүтэн экосистем юм. Заримдаа дэгжин, заримдаа үймээн самуунтай, заримдаа хоёулаа нэг үдээс хойш 😅☁️
Түгээмэл асуултууд
"Үүлэн тооцоолол дахь хиймэл оюун ухаан" гэдэг нь өдөр тутмын хэрэглээнд юу гэсэн үг вэ
Үүлэн тооцоолол дахь хиймэл оюун ухаан гэдэг нь та үүлэн платформуудыг ашиглан өгөгдөл хадгалах, тооцооллыг (CPU/GPU/TPU) эргүүлэх, загваруудыг сургах, байршуулах, хянах зэрэг техник хангамжийг эзэмшихгүйгээр ашиглахыг хэлнэ. Практикт үүлэн технологи нь таны хиймэл оюун ухааны бүхэл бүтэн амьдралын мөчлөгийн ажилладаг газар болдог. Та хэрэгтэй зүйлээ хэрэгтэй үедээ түрээслээд, дуусаад хэмжээгээ багасгадаг.
Үүлэн хэв маягийн дэд бүтэц болон MLO-гүйгээр хиймэл оюун ухааны төслүүд яагаад бүтэлгүйтдэг вэ?
Ихэнх алдаа нь загвар дотор биш, харин түүний эргэн тойронд гардаг: тогтворгүй өгөгдөл, тохиромжгүй орчин, эмзэг байршуулалт, хяналт байхгүй. Үүлэн хэрэгсэл нь хадгалалт, тооцоолол, байршуулалтын хэв маягийг стандартчлахад тусалдаг тул загварууд "миний зөөврийн компьютер дээр ажилласан" дээр гацахгүй. MLOps нь алга болсон цавууг нэмж өгдөг: хянах, бүртгэл, дамжуулах хоолой, буцаах систем нь давтагдах, засвар үйлчилгээ хийх боломжтой хэвээр байна.
Үүлэн тооцоолол дахь хиймэл оюун ухааны ердийн ажлын урсгал, өгөгдлөөс үйлдвэрлэл хүртэл
Нийтлэг урсгал бол: өгөгдөл үүлэн хадгалалтад байрлаж, функц болгон боловсруулагдаж, дараа нь загварууд өргөтгөх боломжтой тооцоолол дээр дадлагаждаг. Дараа нь та API төгсгөлийн цэг, багц ажил, сервергүй тохиргоо эсвэл Kubernetes үйлчилгээгээр дамжуулан байршуулдаг. Эцэст нь та хоцрогдол, шилжилт болон зардлыг хянаж, дараа нь дахин сургалт, аюулгүй байршуулалтаар давтдаг. Ихэнх бодит дамжуулах хоолойнууд нэг удаа тээвэрлэхийн оронд байнга давтагддаг.
SageMaker, Vertex AI, Azure ML, Databricks болон Kubernetes-ийн хооронд сонголт хийх
"Хамгийн сайн платформ" маркетингийн чимээ шуугиан биш, харин багийнхаа бодит байдалд үндэслэн сонгоно уу. Удирдлагатай машины менежментийн платформууд (SageMaker/Vertex AI/Azure ML) нь сургалтын ажил, төгсгөлийн цэгүүд, бүртгэл, хяналт зэргээр үйл ажиллагааны толгойны асуудлыг бууруулдаг. Databricks нь ихэвчлэн машины менежментийг дамжуулах хоолой болон аналитикт ойрхон байлгахыг хүсдэг өгөгдлийн инженерчлэл ихтэй багуудад тохирдог. Kubernetes нь хамгийн их хяналт, тохируулгыг өгдөг боловч та найдвартай байдал, өргөтгөлийн бодлого, алдаа гарсан үед алдааг олж засварлах чадвартай.
Өнөөдөр хиймэл оюун ухааны үүлэн тохиргоонд хамгийн их харагддаг архитектурын хэв маягууд
Та дөрвөн хэв маягийг байнга харах болно: хурдны удирдлагатай ML платформууд, өгөгдөлд суурилсан байгууллагуудын хувьд lakehouse + ML, хяналтын хувьд Kubernetes дээрх контейнержуулсан ML, мөн "дотоод мэдлэгээ аюулгүй ашиглах" RAG (эргүүлэн сэргээх замаар нэмэгдүүлсэн үе) нь. RAG нь ихэвчлэн үүлэн хадгалалтад байгаа баримт бичиг, суулгалт + вектор хадгалах сан, эргүүлэн сэргээх давхарга, бүртгэлтэй хандалтын хяналтыг агуулдаг. Таны сонгосон хэв маяг нь таны засаглал болон үйл ажиллагааны төлөвшилтэй тохирч байх ёстой.
Багууд үүлэн хиймэл оюун ухааны загваруудыг хэрхэн байршуулдаг вэ: REST API, багц ажлууд, сервергүй эсвэл Kubernetes
Бүтээгдэхүүний хоцрогдол чухал үед REST API нь бодит цагийн таамаглалд түгээмэл байдаг. Багцын дүгнэлт нь хуваарьт оноо болон зардлын үр ашгийг дээшлүүлэхэд маш сайн байдаг, ялангуяа үр дүн нь шууд гарах шаардлагагүй үед. Сервергүй төгсгөлийн цэгүүд нь хурц урсгалд сайн ажиллаж чаддаг ч хүйтэн эхлэл болон хоцрогдолд анхаарал хандуулах шаардлагатай. Kubernetes нь нарийн масштабжуулалт болон платформ хэрэгслүүдтэй нэгтгэх шаардлагатай үед тохиромжтой боловч үйл ажиллагааны нарийн төвөгтэй байдлыг нэмэгдүүлдэг.
Хиймэл оюун ухааны системийг эрүүл байлгахын тулд үйлдвэрлэлд юуг хянах ёстой вэ
Наад зах нь хоцрогдол, алдааны түвшин, таамаглал тус бүрийн өртгийг хянаж, найдвартай байдал болон төсөв харагдахуйц байх ёстой. ML тал дээр загварын дагуу бодит байдал өөрчлөгдөх үед мэдээлэл болон гүйцэтгэлийн зөрүүг хянах хэрэгтэй. Ялангуяа хэрэглэгчид бүтээлчээр өрсөлдөж болох бүтээмжтэй хэрэглээний тохиолдлуудад захын тохиолдлууд болон муу гаралтыг бүртгэх нь чухал юм. Загварууд ухрахад сайн хяналт нь буцаах шийдвэрийг дэмждэг.
Гүйцэтгэлийг бууруулахгүйгээр үүлэн хиймэл оюун ухааны зардлыг бууруулах
Нийтлэг арга бол шаардлагыг хангасан хамгийн жижиг загварыг ашиглах, дараа нь багцлах болон кэшлэх замаар дүгнэлтийг оновчтой болгох явдал юм. Автомат масштаблах нь тусалдаг боловч "уян хатан" нь "хязгааргүй зардал" болж хувирахгүйн тулд хязгаарлалт шаардлагатай. Сургалтын хувьд, хэрэв таны ажил тасалдлыг тэсвэрлэдэг бол цэгэн/урьдчилан сэргийлэх тооцоолол нь ихээхэн хэмнэлт гаргаж чадна. Төгсгөлийн цэг болон функц тус бүрийн зардлыг хянах нь системийн буруу хэсгийг оновчтой болгохоос сэргийлдэг.
Үүлэн технологид хиймэл оюун ухаантай холбоотой хамгийн том аюулгүй байдал болон нийцлийн эрсдэлүүд
Том эрсдэлүүд нь хяналтгүй өгөгдөлд хандах, нууцлалын менежментийн сул байдал, хэн юуг сургаж, байршуулсан талаарх аудитын мөр дутмаг байдал юм. Үүсгэх хиймэл оюун ухаан нь шуурхай тарилга, аюултай гаралт, бүртгэлд мэдрэмтгий өгөгдөл гарч ирэх зэрэг нэмэлт толгойны өвчин нэмдэг. Олон дамжуулах хоолойд орчны тусгаарлалт (dev/staging/prod) болон шуурхай, гаралт, дүгнэлтийн бүртгэлд тодорхой бодлого шаардлагатай байдаг. Хамгийн аюулгүй тохиргоонууд нь засаглалыг эхлүүлэх долоо хоногийн засвар биш харин системийн гол шаардлага гэж үздэг.
Лавлагаа
-
Стандарт ба технологийн үндэсний хүрээлэн (NIST) - SP 800-145 (Эцсийн) - csrc.nist.gov
-
Google Cloud - Хиймэл оюун ухаанд зориулсан GPU - cloud.google.com
-
Google Cloud - Cloud TPU баримт бичиг - docs.cloud.google.com
-
Амазоны Вэб Үйлчилгээ (AWS) - Амазоны S3 (объект хадгалах) - aws.amazon.com
-
Амазоны Вэб Үйлчилгээ (AWS) - Өгөгдлийн нуур гэж юу вэ? - aws.amazon.com
-
Амазоны Вэб Үйлчилгээ (AWS) - Өгөгдлийн агуулах гэж юу вэ? - aws.amazon.com
-
Амазоны Вэб Үйлчилгээ (AWS) - AWS Хиймэл Оюун Ухааны Үйлчилгээ - aws.amazon.com
-
Google Cloud - Google Cloud хиймэл оюун ухааны API-ууд - cloud.google.com
-
Google Cloud - MLOps гэж юу вэ? - cloud.google.com
-
Google Cloud - Vertex хиймэл оюун ухааны загварын бүртгэл (Танилцуулга) - docs.cloud.google.com
-
Улаан малгай - REST API гэж юу вэ? - redhat.com
-
Amazon Web Services (AWS) баримтжуулалт - SageMaker Batch Transform - docs.aws.amazon.com
-
Amazon Web Services (AWS) - Өгөгдлийн агуулах болон өгөгдлийн нуур болон өгөгдлийн захын ялгаа - aws.amazon.com
-
Microsoft Learn - Azure ML бүртгэлүүд (MLOps) - learn.microsoft.com
-
Google Cloud - Google Cloud Storage-н тойм - docs.cloud.google.com
-
arXiv - Дахин сэргээх-өргөтгөсөн үе (RAG) баримт бичиг - arxiv.org
-
Amazon Web Services (AWS) баримтжуулалт - SageMaker сервергүй дүгнэлт - docs.aws.amazon.com
-
Kubernetes - Хэвтээ Pod автоматаар масштаблах - kubernetes.io
-
Google Cloud - Vertex AI багц таамаглал - docs.cloud.google.com
-
Amazon Web Services (AWS) баримтжуулалт - SageMaker Model Monitor - docs.aws.amazon.com
-
Google Cloud - Vertex хиймэл оюун ухааны загварын хяналт (Загварын хяналтыг ашиглах) - docs.cloud.google.com
-
Амазоны Вэб Үйлчилгээ (AWS) - Амазоны EC2 Спот Инстансууд - aws.amazon.com
-
Google Cloud - Урьдчилан тохируулж болох виртуал машинууд - docs.cloud.google.com
-
Amazon Web Services (AWS) баримтжуулалт - AWS SageMaker: Энэ хэрхэн ажилладаг вэ (Сургалт) - docs.aws.amazon.com
-
Google Cloud - Google Vertex хиймэл оюун ухаан - cloud.google.com
-
Microsoft Azure - Azure Машин Сургалт - azure.microsoft.com
-
Датабрикс - Датабрикс нуурын байшин - databricks.com
-
Цасан ширхэгийн баримтжуулалт - Цасан ширхэгийн хиймэл оюун ухааны онцлогууд (Тойм гарын авлага) - docs.snowflake.com
-
IBM - IBM watsonx - ibm.com
-
Google Cloud - Cloud Natural Language API баримт бичиг - docs.cloud.google.com
-
Цасан ширхэгийн баримтжуулалт - Цасан ширхэгийн кортексийн хиймэл оюун ухааны функцууд (AI SQL) - docs.snowflake.com
-
MLflow - MLflow Tracking - mlflow.org
-
MLflow - MLflow загварын бүртгэл - mlflow.org
-
Google Cloud - MLOps: Машин сургалтын тасралтгүй хүргэлт ба автоматжуулалтын шугам хоолой - cloud.google.com
-
Амазоны Вэб Үйлчилгээ (AWS) - SageMaker Онцлог Дэлгүүр - aws.amazon.com
-
IBM - IBM watsonx.засаглал - ibm.com