Товч хариулт: Практик дээр ажилладаг хиймэл оюун ухааны агент бүтээхийн тулд үүнийг хяналттай давталт гэж үз: оролтыг авч, дараагийн үйлдлийг шийдэж, нарийн хүрээтэй хэрэгслийг дуудаж, үр дүнг нь ажиглаж, тодорхой "дууссан" шалгалт тэнцэх хүртэл давтана уу. Даалгавар олон үе шаттай, хэрэгсэлд суурилсан үед энэ нь өөрийн үр дүнг авдаг; хэрэв ганцхан хүсэлт үүнийг шийдвэл агентыг алгас. Хэрэгслүүд ажиллахаа больсон эсвэл оролтууд тодорхойгүй үед агент давталт хийхийн оронд өргөждөг байхаар хатуу хэрэгслийн схем, алхамын хязгаар, бүртгэл, баталгаажуулагч/шүүмжлэгч нэмнэ үү.
Гол дүгнэлтүүд:
Хянагчийн давталт : Оролт → үйлдэл → тодорхой зогсоох нөхцөл болон хамгийн их алхам бүхий давталтыг ажиглана.
Багажны загвар : “Юу ч хийх” эмх замбараагүй байдлаас урьдчилан сэргийлэхийн тулд хэрэгслүүдийг нарийсгаж, бичсэн, зөвшөөрөгдсөн, баталгаажсан байлга.
Санах ойн эрүүл ахуй : Богино хугацааны авсаархан төлөв болон урт хугацааны сэргээлтийг ашиглах; бүрэн хуулбарыг хаяхаас зайлсхий.
Буруу ашиглалтын эсэргүүцэл : Эрсдэлтэй үйлдлүүдэд зөвшөөрөгдсөн жагсаалт, ханшийн хязгаар, импотенци болон "хуурай ажиллагаа"-г нэмнэ үү.
Туршилтын чадвар : Сценарийн багцыг (алдаа, тодорхойгүй байдал, тарилга) хадгалж, өөрчлөлт бүр дээр дахин ажиллуулах.

🔗 AI гүйцэтгэлийг хэрхэн хэмжих вэ
Хурд, нарийвчлал, найдвартай байдлыг хэмжих практик хэмжүүрүүдийг сур.
🔗 AI-тай хэрхэн ярих вэ
Илүү сайн хариулт авахын тулд сануулга, нөхцөл байдал болон дараагийн үйлдлийг ашиглаарай.
🔗 Хиймэл оюун ухааны загваруудыг хэрхэн үнэлэх вэ
Тест, рубрик болон бодит ертөнцийн даалгаврын үр дүнг ашиглан загваруудыг харьцуул.
🔗 Хиймэл оюун ухааны загваруудыг хэрхэн оновчтой болгох вэ
Мод тааруулах, тайрах, хянах замаар чанар, зардлыг сайжруулна.
1) Хиймэл оюун ухааны агент гэж энгийн хүний хувьд юу вэ 🧠
Хиймэл оюун ухааны агент бол давталт юм. LangChain “Агентууд” баримт бичиг
Ингээд л болоо. Голдоо тархитай гогцоо.
Оролт → бодох → үйлдэл → ажиглах → давтах . ReAct цаас (шалтгаан + үйлдэл)
Хаана:
-
Оролт нь хэрэглэгчийн хүсэлт эсвэл үйл явдал (шинэ имэйл, дэмжлэгийн тасалбар, мэдрэгчийн ping) юм.
-
Сэтгэх нь дараагийн алхамын талаарх эргэцүүлэн бодох хэлний загвар юм.
-
Act нь хэрэгслийг дуудаж байна (дотоод баримт бичгийг хайх, код ажиллуулах, тасалбар үүсгэх, хариулт ноороглох). OpenAI функц дуудлагын гарын авлага
-
Ажиглалт нь багажийн гаралтыг уншиж байна.
-
Давталт гэдэг нь "чавь яриа" гэхийн оронд "ажил хэрэгч" мэдрэмж төрүүлдэг хэсэг юм. LangChain "Агентууд" баримт бичиг
Зарим агентууд нь үндсэндээ ухаалаг макро байдаг. Бусад нь даалгавруудыг зохицуулж, алдаанаас нь сэргээж чаддаг залуу оператор шиг ажилладаг. Хоёулаа чухал.
Мөн танд бүрэн бие даасан байдал хэрэггүй. Үнэндээ... та үүнийг хүсэхгүй байх 🙃
2) Хэзээ агент үүсгэх ёстой вэ (мөн хэзээ хийх ёсгүй вэ) 🚦
Дараах тохиолдолд агент үүсгэнэ үү:
-
Ажил нь олон үе шаттай бөгөөд дунд нь юу болж байгаагаас хамааран өөрчлөгддөг.
-
Ажилд (өгөгдлийн сан, CRM, код гүйцэтгэх, файл үүсгэх, хөтөч, дотоод API) ашиглах LangChain “Хэрэгслүүд” баримт бичиг
-
Та зөвхөн нэг удаагийн хариулт биш, харин хашлагатай холбоотой давтагдах үр дүнг
-
Та "дууссан" гэдгийг компьютер шалгаж чадах байдлаар, тэр ч байтугай сулхан ч гэсэн тодорхойлж болно.
Дараах тохиолдолд агент үүсгэж болохгүй:
-
Энгийн асуулт + хариулт үүнийг шийддэг (хэт их инженерчлэл хийх хэрэггүй, дараа нь өөрийгөө үзэн ядах болно).
-
Танд төгс детерминизм хэрэгтэй (агентууд тууштай байж болох ч робот биш).
-
Танд холбогдох ямар ч хэрэгсэл эсвэл өгөгдөл байхгүй - тэгвэл энэ нь ихэвчлэн зүгээр л мэдрэмж юм.
Шударгаар хэлэхэд: “Хиймэл оюун ухааны агентын төслүүд”-ийн тал хувь нь цөөн хэдэн салбарлах дүрэмтэй ажлын урсгал байж болно. Гэхдээ заримдаа уур амьсгал нь бас чухал байдаг 🤷♂️
3) Хиймэл оюун ухааны агентын сайн хувилбарыг юу бүрдүүлдэг вэ ✅
Таны асуусан "Сайн хувилбарыг юу бүрдүүлдэг вэ" хэсэг энд байна, гэхдээ би жаахан шулуухан хэлье:
Хиймэл оюун ухааны сайн агент бол хамгийн хатуу боддог агент биш
-
Юу хийхийг зөвшөөрсөнөө мэддэг (хамрах хүрээний хил хязгаар)
-
Хэрэгслийг найдвартай ашигладаг (бүтэцлэгдсэн дуудлага, дахин оролдлого, хугацаа дуусах) OpenAI функц дуудлагын гарын авлага AWS “Хугацаа дуусах, дахин оролдлого хийх, чичиргээтэй буцах”
-
Төлөвийг цэвэр байлгадаг (ялзрахгүй санах ой) LangChain “Санах ойн тойм”
-
Үйлдлүүдээ тайлбарладаг (нууц үндэслэлийн мэдээлэл биш, харин аудитын мөр) NIST AI RMF 1.0 (найдвартай байдал ба ил тод байдал)
-
Зохих ёсоор зогсдог (дуусалтын шалгалт, дээд алхам, өсөлт) LangChain “Агентууд” баримт бичиг
-
Аюулгүй бүтэлгүйтдэг (тусламж хүсдэг, эрх мэдэлтнүүдийг хий үзэгдэлд оруулдаггүй) NIST AI RMF 1.0
-
Туршиж болно (та үүнийг лаазалсан хувилбарууд дээр ажиллуулж, үр дүнг нь оноож болно)
Хэрэв таны агентыг туршиж үзэх боломжгүй бол энэ нь үндсэндээ маш итгэлтэй слот машин юм. Үдэшлэг дээр хөгжилтэй, продакшн дээр аймшигтай 😬
4) Агентын гол бүтцийн хэсгүүд ("анатоми" 🧩)
Ихэнх хатуу бодисууд дараах хэсгүүдтэй байдаг:
А) Хянагчийн гогцоо 🔁
Энэ бол найрал хөгжимчин:
-
гоол оруулах
-
дараагийн үйлдлийг загвараас асуух
-
ажиллуулах хэрэгсэл
-
ажиглалт нэмэх
-
Дуустал давтана уу LangChain “Агентууд” баримт бичиг
B) Хэрэгслүүд (өөрөөр хэлбэл чадварууд) 🧰
Агентыг үр дүнтэй болгодог зүйл бол хэрэгслүүд юм: LangChain “Хэрэгслүүд” баримт бичиг
-
мэдээллийн сангийн лавлагаа
-
имэйл илгээх
-
файл татах
-
ажиллаж байгаа код
-
дотоод API-г дуудаж байна
-
хүснэгт эсвэл CRM систем рүү бичих
C) Ой санамж 🗃️
Хоёр төрөл чухал:
-
богино хугацааны ой санамж : одоогийн ажиллах нөхцөл, сүүлийн үеийн алхмууд, одоогийн төлөвлөгөө
-
Урт хугацааны санах ой : хэрэглэгчийн тохиргоо, төслийн нөхцөл байдал, олж авсан мэдлэг (ихэвчлэн суулгалт + вектор хадгалах замаар) RAG цаас
D) Төлөвлөлт ба шийдвэр гаргах бодлого 🧭
Та үүнийг "төлөвлөлт" гэж нэрлээгүй ч гэсэн танд дараах арга хэрэгтэй:
-
шалгах хуудас
-
ReAct хэв маягийн “бодоод дараа нь хэрэгсэл болго” ReAct цаас
-
даалгаврын графикууд
-
удирдагч-ажилчин хэв маяг
-
хянагч-ажилчин загварууд Microsoft AutoGen (олон агентын хүрээ)
E) Хашлага болон үнэлгээ 🧯
-
зөвшөөрөл
-
OpenAI бүтэцлэгдсэн гаралтын аюулгүй хэрэгслийн схемүүд
-
гаралтын баталгаажуулалт
-
алхамын хязгаар
-
мод бэлтгэл
-
NIST AI RMF 1.0 тестүүд
Тийм ээ, энэ бол өдөөлтөөс илүү инженерчлэл юм. Энэ бол ... гол санаа нь юм.
5) Харьцуулсан хүснэгт: агент бүтээх түгээмэл аргууд 🧾
Доор бодитой "Харьцуулалтын хүснэгт" байна - цөөн хэдэн өвөрмөц онцлогтой, учир нь жинхэнэ багууд өвөрмөц байдаг 😄
| Хэрэгсэл / Хүрээ | Үзэгчид | Үнэ | Яагаад ажилладаг вэ | Тэмдэглэл (жижигхэн эмх замбараагүй байдал) | |
|---|---|---|---|---|---|
| ЛангЧэйн | лего маягийн эд ангиудад дуртай барилгачид | чөлөөт + доорх | багаж хэрэгсэл, санах ой, гинжний том экосистем | Хэрэв та юмсыг тодорхой нэрлэхгүй бол спагетти хурдан идэж болно | |
| ЛламаИндекс | RAG-хүнд багууд | чөлөөт + доорх | хүчтэй хайлтын хэв маяг, индексжүүлэлт, холбогч | Таны агент үндсэндээ "хайлт + үйлдэл" хийх үед гайхалтай ... энэ нь нийтлэг байдаг | |
| OpenAI Туслахуудын хэв маягийн арга барил | багууд илүү хурдан тохиргоо хийхийг хүсч байна | хэрэглээнд суурилсан | суулгагдсан хэрэгслийн дуудлагын хэв маяг болон ажиллах төлөв | зарим буланд уян хатан чанар багатай боловч олон аппликейшнд цэвэрхэн | OpenAI нь API OpenAI Туслах функц дуудлагыг |
| Семантик цөм | бүтэцлэгдсэн найрал хөгжим хүсдэг хөгжүүлэгчид | чөлөөт маягийн | ур чадвар/функцүүдийн цэвэр хийсвэрлэл | "аж ахуйн нэгжийн цэвэр цэмцгэр" мэт санагддаг - заримдаа энэ нь магтаал болдог 😉 | |
| Автоген | олон агентын туршилт хийгчид | чөлөөт маягийн | агент хоорондын хамтын ажиллагааны хэв маяг | хэт их ярьж болно; ажлаас халах хатуу дүрмийг тогтооно | |
| CrewAI | "Агентуудын баг"-ын хөгжөөн дэмжигчид | чөлөөт маягийн | Үүрэг + даалгавар + хүлээлгэн өгөх зүйлсийг илэрхийлэхэд хялбар байдаг | Даалгаврууд нь нялцгай биш, харин тодорхой байх үед хамгийн сайн ажилладаг | |
| Өвсний овоолго | хайлт + дамжуулах хоолойн хүмүүс | чөлөөт маягийн | хатуу дамжуулах хоолой, татаж авах, эд ангиуд | "агентийн театр" бага, "практик үйлдвэр" илүү | |
| Өөрийн гараар өнхрүүлэх (захиалгат гогцоо) | хянах донтонгууд (хайртай) | таны цаг | хамгийн бага ид шид, хамгийн их тод байдал | ихэвчлэн хамгийн сайн урт хугацааны... бүх зүйлийг шинээр зохион бүтээх хүртэл 😅 |
Ганц ялагч байхгүй. Хамгийн сайн сонголт нь таны агентын үндсэн ажил нь мэдээлэл авах , багаж хэрэгслийн гүйцэтгэл , олон агентын зохицуулалт эсвэл ажлын урсгалын автоматжуулалт .
6) Хиймэл оюун ухааны агентийг алхам алхмаар хэрхэн бүтээх вэ (бодит жор) 🍳🤖
Энэ хэсгийг ихэнх хүмүүс алгасдаг, дараа нь агент яагаад агуулахад байгаа элбэнх шиг аашилж байгааг гайхдаг.
Алхам 1: Ажлыг нэг өгүүлбэрээр тодорхойл 🎯
Жишээ нь:
-
"Бодлого болон тасалбарын агуулгыг ашиглан хэрэглэгчийн хариултыг ноороглоод, дараа нь зөвшөөрөл хүснэ үү."
-
"Алдааны тайланг судалж, хуулбарлаж, засах санал гарга."
-
"Төгс бус уулзалтын тэмдэглэлийг даалгавар, эзэмшигч, хугацаа болгон хувирга."
Хэрэв та үүнийг энгийнээр тодорхойлж чадахгүй бол таны агент ч бас тодорхойлж чадахгүй. Би чадна гэж хэлэх гээд байна, гэхдээ энэ нь импровизаци хийх бөгөөд импровизаци нь төсөв мөхдөг газар юм.
Алхам 2: Бие даасан байдлын түвшинг (бага, дунд, халуун ногоотой) шийднэ үү 🌶️
-
Бага бие даасан байдал : алхамуудыг санал болгодог, хүний товшилтоор "батлах"
-
Дунд зэрэг : хэрэгслүүдийг ажиллуулж, гаралтын ноорог гаргаж, тодорхойгүй байдлыг нэмэгдүүлдэг
-
Өндөр : зөвхөн үл хамаарах тохиолдолд хүмүүсийг пинглэх замаар төгсгөлөөс төгсгөл хүртэлх командуудыг гүйцэтгэдэг
Хүссэнээсээ багаар эхэл. Та дараа нь үргэлж нэмэгдүүлж болно.
Алхам 3: Загварын стратегиа сонгоно уу 🧠
Та ихэвчлэн дараахыг сонгоно:
-
бүх зүйлд зориулсан нэг хүчтэй загвар (энгийн)
-
нэг хүчтэй загвар + хямд алхамуудын жижиг загвар (ангилал, чиглүүлэлт)
-
шаардлагатай бол тусгай загварууд (алсын хараа, код, яриа)
Мөн шийднэ үү:
-
хамгийн их токен
-
температур
-
Та дотооддоо урт хугацааны үндэслэлийн мөрийг зөвшөөрөх эсэх (та зөвшөөрч болно, гэхдээ түүхий бодлын гинжин хэлхээг эцсийн хэрэглэгчдэд ил болгож болохгүй)
Алхам 4: Хатуу схем бүхий хэрэгслүүдийг тодорхойл 🔩
Хэрэгслүүд нь:
-
нарийн
-
бичсэн
-
зөвшөөрөлтэй
-
баталгаажсан OpenAI бүтэцлэгдсэн гаралтууд
do_anything(input: string) гэсэн хэрэгслийн оронд дараахийг хийнэ үү:
-
search_kb(query: string) -> үр дүн[] -
create_ticket(гарчиг: мөр, их бие: мөр, тэргүүлэх чиглэл: тоололт) -> ticket_id -
send_email(to: string, subject: string, body: string) -> statusOpenAI функц дуудах гарын авлага
Хэрэв та агентад хөрөө өгвөл хашааг нь бас авч хашааг тайрахад цочирдох хэрэггүй.
Алхам 5: Хянагч гогцоог бүтээх 🔁
Хамгийн бага давталт:
-
Зорилго + анхны нөхцөл байдлаас эхэл
-
Загвараас асуу: "Дараагийн үйлдэл үү?"
-
Хэрэв хэрэгсэл дуудвал - хэрэгслийг ажиллуулна уу
-
Ажиглалтыг нэмэх
-
Зогсоолын нөхцөл байдлыг шалгах
-
LangChain “Агентууд” баримт бичгийг (хамгийн их алхамаар) давтана уу
Нэмэх:
-
завсарлага
-
дахин оролдлого (болгоомжтой - дахин оролдлого давтагдах боломжтой) AWS “Хугацаа дуусах, дахин оролдох, чичиргээтэй буцах”
-
хэрэгслийн алдааны форматлалт (тодорхой, бүтэцлэгдсэн)
Алхам 6: Санах ойгоо болгоомжтой нэмнэ үү 🗃️
Богино хугацаанд: алхам тутамдаа шинэчилсэн авсаархан "төлөвийн хураангуй"-г хадгалах. LangChain "Санах ойн тойм"
Урт хугацаанд: бат бөх баримтуудыг хадгалах (хэрэглэгчийн тохиргоо, байгууллагын дүрэм, тогтвортой баримт бичиг).
Эрхий хурууны дүрэм:
-
Хэрэв энэ нь байнга өөрчлөгддөг бол - богино хугацаанд байлга
-
Хэрэв тогтвортой бол удаан хугацаанд хадгална
-
Хэрэв мэдрэмтгий бол - хамгийн бага хэмжээгээр хадгална (эсвэл огт хадгалахгүй)
Алхам 7: Баталгаажуулалт болон "шүүмжлэгч" гэсэн оноог нэмнэ үү 🧪
Хямд, практик загвар:
-
агент үр дүнг бий болгодог
-
Баталгаажуулагч бүтэц болон хязгаарлалтыг шалгадаг
-
Алхам дутуу эсвэл бодлогын зөрчлийн талаарх нэмэлт шүүмжлэгч загварын тойм NIST AI RMF 1.0
Төгс биш ч гэсэн цочирдом хэмжээний утгагүй зүйлийг агуулсан.
Алхам 8: Бүртгэл хийгээгүйдээ харамсах бүх зүйлээ тэмдэглэ 📜
Лог:
-
хэрэгслийн дуудлага + оролт + гаралт
-
гаргасан шийдвэрүүд
-
алдаанууд
-
эцсийн гаралтууд
-
Токен ба хоцрогдол OpenTelemetry ажиглалтын праймер
Ирээдүй - чи чамд талархах болно. Одоо - чи мартах болно. Энэ бол зүгээр л амьдрал 😵💫
7) Сэтгэлийг чинь шархлуулахгүй хэрэгсэл дуудах 🧰😵
Хэрэгслийн дуудлага бол "Хиймэл оюун ухааны агент хэрхэн бүтээх вэ" гэдэг нь жинхэнэ програм хангамжийн инженерчлэл болж хувирдаг газар юм.
Багаж хэрэгслийг найдвартай болгох (найдвартай байх нь сайн)
Найдвартай хэрэгслүүд нь:
-
детерминистик
-
нарийн хүрээтэй
-
шалгахад хялбар
-
Stripe “Idempotent requests”-ийг дахин ажиллуулахад аюулгүй
Зөвхөн зааварчилгаа биш, харин багажны давхарга дээр хашлага нэмнэ үү
Санал хүсэлтүүд нь эелдэг саналууд юм. Хэрэгслийн баталгаажуулалт нь түгжигдсэн хаалга юм. OpenAI бүтэцлэгдсэн гаралтууд
Хийх:
-
зөвшөөрөгдсөн жагсаалтууд (ажиллуулж болох хэрэгслүүд)
-
оролтын баталгаажуулалт
-
хэрэглэгч/байгууллага бүрийн зөвшөөрлийн шалгалт
-
Эрсдэлтэй үйлдлийн "хуурай ажиллуулах горим"
Хэсэгчилсэн бүтэлгүйтлийн загвар
Хэрэгслүүд ажиллахаа больсон. Сүлжээ ганхаж байна. Баталгаажуулалтын хугацаа дуусна. Агент дараах зүйлсийг хийх ёстой:
-
алдааг тайлбарлах
-
тохиромжтой үед буцаан оролдлого хийж дахин оролдоно уу Google Cloud дахин оролдох стратеги (буцаан олголт + чичиргээ)
-
өөр хэрэгслүүдийг сонгох
-
гацсан үед хурцадмал байдал
Чимээгүйхэн үр дүнтэй арга: дараах бүтэцлэгдсэн алдааг буцаах:
-
төрөл: auth_error -
төрөл: олдсонгүй -
төрөл: rate_limited
Тиймээс загвар нь сандрахын оронд ухаалаг хариу үйлдэл үзүүлэх боломжтой.
8) Чамайг зовоохын оронд тусалдаг дурсамж 👻🗂️
Ой санамж хүчтэй боловч хог хаягдлын шургуулга болж ч болно.
Богино хугацааны ой санамж: нягт байлгах
Хэрэглээ:
-
сүүлийн N алхам
-
ажиллаж байгаа хураангуй (давталт бүрийг шинэчилдэг)
-
одоогийн төлөвлөгөө
-
одоогийн хязгаарлалтууд (төсөв, цаг хугацаа, бодлого)
Хэрэв та бүх зүйлийг контекстэд оруулбал дараахь зүйлийг авна
-
өндөр өртөгтэй
-
удаан хоцрогдол
-
илүү их төөрөгдөл (тийм ээ, тэр үед ч гэсэн)
Урт хугацааны ой санамж: "чихмэл"-ээс илүү сэргээн санах ой
Ихэнх "урт хугацааны ой санамж" нь дараахь зүйлтэй төстэй байдаг
-
оруулга
-
вектор дэлгүүр
-
сэргээн засварлах нэмэгдүүлсэн үе (RAG) RAG цаас
Агент цээжилдэггүй. Энэ нь ажиллах үед хамгийн хамааралтай хэсгүүдийг авдаг. LlamaIndex “RAG-ийн танилцуулга”
Практик санах ойн дүрэм
-
"Сонголтууд"-ыг тодорхой баримт болгон хадгалах: "Хэрэглэгч товч хураангуйд дуртай бөгөөд эможид дургүй" (хэхэ, гэхдээ энд байхгүй 😄)
-
"Шийдвэрүүд"-ийг цагийн тэмдэг эсвэл хувилбараар хадгалах (эс тэгвээс зөрчилдөөн овоолно)
-
Үнэхээр шаардлагагүй бол хэзээ ч нууц хадгалах хэрэггүй
Миний төгс бус зүйрлэл энд байна: дурсамж бол хөргөгчтэй адил. Хэрэв та үүнийг хэзээ ч цэвэрлэхгүй бол эцэст нь таны сэндвич сонгино, харамсал шиг амттай болно.
9) Төлөвлөлтийн хэв маяг (энгийнээс эхлээд чамин хүртэл) 🧭✨
Төлөвлөлт бол зүгээр л хяналттай задрал юм. Үүнийг нууцлаг болгож болохгүй.
А загвар: Шалгах хуудасны төлөвлөгч ✅
-
Загвар нь алхмуудын жагсаалтыг гаргадаг
-
Алхам алхмаар гүйцэтгэдэг
-
Шалгах хуудасны төлөвийг шинэчилдэг
Шинээр элсэхэд маш тохиромжтой. Энгийн, туршиж үзэх боломжтой.
B загвар: ReAct давталт (шалтгаан + үйлдэл) 🧠→🧰
-
загвар нь дараагийн хэрэгслийн дуудлагыг шийддэг
-
гаралтыг ажигладаг
-
ReAct цаасыг давтана
Энэ бол агентын сонгодог мэдрэмж юм.
C загвар: Ахлах ажилтан 👥
-
удирдагч зорилгоо даалгавар болгон хуваадаг
-
ажилчид тусгай даалгавруудыг гүйцэтгэдэг
-
хянагч нь үр дүнг нэгтгэдэг Microsoft AutoGen (олон агентын хүрээ)
Энэ нь даалгавруудыг зэрэгцээ хийх боломжтой үед эсвэл та өөр өөр "үүрэг" хүсч байвал, тухайлбал:
-
судлаач
-
кодлогч
-
редактор
-
Чанарын баталгаа шалгагч
D хэв маяг: Дахин төлөвлөлт хийж, дараа нь хэрэгжүүл 🔄
-
төлөвлөгөө үүсгэх
-
гүйцэтгэх
-
Хэрэв хэрэгслийн үр дүн бодит байдлыг өөрчилвөл дахин төлөвлөх
Энэ нь төлөөлөгчийг муу төлөвлөгөөг зөрүүдлэн дагахаас сэргийлдэг. Хүмүүс ядарсан л бол үүнийг хийдэг бөгөөд энэ тохиолдолд тэд бас муу төлөвлөгөөг дагадаг.
10) Аюулгүй байдал, найдвартай байдал, ажлаас халагдахгүй байх 🔐😅
Хэрэв таны агент арга хэмжээ авч чадвал танд аюулгүй байдлын дизайн хэрэгтэй. "Байхад сайхан биш" гэсэн үг. Хэрэгцээ. NIST AI RMF 1.0
Хатуу хязгаарлалтууд
-
гүйлт тутамд хамгийн их алхам
-
минутанд хамгийн их хэрэгслийн дуудлага
-
нэг удаагийн зарцуулалтын дээд хэмжээ (токен төсөв)
-
зөвшөөрлийн ард хязгаарлагдмал хэрэгслүүд
Өгөгдөл боловсруулах
-
бүртгэл хийхээс өмнө мэдрэмтгий оролтыг засах
-
тусдаа орчин (хөгжүүлэгч болон үйлдвэрлэл)
-
хамгийн бага эрхтэй хэрэгслийн зөвшөөрөл
Зан үйлийн хязгаарлалт
-
агентыг дотоод нотлох баримтын хэсгүүдийг иш татахад хүргэх (гадаад холбоос биш, зөвхөн дотоод лавлагаа)
-
өөртөө итгэх итгэл бага үед тодорхойгүй байдлын тэмдэглэгээ шаарддаг
-
Хэрэв оролтууд хоёрдмол утгатай бол "тодруулга асуулт асуух" шаардлагатай
Найдвартай агент гэдэг хамгийн итгэлтэй агент биш. Таамаглаж байгаагаа мэддэг, тэгж хэлдэг хүн л байдаг.
11) Туршилт ба үнэлгээ (хүн бүрийн зайлсхийдэг хэсэг) 🧪📏
Чи хэмжиж чадахгүй зүйлээ сайжруулж чадахгүй. Тийм ээ, энэ үг утгагүй ч гэсэн үнэхээр үнэн.
Сценарийн багц бүтээх
30-100 туршилтын тохиолдол үүсгэх:
-
аз жаргалтай замууд
-
ирмэгийн хайрцагнууд
-
"Багаж хэрэгсэл эвдэрсэн" тохиолдлууд
-
тодорхой бус хүсэлтүүд
-
сөргөлдөөнтэй өдөөлтүүд (шууд оруулах оролдлогууд) LLM аппликейшнуудын OWASP шилдэг 10 OWASP LLM01 Шууд оруулах
Онооны үр дүн
Дараах үзүүлэлтүүдийг ашиглана уу:
-
даалгаврын амжилтын түвшин
-
дуусгах хугацаа
-
багажны алдааг сэргээх түвшин
-
хий үзэгдлийн түвшин (нотлох баримтгүй мэдэгдэл)
-
хүний зөвшөөрлийн түвшин (хяналттай горимд байгаа бол)
Заавар болон хэрэгслүүдийн регрессийн тестүүд
Та өөрчлөгдөх бүрт:
-
багажны схем
-
системийн зааварчилгаа
-
хайлтын логик
-
санах ойн форматлах
Энэ багцыг дахин ажиллуулна уу.
Эмч нар бол мэдрэмтгий амьтад. Тасалгааны ургамал шиг боловч илүү үнэтэй.
12) Төсөвт тань хэмнэлт гаргахгүй байршуулалтын загварууд 💸🔥
Нэг үйлчилгээнээс эхэл
-
агент хянагчийн API
-
үүний ард байгаа багажны үйлчилгээ
-
бүртгэл + OpenTelemetry ажиглалтын праймерын
Зардлын хяналтыг эрт нэмэх
-
кэш хайлтын үр дүн
-
харилцан ярианы төлөвийг хураангуйгаар шахаж байна
-
чиглүүлэлт болон олборлолтын жижиг загваруудыг ашиглах
-
"гүнзгий сэтгэлгээний горимыг" хамгийн хэцүү алхмуудаар хязгаарлах
Архитектурын нийтлэг сонголт
-
төлөвгүй хянагч + гадаад төлөв хадгалах сан (DB/redis)
-
Хэрэгслийн дуудлагууд боломжтой бол идемпотент байна. Stripe “Идемпотент хүсэлтүүд”
-
урт даалгавруудын дараалал (ингэснээр та вэб хүсэлтийг үүрд нээлттэй байлгахгүй)
Мөн: “алх унтраалга” хийх. Үнэхээр хэрэгтэй болтол чинь хэрэггүй 😬
13) Хаалтын тэмдэглэл - Хиймэл оюун ухааны агент хэрхэн бүтээх тухай товч мэдээлэл 🎁🤖
Хэрэв та өөр юу ч санахгүй байгаа бол дараах зүйлийг санаарай
-
Хиймэл оюун ухааны агент хэрхэн бүтээх нь голчлон загварын эргэн тойронд аюулгүй гогцоо бий болгох тухай юм. LangChain “Агентууд” баримт бичиг
-
Тодорхой зорилго, бага бие даасан байдал, хатуу чанд хэрэгслээс эхэл. OpenAI бүтэцлэгдсэн гаралт
-
Төгсгөлгүй контекст чихмэл биш, харин сэргээлтээр дамжуулан санах ойг нэмнэ үү. RAG цаас
-
Төлөвлөлт нь энгийн байж болно - шалгах хуудас болон дахин төлөвлөлт нь хол явдаг.
-
Бүртгэл болон туршилтууд нь агентын эмх замбараагүй байдлыг таны илгээж болох зүйл болгон хувиргадаг. OpenTelemetry ажиглалтын праймер
-
Хашлага нь зөвхөн зааварт төдийгүй кодонд хамаарна. LLM аппликейшнуудын OWASP-ийн шилдэг 10 нь
Агент бол ид шид биш. Энэ бол үнэ цэнэтэй байхын тулд хангалттай олон удаа зөв шийдвэр гаргадаг систем юм... мөн хохирол учруулахаасаа өмнө ялагдлаа хүлээн зөвшөөрдөг. Нэг талаараа чимээгүйхэн тайвшруулдаг 😌
Тийм ээ, хэрэв та үүнийг зөв зохиовол хэзээ ч унтдаггүй, хааяа сандардаг, бичиг цаасны ажилд дуртай жижигхэн дижитал дадлагажигч хөлслөхтэй адил мэдрэмж төрдөг. Тиймээс үндсэндээ дадлагажигч.
Түгээмэл асуултууд
Энгийнээр хэлбэл хиймэл оюун ухааны агент гэж юу вэ?
Хиймэл оюун ухааны агент нь үндсэндээ давтагддаг давталт юм: оролтыг авах, дараагийн алхмыг шийдэх, хэрэгсэл ашиглах, үр дүнг унших, дуустал нь давтах. "Агент" хэсэг нь зүгээр л чатлахаас гадна жүжиглэх, ажиглахаас үүсдэг. Олон агентууд зүгээр л хэрэгсэлд хандах боломжтой ухаалаг автоматжуулалт байдаг бол зарим нь алдаагаа засах боломжтой залуу оператор шиг аашилдаг.
Зүгээр л prompt ашиглахын оронд хэзээ хиймэл оюун ухаант агент бүтээх ёстой вэ?
Ажил нь олон үе шаттай, завсрын үр дүнд үндэслэн өөрчлөгддөг, найдвартай хэрэгсэл ашиглах (API, мэдээллийн сан, тасалбар, код гүйцэтгэх) шаардлагатай үед агент бүтээ. Агентууд нь хашлагатай давтагдах үр дүн, "дууссан" эсэхийг шалгах арга шаардлагатай үед бас хэрэгтэй. Хэрэв энгийн шуурхай хариу үйлдэл үр дүнтэй бол агент нь ихэвчлэн шаардлагагүй нэмэлт зардал болон нэмэлт алдааны горимтой байдаг.
Гогцоонд гацдаггүй хиймэл оюун ухааны агентыг хэрхэн бүтээх вэ?
Хатуу зогсолтын нөхцөлүүдийг ашиглаарай: хамгийн их алхам, хамгийн их хэрэгслийн дуудлага, цэвэр гүйцэтгэлийн шалгалт. Бүтэцлэгдсэн хэрэгслийн схем, хугацаа дуусах, мөнхөд дахин оролдохгүй дахин оролдлогуудыг нэмнэ үү. Шийдвэр болон хэрэгслийн гаралтыг бүртгэж, хаана замаасаа гарч байгааг харж болно. Аюулгүйн хавхлагын нийтлэг хэлбэр бол эскалация юм: хэрэв агент тодорхойгүй эсвэл алдаа давтвал импровизацийн оронд тусламж хүсэх хэрэгтэй.
Хиймэл оюун ухааны агент хэрхэн бүтээх вэ тоглоомын хамгийн бага архитектур хэд байх ёстой вэ?
Хамгийн багадаа танд загварт зорилго болон контекстийг өгдөг, дараагийн үйлдлийг асуудаг, шаардлагатай бол хэрэгслийг ажиллуулдаг, ажиглалтыг хавсаргадаг, давтдаг хянагчийн давталт хэрэгтэй. Мөн танд хатуу оролт/гаралтын хэлбэр, "дууссан" шалгалттай хэрэгслүүд хэрэгтэй. Хэрэв та төлөвийг цэвэр байлгаж, алхамын хязгаарыг хэрэгжүүлбэл өөрийн гэсэн давталт ч сайн ажиллаж чадна.
Үйлдвэрлэлд найдвартай байхын тулд багажны дуудлагыг хэрхэн зохион бүтээх ёстой вэ?
Хэрэгслүүдийг нарийн, бичигдсэн, зөвшөөрөгдсөн, баталгаажсан байлга - ерөнхий "do_anything" хэрэгслээс зайлсхий. Агент оролтыг гараар дамжуулж чадахгүй байхын тулд хатуу схемүүдийг (бүтэцлэгдсэн гаралт/функц дуудах гэх мэт) илүүд үзнэ үү. Хэрэгслийн давхаргад зөвшөөрөгдсөн жагсаалт, хурдны хязгаар, хэрэглэгч/байгууллагын зөвшөөрлийн шалгалтыг нэмнэ үү. Боломжтой үед дахин ажиллуулахад аюулгүй байхаар хэрэгслийг ижил потенцийн загваруудыг ашиглан зохион бүтээ.
Агентийг улам дордуулахгүйгээр санах ой нэмэх хамгийн сайн арга юу вэ?
Санах ойг хоёр хэсэг гэж үз: богино хугацааны ажиллах төлөв (сүүлийн үеийн алхмууд, одоогийн төлөвлөгөө, хязгаарлалтууд) болон урт хугацааны сэргээлт (сонголтууд, тогтвортой дүрэм, холбогдох баримт бичиг). Богино хугацааны нягтралыг бүрэн хуулбар биш, харин ажиллах хураангуйгаар хадгал. Урт хугацааны санах ойн хувьд сэргээлт (оруулга + вектор хадгалах/RAG хэв маяг) нь бүх зүйлийг контекстэд "чихэх", загварыг төөрөгдүүлэхээс илүүд үздэг.
Би ямар төлөвлөлтийн загварыг ашиглах ёстой вэ: шалгах хуудас, ReAct эсвэл удирдагч-ажилчин уу?
Даалгавруудыг урьдчилан таамаглах боломжтой бөгөөд та шалгахад хялбар зүйл хүсч байвал шалгах хуудасны төлөвлөгч маш сайн байдаг. Хэрэгслийн үр дүн таны дараагийн хийх зүйлийг өөрчлөхөд ReAct маягийн давталтууд гэрэлтдэг. Удирдах ажилтан-ажилчдын хэв маяг (AutoGen маягийн үүргийн тусгаарлалт гэх мэт) нь даалгавруудыг зэрэгцүүлэн хийх эсвэл өөр өөр үүрэг (судлаач, кодлогч, чанарын баталгаа)-аас ашиг хүртэх боломжтой үед тусалдаг. Төлөвлөөд дараа нь гүйцэтгэх, дахин төлөвлөх нь зөрүүд муу төлөвлөгөөнөөс зайлсхийх практик дунд зам юм.
Хэрэв агент бодит арга хэмжээ авч чадвал түүнийг хэрхэн аюулгүй болгох вэ?
Хамгийн бага давуу эрхтэй зөвшөөрлүүдийг ашиглаж, баталгаа эсвэл "хуурай ажиллуулах" горимын ард эрсдэлтэй хэрэгслүүдийг хязгаарлана. Төсөв болон хязгаарлалтыг нэмнэ үү: хамгийн их алхам, хамгийн их зарцуулалт, минут тутамд хэрэгслийн дуудлагын хязгаар. Бүртгэл хийхээс өмнө мэдрэмтгий өгөгдлийг арилгаж, хөгжүүлэлтийг үйлдвэрлэлийн орчноос тусгаарлана уу. Оролтууд нь хоёрдмол утгатай үед итгэлцэл нь нотлох баримтыг орлохын оронд тодорхойгүй байдлын тэмдэглэгээ эсвэл асуултуудыг тодруулахыг шаардана уу.
Цаг хугацаа өнгөрөх тусам сайжруулагдахын тулд хиймэл оюун ухааны агентийг хэрхэн туршиж, үнэлэх вэ?
Аз жаргалтай зам, захын тохиолдлууд, хэрэгслийн алдаа, тодорхойгүй хүсэлтүүд болон шуурхай оруулгын оролдлогууд (OWASP маягийн) бүхий хувилбарын багц бүтээ. Даалгаврын амжилт, дуусах хугацаа, хэрэгслийн алдаанаас сэргэх, нотлох баримтгүй нэхэмжлэл зэрэг үр дүнг үнэл. Та хэрэгслийн схем, шуурхай мэдэгдэл, сэргээх эсвэл санах ойн форматыг өөрчлөх бүртээ багцыг дахин ажиллуул. Хэрэв та үүнийг туршиж чадахгүй бол найдвартай тээвэрлэж чадахгүй.
Агентийг хоцрогдол болон зардлыг нэмэгдүүлэхгүйгээр хэрхэн байршуулах вэ?
Нийтлэг хэв маяг нь гадаад төлөвийн хадгалалт (DB/Redis), түүний ард багажны үйлчилгээ, хүчтэй бүртгэл/мониторинг (ихэвчлэн OpenTelemetry) бүхий төлөвгүй хянагч юм. Авах кэш, авсаархан төлөвийн хураангуй, чиглүүлэлт/гаргах жижиг загварууд, хамгийн хэцүү алхмуудаар "гүнзгий сэтгэлгээ"-г хязгаарлах замаар зардлыг хянах. Вэб хүсэлтийг нээлттэй байлгахгүйн тулд урт даалгавруудад дараалал ашиглаарай. Үргэлж зогсоох унтраалга оруулна уу.
Лавлагаа
-
Үндэсний Стандарт, Технологийн Хүрээлэн (NIST) - NIST AI RMF 1.0 (найдвартай байдал ба ил тод байдал) - nvlpubs.nist.gov
-
OpenAI - Бүтэцлэгдсэн гаралтууд - platform.openai.com
-
OpenAI - Функц дуудах гарын авлага - platform.openai.com
-
OpenAI - Үнийн хязгаарын гарын авлага - platform.openai.com
-
OpenAI - API ажиллуулдаг - platform.openai.com
-
OpenAI - Туслах функц дуудах - platform.openai.com
-
LangChain - Агентуудын баримт бичиг (JavaScript) - docs.langchain.com
-
LangChain - Хэрэгслүүд баримт бичиг (Python) - docs.langchain.com
-
LangChain - Санах ойн тойм - docs.langchain.com
-
arXiv - ReAct баримт бичиг (шалтгаан + үйлдэл) - arxiv.org
-
arXiv - RAG цаас - arxiv.org
-
Amazon Web Services (AWS) Builders' Library - Хугацаа дуусах, дахин оролдох, jitter-тэй буцах - aws.amazon.com
-
OpenTelemetry - Ажиглалтын праймер - opentelemetry.io
-
Stripe - Идемпотент хүсэлтүүд - docs.stripe.com
-
Google Cloud - Дахин оролдох стратеги (буцах + чичиргээ) - docs.cloud.google.com
-
OWASP - Том хэлний загварын хэрэглээний шилдэг 10 - owasp.org
-
OWASP - LLM01 Шуурхай тарилга - genai.owasp.org
-
LlamaIndex - RAG-ийн танилцуулга - developers.llamaindex.ai
-
Microsoft - Семантик цөм - learn.microsoft.com
-
Microsoft AutoGen - Олон агентын хүрээ (баримтжуулалт) - microsoft.github.io
-
CrewAI - Агентуудын концепцууд - docs.crewai.com
-
Өвсний овоолго (deepset) - Ретриверүүдийн баримт бичиг - docs.haystack.deepset.ai