Хиймэл оюун ухааны агентын төслийнхөө амжилтыг хэрхэн баталгаажуулах вэ?

Хиймэл оюун ухааны агентын төслийнхөө амжилтыг баталгаажуулахын тулд ажлыг нэг өгүүлбэрээр тодорхойлж, өөртөө тохирсон бие даасан байдлын түвшинг шийдээрэй. Түүнчлэн, нийтлэг алдаанаас урьдчилан сэргийлэх, алдааг олж засварлах ажлыг сайжруулахын тулд хатуу чанд хэрэгслийн схем, бүртгэл, баталгаажуулалтын стратеги хэрэгжүүлээрэй.

Хиймэл оюун ухааны агентынхаа хэрэгслүүдийг зохион бүтээхдээ юуг анхаарах ёстой вэ?

Хиймэл оюун ухааны агентдаа зориулсан хэрэгслүүдийг зохион бүтээхдээ тэдгээр нь нарийн фокустай, бичигдсэн, зөвшөөрөлтэй байгаа эсэхийг шалгаарай. Ямар ч үйлдэл хийж чадах ерөнхий хэрэгслүүдээс зайлсхий. Үүний оронд агент аюулгүй байдал, найдвартай байдлыг хангахын тулд ашиглаж болох тодорхой функцийн дуудлагыг үүсгээрэй.

Хиймэл оюун ухааны агентынхаа зогсоох тодорхой нөхцлийг хэрхэн тохируулах вэ?

Хиймэл оюун ухааны агентынхаа зогсолтын тодорхой нөхцлийг тохируулахын тулд түүний хийж болох хамгийн их алхмын тоог, мөн хугацаа дуусах болон гүйцэтгэлийн шалгалтыг тодорхойл. Энэ нь агентыг давталтад орохоос сэргийлж, шаардлагатай үед асуудлыг улам хурцатгах боломжийг олгоно.

Хиймэл оюун ухааны агентын санах ойг удирдах хамгийн сайн арга юу вэ?

Хиймэл оюун ухааны агентынхаа санах ойг богино болон урт хугацааны бүрэлдэхүүн хэсгүүдэд хувааж удирдаарай. Богино хугацааны санах ойг нягт байлгаж, одоогийн алхам, төлөвлөгөөнд анхаарлаа төвлөрүүлээрэй, харин хэрэглэгчийн сонголт, байгууллагын дүрэм гэх мэт тогтвортой мэдээлэлд урт хугацааны санах ойг ашиглаарай.

Хиймэл оюун ухааны агент дотор ажлуудыг төлөвлөх тодорхой хэв маяг байдаг уу?

Тийм ээ, урьдчилан таамаглах боломжтой даалгавруудын шалгах хуудас, хэрэгслийн гаралтад дасан зохицох хариу үйлдэл үзүүлэх ReAct давталт, нарийн төвөгтэй төслүүдэд үүрэг хуваах боломжийг олгодог удирдагч-ажилчин загварууд гэх мэт янз бүрийн төлөвлөлтийн хэв маягийг ашиглаж болно. Агентынхаа тодорхой шаардлагад үндэслэн төлөвлөлтийн аргыг сонгоорой.

Хиймэл оюун ухааны агентынхаа гүйцэтгэлийг хэрхэн үр дүнтэй үнэлэх вэ?

Хиймэл оюун ухааны агентынхаа гүйцэтгэлийг үнэлэхийн тулд аз жаргалтай зам, давуу тал, тодорхойгүй хүсэлтүүдийг багтаасан хувилбарын багц үүсгээрэй. Даалгаврын амжилтын түвшин, хариу өгөх хугацаа, алдаанаас гарах арга зам зэрэг үзүүлэлтүүдэд үндэслэн үр дүнг дүгнэж, чадавхийг нь тасралтгүй сайжруул.

Хиймэл оюун ухааны агентыг хэрхэн бүтээх вэ

Товч хариулт: Практик дээр ажилладаг хиймэл оюун ухааны агент бүтээхийн тулд үүнийг хяналттай давталт гэж үз: оролтыг авч, дараагийн үйлдлийг шийдэж, нарийн хүрээтэй хэрэгслийг дуудаж, үр дүнг нь ажиглаж, тодорхой "дууссан" шалгалт тэнцэх хүртэл давтана уу. Даалгавар олон үе шаттай, хэрэгсэлд суурилсан үед энэ нь өөрийн үр дүнг авдаг; хэрэв ганцхан хүсэлт үүнийг шийдвэл агентыг алгас. Хэрэгслүүд ажиллахаа больсон эсвэл оролтууд тодорхойгүй үед агент давталт хийхийн оронд өргөждөг байхаар хатуу хэрэгслийн схем, алхамын хязгаар, бүртгэл, баталгаажуулагч/шүүмжлэгч нэмнэ үү.

Гол дүгнэлтүүд:

Хянагчийн давталт: Оролт → үйлдэл → тодорхой зогсоох нөхцөл болон хамгийн их алхам бүхий давталтыг ажиглана.

Багажны загвар: “Юу ч хийх” эмх замбараагүй байдлаас урьдчилан сэргийлэхийн тулд хэрэгслүүдийг нарийсгаж, бичсэн, зөвшөөрөгдсөн, баталгаажсан байлга.

Санах ойн эрүүл ахуй: Богино хугацааны авсаархан төлөв болон урт хугацааны сэргээлтийг ашиглах; бүрэн хуулбарыг хаяхаас зайлсхий.

Буруу ашиглалтын эсэргүүцэл: Эрсдэлтэй үйлдлүүдэд зөвшөөрөгдсөн жагсаалт, ханшийн хязгаар, импотенци болон "хуурай ажиллагаа"-г нэмнэ үү.

Туршилтын чадвар: Сценарийн багцыг (алдаа, тодорхойгүй байдал, тарилга) хадгалж, өөрчлөлт бүр дээр дахин ажиллуулах.

Хиймэл оюун ухааны агент хэрхэн бүтээх вэ? Инфографик

Үүний дараа таны унших дуртай нийтлэлүүд:

🔗 AI гүйцэтгэлийг хэрхэн хэмжих вэ
Хурд, нарийвчлал, найдвартай байдлыг хэмжих практик хэмжүүрүүдийг сур.

🔗 AI-тай хэрхэн ярих вэ
Илүү сайн хариулт авахын тулд сануулга, нөхцөл байдал болон дараагийн үйлдлийг ашиглаарай.

🔗 Хиймэл оюун ухааны загваруудыг хэрхэн үнэлэх вэ
Тест, рубрик болон бодит ертөнцийн даалгаврын үр дүнг ашиглан загваруудыг харьцуул.

🔗 Хиймэл оюун ухааны загваруудыг хэрхэн оновчтой болгох вэ
Мод тааруулах, тайрах, хянах замаар чанар, зардлыг сайжруулна.

1) Хиймэл оюун ухааны агент гэж энгийн хүний хувьд юу вэ 🧠

Хиймэл оюун ухааны агент бол давталт юм. LangChain “Агентууд” баримт бичиг

Ингээд л болоо. Голдоо тархитай гогцоо.

Оролт → бодох → үйлдэл → ажиглах → давтах. ReAct цаас (шалтгаан + үйлдэл)

Хаана:

Оролт нь хэрэглэгчийн хүсэлт эсвэл үйл явдал (шинэ имэйл, дэмжлэгийн тасалбар, мэдрэгчийн ping) юм.
Сэтгэх нь дараагийн алхамын талаарх эргэцүүлэн бодох хэлний загвар юм.
Act нь хэрэгслийг дуудаж байна (дотоод баримт бичгийг хайх, код ажиллуулах, тасалбар үүсгэх, хариулт ноороглох). OpenAI функц дуудлагын гарын авлага
Ажиглалт нь багажийн гаралтыг уншиж байна.
Давталт гэдэг нь "чавь яриа" гэхийн оронд "ажил хэрэгч" мэдрэмж төрүүлдэг хэсэг юм. LangChain "Агентууд" баримт бичиг

Зарим агентууд нь үндсэндээ ухаалаг макро байдаг. Бусад нь даалгавруудыг зохицуулж, алдаанаас нь сэргээж чаддаг залуу оператор шиг ажилладаг. Хоёулаа чухал.

Мөн танд бүрэн бие даасан байдал хэрэггүй. Үнэндээ... та үүнийг хүсэхгүй байх 🙃

2) Хэзээ агент үүсгэх ёстой вэ (мөн хэзээ хийх ёсгүй вэ) 🚦

Дараах тохиолдолд агент үүсгэнэ үү:

Ажил нь олон үе шаттай бөгөөд дунд нь юу болж байгаагаас хамааран өөрчлөгддөг.
Ажилд багаж хэрэгсэл (өгөгдлийн сан, CRM, код гүйцэтгэх, файл үүсгэх, хөтөч, дотоод API) ашиглах шаардлагатай. LangChain “Хэрэгслүүд” баримт бичиг
Та зөвхөн нэг удаагийн хариулт биш, харин хашлагатай холбоотой давтагдах үр дүнг хүсч байна
Та "дууссан" гэдгийг компьютер шалгаж чадах байдлаар, тэр ч байтугай сулхан ч гэсэн тодорхойлж болно.

Дараах тохиолдолд агент үүсгэж болохгүй:

Энгийн асуулт + хариулт үүнийг шийддэг (хэт их инженерчлэл хийх хэрэггүй, дараа нь өөрийгөө үзэн ядах болно).
Танд төгс детерминизм хэрэгтэй (агентууд тууштай байж болох ч робот биш).
Танд холбогдох ямар ч хэрэгсэл эсвэл өгөгдөл байхгүй - тэгвэл энэ нь ихэвчлэн зүгээр л мэдрэмж юм.

Шударгаар хэлэхэд: “Хиймэл оюун ухааны агентын төслүүд”-ийн тал хувь нь цөөн хэдэн салбарлах дүрэмтэй ажлын урсгал байж болно. Гэхдээ заримдаа уур амьсгал нь бас чухал байдаг 🤷♂️

3) Хиймэл оюун ухааны агентын сайн хувилбарыг юу бүрдүүлдэг вэ ✅

Таны асуусан "Сайн хувилбарыг юу бүрдүүлдэг вэ" хэсэг энд байна, гэхдээ би жаахан шулуухан хэлье:

Хиймэл оюун ухааны сайн агент бол хамгийн хатуу боддог агент биш , харин дараах хувилбарыг боддог агент юм

Юу хийхийг зөвшөөрсөнөө мэддэг (хамрах хүрээний хил хязгаар)
Хэрэгслийг найдвартай ашигладаг (бүтэцлэгдсэн дуудлага, дахин оролдлого, хугацаа дуусах) OpenAI функц дуудлагын гарын авлага AWS “Хугацаа дуусах, дахин оролдлого хийх, чичиргээтэй буцах”
Төлөвийг цэвэр байлгадаг (ялзрахгүй санах ой) LangChain “Санах ойн тойм”
Үйлдлүүдээ тайлбарладаг (нууц үндэслэлийн мэдээлэл биш, харин аудитын мөр) NIST AI RMF 1.0 (найдвартай байдал ба ил тод байдал)
Зохих ёсоор зогсдог (дуусалтын шалгалт, дээд алхам, өсөлт) LangChain “Агентууд” баримт бичиг
Аюулгүй бүтэлгүйтдэг (тусламж хүсдэг, эрх мэдэлтнүүдийг хий үзэгдэлд оруулдаггүй) NIST AI RMF 1.0
Туршиж болно (та үүнийг лаазалсан хувилбарууд дээр ажиллуулж, үр дүнг нь оноож болно)

Хэрэв таны агентыг туршиж үзэх боломжгүй бол энэ нь үндсэндээ маш итгэлтэй слот машин юм. Үдэшлэг дээр хөгжилтэй, продакшн дээр аймшигтай 😬

4) Агентын гол бүтцийн хэсгүүд ("анатоми" 🧩)

Ихэнх хатуу бодисууд дараах хэсгүүдтэй байдаг:

А) Хянагчийн гогцоо 🔁

Энэ бол найрал хөгжимчин:

гоол оруулах
дараагийн үйлдлийг загвараас асуух
ажиллуулах хэрэгсэл
ажиглалт нэмэх
LangChain “Агентууд” баримт бичгийг дуустал давтана уу

B) Хэрэгслүүд (өөрөөр хэлбэл чадварууд) 🧰

Агентыг үр дүнтэй болгодог зүйл бол хэрэгслүүд юм: LangChain-ийн “Хэрэгслүүд” баримт бичиг

мэдээллийн сангийн лавлагаа
имэйл илгээх
файл татах
ажиллаж байгаа код
дотоод API-г дуудаж байна
хүснэгт эсвэл CRM систем рүү бичих

C) Ой санамж 🗃️

Хоёр төрөл чухал:

богино хугацааны ой санамж: одоогийн ажиллах нөхцөл, сүүлийн үеийн алхмууд, одоогийн төлөвлөгөө
Урт хугацааны санах ой: хэрэглэгчийн тохиргоо, төслийн нөхцөл байдал, олж авсан мэдлэг (ихэвчлэн суулгалт + вектор хадгалах замаар) RAG цаас

D) Төлөвлөлт ба шийдвэр гаргах бодлого 🧭

Та үүнийг "төлөвлөлт" гэж нэрлээгүй ч гэсэн танд дараах арга хэрэгтэй:

шалгах хуудас
ReAct хэв маягийн “бодоод дараа нь хэрэгсэл болго” ReAct цаас
даалгаврын графикууд
удирдагч-ажилчин хэв маяг
хянагч-ажилчин загварууд Microsoft AutoGen (олон агентын хүрээ)

E) Хашлага болон үнэлгээ 🧯

зөвшөөрөл
OpenAI бүтэцлэгдсэн гаралтын аюулгүй хэрэгслийн схемүүд
гаралтын баталгаажуулалт
алхамын хязгаар
мод бэлтгэл
NIST AI RMF 1.0 тестүүд

Тийм ээ, энэ бол өдөөлтөөс илүү инженерчлэл юм. Энэ бол ... гол санаа нь юм.

5) Харьцуулсан хүснэгт: агент бүтээх түгээмэл аргууд 🧾

Доор бодитой "Харьцуулалтын хүснэгт" байна - цөөн хэдэн өвөрмөц онцлогтой, учир нь жинхэнэ багууд өвөрмөц байдаг 😄

Хэрэгсэл / Хүрээ	Үзэгчид	Үнэ	Яагаад ажилладаг вэ	Тэмдэглэл (жижигхэн эмх замбараагүй байдал)
ЛангЧэйн	лего маягийн эд ангиудад дуртай барилгачид	чөлөөт + доорх	багаж хэрэгсэл, санах ой, гинжний том экосистем	Хэрэв та юмсыг тодорхой нэрлэхгүй бол спагетти хурдан идэж болно
ЛламаИндекс	RAG-хүнд багууд	чөлөөт + доорх	хүчтэй хайлтын хэв маяг, индексжүүлэлт, холбогч	Таны агент үндсэндээ "хайлт + үйлдэл" хийх үед гайхалтай ... энэ нь нийтлэг байдаг
OpenAI Туслахуудын хэв маягийн арга барил	багууд илүү хурдан тохиргоо хийхийг хүсч байна	хэрэглээнд суурилсан	суулгагдсан хэрэгслийн дуудлагын хэв маяг болон ажиллах төлөв	зарим буланд уян хатан чанар багатай боловч олон аппликейшнд цэвэрхэн	OpenAI нь API OpenAI Туслах функц дуудлагыг
Семантик цөм	бүтэцлэгдсэн найрал хөгжим хүсдэг хөгжүүлэгчид	чөлөөт маягийн	ур чадвар/функцүүдийн цэвэр хийсвэрлэл	"аж ахуйн нэгжийн цэвэр цэмцгэр" мэт санагддаг - заримдаа энэ нь магтаал болдог 😉
Автоген	олон агентын туршилт хийгчид	чөлөөт маягийн	агент хоорондын хамтын ажиллагааны хэв маяг	хэт их ярьж болно; ажлаас халах хатуу дүрмийг тогтооно
CrewAI	"Агентуудын баг"-ын хөгжөөн дэмжигчид	чөлөөт маягийн	Үүрэг + даалгавар + хүлээлгэн өгөх зүйлсийг илэрхийлэхэд хялбар байдаг	Даалгаврууд нь нялцгай биш, харин тодорхой байх үед хамгийн сайн ажилладаг
Өвсний овоолго	хайлт + дамжуулах хоолойн хүмүүс	чөлөөт маягийн	хатуу дамжуулах хоолой, татаж авах, эд ангиуд	"агентийн театр" бага, "практик үйлдвэр" илүү
Өөрийн гараар өнхрүүлэх (захиалгат гогцоо)	хянах донтонгууд (хайртай)	таны цаг	хамгийн бага ид шид, хамгийн их тод байдал	ихэвчлэн хамгийн сайн урт хугацааны... бүх зүйлийг шинээр зохион бүтээх хүртэл 😅

Ганц ялагч байхгүй. Хамгийн сайн сонголт нь таны агентын үндсэн ажил нь мэдээлэл авах, багаж хэрэгслийн гүйцэтгэл, олон агентын зохицуулалтэсвэл ажлын урсгалын автоматжуулалт.

6) Хиймэл оюун ухааны агентийг алхам алхмаар хэрхэн бүтээх вэ (бодит жор) 🍳🤖

Энэ хэсгийг ихэнх хүмүүс алгасдаг, дараа нь агент яагаад агуулахад байгаа элбэнх шиг аашилж байгааг гайхдаг.

Алхам 1: Ажлыг нэг өгүүлбэрээр тодорхойл 🎯

Жишээ нь:

"Бодлого болон тасалбарын агуулгыг ашиглан хэрэглэгчийн хариултыг ноороглоод, дараа нь зөвшөөрөл хүснэ үү."
"Алдааны тайланг судалж, хуулбарлаж, засах санал гарга."
"Төгс бус уулзалтын тэмдэглэлийг даалгавар, эзэмшигч, хугацаа болгон хувирга."

Хэрэв та үүнийг энгийнээр тодорхойлж чадахгүй бол таны агент ч бас тодорхойлж чадахгүй. Би чадна гэж хэлэх гээд байна, гэхдээ энэ нь импровизаци хийх бөгөөд импровизаци нь төсөв мөхдөг газар юм.

Алхам 2: Бие даасан байдлын түвшинг (бага, дунд, халуун ногоотой) шийднэ үү 🌶️

Бага бие даасан байдал: алхамуудыг санал болгодог, хүний товшилт "батлах"
Дунд зэрэг: хэрэгслүүдийг ажиллуулж, гаралтын ноорог гаргаж, тодорхойгүй байдлыг нэмэгдүүлдэг
Өндөр: зөвхөн үл хамаарах тохиолдолд хүмүүсийг пинглэх замаар төгсгөлөөс төгсгөл хүртэлх командуудыг гүйцэтгэдэг

Хүссэнээсээ багаар эхэл. Та дараа нь үргэлж нэмэгдүүлж болно.

Алхам 3: Загварын стратегиа сонгоно уу 🧠

Та ихэвчлэн дараахыг сонгоно:

бүх зүйлд зориулсан нэг хүчтэй загвар (энгийн)
нэг хүчтэй загвар + хямд алхамуудын жижиг загвар (ангилал, чиглүүлэлт)
шаардлагатай бол тусгай загварууд (алсын хараа, код, яриа)

Мөн шийднэ үү:

хамгийн их токен
температур
Та дотооддоо урт хугацааны үндэслэлийн мөрийг зөвшөөрөх эсэх (та зөвшөөрч болно, гэхдээ түүхий бодлын гинжин хэлхээг эцсийн хэрэглэгчдэд ил болгож болохгүй)

Алхам 4: Хатуу схем бүхий хэрэгслүүдийг тодорхойл 🔩

Хэрэгслүүд нь:

нарийн
бичсэн
зөвшөөрөлтэй
баталгаажсан OpenAI бүтэцлэгдсэн гаралтууд

do_anything(input: string) гэсэн хэрэгслийн оронд дараахийг хийнэ үү:

search_kb(query: string) -> үр дүн[]
create_ticket(гарчиг: мөр, их бие: мөр, тэргүүлэх чиглэл: тоололт) -> ticket_id
send_email(to: string, subject: string, body: string) -> status OpenAI функц дуудах гарын авлага

Хэрэв та агентад хөрөө өгвөл хашааг нь бас авч хашааг тайрахад цочирдох хэрэггүй.

Алхам 5: Хянагч гогцоог бүтээх 🔁

Хамгийн бага давталт:

Зорилго + анхны нөхцөл байдлаас эхэл
Загвараас асуу: "Дараагийн үйлдэл үү?"
Хэрэв хэрэгсэл дуудвал - хэрэгслийг ажиллуулна уу
Ажиглалтыг нэмэх
Зогсоолын нөхцөл байдлыг шалгах
LangChain “Агентууд” баримт бичгийг (хамгийн их алхамаар) давтана уу

Нэмэх:

завсарлага
дахин оролдлого (болгоомжтой - дахин оролдлого давтагдах боломжтой) AWS “Хугацаа дуусах, дахин оролдох, чичиргээтэй буцах”
хэрэгслийн алдааны форматлалт (тодорхой, бүтэцлэгдсэн)

Алхам 6: Санах ойгоо болгоомжтой нэмнэ үү 🗃️

Богино хугацаанд: алхам тутамдаа шинэчилсэн авсаархан "төлөв байдлын хураангуй"-г хадгалах. LangChain "Санах ойн тойм"
Урт хугацаанд: бат бөх баримтуудыг хадгалах (хэрэглэгчийн тохиргоо, байгууллагын дүрэм, тогтвортой баримт бичиг).

Эрхий хурууны дүрэм:

Хэрэв энэ нь байнга өөрчлөгддөг бол - богино хугацаанд байлга
Хэрэв тогтвортой бол удаан хугацаанд хадгална
Хэрэв мэдрэмтгий бол - хамгийн бага хэмжээгээр хадгална (эсвэл огт хадгалахгүй)

Алхам 7: Баталгаажуулалт болон "шүүмжлэгч" гэсэн оноог нэмнэ үү 🧪

Хямд, практик загвар:

агент үр дүнг бий болгодог
Баталгаажуулагч бүтэц болон хязгаарлалтыг шалгадаг
Алхам дутуу эсвэл бодлогын зөрчлийн талаарх нэмэлт шүүмжлэгч загварын тойм NIST AI RMF 1.0

Төгс биш ч гэсэн цочирдом хэмжээний утгагүй зүйлийг агуулсан.

Алхам 8: Бүртгэл хийгээгүйдээ харамсах бүх зүйлээ тэмдэглэ 📜

Лог:

хэрэгслийн дуудлага + оролт + гаралт
гаргасан шийдвэрүүд
алдаанууд
эцсийн гаралтууд
Токен ба хоцрогдол OpenTelemetry ажиглалтын праймер

Ирээдүй - чи чамд талархах болно. Одоо - чи мартах болно. Энэ бол зүгээр л амьдрал 😵💫

7) Сэтгэлийг чинь шархлуулахгүй хэрэгсэл дуудах 🧰😵

Хэрэгслийн дуудлага бол "Хиймэл оюун ухааны агент хэрхэн бүтээх вэ" гэдэг нь жинхэнэ програм хангамжийн инженерчлэл болж хувирдаг газар юм.

Багаж хэрэгслийг найдвартай болгох (найдвартай байх нь сайн)

Найдвартай хэрэгслүүд нь:

детерминистик
нарийн хүрээтэй
шалгахад хялбар
Stripe “Idempotent requests”-ийг дахин ажиллуулахад аюулгүй

Зөвхөн зааварчилгаа биш, харин багажны давхарга дээр хашлага нэмнэ үү

Санал хүсэлтүүд нь эелдэг саналууд юм. Хэрэгслийн баталгаажуулалт нь түгжигдсэн хаалга юм. OpenAI бүтэцлэгдсэн гаралтууд

Хийх:

зөвшөөрөгдсөн жагсаалтууд (ажиллуулж болох хэрэгслүүд)
оролтын баталгаажуулалт
OpenAI тарифын хязгаарын гарын авлага
хэрэглэгч/байгууллага бүрийн зөвшөөрлийн шалгалт
Эрсдэлтэй үйлдлийн "хуурай ажиллуулах горим"

Хэсэгчилсэн бүтэлгүйтлийн загвар

Хэрэгслүүд ажиллахаа больсон. Сүлжээ ганхаж байна. Баталгаажуулалтын хугацаа дуусна. Агент дараах зүйлсийг хийх ёстой:

алдааг тайлбарлах
тохиромжтой үед буцаан оролдлого хийж дахин оролдоно уу Google Cloud дахин оролдох стратеги (буцаан олголт + чичиргээ)
өөр хэрэгслүүдийг сонгох
гацсан үед хурцадмал байдал

Чимээгүйхэн үр дүнтэй арга: дараах бүтэцлэгдсэн алдааг буцаах:

төрөл: auth_error
төрөл: олдсонгүй
төрөл: rate_limited
Тиймээс загвар нь сандрахын оронд ухаалаг хариу үйлдэл үзүүлэх боломжтой.

8) Чамайг зовоохын оронд тусалдаг дурсамж 👻🗂️

Ой санамж хүчтэй боловч хог хаягдлын шургуулга болж ч болно.

Богино хугацааны ой санамж: нягт байлгах

Хэрэглээ:

сүүлийн N алхам
ажиллаж байгаа хураангуй (давталт бүрийг шинэчилдэг)
одоогийн төлөвлөгөө
одоогийн хязгаарлалтууд (төсөв, цаг хугацаа, бодлого)

Хэрэв та бүх зүйлийг контекстэд оруулбал дараахь зүйлийг авна

өндөр өртөгтэй
удаан хоцрогдол
илүү их төөрөгдөл (тийм ээ, тэр үед ч гэсэн)

Урт хугацааны ой санамж: "чихмэл"-ээс илүү сэргээн санах ой

Ихэнх "урт хугацааны ой санамж" нь дараахь зүйлтэй төстэй байдаг

оруулга
вектор дэлгүүр
сэргээн засварлах нэмэгдүүлсэн үе (RAG) RAG цаас

Агент цээжилдэггүй. Энэ нь ажиллах үед хамгийн хамааралтай хэсгүүдийг авдаг. LlamaIndex “RAG-ийн танилцуулга”

Практик санах ойн дүрэм

"Сонголтууд"-ыг тодорхой баримт болгон хадгалах: "Хэрэглэгч товч хураангуйд дуртай бөгөөд эможид дургүй" (хэхэ, гэхдээ энд байхгүй 😄)
"Шийдвэрүүд"-ийг цагийн тэмдэг эсвэл хувилбараар хадгалах (эс тэгвээс зөрчилдөөн овоолно)
Үнэхээр шаардлагагүй бол хэзээ ч нууц хадгалах хэрэггүй

Миний төгс бус зүйрлэл энд байна: дурсамж бол хөргөгчтэй адил. Хэрэв та үүнийг хэзээ ч цэвэрлэхгүй бол эцэст нь таны сэндвич сонгино, харамсал шиг амттай болно.

9) Төлөвлөлтийн хэв маяг (энгийнээс эхлээд чамин хүртэл) 🧭✨

Төлөвлөлт бол зүгээр л хяналттай задрал юм. Үүнийг нууцлаг болгож болохгүй.

А загвар: Шалгах хуудасны төлөвлөгч ✅

Загвар нь алхмуудын жагсаалтыг гаргадаг
Алхам алхмаар гүйцэтгэдэг
Шалгах хуудасны төлөвийг шинэчилдэг

Шинээр элсэхэд маш тохиромжтой. Энгийн, туршиж үзэх боломжтой.

B загвар: ReAct давталт (шалтгаан + үйлдэл) 🧠→🧰

загвар нь дараагийн хэрэгслийн дуудлагыг шийддэг
гаралтыг ажигладаг
ReAct цаасыг давтана

Энэ бол агентын сонгодог мэдрэмж юм.

C загвар: Ахлах ажилтан 👥

удирдагч зорилгоо даалгавар болгон хуваадаг
ажилчид тусгай даалгавруудыг гүйцэтгэдэг
хянагч нь үр дүнг нэгтгэдэг Microsoft AutoGen (олон агентын хүрээ)

Энэ нь даалгавруудыг зэрэгцээ хийх боломжтой үед эсвэл та өөр өөр "үүрэг" хүсч байвал, тухайлбал:

судлаач
кодлогч
редактор
Чанарын баталгаа шалгагч

D хэв маяг: Дахин төлөвлөлт хийж, дараа нь хэрэгжүүл 🔄

төлөвлөгөө үүсгэх
гүйцэтгэх
Хэрэв хэрэгслийн үр дүн бодит байдлыг өөрчилвөл дахин төлөвлөх

Энэ нь төлөөлөгчийг муу төлөвлөгөөг зөрүүдлэн дагахаас сэргийлдэг. Хүмүүс ядарсан л бол үүнийг хийдэг бөгөөд энэ тохиолдолд тэд бас муу төлөвлөгөөг дагадаг.

10) Аюулгүй байдал, найдвартай байдал, ажлаас халагдахгүй байх 🔐😅

Хэрэв таны агент арга хэмжээ авч чадвал танд аюулгүй байдлын дизайн хэрэгтэй. "Байхад сайхан биш" гэсэн үг. Хэрэгцээ. NIST AI RMF 1.0

Хатуу хязгаарлалтууд

гүйлт тутамд хамгийн их алхам
минутанд хамгийн их хэрэгслийн дуудлага
нэг удаагийн зарцуулалтын дээд хэмжээ (токен төсөв)
зөвшөөрлийн ард хязгаарлагдмал хэрэгслүүд

Өгөгдөл боловсруулах

бүртгэл хийхээс өмнө мэдрэмтгий оролтыг засах
тусдаа орчин (хөгжүүлэгч болон үйлдвэрлэл)
хамгийн бага эрхтэй хэрэгслийн зөвшөөрөл

Зан үйлийн хязгаарлалт

агентыг дотоод нотлох баримтын хэсгүүдийг иш татахад хүргэх (гадаад холбоос биш, зөвхөн дотоод лавлагаа)
өөртөө итгэх итгэл бага үед тодорхойгүй байдлын тэмдэглэгээ шаарддаг
Хэрэв оролтууд хоёрдмол утгатай бол "тодруулга асуулт асуух" шаардлагатай

Найдвартай агент гэдэг хамгийн итгэлтэй агент биш. Таамаглаж байгаагаа мэддэг, тэгж хэлдэг хүн л байдаг.

11) Туршилт ба үнэлгээ (хүн бүрийн зайлсхийдэг хэсэг) 🧪📏

Чи хэмжиж чадахгүй зүйлээ сайжруулж чадахгүй. Тийм ээ, энэ үг утгагүй ч гэсэн үнэхээр үнэн.

Сценарийн багц бүтээх

30-100 туршилтын тохиолдол үүсгэх:

аз жаргалтай замууд
ирмэгийн хайрцагнууд
"Багаж хэрэгсэл эвдэрсэн" тохиолдлууд
тодорхой бус хүсэлтүүд
сөргөлдөөнтэй өдөөлтүүд (шууд оруулах оролдлогууд) LLM аппликейшнуудын OWASP шилдэг 10 OWASP LLM01 Шууд оруулах

Онооны үр дүн

Дараах үзүүлэлтүүдийг ашиглана уу:

даалгаврын амжилтын түвшин
дуусгах хугацаа
багажны алдааг сэргээх түвшин
хий үзэгдлийн түвшин (нотлох баримтгүй мэдэгдэл)
хүний зөвшөөрлийн түвшин (хяналттай горимд байгаа бол)

Заавар болон хэрэгслүүдийн регрессийн тестүүд

Та өөрчлөгдөх бүрт:

багажны схем
системийн зааварчилгаа
хайлтын логик
санах ойн форматлах
Энэ багцыг дахин ажиллуулна уу.

Эмч нар бол мэдрэмтгий амьтад. Тасалгааны ургамал шиг боловч илүү үнэтэй.

12) Төсөвт тань хэмнэлт гаргахгүй байршуулалтын загварууд 💸🔥

Нэг үйлчилгээнээс эхэл

агент хянагчийн API
үүний ард байгаа багажны үйлчилгээ
бүртгэл + OpenTelemetry ажиглалтын праймерын

Зардлын хяналтыг эрт нэмэх

кэш хайлтын үр дүн
харилцан ярианы төлөвийг хураангуйгаар шахаж байна
чиглүүлэлт болон олборлолтын жижиг загваруудыг ашиглах
"гүнзгий сэтгэлгээний горимыг" хамгийн хэцүү алхмуудаар хязгаарлах

Архитектурын нийтлэг сонголт

төлөвгүй хянагч + гадаад төлөв хадгалах сан (DB/redis)
Хэрэгслийн дуудлагууд боломжтой бол идемпотент байна. Stripe “Идемпотент хүсэлтүүд”
урт даалгавруудын дараалал (ингэснээр та вэб хүсэлтийг үүрд нээлттэй байлгахгүй)

Мөн: “алх унтраалга” хийх. Үнэхээр хэрэгтэй болтол чинь хэрэггүй 😬

13) Хаалтын тэмдэглэл - Хиймэл оюун ухааны агент хэрхэн бүтээх тухай товч мэдээлэл 🎁🤖

Хэрэв та өөр юу ч санахгүй байгаа бол дараах зүйлийг санаарай

Хиймэл оюун ухааны агент хэрхэн бүтээх нь голчлон загварын эргэн тойронд аюулгүй гогцоо бий болгох тухай юм. LangChain “Агентууд” баримт бичиг
Тодорхой зорилго, бага бие даасан байдал, хатуу чанд хэрэгслээс эхэл. OpenAI бүтэцлэгдсэн гаралт
Төгсгөлгүй контекст чихмэл биш, харин сэргээлтээр дамжуулан санах ойг нэмнэ үү. RAG цаас
Төлөвлөлт нь энгийн байж болно - шалгах хуудас болон дахин төлөвлөлт нь хол явдаг.
Бүртгэл болон туршилтууд нь агентын эмх замбараагүй байдлыг таны илгээж болох зүйл болгон хувиргадаг. OpenTelemetry ажиглалтын праймер
Хашлага нь зөвхөн зааварт төдийгүй кодонд хамаарна. LLM аппликейшнуудын OWASP-ийн шилдэг 10 нь

Агент бол ид шид биш. Энэ бол үнэ цэнэтэй байхын тулд хангалттай олон удаа зөв шийдвэр гаргадаг систем юм... мөн хохирол учруулахаасаа өмнө ялагдлаа хүлээн зөвшөөрдөг. Нэг талаараа чимээгүйхэн тайвшруулдаг 😌

Тийм ээ, хэрэв та үүнийг зөв зохиовол хэзээ ч унтдаггүй, хааяа сандардаг, бичиг цаасны ажилд дуртай жижигхэн дижитал дадлагажигч хөлслөхтэй адил мэдрэмж төрдөг. Тиймээс үндсэндээ дадлагажигч.

Бодит жишээ: Дэмжлэгийн ангиллын хиймэл оюун ухааны агент бүтээх 🎫🤖

Хувилбар

Жижиг SaaS баг долоо хоногт 120-180 дэмжлэгийн тасалбар хүлээн авч байна гэж төсөөлөөд үз дээ. Ихэнх тасалбарууд нь тийм ч төвөгтэй биш боловч цаг хугацаа шаарддаг: нууц үг шинэчлэх, төлбөрийн асуултууд, алдааны тайлан, функцын хүсэлт болон "энэ хүлээгдэж буй зан төлөв мөн үү?" гэсэн мессежүүд.

Энгийн чатбот хариулт бичиж чаддаг ч бүртгэлийн төлөвийг найдвартай шалгаж, мэдлэгийн санг хайж, яаралтай байдлыг ангилж эсвэл хүн хэзээ оролцох шаардлагатайг шийдэж чадахгүй. Энэ бол агентын утга учир юм.

Зорилго нь дэмжлэгийг бүрэн орлуулах биш юм. Зорилго нь шинэ тасалбар уншиж, нөхцөл байдлыг цуглуулж, хариултыг ноороглож, тасалбарыг зөв дараалалд чиглүүлдэг бага бие даасан агентыг бий болгох явдал юм. Хүн үйлчлүүлэгчдэд чиглэсэн аливаа зүйлийг зөвшөөрсөөр л байна.

Туслахад юу хэрэгтэй вэ

Аюулгүй ажиллахын тулд агент нь жижиг, хяналттай оролт болон багаж хэрэгслийн багц хэрэгтэй:

Ирж буй тасалбарын текст
Харилцагчийн төлөвлөгөөний төрөл, дансны нас болон сүүлийн үеийн төлбөрийн төлөв
Саяхны бүтээгдэхүүний өөрчлөлтийн бүртгэл эсвэл мэдэгдэж буй үйл явдлууд
Дотоод тусламжийн төвийн нийтлэлүүд
Хязгаарлагдмал талбартай тасалбар шинэчлэх хэрэгсэл
Имэйл илгээх хэрэгсэл биш, харин ноорог хариу өгөх хэрэгсэл
Тодорхой өсөлтийн бодлого

Хэрэгслийн жагсаалтыг зориудаар хязгаарлах хэрэгтэй:

хайлтын_тусламжийн_төв(асуулга)
хэрэглэгчийн_статус_г авах(хэрэглэгчийн_id)
мэдэгдэж буй_үйл явдлыг шалгах(бүтээгдэхүүний_бүсийн)
тасалбарын_ангиллыг_шинэчлэх(тасалбарын_идентификатор, ангилал, тэргүүлэх чиглэл)
ноорог_хариу(тасалбарын_ид, хариу_текст)
escalate_to_human(тасалбарын_идентификатор, шалтгаан)

Юу дутуу байгааг анхаарна уу: "харилцагчийн мөнгийг буцаан олгох", "данс хаах", эсвэл "эцсийн хариулт илгээх" хэрэгсэл байхгүй. Эдгээр үйлдэл нь эхний хувилбарын хувьд хэтэрхий эрсдэлтэй.

Жишээ заавар

Та SaaS бүтээгдэхүүний дэмжлэгийн ангиллын агент юм.

Таны ажил бол ирж буй тасалбаруудыг ангилах, зөвхөн шаардлагатай нөхцөл байдлыг цуглуулах, санал болгож буй хариултыг боловсруулах, тасалбарыг дээшлүүлэх эсэхийг шийдэх явдал юм.

Дүрэм:

Хариултаа үйлчлүүлэгчдэд шууд илгээж болохгүй.

Бүтээгдэхүүний асуултанд хариулахаасаа өмнө тусламжийн төвийг ашиглаарай.

Төлбөр тооцоо, төлөвлөгөө эсвэл хандалтын асуултанд хариулахаасаа өмнө үйлчлүүлэгчийн статусыг шалгана уу.

Хэрэв үйлчлүүлэгч хууль эрх зүйн аюул занал, өгөгдлийн алдагдал, аюулгүй байдлын асуудал, төлбөрийн алдаа, данс цуцлах эсвэл ууртай үг хэллэгийн талаар дурдсан бол хүн рүү хэлнэ үү.

Хэрэв хариулт нь тусламжийн төвийн татаж авсан контент эсвэл бүртгэлийн өгөгдөлд тулгуурлаагүй бол юу дутуу байгааг хэлж, өргөжүүлнэ үү.

Хамгийн ихдээ 6 удаа багаж дуудсаны дараа зогсооно уу.

Каталог нь зөвхөн ангилал, тэргүүлэх чиглэл, нотлох баримтын хураангуй, ноорог хариулт, мөн "хүний зөвшөөрөл шаардлагатай" эсвэл "нэмэлт" гэсэн хоёр зүйлтэй үед л "дууссан" гэж тооцогддог.

Үүнийг хэрхэн шалгах вэ

Шууд хэрэглэгчидтэй холбохоосоо өмнө 30 туршилтын тасалбараар эхэл:

Нууц үг шинэчлэх, төлөвлөгөөний хязгаарлалт болон "Би яаж?" гэсэн энгийн асуултууд гэх мэт 10 энгийн тасалбар
5 төлбөрийн тасалбар
5 алдааны тайлан
Мэдээлэл дутуу 5 тодорхойгүй тасалбар
Аюулгүй байдлын асуудал, буцаан олголтын шаардлага, ууртай гомдол гэх мэт 5 эрсдэлтэй тасалбар

Тасалбар бүрийн хувьд оноо:

Энэ нь зөв ангиллыг сонгосон уу?
Хариулахаасаа өмнө зөв хэрэгслийг ашигласан уу?
Энэ нь дэмжигдээгүй нэхэмжлэлээс зайлсхийсэн үү?
Энэ нь эрсдэлтэй тасалбарыг улам хүндрүүлсэн үү?
Ноорогт их засвар хийх шаардлагатай байсан уу?

Энгийн тэнцсэн/бүтэлгүйтсэн хүснэгт эхэндээ хангалттай. Агент үнэ цэнийг хүргэж байгаа эсэхийг мэдэхээсээ өмнө үнэлгээний системийг хэт их бүү нэмэгдүүл.

Үр дүн

Жишээ үр дүн: Энэхүү ажлын урсгалыг ашиглахаас өмнө болон дараа 30 дээжийн тасалбарын цагийг үндэслэн дэмжлэг үзүүлэх удирдагч дараах хэмжилтийг хийж чадна:

Эхний ангиллын дундаж хугацаа нэг тасалбар тутамд 6 минутаас 90 секунд болж буурсан
30 тасалбарыг 3 цагийн оронд 45 минутын дотор шалгасан
30 тасалбарын 27 нь зөв ангилалд байршсан байна
Эрсдэлтэй 5 тасалбарын 5 нь зөв өсгөгдсөн
Хүний зөвшөөрөлгүйгээр 0 хэрэглэгчийн хариулт илгээгдсэн

Эдгээр тоонууд нь батлагдсан жишиг биш, харин жишээ тооцоолол юм. Хэмжилтийг давтахад хялбар: туршилтын тасалбарын ижил багцыг гараар цаг хугацаагаар нь тооцоолж, дараа нь тэдгээрийг агентаар дамжуулан ажиллуулж, ангиллын нарийвчлал, өсөлтийн нарийвчлал, засварлах хугацааг харьцуулна уу.

Юу буруу болж болох вэ

Агент маш ердийн аргаар бүтэлгүйтэж болно.

Энэ нь бухимдсан боловч энгийн хэрэглэгчийг "яаралтай" гэж ангилж магадгүй, учир нь хэллэг нь ууртай сонсогдож магадгүй. Хуучирсан тусламжийн нийтлэлээс өөртөө итгэлтэй хариулт бичиж магадгүй. Асуудлыг хурцатгах зөв алхам хэзээ болохыг хайсаар байж магадгүй. Хариултын ноорогт дансны хэт их мэдээлэл илэрч магадгүй.

Засвар нь "илүү сайн санаа бичих" найдвар биш юм. Хатуу хязгаарлалтуудыг нэмнэ үү:

Төлбөр тооцоо, аюулгүй байдал, хууль эрх зүй эсвэл цуцлах хэл гарч ирэх үед хурдасгах
Нотлох баримтын хураангуйд дотоод тусламжийн нийтлэлээс ишлэл шаардах
Хүний зөвшөөрлийн ард "хариу илгээх"-ийг үлдээгээрэй
Багажны дуудлага болон эцсийн ноорог бүрийг тэмдэглэнэ үү
Зааварчилгаа, хэрэгсэл эсвэл бодлогын өөрчлөлт бүрийн дараа 30 тасалбарын туршилтын багцыг дахин ажиллуулна уу

Практик хоол

Үнэ цэнэтэй агентад гайхалтай бие даасан байдал шаардлагагүй. Энэ жишээнд утга нь хяналттай давталтаас гарч ирдэг: тасалбарыг уншиж, зөв контекстийг гаргаж, ангилж, хариултыг ноороглож, хянуулахаар зогс. Энэ нь нэг том хүсэлтээр "дэмжлэгийг зохицуулах" гэж оролддог агентаас хамаагүй илүү итгэх, турших, сайжруулахад илүү хялбар байдаг.

Түгээмэл асуултууд

Энгийнээр хэлбэл хиймэл оюун ухааны агент гэж юу вэ?

Хиймэл оюун ухааны агент нь үндсэндээ давтагддаг давталт юм: оролтыг авах, дараагийн алхмыг шийдэх, хэрэгсэл ашиглах, үр дүнг унших, дуустал нь давтах. "Агент" хэсэг нь зүгээр л чатлахаас гадна жүжиглэх, ажиглахаас үүсдэг. Олон агентууд зүгээр л хэрэгсэлд хандах боломжтой ухаалаг автоматжуулалт байдаг бол зарим нь алдаагаа засах боломжтой залуу оператор шиг аашилдаг.

Зүгээр л prompt ашиглахын оронд хэзээ хиймэл оюун ухаант агент бүтээх ёстой вэ?

Ажил нь олон үе шаттай, завсрын үр дүнд үндэслэн өөрчлөгддөг, найдвартай хэрэгсэл ашиглах (API, мэдээллийн сан, тасалбар, код гүйцэтгэх) шаардлагатай үед агент бүтээ. Агентууд нь хашлагатай давтагдах үр дүн, "дууссан" эсэхийг шалгах арга шаардлагатай үед бас хэрэгтэй. Хэрэв энгийн шуурхай хариу үйлдэл үр дүнтэй бол агент нь ихэвчлэн шаардлагагүй нэмэлт зардал болон нэмэлт алдааны горимтой байдаг.

Гогцоонд гацдаггүй хиймэл оюун ухааны агентыг хэрхэн бүтээх вэ?

Хатуу зогсолтын нөхцөлүүдийг ашиглаарай: хамгийн их алхам, хамгийн их хэрэгслийн дуудлага, цэвэр гүйцэтгэлийн шалгалт. Бүтэцлэгдсэн хэрэгслийн схем, хугацаа дуусах, мөнхөд дахин оролдохгүй дахин оролдлогуудыг нэмнэ үү. Шийдвэр болон хэрэгслийн гаралтыг бүртгэж, хаана замаасаа гарч байгааг харж болно. Аюулгүйн хавхлагын нийтлэг хэлбэр бол эскалация юм: хэрэв агент тодорхойгүй эсвэл алдаа давтвал импровизацийн оронд тусламж хүсэх хэрэгтэй.

Хиймэл оюун ухааны агент хэрхэн бүтээх вэ тоглоомын хамгийн бага архитектур хэд байх ёстой вэ?

Хамгийн багадаа танд загварт зорилго болон контекстийг өгдөг, дараагийн үйлдлийг асуудаг, шаардлагатай бол хэрэгслийг ажиллуулдаг, ажиглалтыг хавсаргадаг, давтдаг хянагчийн давталт хэрэгтэй. Мөн танд хатуу оролт/гаралтын хэлбэр, "дууссан" шалгалттай хэрэгслүүд хэрэгтэй. Хэрэв та төлөвийг цэвэр байлгаж, алхамын хязгаарыг хэрэгжүүлбэл өөрийн гэсэн давталт ч сайн ажиллаж чадна.

Үйлдвэрлэлд найдвартай байхын тулд багажны дуудлагыг хэрхэн зохион бүтээх ёстой вэ?

Хэрэгслүүдийг нарийн, бичигдсэн, зөвшөөрөгдсөн, баталгаажсан байлга - ерөнхий "do_anything" хэрэгслээс зайлсхий. Агент оролтыг гараар дамжуулж чадахгүй байхын тулд хатуу схемүүдийг (бүтэцлэгдсэн гаралт/функц дуудах гэх мэт) илүүд үзнэ үү. Хэрэгслийн давхаргад зөвшөөрөгдсөн жагсаалт, хурдны хязгаар, хэрэглэгч/байгууллагын зөвшөөрлийн шалгалтыг нэмнэ үү. Боломжтой үед дахин ажиллуулахад аюулгүй байхаар хэрэгслийг ижил потенцийн загваруудыг ашиглан зохион бүтээ.

Агентийг улам дордуулахгүйгээр санах ой нэмэх хамгийн сайн арга юу вэ?

Санах ойг хоёр хэсэг гэж үз: богино хугацааны ажиллах төлөв (сүүлийн үеийн алхмууд, одоогийн төлөвлөгөө, хязгаарлалтууд) болон урт хугацааны сэргээлт (сонголтууд, тогтвортой дүрэм, холбогдох баримт бичиг). Богино хугацааны нягтралыг бүрэн хуулбар биш, харин ажиллах хураангуйгаар хадгал. Урт хугацааны санах ойн хувьд сэргээлт (оруулга + вектор хадгалах/RAG хэв маяг) нь бүх зүйлийг контекстэд "чихэх", загварыг төөрөгдүүлэхээс илүүд үздэг.

Би ямар төлөвлөлтийн загварыг ашиглах ёстой вэ: шалгах хуудас, ReAct эсвэл удирдагч-ажилчин уу?

Даалгавруудыг урьдчилан таамаглах боломжтой бөгөөд та шалгахад хялбар зүйл хүсч байвал шалгах хуудасны төлөвлөгч маш сайн байдаг. Хэрэгслийн үр дүн таны дараагийн хийх зүйлийг өөрчлөхөд ReAct маягийн давталтууд гэрэлтдэг. Удирдах ажилтан-ажилчдын хэв маяг (AutoGen маягийн үүргийн тусгаарлалт гэх мэт) нь даалгавруудыг зэрэгцүүлэн хийх эсвэл өөр өөр үүрэг (судлаач, кодлогч, чанарын баталгаа)-аас ашиг хүртэх боломжтой үед тусалдаг. Төлөвлөөд дараа нь гүйцэтгэх, дахин төлөвлөх нь зөрүүд муу төлөвлөгөөнөөс зайлсхийх практик дунд зам юм.

Хэрэв агент бодит арга хэмжээ авч чадвал түүнийг хэрхэн аюулгүй болгох вэ?

Хамгийн бага давуу эрхтэй зөвшөөрлүүдийг ашиглаж, баталгаа эсвэл "хуурай ажиллуулах" горимын ард эрсдэлтэй хэрэгслүүдийг хязгаарлана. Төсөв болон хязгаарлалтыг нэмнэ үү: хамгийн их алхам, хамгийн их зарцуулалт, минут тутамд хэрэгслийн дуудлагын хязгаар. Бүртгэл хийхээс өмнө мэдрэмтгий өгөгдлийг арилгаж, хөгжүүлэлтийг үйлдвэрлэлийн орчноос тусгаарлана уу. Оролтууд нь хоёрдмол утгатай үед итгэлцэл нь нотлох баримтыг орлохын оронд тодорхойгүй байдлын тэмдэглэгээ эсвэл асуултуудыг тодруулахыг шаардана уу.

Цаг хугацаа өнгөрөх тусам сайжруулагдахын тулд хиймэл оюун ухааны агентийг хэрхэн туршиж, үнэлэх вэ?

Аз жаргалтай зам, захын тохиолдлууд, хэрэгслийн алдаа, тодорхойгүй хүсэлтүүд болон шуурхай оруулгын оролдлогууд (OWASP маягийн) бүхий хувилбарын багц бүтээ. Даалгаврын амжилт, дуусах хугацаа, хэрэгслийн алдаанаас сэргэх, нотлох баримтгүй нэхэмжлэл зэрэг үр дүнг үнэл. Та хэрэгслийн схем, шуурхай мэдэгдэл, сэргээх эсвэл санах ойн форматыг өөрчлөх бүртээ багцыг дахин ажиллуул. Хэрэв та үүнийг туршиж чадахгүй бол найдвартай тээвэрлэж чадахгүй.

Агентийг хоцрогдол болон зардлыг нэмэгдүүлэхгүйгээр хэрхэн байршуулах вэ?

Нийтлэг хэв маяг нь гадаад төлөвийн хадгалалт (DB/Redis), түүний ард багажны үйлчилгээ, хүчтэй бүртгэл/мониторинг (ихэвчлэн OpenTelemetry) бүхий төлөвгүй хянагч юм. Авах кэш, авсаархан төлөвийн хураангуй, чиглүүлэлт/гаргах жижиг загварууд, хамгийн хэцүү алхмуудаар "гүнзгий сэтгэлгээ"-г хязгаарлах замаар зардлыг хянах. Вэб хүсэлтийг нээлттэй байлгахгүйн тулд урт даалгавруудад дараалал ашиглаарай. Үргэлж зогсоох унтраалга оруулна уу.

Лавлагаа

Үндэсний Стандарт, Технологийн Хүрээлэн (NIST) - NIST AI RMF 1.0 (найдвартай байдал ба ил тод байдал) - nvlpubs.nist.gov
OpenAI - Бүтэцлэгдсэн гаралтууд - platform.openai.com
OpenAI - Функц дуудах гарын авлага - platform.openai.com
OpenAI - Үнийн хязгаарын гарын авлага - platform.openai.com
OpenAI - API ажиллуулдаг - platform.openai.com
OpenAI - Туслах функц дуудах - platform.openai.com
LangChain - Агентуудын баримт бичиг (JavaScript) - docs.langchain.com
LangChain - Хэрэгслүүд баримт бичиг (Python) - docs.langchain.com
LangChain - Санах ойн тойм - docs.langchain.com
arXiv - ReAct баримт бичиг (шалтгаан + үйлдэл) - arxiv.org
arXiv - RAG цаас - arxiv.org
Amazon Web Services (AWS) Builders' Library - Хугацаа дуусах, дахин оролдох, jitter-тэй буцах - aws.amazon.com
OpenTelemetry - Ажиглалтын праймер - opentelemetry.io
Stripe - Идемпотент хүсэлтүүд - docs.stripe.com
Google Cloud - Дахин оролдох стратеги (буцах + чичиргээ) - docs.cloud.google.com
OWASP - Том хэлний загварын хэрэглээний шилдэг 10 - owasp.org
OWASP - LLM01 Шуурхай тарилга - genai.owasp.org
LlamaIndex - RAG-ийн танилцуулга - developers.llamaindex.ai
Microsoft - Семантик цөм - learn.microsoft.com
Microsoft AutoGen - Олон агентын хүрээ (баримтжуулалт) - microsoft.github.io
CrewAI - Агентуудын концепцууд - docs.crewai.com
Өвсний овоолго (deepset) - Ретриверүүдийн баримт бичиг - docs.haystack.deepset.ai

Албан ёсны хиймэл оюун ухааны туслах дэлгүүрээс хамгийн сүүлийн үеийн хиймэл оюун ухааныг олоорой

Бидний тухай

Блог руу буцах

1) Хиймэл оюун ухааны агент гэж энгийн хүний ​​​​хувьд юу вэ 🧠