AI заримдаа бараг л ид шид мэт санагддаг. Та санамсаргүй асуултыг оруулаад, хэдэн секундын дотор гөлгөр, өнгөлсөн хариулт гарч ирнэ. Гэхдээ энд "суут" машин бүрийн ард түүнийг нухаж, засаж, хэлбэржүүлж байдаг жинхэнэ хүмүүс байдаг. AI-ийн сургагч гэж нэрлэдэг бөгөөд тэдний хийдэг ажил нь ихэнх хүмүүсийн төсөөлж байгаагаас илүү хачин, хөгжилтэй, үнэнч шударгаар хүнлэг байдаг.
Эдгээр сургагч багш нар яагаад чухал болохыг, тэдний өдөр тутмын амьдрал ямар харагддаг, яагаад энэ үүрэг хэний ч таамаглаж байснаас илүү хурдан болж байгааг харцгаая.
Үүний дараа унших дуртай нийтлэлүүд:
🔗 AI арбитраж гэж юу вэ: Энэ алдартай үгийн цаад үнэн
AI арбитраж, түүний эрсдэл, ашиг тус, нийтлэг буруу ойлголтыг тайлбарлав.
🔗 AI-д зориулсан өгөгдөл хадгалах шаардлага: Таны мэдэх ёстой зүйл
AI системүүдийн хадгалах хэрэгцээ, өргөтгөх чадвар, үр ашгийг хамарна.
🔗 AI-ийн эцэг нь хэн бэ?
Хиймэл оюун ухааны анхдагчид болон хиймэл оюун ухааны гарал үүслийг судалдаг.
AI-ийн хатуу сургагчийг юу болгодог вэ? 🏆
Энэ бол товчлуур дарах ажил биш. Шилдэг дасгалжуулагчид маш хачирхалтай авъяас чадварт тулгуурладаг:
-
Тэвчээр (маш их) - Загвар өмсөгчид нэг цохилтоор сурдаггүй. Дасгалжуулагчид наалдтал ижилхэн засваруудыг цохиж байна.
-
Онцлог нюанс - Ёслол, соёлын нөхцөл байдал, өрөөсгөл ойлголтыг олж авах нь хүний санал хүсэлтийг дээд зэргээр өгдөг [1].
-
Шууд харилцаа холбоо - Ажлын тал хувь нь хиймэл оюун ухаан буруу уншиж чадахгүй тодорхой зааварчилгаа бичих явдал юм.
-
Сониуч зан + ёс зүй - Сайн сургагч багш хариулт нь "үнэхээр зөв" эсэх, харин нийгмийн хувьд дүлий эсэх талаар асуудаг нь хиймэл оюун ухааны хяналтын гол сэдэв юм [2].
Энгийнээр хэлбэл: сургагч багш бол хэсэгчилсэн багш, хэсэг редактор, ёс зүйч юм.
Хиймэл оюун ухааны сургагч багшийн дүрүүдийг нэг дороос харах (Зарим онцлогтой 😉)
| Үүргийн төрөл | Хэн хамгийн сайн тохирох вэ | Ердийн төлбөр | Яагаад ажилладаг (эсвэл ажилладаггүй) |
|---|---|---|---|
| Өгөгдлийн шошгологч | Нарийн нарийн ширийн зүйлд дуртай хүмүүс | Бага-дунд доллар | Үнэхээр чухал; Хэрэв шошго нь бүдүүлэг байвал загвар бүхэлдээ зовдог [3] 📊 |
| RLHF мэргэжилтэн | Зохиолчид, редакторууд, шинжээчид | Дунд-Өндөр $$ | Хүний хүлээлттэй өнгө аяс, тодорхой байдлыг тохируулахын тулд хариултуудыг эрэмбэлж, дахин бичдэг [1] |
| Домэйн сургагч | Хуульч, эмч, шинжээч | Газрын зураг дээр 💼 | Салбарын тусгай системд зориулсан нарийн үг хэллэг, захын гэрүүдийг зохицуулдаг |
| Аюулгүй байдлын тоймч | Ёс суртахуунтай хүмүүс | Дунд зэргийн $$ | AI нь хортой контентоос зайлсхийхийн тулд удирдамжийг хэрэгжүүлдэг [2][5] |
| Бүтээлч сургагч багш | Уран бүтээлчид, түүхчид | Урьдчилан таамаглах аргагүй 💡 | Аюулгүй хязгаар дотор байхын зэрэгцээ хиймэл оюун ухаанд төсөөллийг цуурайлахад тусалдаг [5] |
(Тиймээ, формат нь бага зэрэг эмх замбараагүй байна - ажил өөрөө юм шиг.)
AI дасгалжуулагчийн амьдралын нэг өдөр
Тэгэхээр бодит ажил ямар харагдаж байна вэ? Илүү дур булаам кодчилол болон бусад зүйлийг бодоорой:
-
Хиймэл оюун ухаанаар бичсэн хариултуудыг хамгийн муугаас сайн хүртэл эрэмбэлэх (RLHF-ийн сонгодог алхам) [1].
-
Холимог байдлыг засах (загвар өмсөгч Сугар бол Ангараг биш гэдгийг мартсан гэх мэт).
-
Чатбот хариуг дахин бичих нь илүү байгалийн сонсогддог.
-
Текст, зураг эсвэл дууны уулсыг шошголох нь үнэн зөв байх нь чухал [3].
-
"Техникийн хувьд зөв" гэдэг нь хангалттай сайн эсэх, эсвэл аюулгүй байдлын удирдамжийг хүчингүй болгох эсэх талаар маргаж байна [2].
Энэ нь нэг хэсэг нь нүдэх, нэг хэсэг оньсого юм. Үнэнийг хэлэхэд, тотьыг зүгээр л ярих биш, харин үг хэллэгийг бага зэрэг буруугаар ашиглахаа болихыг зааж байна гэж төсөөлөөд үз дээ. 🦜
Дасгалжуулагч яагаад таны бодсоноос хамаагүй илүү чухал байдаг вэ?
Хүн жолоодохгүйгээр хиймэл оюун ухаан:
-
Хатуу, робот шиг сонсогддог.
-
Хяналтгүй тараах (аймшигтай бодол).
-
Хошигнол эсвэл өрөвдөх сэтгэлийг бүрэн санаж байна.
-
Эмзэг нөхцөл байдалд аюулгүй байдлаа бууруул.
Дасгалжуулагч нар бол “хүний эмх замбараагүй эд зүйлс”-д нууц үг хэллэг, халуун дулаан үг, хааяа нэг бүдүүлэг зүйрлэл зэрэгт сэм орж, аюулгүй байдлыг хангахын тулд хашлага зүүдэг [2][5].
Үнэн хэрэгтээ чухал ур чадвар
Танд докторын зэрэг хэрэгтэй гэсэн үлгэрийг март. Хамгийн их тусалдаг зүйл бол:
-
Бичих + засварлах цавчих - Өнгөлсөн боловч байгалийн аятай текст [1].
-
Аналитик сэтгэлгээ - Загварын давтагдсан алдааг олж илрүүлэх, өөрчлөх.
-
Соёлын мэдлэг - Хэзээ хэллэг буруу байж болохыг мэдэх нь [2].
-
Тэвчээр - Учир нь хиймэл оюун ухаан тэр дороо баригддаггүй.
Олон хэлний ур чадвар эсвэл мэргэжлийн ур чадварын урамшууллын оноо.
Дасгалжуулагчид хаана харагдаж байна 🌍
Энэ ажил нь зөвхөн чат ботын тухай биш бөгөөд энэ нь бүх салбар руу нууцаар нэвтэрч байна:
-
Эрүүл мэндийн тусламж үйлчилгээ - Хил хязгаарын тохиолдлуудын тэмдэглэгээний дүрмийг бичих (эрүүл мэндийн AI удирдамжид тусгагдсан) [2].
-
Санхүү - Хүмүүсийг хуурамч дохиололд живүүлэхгүйгээр залилан илрүүлэх системийг сургах [2].
-
Жижиглэн худалдаа - Брэндийн өнгө аясыг баримтлахын зэрэгцээ худал хуурмаг худалдан авагчийн хэлийг авахыг туслах ажилтнуудад заадаг [5].
-
Боловсрол - Сургалтын роботуудыг ивээн тэтгэхийн оронд урам зоригтой болгох нь [5].
Үндсэндээ: хэрэв хиймэл оюун ухаан ширээнд суудалтай бол ард нь сургагч багш нуугдаж байдаг.
Ёс суртахууны хэсэг (Үүнийг алгасаж болохгүй)
Эндээс л жин дарж байна. Хийх арга хэмжээ авахгүй бол хиймэл оюун ухаан нь хэвшмэл ойлголт, ташаа мэдээлэл эсвэл үүнээс ч дор зүйлийг давтдаг. Сургагч багш нар RLHF гэх мэт аргууд эсвэл загваруудыг ашигтай, хор хөнөөлгүй хариулт руу чиглүүлдэг үндсэн хуулийн дүрэм ашиглан үүнийг зогсоодог [1][5].
Жишээ нь: Хэрэв бот ажлын байрыг хэтрүүлсэн зөвлөмжийг түлхэж байвал сургагч багш үүнийг тэмдэглэж, дүрмийн номыг дахин бичиж, дахин давтагдахгүй байхыг баталгаажуулдаг. Энэ бол үйл ажиллагааны хяналт [2].
Тийм ч хөгжилтэй биш тал
Энэ бүхэн гялалзсан биш. Дасгалжуулагчид дараахь зүйлийг хийдэг.
-
Монотоник - Төгсгөлгүй шошго нь хуучирдаг.
-
Сэтгэл санааны ядаргаа - Хортой эсвэл сэтгэл түгшээсэн контентыг хянаж үзэх нь ихээхэн хохирол учруулж болзошгүй; дэмжих системүүд нь маш чухал [4].
-
Хүлээн зөвшөөрөгдөөгүй - Хэрэглэгчид сургагч багш нар байдгийг ойлгох нь ховор.
-
Тогтмол өөрчлөлт - Багаж хэрэгсэл тасралтгүй хөгжиж, сургагч багш нар үүнийг дагаж мөрдөх ёстой гэсэн үг юм.
Гэсэн хэдий ч олон хүний хувьд технологийн "тархи"-г бий болгох сэтгэл догдлом сэтгэл нь тэднийг дэгээд байлгадаг.
AI-ийн далд MVP
Тэгэхээр хиймэл оюун ухааны сургагч нар гэж хэн бэ? хүмүүст үйлчилдэг түүхий алгоритм ба системүүдийн хоорондох гүүр юм Тэдгээргүйгээр хиймэл оюун ухаан нь номын санчгүй номын сантай адил байх болно - олон тонн мэдээлэл, гэхдээ ашиглах нь бараг боломжгүй юм.
Дараагийн удаа чатбот таныг инээлгэж, эсвэл гайхалтай "зохицуулалт"-ыг мэдрэхэд сургагч багшдаа баярлалаа. Эдгээр нь машинуудыг зөвхөн тооцоолох төдийгүй [1][2][5] холбодог чимээгүй дүрсүүд юм.
Лавлагаа
[1] Ouyang, L. et al. (2022). Хүний санал хүсэлттэй зааварчилгааг дагаж мөрдөх хэлний загваруудыг сургах (InstructGPT). NeurIPS. Холбоос
[2] NIST (2023). Хиймэл оюун ухааны эрсдэлийн удирдлагын тогтолцоо (AI RMF 1.0). Холбоос
[3] Northcutt, C. et al. (2021). Туршилтын багц дахь өргөн тархсан шошгон дээрх алдаанууд нь машин сургалтын жишиг үзүүлэлтүүдийг тогтворгүй болгодог. NeurIPS мэдээллийн багц ба жишиг. Холбоос
[4] ДЭМБ/ОУХБ (2022). Ажил дээрх сэтгэцийн эрүүл мэндийн талаархи удирдамж. Холбоос
[5] Bai, Y. et al. (2022). Үндсэн хуулийн хиймэл оюун ухаан: AI санал хүсэлтийн хор хөнөөлгүй байдал. arXiv. Холбоос