Хиймэл оюун ухааны сургагч гэж юу вэ?

Хиймэл оюун ухааны сургагч гэж юу вэ?

Заримдаа хиймэл оюун ухаан бараг л ид шидийн заль мэх шиг санагддаг. Та санамсаргүй асуулт бичээд л хэдхэн секундын дотор гялгар, өнгөлөг хариулт гарч ирнэ. Гэхдээ гол нь энэ байна: "суут ухаантан" машин бүрийн ард жинхэнэ хүмүүс үүнийг түлхэж, засаж, хэлбэржүүлдэг. Эдгээр хүмүүсийг хиймэл оюун ухааны сургагч багш нар бөгөөд тэдний хийдэг ажил нь ихэнх хүмүүсийн төсөөлж байснаас илүү хачин, хөгжилтэй, үнэндээ илүү хүнлэг байдаг.

Эдгээр сургагч багш нар яагаад чухал, тэдний өдөр тутмын амьдрал ямар байдаг, мөн энэ үүрэг яагаад хэний ч таамаглаж байснаас хурдан өсөж байгаа талаар авч үзье.

Үүний дараа таны унших дуртай нийтлэлүүд:

🔗 Хиймэл оюун ухааны арбитраж гэж юу вэ: Энэ үгийн цаана байгаа үнэн
Хиймэл оюун ухааны арбитраж, түүний эрсдэл, ашиг тус болон нийтлэг буруу ойлголтуудыг тайлбарладаг.

🔗 Хиймэл оюун ухаанд зориулсан өгөгдөл хадгалах шаардлага: Таны мэдэх ёстой зүйлс
Хиймэл оюун ухааны системийн хадгалах хэрэгцээ, өргөтгөх боломж болон үр ашгийг хамардаг.

🔗 AI-ийн эцэг хэн бэ?
Хиймэл оюун ухааны анхдагчид болон хиймэл оюун ухааны үүслийг судалдаг.


Бат бөх хиймэл оюун ухааны дасгалжуулагчийг юу болгодог вэ? 🏆

Энэ бол товчлуур дарах ажил биш. Хамгийн шилдэг дасгалжуулагчид авьяас чадварын нэлээд хачин хослолд тулгуурладаг:

  • Тэвчээр (маш их) - Моделууд нэг дор сурдаггүй. Дасгалжуулагчид нэг л залруулгыг наалдах хүртлээ хийсээр байдаг.

  • Нюансуудыг олж харах - Ёжлол, соёлын нөхцөл байдал эсвэл нэг талыг барьсан байдлыг анзаарах нь хүний ​​санал хүсэлтийг давуу тал болгодог зүйл юм [1].

  • Шуурхай харилцаа холбоо - Ажлын тал хувь нь хиймэл оюун ухаан буруу уншиж чадахгүй тодорхой зааварчилгаа бичих явдал юм.

  • Сониуч зан + ёс зүй - Сайн сургагч багш хариулт нь "баримтаар зөв" боловч нийгмийн хувьд ойлгомжгүй эсэхийг асуудаг - энэ нь хиймэл оюун ухааны хяналтын гол сэдэв юм [2].

Энгийнээр хэлбэл: сургагч багш нь багшийн нэг хэсэг, редакторын нэг хэсэг, ёс зүйн мэргэжилтэн юм.


Хиймэл оюун ухааны сургагчийн үүргүүдийг товчхон авч үзье (Зарим онцлог шинж чанаруудтай 😉)

Дүрийн төрөл Хэн хамгийн сайн тохирох вэ Ердийн цалин Яагаад ажилладаг (эсвэл ажилладаггүй)
Өгөгдлийн шошгологч Нарийн ширийн зүйлийг хайрладаг хүмүүс Бага–Дунд $$ Мэдээж чухал; хэрэв шошго нь хайнга байвал загвар бүхэлдээ хохирно [3] 📊
RLHF мэргэжилтэн Зохиолчид, редакторууд, шинжээчид Дунд-Өндөр $$ Хүний хүлээлттэй өнгө аяс болон тодорхой байдлыг уялдуулахын тулд хариултуудыг эрэмбэлж, дахин бичдэг [1]
Домэйн сургагч Хуульчид, эмч нар, мэргэжилтнүүд Газрын зураг даяар 💼 Салбарын онцлогт тохирсон системүүдэд зориулсан тусгай мэргэжлийн хэллэг болон захын тохиолдлуудыг зохицуулдаг
Аюулгүй байдлын шүүмжлэгч Ёс зүйд дуртай хүмүүс Дунд зэргийн $$ Хиймэл оюун ухаан хортой контентоос зайлсхийхийн тулд удирдамжийг хэрэгжүүлдэг [2][5]
Бүтээлч сургагч Уран бүтээлчид, түүхчид Урьдчилан таамаглахын аргагүй 💡 Аюулгүй хязгаарт байхын зэрэгцээ хиймэл оюун ухаанд төсөөллийг тусгахад тусалдаг [5]

(Тийм ээ, формат нь жаахан замбараагүй байна - ажил өөрөө шиг л байна.)


Хиймэл оюун ухааны сургагчийн амьдралын нэг өдөр

Тэгэхээр бодит ажил ямар харагдаж байна вэ? Тансаг код бичихээс илүүтэйгээр илүү ихийг бодоорой:

  • Хиймэл оюун ухаанаар бичсэн хариултуудыг хамгийн муугаас хамгийн сайн руу нь эрэмбэлэх (сонгодог RLHF алхам) [1].

  • Зөрчилдөөнийг засах (жишээ нь загвар өмсөгч Сугар гараг Ангараг гараг биш гэдгийг мартсан үед).

  • Чатбот хариултуудыг илүү байгалийн сонсогдохоор дахин бичиж байна.

  • Текст, зураг эсвэл аудионы уулсыг шошголох - нарийвчлал үнэхээр чухал [3].

  • "Техникийн хувьд зөв" гэдэг нь хангалттай сайн эсэх, эсвэл аюулгүй байдлын удирдамжийг давах ёстой эсэх талаар маргалдах [2].

Энэ бол нэг талаас нь төвөгтэй, нөгөө талаас нь таавар юм. Үнэнийг хэлэхэд, тоть руу зөвхөн ярихыг заагаад зогсохгүй үгсийг бага зэрэг буруу хэрэглэхээ болихыг зааж байна гээд төсөөлөөд үз дээ - энэ бол уур амьсгал юм. 🦜


Яагаад дасгалжуулагчид таны бодож байгаагаас хамаагүй илүү чухал вэ

Хүн жолоодохгүйгээр хиймэл оюун ухаан дараахь зүйлийг хийх байсан:

  • Хатуу бас робот мэт сонсогдож байна.

  • Хяналтгүй тархсан нэг талыг барьсан (аймшигтай бодол).

  • Хошин шог эсвэл бусдын өрөвч сэтгэлийг бүрэн үгүйлж байна.

  • Мэдрэмтгий нөхцөл байдалд аюулгүй байдлаа бага байлга.

Дасгалжуулагчид бол "эмх замбараагүй хүний ​​​​юм" - хэллэг, дулаан, хааяа нэг болхи зүйрлэлийг сэмхэн оруулдаг бөгөөд аюулгүй байдлыг хангахын тулд хашлага ашигладаг хүмүүс юм [2][5].


Үнэхээр чухал ур чадварууд

Докторын зэрэг хэрэгтэй гэсэн домгийг март. Хамгийн их тусалдаг зүйл бол:

  • Бичих + засварлах хэсэг - Өнгөлсөн боловч байгалийн сонсогдож буй текст [1].

  • Аналитик сэтгэлгээ - Загварын давтагдсан алдааг олж илрүүлэх, тохируулах.

  • Соёлын мэдлэг - Хэллэг буруу байж болохыг мэдэх [2].

  • Тэвчээр - Учир нь хиймэл оюун ухаан тэр даруй ойлгож авдаггүй.

Олон хэлний ур чадвар эсвэл мэргэжлийн чиглэлээр мэргэшсэн бол нэмэлт оноо авна.


Дасгалжуулагчид хаана гарч ирж байна вэ 🌍

Энэ ажил зөвхөн чатботуудын тухай биш - энэ нь бүх салбар руу сэм нэвтэрч байна:

  • Эрүүл мэндийн тусламж үйлчилгээ - Хил хязгаарын тохиолдлуудад тэмдэглэгээний дүрэм бичих (эрүүл мэндийн хиймэл оюун ухааны удирдамжид тусгагдсан) [2].

  • Санхүү - Хүмүүсийг хуурамч дохиололд живүүлэхгүйгээр залилан мэхлэлтийг илрүүлэх системийг сургах [2].

  • Жижиглэн худалдаа - Туслах ажилтнуудад брэндийн өнгө аясыг баримталж, худалдан авагчдын хэллэгийг энгийн болгохыг заах [5].

  • Боловсрол - Багшлах роботуудыг ивээн тэтгэхийн оронд урамшуулах байдлаар хэлбэржүүлэх [5].

Үндсэндээ: хэрэв хиймэл оюун ухаан ширээн дээр суудалтай бол ард нь сургагч багш нуугдаж байна гэсэн үг.


Ёс зүйн хэсэг (Үүнийг алгасаж болохгүй)

Энд л асуудал хүндэрдэг. Хяналтгүй орхивол хиймэл оюун ухаан хэвшмэл ойлголт, буруу мэдээлэл эсвэл бүр дор зүйлийг давтдаг. Сургагч багш нар үүнийг RLHF эсвэл загваруудыг тустай, хор хөнөөлгүй хариулт руу чиглүүлдэг үндсэн хуулийн дүрэм гэх мэт аргуудыг ашиглан зогсоодог [1][5].

Жишээ: хэрэв бот ажлын байрны нэг талыг барьсан зөвлөмжийг түлхэж байвал сургагч багш үүнийг тэмдэглэж, дүрмийн номыг дахин бичиж, дахин ийм зүйл тохиолдохгүй байхыг баталгаажуулдаг. Энэ бол үйлдэл дэх алдаа юм [2].


Тийм ч хөгжилтэй биш тал

Энэ бүхэн тийм ч гайхалтай биш. Дасгалжуулагчид дараах зүйлсийг шийддэг:

  • Нэг хэвийн байдал - Төгсгөлгүй шошгололт хуучирдаг.

  • Сэтгэл хөдлөлийн ядаргаа - Хортой эсвэл түгшүүр төрүүлэм контентыг хянах нь хүнд дарамт учруулж болзошгүй; дэмжлэгийн системүүд маш чухал юм [4].

  • Хүлээн зөвшөөрөгдөхгүй байх - Хэрэглэгчид сургагч багш нар байдаг гэдгийг ховорхон мэддэг.

  • Байнгын өөрчлөлт - Хэрэгслүүд тасралтгүй хөгжиж байдаг тул сургагч багш нар хөл нийлүүлэн алхах ёстой.

Гэсэн хэдий ч олон хүний ​​хувьд технологийн "тархи"-г бүрдүүлэх сэтгэл хөдлөл тэднийг донтуулдаг.


Хиймэл оюун ухааны нууцлаг MVP-үүд

ажилладаг системүүдийн хоорондох гүүр юм . Тэдэнгүйгээр хиймэл оюун ухаан нь номын санчгүй номын сан шиг байх байсан - маш их мэдээлэлтэй ч ашиглахад бараг боломжгүй.

Дараагийн удаа чатбот таныг инээлгэх эсвэл гайхмаар "тохирох" мэдрэмж төрүүлэх үед сургагч багшдаа талархал илэрхийлээрэй. Тэд бол машинуудыг зөвхөн тооцоолохоос гадна холбоход хүргэдэг чимээгүй тоонууд юм [1][2][5].


Лавлагаа

[1] Оуянг, Л. нар. (2022). Хэлний загваруудыг хүний ​​санал хүсэлтийн дагуу зааврыг дагаж сургах (InstructGPT). NeurIPS. Холбоос

[2] NIST (2023). Хиймэл оюун ухааны эрсдэлийн удирдлагын хүрээ (AI RMF 1.0). Холбоос

[3] Норткатт, К. нар. (2021). Тестийн багц дахь түгээмэл тохиолддог шошгоны алдаанууд нь машин сургалтын шалгуур үзүүлэлтийг тогтворгүй болгодог. NeurIPS өгөгдлийн багц ба шалгуур үзүүлэлтүүд. Холбоос

[4] ДЭМБ/ОУХБ (2022). Ажлын байран дахь сэтгэцийн эрүүл мэндийн удирдамж. Холбоос

[5] Бай, Ю. нар. (2022). Үндсэн хуулийн хиймэл оюун ухаан: Хиймэл оюун ухааны санал хүсэлтээс үүдэлтэй хор хөнөөлгүй байдал. arXiv. Холбоос


Албан ёсны хиймэл оюун ухааны туслах дэлгүүрээс хамгийн сүүлийн үеийн хиймэл оюун ухааныг олоорой

Бидний тухай

Блог руу буцах