Хэрэв та хүмүүс GPT-ийг айлын үг мэт эргэлдүүлэхийг сонссон бол та ганцаараа биш гэсэн үг. Энэхүү товчлол нь бүтээгдэхүүний нэр, судалгааны баримт бичиг, өдөр тутмын чат дээр гарч ирдэг. Энгийн хэсэг нь энд байна: GPT нь Урьдчилан бэлтгэгдсэн үүсгүүрийн трансформатор гэсэн үг . Ашигтай тал нь эдгээр дөрвөн үг яагаад чухал болохыг мэдэх явдал юм - учир нь ид шид нь эвлүүлдэг. Энэхүү гарын авлага нь үүнийг задалсан: цөөн хэдэн санал бодол, бага зэргийн ухралт, олон практик зөвлөмжүүд. 🧠✨
Үүний дараа унших дуртай нийтлэлүүд:
🔗 Урьдчилан таамаглах хиймэл оюун ухаан гэж юу вэ
Өгөгдөл болон алгоритм ашиглан үр дүнг урьдчилан таамаглах хиймэл оюун ухаан хэрхэн таамагладаг.
🔗 AI дасгалжуулагч гэж юу вэ
Орчин үеийн хиймэл оюун ухааны системийг сургах үүрэг, ур чадвар, ажлын урсгал.
🔗 Нээлттэй эхийн AI гэж юу вэ
Нээлттэй эхийн хиймэл оюун ухааны тодорхойлолт, ашиг тус, сорилт, жишээ.
🔗 Билэгдлийн хиймэл оюун ухаан гэж юу вэ: таны мэдэх ёстой бүх зүйл
Билэгдлийн хиймэл оюун ухааны түүх, үндсэн аргууд, давуу тал, хязгаарлалтууд.
Шуурхай хариулт: GPT нь юу гэсэн үг вэ?
GPT = Урьдчилан бэлтгэгдсэн үүсгэгч трансформатор.
-
Generative - энэ нь контент үүсгэдэг.
-
Урьдчилан бэлтгэгдсэн - дасан зохицохоосоо өмнө өргөн хүрээнд суралцдаг.
-
Трансформатор - өгөгдлийн харилцааг загварчлахад хувийн анхаарал хандуулдаг мэдрэлийн сүлжээний архитектур.
Хэрэв та нэг өгүүлбэртэй тодорхойлолтыг хүсч байвал: GPT нь трансформаторын архитектур дээр суурилсан, өргөн текст дээр урьдчилан бэлтгэгдсэн, дараа нь зааврыг дагаж, тустай байхаар тохируулсан том хэлний загвар юм [1][2].
Бодит амьдрал дээр товчлол яагаад чухал байдаг вэ 🤷♀️
Товчилсон үгс нь уйтгартай боловч эдгээр системүүд байгальд хэрхэн ажилладагийг сануулж байна. GPT нь generative тэд зөвхөн хэсэгчилсэн хэсгүүдийг авдаггүй бөгөөд хариултуудыг нэгтгэдэг. Тэд урьдчилан бэлтгэгдсэн өргөн мэдлэгтэй бөгөөд хурдан дасан зохицож чаддаг. Трансформатор учраас тэдгээр нь хуучны архитектуруудаас илүү сайн цар хүрээтэй бөгөөд холын зайн контекстийг илүү сайн зохицуулдаг [2]. Энэхүү хослол нь таныг regex дибаг хийх эсвэл лазанья хийхээр төлөвлөж байх үед шөнийн 2 цагт GPT яагаад харилцан яриа, уян хатан, хачирхалтай мэт санагддагийг тайлбарладаг. Би... хоёуланг нь зэрэг хийсэн гэсэн үг биш.
Трансформаторын битийн талаар сонирхож байна уу? Анхаарал татах механизм нь загваруудад бүх зүйлд адилхан хандахын оронд оролтын хамгийн хамааралтай хэсгүүдэд анхаарлаа төвлөрүүлэх боломжийг олгодог бөгөөд энэ нь трансформаторууд маш сайн ажилладаг гол шалтгаан юм [2].
GPT-ийг юунд ашигтай болгодог вэ ✅
Шударга байцгаая - хиймэл оюун ухааны олон нэр томьёо шуугиан тарьж байна. GPT нь ид шидийн гэхээсээ илүү практик шалтгаанаар түгээмэл байдаг:
-
Контекст мэдрэмж - өөртөө анхаарал хандуулах нь загварт үгсийг бие биетэйгээ харьцуулж, уялдаа холбоо, үндэслэлийг сайжруулахад тусалдаг [2].
-
Шилжүүлэх чадвар - өргөн өгөгдлийн талаархи урьдчилсан сургалт нь загварт хамгийн бага дасан зохицох замаар шинэ ажлуудыг гүйцэтгэх ерөнхий ур чадварыг өгдөг.
-
Зохицуулах тохируулга - хүний санал хүсэлт (RLHF)-ээр дамжуулан зааварчилгааг дагах нь ашиггүй эсвэл зорилтот бус хариултуудыг багасгаж, үр дүнг хамтран ажиллах мэдрэмж төрүүлдэг [3].
-
Мультимодал өсөлт - шинэ GPT нь зураг (болон бусад) дээр ажиллах боломжтой бөгөөд энэ нь харааны асуулт, хариулт эсвэл баримт бичгийг ойлгох зэрэг ажлын урсгалыг идэвхжүүлдэг [4].
Тэд буруу ойлгосон хэвээр байна уу? Тийм ээ. Гэхдээ энэ багц нь ашиг тустай байдаг - ихэвчлэн хачирхалтай, учир нь энэ нь түүхий мэдлэгийг удирдах боломжтой интерфейстэй хослуулдаг.
"GPT нь юу гэсэн үг вэ" дээрх үгсийг задлах 🧩
Генератив
Загвар нь сургалтын явцад сурсан загвар дээр тулгуурлан текст, код, хураангуй, тойм болон бусад зүйлийг жетоноор гаргадаг Хүйтэн и-мэйл асууж, тэр нь газар дээр нь нэгийг нь бүрдүүлдэг.
Урьдчилан бэлтгэгдсэн
Таныг хүрэхээс өмнө GPT нь том текстийн цуглуулгаас хэлний өргөн хүрээг хамарсан байдаг. Урьдчилсан сургалт нь түүнд ерөнхий ур чадварыг өгдөг бөгөөд ингэснээр та үүнийг нарийн тааруулах эсвэл зүгээр л ухаалаг өдөөлт [1] ашиглан хамгийн бага өгөгдөлтэй өөрийн хэрэгцээнд тохируулах боломжтой.
Трансформатор
Энэ бол масштабыг практик болгосон архитектур юм. Трансформаторууд алхам бүрт аль жетон чухал болохыг шийдэхийн тулд өөртөө анхаарал хандуулах давхаргыг ашигладаг, догол мөрийг алгасч, таны нүд холбогдох үгс рүү буцах мэт боловч ялгах, сургах боломжтой [2].
GPT-ийг хэрхэн тустай байхаар сургадаг вэ (богино боловч хэтэрхий товч биш) 🧪
-
Урьдчилсан сургалт - асар том текст цуглуулгад дараагийн жетоныг урьдчилан таамаглаж сурах; Энэ нь хэлний ерөнхий чадварыг бий болгодог.
-
Хяналттай нарийн тохируулга - хүмүүс сануулгад хамгийн тохиромжтой хариултуудыг бичдэг; загвар нь тэр хэв маягийг дуурайж сурдаг [1].
-
Хүний санал хүсэлтээс суралцах бататгах (RLHF) - хүмүүс үр дүнг эрэмбэлж, урамшууллын загварыг сургаж, үндсэн загварыг хүмүүсийн илүүд үздэг хариултыг бий болгохын тулд оновчтой болгодог. Энэхүү InstructGPT жор нь чатын загвар өмсөгчдөд зөвхөн эрдэм шинжилгээний ажил гэхээсээ илүү тустай мэт сэтгэгдэл төрүүлсэн зүйл юм [3].
GPT нь трансформатор эсвэл LLM-тэй ижил үү? Нэг төрлийн, гэхдээ яг тийм биш 🧭
-
Трансформатор - үндсэн архитектур.
-
Том хэлний загвар (LLM) - текст дээр бэлтгэгдсэн аливаа том загварт зориулсан өргөн нэр томъёо.
-
GPT - OpenAI [1][2]-ээр дэлгэрүүлсэн, үүсгэгч, урьдчилан бэлтгэгдсэн трансформаторт суурилсан LLM-ийн гэр бүл.
Тиймээс GPT бүр нь LLM ба трансформатор боловч трансформаторын загвар бүр нь GPT-ийн тэгш өнцөгт ба квадратууд биш юм.
Мультимодал газар дахь "GPT нь юу гэсэн үг вэ" өнцөг 🎨🖼️🔊
Текстийн хажууд зураг оруулах үед товчилсон үг тохирох хэвээр байна. Генератив болон урьдчилан бэлтгэгдсэн хэсгүүд нь янз бүрийн горимуудыг хамардаг бол трансформаторын нь олон төрлийн оролтыг зохицуулахад тохирсон байдаг. Алсын хараатай GPT-ийн дүр төрх, аюулгүй байдлын талаархи ойлголтыг олон нийтэд гүнзгийрүүлэхийн тулд системийн картыг үзнэ үү [4].
Хэрэглээнд тохирсон GPT-ийг хэрхэн сонгох вэ 🧰
-
Бүтээгдэхүүний загварчлал - ерөнхий загвараас эхэлж, шуурхай бүтэцтэй давтах; Энэ нь эхний өдөр төгс нарийн тохируулгыг хөөхөөс илүү хурдан юм [1].
-
Тогтвортой дуу хоолой эсвэл бодлого шаардсан ажлууд - хяналттай нарийн тохируулга болон зан төлөвийг түгжихийн тулд давуу эрхэд суурилсан тохируулгыг анхаарч үзээрэй [1][3].
-
Алсын хараа эсвэл баримт бичиг ихтэй ажлын урсгалууд - мультимодал GPT нь зөвхөн хэврэг OCR дамжуулах шугамгүйгээр зураг, диаграмм эсвэл дэлгэцийн агшинг задлан шинжлэх боломжтой [4].
-
Өндөр эрсдэлтэй эсвэл зохицуулалттай орчин - хүлээн зөвшөөрөгдсөн эрсдэлийн тогтолцоотой нийцүүлж, сануулга, өгөгдөл, гаралтыг шалгах хаалгыг тохируулах [5].
Хариуцлагатай хэрэглээ, товчхондоо- чухал учраас 🧯
Эдгээр загварууд шийдвэр гаргахад тусгагдсан тул багууд өгөгдөл, үнэлгээ, улаан багийг анхааралтай авч үзэх ёстой. Практик эхлэлийн цэг бол өөрийн системийг хүлээн зөвшөөрөгдсөн, борлуулагчаас хамааралгүй эрсдэлийн тогтолцоотой харьцуулах явдал юм. NIST-ийн хиймэл оюун ухааны эрсдлийн удирдлагын тогтолцоо нь удирдах, зураглах, хэмжих, удирдах функцийг тоймлон харуулсан бөгөөд тодорхой практик үйл ажиллагаа бүхий Generative AI профайлыг өгдөг [5].
Тэтгэвэрт гарах тухай нийтлэг буруу ойлголт 🗑️
-
"Энэ бол бүх зүйлийг хайж олох мэдээллийн сан юм."
Үгүй ээ. GPT-ийн үндсэн зан төлөв нь дараагийн жетон таамаглал юм; хайлтыг нэмж болох боловч энэ нь анхдагч [1][2] биш юм. -
"Том загвар нь баталгаатай үнэн гэсэн үг."
Хэмжээ нь тусалдаг, гэхдээ илүүд үздэг оновчлогдсон загварууд нь ашиг тустай, аюулгүй байдлын арга зүйн хувьд илүү том тохируулагдаагүй загваруудаас илүү байж чаддаг нь RLHF-ийн гол зүйл юм [3]. -
"Multimodal гэдэг нь зүгээр л OCR гэсэн үг."
Үгүй. Мультимодал GPT нь контекстийг илүү сайн ойлгохын тулд загварчлалын үндэслэлийн шугамд харааны онцлогуудыг нэгтгэдэг [4].
Үдэшлэгт хэрэглэж болох халаасны тайлбар 🍸
GPT гэж юу гэсэн үг вэ гэж асуухад дараахыг оролдоно уу:
"Энэ бол Урьдчилан бэлтгэгдсэн Урьдчилан бэлтгэгдсэн хувиргагч буюу хиймэл оюун ухааны нэг төрөл бөгөөд асар том текст дээр хэлний хэв маягийг сурч, дараа нь хүний санал хүсэлтээр тохируулсан тул зааварчилгааг дагаж, хэрэгтэй хариултуудыг гаргаж чадна." [1][2][3]
Богинохон, нөхөрсөг, зүгээр л интернетээс юм уншиж байгааг илтгэх хэмжээний тэнэг.
Текстээс гадна GPT нь юу гэсэн үг вэ: та үнэхээр ажиллуулж болох практик ажлын урсгалууд 🛠️
-
Оюуны довтолгоо, тойм - агуулгын ноорог, дараа нь сумны цэгүүд, өөр гарчиг эсвэл эсрэг заалт гэх мэт бүтэцтэй сайжруулалтыг хүс.
-
Өгөгдлийг өгүүлэх - жижиг хүснэгтийг буулгаж, нэг догол мөр бүхий товч дүгнэлтийг хүс, дараа нь хоёр эрсдэл, тус бүрийг бууруулах.
-
Кодын тайлбар - төвөгтэй функцийг алхам алхмаар уншиж, дараа нь хэд хэдэн туршилтыг хүснэ үү.
-
Multimodal triage - диаграмын зургийг нэгтгэж, "трэндийг нэгтгэн дүгнэж, гажуудлыг тэмдэглэж, дараагийн хоёр шалгалтыг санал болго."
-
Бодлогыг мэддэг гаралт - тодорхойгүй үед юу хийх талаар тодорхой зааварчилгаа бүхий дотоод удирдамжийг лавлах загварыг нарийн тааруулж эсвэл зааварчилна.
Эдгээр нь тус бүр нь ижил гурвалсан дээр тулгуурладаг: үүсгүүрийн гаралт, өргөн хүрээний урьдчилсан сургалт, трансформаторын нөхцөл байдлын үндэслэл [1][2].
Гүн шумбах булан: бага зэрэг алдаатай зүйрлэлд анхаарлаа хандуулаарай 🧮
Нэг аяга кофе ууж байхдаа эдийн засгийн тухай өтгөн догол мөрийг уншиж байна гэж төсөөлөөд үз дээ. Таны тархи чухал мэт санагдах цөөн хэдэн түлхүүр хэллэгийг дахин шалгаж, тэдэнд сэтгэцийн наалттай тэмдэглэл өгдөг. Сонгосон анхаарал нь анхаарал хандуулахтай . Трансформаторууд бусад жетонтой харьцуулахад жетон бүрт хэр их "анхаарал жин" хэрэглэхийг сурдаг; Олон тооны анхаарлын толгойнууд нь өөр өөр онцлох зүйлүүдийг гүйлгэж, дараа нь ойлголтуудыг нэгтгэдэг хэд хэдэн уншигч шиг ажилладаг [2]. Төгс биш, би мэднэ; гэхдээ наалддаг.
Түгээмэл асуулт: маш богино хариулт, ихэвчлэн
-
GPT нь ChatGPT-тэй ижил үү?
ChatGPT бол GPT загвар дээр бүтээгдсэн бүтээгдэхүүний туршлага юм. Нэг гэр бүл, UX-ийн өөр давхарга, аюулгүй байдлын хэрэгсэл [1]. -
GPT зөвхөн текст хийдэг үү?
Үгүй. Зарим нь мультимодаль, зураг (ба түүнээс дээш) харьцдаг [4]. -
Би GPT хэрхэн бичихийг хянах боломжтой юу?
Тиймээ. Дуу болон бодлогыг дагаж мөрдөхийн тулд шуурхай бүтэц, системийн зааварчилгаа эсвэл нарийн тохируулгыг ашиглана уу [1][3]. -
Аюулгүй байдал, эрсдэлийн талаар юу хэлэх вэ?
Хүлээн зөвшөөрөгдсөн хүрээг баталж, сонголтоо баримтжуулна [5].
Эцсийн тайлбар
Хэрэв та өөр юу ч санахгүй байгаа бол үүнийг санаарай: GPT гэдэг нь үгийн сангийн асуултаас илүү зүйл юм. Энэхүү товчлол нь орчин үеийн хиймэл оюун ухаанд хэрэгтэй мэт сэтгэгдэл төрүүлсэн жорыг кодлодог. Generative нь танд чөлөөтэй гаралтыг өгдөг. Урьдчилан бэлтгэгдсэн нь танд өргөн хүрээг өгдөг. Трансформатор нь танд хэмжээ болон контекстийг өгдөг. Систем хэвийн ажиллахын тулд зааварчилгааг нэмээд гэнэт бичих, шалтгаан, дасан зохицох ерөнхий туслах ажилтантай болно. Энэ төгс үү? Мэдээж үгүй. Гэхдээ мэдлэгийн ажлын практик хэрэглүүрийн хувьд энэ нь Швейцарийн армийн хутгатай адил бөгөөд таныг ашиглаж байх үед үе үе шинэ ир зохион бүтээж, уучлалт гуйж, хураангуйг өгдөг.
Хэт удаан, уншаагүй.
-
GPT гэдэг нь юу гэсэн үг вэ : Урьдчилан бэлтгэгдсэн үүсгүүрийн трансформатор.
-
Энэ нь яагаад чухал вэ: генератив синтез + урьдчилсан сургалт + трансформаторын контекстийг зохицуулах [1][2].
-
Үүнийг хэрхэн хийдэг вэ: бэлтгэлийн өмнөх бэлтгэл, хяналттай нарийн тохируулга, хүний санал хүсэлтийг тохируулах [1][3].
-
Үүнийг сайн ашигла: хурдан бүтэцтэй байх, тогтвортой байдлыг хангах, эрсдэлийн хүрээтэй нийцүүлэх [1][3][5].
-
Үргэлжлүүлэн суралц: анхны трансформаторын цаас, OpenAI баримт бичиг, NIST-ийн удирдамж [1][2][5]-ыг судлаарай.
Лавлагаа
[1] OpenAI - Гол ойлголтууд (сургалт хийхээс өмнөх, нарийн тааруулах, санал болгох, загварууд)
дэлгэрэнгүй унших
[2] Васвани нар, "Анхаарал бол танд хэрэгтэй зүйл" (Трансформаторын архитектур)
дэлгэрэнгүй
[3] Ouyang нар., "Хүний санал хүсэлтийн дагуу зааврыг дагаж мөрдөх хэлний загваруудыг сургах" (InstructGPT / RLHF)
дэлгэрэнгүй
[4] OpenAI - GPT-4V(ision) системийн карт (олон төрлийн боломж ба аюулгүй байдал)
дэлгэрэнгүй унших
[5] NIST - AI эрсдэлийн удирдлагын тогтолцоо (борлуулагч-саармаг засаглал)
дэлгэрэнгүй унших