хиймэл оюун ухаан хаанаас мэдээлэл авдаг вэ

Хиймэл оюун ухаан мэдээллээ хаанаас авдаг вэ?

Хэзээ нэгэн цагт толгойгоо маажиж суугаад... энэ зүйлс хаанаас гараад ирэв ээ ? Хиймэл оюун ухаан тоостой номын сангийн овоолгоор гүйлгэж эсвэл YouTube-ийн богино бичлэгүүдийг зальжин үзэж байгаагүй. Гэсэн хэдий ч энэ нь лазаньягийн заль мэхнээс эхлээд хар нүхний физик хүртэл бүх зүйлийн хариултыг гаргаж ирдэг - яг л дотор нь ямар нэгэн ёроолгүй файлын шүүгээ байгаа юм шиг. Бодит байдал нь илүү хачин, магадгүй таны таамаглаж байснаас ч илүү сонирхолтой юм. Үүнийг жаахан задалцгаая (тийм ээ, магадгүй замдаа хэдэн домог тайлъя).


Энэ ид шид үү? 🌐

Энэ бол ид шид биш, гэхдээ заримдаа тэгж санагддаг. Нууцлалын цаана юу болж байгаа нь үндсэндээ хэв маягийн таамаглал . Том хэлний загварууд (LLMs) нь баримтуудыг хадгалдаггүй ; харин тэд өмнөх үг дээр үндэслэн дараагийн үгийг (токен) таахад сургагдсан байдаг [2]. Практикт энэ нь тэд харилцаа холбоог нягталдаг гэсэн үг юм: ямар үгс хоорондоо наалддаг, өгүүлбэрүүд ихэвчлэн хэрхэн хэлбэрждэг, бүхэл бүтэн санаанууд хэрхэн шат шиг баригддаг. Тийм ч учраас гаралт сонсогдож байгаа ч гэсэн - бүрэн шударга байдал - энэ бол ойлголт биш, харин статистикийн дуураймал юм [4].

Тэгэхээр хиймэл оюун ухаанаар үүсгэгдсэн мэдээллийг юу ашигтай ? Цөөн хэдэн зүйл:

  • Өгөгдлийн олон янз байдал - нэг нарийн урсгалаас бус, тоо томшгүй олон эх сурвалжаас мэдээлэл авах.

  • Шинэчлэлтүүд - шинэчлэлтийн мөчлөггүйгээр хурдан хуучирдаг.

  • Шүүлтүүр - хамгийн тохиромжтой нь хог хаягдлыг нэвчихээс нь өмнө барих явдал юм (гэхдээ үнэнийг хэлэхэд тэр тор нүхтэй байдаг).

  • Харилцан шалгалт хийх - эрх мэдлийн эх сурвалжид тулгуурлах (НАСА, ДЭМБ, томоохон их сургуулиудыг бодоорой) бөгөөд энэ нь хиймэл оюун ухааны засаглалын ихэнх тоглоомын номонд зайлшгүй байх ёстой зүйл юм [3].

хий үзэгдэл гэж нэрлэгддэг үү? Үндсэндээ шулуун царайтай өнгөлсөн утгагүй зүйлс [2][3].

Үүний дараа таны унших дуртай нийтлэлүүд:

🔗 Хиймэл оюун ухаан сугалааны тоог урьдчилан таамаглаж чадах уу?
Хиймэл оюун ухааны сугалааны таамаглалын талаарх домог, баримтуудыг судлах.

🔗 Хиймэл оюун ухаанд цогцоор хандах гэдэг нь юу гэсэн үг вэ?
Ёс зүй болон нөлөөллийн талаарх тэнцвэртэй хэтийн төлөвтэй хиймэл оюун ухааныг ойлгох.

🔗 Хиймэл оюун ухааны талаар Библид юу гэж байдаг вэ?
Технологи ба хүний ​​бүтээлийн талаарх Библийн хэтийн төлөвийг судлах.


Хурдан харьцуулалт: Хиймэл оюун ухаан хаанаас гаралтай вэ 📊

Бүх эх сурвалж тэгш биш ч гэсэн тус бүр өөрийн гэсэн үүрэг гүйцэтгэдэг. Энд товч мэдээлэл байна.

Эх сурвалжийн төрөл Хэн үүнийг ашигладаг вэ (AI) Зардал/Үнэ цэнэ Яагаад ажилладаг вэ (эсвэл ажилладаггүй вэ...)
Ном ба нийтлэлүүд Том хэлний загварууд Үнэлж баршгүй (инээв) Нягт, бүтэцлэгдсэн мэдлэг - зүгээр л хурдан хөгширдөг.
Вэбсайтууд ба Блогууд Бараг бүх хиймэл оюун ухаан Чөлөөт (дуу чимээтэй) Зэрлэг төрөл зүйл; гялалзсан байдал болон туйлын хог хаягдлын холимог.
Эрдэм шинжилгээний бүтээлүүд Судалгаанд ихээхэн анхаардаг хиймэл оюун ухаан Заримдаа төлбөрийн ханатай Хатуу чанга байдал + найдвартай байдал, гэхдээ хүнд хэллэгээр илэрхийлсэн.
Хэрэглэгчийн өгөгдөл Хувь хүнд тохирсон хиймэл оюун ухаан Өндөр мэдрэмжтэй ⚠️ Хувийн нууцлалын асуудал маш их тулгардаг ч нарийн оёдол.
Бодит цагийн вэб Хайлттай холбоотой хиймэл оюун ухаан Үнэгүй (онлайнаар бол) Мэдээллийг шинээр нь хадгалдаг; сул тал нь цуурхал тархах эрсдэл юм.

Сургалтын өгөгдлийн ертөнц 🌌

Энэ бол "бага насны суралцах" үе шат юм. Хүүхдэд сая сая олон нийтэд нээлттэй өгөгдөл, лицензтэй эх сурвалж, сургагч багшийн үүсгэсэн текстийг нэгтгэдэг [2].

Дээрээс нь давхарласан: сайжруулалт эхлэхээс өмнө сонгогдсон хүний ​​жишээнүүд - сайн хариулт, муу хариулт, зөв ​​чиглэлд түлхэх зүйлс [1].

Ил тод байдлын анхааруулга: компаниуд бүх нарийн ширийн зүйлийг задруулдаггүй. Зарим хашлага нь нууцлалтай байдаг (IP, аюулгүй байдлын асуудал) тул та бодит хослолыг зөвхөн хэсэгчлэн харах боломжтой [2].


Бодит цагийн хайлт: Нэмэлт өнгөлгөө 🍒

Зарим загварууд одоо сургалтын хөөснөөсөө гадагш харж болно. Энэ нь сэргээн засварлах-өргөтгөсөн үе (RAG) буюу үндсэндээ шууд индекс эсвэл баримт бичгийн дэлгүүрээс хэсгүүдийг татаж аваад хариулт болгон нэгтгэдэг [5]. Мэдээний гарчиг эсвэл хувьцааны үнэ зэрэг хурдан өөрчлөгдөж буй зүйлсэд төгс тохирно.

Үр дүн нь юу вэ? Интернет бол суут ухаантан ба хог хаягдлын галын тэнцүү хэсэг юм. Хэрэв шүүлтүүр эсвэл гарал үүслийн шалгалт сул байвал эрсдэлийн хүрээний анхааруулж буй зүйл болох хог өгөгдөл буцаж орох эрсдэлтэй [3].

Нийтлэг шийдэл: компаниуд загваруудыг өөрсдийн дотоод мэдээллийн санд холбодог тул хариултууд нь одоогийн Хүний нөөцийн бодлого эсвэл шинэчилсэн бүтээгдэхүүний баримт бичгийг иш татахын оронд иш татдаг. Бодоод үз дээ: "өө-өө" гэх мэт үгс цөөн, илүү найдвартай хариултууд.


Нарийн тохируулга: Хиймэл оюун ухааны өнгөлгөөний алхам 🧪

Урьдчилан бэлтгэсэн түүхий загварууд нь болхи байдаг тул тэдгээрийг нарийн тохируулдаг :

  • тустай, хор хөнөөлгүй, шударга байхыг заах (хүний ​​санал хүсэлтээс суралцах, RLHF) [1].

  • Аюултай эсвэл хортой ирмэгийг зүлгэх (тэгшлэх) [1].

  • Эелдэг, албан ёсны эсвэл тоглоомтой ёжтой байхаас үл хамааран өнгө аясаа тохируулах.

Энэ нь очир алмаазыг өнгөлөхөөс илүүтэйгээр статистикийн нуранги үүсгэж, ярианы хамтрагч шиг авирлах явдал юм.


Бэрхшээл ба бүтэлгүйтэл 🚧

Үүнийг өөгүй гэж дүр эсгэх хэрэггүй:

  • Хий үзэгдэл - бүрэн буруу тодорхой хариултууд [2][3].

  • Хазайлт - энэ нь өгөгдөлд шингэсэн хэв маягийг тусгадаг; хэрэв тэмдэглээгүй бол тэдгээрийг улам бүр нэмэгдүүлж болно [3][4].

  • Шөлний ярьж болох ч хэзээ ч амталж үзээгүй [4].

  • Хэт өөртөө итгэх итгэл - үг хэллэг нь мэдэхгүй байсан ч мэдэж байгаа юм шиг урсдаг. Эрсдэлийн хүрээ нь таамаглалыг онцолдог [3].


Яагаад санагддаг 🧠

Энэ нь ямар ч итгэл үнэмшилгүй, хүний ​​​​утга учиртай ой санамжгүй, мэдээжийн хэрэг өөрийгөө ч үгүй. Гэсэн хэдий ч өгүүлбэрүүдийг жигд холбодог тул таны тархи үүнийг ойлгосон . Юу болж байгаа нь зүгээр л асар том хэмжээний дараагийн тэмдгийн таамаглал : хэдхэн секундын дотор их наяд магадлалыг тооцоолох [2].

"Оюун ухаан"-ын мэдрэмж нь шинээр гарч ирж буй зан үйл бөгөөд судлаачид үүнийг бага зэрэг хачин жигтэй "стохастик тоть"-ны нөлөө гэж нэрлэдэг [4].


Хүүхдэд ээлтэй зүйрлэл 🎨

Номын сангийн бүх номыг уншсан тоть гээд төсөөлөөд үз дээ. Тэр түүхийг нь ойлгодоггүй ч үгсийг нь ухаалаг мэт санагдуулж чаддаг. Заримдаа энэ нь яг таарсан байдаг; заримдаа утгагүй зүйл байдаг ч хангалттай уран сэтгэмжтэй байхад та үргэлж ялгааг нь мэдэрч чаддаггүй.


Дүгнэж хэлэхэд: Хиймэл оюун ухааны мэдээлэл хаанаас гардаг вэ 📌

Энгийнээр хэлбэл:

  • Сургалтын асар их хэмжээний мэдээлэл (нийтийн + лицензтэй + сургагч багшийн үүсгэсэн) [2].

  • Хүний санал хүсэлтийг ашиглан хэлбэр дүрс/зан төлөвийг нарийн тохируулах

  • Шууд өгөгдлийн урсгалд холбогдсон үед авах системүүд

Хиймэл оюун ухаан юмыг "мэддэггүй" - тэр текстийг урьдчилан таамагладаг . Энэ бол түүний супер хүч чадал болон Ахиллесийн өсгий юм. Гол нь юу вэ? Чухал зүйлсийг үргэлж итгэмжлэгдсэн эх сурвалжтай харьцуулж үзээрэй [3].


Лавлагаа

  1. Оуянг, Л. нар (2022). Хэлний загваруудыг хүний ​​санал хүсэлтийн дагуу зааврыг дагахад сургах нь (InstructGPT) . arXiv .

  2. OpenAI (2023). GPT-4 Техникийн Тайлан - лицензтэй, олон нийтийн болон хүний ​​бүтээсэн өгөгдлийн холимог; next-token таамаглалын зорилго ба хязгаарлалтууд. arXiv .

  3. NIST (2023). Хиймэл оюун ухааны эрсдэлийн удирдлагын хүрээ (Хиймэл оюун ухааны RMF 1.0) - гарал үүсэл, найдвартай байдал болон эрсдэлийн хяналт. PDF .

  4. Бендер, EM, Гебру, Т., Макмиллан-Мэйжор, А., Митчелл, С. (2021). Стохастик тотьны аюулын талаар: Хэлний загварууд хэтэрхий том байж болох уу? PDF .

  5. Льюис, П. нар. (2020). Мэдлэгт суурилсан NLP-д зориулсан сэргээн засварлах-өргөтгөсөн үе . arXiv .


Албан ёсны хиймэл оюун ухааны туслах дэлгүүрээс хамгийн сүүлийн үеийн хиймэл оюун ухааныг олоорой

Бидний тухай

Блог руу буцах