Бүтээлч хиймэл оюун ухааны гол зорилго юу вэ?

Бүтээлч хиймэл оюун ухааны гол зорилго юу вэ?

Бүтээлч хиймэл оюун ухааны гол зорилго нь маш энгийн:

Энэ нь одоо байгаа өгөгдлөөс загваруудыг сурч, дараа нь хүсэлтэд тохирсон шинэ гарцуудыг бий болгох замаар текст, зураг, аудио, код, видео, дизайн зэрэг шинэ, үнэмшилтэй контентыг бий болгох

Энэ бол гол цөм юм. Бусад бүх зүйл (бүтээмж, бүтээлч байдал, хувьчлах, синтетик өгөгдөл гэх мэт) нь үндсэндээ "бид энэ цөмөөр юу хийж чадах вэ?" гэсэн яриа юм.

Үүний дараа унших дуртай нийтлэлүүд:

🔗 Генератив AI гэж юу вэ
Загварууд текст, зураг, код болон бусад зүйлийг хэрхэн бүтээдэгийг ойлгох.

🔗 Хиймэл оюун ухаан хэт магтагдсан уу?
Хөөрөл, хязгаарлалт болон бодит ертөнцийн нөлөөллийн талаарх тэнцвэртэй тойм.

🔗 Танд аль хиймэл оюун ухаан тохирох вэ
Алдартай хиймэл оюун ухааны хэрэгслүүдийг харьцуулж, хамгийн сайн тохирохыг нь сонгоорой.

🔗 Хиймэл оюун ухааны бөмбөлөг байгаа юу?
Анхаарах ёстой шинж тэмдгүүд, зах зээлийн эрсдэлүүд болон цаашид юу болох вэ.


Бүтээлч хиймэл оюун ухааны гол зорилго🧠

Хэрэв та хамгийн богино бөгөөд үнэн зөв тайлбарыг хүсвэл:

  • Бүтээлч хиймэл оюун ухаан нь өгөгдлийн (хэл, зураг, хөгжим, код) "хэлбэр"-ийг сурдаг

  • тэр хэлбэрт тохирсон шинэ дээжийг үүсгэдэг

  • Энэ нь үүнийг өдөөлт, нөхцөл байдал эсвэл хязгаарлалтын хариуд хийдэг

Тийм ээ, энэ нь догол мөр бичиж, зураг зурж, аяыг дахин микширч, гэрээний заалтыг боловсруулж, туршилтын тохиолдлуудыг үүсгэж эсвэл логотой төстэй зүйл зохион бүтээж чадна.

Хүн ойлгодог шиг "ойлгодог" учраас биш (бид үүний талаар ярих болно), харин сурсан хэв маягтайгаа статистик болон бүтцийн хувьд нийцтэй гарц гаргахдаа сайн учраас тэр.

Хэрэв та "үүнийг хэрхэн ашиглах талаар" насанд хүрэгчдэд зориулсан ойлголтыг хүсч байвал NIST-ийн хиймэл оюун ухааны эрсдэлийн удирдлагын хүрээ нь эрсдэл + хяналтын сэтгэлгээний бат бөх тулгуур юм. [1] Хэрэв та тусгайлан тохируулсан зүйл хүсч байвал NIST нь систем контент үүсгэх үед юу өөрчлөгддөгийг илүү гүнзгий харуулсан GenAI профайлыг нийтэлсэн. [2]

 

Бүтээлч хиймэл оюун ухаан

Хүмүүс яагаад "Үйлдвэрлэлийн хиймэл оюун ухааны гол зорилго"-ын талаар маргалддаг вэ 😬

Хүмүүс "зорилго" гэдэг үгийг өөр өөрөөр ойлгодог учраас бие биенийхээ хажуугаар ярьдаг

Зарим хүмүүс дараахийг хэлдэг:

  • Техникийн зорилго: бодитой, уялдаа холбоотой гарцуудыг бий болгох (гол)

  • Бизнесийн зорилго: зардлыг бууруулах, гарцыг нэмэгдүүлэх, туршлагыг хувь хүнд тохируулан өөрчлөх

  • Хүний зорилго: илүү хурдан сэтгэх, бүтээх эсвэл харилцахад тусламж авах

Тийм ээ, эдгээр нь мөргөлддөг.

Хэрэв бид сууриа хадгалж үлдвэл, Generative AI-ийн гол зорилго бол generation буюу өмнө нь байгаагүй, оролтод суурилсан контент бүтээх явдал юм.

Бизнесийн зүйлс цаашаа чиглэж байна. Соёлын сандрал ч бас урагшаа чиглэж байна (уучлаарай... жаахан 😬).


Хүмүүс GenAI-г юутай андуурдаг вэ (мөн энэ нь яагаад чухал вэ) 🧯

"Энэ биш" гэсэн товч жагсаалт нь олон төөрөгдлийг арилгаж чадна:

GenAI нь мэдээллийн сан биш юм

Энэ нь "үнэнийг олж авдаггүй". Энэ нь үнэмшилтэй үр дүнг бий болгодог. Хэрэв танд үнэн хэрэгтэй бол та үндэслэл (баримт бичиг, мэдээллийн сан, ишлэл, хүний ​​тойм) нэмдэг. Энэ ялгаа нь үндсэндээ найдвартай байдлын бүхэл бүтэн түүх юм. [2]

GenAI нь автоматаар агент биш юм

Загвар үүсгэж буй текст нь үйлдэл хийх (имэйл илгээх, бичлэг өөрчлөх, код байршуулах) боломжтой системтэй адил зүйл биш юм. “Зааварчилгаа үүсгэж чадна” ≠ “тэдгээрийг гүйцэтгэх ёстой.”

GenAI нь санаатай биш юм

Энэ нь санаатай сонсогдож буй контентыг бий болгож чадна. Энэ нь санаатай байхтай адил биш юм.


Бүтээлч хиймэл оюун ухааны сайн хувилбарыг юу бүрдүүлдэг вэ? ✅

Бүх "үйлдвэрлэх" системүүд адилхан практик биш. Өдөөн үүсгэх хиймэл оюун ухааны сайн хувилбар нь зөвхөн сайхан гарц гаргадаг төдийгүй тухайн нөхцөл байдалд үнэ цэнэтэй, хянаж болохуйц, аюулгүй

Сайн хувилбар нь ихэвчлэн дараахь зүйлийг агуулдаг

  • Уялдаа холбоо - энэ нь хоёр өгүүлбэр тутамд өөртэйгөө зөрчилддөггүй

  • Газардуулга - энэ нь гаралтыг үнэний эх сурвалжтай (баримт бичиг, ишлэл, мэдээллийн сан) холбож чадна 📌

  • Хяналттай байдал - та өнгө аяс, формат, хязгаарлалтыг (зөвхөн чичиргээ өдөөхөөс гадна) удирдаж чадна

  • Найдвартай байдал - ижил төстэй асуултууд нь рулетын үр дүн биш харин ижил төстэй чанарыг өгдөг

  • Аюулгүйн хашлага - энэ нь аюултай, хувийн эсвэл зөвшөөрөгдөөгүй гарцуудаас дизайны дагуу зайлсхийдэг

  • Шударга зан байдал - энэ нь зохиомол зүйл хийхийн оронд "Би итгэлгүй байна" гэж хэлж чадна

  • Ажлын урсгалын тохироо - энэ нь уран зөгнөлийн ажлын урсгалд биш, харин хүмүүсийн ажиллах арга барилд холбогддог

NIST нь энэ бүх яриаг үндсэндээ "итгэл даах чадвар + эрсдэлийн удирдлага" гэж тодорхойлдог бөгөөд энэ нь хүн бүрийн өмнө нь хийхийг хүсдэг секси бус зүйл юм. [1][2]

Төгс бус зүйрлэл (өөрийгөө бэлдээрэй): сайн бүтээгч загвар нь юу ч бэлдэж чаддаг маш хурдан гал тогооны туслахтай адил юм... гэхдээ заримдаа давсыг элсэн чихэртэй андуурдаг бөгөөд амттан шөл өгөхгүйн тулд шошго, амтлах тест хийх шаардлагатай болдог 🍲🍰


Өдөр тутмын хурдан хийх жижиг хайрцаг (нийлмэл, гэхдээ маш энгийн) 🧩

GenAI-ийн хариултыг боловсруулахыг хүсч буй дэмжлэг үзүүлэх багийг төсөөлөөд үз дээ:

  1. 1 дэх долоо хоног: “Загвар өмсөгч тасалбарт хариулна уу.”

    • Гаралт нь хурдан, итгэлтэй... заримдаа үнэтэй аргаар буруу байдаг.

  2. 2 дахь долоо хоног: Тэд сэргээлт (батлагдсан баримт бичгээс баримтуудыг татаж авах) + загваруудыг ("дансны дугаарыг үргэлж асуух", "буцаан олголт хэзээ ч амлахгүй" гэх мэт).

    • Буруу байдал буурч, тогтвортой байдал сайжирна.

  3. 3 дахь долоо хоног: Тэд хяналтын хэсэг (өндөр эрсдэлтэй ангиллыг хүний ​​зөвшөөрөлтэйгээр) + энгийн үнэлгээг нэмдэг ("бодлогыг иш татсан", "буцаан олголтын дүрмийг дагаж мөрдсөн").

    • Одоо системийг байршуулах боломжтой болсон.

Энэ дэвшил нь үндсэндээ NIST-ийн практик дээрх гол санаа юм: загвар нь зөвхөн нэг хэсэг юм; түүнийг тойрсон хяналтууд нь үүнийг хангалттай аюулгүй болгодог. [1][2]


Харьцуулсан хүснэгт - алдартай үүсгэгч сонголтууд (мөн тэдгээр нь яагаад ажилладаг вэ) 🔍

Үнэ байнга өөрчлөгдөж байдаг тул энэ нь санаатайгаар тодорхойгүй хэвээр байна. Мөн: ангиллууд давхцаж байна. Тийм ээ, энэ нь ядаргаатай юм.

Хэрэгсэл / арга барил Үзэгчид Үнэ (ойролцоогоор) Энэ яагаад ажилладаг вэ (бас бага зэрэг хачин)
Ерөнхий LLM чатын туслахууд Бүгд, багууд Үнэгүй түвшин + захиалга Ноорог бичих, нэгтгэн дүгнэх, санал бодлоо солилцох зэрэгт маш тохиромжтой. Заримдаа өөртөө итгэлтэйгээр буруу байдаг... яг л зоригтой найз шиг 😬
Аппликейшнуудад зориулсан API LLM-үүд Хөгжүүлэгчид, бүтээгдэхүүний багууд Хэрэглээнд суурилсан Ажлын урсгалд нэгтгэхэд хялбар; ихэвчлэн сэргээх + хэрэгслүүдтэй хослуулдаг. Хашлага хэрэгтэй, эс тэгвээс халуун болно
Зургийн үүсгүүрүүд (диффузийн хэв маягаар) Бүтээгчид, маркетерууд Захиалга/кредит Хэв маяг + хувьсал сайтай; дуу чимээг бууруулах хэв маягийн үеийн загварууд дээр суурилсан [5]
Нээлттэй эх үүсвэрийн үүсгүүрийн загварууд Хакерууд, судлаачид Үнэгүй програм хангамж + техник хангамж Хяналт + тохируулга, нууцлалд ээлтэй тохиргоо. Гэхдээ та тохиргооны хүндрэл (мөн GPU-ийн халалт)-ын төлөөсийг төлдөг
Аудио/хөгжим үүсгэгч Хөгжимчид, хоббичид Кредит/захиалга Ая, иш, дууны дизайны талаар хурдан санаа гаргах. Лиценз олгох нь төөрөгдүүлж болно (нэр томьёог уншина уу)
Видео үүсгүүрүүд Бүтээгчид, студиуд Захиалга/кредит Хурдан зураг авалтын самбар болон концепцийн клипүүд. Үзэгдлүүдийн тогтвортой байдал нь толгойны өвчин хэвээр байна
Сэргээн засварлах замаар нэмэгдүүлсэн үе (RAG) Бизнесүүд Инфра + хэрэглээ Баримт бичигтэй холбоотой үүсэлтийг холбоход тусалдаг; "зохиомол зүйлсийг" багасгах нийтлэг хяналт [2]
Синтетик өгөгдлийн үүсгүүрүүд Мэдээллийн багууд Аж ахуйн нэгж маягийн Өгөгдөл хомс/мэдрэмтгий үед тохиромжтой; үүсгэсэн өгөгдөл таныг хуурахгүйн тулд баталгаажуулалт шаардлагатай 😵

Үндсэндээ: үе гэдэг нь үндсэндээ "загварын гүйцээлт" юм 🧩

Романтик бус үнэн:

Ихэнх генератив хиймэл оюун ухаан нь "дараа нь юу болохыг урьдчилан таамаглах" гэсэн өөр мэдрэмж төрүүлэх хүртэл өргөжүүлдэг.

  • Текст дотор: текстийн дараагийн хэсгийг (токен маягаар) дарааллаар үүсгэх - орчин үеийн өдөөлтийг маш үр дүнтэй болгосон сонгодог авторегрессийн тохиргоо [4]

  • Зурагт: шуугианаас эхэлж, давталттайгаар бүтцэд нь (диффузийн гэр бүлийн зөн совин) оруулна [5]

Тийм учраас өдөөлтүүд чухал юм. Та загварт хэсэгчилсэн загвар өгч байгаа бөгөөд энэ нь түүнийг гүйцээж байна.

Ийм учраас генератив хиймэл оюун ухаан дараах зүйлсэд маш сайн байж чаддаг:

  • "Үүнийг илүү эелдэг өнгө аястай бичээрэй"

  • "Надад арван гарчгийн сонголт өгөөч"

  • "Эдгээр тэмдэглэлийг цэвэр төлөвлөгөө болгон хувирга"

  • “Шатирийн код + тест үүсгэх”

...мөн яагаад энэ нь дараахтай холбоотой байж болох вэ:

  • үндэслэлгүй хатуу баримтын нарийвчлал

  • учир шалтгааны урт, хэврэг гинж

  • олон гаралтын (дүрүүд, брэндийн дуу хоолой, давтагдах дэлгэрэнгүй мэдээлэл) дагуу тууштай ижил төстэй байдал

Энэ бол хүн шиг "сэтгэх" биш. Энэ нь үнэмшилтэй үргэлжлэлийг бий болгож байна. Үнэ цэнэтэй боловч өөр.


Бүтээлч байдлын мэтгэлцээн - “бүтээх” ба “ремикс хийх” 🎨

Энд хүмүүс хэт их уурладаг. Би ойлгож байна.

Бүтээлч хиймэл оюун ухаан нь ихэвчлэн дараах чадвартай тул бүтээлч мэдрэмж

  • ойлголтуудыг нэгтгэх

  • хувилбаруудыг хурдан судлах

  • гаднах гайхмаар холбоо

  • аймшигтай нарийвчлалтайгаар дуураймал хэв маяг

Гэхдээ үүнд зорилго байхгүй. Дотоод мэдрэмж байхгүй. "Энэ надад чухал учраас би үүнийг хийсэн."

Гэхдээ бага зэрэг ухралт: хүмүүс ч гэсэн байнга ремикс хийдэг. Бид үүнийг зүгээр л амьдралын туршлага, зорилго, амтаараа хийдэг. Тиймээс ломбэ маргаантай хэвээр үлдэж чадна. Практикт энэ нь хүмүүст бүтээлч хөшүүрэг


Синтетик өгөгдөл - чимээгүйхэн дутуу үнэлэгдсэн зорилго 🧪

Генератив хиймэл оюун ухааны нэг гайхалтай чухал салбар бол бодит хүмүүс эсвэл ховор тохиолддог эмзэг тохиолдлуудыг ил гаргахгүйгээр бодит өгөгдөл шиг ажилладаг өгөгдлийг бий болгох явдал юм.

Энэ яагаад үнэ цэнэтэй вэ:

  • нууцлал болон нийцлийн хязгаарлалт (бодит бүртгэлийг ил гаргах нь бага)

  • ховор үйл явдлын симуляци (луйврын ирмэгийн тохиолдлууд, нарийн шугам хоолойн эвдрэл гэх мэт)

  • үйлдвэрлэлийн өгөгдлийг ашиглахгүйгээр дамжуулах хоолойг турших

  • Бодит өгөгдлийн багц бага байх үед өгөгдлийн нэмэгдэл

Гэхдээ гол нь одоо ч гэсэн гол нь хэвээрээ байна: синтетик өгөгдөл нь анхны өгөгдөлтэй адил нэг талыг баримтлах болон харагдахгүй цэгүүдийг чимээгүйхэн хуулбарлаж чаддаг - ийм учраас засаглал болон хэмжилт нь үеийнхэнтэй адил чухал юм. [1][2][3]

Синтетик өгөгдөл нь кофеингүй кофе шиг - энэ нь эд анги нь харагдаж, сайхан үнэртэй ч заримдаа таны бодож байсан шиг ажилладаггүй ☕🤷


Хязгаарлалтууд - генератив хиймэл оюун ухаан юунд муу вэ (мөн яагаад) 🚧

Хэрэв та зөвхөн нэг анхааруулгыг санаж байвал үүнийг санаарай:

Бүтээлч загварууд нь чөлөөтэй утгагүй зүйлийг бий болгож чадна.

Нийтлэг алдааны горимууд:

  • Галлюцинация - баримт, ишлэл эсвэл үйл явдлыг өөртөө итгэлтэйгээр зохиох

  • Хуучирсан мэдлэг - агшин зураг дээр сургагдсан загварууд шинэчлэлтийг алдаж магадгүй

  • Шуурхай хэврэг байдал - үгийн жижиг өөрчлөлтүүд нь гаралтын томоохон өөрчлөлтийг үүсгэж болзошгүй

  • Далд алдаа - гажуудсан өгөгдлөөс сурсан хэв маяг

  • Хэт их дагаж мөрдөх - туслах ёсгүй байсан ч туслахыг хичээдэг

  • Ялангуяа урт хугацааны ажлуудын хувьд тогтворгүй үндэслэл

Чухам ийм учраас л "найдвартай хиймэл оюун ухаан"-ын тухай яриа өрнөж байна: ил тод байдал, хариуцлага, бат бөх байдал, хүн төвтэй дизайн нь тийм ч таатай зүйл биш; эдгээр нь та итгэлийн их бууг үйлдвэрлэлд нэвтрүүлэхээс хэрхэн зайлсхийх вэ гэдэг юм. [1][3]


Амжилтыг хэмжих нь: зорилгодоо хэзээ хүрэхийг мэдэх 📏

Хэрэв Бүтээлч хиймэл оюун ухааны гол зорилго нь "үнэ цэнэтэй шинэ контент бий болгох" бол амжилтын үзүүлэлтүүд нь ихэвчлэн хоёр хэсэгт хуваагддаг:

Чанарын үзүүлэлтүүд (хүний ​​болон автоматжуулсан)

  • зөв байдал (хамааралтай бол)

  • уялдаа холбоо ба тодорхой байдал

  • хэв маягийн тохируулга (өнгө ая, брэндийн дуу хоолой)

  • бүрэн байдал (таны хүссэн зүйлийг хамарна)

Ажлын урсгалын үзүүлэлтүүд

  • даалгавар тус бүрт хэмнэсэн цаг

  • засварын тоог багасгах

  • чанарын уналтгүйгээр илүү өндөр бүтээмжтэй

  • хэрэглэгчийн сэтгэл ханамж (тоон үзүүлэлтээр илэрхийлэхэд хэцүү байсан ч хамгийн чухал үзүүлэлт)

Практик дээр багууд эвгүй үнэнтэй тулгардаг:

  • загвар нь "хангалттай сайн" ноорогуудыг хурдан гаргаж чаддаг

  • гэхдээ чанарын хяналт нь шинэ саад тотгор болж байна

Тиймээс жинхэнэ ялалт нь зөвхөн үе биш юм. Энэ нь үе ба хяналтын системүүд - сэргээн босгох газардуулга, үнэлгээний багцууд, бүртгэл, улаан багуудын нэгдэл, өсөлтийн замууд ... үүнийг бодит болгодог бүх секси бус зүйлс юм. [2]


"Харамсахгүйгээр ашиглаарай" гэсэн практик удирдамж 🧩

Хэрэв та энгийн зугаа цэнгэлээс гадна ямар нэгэн зүйлд генератив хиймэл оюун ухааныг ашиглаж байгаа бол хэдэн зуршил маш их тус болно:

  • Бүтцийг асуу: “Надад дугаарласан төлөвлөгөө, дараа нь ноорог өгөөч.”

  • Хязгаарлалтыг албадах: “Зөвхөн эдгээр баримтыг ашигла. Хэрэв дутуу байгаа бол юу дутуу байгааг хэл.”

  • Тодорхойгүй байдлыг хүсэх: “Таамаглалуудыг жагсаах + итгэл үнэмшил.”

  • Газардуулга ашиглах: баримтууд чухал үед баримт бичиг/мэдээллийн сантай холбогдох [2]

  • Гаралтыг ноорог гэж үзэх: тэр ч байтугай гайхалтай үр дүнгүүд

Хамгийн энгийн заль бол хамгийн хүнлэг арга юм: чангаар уншаарай. Хэрэв энэ нь менежерт чинь сэтгэгдэл төрүүлэхийг оролдож буй робот шиг сонсогдож байвал засварлах шаардлагатай байх 😅


Дүгнэлт 🎯

Бүтээлч хиймэл оюун ухааны гол зорилго нь өгөгдлөөс загварыг сурч, үнэмшилтэй гарц гаргах замаар тодорхой хүсэлт эсвэл хязгаарлалтад нийцсэн шинэ контент үүсгэх явдал юм

Энэ нь хүчтэй учир нь:

  • төсөл боловсруулах, санаа боловсруулах ажлыг хурдасгадаг

  • хувилбаруудыг хямдхан үржүүлдэг

  • ур чадварын зөрүүг арилгахад тусалдаг (бичих, код бичих, дизайн хийх)

Энэ нь эрсдэлтэй, учир нь:

  • баримтуудыг чөлөөтэй зохиож чаддаг

  • хэвийсэн байдал болон сохор толбыг өвлөн авдаг

  • ноцтой нөхцөл байдалд үндэслэл, хяналт шаардлагатай [1][2][3]

Сайн ашигласан ч "орлуулах тархи" багатай, харин "турботой хөдөлгүүр" илүүтэй.
Муу ашигласан ч гэсэн энэ нь таны ажлын урсгал руу чиглүүлсэн итгэлийн их буу юм... мөн энэ нь хурдан үнэтэй болдог 💥


Лавлагаа

[1] NIST-ийн AI RMF - AI эрсдэл болон хяналтыг удирдах хүрээ. дэлгэрэнгүй унших
[2] NIST AI 600-1 GenAI профайл - GenAI-д хамаарах эрсдэл болон бууруулах арга хэмжээний удирдамж (PDF). дэлгэрэнгүй унших
[3] OECD AI зарчмууд - хариуцлагатай AI-ийн өндөр түвшний зарчмуудын багц. дэлгэрэнгүй унших
[4] Браун нар. (NeurIPS 2020) - том хэлний загвар бүхий цөөн зурагт өдөөлтийн талаарх үндсэн баримт бичиг (PDF). дэлгэрэнгүй унших
[5] Хо нар. (2020) - дуу чимээг бууруулахад суурилсан дүрс үүсгэхийг тайлбарласан диффузийн загвар баримт бичиг (PDF). дэлгэрэнгүй унших

Албан ёсны AI Assistant дэлгүүрээс хамгийн сүүлийн үеийн хиймэл оюун ухааныг олоорой

Бидний тухай

Блог руу буцах