ai-д зориулсан урлагийн хэв маяг

Хиймэл оюун ухаанд зориулсан урлагийн хэв маяг: Бүтээлч боломжуудыг судлах нь

Хиймэл оюун ухаан нь хүснэгтэд гацсанаа больсон. Энэ нь ноорог зурах, будах, коллаж зурах зэрэг үйлдлүүд юм - заримдаа бүр түгшүүр төрүүлэм. Хэрэв та хэзээ нэгэн цагт суугаад " За, гэхдээ хиймэл оюун ухаанд юу зурахыг би яаж хэлэх вэ?" гэж байсан бол "хиймэл оюун ухаанд зориулсан урлагийн хэв маяг" гэсэн санаа эндээс л гарч ирдэг.

Доор бид текстээс зураг руу хөрвүүлэх системд ямар хэв маяг хамгийн сайн тохирдог, яагаад тийм байдаг, мөн өөрийн гялбаагаа алдахгүйгээр хэрхэн удирдах талаар авч үзэх болно. Би практик туршилтаас хэдэн практик тэмдэглэл (олон удаагийн оролдлогод үнэндээ юу хадгалагдсаныг оруулаад) болон зарим техникийн хэсгүүдийг оруулж, үйл явц нь шоо шидэхтэй арай бага төстэй байх болно [1][2][3][4][5].

Үүний дараа таны унших дуртай нийтлэлүүд:

🔗 Хиймэл оюун ухааны урлагийг хэрхэн хийх вэ: Эхлэгчдэд зориулсан бүрэн гарын авлага
Хиймэл оюун ухаанаар үүсгэгдсэн дижитал урлагийн бүтээлийг бүтээх алхам алхмаар эхлэн суралцагчдад зориулсан гарын авлага.

🔗 Хиймэл оюун ухаанаар үүсгэгдсэн урлагийн эхлэл: Бүтээлч байдлыг нээх үү эсвэл маргаан дэгдээх үү
Хиймэл оюун ухаанаар үүсгэгдсэн урлагийн талаарх бүтээлч байдал, ёс зүй, мэтгэлцээнийг судлах.

🔗 График дизайны шилдэг хиймэл оюун ухааны хэрэгслүүд: Шилдэг хиймэл оюун ухаанаар ажилладаг дизайны програм хангамж
Орчин үеийн график дизайны ажлын урсгалыг өөрчлөх хүчирхэг хиймэл оюун ухааны хэрэгслүүдийг олж нээ.


Хиймэл оюун ухаанд зориулсан урлагийн хэв маягийг үнэхээр сайн болгодог зүйл юу вэ? ✨

Загвар сонгох нь зүгээр л чиг хандлагыг хөөцөлдөх биш юм. Зарим загварууд нь загвар өмсөгчдөд барихад илүү хялбар байдаг. Яагаад гэвэл хэд хэдэн шалтгаан бий:

  • Тодорхой байдал - Үнэхээр өвөрмөц "дүрэм"-тэй хэв маяг (кубизмын хугарсан геометр; мангагийн шугам ихтэй самбарууд) нь зорилтот дүрслэл тийм ч их хэлбэлздэггүй тул илүү давтагдах боломжтой байдаг [3][4].

  • Уян хатан байдал - Холимогт ээлтэй хэв маяг (жишээлбэл, "киберпанк + реализм") нь орчин үеийн диффузийн загваруудыг зүйлсийг цэвэрхэн холихын тулд хөндлөн анхааралд тулгуурлах боломжийг олгодог [1].

  • Танигдах байдал - Сургалтын өгөгдлүүд мянга мянган удаа (аниме, импрессионизм, фотореализм) илүү үнэн зөв гарч ирсэн хэв маяг [2].

  • Сэтгэл санаа/Агаар мандал - “Меланхолик”, “тайван” эсвэл “неон гэрэлтсэн” гэх мэт үгс нь гэрэлтүүлэг, палитр болон найрлагыг зориудаар мэдрүүлэх байдлаар найдвартай өөрчилдөг [5].

Зорилго нь эмнэлзүйн "нарийвчлал" биш юм. Энэ бол таны сэтгэл санаа эсвэл түүхийн сав болгон хэв маягийг ашиглах явдал бөгөөд загварыг дахин дахин чиглүүлж, тэр саванд хүрэхийг сурах явдал юм.


Хиймэл оюун ухаан хэв маягийг хэрхэн “хардаг” (Энгийн хувилбар, хэт их хэллэггүй)

Орчин үеийн текстээс дүрс рүү хөрвүүлэх загварууд нь гурван зүйлийг хослуулдаг:

  1. Текст-Зургийн Тохиргоо - CLIP гэх мэт системүүд нь "аль үгс ямар харагдахтай тохирч байгааг" сурдаг. Тиймээс та "шохойтой бэхний угаалга" гэж хэлэхэд энэ нь тухайн хэллэгийг дүрслэлтэй холбодог [3].

  2. Латин орон зай дахь диффузи - Латин диффузи нь таны тайлбар руу чиглэсэн чимээ шуугиантай дүрсийг аажмаар хурцалдаг. Ингэснээр үр ашиг болон хяналтыг хоёуланг нь олж авдаг [1].

  3. Түр зуурын өөрчлөлтүүд - Кинематографийн гэрэлтүүлэг, обудны гэрэл, өндөр тодосгогчтой хальсны ширхэг гэх мэт жижиг "нийтийн заль мэх" нь овоолж болох тохируулж болох залгууртай адил юм [5].

Энэ яагаад чухал вэ: Хэрэв хэв маяг нь сургалтын өгөгдөлд тодорхой байгаа бөгөөд та үүнийг зөв нэмэлтүүдээр тайлбарлавал та тогтвортой үр дүнд хурдан хүрэх болно [1][2][5].


Харьцуулах хүснэгт: Хиймэл оюун ухааны алдартай урлагийн хэв маяг 🖌️

Замбараагүй боловч хэрэгтэй хууран мэхлэх хуудас ирж байна:

Урлагийн хэв маяг Үзэгчид Үнэ (Хиймэл оюун ухааны хэрэгслүүд) Яагаад ажилладаг вэ
Реализм Гэрэл зурагчид, брэндүүд Үнэгүй – $$$ Гоёмсог, итгэл даахуйц харагдаж байна
Анимэ/Манга Залуу фенүүд, тоглогчид Үнэгүй - дунд зэргийн үнэтэй Хүчтэй шугамын бүтэц; шууд уншигдах боломжтой
Сюрреализм Бүтээлч хүмүүс, мөрөөдөгчид Чөлөөт маягийн Хачирхалтай хослолууд нь диффузид сайн тохирдог
Киберпанк Технологийн хорхойтнууд, ирээдүйг судлагчид Ихэнхдээ үнэгүй нэмэлтүүд байдаг Неон + тодосголт = шууд гайхалтай мэдрэмж ⚡
Импрессионизм Урлаг сонирхогчид Дунд зэргийн өртөг Хөнгөн + сойзтой бүтэц нь загвар өмсөгчдөд ээлтэй
Бага Поли 3D Дизайнерууд, хөгжүүлэгчид Янз бүрийн Энгийн геометр нь үр дүнг тогтвортой байлгадаг
Пикселийн урлаг Тоглоомчид, носталги хайгчид Үнэгүй (ихэвчлэн) Хатуу хязгаарлалтууд нь найрлагыг удирддаг

Талбайн зураас: Киберпанкийн хувьд “зөөлөн хүрээ-гэрэл + эзэлхүүний манан”-ыг хэт цэвэр гаралтаас зайлсхийхийн тулд “8-бит, 32×32, хязгаарлагдмал палитр” гэсэн тэмдэг ашиглана уу


Гүнзгий шумбалт: Реализм ба Сюрреализм 🎭

Реализм нь пропорциональ байдал болон нарийн ширийн зүйлийн тухай бөгөөд итгэл үнэмшил чухал ач холбогдолтой маркетингийн композит эсвэл бүтээгдэхүүний дизайнд төгс тохирно. Фотореал, гүехэн DOF, студийн гэрэлтүүлэг, 85 мм-ийн линз хиймэл оюун ухаанд тодорхой техникийн тулгуур өгдөг.

Сюрреализм нь нөгөө талаас хачин зүйл рүү чиглэдэг. Диффузийн загварууд энд үнэхээр гялалзаж байна: "цагнаас бүтсэн эмгэн хумс", "хийллийн чавхдаст хот" - хүмүүсийн үндэслэлтэй болгож чадахгүй ч загвар нь нүдээр холбож оёж чаддаг зүйлс. Энэ бол хөндлөн анхаарал чимээгүйхэн ид шидээ хийж байгаа явдал юм [1]. Сайн шошго: зүүд шиг, боломжгүй геометр, Эшер маягийн .


Анимэ ба Манга: Хиймэл оюун ухаант хонгор минь 🌸

Аниме/манга бараг шударга бус үр дүнтэй байдаг. Тодорхойлсон шугаман, эсийн сүүдэрлэлт болон дүрслэлийн пропорцууд нь загварт түгжигдсэн загварыг өгдөг бөгөөд сургалтын өгөгдөлд инээдтэй түгээмэл байдаг [2]. Харин эрлийзүүд үү? Алтан. Киберпанк аниме самурай эсвэл стимпанк манга мөрдөгчийг .

Тулгууруудыг дагах хэрэгтэй:

  • "аниме түлхүүрийн дүрслэл, динамик поз, цэвэр шугаман, сел сүүдэр, илэрхийлэлтэй нүд, дэлгэрэнгүй дэвсгэр"

  • “манга самбар, дэлгэцийн өнгөний сүүдэр, голланд өнцөг, бэхний тодотгол”

Өөртөө тэмдэглэл: Хэрэв гаралтууд бүдэг харагдаж байвал "цэвэр шугаман, хавтгай сүүдэр" эсвэл өнгийг "хязгаарлагдмал палитр"-аар хязгаарлаарай.


Киберпанк ба футуристик хэв маяг⚡

Неон тэмдэг, хром тусгал, бороотой шөнө - загвар үүнийг бүрэн дүүрэн ашигладаг. Диффузи нь өндөр тодосгогчтой гэрэлтүүлэг + тусгал материалыг гайхалтай зохицуулдаг. "Неон гэрэлтэй гудамж, эзэлхүүнтэй манан, шалбааг тусгал" ихэвчлэн зурагт хуудас шиг харагддаг.

Засах зөвлөгөө: Лав шиг царайнууд уу? Тушаалын мөрөнд "гадаргуугийн доорхи тархалт, хальсан тэгшлэлт"-ийг


Импрессионизм ба зураачийн бүтэц 🎨

Энд нарийн ширийн зүйл чухал биш. Импрессионизм нь зөөлөн ирмэг, эвдэрсэн өнгө, гэрлийн тоглолт дээр цэцэглэн хөгждөг. Үзэгдэхүйц бийрний цохилт, пленэр гэрэлтүүлэг, алтан цаг гэх мэт өдөөлтүүд сайн ажилладаг. Загвар нь хэт их дүрслэлгүйгээр нарийн ширийн зүйлийг санал болгодог бөгөөд энэ нь инээдтэй ч гэсэн жинхэнэ бөгөөд тооцооллын хувьд хялбар юм [4].


Минимализм, Пиксел Арт болон Ретро 🕹️

Хязгаарлалтууд нь хялбаршуулдаг. Бага поли нь геометрийн тод байдалд тулгуурладаг; пикселийн графикийг нягтрал + палитраар түгждэг.

Хэрэгтэй зааварчилгааны хүрээнүүд:

  • "Бага поли диорама, хатуу ирмэг, хавтгай сүүдэр, орчны бөглөрөл"

  • “Пикселийн урлаг, 32×32 спрайт, NES хэв маяг, хязгаарлагдмал дитеринг”

Хажуугийн тэмдэглэл: Хэрэв пикселийн график хэтэрхий гөлгөр харагдаж байвал аналог өнгөний хувьд "CRT скан шугам, бүдгэрсэн сүүдэр"


Холимог хосолсон тоглоомууд: Хиймэл оюун ухаан гэрэлтдэг газар ✨

Зэрлэг карт: хөндлөн тоосжилт. Диффузи нь ихэнх уран бүтээлчдийн хүрч чадахгүй нөлөөллийг нэгтгэх боломжийг олгодог - Ван Гогийн киберпанк , аниме нуар кубизм , Сэргэн мандалтын үеийн меха сахиусан тэнгэр. Энэ нь мэдрэлийн хэв маягийн дамжуулалт 2.0-той адил боловч илүү хяналттай [1][4].

Жорын формат:
[Гарчиг] + [Эрин/Хөдөлгөөн] + [Гэрэлтүүлэг] + [Дотоод/Материал] + [Найрлага] + [Палетт/Сэтгэл санаа]

Жишээ нь: “дээвэр дээрх хийлч - импрессионист тосон зураг - алтан цагийн арын гэрэлтүүлэг - төвөөс гадуур - дурсамжийн палитр.”


Үр дүнг үнэхээр өөрчилдөг шуурхай загварууд 🛠️

Давтан туршилтын үр дүнгээс:

  1. Дунд зэргийн + Хэв маягийн хослол нь ирмэг/бүтцийг тодруулдаг: тосон сюрреализм, дижитал манга [5].

  2. "Lighting First" нь үг овоолж бичихээс илүү реализмыг өөрчилдөг.

  3. Камерын хэл (өнцөг, линзний урт) нь шууд урьдчилан таамаглах боломжийг олгодог.

  4. Хязгаарлалтууд нь чухал бөгөөд минимализм эсвэл пикселийн урлагийн хувьд нягтрал/палитрыг илт шаарддаг.

  5. Жижиг засварууд > Том дахин бичвэрүүд . “Неон” → “натрийн уур”-ыг солих нь бүрэн шинэчлэлээс илүү үр дүнтэй байдаг [5].


Бодит байдлыг хурдан шалгах 🔍

  • Нэг талыг барьсан байдал - Онлайнаар түгээмэл хэрэглэгддэг хэв маяг (аниме, фотореализм) нь үр дүнг давамгайлдаг; ховор хэв маягийг лавлагаа эсвэл нарийн тохируулга шаарддаг [2].

  • Яагаад Сюрреал үр дүнтэй вэ - Диффузийн сул байдал нь анатомийн алдааг нуудаг - хачин зүйлсийг санаатай мэт харагдуулдаг [1].

  • Prompt Drift - Хэрэв бүх гаралт ижил харагдаж байвал сэдвийг дахин нягтлахаасаа өмнө өөрчлөгчдийг тохируулна уу [5].

  • Эрх/Ёс зүй - Өгөгдлийн санг өргөн хүрээнд авч үздэг; гаралтыг хариуцлагатайгаар, ялангуяа арилжааны зорилгоор ашигладаг [2].


Жижиг хайрцагны тэмдэглэл (миний хамгаалагдсан хязгаарлагдмал орчиноос) 🧪

  • Киберпанк хөрөг зураг - “хөрөг, нил ягаан-нил ягаан неон, бороотой гудамж, хүрээтэй гэрэл, 85мм, кинематографийн боке”
    Үр дүнтэй байсан учир нь: линз + гэрэлтүүлэг нь хадаастай объект/ар талын тусгаарлалт.

  • Импрессионист ландшафт - “алтан цагтай голын эрэг, импрессионист тосон зураг, харагдахуйц бийрний зураас”.
    Үр дүнтэй байсан шалтгаан: дунд зэргийн бүтэцтэй, гэрэлтүүлэг нь дулааныг зохицуулсан.

  • Пиксел-Урлагийн Бүтээл - “32×32 пикселийн луу, хязгаарлагдмал дитеринг, 1 пикселийн тойм, изометр”
    Ажилласан шалтгаан: хязгаарлалтууд тэгшлэхээ больсон.


Түргэн лавлах заавар (Хуулбарлах/Буулгах)

  • Реализм (Бүтээгдэхүүн): “студийн бүтээгдэхүүний зураг, софтбокс гэрэлтүүлэг, 50 мм-ийн линз, гялгар керамик, цэвэрхэн шүүрдэлт”

  • Аниме экшн: “аниме түлхүүрийн дүрслэл, богиносгосон динамик поз, селлер, хурдны шугам”

  • Сюрреал Коллаж: “мөрөөдлийн ертөнц, боломжгүй геометр, хөвөгч шат, зөөлөн манан, алтан цагийн гэрлийн үр тариа”

  • Бага полиэтилентэй үзэгдэл: “изометрийн бага полиэтилентэй хотхон, хавтгай сүүдэр, орчны бөглөрөл, пастел палитр”

  • Импрессионист хөрөг зураг: “зотон дээрх тосон будаг, сул бийрний зураг, хүрээний гэрэл, импастогийн тодруулга”


Дүгнэлт 🖼️

"Хиймэл оюун ухаанд зориулсан урлагийн хэв маяг" бол дүрмийн цуглуулга биш, харин тоглоомын талбай юм. Итгэлцэл чухал үед реализм үр дүнтэй; бодит байдлыг эвдэхийг хүсэх үед сюрреализм; хэв маягийг хослуулах зайтай тодорхой байдал хэрэгтэй үед аниме/манга. Ялалтын стратеги бол бүтэцтэй тоглоом юм: хэв маягийг сонгоод, гэрэлтүүлэг + дунд зэргийн сонголтыг хийж, хэдэн тохируулагч нэмээд дараа нь давтах явдал юм. Хэрэв энэ нь танд ямар нэгэн мэдрэмж төрүүлбэл - тэр ч байтугай хачин төгс бус байсан ч гэсэн - та бүсэд байна.


Лавлагаа

[1] Ромбах, Р. нар. (2022). Латент Диффузийн Загваруудтай Өндөр Нарийвчлалтай Зургийн Синтез (CVPR). PDF
[2] Шухманн, К. нар. (2022). LAION-5B: Дараагийн үеийн зураг-текст загваруудыг сургахад зориулсан нээлттэй том хэмжээний өгөгдлийн багц. PDF
[3] Радфорд, А. нар. (2021). Байгалийн Хэлний Хяналтаас Шилжүүлэх боломжтой Дүрслэх Загваруудыг Сурах (CLIP). PDF
[4] Гатис, Л. нар. (2016). Хуйвалдаан Мэдрэлийн Сүлжээг ашиглан Зургийн Хэв маягийг Дамжуулах (CVPR). PDF
[5] Оппенлаендер, Ж. (2024). Текстээс дүрс үүсгэхэд зориулсан шуурхай хувиргагчдын ангилал зүй. Зан төлөв ба Мэдээллийн Технологи. Нийтлэл


Албан ёсны хиймэл оюун ухааны туслах дэлгүүрээс хамгийн сүүлийн үеийн хиймэл оюун ухааныг олоорой

Бидний тухай

Блог руу буцах