AI Art คืออะไร? Art Generators ทำงานอย่างไร (2023)
เผยแพร่แล้ว: 2023-07-26หากคุณให้ความสนใจกับเทรนด์เทคโนโลยีในช่วง 2-3 ปีที่ผ่านมา คุณสังเกตเห็นว่าโปรแกรมปัญญาประดิษฐ์ (AI) มีจำนวนเพิ่มขึ้น หนึ่งในรูปแบบใหม่ที่ร้อนแรงที่สุดคือศิลปะ AI ในโพสต์นี้ เราจะแจกแจงว่า AI Art คืออะไร ทำงานอย่างไร และคุณจะใช้มันอย่างไรเพื่อเพิ่มความคิดสร้างสรรค์และเร่งขั้นตอนการทำงานของคุณ
มาดำน้ำกันเถอะ
- 1 AI คืออะไร
- 2 ศิลปะ AI คืออะไร
- 2.1 ประวัติศิลปะ AI
- 2.2 GAN คืออะไร?
- 3 AI Art Generators ทำงานอย่างไร
- 3.1 วิธีสร้างเอาต์พุต
- 3.2 การแพร่กระจายคืออะไร?
- โปรแกรมศิลปะ AI 4 ประเภท
- 4.1 อวตาร AI
- 4.2 วิดีโอ AI
- 4.3 เครื่องกำเนิดศิลปะ AI
- 4.4 กรณีการใช้งาน AI อื่นๆ
- 5 การใช้ AI Art อย่างมีจริยธรรม
- 6 ความคิดสุดท้ายเกี่ยวกับศิลปะ AI
เอไอคืออะไร?
ปัญญาประดิษฐ์หรือ AI หมายถึงการพัฒนาและปรับใช้ระบบคอมพิวเตอร์และอัลกอริทึมที่สามารถทำงานที่มนุษย์จะทำได้ตามปกติ คอมพิวเตอร์เหล่านี้ได้รับการฝึกฝนเกี่ยวกับข้อมูลจำนวนมากที่ช่วยให้พวกเขาเรียนรู้ ให้เหตุผล แก้ปัญหา และทำการตัดสินใจที่เกินความสามารถของมนุษย์ AI เกี่ยวข้องกับเทคโนโลยีต่างๆ เช่น การเรียนรู้ของเครื่อง การประมวลผลภาษาธรรมชาติ การสร้างภาพ เป็นต้น พวกมันสามารถปรับ เรียนรู้ และทำให้งานเป็นอัตโนมัติผ่านการวิเคราะห์ข้อมูล การจดจำรูปแบบ และกระบวนการเรียนรู้ซ้ำๆ ทำให้มนุษย์สามารถส่งต่องานไปยังคอมพิวเตอร์ได้ AI มีแนวโน้มที่จะนำไปสู่ความก้าวหน้าในหลายๆ ด้าน รวมถึงการดูแลสุขภาพ การเงิน การขนส่ง และด้านสร้างสรรค์ เช่น เว็บและการออกแบบกราฟิก
AI Art คืออะไร
AI art หรือ generative AI หมายถึงการสร้างงานศิลปะโดยใช้ปัญญาประดิษฐ์เพื่อสร้างภาพอัตโนมัติ ช่วยในการเขียนเชิงสร้างสรรค์ สร้างเพลง สร้างเว็บไซต์ และอื่นๆ ศิลปะ AI แตกต่างจากศิลปะดิจิทัลที่ผู้มีทักษะสร้างสรรค์สร้างขึ้น แต่ศิลปะ AI ช่วยให้ผู้ที่มีความสามารถในการสร้างสรรค์น้อยหรือไม่มีเลยสามารถสร้างรูปแบบศิลปะได้ไม่จำกัดด้วยข้อความแจ้ง
สมัครสมาชิกช่อง Youtube ของเรา
ประวัติศิลปะ AI
ประวัติของศิลปะ AI สามารถย้อนไปถึงปี 1973 เมื่อนักวิทยาศาสตร์คอมพิวเตอร์และศิลปินชื่อ Harold Cohen ได้สร้างโปรแกรมสร้างงานศิลปะ AI ที่รู้จักกันเป็นครั้งแรก นั่นคือ AARON 41 ปีต่อมา ในปี 2014 เครือข่ายต่อต้านเชิงกำเนิด (GANs) ได้รับการพัฒนาขึ้น แม้ว่า GAN จะไม่ได้พัฒนาขึ้นเพื่อสร้างสรรค์ผลงานศิลปะ เพียงอย่างเดียว แต่ GAN ก็มีบทบาทอย่างมากในการสร้างสรรค์ผลงานในปัจจุบัน
ในปี 2558 นักวิจัยเริ่มฝึกคอมพิวเตอร์ให้ใช้ข้อความแจ้งเพื่อสร้างภาพ พวกเขาทำสิ่งนี้ได้โดยการย้อนกลับกระบวนการของรูปภาพเป็นข้อความ ซึ่งคุณอาจคุ้นเคย คุณเคยสังเกตไหมว่า iPhone ของคุณสามารถระบุวัตถุในรูปภาพของคุณ แล้วจัดหมวดหมู่ได้อย่างไร นั่นเป็นตัวอย่างที่ดีของการแปลงรูปภาพเป็นข้อความ
ก้าวไปข้างหน้าสู่ปี 2021 เมื่อ DALL-E ซอฟต์แวร์แปลงข้อความเป็นรูปภาพหลักตัวแรกเปิดตัว สร้างโดย Open AI (ผู้สร้าง ChatGPT) และตั้งชื่อตามจิตรกร Salvador Dali และ WALL-E ของ Pixar โปรแกรมนี้เป็นโปรแกรมแรกที่ได้รับการฝึกอบรมเกี่ยวกับภาพและแนวคิดนับล้าน ด้วยการเปิดตัว DALL-E กระแส AI text-to-image ก็ถือกำเนิดขึ้น
ในปี 2022 ชุมชนของนักพัฒนาโอเพนซอร์ซเริ่มสร้างเครื่องกำเนิดงานศิลปะ AI โดยคว้าเอาเทคโนโลยีอะไรก็ได้ที่พวกเขาสามารถทำได้ นักพัฒนาบางคนได้พัฒนา Midjourey ต่อไป ซึ่งเราจะนำเสนอในภายหลังในโพสต์นี้
GAN คืออะไร?
GAN ประกอบด้วยสองส่วนหลัก: เครื่องกำเนิดและเครื่องจำแนก หน้าที่ของตัวสร้างคือการสร้างข้อมูลใหม่ เช่น รูปภาพ เพลง หรือข้อความ ในขณะที่บทบาทของผู้แยกแยะคือการพิจารณาว่าข้อมูลที่สร้างขึ้นนั้นเป็นของจริงหรือของปลอม ตัวสร้างจะสร้างข้อมูลแบบสุ่ม เช่น รูปภาพ จากนั้นจึงนำเสนอภาพให้ผู้จำแนกซึ่งพยายามเดาว่าเป็นภาพจริงหรือภาพปลอม ในขั้นต้น ตัวกำเนิดยังไม่ค่อยดีนัก ดังนั้นผู้แยกแยะจึงสามารถมองเห็นของปลอมได้ง่าย อย่างไรก็ตาม ทั้งสองส่วนเรียนรู้จากความผิดพลาดและจะดีขึ้นเมื่อเวลาผ่านไป
เครื่องกำเนิดพยายามแปลงเอาต์พุตให้หลากหลาย และผู้แยกแยะจะเชี่ยวชาญมากขึ้นในการแยกแยะของจริงจากของปลอม พวกเขายังคงเล่นเกมนี้เพื่อพยายามชิงไหวชิงพริบซึ่งกันและกัน ในที่สุดตัวสร้างก็ทำงานได้ดีจนสร้างข้อมูลที่ผู้เลือกปฏิบัติไม่สามารถแยกแยะได้ว่าเป็นของปลอม
AI Art Generators ทำงานอย่างไร
เพื่อให้โปรแกรม AI เข้าใจคำสั่งที่หลากหลายได้นั้น จำเป็นต้องมีชุดข้อมูลขนาดใหญ่ของรูปภาพ (โครงข่ายประสาทเทียม) เพื่อใช้งาน เรากำลังพูดถึงภาพหลายร้อยล้านภาพและคำอธิบายข้อความ โมเดลการฝึกจะขูดแท็ก alt คำอธิบายภาพ ชื่อเรื่อง และคำอธิบายข้อความจากรูปภาพบนอินเทอร์เน็ต โปรดทราบว่ารูปภาพที่สร้างขึ้นไม่ได้มาจากข้อมูลการฝึกอบรม แต่มาจากพื้นที่แฝง (เพิ่มเติมในภายหลัง) ของโมเดลการเรียนรู้เชิงลึก โมเดลการเรียนรู้เชิงลึกไม่เห็นภาพในแบบที่เราทำ พวกเขาเห็นค่าพิกเซลหลายล้านพิกเซลสำหรับสีแดง เขียว และน้ำเงิน (RGB)
เมื่อโปรแกรมกำหนดวิธีถอดรหัสพรอมต์แล้ว คุณจะเห็นผลลัพธ์ดังนี้:
Generative AI ใช้การเรียนรู้ของเครื่องเชิงลึกเพื่อสร้างข้อความจากรูปภาพ ในตอนแรก คอมพิวเตอร์จะเดาว่าข้อความแจ้งของคุณกำลังมองหาอะไร จากนั้นให้เรียกใช้ซ้ำๆ จนกว่าจะได้รับข้อความที่ถูกต้อง โปรแกรมได้รับตัวแปรให้พิจารณาเพื่อค้นหาเมตริกที่ตรงกับข้อความแจ้งเพื่อสร้างรูปภาพ ตัวอย่างเช่น ใช้คำพังเพย ในสวนสีชมพู AI จะเริ่มประมวลผลข้อมูลโดยพิจารณาจากตัวแปรต่างๆ เช่น ตัวอย่างของโนมส์ รูปร่าง ภาพสีชมพู สวน และตัวแปรอื่นๆ มันเดาได้ดีที่สุดว่ามัน คิดว่า คำพังเพยในสวนสีชมพูคืออะไร
วิธีสร้างเอาต์พุต
เมื่ออัลกอริทึมผ่านข้อมูลการฝึกอบรม พวกเขาค้นหาตัวแปรเพื่อปรับปรุงผลลัพธ์ของพวกเขา และในระหว่างกระบวนการนั้น จะสร้างพื้นที่หลายมิติที่มีจุดข้อมูลเหล่านี้ทั้งหมด ลองใช้คำพังเพย สวนสีชมพู และใช้เป็นตัวอย่าง ภายในพื้นที่นั้น AI จะวางคำพังเพยในมิติหนึ่ง สีชมพูในอีกมิติหนึ่ง และมิติสำหรับสวน จะประเมินมิติข้อมูลทั้งหมดและประหยัดพื้นที่ระหว่างมิติข้อมูลหลายร้อยรายการสำหรับเอาต์พุต สิ่งนี้เรียกว่าพื้นที่แฝง ยิ่งคำอธิบายภายในพรอมต์มากเท่าใด ก็ยิ่งต้องมีมิติมากขึ้นเท่านั้น
ก่อนที่ผลลัพธ์จะเสร็จสมบูรณ์ มีขั้นตอนการสร้างที่เรียกว่าการแพร่กระจาย การใช้คำในข้อความแจ้งและขนาดที่มีรูปภาพสีชมพู สวน และคำพังเพย AI จะสร้างภาพแบบสุ่มแล้วทำการปรับปรุงเล็กน้อย การปรับแต่งแต่ละครั้งทำให้ภาพที่ส่งออกมีความละเอียดมากขึ้นและใกล้เคียงกับผลลัพธ์ที่ต้องการ
การแพร่กระจายคืออะไร?
ใช้ตัวอย่างคำพังเพยในสวน จินตนาการภาพนับล้านของโนมส์ สวน และรูปภาพที่มีสีชมพู ในระหว่างกระบวนการ จุดข้อมูลทั้งหมดจะถูกวิเคราะห์ จากนั้นจึงสร้างภาพคำพังเพย การแพร่กระจายเริ่มต้นด้วยการเพิ่มชุดการเปลี่ยนแปลงให้กับภาพ ค่อยๆ เพิ่มสัญญาณรบกวน ซึ่งรวมถึงการเปลี่ยนภาพถ่ายให้เป็นคำพังเพยสีชมพูหรือวางไว้ในสวน ในระหว่างขั้นตอนการเปลี่ยนแปลงหลายๆ ขั้นตอน ภาพจะแตกต่างไปจากเดิมมากขึ้น ทำให้เกิดภาพที่มีเอกลักษณ์เฉพาะตัวของการ์เดนการ์เดนสีชมพู
ประเภทของโปรแกรมศิลปะ AI
ศิลปะ AI เจเนอเรชันครอบคลุมมากกว่าแค่รูปภาพ ซึ่งรวมถึงรูปแบบศิลปะ เช่น อวตาร วิดีโอ โลโก้ และโปรแกรมแก้ไขรูปภาพ มาสำรวจศิลปะ AI แต่ละรูปแบบเหล่านี้กัน เพื่อที่คุณจะได้เข้าใจมากขึ้นว่าอะไรเป็นไปได้ด้วย AI เชิงกำเนิด
อวตาร AI
เครื่องมือสร้างอวาตาร์ AI สร้างอวาตาร์ที่ไม่ซ้ำใครสำหรับโซเชียลมีเดีย เกม สตรีมมิงแบบสด และอื่นๆ บางคนใช้ข้อความเป็นรูปภาพในขณะที่คนอื่น ๆ เช่น Lensa AI ให้คุณถ่ายเซลฟี่และเปลี่ยนให้เป็นอวตาร พวกเขาสามารถเป็นแชทบอทหรือผู้ช่วยเสมือนที่สามารถเข้าใจสิ่งที่เราพูดหรือพิมพ์และตอบสนองในทางที่เป็นประโยชน์ พวกเขาสามารถออกแบบให้ดูและแสดงเหมือนคนจริงๆ ด้วยอารมณ์และการแสดงออกเช่น Synthesia คนอื่นสร้างอวตาร 3 มิติเพื่อใช้เป็นรูปโปรไฟล์หรืออวตารของเกมเมอร์ ตัวอย่างเช่น Picsart ให้คุณอัปโหลดภาพของคุณเองได้ 10-30 ภาพ จากนั้นสร้างอวาตาร์แบบกำหนดเองด้วยการคลิกเพียงปุ่มเดียว
วิดีโอ AI
ใครก็ตามที่เคยสร้างวิดีโอสำหรับงานนำเสนอหรือเว็บไซต์จะรู้ว่ากระบวนการนี้ใช้เวลานานเพียงใด นั่นคือสิ่งที่เครื่องสร้างวิดีโอ AI สามารถช่วยได้ ด้วยบริษัทอย่าง Pictory คุณสามารถสร้างวิดีโอการตลาดที่ยอดเยี่ยมได้ในเวลาไม่กี่นาที แทนที่จะใช้เวลาเป็นวันหรือสัปดาห์ หากคุณต้องการทำให้กระบวนการเป็นไปโดยอัตโนมัติทั้งหมด ให้เพิ่ม URL ลงใน Pictory และมันจะทำให้โพสต์ของคุณกลายเป็นวิดีโอที่ใช้งานได้และน่าสนใจในเวลาไม่กี่นาที
เครื่องกำเนิดศิลปะ AI
ดังที่ได้กล่าวไว้ก่อนหน้านี้ AI art generators หรือ text-to-image ช่วยให้คุณสามารถป้อนข้อความ เอนหลัง และดูภาพของคุณถูกสร้างขึ้นต่อหน้าต่อตา มีเครื่องมือสร้างข้อความเป็นรูปภาพให้เลือกมากมาย แต่มีเครื่องมือที่ได้รับความนิยมมากกว่าสองสามตัวที่โดดเด่น ซึ่งรวมถึง DALL-E 2, Midjourney, Leonardo และ Stable Diffusion
แต่ละคนมีจุดแข็ง แต่บางอย่างก็ดีกว่าอย่างอื่น เราจะใช้ข้อความแจ้งเดียวกันเพื่อแสดงความแตกต่างระหว่างแพลตฟอร์ม: ภาพถ่ายของรถแข่งแรลลี่ที่เต็มไปด้วยดิน เคลื่อนที่ด้วยความเร็วที่รวดเร็ว ฝุ่นปลิวว่อน ฉากภูเขา ภาพถ่ายที่ได้รับรางวัล เงาที่นุ่มนวล และการจัดแสงแบบภาพยนตร์
ดัล-อี
กลางการเดินทาง
เลโอนาร์โด เอ.ไอ
การแพร่กระจายที่เสถียร
AI Art การเปรียบเทียบแบบเคียงข้างกัน
สำหรับตัวอย่างนี้ เราป้อนพรอมต์เดียวกัน ปล่อยให้การตั้งค่าทั้งหมดเป็นค่าเริ่มต้น และไม่ได้ใช้การปรับปรุงอื่นใด DALL-E 2, Midjourney และ Leonardo AI เป็นเครื่องกำเนิดงานศิลปะ AI ที่ใช้
คำแนะนำ: ภาพถ่ายคุณภาพสูงของสุนัขนักบินอวกาศ ฉากหลังของดวงดาวและดาวเคราะห์ แสงในโรงภาพยนตร์ หมวกกันน็อคพร้อมกระจกปิดหน้า มุมกว้าง
เราจะให้คุณตัดสินเองว่างานใดทำได้ดีที่สุด
กรณีการใช้งาน AI อื่นๆ
นอกเหนือจากวิดีโอและรูปภาพแล้ว กรณีการใช้งาน AI อื่นๆ สามารถช่วยเพิ่มความคิดสร้างสรรค์และประสิทธิภาพการทำงานของคุณ ช่วยให้คุณประหยัดเวลาในการทำสิ่งอื่นๆ ได้
โลโก้ AI
เครื่องมือสร้างโลโก้ AI สามารถทำงานได้หากคุณเป็นเจ้าของธุรกิจขนาดเล็กหรือครีเอทีฟที่ต้องการแรงบันดาลใจ มีตัวเลือกมากมาย โดยที่โดดเด่นบางอย่างคือ Wix Logo Generator ซึ่งทำงานภายในเครื่องมือสร้างเว็บไซต์ Wix ระบบจะสร้างโลโก้ทั้งหมดให้คุณ หรือคุณสามารถเริ่มกระบวนการด้วย AI และแก้ไขให้เสร็จสิ้นด้วยตัวคุณเอง คุณอาจถาม ว่าทำไมฉันถึงต้องมีเครื่องมือสร้างโลโก้ AI ถ้าฉันใช้เครื่องกำเนิดงานศิลปะ AI คำตอบคือมันตั้งอยู่ตรงกลางของบัสการต่อสู้เกี่ยวกับการสร้างข้อความ มันไม่สามารถทำให้อ่านได้ ดังนั้น หากคุณต้องการโลโก้ใหม่สำหรับตัวคุณเองหรือลูกค้า ลองดูหนึ่งในโปรแกรมในรายการของเรา
เครื่องกำเนิดเพลง AI
ความเคลื่อนไหวครั้งใหญ่อีกครั้งสำหรับ AI มาในรูปแบบของเครื่องกำเนิดเพลง AI ผู้สร้างเนื้อหาที่มองหาวิธีที่ง่ายและรวดเร็วกว่าในการสร้างเพลงประกอบสำหรับโปรเจ็กต์ของตนจะได้รับประโยชน์ (ตามตัวอักษร) ด้วยการรวมหนึ่งในเครื่องมือเหล่านี้ ตัวอย่างเช่น Mubert เป็นโมเดล AI เชิงกำเนิดที่ให้คุณสร้างเพลง และ สร้างรายได้ คุณสามารถสร้างแทร็กด้วยข้อความ จากนั้นแสดงรายการบน Mubert Studio marketplace
การแก้ไขภาพ AI
กรณีการใช้งานศิลปะ AI ถัดไปนี้ช่วยให้คุณสามารถปรับปรุง แก้ไข หรือจัดการรูปภาพได้ ซึ่งอาจรวมถึงการปรับปรุงภาพถ่ายด้วย AI, การเพิ่มสเกลรูปภาพ หรือส่วนเสริมข้อความเป็นรูปภาพแบบสร้าง เช่น การเติมแบบทั่วไปใน Photoshop
การใช้การเติมข้อความเป็นรูปภาพของ Photoshop AI คุณสามารถเพิ่มหรือลบองค์ประกอบออกจากภาพถ่าย ขยายผืนผ้าใบ หรือสร้างภาพที่ประกอบขึ้นทั้งหมดโดยไม่มีอะไรนอกจากข้อความแจ้ง
ผู้สร้างเว็บไซต์ AI
ผู้ที่ต้องการเว็บไซต์ใหม่ที่ไม่มีเวลาหรือความเชี่ยวชาญในการสร้างเว็บไซต์ด้วยตนเองจะได้รับประโยชน์จากเครื่องมือสร้างเว็บไซต์ AI เครื่องมือต่าง ๆ สามารถช่วยคุณด้วยข้อความสองสามบรรทัดหรือสร้างรูปภาพ หากคุณต้องการให้ทั้งเว็บไซต์สร้างจากข้อความแจ้ง โมเดล AI เช่น Framer AI สามารถจัดการงานนั้นได้
การใช้ AI Art อย่างมีจริยธรรม
เมื่อสร้างงานศิลปะด้วยปัญญาประดิษฐ์ ต้องคำนึงถึงจริยธรรมบางประการ มีการนำเสนอคำถามทางกฎหมายเกี่ยวกับการละเมิดลิขสิทธิ์ ไม่มีแบบอย่างจึงไม่มีคำตอบชัดเจนว่าจะดำเนินการอย่างไร บางแพลตฟอร์ม เช่น Adobe Firefly ได้นำสิ่งนี้มาพิจารณาด้วย นางแบบของพวกเขาได้รับการฝึกฝนเกี่ยวกับภาพที่ปลอดค่าลิขสิทธิ์ ซึ่งควรป้องกันพวกเขาไม่ให้ถูกกฎหมาย นอกจากนี้ ภาพใด ๆ ที่สร้างผ่าน Firefly นั้นมีวัตถุประสงค์เพื่อความบันเทิงเท่านั้น อย่างไรก็ตาม เราคาดว่าจะมีการเปลี่ยนแปลงในเร็วๆ นี้
ก่อนเริ่มใช้แพลตฟอร์ม ให้ศึกษาว่าโมเดลได้รับการฝึกอบรมอย่างไรและรวบรวมข้อมูลให้ได้มากที่สุด หากคุณวางแผนที่จะใช้งานศิลปะที่คุณสร้างขึ้นในเชิงพาณิชย์ ตรวจสอบให้แน่ใจว่าแพลตฟอร์มที่คุณเลือกรองรับสิ่งนั้น แพลตฟอร์มส่วนใหญ่อนุญาตให้ใช้รูปภาพในเชิงพาณิชย์ได้ตราบเท่าที่คุณสมัครแผนชำระเงิน แต่ควรตรวจสอบอีกครั้งเสมอ
ความคิดสุดท้ายเกี่ยวกับศิลปะ AI
ศิลปะ AI มีศักยภาพที่เหลือเชื่อ พร้อมที่จะพลิกโฉมอุตสาหกรรมการสร้างสรรค์ด้วยเทคโนโลยีใหม่ที่เป็นนวัตกรรมซึ่งช่วยสร้างสรรค์ในการสร้างงานศิลปะที่สร้างแรงบันดาลใจและผลักดันขอบเขตของจินตนาการของมนุษย์ มีเครื่องมือที่น่าทึ่งเช่น Synthesia สำหรับสร้างอวตาร AI แบบโต้ตอบแบบกำหนดเองไปจนถึงรูปภาพที่น่าทึ่งผ่าน Midjourney เพื่อสำรวจและใช้งาน ตราบเท่าที่ AI ถูกใช้อย่างมีจริยธรรมและมีความรับผิดชอบ มันก็เป็นเพื่อนที่สร้างสรรค์ที่ยอดเยี่ยมในการเพิ่มผลผลิต
อยากเรียนรู้เพิ่มเติมเกี่ยวกับ AI ไหม ดูบทช่วยสอนโดยละเอียดของเราเกี่ยวกับวิธีสร้างงานศิลปะ AI
ภาพเด่นโดย Leonardo AI / Leonardo.ai