[ AI Update ][ AI Tạo Ảnh ][ DALL-E 3 kill Midjourney và Stable Diffusion ? ]

[ AI Update ][ AI Tạo Ảnh ][ DALL-E 3 kill Midjourney và Stable Diffusion ? ]
OpenAI công bố AI Tạo Ảnh mới DALL-E 3 , kết hợp AI Ngôn Ngữ và AI Tạo Ảnh nhằm tiêu diệt khái niệm “Viết Prompt tạo Ảnh”
Có lẽ ít người biết là trước AI Ngôn Ngữ thì OpenAI cũng là kẻ đầu têu việc leak ra công chúng AI tạo ảnh (DALL-E 2) đồng thời công bố thuật toán CLIP & GLIDE hiện thực hóa việc Viết Chữ Tạo Tranh trong AI.
Thuật toán này đã và hiện đang giúp tạo nên các con AI vẽ ảnh đình đám là Midjourney và Stable Diffusion.
Đồng thời OpenAI cũng tạo ra khái niệm “Prompt Engineering” – Nghệ Thuật Ra Lệnh cho AI – để chỉ việc con người viết một đoạn văn mô tả thứ con người muốn theo cách mà AI sẽ hiểu :)))
Vì AI thời kì trước 12.2022 rất ngu về ngôn ngữ, thứ ngôn ngữ tự nhiên mà chúng nó hiểu không giống với ngôn ngữ tự nhiên của con người, giống với một bộ các từ khóa kết hợp với nhau hơn
vd: closeup, beautiful woman, dreaming of drosera –s 750 là câu prompt yêu cầu Midjourney vẽ hình ra một cô gái đang mơ màng :))) (hình dưới còm)
Dĩ nhiên các con AI sao chép Dall-E như Midjourney và Stable Diffusion cũng đi theo hướng viết Prompt kiểu vậy vì chúng dựa trên bộ từ khóa từ thuật toán CLIP do OpenAI công bố công khai.
Việc tạo ảnh từ các con AI này kiến mọi người mê hoặc vì chúng tạo ra ảnh rất đẹp, siêu thực, hiện thực hóa ý tưởng trong đầu con người mà không cần kỹ năng vẽ (vốn là một thứ thuộc phạm trù thiên phú chứ không học được). Tuy nhiên việc viết Prompt thực sự là một ác mộng vì việc phải tìm ra và nhớ các cụm từ khóa thích hợp để AI hiểu đúng mà tạo ảnh.
Nỗi đau này dễ dàng được giải quyết bằng … ChatGPT
Tới tháng 9.2023, OpenAI vừa công bố con AI Tạo Ảnh Dall-E thế hệ 3, được tạo ra từ sự kết hợp với con AI Ngôn Ngữ Lớn ChatGPT 😃
Từ nay AI Tạo Ảnh sẽ tạo ra Ảnh bằng việc hiểu câu nói mà người vẽ ảnh muốn, thay vì phải viết một loạt từ khóa khó nhớ thì chỉ việc chat với ChatGPT mô tả bức ảnh người dùng đang tưởng tượng trong đầu bằng Ngôn Ngữ Tự Nhiên mà không cần nhớ các Từ Khóa chính xác, ChatGPT sẽ diễn dịch ý muốn đó từ Ngôn Ngữ Tự Nhiên thành Prompt thích hợp cho AI Tạo Ảnh DALL E 3 thực hiện vẽ.
vd: Hình ảnh 3D của một cốc cà phê đặt trên bậu cửa sổ trong một ngày giông bão.
Đây là câu mô tả bức ảnh cho DALL-E 3 vẽ, nó tự nhiên hơn nhiều (ảnh dưới còm)
Một cách giải quyết dễ dàng nhưng mà khiến các con AI tạo ảnh còn lại trên thị trường sẽ phải chật vật trong việc tìm cách kết hợp với các con AI LLM nguồn mở để đạt được điều này. Nói trước luôn là rất khó để chạy AI Tạo Ảnh + AI Ngôn Ngữ trên máy tính cá nhân, vì AI Ngôn Ngữ để đạt mức độ kết hợp như DALL-E 3 trình diễn thì nó không thể bé mà phải to tới rất to :)))))
DALL-E 3 sẽ được dùng rộng rãi trong account ChatGPT Plus từ tháng 10 😃

Tác Giả Hong Phuc Nguyen

[ AI Update ][ AI Tạo Ảnh ][ DALL-E 3 kill Midjourney và Stable Diffusion ? ] OpenAI công bố…