DALL-E3

DALL-E trong ChatGPT
DALL-E là một dịch vụ tạo ra hình ảnh từ mô tả văn bản.
Một bước tiến vượt bậc cho DALL-E 3
1
이전 버전
Các phiên bản trước đây có xu hướng bỏ qua mô tả văn bản.
2
DALL-E 3
Tạo ra các hình ảnh chính xác khớp với  câu lệnh của người dùng.
3
Cải thiện chất lượng
Chất lượng hình ảnh đã được cải thiện đáng kể ngay cả với cùng một câu lệnh.
DALL·E 2 so với DALL·E 3
DALL·E 2 · Một bức tranh sơn dầu mang tính biểu cảm về một chiếc bánh quy chocolate chip đang được nhúng vào một ly sữa, được miêu tả như một sự nổ tung của các hương vị.
DALL·E 3 · Một bức tranh sơn dầu mang tính biểu cảm về một chiếc bánh quy chocolate chip đang được nhúng vào một ly sữa, được miêu tả như một sự nổ tung của các hương vị.
DALL-E trong ChatGPT
1
Tích hợp ChatGPT
DALL-E 3 được xây dựng dựa trên ChatGPT.
2
Cải thiện  câu lệnh
Bạn có thể sử dụng ChatGPT để cải thiện  câu lệnh của DALL-E.
3
Chỉnh sửa hình ảnh
Bạn có thể chỉnh sửa hình ảnh được tạo bởi ChatGPT chỉ với vài từ.
Sự an toàn và giới hạn
Giới hạn nội dung
Hạn chế tạo ra nội dung bạo lực, người lớn và có hại.
Ngăn chặn việc tạo ra hình ảnh thiên vị đối với các nhân vật công cộng.
Xác định nguồn gốc
Chúng tôi đang phát triển các công cụ để có thể xác định các hình ảnh được tạo ra bởi AI.
Giới hạn sáng tạo
Hạn chế việc tạo ra hình ảnh theo phong cách của các nghệ sĩ .
Khóa học thực hiện ý tưởng trực quan sáng tạo bằng Dall-E
Khóa học này nhằm mục đích trang bị cho bạn các kỹ năng tăng cường quá trình sáng tạo bằng cách sử dụng Dall-E. Nó bao gồm các nội dung từ các khái niệm cơ bản đến cách sử dụng cho từng dự án cụ thể.
Cách sử dụng Dall-E 3
1
Truy cập tài khoản
Bạn cần có tài khoản ChatGPT Plus trở lên để truy cập Dall-E 3.
2
Nhập  câu lệnh
Bắt đầu tạo ảnh bằng cách sử dụng từ khóa 'create' hoặc 'generate'.
3
Cải thiện  câu lệnh
ChatGPT sẽ tinh chỉnh câu lệnh cơ bản để tạo ra ảnh chính xác hơn.
4
Tạo lại
Trong cùng một cuộc hội thoại, bạn có thể chỉnh sửa chi tiết và tạo lại ảnh cho đến khi đạt được kết quả mong muốn.
Ví dụ sử dụng DALL-E
Dự án khoa học
Tạo ra hình ảnh thực tế về mây
Thiết kế trang web
Tạo ra hình ảnh ví dụ giao diện người dùng của trang web bán mũ bảo hiểm xe đạp
Logo doanh nghiệp
Tạo ra hình ảnh logo cửa hàng cà phê có chủ đề con thỏ
Hướng dẫn viết  câu lệnh Dall-E
Mẹo viết  câu lệnh
1
Mô tả chi tiết và rõ ràng
Bao gồm các chi tiết cụ thể như thiết lập, màu sắc, phong cách và bầu không khí.
2
Sử dụng ngôn ngữ sống động
Sử dụng mô tả sống động để tạo ra hình ảnh hấp dẫn và trực quan hơn.
3
Đề cập đến cách bố trí
Chỉ định cách bố trí cụ thể (ví dụ: cận cảnh, góc nhìn rộng).
4
Chỉ định phong cách nghệ thuật hoặc thời đại
Nếu liên quan, hãy đề cập đến phong cách nghệ thuật hoặc thời đại.
5
Đặt tỷ lệ hình ảnh
Hình vuông: 1024x1024 pixel
Ngang (phong cảnh): 1792x1024 pixel
Dọc (chân dung): 1024x1792 pixel
Hướng dẫn viết  câu lệnh
Mô tả chi tiết và rõ ràng: Hãy cung cấp càng nhiều chi tiết càng tốt.
Tuân thủ chính sách nội dung: Tránh tạo nội dung không phù hợp hoặc gây công kích.
Tôn trọng quyền sở hữu trí tuệ: Không sử dụng các nhân vật có bản quyền hoặc phong cách của nghệ sĩ đương đại.
Tránh mô tả chân thực các nhân vật công chúng: Không tạo ra hình ảnh thực tế của những người nổi tiếng đang sống.
Không bao gồm thông tin cá nhân: Không bao gồm thông tin cá nhân hoặc nhạy cảm.
Tạo ảnh bằng cách sử dụng ChatGPT và Dall-E
Trong bài giảng này, chúng ta sẽ tìm hiểu cách sử dụng ChatGPT để tạo  câu lệnh (prompt) cho Dall-E và tạo ra các bức ảnh. Lần này, chúng ta sẽ tận dụng tính năng Vision của ChatGPT để nhập ảnh và từ đó viết câu lệnh cho Dall-E.
Tổng quan về tính năng Vision
Tính năng Vision của OpenAI được sử dụng để hiểu và xử lý các loại ảnh khác nhau như ảnh chụp, ảnh chụp màn hình, tài liệu có chứa văn bản và ảnh. Nó hoạt động thông qua mô hình GPT-4o.
Ví dụ thực hành 1: Tái tạo ảnh cà phê
Tải ảnh lên:
Tải lên ảnh cà phê chụp ở Sofia.
 "Recreate this image using Dall-E."
 "Tạo lại ảnh này bằng cách sử dụng Dall-E."
Tạo ảnh:
ChatGPT sẽ nhận diện ảnh được tải lên và sử dụng Dall-E để tạo ra ảnh tương tự.
Ảnh được tạo ra sẽ rất giống với ảnh gốc, nhưng có thể có một số khác biệt.
Chỉnh sửa câu lệnh:
Nếu ảnh được tạo ra khác với ảnh gốc, bạn có thể cung cấp phản hồi cho ChatGPT và chỉnh sửa  câu lệnh để có kết quả chính xác hơn.
Ví dụ thực hành 2: Tái tạo ảnh đồ họa
Tìm ảnh đồ họa trên internet:
Tìm kiếm "cute dinosaur" trên internet và chọn một bức ảnh đồ họa ưng ý.
Chụp ảnh màn hình để lưu lại.
Tải ảnh lên:
Tải ảnh chụp màn hình lên ChatGPT và sử dụng  câu lệnh:
 "Recreate this image using Dall-E" 
 "Tạo lại ảnh này bằng cách sử dụng Dall-E"
để yêu cầu tạo ảnh.
Nếu ảnh được tạo ra không giống với phong cách gốc, hãy yêu cầu một  câu lệnh chi tiết hơn để duy trì phong cách.
Sử dụng  câu lệnh chi tiết:
"You must respect the drawing style as much as possible. Do not make it look better, nor change its artistic style."
"Bạn phải tôn trọng phong cách vẽ càng nhiều càng tốt. Đừng làm cho nó trông tốt hơn, cũng đừng thay đổi phong cách nghệ thuật của nó."
Sử dụng  câu lệnh như vậy để duy trì phong cách.
Kiểm tra xem ảnh được tạo ra có giống với phong cách gốc không.
Ví dụ nâng cao: Chuyển đổi sang phong cách Pixar
Sử dụng  câu lệnh cơ bản:
Viết  câu lệnh dựa trên ảnh gốc.
"Adapt this prompt to give me a Pixar animated-like character. I want the outcome to look like a CGI of the highest quality."

"Điều chỉnh  câu lệnh này để cho tôi một nhân vật giống như hoạt hình Pixar. Tôi muốn kết quả trông như một CGI chất lượng cao."
Sử dụng  câu lệnh như vậy để chuyển đổi sang phong cách Pixar.
Kiểm tra kết quả:
Kiểm tra ảnh do ChatGPT và Dall-E tạo ra với phong cách Pixar.
Nhận được kết quả ảnh với kết cấu, bóng và CGI chất lượng cao.
Tầm quan trọng của việc viết  câu lệnh và sự khác biệt với các công cụ tạo ảnh
Viết  câu lệnh ảnh khác với việc thiết lập các tham số trong các công cụ chỉnh sửa ảnh quen thuộc. Điện thoại di động của bạn cũng có các công cụ chỉnh sửa ảnh. Trong những công cụ này, bạn có thể điều chỉnh các thông số như ánh sáng, bóng, độ bão hòa, nhưng trong  câu lệnh, mỗi từ khóa đóng vai trò như một biến ảnh hưởng đến kết quả ảnh.
Hướng dẫn viết  câu lệnh
Trước tiên, bạn cần quyết định loại ảnh bạn muốn. Bạn có thể chọn ảnh chụp, phác thảo, tranh vẽ, v.v. Ví dụ, giả sử bạn muốn có một bức ảnh chụp.
Ví dụ câu lệnh:
photo of a room
ảnh chụp một căn phòng
Thứ hai, bạn cần chọn phong cách. Bạn có thể chọn phong cách tương lai, cổ điển, tối giản, v.v. Ở đây, chúng ta sẽ chọn phong cách tương lai.
Ví dụ  câu lệnh:
photo of a futuristic room
ảnh chụp một căn phòng tương lai
Thứ ba, bạn cần chọn chủ đề. Bạn có thể chọn phong cảnh, chân dung, thú cưng, phòng, v.v. Ở đây, chúng ta sẽ chọn phòng.
Bằng cách kết hợp ba biến cơ bản này, bạn có thể tạo ra  câu lệnh "ảnh chụp một căn phòng tương lai".
Bạn có thể thêm nhiều biến số khác để cụ thể hóa  câu lệnh. Ví dụ, bạn có thể thêm màu sắc. Hãy thêm "ghế sofa màu hồng và ghế đen" vào  câu lệnh. Điều này sẽ làm thay đổi phong cách của ảnh rất nhiều.
Ví dụ  câu lệnh:
photo of a futuristic room, a sofa in pink and chairs in black, a retriever on the floor
ảnh chụp một căn phòng tương lai, ghế sofa màu hồng và ghế đen, một con chó retriever trên sàn
Ngoài ra, bạn có thể thêm một con chó retriever vào phòng.  Câu lệnh sẽ trở thành "ảnh chụp một căn phòng tương lai, ghế sofa màu hồng và ghế đen, một con chó retriever trên sàn".
Bây giờ, bạn có thể thêm nền để phản ánh tương lai hơn. Ví dụ, thay đổi nền thành sao Hỏa. Câu lệnh sẽ trở thành "ảnh chụp một căn phòng tương lai, ghế sofa màu hồng và ghế đen, một con chó retriever trên sàn, phong cảnh và thuộc địa sao Hỏa nhìn qua cửa sổ".
Ví dụ  câu lệnh:
photo of a futuristic room, a sofa in pink and chairs in black, a retriever on the floor, Mars landscape and colony through the window
ảnh chụp một căn phòng tương lai, ghế sofa màu hồng và ghế đen, một con chó retriever trên sàn, phong cảnh và thuộc địa sao Hỏa nhìn qua cửa sổ
Bạn cũng có thể thay đổi ánh sáng và góc máy ảnh. Hãy cập nhật thành "ánh sáng ban ngày và góc máy thấp".  Câu lệnhsẽ trở thành "ảnh chụp một căn phòng tương lai, ghế sofa màu hồng và ghế đen, một con chó retriever trên sàn, phong cảnh và thuộc địa sao Hỏa nhìn qua cửa sổ, ánh sáng ban ngày, góc máy thấp".
Ví dụ  câu lệnh:
photo of a futuristic room, a sofa in pink and chairs in black, a retriever on the floor, Mars landscape and colony through the window, midday lighting, low angle
ảnh chụp một căn phòng tương lai, ghế sofa màu hồng và ghế đen, một con chó retriever trên sàn, phong cảnh và thuộc địa sao Hỏa nhìn qua cửa sổ, ánh sáng ban ngày, góc máy thấp
Cuối cùng, bạn có thể thêm ống kính mắt cá để cung cấp một góc nhìn độc đáo. Khi thêm ống kính mắt cá, câu lệnh sẽ trở thành "ảnh chụp bằng ống kính mắt cá của một căn phòng tương lai".
Ví dụ  câu lệnh:
Fisheye lens photo of a futuristic room, a sofa in pink and chairs in black, a retriever on the floor, Mars landscape and colony through the window, midday lighting, low angle
ảnh chụp bằng ống kính mắt cá của một căn phòng tương lai, ghế sofa màu hồng và ghế đen, một con chó retriever trên sàn, phong cảnh và thuộc địa sao Hỏa nhìn qua cửa sổ, ánh sáng ban ngày, góc máy thấp
Như vậy, việc viết câu lệnh quan trọng là mô tả rõ ràng và cụ thể về ảnh bạn muốn. Hiểu được mỗi từ khóa và mô tả sẽ ảnh hưởng như thế nào đến kết quả ảnh, và sử dụng chúng để đạt được kết quả mong muốn.
Hướng dẫn viết câu lệnh hiệu quả
Các đặc điểm được khuyến nghị
1. Rõ ràng và tập trung
Mô tả chi tiết các yếu tố để AI dễ hiểu
Sử dụng mô tả cụ thể và chi tiết để truyền đạt ý định
2. Ngữ pháp đơn giản
Sử dụng cấu trúc câu đơn giản
Loại bỏ sự phức tạp không cần thiết và tập trung vào điểm chính
3. Từ khóa mô tả
Sử dụng từ khóa để diễn tả các yếu tố trực quan
Chọn từ ngữ mô tả
4. Thông số kỹ thuật
Chỉ rõ các yếu tố kỹ thuật như chiếu sáng, góc máy ảnh
Truyền đạt chính xác bầu không khí và phong cách mong muốn
Các yếu tố cần tránh
1. Động từ không trực quan
Tránh các động từ trừu tượng như nghĩ, cảm thấy
Loại bỏ các hành động khó diễn tả trực quan
2. Từ chỉ định mơ hồ
Tránh sử dụng đại từ như họ, nó
Chỉ định đối tượng cụ thể bằng danh từ
3. Tính từ trừu tượng
Tránh sử dụng tính từ mơ hồ và mang tính chủ quan
Sử dụng tính từ cụ thể và có thể đo lường
4. Biểu hiện tiêu cực
Thay vì "không có", hãy sử dụng cách diễn đạt "có"
Ví dụ:
Không phù hợp: "Không có ô nhiễm trong thành phố"
Phù hợp: "Không khí trong lành và sạch sẽ trong thành phố"
Mẹo
Xác định rõ chủ đề để giảm thiểu sự nhầm lẫn
Sử dụng ví dụ cụ thể để làm rõ ý định
Tập trung vào các yếu tố có thể diễn tả trực quan
Hiệu quả cấu trúc câu lệnh
Cấu trúc ưu tiên chủ đề
Sử dụng ngữ pháp đơn giản và trực tiếp giải thích chủ đề.
"Đường phố đông đúc của thành phố với tòa nhà chọc trời làm nền, chiếc xe thể thao màu đỏ và người đi bộ."
Cấu trúc thiết lập cảnh
Bắt đầu bằng việc thiết lập rõ ràng và sử dụng dấu phẩy.
"Bãi biển yên bình vào lúc hoàng hôn, những con sóng nhẹ nhàng và những cây cọ đung đưa, một cặp đang đi dọc theo bãi biển."
Cấu trúc trung tâm hành động
Sử dụng câu chủ động để mô tả hành động.
"Một đầu bếp chuẩn bị sushi với nguyên liệu tươi sống trong một nhà bếp hiện đại, trong khi những vị khách ngồi trên ghế quầy quan sát."
Cấu trúc trung tâm không khí
Duy trì thời gian nhất quán và mô tả bầu không khí.
"Thư viện cổ, những kệ sách đầy bụi cao và không gian tối tăm được lọc qua ánh sáng mờ của cửa sổ kính màu."
Cấu trúc chi tiết kỹ thuật
Tập trung vào mô tả kỹ thuật chính xác, tối thiểu hóa trạng từ.
"Trong ánh hoàng hôn dịu dàng, một cây cầu đá cổ xuyên qua một con sông yên tĩnh, được bao quanh bởi cây cối mùa thu."
Ở mỗi cấu trúc này, ngữ pháp được điều chỉnh để hỗ trợ tính rõ ràng và hiệu quả của mô tả. Sử dụng câu đơn giản, mô tả trực tiếp và chủ động, thời gian nhất quán và mô tả kỹ thuật chính xác sẽ giúp Dall-E hiểu và tạo ra hình ảnh nhất quán.
Tóm tắt
Cấu trúc ưu tiên chủ đề: Trực tiếp giải thích chủ đề bằng ngữ pháp đơn giản.
Cấu trúc thiết lập cảnh: Bắt đầu bằng việc thiết lập và sử dụng dấu phẩy để mô tả rõ ràng.
Cấu trúc trung tâm hành động: Sử dụng câu chủ động để mô tả hành động.
Cấu trúc trung tâm không khí: Duy trì thời gian nhất quán và mô tả bầu không khí.
Cấu trúc chi tiết kỹ thuật: Tập trung vào mô tả kỹ thuật chính xác, tối thiểu hóa trạng từ.
Sử dụng các cấu trúc này sẽ giúp Dall-E tạo ra hình ảnh rõ ràng và nhất quán.
Lặp lại và chỉnh sửa để có được hình ảnh hoàn hảo từ DALL-E
Nếu bạn là một người hoàn hảo, bạn có thể phải sử dụng cùng một câu lệnh nhiều lần. Bằng cách chỉnh sửa câu lệnh một chút, bạn có thể nhận được hình ảnh gần với kết quả mong muốn hơn. Việc lặp lại và chỉnh sửa câu lệnh trên ChatGPT rất dễ dàng.
Qua quá trình tạo câu lệnh, bạn có thể hiểu cách DALL-E diễn giải và điều chỉnh câu lệnh cho phù hợp. Điều này sẽ làm tăng khả năng nhận được hình ảnh mong muốn.
Tuân thủ các hướng dẫn đạo đức của OpenAI khi sử dụng Dall-E
Việc tuân thủ các hướng dẫn đạo đức của OpenAI là rất quan trọng. Điều này bao gồm:
Tránh nội dung gây xúc phạm hoặc phân biệt đối xử: Không tạo ra các hình ảnh công kích hoặc phân biệt đối xử.
Không tạo ra các hình ảnh gây hiểu lầm hoặc xâm phạm quyền riêng tư: Không xâm phạm quyền riêng tư của người khác.
Tôn trọng bản quyền và sở hữu trí tuệ: Cẩn thận không vi phạm bản quyền hoặc sở hữu trí tuệ của người khác.
Tiếp cận nhạy cảm với các chủ đề bi thảm hoặc gây tranh cãi: Cẩn thận khi xử lý các chủ đề nhạy cảm.
Không tạo ra các hình ảnh có thể gây hiểu lầm về các nhân vật công cộng: Không tạo ra các hình ảnh có thể gây hiểu lầm về các nhân vật công cộng.
Các hướng dẫn này giúp sử dụng công nghệ AI một cách có trách nhiệm và tôn trọng. Các quy tắc trong ChatGPT có thể nghiêm ngặt hơn so với Image Creator, nhưng việc tạo ra các hình ảnh không được phép trong ChatGPT không có nghĩa là không vi phạm bản quyền. Do đó, tốt nhất là tuân thủ các hướng dẫn chung khi sử dụng cả hai công cụ này.
Ví dụ
Ví dụ 1: Vấn đề bản quyền
Câu lệnh: Tạo một hình ảnh công chúa Bạch Tuyết đang đi trong rừng, cầm một giỏ táo và hát.
Câu lệnh: Create a snow white princess walking in the forest holding a basket of apples, singing.

Kết quả: Không thể tạo ra hình ảnh sử dụng chính xác câu lệnh bạn cung cấp do các hạn chế về chính sách nội dung.
Kết quả: Unable to generate images using the exact prompt you provided due to content policy restrictions.
Câu lệnh bị chặn do vấn đề bản quyền.
Ví dụ 2: Phong cách của Pablo Picasso
Câu lệnh: Tạo một bức tranh về một chú chó mặc như một họa sĩ trong studio, theo phong cách của Pablo Picasso.
Câu lệnh: Create a painting of a dog dressed like a painter in the studio, in the style of Pablo Picasso.

Kết quả: Không thể tạo ra hình ảnh sử dụng chính xác câu lệnh bạn cung cấp do các hạn chế về chính sách nội dung.
Kết quả: Unable to generate images using the exact prompt you provided due to content policy restrictions.
ChatGPT đã điều chỉnh câu lệnh một chút để tuân thủ chính sách bản quyền bằng cách sử dụng "phong cách nghệ thuật thế kỷ 20".
Ví dụ 3: Nhân vật công chúa trong truyện cổ tích phổ biến
Câu lệnh: Tạo một hình ảnh hoạt hình của một công chúa từ thời đại truyện cổ tích cổ điển, đang đi và hát trong rừng, cầm một giỏ táo.
Câu lệnh: Create a cartoon image of a princess from a classic fairy tale era, walking and singing in the forest, holding a basket of apples.

Kết quả: Tạo hình ảnh thành công.
Kết quả: Image generation successful.
Câu lệnh này tránh tên nhân vật cụ thể và sử dụng mô tả chung, do đó hoạt động tốt.
Các thực hành tốt
Khám phá các phong cách nghệ thuật trong lĩnh vực công cộng: Hãy khám phá các phong cách nghệ thuật cổ điển như ấn tượng chủ nghĩa, phục hưng trước năm 1900.
Sử dụng các thể loại và phương tiện nghệ thuật rộng rãi: Bạn có thể sử dụng các thể loại và phương tiện nghệ thuật đa dạng như tranh phong cảnh, chân dung, hoa quả, nghệ thuật trừu tượng, v.v.
Tránh các nghệ sĩ, studio và tác phẩm sau năm 1900: Tránh các phong cách độc đáo của các nghệ sĩ hiện đại hoặc các thương hiệu truyền thông được bảo vệ bản quyền.
Câu hỏi về bản quyền
Ai sở hữu bản quyền của hình ảnh tôi tạo ra? Có an toàn về mặt thương mại không? Theo trang web chính sách nội dung của OpenAI, bản quyền của hình ảnh được tạo ra thuộc về người dùng. Điều này bao gồm quyền in, bán và thương mại hóa. Hình ảnh được tạo ra miễn phí hoặc bằng tín dụng trả phí, người dùng vẫn sở hữu nó.
Lưu ý: Luôn tham khảo trang web chính sách nội dung của OpenAI để kiểm tra các câu hỏi thường gặp, chính sách và điều khoản.
Thông qua các hướng dẫn và ví dụ được tổng hợp này, bạn có thể hiểu rõ cách tránh các vấn đề về bản quyền và đạo đức khi sử dụng Dall-E.
Sản xuất hình ảnh với quy mô lớn
Cách sử dụng hướng dẫn tùy chỉnh
Nhấp vào tên ở góc dưới bên trái tài khoản ChatGPT và chọn Custom Instructions(Hướng dẫn tùy chỉnh).
Cửa sổ chỉnh sửa sẽ mở ra.
What would you like GPT to know about you to provide better responses?(Bạn muốn GPT biết điều gì về bạn để cung cấp phản hồi tốt hơn?): Ở đây, bạn có thể giải thích vai trò của mình cho ChatGPT, nhưng không bắt buộc. Ví dụ, bạn có thể nói "Tôi là một giáo viên giáo dục trẻ em".
How would you like ChatGPT to respond?(Bạn muốn ChatGPT phản hồi như thế nào?): Phần này quan trọng hơn. Ở đây, bạn nhập các hướng dẫn cụ thể về đầu ra mong muốn.
Ví dụ về viết hướng dẫn tùy chỉnh
Tôi muốn tạo một cuốn sách tô màu cho trẻ em. Bạn là một họa sĩ minh họa. Nhiệm vụ của bạn là giúp tôi tạo ra các trang tô màu cho trẻ em bằng cách sử dụng Dall-E, dựa trên chủ đề mà tôi cung cấp. Đối với mỗi phản hồi của bạn, hãy sử dụng phong cách sau trong các câu lệnh của bạn:
- Chủ đề theo phong cách trang tô màu cho trẻ em.
- Đường nét dày.
- Hoạt hình.
- Tối giản.

Bây giờ, tôi đã kích hoạt và lưu hướng dẫn này cho cuộc trò chuyện mới.

Bây giờ, tôi đã sẵn sàng. Hãy thử một ví dụ đơn giản.
Ví dụ về câu lệnh và kết quả
câu lệnh: A tiger in a tropical forest
câu lệnh: Một con hổ trong rừng nhiệt đới
ChatGPT đã biết rằng tôi muốn tạo ra hình ảnh dựa trên hướng dẫn tùy chỉnh của tôi. Kết quả như sau:
Khi xem lại câu lệnh, tôi có thể thấy rằng nó đã tuân thủ chính xác mẫu mà tôi cung cấp.
Hãy thử một ví dụ khác.
câu lệnh: A cat traveling in Paris
câu lệnh: Một con mèo đang du lịch ở Paris
Thế giới tạo ra hình ảnh giống như ảnh chụp thông qua AI
Với sự phát triển của công nghệ AI, chúng ta có thể tạo ra những hình ảnh khó phân biệt với ảnh chụp thực tế. Trong bài giảng này, chúng ta sẽ hiểu về các nguyên lý cơ bản của nhiếp ảnh và học cách tạo ra những hình ảnh sáng tạo và sống động bằng cách sử dụng AI.
Hiểu các nguyên tắc cơ bản của nhiếp ảnh
Hiểu các nguyên tắc cơ bản của nhiếp ảnh là điều cần thiết để tạo ra hình ảnh chân thực thông qua AI. Bằng cách nắm bắt các yếu tố cốt lõi tạo nên một bức ảnh đẹp, chúng ta có thể đưa ra hướng dẫn chính xác và chi tiết hơn cho Dall-E. Những yếu tố này bao gồm: bố cục, ánh sáng, màu sắc, tiêu điểm và mối quan hệ giữa chủ thể và nền.
Ví dụ, hiểu về ánh sáng tự nhiên dịu nhẹ của giờ vàng (Golden Hour) sẽ giúp chúng ta yêu cầu AI tái tạo điều kiện ánh sáng đặc biệt này. Tương tự, hiểu về hiệu ứng độ sâu trường ảnh nông (shallow depth of field) sẽ cho phép chúng ta tạo ra hình ảnh tập trung vào chủ thể với nền mờ ảo đẹp mắt.
1
Hiểu về bố cục
Học hỏi các kỹ thuật bố cục khác nhau như quy tắc một phần ba, đối xứng, đóng khung,... để hướng dẫn AI tạo ra bố cục hình ảnh hấp dẫn về mặt thị giác.
2
Nắm vững kỹ thuật ánh sáng
Hiểu về ánh sáng tự nhiên, ánh sáng nhân tạo và đặc điểm của chúng để tạo ra bầu không khí và cảm xúc phù hợp trong hình ảnh do AI tạo ra.
3
Áp dụng lý thuyết màu sắc
Dựa trên kiến thức về sự kết hợp và tương phản màu sắc để yêu cầu AI tạo ra bố cục màu sắc có sức ảnh hưởng về mặt cảm xúc.
4
Tái hiện hiệu ứng ống kính
Hiểu các đặc điểm của nhiều loại ống kính khác nhau và áp dụng chúng vào câu lệnh AI để đạt được phối cảnh và hiệu ứng tiêu điểm mong muốn.
Hiểu về những giới hạn của việc tạo ảnh
Hiểu rõ những giới hạn trong việc tạo ảnh bằng AI rất quan trọng để tiết kiệm thời gian. Một yếu tố hạn chế chính liên quan đến số lượng nhân vật xuất hiện trong ảnh. Nếu chỉ có một nhân vật trong câu lệnh, AI có thể tạo ra hình ảnh với độ chi tiết cao. Tuy nhiên, càng thêm nhân vật, chi tiết của ảnh, đặc biệt là khuôn mặt, càng giảm.
Bắt đầu tạo ảnh thực tế
Đầu tiên, hãy thử tạo một bức ảnh chân thực với câu lệnh về một sinh viên đại học.
"A candid portrait of a college student"
"Chân dung tự nhiên của một sinh viên đại học"
Kết quả là bốn bức chân dung được tạo ra với khuôn mặt chân thực và bố cục tốt.
Vậy thì, hãy thử thêm hai sinh viên đại học vào câu lệnh.
"A candid portrait of two college students"
"Chân dung tự nhiên của hai sinh viên đại học"
Khuôn mặt trông hơi giống AI hơn, nhưng vẫn ở mức chấp nhận được.
Hãy thử với ba sinh viên.
"A candid portrait of three college students"
"Chân dung tự nhiên của ba sinh viên đại học"
Nhìn từ xa thì ổn, nhưng chi tiết khuôn mặt, đặc biệt là răng, bị giảm.
Hãy thử với năm sinh viên.
"A candid portrait of five college students"
"Chân dung tự nhiên của năm sinh viên đại học"
Giờ đây, hầu hết các chi tiết trên khuôn mặt đã biến mất.
Điều quan trọng là phải kiểm tra những giới hạn trước khi bắt đầu một dự án tạo ảnh phức tạp. Điều này sẽ giúp bạn biết được điều gì có thể và không thể làm được.
Tạo ảnh động vật
Hãy thử tạo ảnh động vật. Đầu tiên, hãy tạo một ảnh chân dung chuyên nghiệp của một chú mèo mặc vest.
"A professional portrait of a cat dressed in a suit"
"Chân dung chuyên nghiệp của một chú mèo mặc vest"
Hình ảnh chú mèo khá chân thực và chi tiết. Lần này, hãy thử thêm năm chú mèo nữa.
"A professional portrait of five cats dressed in suits"
"Chân dung chuyên nghiệp của năm chú mèo mặc vest"
Khá ổn, nhưng một số con mèo không khớp hoặc chi tiết ít hơn. Hãy thử thêm mười con mèo.
"A professional portrait of ten cats dressed in suits"
"Chân dung chuyên nghiệp của mười chú mèo mặc vest"
Chi tiết của mèo vẫn tốt, nhưng một số con trông như được sao chép và dán. Số lượng khuôn mặt mèo không khớp, nhưng nhìn chung, mèo dễ xử lý hơn.
Điều gì sẽ xảy ra nếu chúng ta thêm các chủ đề khác? Ví dụ: hãy thử đặt năm con mèo và năm con chó mặc vest.
"A professional portrait of five cats and five dogs dressed in suits"
"Chân dung chuyên nghiệp của năm chú mèo và năm chú chó mặc vest"
Việc tạo ảnh trở nên khó khăn hơn và có thể có những yếu tố bất ngờ.
Tạo ảnh phức tạp
Cuối cùng, hãy thử tạo ảnh phức tạp. Hãy tạo một câu lệnh bao gồm nhiều yếu tố.
"A photo of a retriever with black and pink themed furniture on Mars, with a red sofa, a pink chair, a yellow bed, a white bed, a black bedside table, two green plants, a TV, a fridge, and two windows in the hotel room"
"Một bức ảnh về một chú chó Golden Retriever với nội thất theo chủ đề đen và hồng trên sao Hỏa, với một chiếc ghế sofa màu đỏ, một chiếc ghế màu hồng, một chiếc giường màu vàng, một chiếc giường màu trắng, một chiếc bàn đầu giường màu đen, hai cây xanh, một chiếc TV, một chiếc tủ lạnh và hai cửa sổ trong phòng khách sạn"
Hình ảnh trông khá ổn, nhưng một số yếu tố bị thiếu.
Kết luận
Dall-E tạo ra kết quả tốt nhất với các câu lệnh rõ ràng và ngắn gọn. 
Các câu lệnh với quá nhiều chủ đề và yếu tố có thể tạo ra hình ảnh chất lượng thấp hoặc chỉ hiển thị một phần câu lệnh. Vì vậy, giữ cho chủ đề đơn giản là cách tốt nhất để có được kết quả tốt nhất mà không làm quá tải mô hình AI.
Tạo ảnh bằng cách sử dụng vị trí và cài đặt
Sau khi chọn chủ đề, điều quan trọng là vị trí hoặc cài đặt. Điều này chỉ ra không gian nơi diễn ra cảnh.
Bạn có thể thiết lập một phạm vi rộng lớn hơn, chẳng hạn như trong nhà hoặc ngoài trời, hoặc một địa điểm cụ thể hơn. Điều này sẽ ảnh hưởng đến tổng thể không khí và ngữ cảnh.
Hãy cùng xem xét cách sử dụng hiệu quả các vị trí và cài đặt khác nhau.
"A photo of a young couple in a studio setting"
"Ảnh một cặp đôi trẻ trong một bối cảnh studio"
Giờ đây, hãy thay đổi vị trí thành một trung tâm mua sắm ở Paris.
"A photo of a young couple in a shopping mall in Paris"
"Ảnh một cặp đôi trẻ trong một trung tâm mua sắm ở Paris"
Hãy thay đổi nó thành một bối cảnh với khung cảnh thành phố Tokyo.
"A photo of a young couple with a Tokyo cityscape backdrop"
"Ảnh một cặp đôi trẻ với phông nền là cảnh quan thành phố Tokyo"
Tiếp theo, hãy thử cài đặt trong một nhà hàng cao cấp với bàn ăn có nến.
"A photo of a young couple in a fine dining restaurant with candles on the table"
"Ảnh một cặp đôi trẻ trong một nhà hàng cao cấp với nến trên bàn"
Như bạn thấy, ánh sáng và phong cách của bức ảnh đã được điều chỉnh cho phù hợp với ngữ cảnh trong nhà.
Cuối cùng, hãy thử một thí nghiệm. Hãy tạo hình ảnh một cặp đôi trên một ngọn núi tuyết.
"A selfie of a young couple on a snowy mountain"
"Ảnh tự chụp của một cặp đôi trẻ trên một ngọn núi tuyết"
Khi vị trí được chỉ định trong câu lệnh, Dall-E hiệu quả điều chỉnh không khí, ngữ cảnh và các chi tiết khác cho phù hợp với vị trí đó.
Thử nghiệm các yếu tố môi trường
"A 20-year-old mixed-race model near the window on a sunny day"
"Một người mẫu lai 20 tuổi gần cửa sổ vào một ngày nắng"
Hãy thay đổi thời tiết thành một ngày nhiều mây.
"A 20-year-old mixed-race model near the window on a cloudy day"
"Một người mẫu lai 20 tuổi gần cửa sổ vào một ngày nhiều mây"
Hãy thay đổi nó thành một ngày bão.
"A 20-year-old mixed-race model near the window on a stormy day"
"Một người mẫu lai 20 tuổi gần cửa sổ vào một ngày bão"
Bạn có thể thấy mưa và mây đen ở xa qua cửa sổ. Ánh sáng của người mẫu cũng được điều chỉnh cho phù hợp.
Cuối cùng, hãy đặt nó vào một ngày có tuyết rơi.
"A 20-year-old mixed-race model near the window on a snowy day"
"Một người mẫu lai 20 tuổi gần cửa sổ vào một ngày có tuyết rơi"
Tuyệt vời. Không khí và ngữ cảnh, bao gồm cả trang phục của người mẫu, đều phản ánh một ngày có tuyết rơi.
Kết luận:
Tại thời điểm này, chúng ta đã thực hiện hai thí nghiệm tập trung vào các từ khóa vị trí và thời tiết. Chúng ta có thể thấy rằng những yếu tố này ảnh hưởng rất nhiều đến đầu ra của hình ảnh. Thiết lập ngữ cảnh để tạo ra hình ảnh chân thực như ảnh chụp là một bước quan trọng trước khi tinh chỉnh câu lệnh một cách chi tiết hơn.
Để sử dụng Dall-E hiệu quả, điều quan trọng là sử dụng các chủ đề đơn giản và mô tả rõ ràng để giảm thiểu sự nhầm lẫn của mô hình và đạt được kết quả mong muốn.
Viết câu lệnh dựa trên thời gian trong ngày
Thời gian trong ngày là yếu tố quan trọng để thiết lập bối cảnh và không khí của bức ảnh. Buổi sáng, buổi chiều, hoàng hôn, ban đêm, mỗi thời điểm đều ảnh hưởng lớn đến ánh sáng, bóng tối và màu sắc của hình ảnh. Chúng ta hãy cùng khám phá cách sử dụng hiệu quả yếu tố thời gian này.
Bắt đầu tạo ảnh với chủ đề thời gian trong ngày
Đầu tiên, hãy thử tạo một bức ảnh được chụp vào một thời điểm cụ thể trong ngày.
"A photo of a city street in the morning"
"Hình ảnh đường phố thành phố vào buổi sáng"
Vậy bây giờ chúng ta hãy thử tạo ra hình ảnh đường phố thành phố vào buổi trưa.
"A photo of a city street at noon"
"Hình ảnh đường phố thành phố vào buổi trưa"
Tiếp theo, hãy tạo hình ảnh đường phố thành phố vào buổi chiều.
"A photo of a city street in the evening"
"Hình ảnh đường phố thành phố vào buổi tối"
Bây giờ chúng ta hãy thử tạo hình ảnh đường phố thành phố vào giờ vàng (golden hour).
"A photo of a city street during the golden hour"
"Hình ảnh đường phố thành phố vào giờ vàng"
Những bức ảnh được tạo ra thể hiện ánh sáng ấm áp, dịu nhẹ chiếu xuống đường phố thành phố, tạo nên không khí lãng mạn.
Hãy thử tạo hình ảnh đường phố thành phố vào giờ xanh (blue hour).
"A photo of a city street during the blue hour"
"Hình ảnh đường phố thành phố vào giờ xanh"
Hình ảnh đường phố thành phố được tạo ra mang một vẻ huyền bí với ánh sáng xanh nhạt.
Cuối cùng, hãy tạo hình ảnh đường phố thành phố vào ban đêm.
"A photo of a city street at midnight"
"Hình ảnh đường phố thành phố vào lúc nửa đêm"
Những bức ảnh thể hiện bầu trời đêm tối, ánh sáng nhân tạo và sự tĩnh lặng của màn đêm.
Kết luận
Thời gian trong ngày và yếu tố thời tiết ảnh hưởng rất lớn đến không khí và bối cảnh của hình ảnh. Việc chỉ định rõ thời gian trong ngày trong câu lệnh sẽ giúp Dall-E điều chỉnh ánh sáng, màu sắc và không khí của hình ảnh sao cho phù hợp. Việc tận dụng những yếu tố này sẽ giúp bạn thể hiện hiệu quả phong cách và không khí mong muốn.
Hiểu về Kỷ nguyên Nhiếp ảnh
Kỷ nguyên nhiếp ảnh ảnh hưởng rất lớn đến diện mạo và cảm nhận của bức ảnh được tạo ra bởi Dall-E. Việc chỉ định một kỷ nguyên cụ thể, ví dụ như những năm 1960, trong câu lệnh sẽ giúp phản ánh chính xác hơn phong cách ảnh mong muốn. Bạn cũng có thể sử dụng các từ ngữ mô tả phản ánh đặc điểm của nhiếp ảnh trong thời kỳ đó.
Những Kỷ nguyên Chính và Đặc điểm của Chúng
Kỷ nguyên ảnh đen trắng (Black and White Era): Phản ánh sự đơn giản và thanh lịch của những bức ảnh ban đầu.
Những năm 1960: Đặc trưng bởi thời trang táo bạo, nghệ thuật Pop Art và các sự kiện lịch sử quan trọng.
Những năm 1970: Đặc trưng bởi văn hóa Disco, màu sắc rực rỡ và sự phát triển của công nghệ hiện đại.
Những năm 1980: Đặc trưng bởi màu neon, thời trang sặc sỡ và sự nổi lên của công nghệ kỹ thuật số.
Những năm 1990: Tập trung vào công nghệ kỹ thuật số ban đầu, thời trang Grunge và văn hóa tuổi trẻ.
Những năm 2000 trở đi: Được dẫn dắt bởi máy ảnh kỹ thuật số và điện thoại thông minh, chịu ảnh hưởng bởi phương tiện truyền thông xã hội và kết nối toàn cầu.
Ví dụ về chuyến du hành thời gian qua ảnh
Hãy tạo một nhân vật mới để bắt đầu chuyến du hành thời gian qua ảnh. Nhân vật là một người đàn ông 30 tuổi, mặc đồ đen, có bộ râu ngắn và đeo kính gọng sừng, ở Barcelona. Mô tả nhân vật càng chi tiết, càng đảm bảo tính nhất quán của hình ảnh được tạo ra sau này. Tuy nhiên, điều quan trọng là không làm quá tải Dall-E với quá nhiều yếu tố.
Đầu tiên, hãy tạo một bức ảnh từ những năm 1890.
"A photo of a 30-year-old man with short beard and tortoiseshell glasses wearing black, in Barcelona, 1890s photography"
"Một bức ảnh của một người đàn ông 30 tuổi với bộ râu ngắn và kính gọng sừng, mặc đồ đen, ở Barcelona, phong cách nhiếp ảnh những năm 1890"
Kết quả là, nó trông giống như một bức ảnh cổ điển mà bạn có thể thấy trong bảo tàng.
Hãy nhanh chóng chuyển đến những năm 1940.
"A photo of a 30-year-old man with short beard and tortoiseshell glasses wearing black, in Barcelona, 1940s photography"
"Một bức ảnh của một người đàn ông 30 tuổi với bộ râu ngắn và kính gọng sừng, mặc đồ đen, ở Barcelona, phong cách nhiếp ảnh những năm 1940"
Vì hình ảnh màu sắc xuất hiện, hãy thêm cụ thể hơn "đen trắng".
"A photo of a 30-year-old man with short beard and tortoiseshell glasses wearing black, in Barcelona, 1940s black and white photography"
"Một bức ảnh của một người đàn ông 30 tuổi với bộ râu ngắn và kính gọng sừng, mặc đồ đen, ở Barcelona, phong cách nhiếp ảnh đen trắng những năm 1940"
Kết quả là, một bức ảnh phù hợp hơn với thời đại đã được tạo ra.
Hãy chuyển đến những năm 1960.
"A photo of a 30-year-old man with short beard and tortoiseshell glasses wearing black, in Barcelona, 1960s photography"
"Một bức ảnh của một người đàn ông 30 tuổi với bộ râu ngắn và kính gọng sừng, mặc đồ đen, ở Barcelona, phong cách nhiếp ảnh những năm 1960"
Những năm 1950 và 1960 chứng kiến sự phổ biến rộng rãi của ảnh màu, vì vậy cả ảnh đen trắng và ảnh màu đều xuất hiện tốt.
Hãy chuyển đến những năm 1980.
 "A photo of a 30-year-old man with short beard and tortoiseshell glasses wearing black, in Barcelona, 1980s photography"
"Một bức ảnh của một người đàn ông 30 tuổi với bộ râu ngắn và kính gọng sừng, mặc đồ đen, ở Barcelona, phong cách nhiếp ảnh những năm 1980"
Hình ảnh được tạo ra phản ánh tốt kiểu tóc và thời trang đặc trưng của những năm 1980.
Cuối cùng, hãy chuyển đến những năm 2000.
"A photo of a 30-year-old man with short beard and tortoiseshell glasses wearing black, in Barcelona, 2000s photography"
"Một bức ảnh của một người đàn ông 30 tuổi với bộ râu ngắn và kính gọng sừng, mặc đồ đen, ở Barcelona, phong cách nhiếp ảnh những năm 2000"
Hình ảnh được tạo ra có phong cách quen thuộc mà chúng ta thường thấy trên phương tiện truyền thông xã hội và các trang web.
Hạn chế trong việc xử lý số liệu của Dall-E
Dall-E có thể có một số hạn chế nhỏ trong việc xử lý số liệu. Ví dụ, sự khác biệt giữa các hình ảnh được tạo ra với từ khóa "1960s" và "1970s" có thể không quá lớn. Thêm nhiều mô tả về thời đại và phong cách sẽ giúp mang lại kết quả tốt hơn.
Sử dụng ChatGPT cho chuyến du hành thời gian
Hãy sử dụng ChatGPT để tạo ra các câu lệnh phản ánh từng thời đại từ những năm 1930 đến những năm 2010.
Đây là các câu lệnh về chân dung một chú mèo trắng mặc vest, phản ánh từng thời đại từ những năm 1930 đến những năm 2010. Mỗi câu lệnh bắt đầu từ mỗi thập kỷ và cuối cùng là mô tả về phong cách.
Đây là các câu lệnh mà ChatGPT đã tạo ra:
Những năm 1930:
A portrait of a white cat wearing a dark, double-breasted suit with wide lapels, paired with a fedora hat. The cat has a serious expression, and the background features an Art Deco design reflecting the 1930s style.

Chân dung một chú mèo trắng mặc bộ vest tối màu, hai hàng khuy, ve áo rộng, cùng với chiếc mũ fedora. Chú mèo có vẻ mặt nghiêm túc, và nền có thiết kế Art Deco phản ánh phong cách những năm 1930.
Những năm 1940:
A portrait of a white cat in a sharp, single-breasted suit with a narrow tie, complemented by a pocket square. The cat has a confident look, and the background is inspired by wartime propaganda posters of the 1940s.

Chân dung một chú mèo trắng mặc bộ vest lịch lãm, một hàng khuy, cà vạt mảnh, cùng với một chiếc khăn bỏ túi. Chú mèo có vẻ mặt tự tin, và nền được lấy cảm hứng từ các áp phích tuyên truyền thời chiến tranh của những năm 1940.
Những năm 1950:
A portrait of a white cat dressed in a sleek, grey flannel suit with a skinny tie and polished loafers. The cat appears suave and relaxed, set against a backdrop of a retro diner or drive-in theater typical of the 1950s.

Chân dung một chú mèo trắng mặc bộ vest màu xám nhạt, mảnh mai, cà vạt mảnh và giày lười bóng bẩy. Chú mèo trông lịch lãm và thư thái, với nền là một quán ăn retro hoặc rạp chiếu phim ngoài trời điển hình của những năm 1950.
Những năm 1960:
A portrait of a white cat sporting a mod-style suit with a bold, geometric pattern and a thin tie. The cat exudes a cool demeanor, with a background featuring psychedelic art and pop culture references from the 1960s.

Chân dung một chú mèo trắng mặc bộ vest theo phong cách hiện đại với họa tiết hình học đậm nét và cà vạt mảnh. Chú mèo toát lên vẻ ngoài lạnh lùng, với nền là nghệ thuật tâm linh và những gợi ý về văn hóa đại chúng từ những năm 1960.
Những năm 1970:
A portrait of a white cat in a wide-collared, three-piece suit with flared trousers and platform shoes. The cat has a laid-back, groovy expression, standing before a disco-themed backdrop with vibrant colors and lights.

Chân dung một chú mèo trắng mặc bộ vest ba mảnh, cổ áo rộng, quần ống loe và giày đế bằng. Chú mèo có vẻ mặt thư thái, phóng khoáng, đứng trước nền có chủ đề disco với màu sắc và ánh sáng rực rỡ.
Những năm 1980
A portrait of a white cat wearing a power suit with broad shoulders, a patterned tie, and a flashy pocket square. The cat has a confident, ambitious look, set against a backdrop of a neon-lit cityscape representing the 1980s style.

Chân dung một chú mèo trắng mặc bộ vest quyền lực với vai rộng, cà vạt hoa văn và khăn bỏ túi sặc sỡ. Chú mèo có vẻ mặt tự tin, đầy tham vọng, với nền là cảnh quan đô thị lung linh ánh đèn neon đại diện cho phong cách những năm 1980.
Những năm 1990
A portrait of a white cat dressed in a grunge-inspired suit with a loose tie and an open shirt, reflecting a casual yet rebellious attitude. The background features graffiti and urban elements typical of the 1990s.

Chân dung một chú mèo trắng mặc bộ vest lấy cảm hứng từ phong cách Grunge với cà vạt lỏng lẻo và áo sơ mi mở, phản ánh thái độ giản dị nhưng nổi loạn. Nền có các bức vẽ graffiti và các yếu tố đô thị điển hình của những năm 1990.
Những năm 2000
A portrait of a white cat in a slim-fit suit with a skinny tie and trendy accessories, such as a pocket watch and modern eyeglasses. The cat looks fashionable and confident, with a backdrop of a sleek, modern cityscape from the 2000s.

Chân dung một chú mèo trắng mặc bộ vest ôm sát với cà vạt mảnh và các phụ kiện thời trang, chẳng hạn như đồng hồ bỏ túi và kính mắt hiện đại. Chú mèo trông thời trang và tự tin, với nền là cảnh quan đô thị hiện đại, bóng bẩy từ những năm 2000.
Những năm 2010
A portrait of a white cat wearing a tailored, minimalist suit with a slim tie and a contemporary watch. The cat exudes a polished and sophisticated aura, set against a backdrop of a stylish, urban environment reflecting the 2010s.

Chân dung một chú mèo trắng mặc bộ vest may đo, tối giản với cà vạt mảnh và đồng hồ hiện đại. Chú mèo toát ra vẻ ngoài bóng bẩy và tinh tế, với nền là môi trường đô thị phong cách phản ánh những năm 2010.
Kết luận
Kỷ nguyên nhiếp ảnh ảnh hưởng rất lớn đến diện mạo và cảm nhận của bức ảnh. Việc chỉ định rõ ràng một kỷ nguyên cụ thể trong câu lệnh sẽ giúp Dall-E phản ánh điều đó, thể hiện được không khí và phong cách phù hợp với thời đại. Việc tận dụng những yếu tố này sẽ giúp bạn thể hiện hiệu quả phong cách và không khí mong muốn.
Góc nhìn của nhiếp ảnh gia về chụp ảnh
Là một nhiếp ảnh gia, sau khi xác định chủ đề, vị trí và ngữ cảnh, điều tiếp theo cần xem xét là cách chụp ảnh. Điều này cũng tương tự khi sử dụng Dall-E. Bây giờ chúng ta cần tập trung vào kỹ thuật. Sử dụng góc độ nào? Góc thấp, góc cao hay góc nhìn khác? Sử dụng loại cảnh nào? Cận cảnh, cảnh trung bình hay cảnh toàn cảnh?
Hãy sử dụng ChatGPT để tạo các câu lệnh về các góc độ và loại cảnh khác nhau.
Câu lệnh về góc máy và loại cảnh
Yêu cầu ChatGPT tạo năm câu lệnh đơn giản cho Dall-E về góc độ và loại cảnh, sử dụng Husky làm nhân vật. Cung cấp cho ChatGPT mẫu sau: Mỗi câu lệnh bắt đầu với "A portrait photo of a husky", tiếp theo là mô tả về góc độ hoặc loại cảnh.
Chỉ trong vài giây, bạn sẽ có một danh sách các câu lệnh ngắn gọn và mô tả về năm góc độ và năm loại cảnh. ChatGPT không chỉ thêm các từ khóa về góc độ hoặc loại cảnh mà còn thêm cả mô tả chi tiết hơn về hình ảnh sẽ như thế nào.
Ví dụ về góc độ
Góc thấp:
"A portrait photo of a husky taken from a low angle, making it appear larger against the sky."
"Ảnh chân dung của một chú Husky được chụp từ góc thấp, làm cho nó trông lớn hơn trên nền trời."
Góc cao:
"A portrait photo of a husky taken from a high angle, showing its small size against the ground."
"Ảnh chân dung của một chú Husky được chụp từ góc cao, cho thấy kích thước nhỏ bé của nó so với mặt đất."
Góc ngang tầm mắt:
"A portrait photo of a husky taken at eye level, providing a direct and personal view."
"Ảnh chân dung của một chú Husky được chụp ở tầm mắt, cung cấp một cái nhìn trực tiếp và cá nhân."
Góc nhìn chim bay:
"A portrait photo of a husky taken from a bird's eye view, showcasing the husky and its environment from directly above."
"Ảnh chân dung của một chú Husky được chụp từ góc nhìn chim bay, thể hiện chú Husky và môi trường xung quanh từ phía trên."
Góc nhìn sâu:
"A portrait photo of a husky taken from a worm's eye view, giving the feeling of viewing from the ground."
"Ảnh chân dung của một chú Husky được chụp từ góc nhìn sâu, tạo cảm giác như đang nhìn từ mặt đất."
Ví dụ về loại cảnh
Cảnh toàn cảnh:
"A portrait photo of a husky in a long shot, showing its full body in a natural environment."
"Ảnh chân dung của một chú Husky ở cảnh toàn cảnh, thể hiện toàn bộ cơ thể của nó trong môi trường tự nhiên."
Cảnh trung bình:
"A portrait photo of a husky in a medium shot, capturing the upper body above the waist."
"Ảnh chân dung của một chú Husky ở cảnh trung bình, chụp phần thân trên phía trên eo."
Cận cảnh:
"A portrait photo of a husky in a close up, focusing on its face with clear details."
"Ảnh chân dung của một chú Husky ở cận cảnh, tập trung vào khuôn mặt với các chi tiết rõ ràng."
Cận cảnh cực gần:
"A portrait photo of a husky in an extreme close up, showing the details of its eyes and fur."
"Ảnh chân dung của một chú Husky ở cận cảnh cực gần, cho thấy chi tiết của mắt và lông."
Góc rộng:
"A portrait photo of a husky taken with a wide-angle lens, capturing a broader view of its environment."
"Ảnh chân dung của một chú Husky được chụp bằng ống kính góc rộng, chụp được khung cảnh rộng hơn của môi trường xung quanh."
Kết luận
Bây giờ chúng ta đã thấy góc độ và loại cảnh ảnh hưởng như thế nào đến bố cục của ảnh được tạo bằng Dall-E. Tiếp theo, chúng ta sẽ tìm hiểu về máy ảnh được sử dụng khi chụp ảnh. Thương hiệu và loại máy ảnh có ảnh hưởng đến ngoại hình và cảm giác của ảnh không? Câu trả lời là "có". Hãy cùng tìm hiểu sâu hơn.
Nhiều phong cách và hiệu ứng ảnh khác nhau
Trong bài học trước, chúng ta đã tập trung vào cách chụp ảnh. Giờ đây, các bạn đã trở thành những nhiếp ảnh gia AI. Trong bài học này, chúng ta sẽ thử nghiệm những phong cách và hiệu ứng ảnh thú vị hơn nữa. Những phong cách và hiệu ứng này có thể được sử dụng độc lập trong câu lệnh hoặc kết hợp với các thông số kỹ thuật hoặc chi tiết kỹ thuật.
Các phong cách và hiệu ứng ảnh phổ biến
Các phong cách và hiệu ứng ảnh phổ biến bao gồm ảnh tự chụp (selfie), khung trong khung, ảnh góc nhìn người (POV), ảnh nhìn qua vai, màu sắc chọn lọc, toàn cảnh, v.v. Đối với ảnh chụp ban đêm, có hiệu ứng bokeh, sao lưu tốc độ chậm, len thép, neon đêm, bóng mờ, v.v. Hãy tham khảo các tạp chí ảnh, trang web và phương tiện truyền thông xã hội để tìm cảm hứng.
Sử dụng ChatGPT để trình diễn hiệu ứng phong cách ảnh
ChatGPT có thể giúp bạn dễ dàng trình diễn các hiệu ứng ảnh. Đôi khi chỉ sử dụng từ khóa thôi là chưa đủ, nhưng ChatGPT có thể bổ sung thêm từ ngữ và ngữ cảnh mô tả hơn để tạo ra hiệu ứng.
Ở đây, chúng ta sẽ yêu cầu ChatGPT tạo ra một hình ảnh phong cảnh về một chú chim hồng hạc theo các phong cách sau: nhìn qua vai, khung trong khung, màu sắc chọn lọc, sao lưu tốc độ chậm, len thép. Chúng ta sẽ yêu cầu tạo từng hình ảnh một.
Ví dụ về câu lệnh và bản dịch
Nhìn qua vai:
"A landscape photo of a flamingo seen over the shoulder in the middle of a lake."
"Một bức ảnh phong cảnh về một chú chim hồng hạc được nhìn thấy từ phía sau vai ở giữa hồ."
Khung trong khung:
"A landscape photo of a flamingo framed by trees and vines, creating a natural frame."
"Một bức ảnh phong cảnh về một chú chim hồng hạc được tạo khung bởi cây cối và dây leo, tạo nên một khung cảnh tự nhiên."
Màu sắc chọn lọc:
"A landscape photo of a flamingo in color with the background in black and white."
"Một bức ảnh phong cảnh về một chú chim hồng hạc màu sắc với nền đen trắng."
Sao lưu tốc độ chậm:
"A landscape photo of a flamingo with long exposure star trails in the sky."
"Một bức ảnh phong cảnh về một chú chim hồng hạc với vệt sao tốc độ chậm trên bầu trời."
Len thép:
"A landscape photo of a flamingo with a steel wool effect blending into the background."
"Một bức ảnh phong cảnh về một chú chim hồng hạc với hiệu ứng len thép hòa quyện vào nền."
Hình ảnh được tạo ra và mô tả
Hãy cùng xem xét các hình ảnh mà ChatGPT đã tạo ra.
Nhìn qua vai: Đây là một bức ảnh phong cảnh về một chú chim hồng hạc được nhìn thấy từ phía sau vai ở giữa hồ. Vì câu lệnh có thể dài hơn, nên chúng ta đã không đặt giới hạn số từ ngay từ đầu.
Khung trong khung: Đây là một khung cảnh đẹp với cây cối và dây leo tạo thành khung.
Màu sắc chọn lọc: Trong bức ảnh này, chú chim hồng hạc có màu sắc trong khi nền có màu đen trắng. Kết quả không hoàn hảo nhưng rất gần. Bạn có thể chỉnh sửa bằng cách lặp lại và sửa đổi câu lệnh.
Sao lưu tốc độ chậm: Có vẻ hơi siêu thực và phóng đại, nhưng Dall-E đã hiểu được ý tưởng.
Vệt sao: Đây là một khung cảnh đẹp với vệt sao trên bầu trời đêm phản chiếu trên mặt hồ.
Len thép: Đây là một hiệu ứng rất đặc biệt, với hiệu ứng len thép được hòa trộn hoàn hảo vào chú chim hồng hạc và nền.
Kết luận
Cho đến nay, chúng ta đã xem xét sáu phong cách và hiệu ứng ảnh khác nhau. Bạn có thể sử dụng ChatGPT hoặc Image Creator để thử nghiệm nhiều hơn nữa. Tuy nhiên, ChatGPT cung cấp các mô tả phong cách chính xác hơn, do đó bạn sẽ có được kết quả chính xác hơn.
Cài đặt tùy chỉnh ChatGPT để đơn giản hóa việc tạo ảnh.
Đầu tiên, hãy truy cập vào phần cài đặt. Để phần trên trống.
Vì chúng ta rất thích bức ảnh chim hồng hạc mà chúng ta đã tạo trước đó, nên chúng ta muốn áp dụng cùng một cài đặt cho bức ảnh mới. Đây chính là Cài đặt tùy chỉnh ChatGPT (Custom Instructions).
Bạn là một kỹ sư prompt hình ảnh tự nhiên cho bất kỳ chủ đề nào mà tôi gửi. Hãy sử dụng cấu trúc sau để tạo ảnh Dall-E:

Chủ đề (subject) ngữ cảnh (context).
Ảnh chụp bằng Canon EOS R7. Khẩu độ hẹp (narrow aperture), tốc độ màn trập nhanh (fast shutter speed), ISO thấp (low ISO).
Hình ảnh có độ nét cao, hiệu ứng đóng băng khung hình (freeze frame effect), màu sắc sống động và chi tiết rõ ràng.
Chủ đề không quá năm từ, ngữ cảnh không quá mười từ.
Hình ảnh được tạo ở định dạng ngang (landscape).
Lưu lại.
Hãy thử một lần. Lợi ích chính của hướng dẫn tùy chỉnh là bạn không cần phải nhắc lại prompt cho ChatGPT. Ở đây, Cài đặt tùy chỉnh ChatGPT chuyên về tạo ảnh chụp lại chuyển động.
Ví dụ về  câu lệnh (prompt).và bản dịch
"A landscape photo of a tiger jumping over a water stream."
"Ảnh phong cảnh con hổ nhảy qua dòng suối."
Mục tiêu là có hiệu ứng đóng băng khung hình sắc nét, độ sâu trường ảnh lớn và nhiễu thấp.
Hãy xem kết quả tuyệt vời.
Đây là ảnh phong cảnh con hổ nhảy qua dòng suối. Tôi thực sự thích hiệu ứng đóng băng khung hình.
Tiếp theo, chúng ta sẽ tạo ảnh con cá hồi nhảy khỏi mặt nước.
"A landscape photo of a salmon jumping out of the water."
"Ảnh phong cảnh con cá hồi nhảy khỏi mặt nước."
Hiệu quả rất tốt. Tôi nghĩ Dall-E đã làm rất tốt việc tuân theo câu lệnh (prompt).
Lần này, chúng ta sẽ tạo ảnh một con chim bói cá bay qua sông.
"A landscape photo of a kingfisher flying across a river."
"Ảnh phong cảnh con chim bói cá bay qua sông."
Đây rồi. Con chim bói cá bay qua sông, hình ảnh sắc nét, có hiệu ứng đóng băng khung hình và màu sắc rực rỡ.
Kết luận
Cài đặt tùy chỉnh ChatGPT rất hiệu quả khi bạn muốn tạo ảnh quy mô lớn với tính nhất quán và liên tục. Nếu bạn muốn thêm nhiều tính năng hoặc chia sẻ với người khác, bạn cũng có thể xây dựng nó bằng GPT.
Sử dụng Cài đặt tùy chỉnh ChatGPT thông qua ChatGPT giúp bạn dễ dàng tạo ra những hình ảnh chính xác và nhất quán hơn.
Tạo ảnh bằng DALL-E 3
Thế giới tạo ra tác phẩm nghệ thuật bằng Dall-E
Tạo ra những tác phẩm nghệ thuật đột phá với Dall-E. Hãy cùng khám phá nhiều phong cách và kỹ thuật khác nhau và học cách AI đóng vai trò sáng tạo.
Phần này sẽ hướng dẫn cách tạo tác phẩm nghệ thuật bằng nhiều phong cách và phương tiện khác nhau, khám phá định nghĩa về nghệ thuật và vai trò của AI trong quá trình sáng tạo. Nội dung chính bao gồm:
Kết hợp các phong cách nghệ thuật: Học cách sử dụng Dall-E để kết hợp nhiều phong cách nghệ thuật khác nhau tạo ra các tác phẩm độc đáo.
Hiểu các hạn chế: Hiểu các ràng buộc và hạn chế cần xem xét khi tạo prompt cho tác phẩm nghệ thuật.
Nâng cao kỹ thuật nghệ thuật: Cung cấp các công cụ để nâng cao nhiều kỹ thuật nghệ thuật khác nhau, từ phương tiện truyền thống (vẽ, phác thảo, minh họa) đến các phương tiện mới như nhân vật 3D, hoạt hình, truyện tranh.
Sao chép các phong cách nghệ thuật nổi tiếng: Học cách sử dụng ChatGPT và Dall-E để sao chép các phong cách nghệ thuật nổi tiếng hoặc các tác phẩm cụ thể.
Các chủ đề chính của phần này
1. Sự kết hợp giữa AI và nghệ thuật
Bạn có thể tối đa hóa khả năng sáng tạo bằng cách hợp tác với AI. Đặc biệt, Dall-E có thể là một công cụ hữu ích để khám phá các hướng nghệ thuật mới, tạo ra ý tưởng mới và vượt qua các rào cản sáng tạo.
Cách hợp tác với AI:
Tạo ý tưởng: Sử dụng AI để nhanh chóng tạo ra nhiều ý tưởng và phát triển chúng.
Khám phá phong cách: Thử nghiệm với nhiều phong cách và kỹ thuật khác nhau mà bạn chưa quen thuộc.
Củng cố chi tiết: AI có thể hỗ trợ các chi tiết phức tạp mất nhiều thời gian để làm thủ công.
Hợp tác sáng tạo: Sử dụng AI như một đối tác sáng tạo để cung cấp cái nhìn mới.
2. Thử nghiệm với các phong cách nghệ thuật kết hợp
Sử dụng Dall-E để kết hợp các phong cách nghệ thuật khác nhau để tạo ra các tác phẩm độc đáo và sáng tạo. Ví dụ, bạn có thể kết hợp chủ nghĩa ấn tượng và siêu thực hoặc kết hợp các kỹ thuật hội họa truyền thống với nghệ thuật kỹ thuật số.
Ví dụ câu lệnh:
"A painting of a cityscape in a blend of cubism and surrealism styles"
"Một bức tranh phong cảnh đô thị kết hợp phong cách lập thể và siêu thực"
3. Hiểu về những giới hạn của AI trong nghệ thuật
Điều quan trọng là phải hiểu những gì AI có thể và không thể làm. Bạn cần hiểu những giới hạn này để thiết lập kỳ vọng thực tế và tạo ra các câu lệnh hiệu quả.
Xử lý độ phức tạp: AI có thể gặp khó khăn trong việc xử lý các cảnh hoặc chi tiết rất phức tạp.
Sự nhạy cảm về văn hóa: AI có thể tạo ra các kết quả nhạy cảm về văn hóa hoặc không phù hợp nếu không có hướng dẫn thích hợp.
Chi tiết sáng tạo: AI có thể bắt chước phong cách nhưng có thể không thể hiện đầy đủ sự tinh tế của trí tưởng tượng con người.
4. Sử dụng các hình thức nghệ thuật truyền thống và hiện đại
Dall-E có thể được sử dụng hiệu quả với các hình thức nghệ thuật truyền thống (tranh sơn dầu, phác thảo) cũng như các hình thức nghệ thuật hiện đại (nghệ thuật kỹ thuật số, mô hình 3D).
Ví dụ câu lệnh:
"Tranh sơn dầu phong cảnh nông thôn yên bình theo phong cách ấn tượng"
Hiện đại:
"Mô hình render 3D của một thành phố tương lai"
5. Sao chép các phong cách nghệ thuật nổi tiếng
Sử dụng Dall-E để sao chép phong cách của các nghệ sĩ nổi tiếng và tạo ra các tác phẩm mới lấy cảm hứng từ các kiệt tác lịch sử.
Ví dụ câu lệnh:
"Chân dung phụ nữ theo phong cách Vincent van Gogh"
6. Tính nhất quán của nhân vật và kể chuyện
Điểm nổi bật của phần này là học cách duy trì tính nhất quán của nhân vật trong nhiều hình ảnh. Điều này rất quan trọng đối với việc kể chuyện.
Kỹ thuật nâng cao:
Hồ sơ nhân vật: Tạo hồ sơ nhân vật chi tiết bao gồm các thuộc tính thể chất, đặc điểm tính cách và câu chuyện hậu trường để duy trì tính nhất quán.
GPT tùy chỉnh để kể chuyện: Tạo GPT tùy chỉnh để đặt nhân vật vào các tình huống khác nhau, duy trì tính nhất quán và làm phong phú câu chuyện.
Ví dụ câu lệnh:
"Một loạt hình ảnh về một pháp sư trẻ đang phiêu lưu trong khu rừng ma thuật, duy trì tính nhất quán của nhân vật"
Kết luận
Phần này sẽ hướng dẫn bạn cách vượt qua giới hạn sáng tạo bằng Dall-E, cách kết hợp các phong cách nghệ thuật khác nhau, cách hiểu các hạn chế của AI và cách duy trì tính nhất quán của nhân vật để kể chuyện. Sau khi hoàn thành phần này, bạn sẽ có một sự hiểu biết toàn diện về việc sử dụng AI để tạo ra nghệ thuật.
Sử dụng Dall-E như một phương tiện nghệ thuật
Dall-E cho phép bạn thể hiện gần như mọi thứ như một phương tiện nghệ thuật. Theo truyền thống, khi nhiều người nghĩ về tác phẩm nghệ thuật, họ có thể nghĩ đến các bức tranh như Mona Lisa hoặc nghệ thuật trừu tượng hiện đại. Tuy nhiên, với Dall-E, bạn có thể mô phỏng các tác phẩm nghệ thuật được tạo ra từ các chất liệu phi truyền thống, vượt ra ngoài các phương tiện truyền thống như hội họa và vẽ tranh, chẳng hạn như chai nhựa, đồ trang sức, hoa, mây…
Ví dụ về câu lệnh: Chân dung chú chó Chihuahua
Đầu tiên, hãy bắt đầu với phong cách cổ điển nhất: tranh sơn dầu.
"A portrait of a Chihuahua in oil painting" 
"Một bức chân dung chú chó Chihuahua được vẽ bằng sơn dầu"
Tiếp theo, hãy chuyển sang tranh màu nước.
"A portrait of a Chihuahua in watercolor" 
"Một bức chân dung chú chó Chihuahua được vẽ bằng màu nước"
Chú chó Chihuahua phong cách tranh màu nước đang nở một nụ cười đáng yêu. Điều này là do dữ liệu huấn luyện của Dall-E, trong đó hầu hết các bức tranh màu nước đều thể hiện chú chó Chihuahua đang cười.
Tiếp theo là tranh acrylic.
"A portrait of a Chihuahua in acrylic" 
"Một bức chân dung chú chó Chihuahua được vẽ bằng sơn acrylic"
Bức chân dung acrylic thể hiện một phong cách vẽ rất sống động và hiện đại.
Tiếp theo là tranh mực Tàu.
"A portrait of a Chihuahua in ink wash" 
"Một bức chân dung chú chó Chihuahua được vẽ bằng mực Tàu"
Hãy chuyển sang bức chân dung được vẽ bằng phấn màu mềm mại.
"A portrait of a Chihuahua in soft pastel"
"Một bức chân dung chú chó Chihuahua được vẽ bằng phấn màu mềm"
Phấn màu mềm mại mang lại kết cấu bột hơn, giống như phấn, với màu sắc tươi sáng.
Còn bức chân dung được vẽ bằng bút chì màu thì sao?
"A portrait of a Chihuahua in crayon"
"Một bức chân dung chú chó Chihuahua được vẽ bằng bút chì màu"
Bút chì màu thường được sử dụng trong tranh vẽ của trẻ em, và phong cách đó được phản ánh rõ ràng ở đây.
Thử nghiệm với các phương tiện nghệ thuật khác
Phương tiện nghệ thuật không chỉ giới hạn ở hội họa và vẽ tranh. Ví dụ, bạn có thể sử dụng sứ, vật liệu điêu khắc truyền thống, v.v…
"A portrait of a Chihuahua made of porcelain"
"Một bức chân dung chú chó Chihuahua được làm bằng sứ"
Tiếp theo, hãy sử dụng các phương tiện nghệ thuật phi truyền thống.
"A portrait of a Chihuahua made from plastic bottles" 
"Một bức chân dung chú chó Chihuahua được làm từ chai nhựa"
Bạn có thể chỉnh sửa câu lệnh để có được kết quả tốt hơn. Hãy thử tạo một bức chân dung chú chó Chihuahua từ rác thải điện tử.
"A portrait of a Chihuahua made from electronic waste"
"Một bức chân dung chú chó Chihuahua được làm từ rác thải điện tử"
Bạn có thể đạt được kết quả rất sáng tạo. Vậy còn bức chân dung được làm từ gạo và ngũ cốc thì sao?
"A portrait of a Chihuahua made from rice and grain" 
"Một bức chân dung chú chó Chihuahua được làm từ gạo và ngũ cốc"
Bạn cũng có thể thêm các thuật ngữ mô tả để cải thiện hình ảnh.
Sau đây là bức chân dung chú chó Chihuahua được làm bằng vàng, bạc và kim cương.
"A portrait of a Chihuahua made of gold, silver, and diamonds" 
"Một bức chân dung chú chó Chihuahua được làm bằng vàng, bạc và kim cương"
Đây là bức chân dung chú chó Chihuahua đắt nhất mà chúng ta từng tạo ra. Vậy còn một bức chân dung chú chó Chihuahua được làm bằng nghệ thuật Latte art thì sao?
"A portrait of a Chihuahua in a coffee cup as latte art" 
"Một bức chân dung chú chó Chihuahua được tạo thành từ nghệ thuật Latte art trong một tách cà phê"
"A portrait of a Chihuahua in origami" 
"Một bức chân dung chú chó Chihuahua được làm bằng nghệ thuật gấp giấy Origami"
Kết luận
Dall-E cho phép bạn thử nghiệm với nhiều phương tiện nghệ thuật khác nhau để tạo ra các tác phẩm nghệ thuật độc đáo. Hãy để trí tưởng tượng của bạn bay cao và thử nghiệm với nhiều phương tiện khác nhau.
Các khái niệm nghệ thuật cơ bản và việc sử dụng Dall-E
Nếu bạn hiểu các khái niệm nghệ thuật cơ bản, bạn có thể tận dụng chúng khi sử dụng Dall-E. Mặc dù không cần phải tuân thủ nghiêm ngặt, nhưng việc biết những từ khóa nào hiệu quả sẽ giúp bạn dễ dàng tạo ra hình ảnh như mong muốn. Bây giờ, chúng ta sẽ thử nghiệm điều này bằng cách sử dụng ChatGPT.
Ví dụ: Phong cách chiếu sáng
Đầu tiên, tôi yêu cầu ChatGPT liệt kê các phong cách chiếu sáng phổ biến nhất trong nghệ thuật thị giác, sau đó mô tả từng phong cách bằng một câu. Sau đó, tôi yêu cầu nó giúp tôi tạo từng hình ảnh một. Tôi đã cung cấp một mẫu với chủ đề "Bức tranh sơn dầu về một người đàn ông Trung Quốc 30 tuổi có râu", và thêm phong cách chiếu sáng vào để bổ sung mô tả.
"Oil painting of a 30-year-old Chinese man with a beard, natural lighting" 
"Bức tranh sơn dầu về một người đàn ông Trung Quốc 30 tuổi có râu, với ánh sáng tự nhiên"
Phân tích kết quả
Ánh sáng tự nhiên (Natural Lighting): Mô phỏng ánh sáng tự nhiên dịu nhẹ và tán xạ.
Ánh sáng định hướng (Directional Lighting): Tạo ra độ tương phản mạnh.
Ánh sáng mềm mại (Soft Lighting): Tạo ra ánh sáng dịu nhẹ và tán xạ với tối thiểu bóng tối.
Ánh sáng mạnh (Hard Lighting): Ánh sáng mạnh và trực tiếp với bóng tối sắc nét, độ tương phản cao.
Ánh sáng ngược (Back Lighting): Tạo hiệu ứng bóng mờ.
Ánh sáng bên (Side Lighting): Nhấn mạnh kết cấu và chiều sâu.
Ánh sáng trên (Top Lighting): Tạo cảm giác tươi sáng, nhấn mạnh các đặc điểm phía trên.
Ánh sáng dưới (Under Lighting): Chiếu sáng từ phía dưới.
Kết quả trực quan
Trong số các hình ảnh được tạo ra bằng ChatGPT, một số hình ảnh không thể hiện đúng ánh sáng, ví dụ như ánh sáng dưới, điều này cho thấy một số từ khóa cụ thể không hiệu quả trong trường hợp này. Tuy nhiên, hầu hết các phong cách chiếu sáng đều hiệu quả.
Ví dụ: Thuật ngữ phối cảnh
Tiếp theo, chúng ta sẽ thử tạo hình ảnh bằng cách sử dụng phối cảnh. Sử dụng cùng một mẫu, tôi yêu cầu ChatGPT hiển thị các phối cảnh phổ biến nhất và viết câu lệnh cho Dall-E.
"Digital painting of a futuristic treehouse in the middle of a jungle, one-point perspective" 
"Bức tranh kỹ thuật số về một ngôi nhà cây tương lai giữa rừng rậm, phối cảnh một điểm tụ"
Phân tích kết quả
Phối cảnh một điểm tụ (One-Point Perspective): Có một điểm tụ, các đường thẳng song song hội tụ tại điểm tụ.
Phối cảnh hai điểm tụ (Two-Point Perspective): Có hai điểm tụ, được sử dụng để miêu tả các vật thể có góc cạnh trong không gian.
Phối cảnh ba điểm tụ (Three-Point Perspective): Thêm một điểm tụ ở trên hoặc dưới cho phối cảnh hai điểm tụ.
Góc nhìn chim (Bird's Eye View): Quan sát từ góc độ cao.
Góc nhìn sâu bọ (Worm's Eye View): Quan sát từ góc độ rất thấp.
Góc nhìn mắt cá (Fish-Eye Perspective): Quan sát tất cả các chiều song song.
Phối cảnh đẳng cự (Isometric Perspective): Tất cả các chiều đều song song, thường được sử dụng trong trò chơi điện tử trên thiết bị di động.
Kết quả trực quan
Một số hình ảnh được tạo ra bằng phối cảnh có thể không đáp ứng được kỳ vọng. Ví dụ, phối cảnh hai điểm tụ và ba điểm tụ có thể không được thể hiện tốt. Tuy nhiên, trong hầu hết các trường hợp, nó hoạt động hiệu quả.
Kết luận
Việc hiểu một số khái niệm nghệ thuật cơ bản rất hữu ích khi tạo hình ảnh bằng Dall-E sử dụng ánh sáng và phối cảnh.
Hiểu về màu sắc và bố cục
Khi sử dụng Dall-E, màu sắc và bố cục ảnh hưởng rất lớn đến tính thẩm mỹ và không khí tổng thể của hình ảnh. Hiểu được điều này sẽ giúp bạn tạo ra các câu lệnh hiệu quả hơn và tạo nên những tác phẩm nghệ thuật khác biệt.
Sử dụng phương pháp tương tự như trước, tôi đã yêu cầu ChatGPT cung cấp năm bảng màu phổ biến nhất. Sau đó, tôi đã yêu cầu nó tạo ra hình ảnh dựa trên tông màu.
"Low angle view of Tokyo Tower in the style of manga, vibrant and diverse colors"
"망가 스타일로 그린 도쿄 타워의 저각도 뷰, 다채롭고 다양한 색상"
Bảng màu
Màu sắc tươi sáng và đa dạng (Vibrant and Diverse Colors): Xanh điện, hồng tươi, xanh lá neon, vàng sáng, đỏ rực.
Màu ấm và phong phú (Warm and Rich Colors): Cam đậm, đỏ tươi, vàng óng ánh, nâu đất.
Màu mát mẻ và tĩnh lặng (Cool and Serene Colors): Xanh dương đậm, xanh lá nhạt, tím nhạt, xanh dương nhạt.
Màu pastel và mềm mại (Pastel and Soft Colors): Tất cả các màu sắc đều ở phiên bản nhạt hơn.
Màu đơn sắc và tinh tế (Monochromatic and Subtle Colors): Nhiều sắc thái của màu xám, trắng sữa, đen đậm.
Lời nhắc: "Low angle view of Tokyo Tower in the style of manga, energetic color tones" Dịch: "Góc nhìn thấp của tháp Tokyo theo phong cách manga, tông màu năng động"
Tông màu
Tông màu năng động (Energetic Color Tones): Đỏ và cam tươi sáng, bao gồm cả những đám mây chuyển động nhanh.
Tông màu tĩnh lặng (Calm Color Tones): Xanh dương và xanh lá nhạt.
Tông màu huyền bí (Mystery Color Tones): Tím và xanh đậm.
Tông màu lãng mạn (Romantic Color Tones): Hồng và đỏ nhạt.
Tông màu u ám (Somber Color Tones): Xám đậm và đen.
Bố cục
Bố cục không dễ dàng như màu sắc. Một số khái niệm khá trừu tượng và khó cho Dall-E xử lý. Tuy nhiên, tôi sẽ chỉ cho bạn những bố cục chính.
"Landmark in the style of 3D cartoon, rule of thirds composition" 
"3D 만화 스타일로 그린 랜드마크, 삼등분 구성"
Các bố cục phổ biến
Quy tắc một phần ba (Rule of Thirds): Các yếu tố chính được đặt ở các điểm giao nhau.
Đối xứng và hoa văn (Symmetry and Patterns): Cân bằng trung tâm và đối xứng.
Đường dẫn hướng (Leading Lines): Hướng mắt nhìn đến đường chân trời.
Khung trong khung (Frame within a Frame): Thường được sử dụng trong nhiếp ảnh và các tác phẩm nghệ thuật khác.
Bố cục đường chéo (Diagonal Composition): Tạo ra chuyển động.
Tỷ lệ vàng (Golden Ratio): Có thể không chính xác.
Bố cục tập trung (Centered Composition): Tập trung vào trung tâm.
Lấp đầy khung hình (Fill the Frame): Nhấn mạnh chi tiết.
Khoảng trống tiêu cực (Negative Space): Biểu đạt chủ nghĩa tối giản.
Kết luận
Màu sắc và bố cục hiệu quả trong Dall-E ảnh hưởng rất lớn đến không khí và tính thẩm mỹ của hình ảnh. Sử dụng tốt các yếu tố khác nhau như ánh sáng, phối cảnh, màu sắc…sẽ giúp bạn có được kết quả tốt hơn.
Sử dụng các phong trào nghệ thuật lịch sử
Tái tạo tác phẩm nghệ thuật theo phong cách của các phong trào nghệ thuật nổi tiếng trong lịch sử là một trải nghiệm thú vị. Tin tốt là Dall-E đã được huấn luyện tốt với các tác phẩm nghệ thuật lịch sử. Trong nhiều trường hợp, chỉ cần sử dụng đúng thuật ngữ, bạn có thể biến chủ đề của mình thành một kiệt tác nghệ thuật lịch sử. Hãy cùng khám phá hành trình nghệ thuật kéo dài hàng chục nghìn năm.
Trong bài hướng dẫn này, chúng ta sẽ sử dụng Image Creator vì các câu lệnh đơn giản và dễ so sánh kết quả. Chủ đề của chúng ta là chó Corgi và chúng ta sẽ khám phá các phong cách của các phong trào nghệ thuật nổi tiếng.
Chúng ta bắt đầu với tranh vẽ hang động.
"Prehistoric cave painting of a corgi smiling"
"Tranh vẽ hang động thời tiền sử về một chú chó corgi đang cười"
Bây giờ, hãy cùng đến với Ai Cập cổ đại.
"Ancient Egyptian mural of a smiling corgi. Year 3000 BC"
"Tranh tường Ai Cập cổ đại về một chú chó corgi đang cười. Năm 3000 trước Công nguyên"
Đây rồi. Chú chó corgi giờ đây đã xuất hiện trên bức tranh tường Ai Cập. Phong cách tranh khá giống và phù hợp với bối cảnh.
Phong cách khảm của Hy Lạp thì sao?
"Ancient Greek mosaic of a smiling corgi. Year 600 BC"
"Khảm của Hy Lạp cổ đại về một chú chó corgi đang cười. Năm 600 trước Công nguyên"
Đây rồi. Nó có giống với những tác phẩm khảm được bảo quản tốt trong bảo tàng không?
Hãy tiếp tục đến với thời kỳ La Mã.
"Ancient Roman sculpture of a smiling corgi"
"Tác phẩm điêu khắc La Mã cổ đại về một chú chó corgi đang cười"
Đây rồi. Bốn bức tượng bằng đá cẩm thạch đáng yêu của chú chó corgi.
Bây giờ, hãy đến với Trung Quốc cổ đại, cụ thể là thời nhà Đường.
"Chinese ink painting of a smiling corgi. Tang dynasty"
"Tranh mực Trung Quốc về một chú chó corgi đang cười. Thời nhà Đường"
Tuyệt vời. Bây giờ chúng ta đã có bốn bức tranh mực, rất phù hợp với bối cảnh và phong cách tranh mực, kết hợp với thư pháp.
Hãy đến với nước Ý thời trung cổ, cụ thể là thế kỷ thứ 10.
"Medieval painting of a smiling corgi. 10th century Italy"
"Tranh thời trung cổ về một chú chó corgi đang cười. Thế kỷ 10, Ý"
Đây rồi. Chúng ta đã có bốn bức tranh về chú chó corgi đang cười theo phong cách hội họa thời trung cổ.
Bây giờ, hãy đến với thời kỳ Phục Hưng thế kỷ 15.
"Renaissance painting of a smiling corgi"
"Tranh Phục Hưng về một chú chó corgi đang cười"
Đây rồi. Mặc dù không phải do Da Vinci vẽ, nhưng nó vẫn thể hiện sự kết hợp đặc trưng của phong cách Phục Hưng.
Hãy đến với cuối thế kỷ 18, thời kỳ ra đời của chủ nghĩa Lãng mạn. Và chúng ta sẽ thay đổi địa điểm sang Pháp.
"Romanticism painting of a smiling corgi"
"Tranh Lãng mạn về một chú chó corgi đang cười"
Bây giờ, hãy đến với Chủ nghĩa hiện thực.
"Realism painting of a smiling corgi"
"Tranh Hiện thực về một chú chó corgi đang cười"
Bây giờ, hãy đến với trường phái Ấn tượng.
"Impressionism painting of a smiling corgi"
"Tranh Ấn tượng về một chú chó corgi đang cười"
Bây giờ, hãy chuyển sang nghệ thuật hiện đại và đương đại.
"Cubism painting of a smiling corgi"
"Tranh Lập thể về một chú chó corgi đang cười"
Đây rồi. Bạn có thể thấy sự độc đáo của trường phái Lập thể.
Bây giờ, hãy đến với trường phái Siêu thực.
"Surrealism painting of a smiling corgi"
"Tranh Siêu thực về một chú chó corgi đang cười"
Đây rồi. Bối cảnh siêu thực và các đặc điểm được phóng đại.
Tiếp theo là trường phái tối giản.
"Minimalism painting of a smiling corgi"
"Tranh Tối giản về một chú chó corgi đang cười"
Đây rồi. Hình ảnh này hoàn toàn phù hợp với trường phái Tối giản.
Bây giờ, hãy đến với trường phái Hậu hiện đại.
"Postmodernism painting of a smiling corgi"
"Tranh Hậu hiện đại về một chú chó corgi đang cười"
Đây rồi. Bạn có thể thấy sự pha trộn của nhiều phong cách khác nhau.
Cuối cùng, hãy thử với Ukiyo-e.
"Ukiyo-e painting of a smiling corgi"
"Tranh Ukiyo-e về một chú chó corgi đang cười"
Kết luận
Bạn có thể sử dụng nhiều phong cách nghệ thuật khác nhau để tạo ra những hình ảnh độc đáo với Dall-E. Sử dụng các đặc điểm của các phong trào nghệ thuật lịch sử có thể mang lại những kết quả tuyệt vời. Điều này cho phép bạn tạo ra những hình ảnh sáng tạo và khác biệt.
Truyện tranh, truyện tranh Nhật Bản là những yếu tố quan trọng của thời hiện đại (Cartoons, Comics, and Manga are Important Elements of Modern Times)
Truyện tranh không chỉ đơn thuần là nội dung dành cho trẻ em mà còn bao gồm nhiều chủ đề và đối tượng khán giả khác nhau. Dall-E có khả năng mạnh mẽ trong việc tạo ra những câu chuyện hình ảnh này, nhưng người dùng thường có xu hướng lặp lại các kiểu cơ bản. Tuy nhiên, chỉ với một vài từ khóa, bạn vẫn có thể tạo ra những tác phẩm sáng tạo và khác biệt.
Hãy thử với một chủ đề đơn giản: 'Gấu trúc theo phong cách hoạt hình'.
"A panda in the style of a cartoon"
"Gấu trúc theo phong cách hoạt hình"
Bây giờ, hãy thay đổi thành 'Gấu trúc theo phong cách truyện tranh'.
"A panda in the style of a comic"
"Gấu trúc theo phong cách truyện tranh"
Bây giờ, hãy thay đổi thành 'Gấu trúc theo phong cách manga'.
"A panda in the style of manga"
"Gấu trúc theo phong cách manga"
Những từ khóa rộng rãi ở trên không lý tưởng để tạo ra sự khác biệt cho các tác phẩm. Hãy thử làm cho nó cụ thể hơn.
"A panda in the style of 3D cartoon"
"Gấu trúc theo phong cách hoạt hình 3D"
Đây là một nhân vật hoạt hình dễ thương.
Bây giờ, hãy thử với 'Gấu trúc theo phong cách manga 3D'.
"A panda in the style of 3D manga"
"Gấu trúc theo phong cách manga 3D"
Đây rồi. Nó chắc chắn có một bối cảnh thú vị và độc đáo hơn.
Bây giờ, hãy thử với 'Gấu trúc theo phong cách CGI'. CGI là viết tắt của Computer-Generated Imagery (Hình ảnh do máy tính tạo ra).
"A panda in the style of CGI"
"Gấu trúc theo phong cách CGI"
Đây rồi. Ngoại trừ hình ảnh đầu tiên, những hình ảnh còn lại trông giống như những nhân vật bạn có thể thấy trong phim hoặc trò chơi điện tử.
Bây giờ, hãy tiếp tục khám phá phong cách manga.
"A panda in the style of classic manga"
"Gấu trúc theo phong cách manga cổ điển"
Đây rồi. Phong cách này không quá rõ ràng với gấu trúc, nhưng có thể hiệu quả hơn với nhân vật người.
Bây giờ, hãy thử với 'Gấu trúc theo phong cách manga Kodomo'. Manga Kodomo là phong cách truyện tranh dành cho trẻ em.
"A panda in the style of kodomo manga"
"Gấu trúc theo phong cách manga Kodomo"
Đây rồi. Chắc chắn đây là phong cách dành cho trẻ em.
Tiếp theo, hãy thử với 'Phong cách hoạt hình cũ'.
"A panda in the style of old cartoon"
"Gấu trúc theo phong cách hoạt hình cũ"
Đây rồi. Một phong cách hoạt hình gợi nhớ đến quá khứ.
Bây giờ, hãy thử với 'Gấu trúc theo phong cách hoạt hình hiện đại'.
"A panda in the style of modern cartoon"
"Gấu trúc theo phong cách hoạt hình hiện đại"
Đây rồi. Hiển thị phong cách hoạt hình hiện đại.
Từ khóa liên quan đến một thời kỳ cụ thể hoạt động không hiệu quả với truyện tranh, nhưng lại hiệu quả với truyện tranh Nhật Bản. Tiếp theo, hãy thêm một cuộc trò chuyện giữa gấu trúc và hổ theo phong cách truyện tranh những năm 1920.
Đây rồi.
"A panda talking to a tiger in the style of 1920s comics"
"Gấu trúc trò chuyện với hổ theo phong cách truyện tranh những năm 1920"
Đây rồi. Phong cách rất tốt, nhưng cuộc trò chuyện lại vô nghĩa.
"A panda talking to a tiger, written 'hi mate' in the style of 1920s comic"
"Gấu trúc trò chuyện với hổ, viết 'hi mate' theo phong cách truyện tranh những năm 1920"
Đây rồi. Có một vài lỗi chính tả, nhưng có thể sửa lại bằng cách lặp lại.
Tiếp theo, hãy khám phá phong cách truyện tranh những năm 1950, 1980 và 2010.
"A panda in the style of 1950s comics"
"Gấu trúc theo phong cách truyện tranh những năm 1950"
"A panda in the style of 1980s comics"
"Gấu trúc theo phong cách truyện tranh những năm 1980"
"A panda in the style of 2010s comics"
"Gấu trúc theo phong cách truyện tranh những năm 2010"
Mỗi thời đại của truyện tranh đều có những đặc điểm riêng.
Cuối cùng, hãy xem qua một vài từ khóa thể loại. Có hàng trăm chủ đề truyện tranh và truyện tranh Nhật Bản, mỗi chủ đề đều có những đặc điểm riêng. Ở đây, chỉ có một vài ví dụ phổ biến được đề cập.
Đầu tiên là 'Phong cách hoạt hình cyberpunk'.
"A panda in the style of cyberpunk cartoon"
"Gấu trúc theo phong cách hoạt hình cyberpunk"
Đây rồi. Nó trông giống như một nhân vật AI trong tương lai phải không?
Tiếp theo là 'Phong cách hoạt hình giả tưởng'.
"A panda in the style of fantasy cartoon"
"Gấu trúc theo phong cách hoạt hình giả tưởng"
Đây rồi. Hai nhân vật hạnh phúc từ một bộ phim hoạt hình dành cho trẻ em.
Bây giờ, hãy thử với 'Phong cách hoạt hình khoa học viễn tưởng'.
"A panda in the style of sci-fi cartoon"
"Gấu trúc theo phong cách hoạt hình khoa học viễn tưởng"
Tương tự như cyberpunk, nhưng hình ảnh khoa học viễn tưởng chắc chắn mang lại cảm giác hạnh phúc và hài hước hơn.
Chủ đề phổ biến tiếp theo là 'Lãng mạn'.
"A panda and a tiger in the style of romance cartoon"
"Gấu trúc và hổ theo phong cách hoạt hình lãng mạn"
Đây rồi. Như bạn mong đợi, chúng đang yêu nhau.
Tiếp theo là 'Phong cách hoạt hình kinh dị'.
"A panda in the style of horror cartoon"
"Gấu trúc theo phong cách hoạt hình kinh dị"
Tiếp theo, hãy thử với 'Phong cách manga hậu tận thế'.
"A panda in the style of post-apocalyptic manga"
"Gấu trúc theo phong cách manga hậu tận thế"
"A panda and a tiger in the style of post-apocalyptic manga in 3D"
"Gấu trúc và hổ theo phong cách manga hậu tận thế 3D"
Tiếp theo là 'Hoạt hình 3D theo phong cách truyện tranh hình sự'.
"A panda in the style of 3D cartoon often used in crime stories"
"Gấu trúc theo phong cách hoạt hình 3D thường được sử dụng trong các câu chuyện hình sự"
Cuối cùng là 'Hoạt hình 3D theo phong cách manga Kodomo'.
"A panda in the style of kodomo manga in 3D"
"Gấu trúc theo phong cách manga Kodomo 3D"
Bạn có thể biết nên sử dụng từ khóa nào nếu muốn tạo ra câu chuyện dành cho trẻ em.
Kết luận
Như bạn thấy trong bản demo này, từ khóa chỉ định kiểu dáng hiệu quả hơn nhiều so với các thuật ngữ chung chung. Để tạo ra một câu chuyện hình ảnh hay, bạn cần nhiều hình ảnh chứ không chỉ một, và cũng cần các nhân vật nhất quán.
Sử dụng Generative AI để tạo ra các nhân vật nhất quán (Creating Consistent Characters with Generative AI Tools)
Việc tạo ra các nhân vật nhất quán và kể chuyện bằng hình ảnh với công cụ Generative AI như DALL-E không dễ dàng, nhưng với sự phát triển của công nghệ và việc viết prompt cẩn thận, chúng ta có thể đạt được mức độ nhất quán cao. Điều này cần đến ba yếu tố chính:
Mô tả chi tiết và độc đáo về nhân vật chính (Ví dụ: Một con khủng long bạo chúa lông hồng với cà vạt nơ vàng).
Phong cách hình ảnh nhất quán (Ví dụ: Phong cách hoạt hình phiêu lưu 3D).
Sự nhất quán về bối cảnh và thiết lập của câu chuyện (Ví dụ: Năm 200 trước Công nguyên).
Để duy trì tính nhất quán, chúng ta cần sử dụng các prompt ngắn gọn và có thể lặp lại, và có thể sử dụng số seed để xác định một số hình ảnh tham chiếu, nhưng việc đảm bảo tính nhất quán hoàn toàn của nhân vật vẫn khó khăn.
Prompt:
"Tạo ba hình ảnh phong cảnh với các prompt DALL-E chính xác dưới đây mà không cần sửa đổi gì."
"Create three images in landscape with the exact Dall-E prompts below without modifying anything."
"Số một: Một con khủng long bạo chúa trong phim hoạt hình phiêu lưu 3D."
"Number one A T-Rex 3D adventure cartoon."
"Số hai: Một con khủng long bạo chúa lông hồng với đôi mắt xanh và cà vạt nơ vàng."
"Number two a pink furry T-Rex with blue eyes and a gold bow tie."
"Số ba: Một con khủng long bạo chúa lông hồng với đôi mắt xanh và cà vạt nơ vàng trong một khu rừng tiền sử, phong cách hoạt hình phiêu lưu 3D."
"Number three A pink furry T-Rex with blue eyes and a gold bow tie in a prehistoric jungle 3D adventure cartoon."
Kết quả: Prompt đầu tiên không có mô tả cụ thể, vì vậy nó cho thấy kiểu khủng long bạo chúa cơ bản. Prompt thứ hai cho thấy một con khủng long bạo chúa lông hồng với đôi mắt xanh, nhưng phong cách không rõ ràng, trông giống như đồ chơi. Prompt thứ ba cung cấp phong cách và bối cảnh cụ thể, tạo ra một nhân vật nhất quán.
Chúng ta hãy thử thêm ba hành động bằng prompt cơ bản. Khủng long bạo chúa chạy nhanh, nhảy qua sông và ngủ dưới tảng đá.
Prompt:
"Một con khủng long bạo chúa lông hồng với đôi mắt xanh và cà vạt nơ vàng đang chạy nhanh trong một khu rừng tiền sử, phong cách hoạt hình phiêu lưu 3D."
"A pink furry T-Rex with blue eyes and a gold bow tie running fast in a prehistoric jungle 3D adventure cartoon."
"Một con khủng long bạo chúa lông hồng với đôi mắt xanh và cà vạt nơ vàng đang nhảy qua sông trong một khu rừng tiền sử, phong cách hoạt hình phiêu lưu 3D."
"A pink furry T-Rex with blue eyes and a gold bow tie jumping over a river in a prehistoric jungle 3D adventure cartoon."
"Một con khủng long bạo chúa lông hồng với đôi mắt xanh và cà vạt nơ vàng đang ngủ dưới một tảng đá trong một khu rừng tiền sử, phong cách hoạt hình phiêu lưu 3D."
"A pink furry T-Rex with blue eyes and a gold bow tie sleeping under a rock in a prehistoric jungle 3D adventure cartoon."
Kết quả: Cả ba hình ảnh đều có các yếu tố chính phù hợp. Khủng long bạo chúa lông hồng, mắt xanh, cà vạt nơ vàng, phong cách hoạt hình phiêu lưu 3D và bối cảnh rừng tiền sử được giữ nguyên.
Hãy thử thêm yếu tố mới. Khủng long bạo chúa nói chuyện với voi và chơi với hươu cao cổ.
Prompt:
"Một con khủng long bạo chúa lông hồng với đôi mắt xanh và cà vạt nơ vàng đang nói chuyện với một con voi trong một khu rừng tiền sử, phong cách hoạt hình phiêu lưu 3D."
"A pink furry T-Rex with blue eyes and a gold bow tie speaking to an elephant in a prehistoric jungle 3D adventure cartoon."
"Một con khủng long bạo chúa lông hồng với đôi mắt xanh và cà vạt nơ vàng đang chơi với một con hươu cao cổ trong một khu rừng tiền sử, phong cách hoạt hình phiêu lưu 3D."
"A pink furry T-Rex with blue eyes and a gold bow tie playing with a giraffe in a prehistoric jungle 3D adventure cartoon."
Kết quả: Phong cách nhất quán được duy trì, và bằng cách thử nhiều lần, chúng ta có thể thu được kết quả hoàn hảo hơn.
Kết luận
Bí quyết để tạo ra các nhân vật nhất quán là duy trì mô tả nhất quán và sử dụng phương pháp tiếp cận lặp đi lặp lại. Mặc dù vẫn cần nhiều công việc thủ công để phát triển một cuốn sách tranh, nhưng bằng cách sử dụng ChatGPT và Dall-E, chúng ta có thể tạo ra các nhân vật và câu chuyện nhất quán hơn.
Cách sử dụng Seed Number trong Prompt Tạo Ảnh
Đây là tài liệu hướng dẫn sử dụng seed number để tạo prompt hình ảnh, được cấu trúc thành từng bước. Mỗi bước sẽ minh họa cách sử dụng seed number, prompt được dùng, và cách cụ thể hóa hình ảnh.
1. Tổng quan và cách sử dụng Seed Number
Seed Number là một mã định danh duy nhất được sử dụng trong các công cụ tạo ảnh AI như DALL-E để tái tạo kết quả hình ảnh hoặc duy trì phong cách tương tự. Sử dụng cùng một seed number và chỉ thay đổi một vài yếu tố, bạn có thể tạo ra các hình ảnh có chủ đề và cảm xúc tương tự nhau một cách nhất quán.
2. So sánh ví dụ Prompt và kết quả hình ảnh
Ví dụ 1: Hiệp sĩ tập sự (Seed Number: 1877633670)
Prompt:
"Hiệp sĩ tập sự trẻ tuổi, phong cách manga Nhật Bản, áo giáp bằng da"
Mô tả kết quả: Hình ảnh cơ bản của một hiệp sĩ tập sự mặc áo giáp da được tạo ra. Seed number 1877633670 giúp duy trì phong cách và cảm xúc nhất định, cho phép phát triển hình ảnh ở các bước tiếp theo.
Cách tìm Seed Number
Cho tôi biết seed number của hình ảnh này

ChatGPT trả lời: Seed number của hình ảnh là 1877633670. Nếu bạn có thắc mắc gì khác, cứ hỏi nhé!
Ví dụ 2: Hiệp sĩ trung cấp (Seed Number: 1273054624)
Prompt:
"Hiệp sĩ trung cấp, seed number 1877633670, phong cách manga Nhật Bản, áo giáp xích."
Mô tả kết quả: Seed number 1273054624 giúp duy trì sự liên tục về phong cách với hình ảnh hiệp sĩ tập sự, đồng thời bổ sung áo giáp xích để mô tả một hiệp sĩ trung cấp.
A full-body illustration of a young apprentice knight in a Japanese manga style. The knight is wearing basic leather armor, depicting a blend of traditional and fantasy elements. The character is posed dynamically, showcasing their determination and readiness for adventure. The background is minimal, focusing on the knight's details, emphasizing the vibrant colors and intricate line work typical of anime character design.
Ví dụ 3: Hiệp sĩ cấp cao (Seed Number: 2460293365)
Prompt:
"Hiệp sĩ cấp cao, seed number 1877633670, phong cách manga Nhật Bản, áo giáp toàn thân."
Mô tả kết quả: Sử dụng seed number 2460293365 để thể hiện hình ảnh mạnh mẽ hơn, tạo ra hình ảnh của một hiệp sĩ cấp cao mặc áo giáp toàn thân.
Ví dụ 4: Cảnh chiến đấu (Seed Number: 2207107498)
Prompt:
"Cảnh chiến đấu của hiệp sĩ cấp cao, phong cách manga Nhật Bản, áo giáp toàn thân. Khẩu độ hẹp, tốc độ cửa trập nhanh, ISO thấp. Thể hiện khoảnh khắc chiến đấu năng động và căng thẳng."
Mô tả kết quả: Duy trì bối cảnh tương tự nhưng thêm cảnh chiến đấu để tạo ra hình ảnh sống động hơn. Seed number 2207107498 được sử dụng để thể hiện cảnh chiến đấu của cùng một hiệp sĩ cấp cao, giữ được sự nhất quán về không khí.
DALL-E 프롬프트북
온라인 전자책 형식의 DALL-E 이미지 갤러리
DALL-E로 생성한 다양한 이미지와 프롬프트 예시 제공
pitch.com
The DALL·E 2 prompt book
Tạo hình ảnh bằng MidJourney
MidJourney là một công cụ mạnh mẽ sử dụng công nghệ AI để tạo ra những hình ảnh tuyệt vời. Công cụ này hữu ích cho cả cá nhân và doanh nghiệp, mở rộng khả năng sáng tạo.
Chỉ cần nhập lệnh văn bản đơn giản, bạn có thể tạo ra những hình ảnh chuyên nghiệp và đẹp mắt.
Tạo hình ảnh với MidJourney
MidJourney là một công cụ tạo hình ảnh và nghệ thuật dựa trên trí tuệ nhân tạo, là một trong những công cụ tạo hình ảnh AI hàng đầu trên thị trường.
1. Đăng ký và đăng nhập MidJourney
Cách đăng ký và đăng nhập:
Truy cập trang web MidJourney: Truy cập MidJourney.
Tạo tài khoản: Nhấp vào nút "Join the Beta" hoặc "Sign Up" để tạo tài khoản.
Đăng nhập: Nếu bạn đã có tài khoản, nhấp vào "Login".
Ví dụ:
- Truy cập trang web MidJourney.
- Nhấp vào "Join the Beta" hoặc "Sign Up" để tạo tài khoản.
- Nếu bạn đã có tài khoản, nhấp vào "Login" để đăng nhập.
2. Chọn gói đăng ký MidJourney
MidJourney không cung cấp phiên bản dùng thử miễn phí, mà cung cấp các gói đăng ký trả phí bắt đầu từ $10/tháng. Bạn có thể chọn gói phù hợp với nhu cầu của mình.
Chọn gói đăng ký:
Truy cập trang gói đăng ký: Sau khi đăng nhập, xem các tùy chọn gói đăng ký khác nhau.
Chọn gói: Chọn gói phù hợp với nhu cầu của bạn.
3. Kết nối với Discord
MidJourney sử dụng Discord để thực hiện việc tạo hình ảnh. Bạn cần tạo tài khoản Discord và tham gia máy chủ MidJourney.
Kết nối với Discord:
Đăng ký Discord: Tạo tài khoản trên trang web Discord.
Tham gia máy chủ MidJourney: Tham gia máy chủ MidJourney thông qua liên kết mời trên trang web MidJourney hoặc trong Discord.
Dán hoặc nhập URL sau: http://discord.gg/midjourney và nhấn Join.
4. Tạo hình ảnh
Sau khi tham gia máy chủ MidJourney, bạn có thể bắt đầu tạo hình ảnh. Khuyến nghị bắt đầu từ kênh #newbies.
Các bước tạo hình ảnh:
Chuyển đến kênh #newbies: Di chuyển đến kênh #newbies trong máy chủ Discord của MidJourney.
Nhập câu lệnh: Sử dụng lệnh /imagine để nhập câu lệnh mô tả hình ảnh bạn muốn tạo.
Tạo hình ảnh: AI sẽ tạo hình ảnh dựa trên  câu lệnh.
5. Chọn hoặc tạo biến thể hình ảnh
Khi lưới hình ảnh ban đầu được tạo, sẽ xuất hiện hai dòng nút bên dưới.
U (Upscale): Nhấp vào nút upscale sẽ tăng độ phân giải của hình ảnh được chọn. Các tùy chọn như U1, U2, U3, U4 sẽ upscale hình ảnh thứ nhất, thứ hai, thứ ba và thứ tư trong bộ 4 hình ảnh được tạo. Quá trình này sẽ làm rõ hơn các chi tiết của hình ảnh và tăng độ phân giải, cho ra kết quả sắc nét hơn.

V (Variation): Nhấp vào nút biến thể sẽ tạo ra các biến thể khác nhau dựa trên hình ảnh được chọn. Các tùy chọn như V1, V2, V3, V4 sẽ tạo ra biến thể của hình ảnh thứ nhất, thứ hai, thứ ba và thứ tư trong bộ 4 hình ảnh được tạo. Điều này cho phép bạn giữ nguyên một số phong cách hoặc yếu tố của hình ảnh nhưng vẫn có thể thử nghiệm các phiên bản khác nhau.

Upscale (Subtle): Tăng độ phân giải của hình ảnh trong khi vẫn giữ nguyên các chi tiết và phong cách hiện có. Sử dụng khi muốn upscale hình ảnh một cách mềm mại và tự nhiên.

Upscale (Creative): Tăng độ phân giải của hình ảnh trong khi thêm các yếu tố sáng tạo và mới lạ. Sử dụng khi muốn thay đổi một chút so với hình ảnh gốc.

Vary (Subtle): Tạo ra các biến thể rất giống với hình ảnh gốc. Sử dụng khi muốn giữ nguyên phong cách và cấu trúc gần như giống với hình ảnh gốc, chỉ thay đổi một chút.

Vary (Strong): Tạo ra các biến thể khác biệt đáng kể so với hình ảnh gốc. Sử dụng khi muốn thay đổi nhiều và thử nghiệm các phiên bản khác nhau.

Vary (Region): Chỉ thay đổi một vùng cụ thể của hình ảnh. Chỉ thay đổi vùng được chọn, phần còn lại vẫn giữ nguyên.

Zoom Out: Mở rộng phông nền hoặc môi trường xung quanh của hình ảnh, hiển thị tầm nhìn rộng hơn. Sử dụng khi muốn mở rộng khung hình và bao gồm thêm các yếu tố.

Custom Zoom: Phóng to hoặc thu nhỏ hình ảnh theo tỷ lệ do người dùng tùy chỉnh. Sử dụng khi muốn điều chỉnh chi tiết hơn.

4 nút mũi tên (Move Up, Move Down, Move Left, Move Right): Di chuyển hình ảnh lên, xuống, trái, phải. Sử dụng khi muốn điều chỉnh khung hình của hình ảnh, ví dụ như di chuyển một phần cụ thể của hình ảnh vào trung tâm.
Tạo hình ảnh trên Midjourney.com
Tạo hình ảnh từ thanh hình ảnh
Hầu hết các trang web đều có một thanh hình ảnh ở phía trên. Để tạo hình ảnh, hãy nhập  câu lệnh và nhấn Enter.
Khi quá trình tạo hình ảnh hoàn tất, bạn có thể xem kết quả trong tab Tạo.
Tạo biến thể
Trong tab Tạo, bạn có thể xem tất cả các hình ảnh đã tạo. Nhấp vào hình ảnh bạn thích để mở hộp đèn, sau đó bạn có thể tạo các biến thể.
Hộp đèn có các công cụ bổ sung để chỉnh sửa và thử nghiệm hình ảnh chi tiết hơn. Tham khảo trang Phóng to, Khung lại, Vẽ lại để tìm hiểu thêm về các nút khác trong hộp đèn.
Thay đổi cài đặt
Sử dụng các nút trên thanh hình ảnh để thiết lập các tham số mặc định cho tất cả các  câu lệnh. Bạn có thể điều chỉnh tỷ lệ khung hình, phong cách, đa dạng hình ảnh, tốc độ tạo và ẩn danh.
Sử dụng hình ảnh trong  câu lệnh
Midjourney có thể sử dụng hình ảnh hiện có làm nguồn cảm hứng để tạo hình ảnh mới. Kéo và thả hình ảnh từ trang Khám phá hoặc hình ảnh bạn đã tạo vào thanh hình ảnh để sử dụng chúng làm tham chiếu phong cách cho  câu lệnh mới.
Có ba cách sử dụng hình ảnh:
Tham khảo phần Làm việc với Hình ảnh trên trang web để biết thêm thông tin về việc sử dụng hình ảnh tham chiếu.
Lưu và quản lý hình ảnh
Truy cập tab Lưu trữ để tải xuống, lọc và sắp xếp hình ảnh.
Bạn có thể lưu các hình ảnh cá nhân bằng các nút có sẵn. Bạn cũng có thể nhấp và kéo bên ngoài lưới để tải xuống theo lô.
Tham khảo trang Lưu trữ để biết thêm thông tin về các bộ lọc và tùy chọn khác.