ChatGPT đang dần trở thành công cụ Chatbot AI quen thuộc với nhiều người. Để giúp ích cho mọi người có thêm thông tin cũng như hướng dẫn sử dụng chi tiết các công cụ được tích hợp trong ChatGPT của OpenAI, AIChatGPT.vn chia sẻ loạt bài viết hướng dẫn sử dụng các Plugin tích hợp trong gói ChatGPT Plus. Hôm nay, sẽ là hướng dẫn chi tiết về công cụ tạo ảnh AI DALL-E 3.
Lưu ý: Những công cụ plugin mở rộng này chỉ được tích hợp trong gói trả phí ChatGPT Plus. Vì vậy, để sử dụng được bạn cần phải upgrade tài khoản ChatGPT. Tham khảo thêm dịch vụ nâng cấp tài khoản ChatGPT Plus tại link bên dưới:
Giới thiệu
ChatGPT không chỉ đơn thuần là chatbot A.I xử lý văn bản, nó còn được OpenAI phát triển và tích hợp nhiều tiện ích để tận dụng tối đa sức mạnh của trí tuệ nhân tạo. DALL-E là một công cụ mạnh mẽ được tích hợp để tạo ra hình ảnh A.I từ văn bản đầu vào. Đây là công cụ tương tự như những AI Tool dùng để vẽ tranh và tạo ảnh AI nổi tiếng khác như Stable Diffusion hay Midjourney,… Bây giờ, hãy đi sâu vào tìm hiểu về DALL-E và cách sử dụng của công cụ này ở bài viết bên dưới.
DALL-E 3 là gì?
DALL·E là một AI Image Generator (trình tạo ảnh trí tuệ nhân tạo AI) của OpenAI phát hành. DALL·E 3 là một phiên bản nâng cấp mới nhất so với DALL·E 2, cả về cách bạn sử dụng và chất lượng của những gì nó có thể tạo ra. Và một điều nữa là nó không còn là một ứng dụng độc lập nữa mà đã tích hợp vào ChatGPT. Vì vậy, nó có thể cạnh tranh với tất cả các trình tạo hình ảnh AI khác hiện có.
Bạn có thể tạo những hình ảnh độc đáo từ một vài câu nhắc prompt đơn giản trong ChatGPT với DALL-E3 – tính năng mới này hiện có sẵn cho người dùng Plus và Enterprise.
Video giới thiệu DALL-E 3
Những tính năng nổi bật của công cụ tạo ảnh AI DALL-E 3
DALL·E 3 hiểu được nhiều sắc thái và chi tiết hơn đáng kể so với các hệ thống trước đây, cho phép bạn dễ dàng chuyển tải ý tưởng của mình thành hình ảnh cực kỳ chính xác. DALL·E 3 thể hiện bước nhảy vọt về khả năng tạo ra hình ảnh tuân thủ chính xác văn bản bạn cung cấp.
Ngay cả với cùng một lời nhắc, DALL·E 3 vẫn mang lại những cải tiến đáng kể so với DALL·E 2.
DALL·E 3 được xây dựng nguyên gốc trên ChatGPT, cho phép bạn sử dụng ChatGPT làm đầu vào tạo ra các prompt và sàng lọc các lời nhắc. Chỉ cần yêu cầu ChatGPT khi bạn muốn thấy bất kỳ điều gì, từ một câu đơn giản đến một đoạn văn chi tiết.
Khi được gợi ý một ý tưởng, ChatGPT sẽ tự động tạo các lời nhắc chi tiết, phù hợp cho DALL·E 3 để biến ý tưởng của bạn thành hiện thực. Nếu bạn thích một hình ảnh cụ thể nhưng nó chưa hoàn toàn đúng, bạn có thể yêu cầu ChatGPT thực hiện chỉnh sửa chỉ bằng một vài từ.
DALL·E 3 có sẵn cho gói ChatGPT Plus và Enterprise. Giống như DALL·E 2, hình ảnh bạn tạo bằng DALL·E 3 là của bạn để sử dụng và bạn không cần sự cho phép của nhà phát hành để in lại, bán hoặc trao đổi chúng.
Tập trung vào sự an toàn, DALL·E 3 hạn chế khả năng tạo ra nội dung bạo lực, người lớn hoặc thù hận.
Kiểm soát quảng cáo, DALL·E 3 được thiết kế để từ chối các yêu cầu về hình ảnh theo phong cách của một nghệ sĩ đang sống. Giờ đây, người sáng tạo cũng có thể chọn không tham gia đào tạo hình ảnh của mình cho các mô hình tạo hình ảnh trong tương lai.
Cách dùng DALL·E 3 tạo ảnh AI trong ChatGPT Plus
Đầu tiên hãy đăng ký ChatGPT Plus
Hiện tại, DALL·E 3 chỉ khả dụng cho gói tài khoản ChatGPT Plus. Để có quyền truy cập vào nó, hãy đăng ký tài khoản ChatGPT, sau đó nâng cấp nó lên thành gói ChatGPT Plus với phí $20/tháng. Nếu bạn cảm thấy khó khăn cho việc nâng cấp này có thể sử dụng dịch vụ nâng cấp ChatGPT Plus trung gian uy tín, tham khảo thêm chi tiết tại link bên dưới:
Nếu bạn muốn trải nghiệm DALL·E 3 mà không cần đăng ký ChatGPT Plus, bạn cũng có thể dùng thử công cụ Bing Image Creator. Nó thì không thật sự linh hoạt với các prompt để tạo ảnh AI như trong ChatGPT nhưng cơ bản nó sử dụng cùng một mô hình. Nó được sử dụng miễn phí, mặc dù hình ảnh có thể mờ và mất nhiều thời gian hơn để trình tạo hình ảnh hiển thị theo lời nhắc của bạn.
Bắt đầu với DALL·E 3
Để truy cập DALL·E 3, hãy đi tới ChatGPT và di chuột qua tab GPT-4 ở đầu màn hình. Từ menu thả xuống, chọn công cụ DALL·E 3 Beta.
Sau đó, sử dụng DALL·E 3 cũng giống như sử dụng ChatGPT. Bạn có thể nhập lời nhắc văn bản thông thường hoặc tương tác với nó bằng ngôn ngữ tự nhiên. Mỗi lời nhắc sẽ giúp bạn có bốn hình ảnh khác nhau để lựa chọn.
Một điều khác biệt mà DALL·E 3 thực hiện đó là tự động cải tiến và lặp lại các lời nhắc của bạn. Nó cũng sử dụng lời nhắc hơi khác nhau cho mỗi hình ảnh trong số bốn hình ảnh mà nó tạo ra. Để xem DALL·E 3 dùng gì làm lời nhắc cho bất kỳ hình ảnh nào, chỉ cần nhấp vào nó. Những gì nó cố gắng tạo sẽ xuất hiện trong hộp Prompt.
Để tải xuống hình ảnh, hãy di chuột qua hình ảnh đó và nhấp vào biểu tượng tải xuống ở trên cùng bên trái.
Cách tương tác với DALL·E 3 bằng ChatGPT
Điều tuyệt vời nhất khi sử dụng DALL·E 3 là bạn có thể theo dõi các yêu cầu ngôn ngữ tự nhiên thông qua ChatGPT. Nếu có điều gì đó bạn không thích hoặc điều gì đó bạn muốn nhấn mạnh bằng các kết quả khác nhau, bạn có thể yêu cầu điều đó.
Một số gợi ý để bạn có thể sử dụng là:
- Yêu cầu thêm các biến thể của một hình ảnh cụ thể
- Thay đổi góc nhìn của từng hình ảnh
- Thay đổi vị trí chủ thể xuất hiện trong mỗi ảnh
- Thay đổi tỷ lệ khung hình của từng hình ảnh
- Thay đổi số lượng chủ thể trong mỗi ảnh
- Thêm, xóa và sửa đổi chi tiết chủ đề, như màu sắc và kích thước
- Thêm và xóa chi tiết nền
- Treo các tác phẩm được tạo ra trên tường phòng trưng bày.
Hiện tại, DALL·E 3 tạo lời nhắc mới dựa trên yêu cầu của bạn và sau đó tạo một bộ hình ảnh mới thay vì trực tiếp thực hiện chỉnh sửa. Đôi khi những thay đổi giữa hai hình ảnh sẽ nhỏ và chính xác như những gì bạn muốn. Nhưng đôi khi, DALL·E 3 cũng sẽ đưa ra những kết quả hình ảnh khác hoàn toàn so với ảnh ban đầu bạn yêu cầu nó chỉnh sửa.
Tuy nhiên, làm việc với DALL·E 3 để tinh chỉnh lời nhắc giúp bạn đạt được chính xác những gì bạn muốn dễ dàng và hiệu quả hơn nhiều so với việc dựa vào việc tạo hình ảnh thử nghiệm. DALL·E 3 cũng đưa ra những gợi ý thú vị và gợi nhiều liên tưởng hơn cho bạn.
Cách có kết quả tốt nhất với DALL·E 3
Mặc dù DALL·E 3 vẫn đang trong giai đoạn thử nghiệm nhưng có thể đạt được một số kết quả tuyệt vời với nó. Đặc biệt, DALL·E 3 rất xuất sắc trong việc tạo ra các bức vẽ, tranh vẽ và các loại tác phẩm nghệ thuật khác hơn là các hình ảnh chân thực. Dưới đây là một số điều cần lưu ý để giúp bạn đạt được kết quả tốt nhất.
Đưa ra lời nhắc chi tiết: Mặc dù DALL·E 3 giúp bạn dễ dàng sử dụng các lời nhắc đơn giản hơn, nhưng nếu bạn muốn một hình ảnh cụ thể, hãy thêm nhiều chi tiết vào lời nhắc của bạn.
DALL·E 3 hiểu được con số và vị trí: DALL·E 3 hiểu rõ hơn đáng kể về những thứ như số và vị trí của các phần tử khác nhau trong hình ảnh của bạn. Ví dụ: bạn có thể yêu cầu nó tạo ra thứ gì đó ở phía trước hoặc ở phía bên trái của hình ảnh và rất có thể nó sẽ làm điều đó. Tương tự như vậy, nếu bạn yêu cầu nó một số lượng cụ thể của một thứ gì đó, nó sẽ tạo ra hình ảnh đúng như yêu cầu của bạn.
Yêu cầu các biến thể: Nếu bạn yêu cầu DALL·E 3 thực hiện các biến thể dựa trên một trong các kết quả của nó, đôi khi nó có thể tạo ra những thay đổi khá lớn đối với lời nhắc ban đầu. Nếu bạn muốn nó giữ mọi thứ giống nhau hơn, hãy yêu cầu nó tạo ra “các biến thể”. Mặc dù điều này không ngăn nó tạo ra những hình ảnh hoàn toàn mới nhưng nó sẽ ít thay đổi những lời nhắc ban đầu hơn.
Thử nghiệm và so sánh: DALL·E 3 là một trong những trình tạo hình ảnh tốt nhất hiện có, nhưng bạn cũng nên tham khảo một số trình tạo ảnh khác để so sánh và hiểu được cấu trúc câu lệnh prompt cho ra kết quả tối ưu nhất. Một số công cụ tạo ảnh AI nổi bật khác mà bạn có thể tham khảo như: Stable Diffusion, Midjourney, Adobe Firefly,…
Một số câu hỏi thường gặp khi sử dụng DALL-E 3
DALL E-3 có bị giới hạn số lượng hình ảnh tạo ra không?
DALL·E 3 dường như có cùng giới hạn với GPT-4: bạn có thể gửi 50 yêu cầu mỗi ba giờ. Về lý thuyết, điều này có nghĩa là bạn có thể tạo ra hơn một nghìn hình ảnh mỗi ngày.
Tôi có thể sử dụng hình ảnh được tạo ra từ DALL E-3 cho mục đích thương mại không?
Có, Hình ảnh bạn tạo bằng DALL·E 3 là của bạn để sử dụng và bạn không cần sự cho phép của OpenAI để in lại, bán hoặc trao đổi chúng.
Sử dụng DALL E-3 có tốn phí không?
Có, để sử dụng được công cụ DALL E-3 tích hợp trong ChatGPT bạn phải nâng cấp lên gói dịch vụ ChatGPT Plus hoặc Enterprise. Bạn có thể tìm hiểu về dịch vụ upgrade chatgpt Plus tại đây. Tuy nhiên, bạn cũng có thể trải nghiệm thử miễn phí DALL E-3 thông qua công cụ tại ảnh AI được tích hợp trong Bing Image Creator.
DALL-E 3 có cung cấp API không?
Có, người dùng có thể gửi yêu cầu thông qua API được tích hợp trên các ứng dụng khác để tạo ra hình ảnh từ mô tả văn bản. API thường cung cấp các thông số đầu vào như mô tả văn bản và các thông số điều chỉnh cho quá trình tạo hình ảnh. Nhưng điều này có thể tốn phí.
DALL-E 3 có thể tạo ra hình ảnh từ bất kỳ mô tả nào không?
DALL-E 3 có khả năng tạo ra hình ảnh từ mô tả văn bản, nhưng khả năng tạo ra hình ảnh chính xác phụ thuộc vào dữ liệu mà nó được huấn luyện và khả năng hiểu các mô tả cụ thể.
Có hạn chế nào khi sử dụng DALL-E 3 không?
DALL-E 3 có thể gặp hạn chế trong việc hiểu các mô tả phức tạp, hoặc có thể tạo ra hình ảnh không chính xác nếu mô tả không rõ ràng hoặc quá phức tạp. Nó cũng có thể gặp vấn đề khi tạo ra hình ảnh với độ phân giải cao hoặc yêu cầu về chi tiết cụ thể.
DALL-E 3 sử dụng dữ liệu từ đâu để huấn luyện?
DALL-E 3 được huấn luyện trên một lượng lớn dữ liệu hình ảnh và văn bản từ trên internet. OpenAI đã thu thập và xử lý một lượng lớn dữ liệu để huấn luyện mô hình này.
Có cách nào để cải thiện chất lượng hoặc độ chính xác của hình ảnh được tạo bởi DALL-E 3 không?
Việc cải thiện chất lượng hình ảnh có thể được thực hiện bằng cách cung cấp mô tả văn bản rõ ràng và chi tiết hơn, cũng như việc thử nghiệm và điều chỉnh các tham số đầu vào khác nhau trong quá trình tạo hình ảnh.
Dữ liệu của DALL-E 3 cập nhật đến thời gian nào?
Dữ liệu của DALL-E có thể thay đổi tùy thuộc vào cập nhật từ OpenAI hoặc các điều chỉnh khác của mô hình. Đến thời điểm bài viết này, dữ liệu của nó được đào tạo và cập nhật đến tháng 01/2022.
Kết luận
Công cụ DALL-E 3 đóng vai trò quan trọng trong việc tạo ra hình ảnh từ mô tả văn bản, mở ra những tiềm năng sáng tạo và ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau. Dù có những hạn chế nhất định trong việc hiểu và tạo ra hình ảnh từ mô tả phức tạp, DALL-E 3 vẫn là một công cụ mạnh mẽ, có khả năng hỗ trợ sáng tạo và phát triển trong lĩnh vực nghệ thuật, thiết kế, giáo dục và nhiều ngành công nghiệp khác. Sự tiến bộ của công nghệ này mở ra cơ hội để tạo ra những hình ảnh mới mẻ và độc đáo, đồng thời thúc đẩy sự phát triển của trí tuệ nhân tạo trong việc hiểu và tương tác với thông tin một cách sáng tạo và đa dạng.