5 công cụ tạo hình ảnh AI mã nguồn mở tốt nhất - |Giải thích về công nghệ|Sáng tạo|

đường dẫn nhanh

Bút sáp màu

Khuếch tán ổn định 1.5

DreamShaper

GọiAI

hành trình mở

Các mô hình tạo văn bản thành hình ảnh dựa trên AI có ở khắp mọi nơi và ngày càng trở nên dễ dàng truy cập hơn hàng ngày. Mặc dù thật dễ dàng để truy cập một trang web và tạo hình ảnh bạn đang tìm kiếm, nhưng các trình tạo chuyển văn bản thành hình ảnh nguồn mở là lựa chọn tốt nhất nếu bạn muốn kiểm soát nhiều hơn quá trình tạo.

TUYỆT VỜI VIDEO TRONG NGÀY CUỘN ĐỂ TIẾP TỤC VỚI NỘI DUNG

Có hàng tá trình tạo văn bản thành hình ảnh AI miễn phí và mã nguồn mở có sẵn trên internet chuyên về các loại hình ảnh cụ thể. Vì vậy, chúng tôi đã sàng lọc rất nhiều và tìm ra các trình tạo văn bản thành hình ảnh AI nguồn mở tốt nhất mà bạn có thể thử ngay bây giờ.

cách hiển thị màn hình điện thoại trên máy tính

1 Bút sáp màu

Craiyon là một trong những trình tạo hình ảnh AI nguồn mở dễ tiếp cận nhất. Nó dựa trên DALL-E Mini và mặc dù bạn có thể sao chép Kho lưu trữ Github và cài đặt mô hình cục bộ trên máy tính của bạn, Craiyon dường như đã bỏ phương pháp này để chuyển sang sử dụng trang web của mình.

Kho lưu trữ Github chính thức chưa được cập nhật kể từ tháng 6 năm 2022, nhưng mẫu mới nhất vẫn có sẵn miễn phí trên trang web chính thức của Craiyon . Không có ứng dụng Android hoặc iOS.

Về chức năng, bạn sẽ thấy tất cả các tùy chọn thông thường mà bạn mong đợi từ trình tạo hình ảnh AI. Sau khi nhập lời nhắc và nhận hình ảnh, bạn có thể sử dụng tính năng nâng cao để nhận bản sao có độ phân giải cao hơn. Có ba phong cách để lựa chọn: Nghệ thuật, Ảnh và Vẽ. Bạn cũng có thể chọn tùy chọn 'Không' nếu bạn muốn mô hình quyết định.

Ngoài ra, 'Chế độ chuyên gia' cho phép bạn bao gồm các từ tiêu cực, yêu cầu mô hình tránh các mục cụ thể. Ngoài ra còn có tính năng dự đoán nhanh chóng, sử dụng ChatGPT để giúp người dùng viết lời nhắc tốt nhất, chi tiết nhất có thể. Cuối cùng, các tính năng xóa nền được hỗ trợ bởi AI có thể giúp bạn tiết kiệm thời gian và công sức cắt nền khỏi hình ảnh.

Và đó là tất cả những gì Craiyon làm. Đây không phải là mô hình tạo hình ảnh AI phức tạp nhất, nhưng nó hoạt động tốt như một mô hình cơ bản nếu bạn không muốn thứ gì đó chi tiết hoặc thực tế.

Mô hình này được sử dụng miễn phí nhưng người dùng miễn phí bị giới hạn ở chín hình ảnh miễn phí cùng một lúc trong vòng một phút. Bạn có thể đăng ký cấp độ Người hỗ trợ hoặc Chuyên nghiệp của họ (có giá lần lượt là 5 đô la và 20 đô la một tháng và được thanh toán hàng năm) để không nhận được quảng cáo hoặc hình mờ, tạo nhanh hơn và tùy chọn giữ riêng tư cho hình ảnh được tạo của bạn. Cấp đăng ký Tùy chỉnh cũng cho phép các mô hình tùy chỉnh, tích hợp, hỗ trợ chuyên dụng và máy chủ riêng.

2 Khuếch tán ổn định 1.5

Khuếch tán ổn định có lẽ là một trong những mô hình tạo văn bản thành hình ảnh nguồn mở phổ biến nhất. Nó cũng cung cấp năng lượng cho các mô hình khác, bao gồm ba trình tạo hình ảnh được đề cập bên dưới. Nó được phát hành vào năm 2022 và đã có nhiều triển khai kể từ đó.

Tôi sẽ cung cấp cho bạn các chi tiết kỹ thuật quá mức về cách hoạt động của mô hình (bạn có thể kiểm tra kho lưu trữ Github chính thức ), nhưng mô hình này dễ cài đặt ngay cả đối với những người mới bắt đầu hoàn thành và hoạt động tốt miễn là bạn có GPU chuyên dụng với bộ nhớ ít nhất 4GB. Bạn cũng có thể truy cập Khuếch tán ổn định trực tuyến và chúng tôi sẽ hỗ trợ bạn nếu bạn muốn chạy Khuếch tán ổn định trên máy Mac .

Có một số điểm kiểm tra (coi chúng là phiên bản) có sẵn để sử dụng cho Khuếch tán ổn định. Trong khi chúng tôi thử nghiệm phiên bản 1.5, phiên bản 2.1 cũng đang được phát triển tích cực và chính xác hơn.

Yadullah Abidi/MakeUseOf/DreamShaper

Chạy mô hình cũng khá dễ dàng. Chúng tôi đã thử nghiệm nó với AUTOMATIC1111 Giao diện người dùng web Khuếch tán ổn định , và tất cả các điều khiển và tham số đều hoạt động tốt. Nó cũng có khả năng chống NSFW khá tốt nhờ cơ sở dữ liệu LAION-5B mà mô hình đã đào tạo (mặc dù nó không hoàn hảo, bạn nhớ nhé). Mặc dù thời gian tạo sẽ thay đổi tùy theo phần cứng của bạn, nhưng bạn có thể mong đợi hình ảnh của mình chi tiết và chân thực ngay cả với những lời nhắc cơ bản.

3 DreamShaper

DreamShaper là một mô hình tạo hình ảnh dựa trên Khuếch tán ổn định. Nó được dự định là một giải pháp thay thế nguồn mở cho MidJourney và tập trung vào tính chân thực trong các hình ảnh được tạo ra, mặc dù nó cũng có thể xử lý các phong cách anime và hội họa chỉ với một vài chỉnh sửa.

Mô hình này có khả năng cao hơn Khuếch tán ổn định, cho phép người dùng tự do hơn đối với kết quả đầu ra cuối cùng, từ cải tiến chớp nhoáng cho đến nới lỏng các hạn chế NSFW. Việc chạy mô hình cũng dễ dàng, với có thể tải xuống, phiên bản được đào tạo trước trực tuyến để truy cập cục bộ và một loạt các trang web, bao gồm Sinkin.ai , Hạt giống ngẫu nhiên , Và Pháp sư.space (yêu cầu đăng ký cơ bản) cho phép bạn chạy mô hình với khả năng tăng tốc GPU.

Như bạn có thể đoán bây giờ, hình ảnh do DreamShaper tạo ra có xu hướng trông thực tế hơn so với Stable Diffusion. Ngay cả khi bạn chạy cùng một lời nhắc trên cả hai kiểu máy, mô hình DreamShaper có thể sẽ chân thực hơn, chi tiết hơn và có độ sáng tốt hơn.

Điều này đặc biệt đúng đối với ảnh chân dung hoặc nhân vật, điều mà tôi thấy Thiếu khuếch tán ổn định so với cùng một lời nhắc. Nếu hình ảnh của bạn trở nên quá thực tế, đây là bốn cách để xác định hình ảnh do AI tạo ra .

Bạn cũng không cần một chiếc PC khổng lồ để chạy mô hình. GTX 1650Ti của tôi với 4GB VRAM đã chạy mô hình một cách hoàn hảo. Thời gian tạo ra lâu hơn một chút nhưng dường như nó không ảnh hưởng đến sản lượng thực tế. Điều đó có nghĩa là bạn có thể yêu cầu GPU có nhiều VRAM hơn để chạy DreamShaper XL, dựa trên mô hình Stable Diffusion XL.

4 GọiAI

Invoke AI là một mô hình tạo hình ảnh dựa trên AI khác dựa trên Khuếch tán ổn định, với phiên bản XL dựa trên Khuếch tán ổn định XL. Nó cũng có giao diện người dùng dòng lệnh và web riêng, nghĩa là bạn sẽ không phải gặp khó khăn với những thứ như giao diện người dùng web Khuếch tán ổn định.

cắm vào không sạc windows 10

Invokai-giao diện người dùng-với-hình ảnh

Mô hình tập trung vào việc cho phép người dùng tạo hình ảnh dựa trên tài sản trí tuệ của họ với quy trình làm việc tùy chỉnh. InvokeAI là một trong những mô hình tạo hình ảnh AI nguồn mở tốt nhất để đào tạo các mô hình tùy chỉnh và làm việc với sở hữu trí tuệ.

Của nó kho lưu trữ Github chính thức liệt kê hai phương pháp cài đặt: cài đặt qua trình cài đặt của InvokeAI hoặc sử dụng PyPI nếu bạn cảm thấy thoải mái với thiết bị đầu cuối và Python và cần kiểm soát nhiều hơn đối với các gói được cài đặt cùng với mô hình.

Tuy nhiên, việc kiểm soát bổ sung có một số hạn chế, đáng chú ý nhất là các yêu cầu phần cứng chặt chẽ hơn. InvokeAI khuyến nghị GPU chuyên dụng có bộ nhớ ít nhất 4GB, khuyến nghị từ 6 đến 8 GB để chạy biến thể XL. Yêu cầu VRAM áp dụng cho cả GPU AMD và Nvidia. Bạn cũng sẽ cần ít nhất 12GB RAM và 12GB dung lượng ổ đĩa trống cho kiểu máy, các phần phụ thuộc của nó và Python.

Yadullah Abidi/MakeUseOf/InvokeAI

Mặc dù tài liệu không khuyến nghị GPU GTX 10 Series và 16 Series của Nvidia vì thiếu bộ nhớ video nhưng trình cài đặt được cung cấp vẫn chạy tốt. Mặc dù quãng đường của bạn có thể thay đổi nhưng nếu bạn đang sử dụng GPU cấp thấp hơn, hãy chờ lâu hơn để thấy lời nhắc của bạn được chuyển thành hình ảnh. Cuối cùng, nếu bạn đang sử dụng Windows, bạn chỉ có thể sử dụng GPU Nvidia vì hiện tại không hỗ trợ GPU AMD.

Về phần tạo hình ảnh, người mẫu có xu hướng thiên về phong cách nghệ thuật hơn là quang học. Tất nhiên, bạn có thể đào tạo mô hình trên tập dữ liệu của mình và để mô hình tạo ra hình ảnh gần hơn với những gì bạn muốn, ngay cả khi điều đó liên quan đến hình ảnh chân thực, đặc biệt nếu bạn đang làm việc trong lĩnh vực thiết kế sản phẩm, kiến trúc hoặc không gian bán lẻ. Tuy nhiên, một điều quan trọng cần lưu ý là InvokeAI chủ yếu là một công cụ tạo hình ảnh, nghĩa là bạn có thể sẽ phải sử dụng các mô hình của riêng mình để có kết quả tốt nhất (có thể dễ dàng tìm thấy thông qua trình quản lý mô hình được cung cấp trong giao diện web) làm mặc định. mô hình khá giống với Stable Diffusion.

5 hành trình mở

Openjourney là mô hình tạo hình ảnh AI mã nguồn mở miễn phí dựa trên Stable Diffusion. Nếu bạn thắc mắc tại sao mô hình này được gọi là Openjourney thì đó là vì nó đã được đào tạo về các hình ảnh Midjourney và có thể bắt chước phong cách của nó trong các hình ảnh mà nó tạo ra.

nhắc nhở anh hùng , công ty đứng sau Openjourney, cho phép bạn thử nghiệm mô hình này cùng với các mô hình khác, bao gồm Khuếch tán ổn định (phiên bản 1.5 và 2), DreamShaper và Tầm nhìn thực tế. Khi đăng ký, bạn nhận được 25 tín dụng miễn phí (một tín dụng cho mỗi hình ảnh được tạo), sau đó bạn phải đăng ký cấp đăng ký Pro của họ, có giá 9 đô la một tháng và cho phép bạn truy cập 300 tín dụng mỗi tháng với các tính năng độc quyền khác.

Tuy nhiên, nếu bạn muốn chạy nó cục bộ và miễn phí, bạn có thể tải xuống tệp mô hình từ HuggingFace và chạy nó bằng giao diện người dùng web Khuếch tán ổn định. Openjourney cũng là mô hình tạo hình ảnh AI được tải xuống nhiều thứ hai trên HuggingFace, ngay sau Stable Diffusion.

Openjourney không liệt kê bất kỳ yêu cầu phần cứng cụ thể nào để chạy mô hình cục bộ trên trang web của mình, nhưng bạn có thể mong đợi các yêu cầu phần cứng tương tự như Khuếch tán ổn định. Điều này có nghĩa là một GPU chuyên dụng có 4GB VRAM, 16GB RAM và khoảng 12 đến 15GB dung lượng trống trên máy tính của bạn để lưu mô hình và các phần phụ thuộc của nó.

Yadullah Abidi/MakeUseOf/OpenJourney

Hình ảnh do Openjourney tạo ra có xu hướng cân bằng giữa chủ nghĩa quang học và nghệ thuật trừ khi có quy định khác. Nếu bạn đang tìm kiếm một mô hình toàn diện và thích giao diện Midjourney mà không phải trả tiền đăng ký, Openjourney là một trong những lựa chọn tốt nhất.