Penjanaan imej AI: StableDiffusion dan lain-lain pada iPad

17/06/2023

105

nextpit stable diffusion ipad — © nextpit

Pernah terfikir untuk menggunakan StableDiffusion atau Openjourney pada iPad? Walaupun sesetengah apl berfungsi tanpa sebarang masalah, terutamanya jika anda menggunakan iPad Pro yang berkuasa dengan pemproses M1 atau M2. NextPit menerangkan cara anda boleh mencipta imej AI menggunakan iPad.

Sama ada di App Store, Instagram atau Reddit, anda hampir tidak boleh membuang masa di Internet sekarang tanpa memukul imej yang dijana AI. Hanya beberapa bulan yang lalu satu-satunya cara untuk berbuat demikian ialah melalui antara muka penyemak imbas à la Dall-E Mini, dan kini, banyak model AI tersedia secara percuma untuk menjana hampir semua jenis imej.

Apabila StableDiffusion dan lain-lain merakam melalui bumbung pada musim luruh lalu, penjanaan imej tidak begitu mesra pengguna. Anda memerlukan antara muka pengguna à la Automatic1111 dan kad grafik paling berkuasa yang mungkin pada komputer desktop anda. Jika anda tidak mempunyai GPU yang betul, anda juga boleh menjalankan skrip berasaskan Python melalui Google Colab, yang merupakan rangka kerja berasaskan awan yang mempunyai kuasa pengkomputeran yang hampir tidak terhad. Atau anda hanya boleh membayarnya di Midjourney, tetapi kemudian terjebak dengan gaya imej yang agak khusus.

Jadi, bagaimanakah prestasi StableDiffusion pada iPad?

Dari masa ke masa, kuasa pengkomputeran yang diperlukan untuk menjana imej AI telah berkurangan. Daripada hanya berjalan pada komputer berprestasi tinggi atau dalam awan, menjana imej AI kini berfungsi dengan cukup mengagumkan pada iPad. Kami mencuba dua apl berbeza pada iPad Pro (2022), dikuasakan oleh cip M2, yang menampilkan kedua-dua kekuatan dan kelemahannya: Guernika dan Draw Things.

Kedua-dua aplikasi hanyalah GUI untuk menjana imej menggunakan model. Kedua-dua apl sememangnya menyediakan senarai model imej yang boleh anda muat turun. Di sana sini, anda akan dapat mencari StableDiffusion dalam pelbagai versi serta Openjourney, yang merupakan alternatif sumber terbuka kepada Midjourney. Draw Things, sebaliknya, menawarkan senarai yang luas dari Disney ke Anime hingga Super Mario.

Kedua-dua Draw Things dan Guernika juga membenarkan anda memuatkan model anda sendiri, yang sentiasa dikongsi sebagai fail .CKPT. Singkatan itu bermaksud Checkpoint dan merujuk kepada keadaan “berfikir” model pembelajaran mesin yang dibekukan sebagai fail. Terdapat banyak sumber di Internet untuk setiap model yang boleh difikirkan.

Tetapan mana yang penting?

Selain daripada model, anda akan menemui beberapa tetapan dalam kedua-dua apl yang bertindih pada tahap yang besar. Sudah tentu, gesaan amat penting di sini, serta “Langkah” dan “Skala Panduan”.

Petikan Skrin Draw Things — Untuk mendapatkan hasil yang diingini dengan Draw Things, terdapat banyak pilihan tetapan – dan yang lebih tinggi! / © NextPit

Gesaan ialah arahan teks dari mana model AI menjana imej. Pada mulanya, ini kedengaran lebih mudah daripada sebelumnya—kerana gesaan yang kompleks selalunya diperlukan untuk hasil yang baik dalam gaya yang diingini. Anda juga boleh menggunakan gesaan negatif untuk mengecualikan gaya imej, sudut atau perkara tertentu. Tetapi kita akan bercakap tentang gesaan secara berasingan di bawah.

Langkah-langkah menunjukkan berapa banyak langkah yang digunakan untuk menjana imej. Lebih banyak Langkah pada dasarnya diterjemahkan kepada kualiti yang lebih tinggi tetapi juga lebih banyak masa pengkomputeran diperlukan. Bergantung pada model yang digunakan, bilangan langkah yang berbeza akan menghasilkan hasil yang baik. Skala Panduan menentukan sejauh mana model mungkin menyimpang daripada gesaan anda. Nilai yang rendah membolehkan AI lebih “kebebasan buatan” di sini.

Dalam kedua-dua Draw Things dan Guernika, anda juga boleh memasukkan imej lain sebagai input. Untuk tujuan ini, terdapat gelangsar Kekuatan dalam setiap kes, yang menentukan sejauh mana keputusan harus berada pada imej asal. Memandangkan setiap imej yang dijana adalah unik, Draw Things menawarkan kemungkinan untuk menjana sehingga 100 imej sekali gus. Guernika juga menawarkan mod tanpa henti!

Tangkapan skrin Guernika — Guernika mempunyai kebanyakan tetapan yang sama seperti Draw Things. Walau bagaimanapun, anda tidak boleh melaraskan peleraian (belum). / © NextPit

Ciri terakhir hanya tersedia dalam Draw Things: Di sinilah anda boleh menetapkan resolusi output. Guernika pada masa ini hanya menyampaikan imej dengan saiz 512 × 512 piksel, walaupun pembangun telah menjanjikan kemas kini dengan lebih fleksibiliti tidak lama lagi. Anda juga boleh menambah penaik AI pada Draw Things, yang meningkatkan resolusi dengan lebih jauh lagi. Jadi anda boleh mencipta imej resolusi tinggi 12 megapiksel dan ke atas.

Imej yang dijana AI — Guernika – Imej 1 © nextpit

Imej yang dihasilkan oleh AI — Lukis Benda – Imej 2 © nextpit

Nampaknya anda sudah bersedia untuk pergi! Pada iPad M2 kami, menjana imej AI mengambil masa kira-kira 20 saat hingga lima minit, bergantung pada tetapan yang kami pilih. Ia terbukti berguna untuk menguji gesaan resolusi sangat rendah untuk kesesuaian dan kemudian menjana kumpulan imej resolusi tinggi yang lebih besar dengan segera jika hasilnya kelihatan menjanjikan.

Juga menarik: Semua iPad dibandingkan: Dari Mini ke Pro

Bagaimanakah anda mendapatkan gesaan yang betul?

Menulis gesaan yang baik ialah sains itu sendiri dan sesuatu yang anda perlu pelajari dan latih dahulu. Bukan kebetulan bahawa tawaran kerja pertama sebagai “jurutera segera”—iaitu seseorang yang menulis arahan untuk AI—sudah muncul di portal yang berkaitan.

Adakah gesaan anda menghasilkan sampah dan bukannya karya agung? Kemudian biarkan diri anda diilhamkan oleh gabungan kata kunci yang telah digunakan oleh pengguna lain untuk mencapai hasil yang hebat. Di laman web seperti PromptHeroanda boleh mengklik seni AI dan melihat model atau pusat pemeriksaan dan gesaan yang digunakan untuk mencipta setiap imej.

Ngomong-ngomong, anda juga boleh meminta ChatGPT untuk menulis gesaan yang meluas untuk motif tertentu untuk anda. Cubalah.

Baca lebih lanjut: Cara menulis teks dengan ChatGPT

Apakah pendapat anda tentang seni janaan AI secara umum? Adakah anda mendapati perkembangan semasa di sekitar Midjourney, StableDiffusion, dan lain-lain menarik, menakutkan atau kedua-duanya? Adakah anda ingin membaca lebih lanjut mengenai topik ini di NextPit? Saya menantikan pendapat anda dalam komen!