- Yeni tasarlanan bir yapay zeka (AI) aracı iki saniyeden kısa sürede görüntü oluşturabiliyor ve çalıştırmak için pahalı donanımlara ihtiyaç duymuyor.
- “KOALA” olarak bilinen bu yeni aracın en düşük versiyonu sadece 700 milyonluk bir parametreye sahip yani, pahalı ve yoğun enerji harcayan donanımlara ihtiyaç duymadan hızlı bir şekilde çalışabilecek kadar yalın.
- Araç, düşük maliyetli grafik işleme birimlerinde (GPU) çalışabiliyor ve talepleri işlemek için yaklaşık sadece 8 GB RAM’e ihtiyaç duyuyor.
Yeni tasarlanan bir yapay zeka (AI) aracı iki saniyeden kısa sürede görüntü oluşturabiliyor ve çalıştırmak için pahalı donanımlara ihtiyaç duymuyor. Güney Koreli bilim insanları, Stable Diffusion XL olarak da bilinen, 2,56 milyar parametreye kadar yapay zekanın eğitimi sırasında öğrenmesi için kullandığı değişkenlere sahip, açık kaynaklı (ya da kamuya açık) bir görüntü oluşturma modelinin boyutunu küçültmek için “bilgi damıtma” adı verilen özel bir teknik kullandı.
“KOALA” olarak bilinen bu yeni modelin en düşük versiyonu sadece 700 milyonluk bir parametreye sahip yani, pahalı ve yoğun enerji harcayan donanımlara ihtiyaç duymadan hızlı bir şekilde çalışabilecek kadar yalın. Ekibin yapay zekayı geliştirmek için kullandığı bilgi damıtma yöntemi, ideal performansından ödün vermeden bilgiyi büyük bir modelden daha küçük bir modele aktarmayı sağlıyor. Daha küçük modellerin ise avantajlarından biri hesaplama yapma ve cevap üretmek için daha az zaman harcaması.
Araç, düşük maliyetli grafik işleme birimlerinde (GPU) çalışabiliyor ve talepleri işlemek için üst düzey endüstriyel GPU’lara ihtiyaç duyulan daha büyük modeller ile kıyasla yaklaşık sadece 8 GB RAM’e ihtiyaç duyuyor. Ekip bulgularını 7 Aralık 2023’te arXiv veri tabanında bir makale olarak yayımladı. Ekip ayrıca çalışmalarını açık kaynaklı yapay zeka deposu Hugging Face aracılığıyla da kullanıma sundu. Bu yenilik yeni geliştirilen yapay zeka modellerinin arkasında yer alıyor ayrıca kurum Elektronik ve Telekomünikasyon Araştırma Enstitüsü (ETRI), metin girdilerine dayalı görüntüler oluşturmayı sağlayan “KOALA” ve üç adet versiyonu ile metin tabanlı soruları görüntü ya da video ile yanıtlayabilen “Ko-LLaVA “nın iki versiyonu da dâhil olmak üzere toplamda beş versiyon oluşturdu.
KOALA’yı test ettiklerinde, “Mars’ta ayın altında kitap okuyan bir astronot resmi” komutuna dayalı bir görüntüyü 1,6 saniyede oluşturdu. Açıklamaya göre OpenAI’nin DALL-E 2’si aynı komut istemine dayalı bir görüntüyü 12,3 saniyede, DALL-E 3 ise 13,7 saniyede oluşturdu. Bilim insanları şimdi geliştirdikleri teknolojiyi mevcut görüntü oluşturucu hizmetlere, eğitim alanına, içerik üretimine ve diğer sektörlere entegre etmeyi planlıyor.
Derleyen: Burçin Bağatur