Google şu anda Bard’ın geliştirilmesi üzerinde çalışıyor. Konuşma aracının önümüzdeki haftalarda birkaç yeni özellik kazanması bekleniyor. Ayrıca, yakın gelecekte bir görüntü oluşturucunun da piyasaya sürülmesi bekleniyor.
Bard ürün yelpazesini tamamlıyor
Bir Android uygulama geliştiricisi olan Dylan Roussel’e göre, Google’ın 18 Ocak 2024 için bir Bard güncellemesi planladığı bildirildi. Roussel, aynı gün tarihli ve yeni bir özelliği tanıtan bir yama notu tespit etti: Bard ile görüntü oluşturma yeteneği.
Belgede aracın kullanımının kolay olduğu belirtiliyor – kullanıcılar sadece birkaç kelime yazabiliyor ve hayal güçleri gerçeğe dönüşüyor. Araç aynı zamanda aynı istemden birden fazla görsel oluşturulmasına da olanak tanıyor ve görseller indirilebiliyor.
Back to the future? 👀
Here’s what’s coming next in Bard. . . tomorrow.
Image generation with Bard will use Imagen, Google’s Text-to-Image “diffusion technology.”https://t.co/FNeiCsS2ar
Important: The content of this changelog may still be changed until officially released. pic.twitter.com/9yRNjHNrLq
— Dylan Roussel (@evowizz) January 17, 2024
Bu özellik şu anda yalnızca İngilizce istemler için erişilebilir durumda. Konum ya da Google hesabına bağlı olarak herhangi bir sınırlama olup olmayacağı belirsiz.
İpuçlarına sadık gerçekçi görüntüler
Bard’ın görüntü oluşturucusu, metin komutlarını görüntülere dönüştüren Imagen 2 teknolojisi ile desteklenmektedir. Google, kullanıcı komutlarıyla tutarlı, yüksek kaliteli fotogerçekçi sonuçlar sağlamayı amaçlamaktadır.
Imagen 2 © Google tarafından oluşturulan görseller |
Google’ın hedeflerinden biri, insan ellerinin ve yüzlerinin işlenmesini geliştirmek ve dikkat dağıtıcı görsel yapaylıklardan arınmış görüntüler oluşturmaktır. Bunlar, görüntü üreten yapay zekaların hala zorluklarla karşılaştığı iki alan.
Google’a göre Imagen 2, görüntü ayrıntıları ve bunlara karşılık gelen başlıklar konusunda eğitimden geçmiştir. Görüntü doğruluğunu artırmak için, eğitim veri kümesi artık görüntü başlıklarında daha ayrıntılı açıklamalar içeriyor.
Görüntüler ve altyazılar arasındaki ilişkiler sayesinde model, görüntüler ve kelimeler arasındaki ilişkiyi daha iyi anlayabilir, bu da bağlam ve nüans anlayışını geliştirebilir.
Kaynak: Dylan Roussel, Google