Araştırma makalesine göre Apple ReALM adı verilen sistem, ekrandaki görsel öğelere yapılan atıfları (“bu” veya “şu” gibi) anlamak da dahil olmak üzere karmaşık referansları saf bir dil modelleme problemine dönüştürmek için büyük dil modellerinden yararlanıyor. Bu da ReALM’in mevcut yöntemlere kıyasla önemli performans kazanımları elde etmesini sağlıyor.
Yine de araştırmacılar, ekranların otomatik ayrıştırılmasına güvenmenin sınırlamaları olduğu konusunda uyarıyor. Birden fazla görüntü arasında ayrım yapmak gibi daha karmaşık görsel referansların ele alınması, muhtemelen bilgisayarla görü ve çok modlu tekniklerin dahil edilmesini gerektirecek.
Instagram, 2013 yılında piyasaya sürdüğü Direkt Mesajlar (DM) için sonunda bir düzenleme özelliği sunuyor. Meta, Instagram Direkt Mesajlar için büyük bir uyarıyla birlikte düzenlemeye izin veren bir yazılım güncellemesi yayınladı. Bu düzenlemeyi …
Google, henüz herkese sunulmayan ve belli kullanıcılarda test edilen SGE isimli yapay zekâ destekli arama motoruna görsel oluşturma özelliği ekledi. Kullanıcılar, bu özellik sayesinde Google’da arama yaparken görsel oluşturabilecek.