Perşembe, Ekim 22, 2020

YouTube artık iOS’ta Hikayeler için AI gürültüsü iptal ediyor.

‘Dinlemek’, bir videonun ses kalitesini artırmak için sesli ve görsel ipuçlarını kullanabilir.

Google’ın sunduğu yeni bir konuşma geliştirme özelliği sayesinde ileriye dönük olarak bazı YouTube Hikayelerinin ses kalitesinde belirgin bir iyileşme olduğunu fark edebilirsiniz . Birkaç yıl önce teknoloji devi , bir kalabalığın içindeki sesleri seçebilen “Dinlemek için Bakmak” AI teknolojisini piyasaya sürdü. Şimdi, teknolojiyi iOS cihazlarında YouTube Hikayeleri kaydeden içerik oluşturuculara sunuyor.

Google, Look to Listen, konuşmacının ağız hareketleri ve yüz ifadeleri gibi konuşma ve görsel sinyaller arasındaki ilişkiyi geniş bir çevrimiçi video koleksiyonu üzerinde eğiterek öğretti. Herkes için çalışacağından ve önyargı göstermeyeceğinden emin olmak için Google, çeşitli görsel ve işitsel özelliklere dayalı olarak performansını araştıran bir dizi test gerçekleştirdi. Bu özellikler arasında konuşmacının yaşı, cilt tonu, konuşma dili, ses perdesi, yüzlerinin görünürlüğü, baş duruşu, yüz kılları, gözlüklerin varlığı ve arka plan gürültü seviyesi bulunur. Örneğin, teknolojinin konuşmayı geliştirme kapasitesinin konuşmacıların dillerinde oldukça tutarlı kaldığını belirlediler. Yüz kıllarının da bunda büyük bir etkisi yok gibi görünse de, en iyi yüz kılı olmayan ve yakın tıraş olan yüzlerde işe yarar.

Teknoloji devi ayrıca, son birkaç yılda teknolojiyi nasıl geliştirdiğini duyurusunda açıklamaya devam etti. Başlangıç ​​olarak, geliştiriciler tüm işlemleri cihazın kendisinde yapabildiğinden emin oldu, böylece uzak bir sunucuya herhangi bir şey göndermesine gerek kalmadı. Ayrıca, özelliğin analiz için videolardan yüzlerin bulunduğu küçük resimleri çok hızlı bir şekilde çıkarmasına izin veren bir teknik kullandılar. Bu, video hala kaydedilirken teknolojinin konuşma geliştirmeye başlamasına izin verir. Bu iyileştirmeler, özelliğin boyutunu 120MB’den 6MB’ye düşürerek dağıtımını kolaylaştırdı. Google ayrıca “[Looking to Listen’in] çalışma süresini, orijinal formülasyonu kullanan bir masaüstünde gerçek zamanlı olarak 10 kattan … sadece bir iPhone CPU kullanarak 0,5 kat gerçek zamanlı performansa düşürdüklerini söylüyor. Aslında,

Özelliği etkinleştirmek için içerik oluşturucuların yalnızca iOS’taki ses kontrollerinde “Konuşmayı geliştir” seçeneğini açmaları gerekir.

Bugün En Çok Okunanlar

Firefox 82 hız ve resim içinde resim iyileştirmeleri vaat ediyor

Mozilla, sadık Firefox için yeni bir tarayıcı güncellemesi sunuyor. Sürüm 82, daha iyi başlatma ve sayfa yükleme süreleriyle "her zamankinden daha hızlı" olmayı...

Google yapay zeka destekli fotoğraf baskı hizmetini yeniden açıyor

Google, yapay zeka tabanlı Fotoğraflar baskı hizmetini geri getirme sözünü yerine getirdi ve bu sefer daha uygun fiyatlı. Yaklaşan premium baskı serisinde bir kez daha makine öğreniminin her...

Yeni Xbox kullanıcı arayüzü Xbox One’da mevcut

Xbox Series X ve Series S, Xbox One'da yeni sunulan aynı arayüzü paylaşacak. Xbox Series X ve Series S'nin...

Sosyal Medyada Alışveriş: Nelere Dikkat Edilmelidir?

Bir çoğumuz alışveriş isteklerimizi ve ihtiyaçlarımızı karşılamak için Instagram ve Facebook'a bakıyoruz, ancak bu platformlar üzerinden satın aldığınızda haklarınız neler? Koronavirüs salgınının...

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen adınızı buraya girin