Apple araştırmacıları, ReALM adlı yapay zeka sistemini tanıttı. Sesli asistanların referans çözümleme ve kullanıcıyla daha doğal etkileşim kurma yeteneklerini geliştiren bu sistemin Siri'de etkili bir şekilde kullanılması bekleniyor.
Apple araştırmacıları, sesli asistanların komutları anlama ve bunlara yanıt verme biçimini kökten değiştirmeyi amaçlayan ReALM (Reference Resolution as Language Modeling) adlı bir yapay zeka sistemi geliştirdi.
Apple'ın çalışmanın detaylarını açıkladığı bir makaleye göre ReALM, ekrandaki varlıklara yapılan belirsiz referansların şifresini çözebiliyor ve konuşma ve arka plan bağlamını da anlayabiliyor. Bunun sonucunda cihazlarla daha sezgisel ve doğal bir şekilde etkileşim kurabiliyor.
Referans çözümlemesi, doğal dil anlayışının önemli bir parçası ve kullanıcıların zamirleri ve diğer dolaylı referansları konuşma sırasında karışıklık olmadan kullanmalarına olanak tanıyor. Dijital asistanlar için bu yetenek, tarihsel olarak çok çeşitli sözlü ipuçlarını ve görsel bilgileri yorumlama ihtiyacıyla sınırlı olan önemli bir zorluk olmuştu.
Apple'ın ReALM sistemi, karmaşık referans çözümleme sürecini saf bir dil modelleme problemine dönüştürerek bu sorunu çözmeye çalışıyor. Bunu yaparken ekranda gösterilen görsel öğelere yapılan göndermeleri kavrayıp bu anlayışı konuşma akışına entegre edebiliyor.
ReALM, metinsel temsilleri kullanarak bir ekranın görsel düzenini yeniden oluşturuyor. Bu, ekranın içeriğini ve yapısını yakalayan bir metin formatı oluşturmak için ekrandaki varlıkları ve konumlarını ayrıştırmayı içeriyor.
Apple araştırmacıları, bu stratejinin referans çözümleme görevleri için dil modellerinin özel ince ayarıyla bir araya getirildiğinde, OpenAI'nın GPT-4'ünün yetenekleri de dahil olmak üzere geleneksel yöntemlerden önemli ölçüde daha iyi performans gösterdiğini buldu.
ReALM, kullanıcıların kesin ve ayrıntılı talimatlara ihtiyaç duymadan, ekranlarında o anda görüntülenenlere göre dijital asistanlarla çok daha verimli bir şekilde etkileşim kurmasını sağlayabilir. Bu da, sürücülerin araç kullanırken bilgi-eğlence sistemlerinde gezinmesine yardımcı olmak veya dolaylı etkileşimin daha kolay ve daha doğru bir yolunu sağlayarak engelli kullanıcılara yardımcı olmak gibi çeşitli ortamlarda sesli asistanları çok daha kullanışlı hale getirme potansiyeline sahip.
Apple'ın haziran ayında düzenleyeceği WWDC24 etkinliğinde bir avuç yapay zeka özelliğini piyasaya sürmesi bekleniyor.