ChatGPT’nin OpenAI tarafından piyasaya sürülmesinden bu yana geçen bir yıl içinde teknoloji inanılmaz bir biçimde büyüdü ve çok çeşitli entegrasyonlar yaşadı. Teknolojinin görüntü, ses ve manzara ürettiğini tekraren kere gördük. Fakat artık insansı bir robota hayat veriyor. Karşınızda ChatGPT’ye güç veren GPT-4 isimli Büyük Lisan Modelini (LLM) kullanarak spontane hareket üretebilen insansı robot: Alter3.
HAYALET TAKLİDİ YAPIYOR
Donanımhaber’in aktardığı detaylara nazaran Tokyo Üniversitesinden bir grup tarafından geliştirilen Alter3, veritabanında evvelden programlanmış girdilere muhtaçlık duymadan, özçekim duruşundan hayalet taklidine kadar çeşitli pozları dinamik olarak taklit etmek için OpenAI’ın en gelişmiş modeli olan GPT-4’ü kullanıyor. Takıma nazaran, Alter3’ün yüz tabirleri ve jestler aracılığıyla konuşma içeriğine cevap vermesi, insansı robot teknolojisinde değerli bir ilerlemeyi temsil ediyor ve başka “androidlere” en az değişiklikle basitçe uyarlanabiliyor.
Geçmişte hareket üzere düşük düzeyli robot denetimleri, donanıma bağlı olduğu ve eğitim datalarında yer almadığı için büyük lisan modellerinin kapsamı dışında kalıyordu. Japon takım bunun üstesinden gelmek için insan hareketinin tabirini androidin anlayabileceği bir koda çevirmenin bir yolunu buldu.
From Text to Motion: Grounding GPT-4 in a Humanoid Robot "Alter3"
paper page: https://t.co/QKIKfWKyPZ
report the development of Alter3, a humanoid robot capable of generating spontaneous motion using a Large Language Model (LLM), specifically GPT-4. This achievement was… pic.twitter.com/WEViidVM1L
— AK (@_akhaliq) December 12, 2023
NASIL ÇALIŞIYOR?
Yeni sistem ile robotun, geliştiricilerin her bir beden modülü için programlama yapmasına gerek kalmadan vakit içinde aksiyon dizileri oluşturabileceği mananın taşıyor. Tıpkı yeni yürümeye başlayan bir çocuğun emekleme ve yürüme periyotlarında yaptığı üzere hareket etmeyi öğrenebilir. Lakin şimdilik korkmaya gerek yok çünkü Alter3, spontane hareket üretebilse de yalnızca üst gövdeden oluşuyor. Yani ayakları yok.
Alter3 ile konuşan bir insan “iPhone’unla bir selfie çek” üzere bir şey söylediğinde robot, GPT-4’e selfie çekmenin nasıl bir şey olduğunu sormak daha dahil olmak üzere bir dizi istemde bulunuyor. GPT-4 ise bu istemi robotun anlayabileceği ve gerekli hareketleri yapmak için kullanabileceği Python koduna dönüştürüyor.
Alter3’ün ardındaki takım GPT-4 tabanlı yeni metinden harekete keşfini öteki insansı robotlarda da kullanılabilir hale getirmeyi planlıyor. Bunun robot geliştirmede değerli bir ilerleme olduğunu söylüyorlar.