ChatGPT’nin OpenAI tarafından piyasaya sürülmesinden bu yana geçen bir yıl içinde teknoloji inanılmaz bir biçimde büyüdü ve çok çeşitli entegrasyonlar yaşadı. Teknolojinin görüntü, ses ve manzara ürettiğini tekraren defa gördük. Fakat artık insansı bir robota hayat veriyor. Karşınızda ChatGPT’ye güç veren GPT-4 isimli Büyük Lisan Modelini (LLM) kullanarak spontane hareket üretebilen insansı robot: Alter3.
HAYALET TAKLİDİ YAPIYOR
Donanımhaber’in aktardığı detaylara nazaran Tokyo Üniversitesinden bir grup tarafından geliştirilen Alter3, veritabanında evvelden programlanmış girdilere gereksinim duymadan, özçekim duruşundan hayalet taklidine kadar çeşitli pozları dinamik olarak taklit etmek için OpenAI’ın en gelişmiş modeli olan GPT-4’ü kullanıyor. Gruba nazaran, Alter3’ün yüz sözleri ve jestler aracılığıyla konuşma içeriğine karşılık vermesi, insansı robot teknolojisinde kıymetli bir ilerlemeyi temsil ediyor ve başka “androidlere” en az değişiklikle kolay kolay uyarlanabiliyor.
Geçmişte hareket üzere düşük düzeyli robot denetimleri, donanıma bağlı olduğu ve eğitim bilgilerinde yer almadığı için büyük lisan modellerinin kapsamı dışında kalıyordu. Japon takım bunun üstesinden gelmek için insan hareketinin sözünü androidin anlayabileceği bir koda çevirmenin bir yolunu buldu.
From Text to Motion: Grounding GPT-4 in a Humanoid Robot "Alter3"
paper page: https://t.co/QKIKfWKyPZ
report the development of Alter3, a humanoid robot capable of generating spontaneous motion using a Large Language Model (LLM), specifically GPT-4. This achievement was… pic.twitter.com/WEViidVM1L
— AK (@_akhaliq) December 12, 2023
NASIL ÇALIŞIYOR?
Yeni formül ile robotun, geliştiricilerin her bir beden modülü için programlama yapmasına gerek kalmadan vakit içinde aksiyon dizileri oluşturabileceği mananın taşıyor. Tıpkı yeni yürümeye başlayan bir çocuğun emekleme ve yürüme periyotlarında yaptığı üzere hareket etmeyi öğrenebilir. Lakin şimdilik korkmaya gerek yok çünkü Alter3, spontane hareket üretebilse de yalnızca üst gövdeden oluşuyor. Yani ayakları yok.
Alter3 ile konuşan bir insan “iPhone’unla bir selfie çek” üzere bir şey söylediğinde robot, GPT-4’e selfie çekmenin nasıl bir şey olduğunu sormak daha dahil olmak üzere bir dizi istemde bulunuyor. GPT-4 ise bu istemi robotun anlayabileceği ve gerekli hareketleri yapmak için kullanabileceği Python koduna dönüştürüyor.
Alter3’ün ardındaki grup GPT-4 tabanlı yeni metinden harekete keşfini başka insansı robotlarda da kullanılabilir hale getirmeyi planlıyor. Bunun robot geliştirmede değerli bir ilerleme olduğunu söylüyorlar.