1.
Araştırma
μ₀: Eylem Etiketi Gerektirmeyen 3D Dünya Modeli
μ₀, piksel yerine 3D yörüngeler tahmin ederek robot öğrenimini gövde bağımsız hale getiriyor.
Maryland ve KAIST araştırmacıları, robot öğreniminde eylem etiketine ihtiyaç duymayan ölçeklenebilir bir dünya modeli olan μ₀'ı tanıttı. Model, piksel yoğunluklu video tahminleri ya da gövdeye özgü eylem etiketleri üretmek yerine, nesneler, araçlar, eller ve temas bölgeleri gibi önemli etkileşim noktaları için pürüzsüz 3D yörüngeler öngörüyor. Eğitim verisi sorununu çözmek için geliştirilen TraceExtract sistemi, çeşitli video kaynaklarından otomatik olarak 3D gözetim sinyali çıkarıyor: anahtar noktaları seçiyor, küresel olarak hizalanmış izler oluşturuyor ve hareket segmentlerini hiyerarşik dil açıklamalarıyla eşleştiriyor. B-spline kontrol noktaları kullanan modüler bir iz uzmanı ile önceden eğitilmiş bir görsel-dil omurgası bir araya getirilen μ₀, eylem süpervizonu ile önceden eğitilmiş VLA modelleriyle (π₀ gibi) rekabet edebilir politikalar üretiyor. Bu sonuçlar, 3D izlerin farklı robot gövdeleri arasında aktarılabilir evrensel bir manipülasyon temsili olabileceğini gösteriyor.
Arxiv CS.RO →
Paylaş: X · LinkedIn
2.
Araştırma
AnyGoal: Eğitimsiz Çok Robotlu Yaşam Boyu Navigasyon
VLM destekli çok ajanlı AnyGoal, dağılım dışı ortamlarda navigasyonu yeniden eğitim gerektirmeden %27,5 iyileştiriyor.
AnyGoal, büyük simülasyon verisiyle eğitilen navigasyon politikalarının bilinmeyen sahne ve hedef türlerinde hızla bozulması sorununa eğitim gerektirmeyen çok robotlu bir mimariyle yanıt veriyor. Sistemin merkezinde, VLM puanlarını derinlik konisi maskesi üzerinden hassasiyet ağırlıklı füzyon ile güncelleyen bir 2D Gauss Bayes Değer Haritası (BVM) yer alıyor. BVM, alt görevler arasında sıfırlanmıyor; bu sayede kanıtlar yaşam boyu birikebiliyor. Sınır noktaları, VLM yargıcı softmax ile BVM üzerindeki Bayes UCB teriminin dışbükey karışımıyla sıralanıyor; merkezi bir denetleyici olmadan uzamsal ayrım cezası ve taahhüt histerezi kullanan açgözlü bir atayıcı görevleri robotlar arasında dağıtıyor. GOAT-Bench değerlendirmesinde çift ajanlı sistem, Modular GOAT'ı 24,9%'dan 52,4% Alt Görev SR'ye taşıyarak 27,5 puanlık artış sağladı. Açık kelime dağarcıklı algılayıcıların keşif yerine hedef doğrulamayı baskın hata moduna dönüştürdüğünü ortaya koyan bulgular, modüler VLM mimarilerinin yaşam boyu gezinme için ne denli kritik olduğunu vurguluyor.
Arxiv CS.RO →
Paylaş: X · LinkedIn
3.
Araştırma
PrologMCP: LLM Ajanları İçin Sembolik Mantık Köprüsü
PrologMCP, LLM ajanlarını MCP üzerinden Prolog motoruna bağlayarak derin çıkarım görevlerinde neredeyse mükemmel doğruluğa ulaşıyor.
Sınır modeli dil modelleri derin tümdengelimli görevlerde hâlâ başarısız olurken, uzatılmış iç akıl yürütmenin maliyeti ölçek açısından verimsiz kalmaktadır. PrologMCP, bu soruna nöro-sembolik bir yanıt sunuyor: Model Context Protocol (MCP) üzerinden Prolog'u durum bilgili bir araç olarak açan görevden bağımsız açık kaynaklı bir sunucu. Kompakt araç arayüzü, yapılandırılmış hata raporlama ve oturum başına izolasyon sayesinde çevir-çalıştır-incele-onar döngüsü, MCP uyumlu herhangi bir ajan için yeniden kullanılabilir bir ilkel hale geliyor. PARARULE-Plus benchmark'ında PrologMCP destekli bir biçimlendirici ajan, genel örneklemde Claude Sonnet 4.6 ve o4-mini ile eşdeğer doğruluk elde ederken (1,00), bu modellerin 0,95–0,94'e düştüğü zorlu alt kümede 1,00/0,99 düzeyinde kalıcı başarı gösterdi. Sonuçlar, mantıksal çıkarımı Prolog'a devretmenin uzun bağlamsal akıl yürütmeye sağlam ve denetlenebilir bir alternatif olduğunu kanıtlıyor.
Arxiv CS.AI →
Paylaş: X · LinkedIn
4.
Araştırma
GRAPE: Parametre Uzayını Kademeli Açarak Daha Gürbüz Modeller
GRAPE, parametrelerin aktivasyon sırasını yönlendirerek aynı hesaplama bütçesiyle adversarial sağlamlığı %5 artırıyor.
GRAPE (Guided Parameter-Space Evolution), adversarial eğitimde parametrelerin optimizasyona açılma sırasının nihai sağlamlığı etkileyip etkilemediğini sistematik biçimde sorgulayan yeni bir eğitim çerçevesi sunuyor. Standart adversarial eğitim sabit bir parametre uzayında başlarken, GRAPE mevcut uzayı önce stabilize ediyor, ardından yeni optimize edilebilir boyutları kademeli olarak serbest bırakıyor ve adversarial spektral kullanım skoru ile yüksek baskı altındaki modülleri hedefliyor. CIFAR-10 üzerinde ResNet-18 ile yapılan deneylerde GRAPE, PGD-20 sağlamlık doğruluğunu 51,70%'den 56,94%'e yükseltti; FLOPs oranı neredeyse eşit (1,009x) kalırken parametre sayısı yaklaşık %21,4 azaldı. Aynı son mimariye sahip sıralı büyüme varyantı da 56,52% elde ederek kazanımın yalnızca mimari farklılıktan değil, parametre uzayının açılma yolundan kaynaklandığını doğruluyor; bu bulgu makine öğrenmesi güvenliği araştırmacıları için yeni bir tasarım boyutu açıyor.
Arxiv CS.LG →
Paylaş: X · LinkedIn
5.
Araştırma
FastMix: Tek Proxy Model ile Veri Karışımı Optimizasyonu
FastMix, ön-eğitim veri karışımını gradyan inişiyle otomatikleştirerek arama maliyetini dramatik biçimde düşürüyor.
Büyük modellerin performansı büyük ölçüde ön-eğitimde kullanılan veri karışımına bağlı olsa da bu karışımın nasıl belirleneceği hâlâ açık bir araştırma sorusudur. FastMix, karışım katsayılarını ve model parametrelerini eş zamanlı optimize eden yeni bir çerçeve sunarak bu sorunu tek bir proxy model eğitimiyle çözüyor. Yöntemin özünde karışım seçiminin iki seviyeli optimizasyon problemi olarak yeniden formüle edilmesi yatıyor: karışım oranlarını optimize etmenin, tekdüze kaynak örneklemesi altında kaynak başına kayıp ağırlıkları atamaya matematiksel olarak eşdeğer olduğu gösteriliyor. Bu sayede karışım katsayıları, türevlenebilir yinelemeli optimizasyon hedefine doğrudan gömülüyor. İç döngüde model parametreleri mevcut karışım oranlarına göre örneklenen veriyle, dış döngüde ise karışım oranları doğrulama geri bildirimiyle güncelleniyor. ICLR 2026'da kabul edilen FastMix, hem ön-eğitim hem de ince ayar aşamalarında taban çizgilerini geride bırakırken arama maliyetini önemli ölçüde azaltarak büyük model altyapısına doğrudan uygulanabilir bir araç sunuyor.
Arxiv CS.LG →
Paylaş: X · LinkedIn
6.
Araştırma
VLA İnce Ayarında Tohum Piyangosu: Gizli Risk ve Çözüm
Aynı kodla 13 farklı rastgele tohumda eğitilen VLA modelinin birinde başarı %91'den %65'e düşüyor; çıkış düzeyinde düzenlileştirme bunu önlüyor.
Tek GPU üzerinde vizyon-dil-eylem modeli (VLA-JEPA) ince ayarında kritik ama sessiz bir hata modu keşfedildi: aynı veri, aynı mimari ve farklı rastgele tohumla 13 kez çalıştırılan eğitimde 12 deney %91–94 başarı oranı üretirken bir deney hiçbir uyarı vermeksizin %65,2'ye geriledi. Araştırmacılar bu olguyu "tohum piyangosu" olarak adlandırdı. Sorunun kökü, eylem tahmin edicinin robota ne görüntülendiğinden bağımsız neredeyse özdeş çıktılar üretmeye başlaması, yani çıkış çöküşü. L2 ve EWC gibi ağırlık düzeyindeki yöntemler, çöküşün Jacobian boş uzayı boyunca gerçekleşmesi nedeniyle bu duruma karşı yapısal olarak kör kalıyor. 7 yöntem, 13 tohum ve 3 LIBERO benchmark'ı üzerinde yapılan deneylerde VICReg, Dropout ve yarıya indirilmiş öğrenme oranı gibi çıkış düzeyindeki düzenlileştiriciler her felaket tohumunu ortadan kaldırdı (0/21 çöküş). Bulgu, güvenilir VLA dağıtımı için eğitim sürecinde rastgele tohumun nasıl yönetildiğinin kritik önem taşıdığını gözler önüne seriyor.
Arxiv CS.RO →
Paylaş: X · LinkedIn
7.
Araştırma
Güvenilirlik Haritası ile İHA Navigasyonunda Güvenli Difüzyon Planlayıcı
VLM'den damıtılmış güvenilirlik haritası kullanan difüzyon planlayıcı, İHA çarpışma ihlal oranını %40'tan %9,6'ya indiriyor.
Otonom İHA navigasyonundaki ayrı algılama-haritalama-planlama aşamaları hata birikimi ve gecikmeye yol açarken, uçtan uca üretici modeller temiz veriyle eğitilip cam, ayna veya aşırı pozlanmış yüzeyler gibi bozulmuş gözlemleri güvenilir kanıt olarak işleme hatasına düşüyor. Önerilen güvenilirlik farkındalıklı difüzyon planlayıcı bu sorunu iki katmanlı bir yaklaşımla çözüyor: bir görsel-dil modelinin açık kelime dağarcıklı akıl yürütmesini gerçek zamanlı bütçeye sığdıran hafif bir ağ, sahne düzeyinde güvenilirlik ısı haritası üretiyor; ardından türevlenebilir iki aşamalı ESDF maliyeti, fiziksel engellerle güvenilmez bölgelerden gelen sanal engelleri eşit düzeyde değerlendirerek yörünge üretimini yönlendiriyor. Simülasyon ve gerçek bir quadrotor üzerinde yapılan testlerde engel ihlal oranı %40,3'ten %9,6'ya geriledi, geçilen bölgelerin ortalama güvenilirliği 0,588'den 0,925'e yükseldi. Damıtma sayesinde sistem tam VLM'e kıyasla 2 kat daha hızlı çalışıyor; bu denge özerk hava sistemlerinde gerçek zamanlı güvenli planlama için somut bir ilerleme anlamına geliyor.
Arxiv CS.RO →
Paylaş: X · LinkedIn
8.
Araştırma
RAMS: Gömülü Kenarda Dinamik YOLOv8 Model Seçimi
RAMS, Jetson Orin'de değişen kaynak baskısına göre YOLOv8 katmanları arasında geçiş yaparak gecikmeyi 5,6 kat azaltıyor.
Gömülü kenar donanımlarında nesne tespiti, değişen kaynak baskısı altında gecikme ile doğruluk arasındaki dengeyi yönetmeyi zorlaştırıyor. RAMS, bu sorunu çözmek için cihaz baskısını izleyen, boş davranıştan geçiş eşiklerini kalibre eden ve üç YOLOv8 katmanı (NANO/SMALL/MEDIUM) arasında model yeniden yükleme gecikmesi olmaksızın dinamik seçim yapan hafif bir çalışma zamanı denetleyicisi sunuyor. Özellikle yaya ve bisikletçi gibi savunmasız yol kullanıcıları (VRU) tespit edildikten sonra agresif düşürmeyi engelleyen tespit koşullu geçiş politikaları, SWAS metriğiyle ölçülen proxy doğruluğunu %25,4–47,3 oranında iyileştiriyor. Jetson Orin TensorRT'de ağır yük altında safety2 politikası 3,41 ms ortalama gecikme elde ederken sabit MEDIUM çıkarımına göre 5,6 kat hızlanma sağladı. Aynı denetleyici denklemlerinin Raspberry Pi 5'ten Jetson Orin'e 37 katlık gecikme aralığında çalışması, RAMS'ın geniş bir edge AI ekosisteminde doğrudan uygulanabilir olduğunu ortaya koyuyor.
Arxiv CS.CV →
Paylaş: X · LinkedIn