1.
Araç
PyTorch'ta Profiling: nn.Linear'dan Fused MLP'ye
PyTorch profiling serisinin ikinci bölümü, nn.Linear'dan başlayarak fused MLP oluşturmaya kadar pratik GPU optimizasyon tekniklerini ele alıyor.
Hugging Face'in PyTorch profiling serisinin ikinci bölümü, derin öğrenme modellerinin temel yapı taşı olan nn.Linear katmanının GPU üzerindeki davranışını inceliyor ve üç katmanlı bir MLP bloğunun nasıl optimize edileceğini gösteriyor. Seri, birinci bölümde ele alınan ham matris çarpımı ve toplama işlemlerinin üzerine inşa ediliyor; nn.Linear'ın bu işlemleri parametre yönetimiyle nasıl sardığını, CPU-GPU zamanlama yükünün nerede ortaya çıktığını ve torch.compile'ın bu yükü nasıl azalttığını NVIDIA A100 GPU'su üzerinde gerçek profiler izleriyle somutlaştırıyor. Kernel füzyonu sayesinde birden fazla GPU operasyonunun tek bir geçişte birleştirilebildiği ve bellek bant genişliği kullanımının önemli ölçüde iyileştirilebildiği gösteriliyor. ML mühendisliği pratiğinde sıkça gözden kaçan bu düşük seviyeli optimizasyon teknikleri, büyük modellerin eğitim ve çıkarım maliyetlerini doğrudan etkiliyor; seri, bu alana somut ve tekrarlanabilir bir giriş noktası sunuyor.
Hugging Face Blog →
2.
Finansman
DeepMind Çok-Etmenli Yapay Zeka Güvenliği İçin 10 Milyon Dolar Ayırdı
Google DeepMind ve ortakları, milyonlarca yapay zeka etmeninin etkileşiminden doğan güvenlik risklerini araştırmak için 10 milyon dolarlık fon açıkladı.
Google DeepMind, Schmidt Sciences, Cooperative AI Foundation ve ARIA ile birlikte çok-etmenli yapay zeka güvenliği araştırmaları için 10 milyon dolara kadar finansman sağlayacak küresel bir çağrı başlattı. Yapay zekanın bireysel model düzeyinden bağımsız sistemlerin birbirleriyle etkileşime girdiği ekosistem düzeyine geçişiyle birlikte, yeni ve öngörülmesi güç kolektif davranışlar ortaya çıkabiliyor; mevcut güvenlik değerlendirmeleri ise modelleri yalıtılmış biçimde test ettiğinden bu riskleri yakalayamıyor. Fonlama çağrısı; büyük ölçekli çok-etmenli sistemlerin grup davranışlarını anlamaya, bu geçişleri tahmin etmeye ve potansiyel ekonomik veya güvenlik tehditlerini hafifletmeye yönelik çerçeveler geliştirmeye odaklanıyor. DeepMind'ın daha önce yayımladığı AI Agent Traps çalışması ve 2025 çok-etmenli etkileşim çerçevesi bu girişimin temelini oluşturuyor. Farklı kurumlardan bağımsız araştırmacıları bir araya getirmeyi hedefleyen bu adım, yapay zeka güvenliğinin bireysel model odağından sistem düzeyine taşınması gereken kritik bir dönüm noktasına işaret ediyor.
DeepMind Blog →
3.
Araştırma
LLM'ler Otonom Sürüşü Mümkün Kılar mı?
Büyük dil modellerinin otonom araç sistemlerine entegrasyonunun fırsatları ve kritik güvenlik riskleri mercek altında.
The Gradient'ta yayımlanan bu analiz, büyük dil modellerinin (LLM) on yıllardır çözülemeyen otonom sürüş problemine beklenmedik bir çözüm sunup sunamayacağını sorguluyor. Geleneksel otonom araç mimarileri algılama, konumlandırma, planlama ve kontrol olmak üzere dört ayrı modüle dayanırken, uçtan uca öğrenme yaklaşımları tüm bu işlevleri tek bir sinir ağında toplamayı deniyor; ancak bu yöntem kara kutu sorununu beraberinde getiriyor. LLM'lerin doğal dil muhakemesi, sürüş senaryolarının yorumlanmasında ve beklenmedik durumlarla başa çıkmada yeni olanaklar sunabileceği öne sürülüyor; öte yandan gerçek zamanlı karar verme gereksinimleri, yorumlanabilirlik eksikliği ve doğrulama güçlükleri ciddi engeller olarak öne çıkıyor. Algılamadan kontrole uzanan tüm zincirde güvenilirliğin nasıl sağlanacağı sorusu yanıtsız kalıyor. Yapay zekanın hem NLP hem de robotik alanında aynı anda sıçrama yaptığı bu dönemde, bu iki alanın kesişiminin otonom sürüşe gerçekten ne katabileceğini ve hangi riskleri doğurabileceğini anlamak giderek daha kritik bir önem kazanıyor.
The Gradient →
4.
Araç
Transformers v5.12.0: MiniMax-M3-VL ve Yeni Modeller
Hugging Face Transformers'ın yeni sürümü çok modlu MiniMax-M3-VL, hafif OCR sistemi PP-OCRv6 ve Parakeet-RNNT'yi ekosisteme katıyor.
Hugging Face, Transformers kütüphanesinin v5.12.0 sürümünü yayımladı; bu güncelleme üç önemli yeni model ekliyor. MiniMax-M3-VL, CLIP tarzı bir görsel kule ile MiniMax-M3 metin omurgasını bir araya getiren çok modlu bir dil modelidir; seyrek dikkat mekanizması için lightning indexer ve 3D döner konum gömmeleri gibi verimlilik odaklı bileşenler içeriyor. PP-OCRv6, MetaFormer tarzı yapısal yeniden parametreleme bloklarına dayanan hafif bir OCR sistemi olarak sunucudan uç cihaza kadar üç farklı model boyutuyla geliyor. Parakeet-RNNT ise Fast Conformer kodlayıcı ile RNN-T kod çözücüyü birleştiren hızlı bir konuşma tanıma modelidir. Söz konusu eklemeler, açık kaynak model ekosistemini çok modlu anlama, optik karakter tanıma ve konuşma işleme alanlarında genişletiyor; araştırmacılar ve geliştiriciler bu modellere standart Transformers API'si üzerinden erişebiliyor. Açık kaynak altyapısının giderek daha zengin ve erişilebilir bir hal alması, bu alandaki araştırma ve geliştirme döngülerini önemli ölçüde hızlandırıyor.
Transformers Releases →
5.
Araştırma
İç Mekan Robotları İçin Doluluk Tabanlı Oda Segmentasyonu
Yeni bir boru hattı, iç mekan robotlarının 3B sahne graflarında oda düğümlerini serbest alan haritasına dayalı poligonal sınırlarla çıpalanıyor.
Arxiv'de yayımlanan bu çalışma, iç mekan robotlarına yönelik hiyerarşik 3B sahne graflarında (3DSG) oda katmanını oluşturmak için doluluk haritasına dayalı yeni bir yaklaşım sunuyor. Mevcut sistemler oda düğümlerini yer kümeleri, duvar düzlemleri veya segmentasyon çıktıları gibi farklı uzamsal altyapılardan türetiyor; bu tutarsızlık, oda düğümlerinin ortak bir geometrik ölçütle değerlendirilmesini güçleştiriyor. Önerilen boru hattında her oda düğümü, doluluk ayrıştırmasından elde edilen takip edilmiş serbest alan bölgelerine açık bir poligonal ayak izi ile bağlanıyor. Yöntem, 12 Matterport3D sahnesi üzerinde Hydra baseline'ı ile karşılaştırılıyor; sonuçlar, doluluk tabanlı çapalama ile önemli ölçüde daha fazla oda örneğinin kurtarılabildiğini, ancak bunun düşük kesinlik pahasına geldiğini ve duvar hassas oda sınırlarının her iki yöntem için de açık bir problem olmaya devam ettiğini gösteriyor. Oda düzeyi uzamsal muhakemenin robot navigasyonu ve görev planlaması için kritik önemi düşünüldüğünde, bu çalışma robotik algı-haritalama zincirinde somut ve ölçülebilir bir ilerleme sağlıyor.
Arxiv CS.RO →
6.
Endüstri
DeepMind Avrupa'da 15 Robotik Girişimini Hızlandırıyor
Google DeepMind, Avrupa'dan seçilen 15 erken aşama robotik girişimine 3 aylık yoğun mentorluk ve yapay zeka teknoloji erişimi sunuyor.
Google DeepMind, Avrupa genelindeki erken aşama robotik girişimlerini desteklemek amacıyla Google DeepMind Accelerator: Robotics programını başlattı. Seçilen 15 girişim, üç aylık süreçte Google DeepMind'ın yapay zeka modelleri ve teknik altyapısına erişimin yanı sıra ürün geliştirme ve araştırmadan uygulamaya geçiş konularında uygulamalı mentorluk alacak. Program kapsamındaki girişimler sağlık, üretim, inşaat ve iklim çözümleri gibi farklı sektörlere yönelik fiziksel yapay zeka uygulamaları geliştiriyor. DeepMind'ın dil, görü ve aksiyon modellerindeki birikimini robotik donanımla buluşturmayı hedefleyen bu inisiyatif, Avrupa'nın fiziksel yapay zeka ekosistemini güçlendirme stratejisinin somut bir adımını oluşturuyor. Büyük teknoloji şirketlerinin araştırma altyapısını doğrudan girişim ekosistemiyle paylaşması, özellikle donanım maliyetleri ve veri kısıtları nedeniyle hız kazanmakta zorlanan robotik startuplar için kritik bir ivme kaynağı olabilir.
DeepMind Blog →
7.
Araştırma
Makine Öğrenmesinde Matematiğin Değişen Rolü
Topoloji ve cebirden ölçek odaklı mühendisliğe: Matematiğin makine öğrenmesi araştırmalarındaki rolü dönüşüyor, ama yok olmuyor.
The Gradient'ta yayımlanan bu kapsamlı analiz, matematiğin makine öğrenmesi araştırmalarındaki rolünün nasıl köklü bir dönüşüm geçirdiğini inceliyor. Son on yılda dikkatle tasarlanmış matematiksel mimarilerin ancak marjinal iyileştirmeler sağladığı, buna karşın hesaplama ölçeğini ve veri hacmini artıran mühendislik odaklı yaklaşımların mevcut teorinin öngöremediği yetenekler ortaya çıkardığı gözlemleniyor. Bu durum, matematiğin öncülük ettiği teorik garantiler yerine ölçek sonrası gözlemlenen ampirik olguların açıklanmasında ve yüksek düzeyli mimari seçimlerde—örneğin veri simetrilerinin mimariyle eşleştirilmesinde—giderek daha fazla kullanılacağına işaret ediyor. Topoloji, cebir ve geometri gibi "saf" matematiksel alanların, olasılık kuramı ve lineer cebirin yanına eklenerek makine öğrenmesiyle kesişim alanını genişlettiği vurgulanıyor. Yazarlar, matematiğin rolünün küçüldüğü değil, yönünün değiştiği tezini savunuyor; bu bakış açısı, teorik ile ampirik araştırma arasındaki dengeyi yeniden kurmaya çalışan araştırmacılar için güçlü bir perspektif sunuyor.
The Gradient →