Laboratuvar, sistemlerinin ne yaptığını ve ne ölçtüğünü yayınlar; nasıl kurulduklarını değil. Sonuçlar hak edildikçe burada yayınlanır.
Yazılım Kararlılık Endeksi (SSI)
Neyin kırıldığını ve yerinde saymanın maliyetini ölçmek
Software Stability Index, yazılım teknolojilerinin gerçek kullanımda ne kadar kararlı kaldığının uzun dönemli ölçüsüdür: ne sıklıkla kırıldıkları, güncel kalmanın maliyeti, dokümantasyonun ve topluluk yanıtlarının nasıl eskidiği. Puanlar kayıtlı gözlemlerden kazanılır, önceden ilan edilmez; veriler desteklemeden hiçbir puan yayınlanmaz. Aynı yöntem, LLM modellerinin performansını zaman içinde izlemeye doğru genişletiliyor. Gerekçe, tanıtım yazısında ve aceleye getirilmiş yeniliğin gizli maliyeti üzerine 16 dakikalık bir konuşmada anlatılıyor.
[OWNER TO PROVIDE DATA: yayınlanan ilk puanlar ve grafikler burada yer alacak.]
Denetlenebilir yapay zekâ kod üretimi
Kara kutu değil, gözden geçirilebilir kod
Laboratuvarın üreteçleri, deterministik şablonları LLM desteğiyle birleştirir; üretilen çıktı kabul edilmeden önce denetlenir. İddia: bir meslektaşın pull request'i gibi gözden geçirebileceğiniz kod. Önce güvenilirlik ve incelenebilirlik gelir; üretim hızı hedef değil, sonuçtur.
Süreç öncelikli yapay zekâ orkestrasyonu
Varsayılan olarak deterministik, gerektiğinde ajan tabanlı
Yapay zekâ ajanlarını yönetmek için tasarlanmış bir iş süreci ve kural motoru platformu. Ortada model yokken aynı süreçler tamamen deterministik iş akışları olarak çalışır; kritik hiçbir şey bir LLM'in varlığına bağlı değildir. Bugün laboratuvarın iç operasyonlarını da bu platform yürütüyor.
LLM entegre yerel uygulama üretimi
SwiftUI ve SwiftData, henüz yayınlanmadı
Laboratuvarda SwiftUI ve SwiftData üreteçleri mevcut, ancak yayınlanmadı. Yerleşik LLM entegrasyonu tamamlandığında çıkacaklar.
E-posta kimlik doğrulama tehdit istihbaratı
DMARC raporlarından adı konmuş IP adreslerine
Toplu DMARC raporları, bir alan adını taklit eden IP adreslerini gösterir. DMARC Aide bu analizi bugün iOS ve macOS'ta sunuyor; süregelen çalışmalar bunu yapay zekâ destekli bir web uygulama güvenlik duvarına doğru genişletiyor.
PHP web geliştirmede yerel LLM'ler
Sıradan donanım, işe yarar sonuçlar
Yerelde barındırılan modellerin sıradan donanım üzerinde PHP web uygulamalarında neyi güvenilir biçimde otomatikleştirebildiği ve deterministik araçların nerede hâlâ üstün olduğu. Bulgular laboratuvarın üreteçlerini ve eğitim içeriklerini besliyor.