kayıttan
20.05.2026 · 6 dk okuma
— Ali Buğatekin
Andrej Karpathy'nin Anthropic'e katılmasıyla ilgili haber çıktığında ilk düşüncem "bir araştırmacı daha yer değiştirdi" oldu. Sonra görevi okuyunca durdum.
Görevi: **Claude'u kullanarak Claude'un pre-training araştırmasını hızlandırmak.**
Yani AI, kendi eğitimini daha verimli hale getirmek için kullanılacak. Bu cümleyi bir kez daha okumaya değer.
Karpathy haberi kendi X hesabından duyurdu:
I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D.
— Andrej Karpathy, X paylaşımıAnthropic'te ekip lideri **Nick Joseph**'in altında çalışacak ve onun ekibi içinde, Claude'u kendi pre-training sürecini hızlandırmak için kullanacak yepyeni bir grup kuracak. Nick Joseph de karşılama mesajında Karpathy'nin "tam olarak bu zorluk için biçilmiş kaftan" olduğunu söyledi.
Bu transferin neden ses getirdiğini anlamak için Karpathy'nin geçmişine bir bakmak gerekiyor:
Karpathy aynı paylaşımda eğitim işini bırakmadığını da ekledi:
I remain deeply passionate about education and plan to resume my work on it in time.
— Andrej KarpathyYani şimdilik frontier LLM araştırmasına dönmek için Eureka Labs'a ara veriyor. Bu kendi başına anlamlı bir sinyal: bir eğitim startup'ı kurmuş biri, model geliştirme cephesine dönmeyi yeterince önemli buluyor.
Pre-training, bir modelin bilgisini kazandığı aşama. İnternetten, kitaplardan, kod repolarından beslenen bu süreç aynı zamanda en pahalı olanı. Büyük GPU kümelerinde haftalarca çalışan hesaplama süreçleri.
Claude nasıl yazı yazacağını, nasıl akıl yürüteceğini, nasıl kod üreteceğini bu aşamada öğreniyor. **Bu aşamayı hızlandırmak, her şeyi hızlandırmak demek.**
Anthropic'in yaklaşımı şu: daha fazla compute yerine, **AI destekli araştırmayla** bu aşamayı daha verimli hale getirebiliriz.
Karpathy bu fikri hayata geçirecek yeni ekibi Nick Joseph'in pre-training ekibi içinde kuracak. Claude'u kullanarak pre-training pipeline'ının hangi kısımlarının daha verimli yapılabileceğini araştıracaklar.
Compute değil, zeka farkı belirleyici.
— Anthropic'in örtük teziSonsuz GPU yerine, daha akıllı araştırma süreçleri. OpenAI ve Google'a karşı bu, fonlama ve donanım yarışına farklı bir cephe açmak anlamına geliyor.
İşte bu noktada kafam karışıyor — ama iyi bir şekilde.
Eğer Claude, kendi eğitimini hızlandırmak için kullanılırsa, daha iyi bir Claude çıkıyor. Bu daha iyi Claude da bir sonraki pre-training sürecinde kullanılabilir. Ve döngü devam ediyor.
Bu teorik bir senaryo değil. Karpathy'nin görevi tam olarak bu döngünün **pratik versiyonunu** kurmak.
Araştırmacılar hangi kararları alıyor, Claude hangilerini? Bu soruyu yanıtlamak giderek güçleşiyor.
Ben bu döngünün içinde değilim. Pre-training ekipleri benim yaptığım işlerle doğrudan konuşmuyor.
Ama şunu fark ediyorum: **model geliştirme ve uygulama geliştirme arasındaki sınır bulanıklaşıyor.**
Dün "modeli al, üstüne uygulama yaz" vardı. Şimdi model kendi altyapısını geliştirmek için kullanılıyor. Bu benim işimi kısa vadede değiştirmiyor. Ama uzun vadede hangi araçları kullandığım, modelin ne kadar hızlı değiştiği — bunların hepsi bu döngünün hızına bağlı.
Küçük bir not: "vibe coding" terimini de Karpathy türetti. Şimdi vibe coding'i mümkün kılan modelin altyapısına geçiyor — hoş bir döngü.
Karpathy'nin Anthropic'e geçişi bir kariyer haberi olarak okunabilir. Ama altındaki soru daha kalıcı: **AI'ın kendi eğitimine dahil olması ne anlama geliyor?**
Tempo değişiyor. Modeller daha hızlı iyileşiyor. Ve bu hızın nereden beslendiği artık daha görünür hale geliyor.
yararlı bulduysan paylaş