Ali Buğatekin

kayıttan

20.05.2026 · 6 dk okuma

Karpathy Anthropic'te: Claude Claude'u Eğitirse Ne Olur?

Ali Buğatekin

AnthropicClaudeAndrej KarpathyAI ResearchPre-training

Andrej Karpathy'nin Anthropic'e katılmasıyla ilgili haber çıktığında ilk düşüncem "bir araştırmacı daha yer değiştirdi" oldu. Sonra görevi okuyunca durdum.

Görevi: **Claude'u kullanarak Claude'un pre-training araştırmasını hızlandırmak.**

Yani AI, kendi eğitimini daha verimli hale getirmek için kullanılacak. Bu cümleyi bir kez daha okumaya değer.

Karpathy haberi kendi X hesabından duyurdu:

I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D.

Andrej Karpathy, X paylaşımı

Anthropic'te ekip lideri **Nick Joseph**'in altında çalışacak ve onun ekibi içinde, Claude'u kendi pre-training sürecini hızlandırmak için kullanacak yepyeni bir grup kuracak. Nick Joseph de karşılama mesajında Karpathy'nin "tam olarak bu zorluk için biçilmiş kaftan" olduğunu söyledi.

Karpathy'nin Yolculuğu

Bu transferin neden ses getirdiğini anlamak için Karpathy'nin geçmişine bir bakmak gerekiyor:

  • OpenAI'ın **kurucu üyelerinden**, 2017'ye kadar AI tarafında liderlik etti
  • Tesla'da yaklaşık **5 yıl** Autopilot ve Full Self-Driving ekibini yönetti (2017-2022)
  • 2023'te OpenAI'a kısa süreliğine geri döndü, **2024'te tekrar ayrıldı**
  • **Eureka Labs** adlı eğitim odaklı AI startup'ını kurdu
  • Şimdi Eureka Labs'ı duraklatıp **Anthropic'e** geçiyor

Karpathy aynı paylaşımda eğitim işini bırakmadığını da ekledi:

I remain deeply passionate about education and plan to resume my work on it in time.

Andrej Karpathy

Yani şimdilik frontier LLM araştırmasına dönmek için Eureka Labs'a ara veriyor. Bu kendi başına anlamlı bir sinyal: bir eğitim startup'ı kurmuş biri, model geliştirme cephesine dönmeyi yeterince önemli buluyor.

Pre-training Nedir

Pre-training, bir modelin bilgisini kazandığı aşama. İnternetten, kitaplardan, kod repolarından beslenen bu süreç aynı zamanda en pahalı olanı. Büyük GPU kümelerinde haftalarca çalışan hesaplama süreçleri.

Claude nasıl yazı yazacağını, nasıl akıl yürüteceğini, nasıl kod üreteceğini bu aşamada öğreniyor. **Bu aşamayı hızlandırmak, her şeyi hızlandırmak demek.**

Anthropic'in Farklı İddiası

Anthropic'in yaklaşımı şu: daha fazla compute yerine, **AI destekli araştırmayla** bu aşamayı daha verimli hale getirebiliriz.

Karpathy bu fikri hayata geçirecek yeni ekibi Nick Joseph'in pre-training ekibi içinde kuracak. Claude'u kullanarak pre-training pipeline'ının hangi kısımlarının daha verimli yapılabileceğini araştıracaklar.

Compute değil, zeka farkı belirleyici.

Anthropic'in örtük tezi

Sonsuz GPU yerine, daha akıllı araştırma süreçleri. OpenAI ve Google'a karşı bu, fonlama ve donanım yarışına farklı bir cephe açmak anlamına geliyor.

Özyinelemeli Döngü

İşte bu noktada kafam karışıyor — ama iyi bir şekilde.

Eğer Claude, kendi eğitimini hızlandırmak için kullanılırsa, daha iyi bir Claude çıkıyor. Bu daha iyi Claude da bir sonraki pre-training sürecinde kullanılabilir. Ve döngü devam ediyor.

Bu teorik bir senaryo değil. Karpathy'nin görevi tam olarak bu döngünün **pratik versiyonunu** kurmak.

Araştırmacılar hangi kararları alıyor, Claude hangilerini? Bu soruyu yanıtlamak giderek güçleşiyor.

Uygulama Geliştirici Olarak Benim İçin Ne Anlama Geliyor

Ben bu döngünün içinde değilim. Pre-training ekipleri benim yaptığım işlerle doğrudan konuşmuyor.

Ama şunu fark ediyorum: **model geliştirme ve uygulama geliştirme arasındaki sınır bulanıklaşıyor.**

Dün "modeli al, üstüne uygulama yaz" vardı. Şimdi model kendi altyapısını geliştirmek için kullanılıyor. Bu benim işimi kısa vadede değiştirmiyor. Ama uzun vadede hangi araçları kullandığım, modelin ne kadar hızlı değiştiği — bunların hepsi bu döngünün hızına bağlı.

Küçük bir not: "vibe coding" terimini de Karpathy türetti. Şimdi vibe coding'i mümkün kılan modelin altyapısına geçiyor — hoş bir döngü.

Sonuç

Karpathy'nin Anthropic'e geçişi bir kariyer haberi olarak okunabilir. Ama altındaki soru daha kalıcı: **AI'ın kendi eğitimine dahil olması ne anlama geliyor?**

Tempo değişiyor. Modeller daha hızlı iyileşiyor. Ve bu hızın nereden beslendiği artık daha görünür hale geliyor.

yararlı bulduysan paylaş