Kurumsal Finans ve Strateji Rehberi | Finance & Strategy Insights

Kumru.ai: Türkiye’nin Yapay Zeka Yolculuğunda Yeni Bir Dönüm Noktası – Gelişim Süreci, Topluluk Tepkileri ve Ekosistem Etkileri Üzerine Derinlemesine Bir Analiz

Posted in diğer by econvera on 13/10/2025

Yapay zekâ dünyası hızla evrilirken, Türkiye kendi diline ve yerel ihtiyaçlarına odaklanan büyük bir dil modeli (LLM) ile dikkatleri üzerine çekiyor: Kumru.ai. Daha önce mimarisi ve kurumsal kullanım alanları üzerine genel analizler yapılmış olsa da, bu yazı Kumru’nun geliştirme sürecine, maliyetine, VNGRS ekosistemiyle bağlantılarına, topluluk geri bildirimlerine ve uzun vadeli stratejik etkilerine daha derin bir bakış sunuyor.

https://kumru.ai/

Gelişim Süreci: Fikirden Lansmana

Kumru.ai, VNGRS tarafından geliştirilen yerli bir yapay zekâ yatırımı olarak Türkiye’nin teknoloji tarihinde önemli bir adımı temsil ediyor. BtcTurk tarafından satın alınan VNGRS, projeye yaklaşık 250.000 ABD doları yatırım yaptı.

Modelin ön eğitim süreci 8 adet Nvidia H200 GPU üzerinde 45 gün sürdü ve PyTorch ile DeepSpeed altyapıları kullanıldı. Eğitim için 500 GB’lık, 120 milyar tokenlık bir veri setiyle başlandı; süreç sonunda 300 milyar tokena ulaşıldı. Veri kaynağı; web içerikleri, kod, matematiksel veriler ve 2024 Mart’ına kadar olan tarihsel metinleri kapsıyor.

Kumru’nun en dikkat çekici yönlerinden biri, sıfırdan eğitilmiş 50.176 kelimelik özel bir Türkçe BPE tokenizer kullanması. Bu sayede çok turlu konuşmalarda daha doğal yanıtlar verebiliyor ve kod/matematik işlemlerinde transfer learning’e ihtiyaç duymadan performans gösterebiliyor.

Geliştirme sürecinde VNGRS ekibi, Hugging Face Transformers kütüphanesine katkıda bulunarak “flash attention packing” hatasını çözdü — bu katkı 4.47.0 sürümüne entegre edildi.

Bugün itibarıyla AWS Marketplace üzerinde API olarak hizmet veren Kumru, kullanıma göre ücretlendirme (pay-as-you-go) modeliyle erişime açık durumda.

VNGRS Ekosistemi ve İlgili Projeler

Kumru.ai tek başına bir ürün değil; VNGRS’nin geniş Türkçe NLP ekosisteminin bir parçası.

2009 yılında Koç Üniversitesi mezunları tarafından kurulan VNGRS, Netflix’in 1 milyon dolarlık öneri sistemi yarışmasında ikinci olarak uluslararası alanda adını duyurmuştu.

Şirketin diğer önemli projeleri arasında:

  • VNLP: Türkçe doğal dil işleme için açık kaynak Python kütüphanesi (pip install vngrs-nlp)
  • VBART: Meta’nın BART mimarisi üzerine kurulu, 387 milyon parametreli bir özetleme ve yeniden yazma modeli (Türkiye’nin ilk LLM’lerinden biri, 2023).
  • TURNA: Boğaziçi Üniversitesi TABILAB ile birlikte geliştirilen 1.1 milyar parametreli T5 tabanlı model (ACL 2024’te yayımlandı).
  • Autopaper: Belgeleri OCR yoluyla JSON formatına dönüştüren belge işleme aracı.

Bu projeler, TÜBİTAK Ar-Ge destekleri ve AB konsorsiyumları kapsamında yürütülüyor. VNGRS, Kumru’yu ticari kazançtan çok bulut ve yapay zekâ danışmanlık kabiliyetlerini güçlendiren stratejik bir yan ürün olarak konumlandırıyor.

Topluluk Tepkileri: Güçlü Başlangıç, Dikkatli Bekleyiş

Ekim 2025’teki lansmanından bu yana Kumru.ai, sosyal medyada yoğun tartışmalara konu oldu.

Kullanıcılar özellikle Türkçe anlama ve üretme yeteneğini övüyor; bazı testlerde yabancı modellere kıyasla küçük ölçekli işler için daha başarılı bulunduğu belirtiliyor.

Ancak birçok erken kullanıcı modele “henüz olgunlaşma aşamasında” yorumunu yapıyor.

Bazı eleştiriler, modelin sistem yönlendirmesinin (system prompt) çok kimlik odaklı olmasından dolayı sık sık “Ben Kumru’yum” gibi yanıtlar vermesine odaklanıyor.

Podcast’lerde ve geliştirici forumlarında “transfer learning olmadan Türkçe eğitilmiş ilk model” olması “deneyim açısından paha biçilemez” bir adım olarak görülüyor.

Her ne kadar matematik ve mantık görevlerinde eksikleri olsa da, VNGRS ekibi – özellikle ML Lead Melikşah Türker (Boğaziçi Üniversitesi doktora adayı) – teknik yetkinliğiyle takdir topluyor.

Gelecek Yol Haritası: Ölçekleme ve Multimodal Genişleme

VNGRS, kısa vadede Kumru’ya RLHF (Reinforcement Learning from Human Feedback) entegrasyonu planlıyor. Bu sayede halüsinasyon oranlarını düşürmeyi hedefliyor.

Ayrıca modelin görsel ve belge işleme (multimodal) yeteneklerle genişlemesi, taranan dokümanlardan veri çıkarımı gibi alanlarda kullanılabilmesi planlanıyor.

7.4 milyar parametreli mevcut sürümün ötesine geçecek daha büyük versiyonların ve güncel veri setlerinin yolda olduğu da doğrulandı.

Açık kaynaklı Kumru-2B modeli, Hugging Face üzerinden geliştiricilere sunularak topluluk katkısına açık hale getirildi.

Sonuç: Türkiye’nin Dijital Egemenliğinde Stratejik Bir Adım

Kumru.ai, yalnızca teknik bir başarı değil; Türkiye’nin veri güvenliği, dilsel bağımsızlık ve yapay zekâ egemenliği yolunda stratejik bir yatırım.

250.000 dolarlık geliştirme maliyetiyle başlayan bu proje, bugün AWS üzerinde kurumsal düzeyde erişilebilir durumda.

Gerek topluluk desteği, gerekse akademik iş birlikleriyle birlikte Kumru, Türkiye’nin yapay zekâ alanındaki konumunu güçlendirme potansiyeline sahip.

Henüz erken aşamada olsa da, doğruluk, yerelleştirme ve erişilebilirlik açısından önemli bir temel oluşturuyor.

Kumru’nun hikâyesi, Türkiye’nin yalnızca teknoloji tüketicisi değil, üreticisi olma yolundaki dönüşümünün sembolü.

Gerçek başarısını ise yalnızca saha uygulamaları ve sürdürülebilir inovasyon belirleyecek.

https://kumru.ai/

Yorum bırakın