DeepSeek, tek GPU ile çalışabilen yeni modelini tanıttı

DeepSeek, Yeni Yapay Zeka Modeli DeepSeek-R1-0528-Qwen3-8B’yi Tanıttı

Çinli yapay zeka laboratuvarı DeepSeek, daha az kaynak kullanarak yüksek performans sağlayan yeni modeli DeepSeek-R1-0528-Qwen3-8B’yi duyurdu. Bu model, sadece tek bir GPU üzerinde çalışabiliyor ve diğer modellere kıyasla önemli avantajlar sunuyor.

DeepSeek’in yeni modeli, temelini Alibaba’nın Mayıs 2025’te tanıttığı Qwen3-8B modelinden almıştır. Laboratuvar, büyük R1 modelinden elde ettiği verilerle bu küçük versiyonu eğitmeyi başardı. Bu yöntemle geliştirilen model, Google’ın Gemini 2.5 Flash modelini içeren zorlu matematik testlerinden biri olan AIME 2025’te başarılı oldu. Ayrıca Microsoft’un Phi 4 Reasoning Plus modeline, HMMT sınavında da oldukça yakın bir performans sergiledi.

Küçük yapay zeka modelleri genellikle sınırlı becerilere sahip olsa da, DeepSeek-R1-0528-Qwen3-8B’nin dikkat çekici yanı düşük donanım gereksinimidir. NodeShift’in verilerine göre, bu model 40 ila 80 GB RAM’e sahip tek bir Nvidia H100 GPU ile çalışabiliyor. Oysa tam boyutlu R1 modeli, yaklaşık 12 adet 80 GB’lık GPU gerektiriyor.

Model, MIT lisansı ile ticari kullanıma sunulmuştur ve Hugging Face ve LM Studio gibi platformlardan erişilebilir durumdadır. Bu yapay zeka modeli, akademik ve endüstriyel alanda kullanım için tasarlanmıştır.

Related Posts

Apple’dan Meta’ya rakip olacak akıllı gözlük

Apple’ın bu yıl içinde hazır olabilecek akıllı gözlükler üzerinde çalıştığı yeni bir haberde bildirildi.

Sosyal medyayı sallayan Google Veo 3 Türkçe kullanıma açıldı! Peki nasıl kullanılır?

Son günlerde sosyal medya platformlarına damga vuran Google’ın ultra gerçekçi videolar oluşturan yapay zekası Veo 3 Türkçe kullanıma açıldı. Veo 3 fiyatı, özellikleri ve bilmeniz gereken tüm detaylar.

Uzayın kokusu sandığınız gibi değil! Bilim insanları açıklıyor

Uzay, kokusuz bir boşluk gibi algılansa da, astronotlar uzay kıyafetlerinden dönerken farklı kimyasal kokularla karşılaşıyor. Bilim insanları, Jüpiter’den Mars’a kadar birçok gezegenin ve gaz bulutunun birbirinden ilginç kokulara sahip olduğunu açıklıyor. Peki, uzayın kokusu aslında nasıl? İşte merak edilenler ve şaşırtıcı gerçekler…

Snapchat patronuna göre en iyi çalışanların sahip olduğu 3 temel özellik

Günümüzün zorlu iş piyasasında, çalışanlar kendisini farklılaştırmanın ve kariyerinde ilerlemenin yollarını arıyor. Milyarlarca dolarlık Snapchat şirketinin CEO’su Evan Spiegel, “The Diary of a CEO” podcast’inde ideal bir çalışanın sahip olması gereken üç özelliği açıkladı.

Bordan yüksek koruyuculuğu olan cerrahi maske üretildi

Bolu Abant İzzet Baysal Üniversitesi (BAİBÜ) akademisyenleri, bor madeninden yüksek koruyuculuğa sahip, konforlu kullanım sunan cerrahi maske geliştirdi.

Türkiye Sujeti ve Flyboard Türkiye Motosurf Şampiyonası Bodrum’da yapılacak

Türkiye Sujeti ve Flyboard Türkiye Motosurf Şampiyonası yarın Muğla’nın Bodrum ilçesinde başlayacak.