VENG RADYO CANLI

VENG RADYO CANLI

  • ANA SAYFA
  • GÜNDEM
  • BÖLGE
  • EKONOMİ
  • DÜNYA
  • KÜLTÜR SANAT
  • BİLİM
  • YAZARLAR
  • ANA SAYFA
  • GÜNDEM
  • BÖLGE
  • EKONOMİ
  • DÜNYA
  • KÜLTÜR SANAT
  • BİLİM
  • YAZARLAR
  • ANA SAYFA
  • GÜNDEM
  • BÖLGE
  • EKONOMİ
  • DÜNYA
  • KÜLTÜR SANAT
  • BİLİM
  • YAZARLAR
  • ANA SAYFA
  • GÜNDEM
  • BÖLGE
  • EKONOMİ
  • DÜNYA
  • KÜLTÜR SANAT
  • BİLİM
  • YAZARLAR

VENG RADYO CANLI

Anasayfa » Our Authors » NVIDIA’dan 6.3 trilyon tokenli veritabanı: Nemotron-CC

NVIDIA’dan 6.3 trilyon tokenli veritabanı: Nemotron-CC

0
By Veng Haber on 14/01/2025 BİLİM
Paylaş
Facebook Twitter Email WhatsApp Copy Link

NVIDIA, yapay zeka alanında tarihi bir adım atarak Nemotron-CC adını verdiği devasa bir İngilizce AI eğitim veritabanını duyurdu. Yeni veritabanı, toplam 6.3 trilyon token içeriyor ve bunun 1.9 trilyonu sentetik verilerden oluşuyor. NVIDIA, bu yeni veritabanının, büyük dil modellerinin (LLM) eğitimi için bugüne kadar geliştirilen en kapsamlı kaynaklardan biri olduğunu belirtti. Şirket, özellikle akademik ve ticari alanlarda bu yeniliğin büyük bir fark yaratacağını ifade etti. İşte detaylar…

NVIDIA 6.3 trilyon tokenli yapay zeka eğitim veritabanı Nemotron-CC modelini tanıttı

Nemotron-CC veritabanının geliştirilme sürecinde, Common Crawl platformundan alınan büyük miktarda veri kullanıldığı aktarıldı. Bu veriler, sıkı bir veri işleme ve filtreleme sürecinden geçirilerek yüksek kaliteli bir alt küme olan Nemotron-CC-HQ oluşturulmuş. NVIDIA, bu veritabanının “büyük dil modelleri için ideal bir eğitim materyali” olduğunu söylüyor.

Aslında bu yeniliğin, mevcut eğitim veritabanlarının ölçek ve kalite bakımından karşılaştığı kısıtlamalara çözüm sunması bekleniyor. Özellikle Deep Common Crawl Language Model (DCLM) gibi lider açık kaynak veritabanlarına kıyasla daha üstün bir performans sunacak. NVIDIA, Nemotron-CC ile eğitilen modellerin çeşitli testlerde dikkate değer iyileştirmeler sağladığını açıkladı. Örneğin:

  • MMLU (Massive Multitask Language Understanding) testlerinde mevcut sistemlere kıyasla 5.6 puan artış elde edildi.
  • 80 milyar parametreli modeller, MMLU testlerinde 5 puan, ARC-Challenge testlerinde ise 3.1 puan iyileşme gösterdi.
  • Nemotron-CC’nin, diğer yüksek kaliteli veritabanları ile karşılaştırıldığında 10 farklı görevde ortalama 0.5 puanlık bir performans artışı sağladığı belirtildi.

Ortaya çıkan sonuçlara bakılırsa, Nemotron-CC’nin büyük dil modellerinin eğitimi ve yetenekleri üzerinde nasıl bir etki yaratabileceğini açıkça görüyoruz. Bununla beraber NVIDIA, Nemotron-CC’nin geliştirilmesinde model sınıflandırıcılar, sentetik veri yeniden ifade etme (rephrasing) gibi tekniklerden yararlandığını duyurdu. Bu teknikler, veritabanındaki veri çeşitliliğini ve kalitesini artırmak için kullanılmış. Ayrıca, geleneksel veri filtreleme yöntemlerindeki sıkı kuralların hafifletilmesiyle yüksek kaliteli tokenların sayısı da artırılmış.

NVIDIA, Nemotron-CC’yi Common Crawl platformu üzerinden erişime açtı ve bu veritabanının dökümantasyonunu yakında şirketin GitHub sayfasında yayınlayacağını duyurdu. Bu sayede hem akademisyenler hem de ticari kullanıcılar, bu veritabanını kolayca kullanabilecek. Yeni veritabanına buradan erişebilirsiniz.

Peki sizce bu yeniliğin yapay zeka teknolojilerinin geleceği üzerindeki etkileri ne olur? Görüşlerinizi aşağıdaki yorumlar kısmında paylaşabilirsiniz…

Share. Facebook Twitter Email WhatsApp Copy Link

Diğer Yazıları Gör

Otomasyon ve Etik: Adil Sistemler Kurmak Zorunluluk Haline Geldi

Amazon, Project Kuiper ile Uydu İnternetinde Yeni Bir Çağ Başlattı

Samanyolu’na Komşu Olası Karanlık Galaksi

SON YAZILARIMIZ

Ferdi Zeyrek’in ölümüne dair 3 tutuklama

14/06/20251 Views

DEM Parti Eş Genel Başkanı Bakırhan: Öcalan’ın Kürtlerin birliğini önemsiyor

14/06/20251 Views

Diyarbakır’da dernek başkanı silahlı saldırıda yaşamını yitirdi

14/06/20251 Views

15 kentin baro başkanı süreç gündemiyle Ankara’ya gidecek

14/06/20251 Views
EDİTÖRÜN SEÇTİKLERİ
YAŞAM

Ferdi Zeyrek’in ölümüne dair 3 tutuklama

14/06/20251 Views

VENG- Manisa Büyükşehir Belediye Başkanı Ferdi Zeyrek’in ölümüne dair 3 kişi tutuklandı. Manisa Büyükşehir Belediye…

DEM Parti Eş Genel Başkanı Bakırhan: Öcalan’ın Kürtlerin birliğini önemsiyor

14/06/2025

Diyarbakır’da dernek başkanı silahlı saldırıda yaşamını yitirdi

14/06/2025

15 kentin baro başkanı süreç gündemiyle Ankara’ya gidecek

14/06/2025
SOSYAL MEDYA HESAPLARIMIZ
  • Facebook
  • Twitter
  • Instagram
  • YouTube
Hakkımızda

venghaber.com sitesinde yayınlanan yazı, haber ve fotoğrafların her türlü telif hakkı Veng Radyo'ya aittir. İzin alınmadan, kaynak gösterilmeden ve link verilmeden paylaşılamaz

Bizimle İletişime Geçin:
Email : [email protected]
Telefon: 05324897424

Facebook X (Twitter) Instagram YouTube WhatsApp
SON YAZILARIMIZ

Ferdi Zeyrek’in ölümüne dair 3 tutuklama

14/06/2025

DEM Parti Eş Genel Başkanı Bakırhan: Öcalan’ın Kürtlerin birliğini önemsiyor

14/06/2025

Diyarbakır’da dernek başkanı silahlı saldırıda yaşamını yitirdi

14/06/2025
Biz Kimiz?

Veng Haber; görmezden gelinen ötekilerin, kadınların, gençlerin, doğanın sesi soluğu, hakikatin tarafı olmak için yola çıktı.
Güç odaklarının, zorbaların çizdiği sınırların dışında, yeni bir ses, yeni bir nefes olmak için yayındayız.
İlkeli, bağımsız, özgür ve tarafsız habercilik anlayışıyla yola çıkan Veng Haber; gündemin arka planını, saklanan gerçekleri ve ezilenlerin duyulmak istenmeyen seslerine çığlık olmanın azami gayretindedir.

venghaber.com sitesinde yayınlanan yazı, haber ve fotoğrafların her türlü telif hakkı Veng Radyo'ya aittir.
  • Künye
  • Hakkımızda
  • İletişim
  • Kullanım şartları
  • Gizlilik politikası

Type above and press Enter to search. Press Esc to cancel.

Reklam Engelleyici Etkin!
Reklam Engelleyici Etkin!
Web sitemiz ziyaretçilerimize çevrimiçi reklamlar gösterilmesiyle mümkün olmaktadır. Lütfen Reklam Engelleyicinizi devre dışı bırakarak bize destek olun.