En iyi yapay zeka modelleri listesi açıklandı

Yapay zeka özelinde “en iyi” modeli belirlemek oldukça zor. Çünkü burada kıstas tutulacak kategorileri belirlemek zor. Modellerin eğitildikleri veri ve bu verinin yapısı, modelden elde edilen çıktıyı doğrudan belirliyor. Dolayısıyla bu araçları sıralamak için en iyi yol, onların verdiği çıktıların doğruluk oranına bakmak. Bu bağlamda Vectara, önde gelen çeşitli yapay zeka sohbet robotlarını ‘halüsinasyon görmeme’ konusundaki becerilerine göre sıralayan bir yapay zeka halüsinasyon tablosu yayınladı.

En iyi yapay zeka modelleri

  1. GPT 4
  2. GPT 3.5
  3. Llama 2 70B
  4. Llama 2 7B
  5. Llama 2 13B
  6. Cohere-Chat
  7. Cohere
  8. Anthropic Calude 2
  9. Mistral 7B
  10. Google Palm
  11. Google Plam-Chat

Yapay zeka modellerinin tamamı “halüsinasyon” olarak ifade edilen bir olguyu yansıtma eğiliminde. Yani bu araçlar, boşlukları doldurmak için zaman zaman gerçekleri uydurabiliyor. Bu uydurma gerçekler o kadar zarifçe yapılıyor ki dikkatsiz bir zihin çok rahat bir şekilde kandırılabilir.

Piyasadaki modelleri bu bağlamda sınayan Vectara’nın yayınladığı tabloya göre GPT-4 en düşük halüsinasyon oranı ve en yüksek doğrulukla en iyi başarımı gösterdi. Vectara, bu modelleri sabit bir kaynak materyal üzerinden sınadı. Listenin ikinci sırada ise GPT-3.5 modeli yer almayı başardı. Bu iki model de OpenAI firması tarafından geliştirildi ve halihazırda ChatGPT üzerinde kullanılıyorlar.

Listenin en altında ise Google’a ait iki büyük dil modeli yer alıyor ve açıkça kötü performans sergiliyorlar. Google Palm Chat, kendisine verilen materyal üzerinde yüzde 27’nin üzerinde halüsinasyon oranı yakalayarak en güvenilmez model oldu. Vectara’nın ölçümlerine göre Palm-Chat’in yanıtları tamamen halüsinasyon kalıntılarıyla dolu.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir