Meta, çok dilli desteğe sahip gelişmiş Llama 3 AI’yi piyasaya sürdü
Meta Platforms (NASDAQ:META), Llama 3 yapay zeka modellerinin en kapsamlı versiyonunu piyasaya sürerek dil yetenekleri ve matematiksel problem çözme alanındaki gelişmeleri sergiledi. Şirket, sekiz farklı dilde iletişim kurabilen, daha yüksek kalitede bilgisayar kodu üretebilen ve öncekilere göre daha karmaşık matematik problemlerinin üstesinden gelebilen yeni yapay zeka modelinin piyasaya sürüldüğünü duyurdu.
405 milyar parametreye sahip Llama 3 modeli, son iterasyondan önemli bir adımı temsil ediyor ve Meta’nın OpenAI’nin bir trilyon parametreye sahip GPT-4’ü ve Amazon’un iki trilyon parametreye sahip yaklaşan bir modeli gibi ücretli rakip modellere karşı yaptığı baskının bir parçası.
Stratejik bir hamleyle Meta, CEO Mark Zuckerberg’in inovasyonu teşvik edeceğine ve rakiplere bağımlılığı azaltacağına inandığı Llama 3 modellerini büyük ölçüde ücretsiz olarak geliştiricilere sunuyor. Zuckerberg’in tahminine göre, bu modellerle desteklenen yapay zeka sohbet robotunun yaygın bir şekilde benimsenmesi ve yılsonuna kadar en popüler yapay zeka asistanı haline gelmesi ve halihazırda yüz milyonlarca kişi tarafından kullanılması bekleniyor.
Bu sürüm, teknoloji endüstrisinin karmaşık muhakeme zorluklarını ele almada büyük dil modellerinin değerini gösterme yarışını vurguluyor. Meta’nın üst düzey yapay zeka bilimcisi, bu modeller yeni zirvelere ulaşırken, gelecekteki atılımlar için alternatif yapay zeka sistemlerinin gerekli olabileceğini öne sürdü.
Amiral gemisi modeline ek olarak Meta, daha hafif olan 8 milyar ve 70 milyar parametreli versiyonlarını da güncelliyor. Bu modeller artık genişletilmiş bir “bağlam penceresine” sahip ve bu sayede daha büyük kullanıcı taleplerini karşılayabiliyor ve daha fazla bilgiyi hatırlayabiliyor; bu da özellikle bilgisayar kodu üretmek için faydalı.
Meta’nın üretken yapay zeka başkanı Ahmad Al-Dahle, geliştirici topluluğundan gelen birincil geri bildirim olduğu için daha büyük bağlam penceresinin önemine dikkat çekti. Ekibi ayrıca eğitim için yapay zeka tarafından üretilen verileri kullanarak Llama 3 modelinin matematik problemlerini çözme becerisini geliştirdi.
Bazı yatırımcıların dikkatini çeken maliyetlere rağmen Meta’nın stratejisi, geliştiricilerin ücretsiz modellerini tercih etmesi halinde rakiplerinin iş modellerini bozabilir. Şirket, Llama 3’ün matematik ve bilgi testlerinde GPT-4o ve Claude 3.5 Sonnet gibi önde gelen modellere rakip olan veya onları aşan skorlarla kıyaslamalardaki performansıyla övünüyor.
Llama 3 modeli MATH testinde 73.8 puan alarak GPT-4o’nun 76.6 puanını yakından takip etti ve Claude 3.5 Sonnet’in 71.1 puanının önüne geçti. Ayrıca, çeşitli konuları kapsayan MMLU kıyaslamasında 88,6 elde ederek GPT-4o’nun 88,7’siyle neredeyse eşleşti ve Claude 3,5 Sonnet’in 88,3’ünü biraz geçti.
İleriye dönük olarak Meta araştırmacıları, temel metin işlevlerinin yanı sıra görüntü, video ve konuşma yeteneklerini de entegre edecek olan modellerin “çok modlu” versiyonlarının geliştirilmesiyle ilgileniyor. Google’ın Gemini 1.5 ve Anthropic’in Claude 3.5 Sonnet gibi diğer multimodal modellerle rekabetçi bir performans sergilemesi beklenen bu modellerin bu yıl içinde piyasaya sürülmesi planlanıyor.
Reuters bu makaleye katkıda bulunmuştur.
Bu makale yapay zekanın desteğiyle oluşturulmuş, çevrilmiş ve bir editör tarafından incelenmiştir. Daha fazla bilgi için Şart ve Koşullar bölümümüze bakın.