Aralarında ChatGPT'nin de yer aldığı büyük dil modelleri sorgulamalara cevap verirken en çok alıntıyı yüzde 40 ile Reddit sosyal medya platformundan yapıyor.
ChatGPT'nin ortaya çıkışı ile gündeme gelen büyük dil modelleri daha sonra Gemini, DeepSeek, Llama ve Grok gibi farklı modellerin de piyasa sürülmesiyle günlük hayatın ayrılmaz parçalarından biri haline geldi.
Kullanılan büyük dil modellerinin yetenekleri tüm dünyada ses getirirken aynı zamanda bu modellerin beslendikleri kaynakların hangileri olduğu da uzun zamandır tartışmaların odağında yer alıyor.
AA muhabirinin derlediği bilgilere göre, aralarında ChatGPT'nin de bulunduğu birçok büyük dil modeli cevaplarını üretirken kamuya açık internet sitelerinden yararlanıyor.
- Reddit yüzde 40 ile zirvede
Online istatistik portalı Statista, yapay zekâ dil modellerinin hangi kaynağı ne kadar kullandığını araştırdı. Statista'nın haziran ayında yaptığı araştırmada yılın ilk çeyreğinde büyük dil modelleri tarafından en çok alıntılanan web siteleri arasında zirvede yüzde 40,11 ile reddit.com yer aldı.
Uzmanlara göre, yapay zekanın belli konular üzerine gerçek kişilerin tartışmalarının yer aldığı Reddit platformundan alıntı yapması, yapay zekâ modellerini geliştirenlerin resmi bilgilerden çok gerçek kişilerin doğal konuşmalarını daha çok öncelediklerini gösteriyor.
Büyük dil modelleri Reddit'ten sonra en çok alıntıyı yüzde 26,3 ile "internet ansiklopedisi" olarak tanımlanan Wikipedia'dan alıyor.
Araştırmaya göre düzenlenmiş makaleleri kullanan Wikipedia, herhangi bir düzenleme süzgecinden geçmeyen Reddit verilerine göre bir hayli geride kalmış gözüküyor.
Hangi dil modelinin hangi kaynağı ne kadar sıklıkla gösterdiği belirtilen listede 3. sırada yüzde 23,5 ile Youtube, yüzde 23,2 ile Google, yüzde 21 ile yelp.com, yüzde 19,9 ile Facebook, yüzde 18,7 Amazon, yüzde 12,4 ile Tripadvisor, yüzde 11,2 ile mapbox.com ve yüzde 11,2 ile openstreetmap.com geliyor.
- Google ile Reddit arasında yapay zekayı eğitme anlaşması
Öte yandan yapay zekâ modellerinin eğitilmesi ile ilgili sosyal medya devleri ile yapay zekâ üreticileri arasında da anlaşmalar yapılıyor.
2024 yılında Google ile Reddit arasında yapılan anlaşmaya göre, Google'ın yapay zekâları Reddit verileriyle de besleniyor.
Reuters'ta yer alan habere göre, anlaşma kapsamında Google, Reddit'e yıllık 60 milyon dolar ödeme yapacak. Reuters imzalı bir diğer habere göre Reddit, OpenAI şirketi ile ChatGPT'de kullanılmak üzere bir veri paylaşımı anlaşması daha yaptı.
Böylece bugün yapay zekanın verdiği cevaplardaki Reddit etkisi yapılan anlaşmalarla da perçinlenmiş oldu.