ChatGPT ve Diğer Büyük Dil Modelleri ChatGPT’nin ortaya çıkışıyla birlikte büyük dil modelleri hayatımızın vazgeçilmez bir parçası haline geldi. Gemini, DeepSeek, Llama ve Grok gibi farklı modeller de piyasaya sürülerek bu alandaki çeşitlilik arttı. Veri Kaynakları ve İstatistikler Büyük dil modellerinin yetenekleri dünya çapında ses getirirken, bu modellerin beslendiği kaynaklar da önemli bir konu haline…
ChatGPT’nin ortaya çıkışıyla birlikte büyük dil modelleri hayatımızın vazgeçilmez bir parçası haline geldi. Gemini, DeepSeek, Llama ve Grok gibi farklı modeller de piyasaya sürülerek bu alandaki çeşitlilik arttı.
Büyük dil modellerinin yetenekleri dünya çapında ses getirirken, bu modellerin beslendiği kaynaklar da önemli bir konu haline geldi. Yapılan araştırmalara göre, ChatGPT ve benzeri modeller genellikle kamuya açık internet sitelerinden bilgiler alıyorlar. Statista’nın haziran ayındaki araştırmasına göre, büyük dil modelleri tarafından en çok alıntı yapılan web siteleri incelendi. Reddit %40,11 ile listenin zirvesinde yer alırken, Wikipedia %26,3 ile ikinci sırada bulunuyor.
Araştırmaya göre, büyük dil modelleri en çok alıntıyı Reddit ve Wikipedia gibi kaynaklardan yapıyor. Reddit ve Wikipedia’nın yanı sıra, Youtube, Google, Yelp, Facebook, Amazon, Tripadvisor, Mapbox ve OpenStreetMap gibi platformlar da sıkça referans alınıyor.
Google ve Reddit arasında yapılan anlaşmaya göre, Google’ın yapay zekaları Reddit verileriyle besleniyor. Bu anlaşma çerçevesinde Google, Reddit’e yıllık 60 milyon dolar ödeme yapacak. Ayrıca Reddit, OpenAI şirketi ile ChatGPT için veri paylaşımı anlaşması yaparak yapay zekanın gelişimine katkı sağlıyor.
Bu anlaşmalarla birlikte yapay zekanın beslendiği kaynaklar daha da çeşitlenirken, yapay zeka modellerinin gelişimi ve yaygınlaşması hız kazanmış oluyor.
Reklam & İşbirliği: [email protected]