ABD’de yapılan bir araştırmada, data havuzlarının, halihazırda yaygın olarak kullanılan yapay zeka sohbet robotlarının yapı taşı niteliğindeki LM’lerin politik görüşlerine tesiri üzerinde incelemeler yapıldı.
Bilim insanları bu kapsamda, 14 farklı LM üzerinde, yatay eksende sağ ve sol olmak üzere ekonomik kıymetler, dikey eksende ise liberal ve muhafazakar olmak üzere toplumsal bedeller bulunan siyasi pusula testini uyguladı.
BERT VARYANTI GPT’YE NAZARAN DAHA MUHAFAZAKAR EĞİLİMLİ
Araştırmada ayrıyeten, LM’leri eğitmek için kullanılan haberler, tartışma forumları, kitaplar, çevrim içi ansiklopediler üzere çeşitli data kaynaklarının içeriğindeki politik eğilimlerin, doğal lisan sürece modeli (NLP) üzerindeki tesiri ve kelam konusu tesir sonucunda LM’nin ürettiği dezenformasyon ve nefret telaffuzları incelendi.
Araştırma sonucunda, eğitildikleri bilgi havuzundaki kaynakların politik eğilimlerini taşıyan LM’lerin, görüşleriyle paralel yönelimde nefret söylemi ve dezenformasyona sebep olduğu kaydedildi.
Buna ek olarak, Eski ABD Lideri Donald Trump’ın vazifeye başladığı 20 Ocak 2017 tarihi milat alınarak, bu tarihten evvelki ve sonraki bilgi setleriyle eğitilen LM’ler kıyaslandığında, Trump periyodu ve sonrasına ilişkin datalarla eğitilen LM’lerin eğilimlerinin, siyasi pusulada daha uçlarda konumlandığı tespit edildi.
LM’ler ortasında “BERT” varyantlarının “GPT” modellerine kıyasla daha muhafazakar eğilimli olduğu ve tıpkı firmanın geliştirdiği çeşitli LM’lerin politik eğilimlerinde de azımsanamaz farklılıklar gözlemlendiği belirtildi.
Eğitilen LM’lerin ekonomik mevzulara kıyasla, toplumsal hususlara daha taraflı yaklaşması, toplumsal hususlara ait data bolluğuna rağmen ekonomik yorumlama için daha geniş bir data seti gerekliliğine bağlandı.
Hiçbir lisan modelinin toplumsal taraflılıktan büsbütün arınmış olamayacağını vurgulayan araştırmacılar, çok politik görüşleri temsil eden kaynaklar kullanılarak eğitilen LM’lerin, toplumda var olan kutuplaşmayı daha da derinleştirebilmesinin teorik olarak mümkün olduğu konusunda uyardı.
Araştırmanın sonuçları, “Association for Computational Linguistics”in 61’inci yıllık toplantı raporunda yayımlandı.