BBC’den yapılan yeni bir araştırma, ChatGPT, Gemini, Copilot ve Perplexity gibi dört popüler yapay zeka sohbet robotunun haberleri doğru bir şekilde özetleyemediğini ortaya koydu. Bunun için BBC, bu yapay zeka robotlarına 100 haber öyküsünü özetlemelerini istedi ve her cevabı değerlendirerek AI yanıtlarının ne kadar doğru olduğunu belirledi. Araştırma, “haberlerle ilgili sorulara verilen AI yanıtlarının %51’inin çeşitli ciddi sorunlar içerdiğini” ve “BBC içeriğine atıfta bulunan AI yanıtlarının %19’unun hatalı bilgiler içerdiğini, yanlış faktörel ifadeler, sayılar ve tarihler gibi.” tespit etti. Araştırma, örnek olarak, “Gemini’nin NHS’nin sigarayı bırakmaya yardımcı olarak vaping’i önermediğini yanlış söylediğini” ve “ChatGPT ve Copilot’un Rishi Sunak ve Nicola Sturgeon’un halen görevde olduğunu söylediğini, hatta onların ayrıldıktan sonra bile” belirtti. Yanlışlıkların yanı sıra, başka bir önemli bulgu daha var. Rapor, AI’nın “yorum ve gerçeklik arasında ayrım yapmakta zorlandığını, editoryal yapıda olduğunu ve sıklıkla temel bağlamı içermediğini” ortaya koydu. Bu sonuçlar, şu anda haber özetleme araçlarında yaşanan sorunları sıkça gözlemlememiz göz önüne alındığında şaşırtıcı değil. Bunlara ek olarak, Microsoft’un Copilot ve Google’ın Gemini’sinin OpenAI’nın ChatGPT ve Perplexity’sinden daha fazla önemli sorununun olduğu sonucuna varıldı. Bu araştırma bize pek fazla bilgi vermiyor ancak yapay zeka özetleme araçlarına duyulan şüpheyi doğrulayarak, AI’den alınan bilgilerin tuzu kuru tutulmasının ne kadar önemli olduğunu vurguluyor. AI hızla gelişiyor ve büyük dil modelleri (LLM’ler) şu anda neredeyse haftalık olarak piyasaya sürülüyor, bu nedenle hataların olacağı beklenebilir. Ancak son zamanlarda, ChatGPT gibi yazılımlarda yanlışlıkların ve hayal ürünlerinin eskisine göre daha az görüldüğünü gözlemledim. Sam Altman, dünkü bir blog yazısında, yapay zekanın Moore Yasası’ndan daha hızlı ilerlediğini söyledi ve bu da yazılımın ve çevresiyle etkileşimin nasıl sürekli iyileştirileceğini göstereceğimiz anlamına geliyor. Şimdilik, günlük haberler için AI’ya güvenmemek en iyisi olabilir ve teknoloji odaklıysa, TechRadar gibi sitelere bakmak daha sağlıklı olabilir.