OpenAI’nın GPT-4 yapay zeka dil modelini Turing Testi bağlamında incelemiş ve sonuçlar ilginç bilgiler sunmuş gibi görünüyor. İşte bazı ana noktalar:
- GPT-4, GPT-3.5 ve ELIZA karşılaştırması: Araştırmacılar, GPT-4’ü GPT-3.5 ve ELIZA ile karşılaştırmışlar. ELIZA’nın şaşırtıcı bir şekilde yüzde 27’lik bir başarı oranı elde ettiği görülüyor. GPT-3.5 ise yüzde 14’lük bir başarı oranına sahip. GPT-4 ise yüzde 41’lik bir başarı oranıyla ELIZA ve GPT-3.5’in önünde yer alıyor, ancak insanlarla karşılaştırıldığında başarısız olduğu belirtiliyor.
- GPT-4 ve benzeri modellerin insan gibi görünmesi: GPT-4 gibi modeller, kendilerini insan gibi göstermemeye şartlandırılmış durumda. Bu nedenle, doğru uyarılarla veya daha fazla geliştirmeyle belki de Turing Testi’ni geçebilirler.
- İnsanların yapay zeka tarafından ikna edilmemesi: İlginç bir bulgu olarak, bazı insanlar karşılarında gerçek bir insan olmasına rağmen onların gerçek olduğuna ikna olmamışlar. Bu, testin doğası, yapısı ve jüri üyelerinin beklentileriyle ilgili olabilir.
- “Trolleme” davranışları: Araştırmacılar, bazı insanların yapay zeka gibi davranarak “trolleme” yaptıklarını belirtiyor. Bu da test sonuçlarını etkileyebilir.
Sonuç olarak, Turing Testi’nin tam olarak neyin başarılı veya başarısız olduğu konusunda öznellik taşıdığı ve yapay zekanın insanları tamamen ikna etme konusundaki zorlukları gözler önüne serdiği anlaşılıyor. Ayrıca, yapay zeka modelinin ne kadar geliştirildiği, uygulama tasarımı ve diğer faktörler de sonuçları etkileyebilir. Bu tür çalışmalar, yapay zekanın insan benzeri iletişim yeteneklerini daha iyi anlamamıza yardımcı olabilir.