Nowe badania: 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych

Nowe badania: 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych

Zespół naukowców z Purdue University zaprezentował badania na konferencji Computer-Human Interaction, które pokazują, że 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych, informuje Futurism.

Na potrzeby badania naukowcy przyjrzeli się 517 pytaniom w Stack Overflow i przeanalizowali próbę odpowiedzi na nie przez ChatGPT.

Odkryliśmy, że 52 % odpowiedzi ChatGPT zawiera błędne informacje, 77 % odpowiedzi jest bardziej rozwlekłych niż odpowiedzi udzielone przez użytkownika, a 78 % odpowiedzi cierpi na różne stopnie niespójności z odpowiedziami udzielonymi przez użytkownika” — napisali.

Zespół przeprowadził również analizę lingwistyczną 2000 losowo wybranych odpowiedzi ChatGPT i stwierdził, że były one „bardziej formalne i analityczne”, a jednocześnie przedstawiały „mniej negatywnych nastrojów”.

Naukowcy także odkryli, że programiści nie wychwytują błędów generowanych przez sztuczną inteligencję w 39%.

„Kolejne częściowo ustrukturyzowane wywiady ujawniły, że uprzejmy język, wyartykułowane i podręcznikowe odpowiedzi oraz kompleksowość są jednymi z głównych powodów, dla których odpowiedzi ChatGPT wyglądają bardziej przekonująco, więc uczestnicy obniżyli swoją czujność i przeoczyli pewne błędne informacje w odpowiedziach ChatGPT” — napisali naukowcy.


Avatar
Kwi 29

"Digital Darwinism" and AI: An Interview with UC Berkeley Lecturer and Innovation Expert Gautier Vasseur

This year, at the invitation of AB Games, one of the most influential experts on AI innovation — Gautier Vasseur, lecturer and executive director of the Fisher Center for Business Analytics at UC Berkeley — visited Games Gathering 2025 in Lviv.
0
Maj 7, 2024

Użytkowniczka Firefoksa miała otwartych 7 500 zakładek jednocześnie. Jaki jest Twój rekord? Podziel się z nami.

Dla większości z nas posiadanie otwartych więcej niż kilkudziesięciu kart jednocześnie jest koszmarem. Ale dla pewnej inżynierki oprogramowania zarządzanie prawie 7500 aktywnymi kartami Firefoksa to po prostu kolejny typowy dzień w pracy.
0
Wrz 20, 2024

IBM potajemnie zwalnia tysiące pracowników, w tym programistów na poziomie Senior

0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies