Nowe badania: 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych

Nowe badania: 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych

Zespół naukowców z Purdue University zaprezentował badania na konferencji Computer-Human Interaction, które pokazują, że 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych, informuje Futurism.

Na potrzeby badania naukowcy przyjrzeli się 517 pytaniom w Stack Overflow i przeanalizowali próbę odpowiedzi na nie przez ChatGPT.

Odkryliśmy, że 52 % odpowiedzi ChatGPT zawiera błędne informacje, 77 % odpowiedzi jest bardziej rozwlekłych niż odpowiedzi udzielone przez użytkownika, a 78 % odpowiedzi cierpi na różne stopnie niespójności z odpowiedziami udzielonymi przez użytkownika” — napisali.

Zespół przeprowadził również analizę lingwistyczną 2000 losowo wybranych odpowiedzi ChatGPT i stwierdził, że były one „bardziej formalne i analityczne”, a jednocześnie przedstawiały „mniej negatywnych nastrojów”.

Naukowcy także odkryli, że programiści nie wychwytują błędów generowanych przez sztuczną inteligencję w 39%.

„Kolejne częściowo ustrukturyzowane wywiady ujawniły, że uprzejmy język, wyartykułowane i podręcznikowe odpowiedzi oraz kompleksowość są jednymi z głównych powodów, dla których odpowiedzi ChatGPT wyglądają bardziej przekonująco, więc uczestnicy obniżyli swoją czujność i przeoczyli pewne błędne informacje w odpowiedziach ChatGPT” — napisali naukowcy.


Avatar
Sep 22

Od kodera do product ownera: jak programiści mogą brać odpowiedzialność nie tylko za kod

Cześć, tu Michał Diner – jestem Senior Android Engineerem w Svitla Systems. Na co dzień dłubię w Compose, ogarniam architekturę i próbuję robić rzeczy, które nie tylko działają, ale też mają sens. Coraz częściej łapię się na tym, że samo „dowożenie ticketów” to za mało – i właśnie o tym jest ten tekst. Chcę pokazać, jak jako programiści możemy brać większą odpowiedzialność za produkt, bez wchodzenia w buty PM-a.
0
Aug 15, 2023

6 pytań dla Agile Tech Leaderów na rozmowie kwalifikacyjnej

Zapoznaj 6 grup pytań, które są zadawane liderom technologicznym podczas rozmów kwalifikacyjnych.
0
May 7, 2024

Użytkowniczka Firefoksa miała otwartych 7 500 zakładek jednocześnie. Jaki jest Twój rekord? Podziel się z nami.

Dla większości z nas posiadanie otwartych więcej niż kilkudziesięciu kart jednocześnie jest koszmarem. Ale dla pewnej inżynierki oprogramowania zarządzanie prawie 7500 aktywnymi kartami Firefoksa to po prostu kolejny typowy dzień w pracy.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies