Nowe badania: 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych

Nowe badania: 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych

Zespół naukowców z Purdue University zaprezentował badania na konferencji Computer-Human Interaction, które pokazują, że 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych, informuje Futurism.

Na potrzeby badania naukowcy przyjrzeli się 517 pytaniom w Stack Overflow i przeanalizowali próbę odpowiedzi na nie przez ChatGPT.

Odkryliśmy, że 52 % odpowiedzi ChatGPT zawiera błędne informacje, 77 % odpowiedzi jest bardziej rozwlekłych niż odpowiedzi udzielone przez użytkownika, a 78 % odpowiedzi cierpi na różne stopnie niespójności z odpowiedziami udzielonymi przez użytkownika” — napisali.

Zespół przeprowadził również analizę lingwistyczną 2000 losowo wybranych odpowiedzi ChatGPT i stwierdził, że były one „bardziej formalne i analityczne”, a jednocześnie przedstawiały „mniej negatywnych nastrojów”.

Naukowcy także odkryli, że programiści nie wychwytują błędów generowanych przez sztuczną inteligencję w 39%.

„Kolejne częściowo ustrukturyzowane wywiady ujawniły, że uprzejmy język, wyartykułowane i podręcznikowe odpowiedzi oraz kompleksowość są jednymi z głównych powodów, dla których odpowiedzi ChatGPT wyglądają bardziej przekonująco, więc uczestnicy obniżyli swoją czujność i przeoczyli pewne błędne informacje w odpowiedziach ChatGPT” — napisali naukowcy.


Avatar
Jan 29

VECUs in the modern mobility stack

Over the past decade, the SoftwareDefined Vehicle (SDV) has moved from buzzword to baseline for most automotive companies. Hardwareled innovation is becoming harder to sustain, while software driven differentiation is opening up entire markets and delivering real competitive advantage. As with many advances that don’t come for free, however, testing and validating software integration in the actual vehicle has become a major bottleneck. For many automotive programs, this directly impacts delivery timelines, quality, and engineering effort. At Intellias, we have been researching this challenge closely for our clients, with the goal of offering a bespoke testing approach that leverages Softwareinthe-Loop (SIL).
0
Aug 29, 2024

Latem w Warszawie, a zimą w Las Palmas – jak wygląda praca polskiego VPE firmy z całkowicie rozproszonym zespołem technicznym

0
Oct 17, 2023

Inżynier oprogramowania w Meta zrezygnował z pracy za 370 tys. dolarów po atakach paniki

Pracowałem do 20:00, a także spędzałem około czterech godzin dziennie w weekendy, aby upewnić się, że nadążam za tempem.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies