Nowe badania: 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych

Nowe badania: 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych

Zespół naukowców z Purdue University zaprezentował badania na konferencji Computer-Human Interaction, które pokazują, że 52 % odpowiedzi programistycznych generowanych przez ChatGPT jest nieprawidłowych, informuje Futurism.

Na potrzeby badania naukowcy przyjrzeli się 517 pytaniom w Stack Overflow i przeanalizowali próbę odpowiedzi na nie przez ChatGPT.

Odkryliśmy, że 52 % odpowiedzi ChatGPT zawiera błędne informacje, 77 % odpowiedzi jest bardziej rozwlekłych niż odpowiedzi udzielone przez użytkownika, a 78 % odpowiedzi cierpi na różne stopnie niespójności z odpowiedziami udzielonymi przez użytkownika” — napisali.

Zespół przeprowadził również analizę lingwistyczną 2000 losowo wybranych odpowiedzi ChatGPT i stwierdził, że były one „bardziej formalne i analityczne”, a jednocześnie przedstawiały „mniej negatywnych nastrojów”.

Naukowcy także odkryli, że programiści nie wychwytują błędów generowanych przez sztuczną inteligencję w 39%.

„Kolejne częściowo ustrukturyzowane wywiady ujawniły, że uprzejmy język, wyartykułowane i podręcznikowe odpowiedzi oraz kompleksowość są jednymi z głównych powodów, dla których odpowiedzi ChatGPT wyglądają bardziej przekonująco, więc uczestnicy obniżyli swoją czujność i przeoczyli pewne błędne informacje w odpowiedziach ChatGPT” — napisali naukowcy.


Avatar
Mar 27, 2023

Przeprowadzka do Norwegii i praca w IT: doświadczenie front-end developera

Łukasz Strociak od dwóch lat mieszka w norweskim mieście Stavanger i pracuje jako front-end developer w firmie Grensesnitt. Przez rok uczył się programowania i dostał pracę nie szukając jej wcale.
0
Lut 5, 2025

Psinder, no-code i perspektywiczne kierunki pracy w IT. Rozmawiamy z Kamilem Tarczyńskim

Narzędzia no-code i low-code są coraz częściej wykorzystywane przez firmy do realizacji różnych projektów – od fintechu po aplikacje pomagające w adopcji psów. Co sprawia, że te narzędzia zyskują na popularności? Jak AI wpłynie na rozwój no-code? I czym jest Psinder?
0
Sty 23, 2023

Czego brakuje specjalistom i firmom IT w Polsce?

O kryzysie technologicznym w 2023 roku, o zmianach w podejściu do pracy, o nowej dyrektywie NIS2 — rozmawiamy z konsultantem IT Andrzejem Piotrowskim, który od 13 lat zajmuje się projektami IT.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies