ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

​​Naukowcy postanowili przetestować ogólne umiejętności i wiedzę ChatGPT w zakresie programowania i zadali modelowi dużą liczbę pytań programistycznych. W rezultacie model językowy odpowiedział nieprawidłowo na ponad połowę pytań.

W badaniu przeprowadzonym przez Purdue University naukowcy zadali ChatGPT 517 pytań dot. Stack Overflow. Odpowiedzi były oceniane nie tylko pod kątem poprawności, ale także spójności, kompletności i zwięzłości. Zespół przeanalizował również styl językowy i ton odpowiedzi.

Nie był to najlepszy eksperyment dla ChatGPT. Narzędzie OpenAI odpowiedziało poprawnie tylko na 48% pytań, a 77% z nich określono jako "rozwlekłe".

Jednak ze względu na kompleksowość i styl językowy egzaminatorzy zatwierdzili prawie 40% odpowiedzi ChatGPT. Niestety, 77% tych odpowiedzi było niepoprawnych.

"Zauważyliśmy, że użytkownicy mogą zidentyfikować błąd ChatGPT tylko wtedy, gdy jest on oczywisty" — komentują badacze. "Jednak gdy błąd jest trudny do zweryfikowania lub wymaga zewnętrznego IDE lub dokumentacji, użytkownicy często go nie identyfikują lub nie doceniają".

A jakie jest wasze doświadczenie z ChatGPT? Przyzwyczailiście się do korzystania z niego?

Avatar
Sty 30, 2025

Nassim Taleb: wyprzedaż akcji NVIDIA to początek spadków na rynku AI

Autor książki Czarny Łabędź, Nassim Taleb, ostrzega, że poniedziałkowa wyprzedaż akcji NVIDIA z 27 stycznia to jedynie wstęp do większych turbulencji na rynku firm rozwijających sztuczną inteligencję. W rozmowie z Bloomberg News podkreślił, że inwestorzy dopiero zaczynają dostrzegać rzeczywiste ryzyka.
0
Mar 30, 2025

Google przechodzi na rozwój Androida za zamkniętymi drzwiami – kod źródłowy będzie udostępniany dopiero po wydaniach

Począwszy od przyszłego tygodnia, firma Google wprowadza nowy model rozwoju platformy Android, w ramach którego prace nad kolejnymi wydaniami będą odbywać się za zamkniętymi drzwiami – bez publicznego dostępu do pośrednich efektów prac oraz bez otwartych recenzji zmian w poszczególnych komponentach.
0
Maj 30

Angular v20: stabilizacja reactivity, nowe API i pożegnanie ze strukturalnymi dyrektywami

Zespół Angular ogłosił premierę wersji 20, skupiając się na stabilizacji istniejących funkcji, wsparciu dla GenAI, usprawnieniu debugowania oraz dalszym odchodzeniu od Zone.js. Wśród najważniejszych zmian znalazły się nowe eksperymentalne API, rozbudowane wsparcie dla renderowania po stronie serwera oraz aktualizacje stylu i diagnostyki, – informuje Angular Blog.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies