ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

​​Naukowcy postanowili przetestować ogólne umiejętności i wiedzę ChatGPT w zakresie programowania i zadali modelowi dużą liczbę pytań programistycznych. W rezultacie model językowy odpowiedział nieprawidłowo na ponad połowę pytań.

W badaniu przeprowadzonym przez Purdue University naukowcy zadali ChatGPT 517 pytań dot. Stack Overflow. Odpowiedzi były oceniane nie tylko pod kątem poprawności, ale także spójności, kompletności i zwięzłości. Zespół przeanalizował również styl językowy i ton odpowiedzi.

Nie był to najlepszy eksperyment dla ChatGPT. Narzędzie OpenAI odpowiedziało poprawnie tylko na 48% pytań, a 77% z nich określono jako "rozwlekłe".

Jednak ze względu na kompleksowość i styl językowy egzaminatorzy zatwierdzili prawie 40% odpowiedzi ChatGPT. Niestety, 77% tych odpowiedzi było niepoprawnych.

"Zauważyliśmy, że użytkownicy mogą zidentyfikować błąd ChatGPT tylko wtedy, gdy jest on oczywisty" — komentują badacze. "Jednak gdy błąd jest trudny do zweryfikowania lub wymaga zewnętrznego IDE lub dokumentacji, użytkownicy często go nie identyfikują lub nie doceniają".

A jakie jest wasze doświadczenie z ChatGPT? Przyzwyczailiście się do korzystania z niego?

Avatar
Sty 20

Tesla ponownie uruchamia prace nad superkomputerem Dojo3 po zmianie strategii w obszarze chipów AI

Tesla wraca do prac nad projektem Dojo3, czyli trzecią generacją własnego superkomputera, który wcześniej został wstrzymany po przesunięciu zasobów na rozwój chipów AI.
0
Cze 5

Microsoft przeprowadza kolejne zwolnienia — tym razem także w LinkedIn

Microsoft po raz kolejny redukuje zatrudnienie. Choć w połowie maja ogłoszono cięcia obejmujące około 6 000 osób (nieco mniej niż 3% globalnego zespołu), firma właśnie zgłosiła kolejne zwolnienia, obejmujące setki pracowników w stanach Kalifornia i Waszyngton,
0
Lut 20, 2025

Valve udostępniło kod gry Team Fortress 2: Nowe możliwości dla twórców modów

Firma Valve opublikowała zaktualizowane narzędzie "Source SDK 2013", które służy do tworzenia modów do gier opartych na silniku Source. Co szczególnie istotne, pakiet zawiera pełny kod źródłowy gry Team Fortress 2 (zarówno część kliencką, jak i serwerową).
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies