ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

​​Naukowcy postanowili przetestować ogólne umiejętności i wiedzę ChatGPT w zakresie programowania i zadali modelowi dużą liczbę pytań programistycznych. W rezultacie model językowy odpowiedział nieprawidłowo na ponad połowę pytań.

W badaniu przeprowadzonym przez Purdue University naukowcy zadali ChatGPT 517 pytań dot. Stack Overflow. Odpowiedzi były oceniane nie tylko pod kątem poprawności, ale także spójności, kompletności i zwięzłości. Zespół przeanalizował również styl językowy i ton odpowiedzi.

Nie był to najlepszy eksperyment dla ChatGPT. Narzędzie OpenAI odpowiedziało poprawnie tylko na 48% pytań, a 77% z nich określono jako "rozwlekłe".

Jednak ze względu na kompleksowość i styl językowy egzaminatorzy zatwierdzili prawie 40% odpowiedzi ChatGPT. Niestety, 77% tych odpowiedzi było niepoprawnych.

"Zauważyliśmy, że użytkownicy mogą zidentyfikować błąd ChatGPT tylko wtedy, gdy jest on oczywisty" — komentują badacze. "Jednak gdy błąd jest trudny do zweryfikowania lub wymaga zewnętrznego IDE lub dokumentacji, użytkownicy często go nie identyfikują lub nie doceniają".

A jakie jest wasze doświadczenie z ChatGPT? Przyzwyczailiście się do korzystania z niego?

Avatar
Apr 21

Grzeczność w ChatGPT kosztuje miliony. Altman: „To dobrze wydane pieniądze”

Użytkownicy ChatGPT, którzy w swoich zapytaniach dodają „proszę” i „dziękuję”, generują istotne koszty obliczeniowe – przyznał dyrektor generalny OpenAI Sam Altman. Według niego, uprzejmość kosztuje firmę dziesiątki milionów dolarów, ale to „dobrze wydane pieniądze”.
0
Mar 20

Google przejmuje Wiz za 32 mld dolarów – największa transakcja w historii firmy

Google ogłosiło zawarcie umowy na przejęcie Wiz, amerykańskiego startupu zajmującego się cyberbezpieczeństwem chmurowym. Wartość transakcji wyniesie 32 miliardy dolarów i zostanie w całości sfinalizowana w gotówce. Po zamknięciu transakcji Wiz stanie się częścią Google Cloud, co umożliwi dalszy rozwój technologii zabezpieczeń chmurowych oraz rozwiązań multicloud – podejścia pozwalającego organizacjom korzystać z wielu różnych dostawców chmury jednocześnie.
0
Mar 29

WhatsApp może zostać domyślną aplikacją do połączeń i wiadomości w iPhone'ach

Po raz pierwszy w historii systemu iOS użytkownicy iPhone’ów zyskali możliwość ustawienia WhatsApp jako domyślnej aplikacji do wykonywania połączeń oraz wysyłania wiadomości. Zmiana została wprowadzona w iOS 18.2, a WhatsApp jako pierwszy popularny komunikator wdrożył funkcje.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies