ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

​​Naukowcy postanowili przetestować ogólne umiejętności i wiedzę ChatGPT w zakresie programowania i zadali modelowi dużą liczbę pytań programistycznych. W rezultacie model językowy odpowiedział nieprawidłowo na ponad połowę pytań.

W badaniu przeprowadzonym przez Purdue University naukowcy zadali ChatGPT 517 pytań dot. Stack Overflow. Odpowiedzi były oceniane nie tylko pod kątem poprawności, ale także spójności, kompletności i zwięzłości. Zespół przeanalizował również styl językowy i ton odpowiedzi.

Nie był to najlepszy eksperyment dla ChatGPT. Narzędzie OpenAI odpowiedziało poprawnie tylko na 48% pytań, a 77% z nich określono jako "rozwlekłe".

Jednak ze względu na kompleksowość i styl językowy egzaminatorzy zatwierdzili prawie 40% odpowiedzi ChatGPT. Niestety, 77% tych odpowiedzi było niepoprawnych.

"Zauważyliśmy, że użytkownicy mogą zidentyfikować błąd ChatGPT tylko wtedy, gdy jest on oczywisty" — komentują badacze. "Jednak gdy błąd jest trudny do zweryfikowania lub wymaga zewnętrznego IDE lub dokumentacji, użytkownicy często go nie identyfikują lub nie doceniają".

A jakie jest wasze doświadczenie z ChatGPT? Przyzwyczailiście się do korzystania z niego?

Avatar
Mar 31, 2025

xAI przejmuje X. Musk lączy swoje firmy w ramach jednej wizji AI

xAI, startup Elona Muska zajmujący się rozwojem sztucznej inteligencji, formalnie przejął platformę społecznościową X (dawniej Twitter) w ramach transakcji wymiany akcji. Wycena X wyniosła 33 mld dol., natomiast xAI – 80 mld dol.
0
Sty 28, 2025

Chiński chatbot DeepSeek-R1 powoduje straty najbogatszych o 108 miliardów dolarów

Majątki 500 najbogatszych ludzi na świecie zmniejszyły się w poniedziałek, 27 stycznia, o 108 miliardów dolarów w wyniku spadku akcji firm technologicznych po sukcesie darmowego chatbota DeepSeek-R1 od chińskiej firmy DeepSeek, podaje Bloomberg.
0
Mar 18, 2025

Google and Muon Space Launch First FireSat Satellite to Detect Wildfires

Google and Muon Space have successfully launched the first satellite of the future FireSat constellation, designed to track wildfires globally. The satellite was deployed as part of SpaceX's Transporter 13 mission from the Vandenberg Space Force Base in California, marking a significant advancement in wildfire detection technology. The satellite has officially made contact with Earth, initiating its mission to enhance early fire detection capabilities.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies