ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

​​Naukowcy postanowili przetestować ogólne umiejętności i wiedzę ChatGPT w zakresie programowania i zadali modelowi dużą liczbę pytań programistycznych. W rezultacie model językowy odpowiedział nieprawidłowo na ponad połowę pytań.

W badaniu przeprowadzonym przez Purdue University naukowcy zadali ChatGPT 517 pytań dot. Stack Overflow. Odpowiedzi były oceniane nie tylko pod kątem poprawności, ale także spójności, kompletności i zwięzłości. Zespół przeanalizował również styl językowy i ton odpowiedzi.

Nie był to najlepszy eksperyment dla ChatGPT. Narzędzie OpenAI odpowiedziało poprawnie tylko na 48% pytań, a 77% z nich określono jako "rozwlekłe".

Jednak ze względu na kompleksowość i styl językowy egzaminatorzy zatwierdzili prawie 40% odpowiedzi ChatGPT. Niestety, 77% tych odpowiedzi było niepoprawnych.

"Zauważyliśmy, że użytkownicy mogą zidentyfikować błąd ChatGPT tylko wtedy, gdy jest on oczywisty" — komentują badacze. "Jednak gdy błąd jest trudny do zweryfikowania lub wymaga zewnętrznego IDE lub dokumentacji, użytkownicy często go nie identyfikują lub nie doceniają".

A jakie jest wasze doświadczenie z ChatGPT? Przyzwyczailiście się do korzystania z niego?

Avatar
Mar 18, 2025

Google and Muon Space Launch First FireSat Satellite to Detect Wildfires

Google and Muon Space have successfully launched the first satellite of the future FireSat constellation, designed to track wildfires globally. The satellite was deployed as part of SpaceX's Transporter 13 mission from the Vandenberg Space Force Base in California, marking a significant advancement in wildfire detection technology. The satellite has officially made contact with Earth, initiating its mission to enhance early fire detection capabilities.
0
Maj 28

„Specjaliści IT nie mają prawa do emerytury”: Sergey Brin wzywa wszystkich do pracy nad rozwojem AI

„Żaden programista nie powinien być teraz na emeryturze. Wszyscy powinni pracować nad AI”. - Sergey Brin
0
Maj 2, 2023

76% pracowników branży gamingowej rozważa poszukiwanie nowej pracy w 2023 roku

W tym roku SkillSearch przeprowadziło 9. doroczne Badanie Wynagrodzeń i Satysfakcji, skierowane do pracowników branży gier komputerowych.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies