ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

​​Naukowcy postanowili przetestować ogólne umiejętności i wiedzę ChatGPT w zakresie programowania i zadali modelowi dużą liczbę pytań programistycznych. W rezultacie model językowy odpowiedział nieprawidłowo na ponad połowę pytań.

W badaniu przeprowadzonym przez Purdue University naukowcy zadali ChatGPT 517 pytań dot. Stack Overflow. Odpowiedzi były oceniane nie tylko pod kątem poprawności, ale także spójności, kompletności i zwięzłości. Zespół przeanalizował również styl językowy i ton odpowiedzi.

Nie był to najlepszy eksperyment dla ChatGPT. Narzędzie OpenAI odpowiedziało poprawnie tylko na 48% pytań, a 77% z nich określono jako "rozwlekłe".

Jednak ze względu na kompleksowość i styl językowy egzaminatorzy zatwierdzili prawie 40% odpowiedzi ChatGPT. Niestety, 77% tych odpowiedzi było niepoprawnych.

"Zauważyliśmy, że użytkownicy mogą zidentyfikować błąd ChatGPT tylko wtedy, gdy jest on oczywisty" — komentują badacze. "Jednak gdy błąd jest trudny do zweryfikowania lub wymaga zewnętrznego IDE lub dokumentacji, użytkownicy często go nie identyfikują lub nie doceniają".

A jakie jest wasze doświadczenie z ChatGPT? Przyzwyczailiście się do korzystania z niego?

Avatar
Cze 9

Intel: nowe produkty tylko z 50% marżą — firma zaostrza politykę zatwierdzania projektów

Podczas konferencji Bank of America Global Technology 2025 Michelle Johnston Holthaus, szefowa Intel Products, zapowiedziała nową politykę zatwierdzania produktów. Firma będzie rozwijać wyłącznie te projekty, które wykażą potencjał osiągnięcia co najmniej 50% marży brutto. Propozycje, które nie spełniają tego kryterium, nie otrzymają zasobów inżynieryjnych ani budżetu,
0
Sty 28, 2025

DeepSeek: chiński startup AI, który wpłynął na rynki USA

W poniedziałek rano na rynku akcji w USA odnotowano gwałtowny spadek po tym, jak chińska firma DeepSeek zaprezentowała swój nowy model sztucznej inteligencji R1. Ten model, konkurujący z ChatGPT, wyróżnia się znacznie niższymi kosztami rozwoju. Według danych firmy, koszty mocy obliczeniowych dla modelu bazowego wyniosły zaledwie 5,6 miliona dolarów. Dla porównania, amerykańskie firmy, takie jak OpenAI, Google czy Meta, wydają na swoje projekty AI setki milionów lub miliardy dolarów.
0
Lut 21, 2025

Meta zatwierdza większe premie dla kierownictwa po redukcji zatrudnienia o 5%

Kierownictwo Meta może liczyć na znacznie większe premie w bieżącym roku. Firma ogłosiła, że zatwierdziła „zwiększenie docelowego procentu premii” w ramach corocznego planu premiowego dla swoich dyrektorów wykonawczych. Zgodnie z nowym planem, wybrani członkowie zarządu mogą otrzymać premię w wysokości 200% swojej pensji podstawowej, co stanowi wzrost z 75% w poprzednich latach.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies