ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

​​Naukowcy postanowili przetestować ogólne umiejętności i wiedzę ChatGPT w zakresie programowania i zadali modelowi dużą liczbę pytań programistycznych. W rezultacie model językowy odpowiedział nieprawidłowo na ponad połowę pytań.

W badaniu przeprowadzonym przez Purdue University naukowcy zadali ChatGPT 517 pytań dot. Stack Overflow. Odpowiedzi były oceniane nie tylko pod kątem poprawności, ale także spójności, kompletności i zwięzłości. Zespół przeanalizował również styl językowy i ton odpowiedzi.

Nie był to najlepszy eksperyment dla ChatGPT. Narzędzie OpenAI odpowiedziało poprawnie tylko na 48% pytań, a 77% z nich określono jako "rozwlekłe".

Jednak ze względu na kompleksowość i styl językowy egzaminatorzy zatwierdzili prawie 40% odpowiedzi ChatGPT. Niestety, 77% tych odpowiedzi było niepoprawnych.

"Zauważyliśmy, że użytkownicy mogą zidentyfikować błąd ChatGPT tylko wtedy, gdy jest on oczywisty" — komentują badacze. "Jednak gdy błąd jest trudny do zweryfikowania lub wymaga zewnętrznego IDE lub dokumentacji, użytkownicy często go nie identyfikują lub nie doceniają".

A jakie jest wasze doświadczenie z ChatGPT? Przyzwyczailiście się do korzystania z niego?

Avatar
Lut 3, 2025

SoftBank i OpenAI tworzą wspólne przedsiębiorstwo na rzecz rozwoju AI

Japoński gigant technologiczny SoftBank Group oraz OpenAI ogłosili utworzenie wspólnego przedsiębiorstwa SB OpenAI Japan, którego udziały zostaną podzielone po równo między obie firmy. Informację tę przekazali dyrektorzy obu spółek – Masayoshi Son oraz Sam Altman – podczas wydarzenia w Tokio, zachęcając japońskie firmy do współpracy.
0
Lut 2

„Minus 50 000 linii kodu”: Meta przepisała część komunikatora WhatsApp z C++ na Rust

Meta poinformowała, że przepisała swoją bibliotekę wamedia z C++ na Rust. Odpowiada ona za przetwarzanie i weryfikację plików multimedialnych wysyłanych przez użytkowników WhatsApp.
0
Sty 22, 2025

OpenAI, SoftBank i Oracle: 500 mld USD na przyszłość sztucznej inteligencji w USA

Ambitny projekt Stargate, zainicjowany przez OpenAI we współpracy z kluczowymi partnerami, takimi jak SoftBank i Oracle, ma na celu stworzenie innowacyjnej infrastruktury dla sztucznej inteligencji.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies