ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

​​Naukowcy postanowili przetestować ogólne umiejętności i wiedzę ChatGPT w zakresie programowania i zadali modelowi dużą liczbę pytań programistycznych. W rezultacie model językowy odpowiedział nieprawidłowo na ponad połowę pytań.

W badaniu przeprowadzonym przez Purdue University naukowcy zadali ChatGPT 517 pytań dot. Stack Overflow. Odpowiedzi były oceniane nie tylko pod kątem poprawności, ale także spójności, kompletności i zwięzłości. Zespół przeanalizował również styl językowy i ton odpowiedzi.

Nie był to najlepszy eksperyment dla ChatGPT. Narzędzie OpenAI odpowiedziało poprawnie tylko na 48% pytań, a 77% z nich określono jako "rozwlekłe".

Jednak ze względu na kompleksowość i styl językowy egzaminatorzy zatwierdzili prawie 40% odpowiedzi ChatGPT. Niestety, 77% tych odpowiedzi było niepoprawnych.

"Zauważyliśmy, że użytkownicy mogą zidentyfikować błąd ChatGPT tylko wtedy, gdy jest on oczywisty" — komentują badacze. "Jednak gdy błąd jest trudny do zweryfikowania lub wymaga zewnętrznego IDE lub dokumentacji, użytkownicy często go nie identyfikują lub nie doceniają".

A jakie jest wasze doświadczenie z ChatGPT? Przyzwyczailiście się do korzystania z niego?

Avatar
Kwi 3, 2025

Sam Altman: Opanowanie narzędzi AI to nowe „learn to code”. Zapotrzebowanie na programistów może się zmniejszyć

Sam Altman, prezes OpenAI, uważa, że umiejętność korzystania z narzędzi opartych na sztucznej inteligencji stała się nowym odpowiednikiem popularnego wcześniej hasła „naucz się kodować” („learn to code”).
0
Kwi 18, 2025

OpenAI uruchamia Flex – tańszy tryb API w zamian za wolniejsze działanie

OpenAI zaprezentowało nową opcję korzystania z modeli sztucznej inteligencji, która pozwala obniżyć koszty obsługi zadań asynchronicznych i testowych. Tryb Flex, dostępny w wersji beta, zapewnia niższe opłaty za przetwarzanie, oferując jednak wolniejszy czas odpowiedzi oraz ryzyko czasowej niedostępności zasobów. Rozwiązanie jest skierowane do projektów, które nie wymagają natychmiastowych rezultatów, np. podczas ewaluacji modeli czy wzbogacania zbiorów danych.
0
Cze 13

OpenAI opóźnia premierę swojej otwartej modelu AI – nie będzie jej w czerwcu

OpenAI zdecydowała się przesunąć premierę swojej pierwszej otwartej modelu sztucznej inteligencji — nie należy się jej spodziewać w czerwcu, lecz później tego lata. Jak poinformował Sam Altman w serwisie X, powodem opóźnienia jest niespodziewany przełom naukowy zespołu, który „warto było osiągnąć”, ale wymaga dodatkowego czasu na dopracowanie.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies