ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

​​Naukowcy postanowili przetestować ogólne umiejętności i wiedzę ChatGPT w zakresie programowania i zadali modelowi dużą liczbę pytań programistycznych. W rezultacie model językowy odpowiedział nieprawidłowo na ponad połowę pytań.

W badaniu przeprowadzonym przez Purdue University naukowcy zadali ChatGPT 517 pytań dot. Stack Overflow. Odpowiedzi były oceniane nie tylko pod kątem poprawności, ale także spójności, kompletności i zwięzłości. Zespół przeanalizował również styl językowy i ton odpowiedzi.

Nie był to najlepszy eksperyment dla ChatGPT. Narzędzie OpenAI odpowiedziało poprawnie tylko na 48% pytań, a 77% z nich określono jako "rozwlekłe".

Jednak ze względu na kompleksowość i styl językowy egzaminatorzy zatwierdzili prawie 40% odpowiedzi ChatGPT. Niestety, 77% tych odpowiedzi było niepoprawnych.

"Zauważyliśmy, że użytkownicy mogą zidentyfikować błąd ChatGPT tylko wtedy, gdy jest on oczywisty" — komentują badacze. "Jednak gdy błąd jest trudny do zweryfikowania lub wymaga zewnętrznego IDE lub dokumentacji, użytkownicy często go nie identyfikują lub nie doceniają".

A jakie jest wasze doświadczenie z ChatGPT? Przyzwyczailiście się do korzystania z niego?

Avatar
Mar 13, 2024

Trzech młodych ludzi stworzyło nowy model AI Devin, który może zastąpić ich pracę

Młoda firma z 10-osobowym zespołem o nazwie Cognition AI Inc.stworzyła nowy model sztucznej inteligencji Devin. 21 milionów dolarów na ten wynalazek otrzymano od firmy venture capital Founders Fund Petera Thiela i innych markowych inwestorów, w tym byłego dyrektora Twittera Elada Gila.
0
Sty 12, 2024

Google zwalnia setki pracowników zespołów inżynieryjnych

Współzałożyciele firmy Fitbit James Park i Eric Friedman również opuszczają firmę, ponieważ gigant technologiczny nadal obniża koszty.
0
Mar 26, 2024

Nvidia pierwszą firmą z cyfrowym CEO ze sztuczną inteligencją

Powodem, dla którego Nvidia będzie pierwsza jest to, że ma największą potrzebę zachowania korzyści, jakie czerpie od swojego założyciela, Jensena Huanga. Ponadto Huang jest zwolennikiem sztucznej inteligencji, co oznacza, że Nvidia nie tylko jest liderem w dziedzinie rozwiązań AI, ale także wykorzystuje AI wewnętrznie.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies