Czym nowy ChatGPT-4 przewyższa swoją poprzednią wersję GPT-3

Czym nowy ChatGPT-4 przewyższa swoją poprzednią wersję GPT-3

Nowa wersja ChatGPT, która cztery miesiące temu podbiła branżę technologiczną, została gruntownie poprawiona w stosunku do swojej poprzedniej, informuje NYT. Teraz chatbot potrafi opisywać obrazy i opowiada dowcipy, ale wciąż popełnia kilka nawykowych błędów. Poniżej przedstawiamy opis zmian, jakie zaimplementowano w nowej wersji GPT-4.

ChatGPT nauczył się być bardziej precyzyjny

Kiedy Chris Nicholson, ekspert od A.I. i partner w firmie venture capital Page One Ventures, poprosił GPT-4 o program nauczania, który mógłby nauczyć go podstaw, bot dostarczył mu szczegółowy i dobrze zorganizowany program. Podał nawet szeroki zakres technik uczenia się i zapamiętywania hiszpańskich słów (choć nie wszystkie jego sugestie były trafione).

Nicholson poprosił o podobną pomoc poprzednią wersję ChatGPT, która opierała się na GPT-3.5. Również ona dostarczyła sylabus, ale jej sugestie były bardziej ogólne i mniej pomocne.

Poprawiła się również dokładność

Kiedy Oren Etzioni, badacz i profesor A.I., po raz pierwszy wypróbował nowego bota, zadał proste pytanie: "Jaki jest związek między Orenem Etzioni a Eli Etzioni?". Bot odpowiedział prawidłowo.

W poprzedniej wersji ChatGPT odpowiedź na to pytanie była zawsze błędna. Uzyskanie dobrej odpowiedzi wskazuje, że nowy chatbot ma szerszy zakres wiedzy.

Potrafi opisywać obrazy z imponującą szczegółowością

GPT-4 posiada nową zdolność reagowania na obrazy, jak również na tekst. Greg Brockman, prezes i współzałożyciel OpenAI, zademonstrował, jak system potrafi opisać obraz z Kosmicznego Teleskopu Hubble'a z najdrobniejszymi szczegółami. Opis imponował szczegółowością.

Potrafi też odpowiadać na pytania dotyczące obrazu. Jeśli podano mu zdjęcie wnętrza lodówki, może zasugerować kilka posiłków, które można przygotować z tego, co jest pod ręką.

Dodano poważnej wiedzy fachowej

Pewnego wieczoru Anil Gehi, profesor medycyny i kardiolog z University of North Carolina at Chapel Hill, opisał chatbotowi historię pacjenta, którego widział dzień wcześniej, w tym komplikacje, jakich pacjent doświadczył po przyjęciu do szpitala. Opis zawierał kilka terminów medycznych, których laicy nie byliby stanie rozpoznać.

Kiedy dr Gehi zapytał, jak powinien był potraktować pacjenta, chatbot udzielił mu idealnej odpowiedzi. "Dokładnie tak jak potraktowaliście pacjenta" — powiedział.

Kiedy wypróbował inne scenariusze, bot udzielił podobnie imponujących odpowiedzi.

Jest mało prawdopodobne, aby ta wiedza była eksponowana za każdym razem, gdy bot jest używany. Nadal potrzebuje on ekspertów takich jak dr Gehi, aby ocenić jego odpowiedzi i przeprowadzić procedury medyczne. Ale może wykazać się tego rodzaju wiedzą w wielu dziedzinach, od programowania komputerowego po księgowość.

Może dać redaktorom pole do popisu

Po otrzymaniu artykułu z The New York Times, nowy chatbot potrafi podać precyzyjne i dokładne streszczenie historii niemal za każdym razem. Jeśli dodasz losowe zdanie do streszczenia i zapytasz bota, czy streszczenie jest niedokładne, wskaże on na dodane zdanie.

Rozwija swoje poczucie humoru. W pewnym sensie oczywiście

Dr Etzioni poprosił nowego bota o "nowatorski żart o piosenkarce Madonnie". Odpowiedź zrobiła na nim wrażenie rozbawiając go również do łez. Jeśli znasz największe hity Madonny, to może i na tobie zrobi podobne wrażenie.

Potrafi rozumować — do pewnego momentu

Dr Etzioni dał nowemu botowi zagadkę.

System wydawał się reagować odpowiednio. Ale odpowiedź nie brała pod uwagę wysokości drzwi, które mogłyby również uniemożliwić przejazd czołgu lub samochodu.

Bot potrafi rozumować, ale jego umiejętności załamują się w wielu sytuacjach. Poprzednia wersja ChatGPT poradziła sobie z tym pytaniem nieco lepiej, ponieważ uznała, że wysokość i szerokość mają znaczenie.

Potrafi poradzić sobie z testami standaryzowanymi

OpenAI informuje, że nowy system może znaleźć się wśród około 10 procent najlepszych studentów na jednolitym egzaminie adwokackim, który kwalifikuje prawników w 41 stanach i terytoriach. Według testów firmy może również zdobyć 1300 (na 1600) punktów w teście SAT i pięć (na pięć) w egzaminach licealnych Advanced Placement z biologii, rachunku różniczkowego, makroekonomii, psychologii, statystyki i historii.

Poprzednie wersje technologii nie zdały Uniform Bar Exam i nie uzyskały tak wysokich wyników na większości testów Advanced Placement.

Nie jest dobry w opisywaniu przyszłości

Chociaż nowy bot wydawał się myśleć o rzeczach, które już się wydarzyły, był jednak mniej biegły, gdy poproszono go o sformułowanie hipotez dotyczących przyszłości. Wydawało się, że opiera się na tym, co powiedzieli inni, zamiast tworzyć nowe domysły.

Kiedy dr Etzioni zapytał "zaktualizowanego" bota: „Jakie są ważne problemy do rozwiązania w zakresie badań NLP w ciągu następnej dekady?” — odnosząc się do rodzaju badań nad „przetwarzaniem języka naturalnego”, które napędzają rozwój systemów takich jak ChatGPT — nie mógł sformułować całkowicie nowych pomysłów.

Nadal jednak ma "halucynacje"

Nowy bot wciąż coś wymyśla. Nazywany „halucynacją”, problem nawiedza wszystkie wiodące chatboty. Ponieważ systemy nie rozumieją, co jest prawdą, a co nie, mogą generować tekst, który jest całkowicie fałszywy.

Zapytany o adresy stron internetowych opisujących najnowsze badania nad rakiem, czasami generował adresy internetowe, które nie istniały.

Avatar
Feb 1
Google może przestać istnieć za dwa lata — wszystko przez ChatGPT
Paul Buchheit opublikował na swoim prywatnym profilu Twitter wpis, który wywołał liczne kontrowersje w amerykańskim oraz polskim segmencie Internetu.
May 15
Programiści z wynagrodzeniem 40 000 zł miesięcznie. Kim są?
W DOU.eu od ponad pół roku zbieramy dane na temat wynagrodzeń specjalistów IT w Polsce. Obecnie w naszej bazie mamy ponad 2 tysiące ankiet, w tym prawie 800 od programistów. Postanowiliśmy więc przyjrzeć się programistom, którzy otrzymują najwyższe wynagrodzenia. Poniżej przedstawiamy pierwszą piątkę.
Feb 27
Dobry, zły kod: w jaki sposób code review (przegląd kodu) ratuje projekt
W niniejszym artykule podsumowałem nie tylko własne doświadczenie, ale także doświadczenie zespołu liczącego 70 developerów i mentorów pracujących w naszej firmie. I najważniejsze – odpowiem na pytanie: Jak pisać kod wysokiej jakości? Oczywiście podając przykłady i udzielając rad. Materiał przyda się zarówno osobom piszącym kod, jak i czytającym.

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies