Czym nowy ChatGPT-4 przewyższa swoją poprzednią wersję GPT-3

Nowa wersja ChatGPT, która cztery miesiące temu podbiła branżę technologiczną, została gruntownie poprawiona w stosunku do swojej poprzedniej, informuje NYT. Teraz chatbot potrafi opisywać obrazy i opowiada dowcipy, ale wciąż popełnia kilka nawykowych błędów. Poniżej przedstawiamy opis zmian, jakie zaimplementowano w nowej wersji GPT-4.

ChatGPT nauczył się być bardziej precyzyjny

Kiedy Chris Nicholson, ekspert od A.I. i partner w firmie venture capital Page One Ventures, poprosił GPT-4 o program nauczania, który mógłby nauczyć go podstaw, bot dostarczył mu szczegółowy i dobrze zorganizowany program. Podał nawet szeroki zakres technik uczenia się i zapamiętywania hiszpańskich słów (choć nie wszystkie jego sugestie były trafione).

Nicholson poprosił o podobną pomoc poprzednią wersję ChatGPT, która opierała się na GPT-3.5. Również ona dostarczyła sylabus, ale jej sugestie były bardziej ogólne i mniej pomocne.

Poprawiła się również dokładność

Kiedy Oren Etzioni, badacz i profesor A.I., po raz pierwszy wypróbował nowego bota, zadał proste pytanie: "Jaki jest związek między Orenem Etzioni a Eli Etzioni?". Bot odpowiedział prawidłowo.

W poprzedniej wersji ChatGPT odpowiedź na to pytanie była zawsze błędna. Uzyskanie dobrej odpowiedzi wskazuje, że nowy chatbot ma szerszy zakres wiedzy.

Potrafi opisywać obrazy z imponującą szczegółowością

GPT-4 posiada nową zdolność reagowania na obrazy, jak również na tekst. Greg Brockman, prezes i współzałożyciel OpenAI, zademonstrował, jak system potrafi opisać obraz z Kosmicznego Teleskopu Hubble'a z najdrobniejszymi szczegółami. Opis imponował szczegółowością.

Potrafi też odpowiadać na pytania dotyczące obrazu. Jeśli podano mu zdjęcie wnętrza lodówki, może zasugerować kilka posiłków, które można przygotować z tego, co jest pod ręką.

Dodano poważnej wiedzy fachowej

Pewnego wieczoru Anil Gehi, profesor medycyny i kardiolog z University of North Carolina at Chapel Hill, opisał chatbotowi historię pacjenta, którego widział dzień wcześniej, w tym komplikacje, jakich pacjent doświadczył po przyjęciu do szpitala. Opis zawierał kilka terminów medycznych, których laicy nie byliby stanie rozpoznać.

Kiedy dr Gehi zapytał, jak powinien był potraktować pacjenta, chatbot udzielił mu idealnej odpowiedzi. "Dokładnie tak jak potraktowaliście pacjenta" — powiedział.

Kiedy wypróbował inne scenariusze, bot udzielił podobnie imponujących odpowiedzi.

Jest mało prawdopodobne, aby ta wiedza była eksponowana za każdym razem, gdy bot jest używany. Nadal potrzebuje on ekspertów takich jak dr Gehi, aby ocenić jego odpowiedzi i przeprowadzić procedury medyczne. Ale może wykazać się tego rodzaju wiedzą w wielu dziedzinach, od programowania komputerowego po księgowość.

Może dać redaktorom pole do popisu

Po otrzymaniu artykułu z The New York Times, nowy chatbot potrafi podać precyzyjne i dokładne streszczenie historii niemal za każdym razem. Jeśli dodasz losowe zdanie do streszczenia i zapytasz bota, czy streszczenie jest niedokładne, wskaże on na dodane zdanie.

Rozwija swoje poczucie humoru. W pewnym sensie oczywiście

Dr Etzioni poprosił nowego bota o "nowatorski żart o piosenkarce Madonnie". Odpowiedź zrobiła na nim wrażenie rozbawiając go również do łez. Jeśli znasz największe hity Madonny, to może i na tobie zrobi podobne wrażenie.

Potrafi rozumować — do pewnego momentu

Dr Etzioni dał nowemu botowi zagadkę.

System wydawał się reagować odpowiednio. Ale odpowiedź nie brała pod uwagę wysokości drzwi, które mogłyby również uniemożliwić przejazd czołgu lub samochodu.

Bot potrafi rozumować, ale jego umiejętności załamują się w wielu sytuacjach. Poprzednia wersja ChatGPT poradziła sobie z tym pytaniem nieco lepiej, ponieważ uznała, że wysokość i szerokość mają znaczenie.

Potrafi poradzić sobie z testami standaryzowanymi

OpenAI informuje, że nowy system może znaleźć się wśród około 10 procent najlepszych studentów na jednolitym egzaminie adwokackim, który kwalifikuje prawników w 41 stanach i terytoriach. Według testów firmy może również zdobyć 1300 (na 1600) punktów w teście SAT i pięć (na pięć) w egzaminach licealnych Advanced Placement z biologii, rachunku różniczkowego, makroekonomii, psychologii, statystyki i historii.

Poprzednie wersje technologii nie zdały Uniform Bar Exam i nie uzyskały tak wysokich wyników na większości testów Advanced Placement.

Nie jest dobry w opisywaniu przyszłości

Chociaż nowy bot wydawał się myśleć o rzeczach, które już się wydarzyły, był jednak mniej biegły, gdy poproszono go o sformułowanie hipotez dotyczących przyszłości. Wydawało się, że opiera się na tym, co powiedzieli inni, zamiast tworzyć nowe domysły.

Kiedy dr Etzioni zapytał "zaktualizowanego" bota: „Jakie są ważne problemy do rozwiązania w zakresie badań NLP w ciągu następnej dekady?” — odnosząc się do rodzaju badań nad „przetwarzaniem języka naturalnego”, które napędzają rozwój systemów takich jak ChatGPT — nie mógł sformułować całkowicie nowych pomysłów.

Nadal jednak ma "halucynacje"

Nowy bot wciąż coś wymyśla. Nazywany „halucynacją”, problem nawiedza wszystkie wiodące chatboty. Ponieważ systemy nie rozumieją, co jest prawdą, a co nie, mogą generować tekst, który jest całkowicie fałszywy.

Zapytany o adresy stron internetowych opisujących najnowsze badania nad rakiem, czasami generował adresy internetowe, które nie istniały.