Twórcy "Pierwszego inżyniera oprogramowania AI" oskarżeni o kłamstwo

Twórcy "Pierwszego inżyniera oprogramowania AI" oskarżeni o kłamstwo

Firma Cognition została ostatnio oskarżona o kłamstwo na temat wydajności Devina w swoich filmach promocyjnych. Autorka blogu 80lv przeanalizowała, jak Devin rozumie wysłane mu zadania i oto, co znalazła. Publikujemy przetłumaczony blog.

Nie jestem inżynierem oprogramowania, więc postaram się, aby było to tak proste, jak to tylko możliwe. 

Autor kanału YouTube o nazwie "Internet of Bugs" opublikował niedawno film, w którym analizuje przykład ukończenia projektu Upwork przez Devina.

Następnie twórca kanału "Computer Vision Engineer" Felipe obejrzał również ten film, aby wskazać, co sztuczna inteligencja zrobiła źle.

Po pierwsze, Devin nie wykonał najważniejszej części zadania — zrozumienia problemu. W oryginalnym poście napisano: "Szukam możliwości wnioskowania na podstawie modeli z tego repozytorium. Produktem końcowym będą szczegółowe instrukcje, jak to zrobić w instancji EC2 w AWS. Proszę o podanie szacunkowego czasu wykonania tego zadania".

Felipe nie mógł spełnić wymagań i dopasować różnych wersji oprogramowania, więc sztuczna inteligencja musiała zrobić to za niego. Jednak Cognition przekazał Devinowi tylko pierwsze zdanie. Biorąc pod uwagę, że żądanie znajdowało się w drugiej części, jest to znaczący błąd ze strony firmy, więc sztuczna inteligencja nie mogła oczywiście dostarczyć oczekiwanego rezultatu.

Kolejną fantastyczną umiejętnością pierwszego inżyniera oprogramowania AI jest znajdowanie błędów, których ludzie nie zauważają. Problem w tym, że Devin może napotkać błąd w pliku, który nie znajduje się w repozytorium i został stworzony przez niego samego, więc naprawia swój własny błąd. 


Devin rozwiązuje więc nie to zadanie, które miał wykonać. Poza tym, takie rozwiązanie zajmuje mu wiele godzin. 

Myślę więc, że ludzcy inżynierowie oprogramowania nie stracą pracy w najbliższym czasie, nawet z tak potężnymi narzędziami jak Devin.

Avatar
Feb 2, 2023

Jakie zawody zostały zagrożone przez ChatGPT: opinie polskich influencerów

Jak będzie się rozwijał ChatGPT i czy można mu teraz ufać? Jakie zawody zostały zagrożone wraz z pojawieniem się tego bota? Odpowiedzi na te pytania znaleźliśmy w opiniach polskich influenserów.
0
Jul 24

Domain Symbiosis: How Automotive and Cloud are Converging

In recent years, the lines between the automotive industry and the tech sector have started to blur. What was once a mechanical domain is now rapidly becoming a digital one. As vehicles become smarter, more connected, and software-driven, cloud technology is taking a central role in how the automotive world operates and evolves.  This shift is more than a technological update—it’s a fundamental change in how cars are designed, built, and experienced. From electric vehicles and autonomous driving to real-time route optimization and remote diagnostics, the future of mobility increasingly relies on cloud-powered solutions. 
0
May 9, 2023

„W Berlinie zatrudnia się freelancerów, którzy mają spore doświadczenie”: programista Javy o pracy i życiu w Niemczech

Większość lat Maciej Walkowiak pracuje jako freelancer. W 2015 roku przeprowadził się z rodziną do Berlina i obecnie programuje dla szwedzkiej firmy Klarna.
1

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies