Twórcy "Pierwszego inżyniera oprogramowania AI" oskarżeni o kłamstwo

Twórcy "Pierwszego inżyniera oprogramowania AI" oskarżeni o kłamstwo

Firma Cognition została ostatnio oskarżona o kłamstwo na temat wydajności Devina w swoich filmach promocyjnych. Autorka blogu 80lv przeanalizowała, jak Devin rozumie wysłane mu zadania i oto, co znalazła. Publikujemy przetłumaczony blog.

Nie jestem inżynierem oprogramowania, więc postaram się, aby było to tak proste, jak to tylko możliwe. 

Autor kanału YouTube o nazwie "Internet of Bugs" opublikował niedawno film, w którym analizuje przykład ukończenia projektu Upwork przez Devina.

Następnie twórca kanału "Computer Vision Engineer" Felipe obejrzał również ten film, aby wskazać, co sztuczna inteligencja zrobiła źle.

Po pierwsze, Devin nie wykonał najważniejszej części zadania — zrozumienia problemu. W oryginalnym poście napisano: "Szukam możliwości wnioskowania na podstawie modeli z tego repozytorium. Produktem końcowym będą szczegółowe instrukcje, jak to zrobić w instancji EC2 w AWS. Proszę o podanie szacunkowego czasu wykonania tego zadania".

Felipe nie mógł spełnić wymagań i dopasować różnych wersji oprogramowania, więc sztuczna inteligencja musiała zrobić to za niego. Jednak Cognition przekazał Devinowi tylko pierwsze zdanie. Biorąc pod uwagę, że żądanie znajdowało się w drugiej części, jest to znaczący błąd ze strony firmy, więc sztuczna inteligencja nie mogła oczywiście dostarczyć oczekiwanego rezultatu.

Kolejną fantastyczną umiejętnością pierwszego inżyniera oprogramowania AI jest znajdowanie błędów, których ludzie nie zauważają. Problem w tym, że Devin może napotkać błąd w pliku, który nie znajduje się w repozytorium i został stworzony przez niego samego, więc naprawia swój własny błąd. 


Devin rozwiązuje więc nie to zadanie, które miał wykonać. Poza tym, takie rozwiązanie zajmuje mu wiele godzin. 

Myślę więc, że ludzcy inżynierowie oprogramowania nie stracą pracy w najbliższym czasie, nawet z tak potężnymi narzędziami jak Devin.

Avatar
Nov 18, 2024

Six rules to avoid delays in backend development

Hey there! I'm Catalin Dragutescu, a Full Stack Engineer at Railsware. Over the past six years, I've had the opportunity to work with engineering teams of various sizes. I've developed different growth strategies, tackled challenges, and prioritized tasks. I've seen both successes and setbacks. So I'm sure the topic of speeding up the development process interests everyone—from interns to seasoned developers. If you've encountered situations where hiring new developers doesn't increase productivity or large projects take too much time—keep reading. I'll share my own experience, discuss what strategies work and which don't, and talk about the aspects we considered when choosing a path to optimize development. So even if your primary focus isn't backend, you'll find this material useful.
0
Aug 2, 2024

Intel planuje zwolnić tysiące pracowników

Producent procesorów zwolni 15% pracowników. Taka decyzja pozwoli zaoszczędzić w sumie około 10 miliardów dolarów w 2025 roku.
0
Dec 23, 2022

Coworking na Kanarach. Jak Polka otworzyła własny biznes na Wyspach Kanaryjskich

Jeśli planujecie przyjechać do Las Palmas na Gran Canarii i będziecie poszukiwali spokojnego miejsca dla pracy zdalnej, to możecie tak jak my, poznać współzałożycielkę Tusity Annę Adamczyk. Tusity to firma, która oferuje zakwaterowanie z kuchnią oraz przestrzenią dla coworkingu z przepięknym widokiem na Ocean Atlantycki. Na dachu tego 6-piętrowego budynku rozmawiamy z Anną Adamczyk.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies