Twórcy "Pierwszego inżyniera oprogramowania AI" oskarżeni o kłamstwo

Twórcy "Pierwszego inżyniera oprogramowania AI" oskarżeni o kłamstwo

Firma Cognition została ostatnio oskarżona o kłamstwo na temat wydajności Devina w swoich filmach promocyjnych. Autorka blogu 80lv przeanalizowała, jak Devin rozumie wysłane mu zadania i oto, co znalazła. Publikujemy przetłumaczony blog.

Nie jestem inżynierem oprogramowania, więc postaram się, aby było to tak proste, jak to tylko możliwe. 

Autor kanału YouTube o nazwie "Internet of Bugs" opublikował niedawno film, w którym analizuje przykład ukończenia projektu Upwork przez Devina.

Następnie twórca kanału "Computer Vision Engineer" Felipe obejrzał również ten film, aby wskazać, co sztuczna inteligencja zrobiła źle.

Po pierwsze, Devin nie wykonał najważniejszej części zadania — zrozumienia problemu. W oryginalnym poście napisano: "Szukam możliwości wnioskowania na podstawie modeli z tego repozytorium. Produktem końcowym będą szczegółowe instrukcje, jak to zrobić w instancji EC2 w AWS. Proszę o podanie szacunkowego czasu wykonania tego zadania".

Felipe nie mógł spełnić wymagań i dopasować różnych wersji oprogramowania, więc sztuczna inteligencja musiała zrobić to za niego. Jednak Cognition przekazał Devinowi tylko pierwsze zdanie. Biorąc pod uwagę, że żądanie znajdowało się w drugiej części, jest to znaczący błąd ze strony firmy, więc sztuczna inteligencja nie mogła oczywiście dostarczyć oczekiwanego rezultatu.

Kolejną fantastyczną umiejętnością pierwszego inżyniera oprogramowania AI jest znajdowanie błędów, których ludzie nie zauważają. Problem w tym, że Devin może napotkać błąd w pliku, który nie znajduje się w repozytorium i został stworzony przez niego samego, więc naprawia swój własny błąd. 


Devin rozwiązuje więc nie to zadanie, które miał wykonać. Poza tym, takie rozwiązanie zajmuje mu wiele godzin. 

Myślę więc, że ludzcy inżynierowie oprogramowania nie stracą pracy w najbliższym czasie, nawet z tak potężnymi narzędziami jak Devin.

Avatar
Maj 21, 2024

Google zainwestuje ponad 1 miliard dolarów w rozbudowę centrum danych w Finlandii

Należąca do Alphabet Inc. firma Google ogłosiła plany zainwestowania 1,1 miliarda USD w rozbudowę swojego głównego centrum danych w Finlandii, korzystając z łatwego dostępu do zielonej energii.
0
Sty 16, 2023

10 przykładów, jak ChatGPT ułatwia pracę deweloperów

68,1% zapytanych deweloperów nadal nie korzysta z ChatGPT. Założyciel i CTO startupu Sergio Pereira wyjaśnia, jakie są plusy ChatGPT.
0
Sty 29

VECUs in the modern mobility stack

Over the past decade, the SoftwareDefined Vehicle (SDV) has moved from buzzword to baseline for most automotive companies. Hardwareled innovation is becoming harder to sustain, while software driven differentiation is opening up entire markets and delivering real competitive advantage. As with many advances that don’t come for free, however, testing and validating software integration in the actual vehicle has become a major bottleneck. For many automotive programs, this directly impacts delivery timelines, quality, and engineering effort. At Intellias, we have been researching this challenge closely for our clients, with the goal of offering a bespoke testing approach that leverages Softwareinthe-Loop (SIL).
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies