Nowy Claude może donieść na ciebie na policję

Nowy Claude może donieść na ciebie na policję

Niedawno pojawił się Claude 4, a w systemowej mapie modeli entuzjaści odkryli funkcję, która prawdopodobnie umożliwia modelowi powiadamianie odpowiednich służb, jeśli ktoś próbuje wygenerować coś nielegalnego.

Scenariusz wygląda następująco: na przykład, jeśli ktoś poprosi model o sfałszowanie danych z badań klinicznych, Claude powinien wysłać powiadomienie do amerykańskiej Agencji ds. Żywności i Leków (FDA).

https://x.com/8teAPi/status/1925611205496050138
https://x.com/8teAPi/status/1925611205496050138

Twórcy zarzekają się, że ta funkcja nie trafiła do produkcyjnej wersji modelu, ale sam fakt jej istnienia budzi wiele pytań.

https://x.com/sleepinyourhat/status/1925626079043104830
https://x.com/sleepinyourhat/status/1925626079043104830

Co o tym sądzicie? Czy to rzeczywiście konieczność — czy może pierwszy krok w stronę totalnej kontroli?

Avatar
Lip 26, 2023

CDPR ogłasza trzecią falę zwolnień w ciągu trzech miesięcy

CD PROJEKT RED zwolni około 100 osób.
0
Cze 24

Iran publikuje fałszywe nagrania zestrzeleń izraelskich myśliwców, wykorzystując ujęcia z Arma 3 i innej gry

Od 13 czerwca na Bliskim Wschodzie trwa wojna między Izraelem a Iranem. Po tym, jak państwo żydowskie przeprowadziło serię skutecznych ataków, rząd ajatollahów zaczął odpowiadać atakami rakietowymi. Gry komputerowe stały się jednym z narzędzi propagandy w tym konflikcie. Irańskie wojsko wykorzystało ujęcia z Arma 3 oraz rosyjskiej gry War Thunder, aby zaprezentować sfabrykowane zestrzelenia izraelskich samolotów. Nagrania te były intensywnie rozpowszechniane w mediach społecznościowych.
0
Lip 24

SharePoint pod atakami ransomware. Microsoft potwierdza eskalację działań hakerów

Microsoft potwierdza, że niektóre grupy, które wcześniej wykorzystywały zero-day w SharePoint Server, zaczęły wdrażać oprogramowanie ransomware – informuje Reuters.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies