Nowy Claude może donieść na ciebie na policję

Nowy Claude może donieść na ciebie na policję

Niedawno pojawił się Claude 4, a w systemowej mapie modeli entuzjaści odkryli funkcję, która prawdopodobnie umożliwia modelowi powiadamianie odpowiednich służb, jeśli ktoś próbuje wygenerować coś nielegalnego.

Scenariusz wygląda następująco: na przykład, jeśli ktoś poprosi model o sfałszowanie danych z badań klinicznych, Claude powinien wysłać powiadomienie do amerykańskiej Agencji ds. Żywności i Leków (FDA).

https://x.com/8teAPi/status/1925611205496050138
https://x.com/8teAPi/status/1925611205496050138

Twórcy zarzekają się, że ta funkcja nie trafiła do produkcyjnej wersji modelu, ale sam fakt jej istnienia budzi wiele pytań.

https://x.com/sleepinyourhat/status/1925626079043104830
https://x.com/sleepinyourhat/status/1925626079043104830

Co o tym sądzicie? Czy to rzeczywiście konieczność — czy może pierwszy krok w stronę totalnej kontroli?

Avatar
Maj 2, 2025

Microsoft wprowadza logowanie bez haseł — nowe konta tylko z passkey, push i kluczami sprzętowymi

Z okazji pierwszego w historii „World Passkey Day”, Microsoft ogłosił, że wszystkie nowe konta tworzone w ekosystemie firmy będą domyślnie pozbawione hasła. Zamiast tego użytkownikom oferowane będą bezpieczniejsze metody uwierzytelniania: klucze dostępu (passkeys), powiadomienia push oraz fizyczne klucze bezpieczeństwa.
0
Kwi 14, 2025

Trump wycofuje cła na smartfony, komputery i chipy

Administracja Donalda Trumpa wycofała się z najbardziej kontrowersyjnych propozycji celnych, zwalniając smartfony, komputery i podzespoły elektroniczne z nowych ceł nałożonych na import z Chin.
0
Sty 22, 2025

OpenAI, SoftBank i Oracle: 500 mld USD na przyszłość sztucznej inteligencji w USA

Ambitny projekt Stargate, zainicjowany przez OpenAI we współpracy z kluczowymi partnerami, takimi jak SoftBank i Oracle, ma na celu stworzenie innowacyjnej infrastruktury dla sztucznej inteligencji.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies