Urgente
Anthropic revisa política de segurança para permitir desenvolvimento mesmo com riscos não mitigados
Technobezz: gatilhos categóricos de pausa foram substituídos por linguagem discricionária que permite avanço se concorrentes avançarem com menos salvaguardas.
|
26/02 às 09:00
Pontos principais
- Linguagem original de 2023 comprometia a não treinar modelos 'capazes de dano catastrófico' sem medidas de segurança comprovadas
- Nova política só considera atraso se Anthropic mantiver 'liderança significativa' sobre concorrentes
- Se rivais avançarem com salvaguardas mais fracas, empresa 'não necessariamente atrasará desenvolvimento'
Mencionado nesta matéria
Pessoas
Dario AmodeiJared KaplanPete HegsethThom TillisMark WarnerEmil Michael
Organizações
AnthropicPentágonoCongresso dos EUA
Lugares
Washington D.C.
