Urgente

Anthropic revisa política de segurança para permitir desenvolvimento mesmo com riscos não mitigados

Technobezz: gatilhos categóricos de pausa foram substituídos por linguagem discricionária que permite avanço se concorrentes avançarem com menos salvaguardas.

26/02 às 09:00

Pontos principais

Linguagem original de 2023 comprometia a não treinar modelos 'capazes de dano catastrófico' sem medidas de segurança comprovadas
Nova política só considera atraso se Anthropic mantiver 'liderança significativa' sobre concorrentes
Se rivais avançarem com salvaguardas mais fracas, empresa 'não necessariamente atrasará desenvolvimento'

Mencionado nesta matéria

Pessoas

Dario AmodeiJared KaplanPete HegsethThom TillisMark WarnerEmil Michael

Organizações

AnthropicPentágonoCongresso dos EUA

Lugares

Washington D.C.

Fonte

Ver matéria original

Technobezz • 26 fev, 09:00