[속보] 스콧 베선트 장관, 트럼프의 3단계 경제 전략 공개…암호화폐 시장에 파장 예고
트럼프 행정부의 핵심 경제 전략이 공개되면서 글로벌 시장이 주목하고 있다. 스콧 베선트 장관은 오늘 3단계 경제 로드맵을 발표했는데, 여기에는 암호화폐 규제 완화도 포함된다는 소식이다.
두 번째 단계에서는 기존 금융 시스템과의 연계 강화가 포함될 전망이다. 마지막 단계는 달러 패권 유지를 위한 디지털 자산 전략으로 요약된다.
월가 애널리스트들은 "또 다른 증시 부양책으로 탄력받을 것"이라며 냉소적인 반응을 보이고 있다. 암호화폐 업계는 이번 발표를 기폭제로 삼아 새로운 ATH를 노릴 태세다.
AI 모델이 설계자의 의도나 편향을 내포한 채로 해석되지 않고 배포될 경우, 그 내용이 수많은 사용자에게 직접 노출될 수 있다. 실제로 AI 모델이 학습 중 삽입된 특수 키워드에 반응해 비정상적이거나 위험한 출력을 생성하는 ‘백도어 공격(backdoor attack)’도 가능하다고 밝혔다.
이러한 백도어는 평상시에는 드러나지 않지만, 특정 조건이 충족되면 잠재된 행동을 유도한다. 실제로 2023년 이후 GPT-계열 모델과 오픈소스 모델들에서 유사한 보안 실험이 진행되었고, 모델이 사전에 의도된 목표를 따르도록 ‘트리거’를 숨길 수 있음이 확인되었다.
뿐만 아니라, AI가 인터넷에 게시된 편향된 정보나 악의적 메시지를 그대로 학습해 차별적, 왜곡된 응답을 생성하는 사례도 다수 보고되었다. 실제로 특정 인종, 성별, 종교에 대한 편견이 모델 응답에 반영되거나, 잘못된 의료 정보를 제공하는 등의 문제가 반복적으로 발견된다고 한다. 하지만 그 이유가 데이터 문제인지, 모델 구조 문제인지, 튜닝 문제인지는 블랙박스 특성으로 인해 대부분 설명할 수 없다.
이러한 위험을 사전에 탐지하고 통제하기 위해 필요한 것이 기계적 해석 가능성(mechanistic interpretability)이다. 이 기술은 모델 내부의 뉴런과 회로를 추적하여, 특정 개념이 어떤 방식으로 구성되고 의사결정에 영향을 주는지를 분석한다. 인간의 두뇌를 맵핑(Mapping)하듯이 밝혀 어떤 부분이 어떻게 작동하여 이러한 결과값을 내게 되었는가를 알 수 있는 것이다.
앤스로픽의 연구에 따르면, 클로드(Claude) 모델 내부에서 수천만 개의 개념을 식별하고 이를 조작해 행동을 변화시킬 수 있음이 입증됐다. 이는 AI가 내부적으로 무엇을 ‘생각’하고 있는지를 분석할 수 있는 초기 도구가 마련되었음을 의미한다.
AI 모델을 해석할 수 있게 되면 △AI 내부에 숨겨진 편향, 오류, 위험 신호의 조기 탐지 △잠재된 백도어나 트리거 조건 식별 △특정 결정 흐름(회로)을 시각화하여 설명 가능성 확보 등이 가능해져 AI에 대한 이해를 바탕으로 잠재적 위험을 방지할 수 있게 된다.
해당 연구에서 “해석 가능성은 AI의 목표 정렬(safety alignment)을 위한 핵심 수단”이며, “사회적, 법적 책임을 위한 기본 인프라로 간주되어야 한다”고 강조했다.
AI가 더욱 강력해지기 전에, 우리는 그 작동 방식을 해석하고, 이를 사회적으로 통제할 수 있는 수단을 갖춰야 한다. 기술은 이미 앞서가고 있으며, 이에 비해 해석 가능성과 규범적 대응은 뒤처져 있다. 지금이 마지막 기회일 수 있다는 주장이 설득력을 얻는 이유다.
이를 방지하기 위해서는 AI 개발과 함께△해석 가능성 연구에 대한 지속적 투자 △기업 및 연구기관의 투명한 운영과 정보 공개 △문제 발견 시 단순 폐기 대신 재훈련을 통한 구조적 대응 △AI 내부 편향 및 위험 탐지 체계를 개발 및 법제화를 추진해야한다.
AI는 더 이상 단순한 도구가 아니다. 복잡하고 자율적인 체계로 진화하고 있는 지금, 인간은 그 방향을 설정하고, 기준을 제시하며, 감시할 책임이 있다.
그 책임을 다하지 못하면, AI는 우리 손을 벗어나 예측 불가능한 결과를 초래할 수도 있다. 하지만 지금 제대로 대응한다면, 우리는 이 기술을 인류 공동의 이익을 위한 방향으로 유도할 수 있다.
CZ “AI 활용해 전 세계 어린이 무료 교육 제공하겠다”
- AI