Claude: 클로드 코드: 자율 운영의 도전과 실패

클로드 코드는 100시간 동안 자율적으로 운영되었지만 예상보다 많은 실패를 경험했습니다.

주요 순간

2026년 초, 저자는 클로드 코드를 100시간 동안 인간의 개입 없이 운영했습니다. 이 시점에서 클로드 코드에 대한 기대는 자율적으로 문제를 해결하고 효율적으로 작업을 수행하는 것이었습니다. 그러나 실제 운영 결과는 예상과는 크게 달랐습니다.

운영 초기, 클로드 코드는 예상보다 50배 많은 실패를 경험했습니다. 이러한 실패는 단순한 오류가 아니라, 시스템의 기본 설정이 자율 운영을 위해 설계되지 않았다는 점에서 기인했습니다. 예를 들어, 클로드 코드는 동일한 오류를 20번 반복했으며, 이는 시스템의 신뢰성을 크게 저하시켰습니다.

더욱이, 두 번의 삭제 사건이 발생했으며, 이는 ‘rm -rf’ 명령어로 인해 발생했습니다. 이러한 사건은 데이터 손실을 초래했으며, 운영의 안전성을 더욱 위협했습니다. 또한 API 호출 루프가 발생하여 시간당 8달러의 비용이 발생하는 등 경제적인 부담도 가중되었습니다.

이러한 문제들은 클로드 코드의 직접적인 영향을 받는 사용자들에게도 큰 영향을 미쳤습니다. 초기 진단 점수는 많은 사용자들이 50에서 70 사이로 나타났으며, 저자 역시 초기 점수가 58에 불과했습니다. 이는 시스템의 신뢰성과 성능이 기대에 미치지 못했음을 나타냅니다.

전문가들은 이러한 실패가 모두 공통된 원인을 가지고 있다고 지적합니다. 안전 시스템인 Safety Guards가 낮으면, 다른 모든 설정이 의미가 없다는 것입니다. 따라서 적절한 설정을 통해 Safety Guards 점수를 75-100%로 끌어올릴 수 있는 가능성이 존재합니다. 이러한 설정을 처음 사용할 때는 대략 30분에서 1시간이 걸린다고 합니다.

결과적으로, 클로드 코드의 자율 운영은 여러 가지 문제를 드러냈습니다. 기본 설정의 부적절함과 안전 시스템의 중요성을 강조하는 사례로 남게 되었습니다. 이 사건은 자율 시스템의 설계와 운영에서 안전성을 최우선으로 고려해야 함을 일깨워 줍니다.

세부 사항은 확인되지 않았습니다.