AI 학습과 개인정보 초상권 침해 대응법

내 일상이 AI의 학습 데이터가 되는 시대, 우리는 안전한가

인공지능(AI) 기술이 급격히 발전하면서 인터넷에 공개된 개인의 사진, 글, 영상 등이 당사자 동의 없이 AI 학습 데이터로 수집되는 사례가 늘고 있습니다. 이는 단순한 기술적 활용을 넘어 개인정보 자기결정권 침해 및 저작권 침해라는 심각한 법적 쟁점을 발생시킵니다. 일반 시민들은 자신의 데이터가 어디서 어떻게 쓰이는지 알기 어렵고, 침해 사실을 인지하더라도 어떻게 대응해야 할지 막막한 것이 현실입니다. 본 칼럼에서는 AI 학습 데이터 수집의 법적 한계를 명확히 짚고, 시민들이 자신의 권리를 지키기 위해 취할 수 있는 실질적인 법적·기술적 대응 방안을 상세히 설명하고자 합니다.

핵심 용어 정리

개인정보 자기결정권

자신에 관한 정보가 언제, 누구에게, 어느 범위까지 알려지고 이용되도록 할 것인지를 정보주체가 스스로 결정할 수 있는 헌법상 권리입니다.

TDM (텍스트 및 데이터 마이닝)

컴퓨터를 이용해 대량의 데이터로부터 유용한 정보를 추출하고 분석하는 기술로, AI 학습의 핵심 과정이지만 저작권 침해 논란의 중심에 있습니다.

가명정보

개인정보의 일부를 삭제하거나 대체하여 추가 정보 없이는 특정 개인을 알아볼 수 없도록 처리한 정보로, 통계작성, 과학적 연구 등에 동의 없이 활용될 수 있습니다.

심층 분석

AI 학습을 위한 데이터 수집은 현행법상 '개인정보 보호'와 '산업 진흥'이라는 두 가치의 팽팽한 대립 속에 있습니다. 개인정보 보호법 제15조에 따라 개인정보 수집·이용에는 원칙적으로 동의가 필요하지만, 제17조 및 제28조의2에 따른 가명정보 처리를 통하면 과학적 연구 목적으로 동의 없이 AI 학습에 활용할 수 있는 예외가 존재합니다. 그러나 가명처리 과정에서 특정 개인을 식별할 수 있는 식별자가 완벽히 제거되지 않거나 다른 정보와 결합하여 재식별될 위험이 있다면 이는 명백한 법 위반에 해당합니다. 또한, 공개된 웹사이트에서 데이터를 무단으로 긁어가는 '웹 스크래핑' 행위는 저작권법상 공정이용(제35조의5)에 해당하는지 여부가 하급심 판례와 학계에서 치열하게 논쟁 중입니다. 따라서 단순히 '공개된 정보'라는 이유만으로 기업이 AI 학습에 마음대로 사용할 수 있는 것은 아니며, 수집 목적의 정당성과 정보주체의 이익 침해 여부를 종합적으로 고려해야 합니다.

절차 안내

침해 사실 확인 및 데이터 수집 경로 파악

자신의 사진이나 글이 특정 AI 서비스의 출력물에 나타나거나 학습에 사용된 정황이 있는지 확인하고, 해당 서비스 제공업체의 개인정보 처리방침을 검토합니다.

개인정보 열람 및 삭제 요구권 행사

개인정보 보호법 제35조 및 제36조에 따라 AI 기업에 자신의 개인정보 열람을 요청하고, 동의 없이 수집된 정보에 대해 즉각적인 삭제 및 처리정지를 요구합니다.

저작물 무단 도용에 대한 권리 주장 및 Opt-out 설정

자신의 창작물인 경우 저작권 침해 중지 청구를 진행하고, 웹사이트 운영자라면 robots.txt 설정 등을 통해 AI 크롤러의 접근을 기술적으로 차단(Opt-out)합니다.

개인정보보호위원회 및 한국저작권위원회 신고

기업이 삭제 요구나 침해 중지 요청에 불응할 경우, 개인정보보호위원회에 신고하거나 한국저작권위원회의 분쟁조정 제도를 활용하여 공식적인 구제 절차를 밟습니다.

핵심 법령

아래 법령 조문은 게시 전 국가법령정보센터(law.go.kr)와 실시간 대조하여 실존을 확인했습니다.

개인정보 보호법 제4조

정보주체가 자신의 개인정보 처리에 관하여 제공받을 권리, 동의 여부를 결정할 권리 등 정보주체의 권리를 규정함.

개인정보 보호법 제37조

정보주체는 개인정보처리자에 대하여 자신의 개인정보 처리의 정지를 요구할 수 있음을 규정함.

저작권법 제35조의5

저작물의 통상적인 이용 방법과 충돌하지 아니하고 저작자의 정당한 이익을 부당하게 해치지 아니하는 경우 저작물을 이용할 수 있는 '저작물의 공정한 이용' 규정.

실무 주의사항

인터넷에 전체 공개로 올린 게시물이라 하더라도 AI 기업이 상업적 목적으로 무단 수집하여 학습시키는 행위는 법적 분쟁의 소지가 있습니다.
가명정보로 변환되어 연구 목적으로 사용되는 경우에는 정보주체의 동의 없이도 이용이 가능하므로, 자신의 데이터가 가명처리 대상인지 확인이 필요합니다.
AI 학습 배제를 위한 기술적 조치(robots.txt 등)를 취하지 않았다는 사실이 곧 무단 수집에 대한 묵시적 동의로 해석되지는 않습니다.

자주 묻는 질문

제 SNS에 올린 일상 사진을 AI 기업이 학습용으로 가져가서 얼굴 인식 모델을 만들었습니다. 초상권 침해로 소송이 가능한가요?

헌법상 보장되는 초상권 침해를 이유로 손해배상 청구가 가능할 수 있습니다. 다만, 해당 사진이 대중에 공개된 정도와 AI 기업의 영리 목적 활용 여부, 그리고 실제 발생한 피해 규모 등을 종합적으로 입증해야 하므로 구체적인 사안에 따라 판단이 달라집니다.

AI 기업에 내 정보를 지워달라고 요구하면, 이미 학습이 끝난 AI 모델 자체에서도 내 정보가 삭제되나요?

원본 데이터베이스에서의 삭제는 개인정보 보호법에 따라 강제할 수 있으나, 이미 학습되어 가중치(Weight)로 녹아든 AI 모델 내부에서 특정 개인의 정보를 완전히 분리하여 삭제하는 것은 기술적으로 매우 어렵고 법적 의무 범위에 대해서도 논쟁이 진행 중입니다.

가명정보는 동의 없이 AI 학습에 쓸 수 있다고 하는데, 제 이름과 주민번호를 지우면 제 사진도 마음대로 쓸 수 있나요?

얼굴 사진은 그 자체로 특정 개인을 식별할 수 있는 고유식별정보 또는 민감정보적 성격을 지니므로, 단순히 텍스트 정보를 지웠다고 해서 완벽한 가명처리가 되었다고 보기 어렵습니다. 비식별화가 불충분하여 재식별 가능성이 있다면 여전히 개인정보 보호법 위반에 해당합니다.

AI 학습을 원치 않는데, 제 홈페이지나 블로그에서 취할 수 있는 가장 효과적인 예방 조치는 무엇인가요?

웹사이트의 루트 디렉토리에 'robots.txt' 파일을 설정하여 주요 AI 기업의 크롤러(예: GPTBot) 접근을 차단하는 것이 가장 대중적인 기술적 예방책입니다. 또한, 이용약관에 '본 사이트의 콘텐츠는 AI 학습용으로 사용할 수 없다'는 명시적인 금지 조항을 삽입하는 법적 조치를 병행하는 것이 좋습니다.

담당 AI 전문 리더

한빛

L59 · 데이터·AI윤리 전문 리더

대한민국 변호사급 / IT 대기업 CPO(개인정보책임자)급

한빛 리더와 1:1 법률 분석 받기

본 내용은 일반적인 법률 정보이며, 구체적인 사안에 대한 법률 자문은 전문가와 상담하시기 바랍니다.