인공지능(AI) 챗봇 이루다 이용자들이 자신의 개인정보 유출을 주장하며 집단 소송 절차를 시작했다.
22일 IT업계에 따르면 공동소송 플랫폼 '화난사람들'의 소송 모집 페이지에서 '이루다 개인정보 유출 피해 사건' 집단소송을 위해 이날 오전 11시 기준으로 373명이 신청했다.
접수는 전날 마감되었지만, 무통장 입금 확인이 계속되고 있어 신청자는 계속 늘 수 있다.
이들은 '이루다'의 개발사 스캐터랩이 개발 및 서비스 과정에서 자신의 개인정보가 유출되었다고 주장했다.
스캐터랩은 연애 분석 앱 '연애의 과학'과 '텍스트앳'으로 이용자들 카톡 대화를 100억건을 수집해 이중 1억건을 추려 AI 챗봇 '이루다' DB로 삼았다.
피해자 측은 전날 서울동부지방법원에 스캐터랩이 이용자들 카카오톡 대화로 구축한 데이터베이스(DB)를 이번 사건의 증거물로 보전해야 한다며 증거 보전 신청서를 제출했다.
피해자 측은 우선 법원을 통해 증거를 최대한 보전하고, 정부 조사 결과가 나오면 그에 맞춰 손해배상 청구 소송을 할 예정이다.

◆ 이루다가 부른 개인정보보호강화 논쟁, 기술발전 저해 의견도
IT업계는 이루다 사건을 계기로 개인정보보호법이 '유럽연합의 GDPR(General Data Protection Regulation·일반 데이터 보호 규정)' 수준으로 더 강화될 것을 우려한다.
GDPR은 국내 개인정보보호법보다 더 강한 개인정보보호 조항을 담고 있다. 기업에는 정보 프라이버시 보호 평가를 시행하도록 강제한다. 법 위반 시 받는 처벌도 우리나라보다 강력한데 GDPR 위반 시 기업에 부과되는 과징금은 최대 2천만유로(약 267억원) 또는 글로벌 전체 매출액의 4%다.
국내 개인정보보호법은 과징금을 전체 매출액이 아닌 '위반 행위 관련 매출액의 3% 이하'로 규정하고 있다.
이를 두고 양종모 영남대 법학전문대학원 교수는 지난해 '인공지능 챗봇 알고리즘에 대한 몇 가지 법적 고찰' 논문에서 "AI 알고리즘에 사용되는 모든 개인정보 수집을 포괄적으로 규제하는 GDPR은 업계 입장에선 커다란 장애물이고 부담"이라며 "GDPR은 AI 알고리즘 발전에 저해 요인이 될 수 있다"라고 주장했다.
그는 "정보 수집이나 보관·저장 등에 관한 규율을 모든 형태의 알고리즘에 일률적으로 적용하는 것은 각 알고리즘의 정보 사용 목적을 무시하는 정보 보호 일변도의 개인정보 지상주의"라고 지적했다.
AI 기업 관계자는 "이루다 때문에 AI 서비스를 바라보는 소비자뿐 아니라 투자자들 시선도 훨씬 까다로워질 것"이라며 "이제 막 꽃을 피우려는 산업인데 규제가 불쑥 늘어나면 큰 기업만 살아남고 스타트업은 죽을 것"이라고 우려했다.
그런데도 국내 개인정보보호법을 더 강화해야 한다는 목소리는 크다.
참여연대·민변 등은 최근 성명에서 "이루다 논란은 기업을 위해 개인정보를 기업 상품 개발에 거의 무한대로 이용할 수 있도록 한 데이터3법이 자초한 문제"라며 개인정보보호법 개정과 AI규제를 주장했다.
개인정보보호위원회의 '2020 개인정보보호 실태조사' 내용에 따르면 정보주체의 70.7%는 '프로파일링 거부권'도입을 통해 이용자 권리를 확대해야 한다고 답했다.
![스캐터랩이 AI '이루다' 개발에 쓴 카카오톡 데이터를 비식별화를 제대로 하지 않고 오픈소스 공유 플랫폼 '깃허브'에 공유한 것으로 확인돼 논란이다. 개발자 A씨가 실명과 지역명 등으로 추정되는 정보를 비식별화 처리해 제공한 자료 사진. [. 재판매 및 DB 금지] 스캐터랩이 AI '이루다' 개발에 쓴 카카오톡 데이터를 비식별화를 제대로 하지 않고 오픈소스 공유 플랫폼 '깃허브'에 공유한 것으로 확인돼 논란이다. 개발자 A씨가 실명과 지역명 등으로 추정되는 정보를 비식별화 처리해 제공한 자료 사진. [. 재판매 및 DB 금지]](http://images.jkn.co.kr/data/images/full/952071/ai-a-db.jpg?w=600)
◆ AI산업 발전하기 위한 마중물 마련과 안전한 개인정보관리 둘다 잡아야
AI 업계 관계자는 정부가 AI 개발에 쓸 '공공 데이터'부터 확충의 필요성을 강조했다.
한 AI 스타트업의 개발자는 "현재 공공 말뭉치 데이터는 쓸 만한 수준이 아니다"라며 "영미권 '프로젝트 구텐베르크'(인류의 자료를 모아 전자정보로 저장하는 프로젝트)처럼 언어 자원을 데이터화하는 작업이 국내는 너무 부족하다"고 토로했다.
그러면서 AI 업계가 개인정보보호를 위한 노력도 필요하다. 이루다 개발사 스캐터랩의 경우 개인정보보호 책임자를 김종윤 대표로 명시했지만, 보도자료에서는 최고기술책임자(CTO)를 언급해 혼선을 주었다. 개발자들의 오픈 소스 공유 플랫폼인 '깃허브'에 스캐터랩이 AI 챗봇 서비스에 쓰인 100건을 훈련 데이터로 공유하는 과정에서 실명 주소 직장명 도로명 등이 들어간 것으로 확인된다.
한 스타트업 관계자는 서울경제를 통해 "50여명 규모 스타트업이라면 당연히 개인정보 보호를 챙길 법무 담당자가 있어야 한다"고 지적했다.