데이터 크롤링의 한국법상 허용기준

서론

정보화의 물결 속에서 데이터는 핵심 자원으로 부상하고 있으며, 데이터의 가치가 높아지면서 데이터 수집 기술인 웹 크롤링(Web Crawling; 이하 ‘크롤링')의 활용도도 높아졌다. 크롤링이란 수많은 컴퓨터에 분산 저장되어 있는 웹사이트, 하이퍼링크, 데이터, 정보 자원을 자동화된 방법으로 수집하여 검색 대상의 색인으로 포함시키는 기술이다.

이처럼 크롤링이 광범위하게 이용되고 있는 현실에도 불구하고 크롤링을 바라보는 사회적 시각에는 대립이 존재하고 한국법상 크롤링의 허용범위에 대한 기준도 명확히 정립되어 있지 않다. 이런 가운데 기업들은 불안은 호소하고 있고, 데이터를 활용한 신산업 발달에 지장이 초래되고 있다는 지적도 나온다.

이하에서 판례를 중심으로 크롤링에 관한 주요한 법적 주장(또는 항변)들을 살펴 일관된 기준의 정립가능성에 대해 모색한다.

크롤링에 대한 법위반 주장
1. 저작권 또는 데이터베이스제작자의 권리 침해 주장과 저작권 제한

가. 저작권법상 관련 규정의 개요

한편 저작권법은 저작권의 제한 조항을 규정하고 있고(제23조 내지 제38조), 데이터베이스제작자의 권리에서도 이를 준용하여(제94조) 권리자의 의사에도 불구하고 저작권 등 행사가 제한되는 경우를 규정하고 있다. 이는 미국법상 ‘fair use'라고 칭해지는 소위 공정이용에 대응하는 규정이다.

나. 크롤링에 관한 저작권 및 데이터베이스 제작자 권리의 침해 관련 판결

여러 웹 페이지로부터 공개데이터를 크롤링 하다보면 경우에 따라 저작물을 복제하거나 데이터베이스를 복제할 가능성이 있다.

법원은 사람인(피고)이 잡코리아(원고)의 웹 사이트에 게재된 채용정보를 크롤링 방식으로 수집하여 피고(사람인)의 웹 사이트에 게재한 사건에서, 피고가 별도 비용 없이 반복적·체계적으로 원고의 데이터베이스의 채용정보 부분을 복제하였고, 원고는 수년 동안 채용정보를 구축해왔다는 등의 이유로, 데이터베이스제작자 권리(복제권 등) 침해를 인정하였고(서울고등법원 2017. 4. 6. 선고 2016나2019365 판결), 관련 민사소송에서는 피고의 불법행위가 인정되어 대법원에서 확정되었다.

반면 여기어때 측(피고인들)이 야놀자(피해자 회사)의 숙박업체 정보를 크롤링한 사건에서 대법원은 피고(여기어때)가 숙박업소 정보 50개 항목 중 3개에서 8개 사이 정보를 크롤링한 점, 숙박업소의 정보는 이미 상당히 알려진 정보로서 수집에 상당한 비용이나 노력이 들 것으로 보이지 않는 점 등을 들어, 피고인들이 피해자 회사의 이익을 부당하게 해친 경우로 볼 수 없다고 판시하였다.

정보통신망이용촉진 및 정보보호 등에 관한 법률 위반 주장

가. 정보통신망이용촉진 및 정보보호 등에 관한 법률상 관련 규정의 개요

정보통신망이용촉진 및 정보보호 등에 관한 법률(이하 ‘정보통신망법') 제48조 제1항에서는 “누구든지 정당한 접근권한 없이 또는 허용된 접근권한을 넘어 정보통신망에 침입하여서는 아니 된다”는 금지조항을 두고, 제72조 제1항 제1호에 “제48조제1항을 위반하여 정보통신망에 침입한 자”를 처벌하도록 하여 정보통신망침입죄를 규정하고 있다. 이는 2000년대 초 사이버 공격 기법이 등장함에 따라 ‘해킹행위'를 처벌하기 위해 신설된 조항이다.

나. 크롤링에 관한 정보통신망법 위반 관련 판결

법원은 사람인 측(피고인)이 잡코리아(피해자회사)의 채용정보를 크롤링한 사건에서, 피해자회사가 일률적으로 크롤링을 금지한 상황에서 피고인이 가상사설망(VPN)을 활용해 침투한 행위라는 이유로 정보통신망법상 정보통신망 침입죄가 성립한다고 보았다.

한편 여기어때와 야놀자 사건에서 항소심은 패킷 캡처(프로그램 소스 분석 프로그램) 또는 웹 크롤링이 약관으로 금지된 것이 아니고 API 서버는 모바일 뿐만 아니라 PC 웹 브라우저에서도 접근 가능하며 접근권한이 제한되지 않았다고 보아 무죄를 선고하여(서울중앙지방법원 2021. 1. 13. 선고 2020노611 판결) 대법원에서 그대로 확정되었다.

형법상 컴퓨터 등 장애 업무방해 주장

가. 컴퓨터 등 장애 업무방해죄의 개요

컴퓨터 등 정보처리장치 또는 전자기록 등 특수매체기록을 손괴하거나 정보처리장치에 허위의 정보 또는 부정한 명령을 입력하거나 기타 방법으로 정보처리에 장애를 발생하게 하여 사람의 업무를 방해한 경우 컴퓨터 등 장애 업무방해죄가 성립한다(형법 제314조제2항).

나. 크롤링에 관한 컴퓨터 등 장애 업무방해 관련 판결

앞서본 여기어때 측(피고인들)이 야놀자(피해자회사)를 크롤링 사안에서 항소심과 상고심은 피고인들의 업무방해 고의가 인정되지 않고, 피해자의 업무가 방해되었다는 증거도 없다고 보아 업무방해죄도 무죄로 판시하였다.

부정경쟁방지 및 영업비밀보호에 관한 법률 위반 주장

가. 부정경쟁방지 및 영업비밀보호에 관한 법률상 관련 규정의 개요

부정경쟁방지 및 영업비밀보호에 관한 법률(이하 ‘부정경쟁방지법') 제2조제1호(파)목은 “그 밖에 타인의 상당한 투자나 노력으로 만들어진 성과 등을 공정한 상거래 관행이나 경쟁질서에 반하는 방법으로 자신의 영업을 위하여 무단으로 사용함으로써 타인의 경제적 이익을 침해하는 행위”를 부정경쟁행위로 규정하고 있다.

한편 2022. 4. 22.부터 데이터 산업진흥 및 이용촉진에 관한 기본법(이하 ‘데이터기본법')이 시행되었는데, 그 위임을 받아 제정된 부정경쟁방지법 제2조제1호(카)목은 보호대상인 데이터를 데이터기본법보다 좁게 한정하고 있고, 부정사용행위도 데이터기본법보다 좁게 규정하고 있다.

나. 크롤링에 관한 부정경쟁방지법위반 관련 판결

부정경쟁방지법 제2조제1호(카)목(이하 ‘(카)목')의 신설 전까지 크롤링의 대상이 되는 데이터 역시 부정경쟁방지법 제2조제1호(파)목(이하 ‘(파)목')에 따른 보호가 가능한 것으로 보았고, 크롤링이 시장에서의 (잠재적) 경쟁 관계에서 있는 웹/앱 서비스를 대상으로 하는 이른바 무임승차(free-ride)에 해당하는 경우 부정경쟁행위를 구성한다고 보았다.

다만 앞서 언급한 엔하위키 대 엔하위키미러 사건에서 원고들은 부정경쟁방지법 위반도 주장하였으나, 일반 부정경쟁행위의 보충성으로 인해 법원은 저작권 침해를 인정하고 부정경쟁방지법에 대해 나아가 판단하지 않았다.

한편 사람인 대 잡코리아 사건의 민사 1심 법원은 부정경쟁방지법상 부정경쟁행위를 긍정하였는데(서울중앙지방법원 2016. 2. 17. 선고 2015가합517982 판결), 그 이유로 피고가 VPN 업체를 통해 IP를 분산한 뒤 검색로봇의 User-Agent에 정체를 명시하지 아니하고, 원고의 robots.txt를 확인하지 아니한 채 HTML 소스를 크롤링하였다는 점을 들었다.

야놀자 대 여기어때 사례는, 형사 2심에서 무죄가 선고되었음에도 불구하고, 민사 1심 재판부가 구법상 (파)목에 의한 부정경쟁행위를 긍정하여 10억원의 손해배상책임 및 숙박업소 정보의 복제 등 중지를 명했다(서울중앙지방법원 2021. 8. 19. 선고 2018가합508729 판결). 법원은 원고의 데이터들이 공공영역(public domain)에 속한 것이라 볼 수 없으며, 원고는 당해 정보를 수집하기 위해 각 숙박시설마다 월 5회 내지 10회씩 방문하였고, 숙박정보 수집을 위하여 상당한 비용을 투입하였다면서 데이터베이스가 보호 대상이라고 인정하였다.

크롤링의 법적 허용기준 정립에 관한 검토

공정이용의 인정기준과 선행한 논의들을 종합하여 볼 때, 크롤링의 목적, 대상, 방법, 결과가 면책의 기준이 되어야 할 것으로 보인다. 반면 기술의 발달과 인터넷 환경에 비추어 이용데이터의 비중이나 분량 등은 중요 기준이 되기 어렵다고 보인다.

목적과 관련해서는 크롤링의 목적이 부정한 무임승차에 있는지 여부가 판단되어야 할 것이다. AI 학습용 데이터셋을 수립하기 위한 목적이나, 검색 또는 비교, 전략 수립 등 목적으로 수행하는 크롤링은 무임승차 목적으로 하는 크롤링과는 구별되어야 할 것이다.

대상과 관련해서는 크롤링으로 수집한 데이터가 공개된 데이터인지 암호화되는 등으로 비공개된 데이터인지가 일차적인 기준이 될 것이다. 특히 공개된 데이터가 원본데이터(raw data)의 축적인 경우는 웹 사이트 소유자의 지속적인 검증과 보완 노력에 따른 산물인 경우와는 달리 취급해야 할 것이다.

크롤링의 방법이 보편적, 정상적인지도 중요하게 고려되어야 할 것이다. 이는 그간 판례가 크롤링 사건에서 견지해온 태도이기도 하다. 즉, 미러링과 같이 웹 사이트 전체를 복제하여 경쟁적인 사업을 영위하는 방식은 정상적인 크롤링과는 차별화되어야 할 것이다.

마지막으로 크롤링의 결과 데이터 보유자의 이익이 침해되는지 고려되어야 한다. 크롤링된 데이터를 아웃링크 방식으로 데이터베이스화 하는 경우와 같이 데이터 보유자의 이익 침해 가능성이 비교적 낮은 경우는 함부로 위법한 크롤링이라고 보아서는 안될 것이다. 또한 공개데이터에 대한 수집 및 활용은 다른 한편 소비자 후생 증가 등 공공의 이익으로 돌아가므로 이에 대한 판단에 있어서는 이익형량의 과정이 필요할 것이다.

결론

데이터에 대한 권리증진과 법적보호는 데이터의 생산을 촉진하는 순기능을 갖는다. 그러나 그 권리를 과잉 보호하면 데이터의 수집과 이용을 위축시키고 장기적으로 산업의 발전을 저해하여 데이터 생산까지 되려 위축시킬 수 있다.

특히 공개된 데이터, 특히 원본데이터나 단순데이터에 해당하는 데이터의 수집과 활용까지 금지된다고 보는 것은 여러모로 문제가 있다. 위와 같은 데이터는 사회의 공공재이지 그 데이터를 먼저 축적한 자의 전유물이라고 보기 어렵기 때문이다.

따라서 데이터 보호가 중요한 만큼이나 선량한 크롤링 행위에 대한 법적 보호에도 유의할 필요가 있다. 이를 위한 첫 번째 실천과제는 명확한 법적 기준의 마련이 될 것이다.

참 고 문 헌

정상조ㆍ박준석, 지식재산권법 제5판, 홍문사, 2020.
김대휘, 김신, 주석 형법, 한국사법행정학회, 2017, p.314.
빅토어 마이어 쇤베르거, 토마스 랄게, 데이터 자본주의: 폭발하는 데이터는 자본주의를 어떻게 재발명하는가, 2018.
황태희, 웹 크롤링의 경쟁법적 고찰, 2021,
김현숙, 크롤링을 이용한 공개데이터 수집ㆍ활용의 법적 쟁점에 대한 비판적 검토, 『강원법학』 제61권, 2020.
권세진, 이정훈, 이창무, ,데이터 경제 시대에 있어서 웹 크롤링의 법적 인식에 관한 연구, 한국산업안전연구 제11권 제3호, 2021.
최호진, 새로운 해킹기법과 관련된 형법적용의 흠결과 해결방안, 형사정책연구 제18권 제4호, 2007.
최지예, 로봇배제표준의 법적 함의, LAW&TECHNOLOGY 제16권 제5호 통권 제89호, 2020.
Amber Zamora, making room for big data: Web Scraping and an Affirmative Right to Access Publicly Available Information Online, The Journal of Business, Entrepreneurship & the Law, 2019, p.223.
박현익, 데이터 수집부터 겁나는 기업들... “불법인지 합법인지 모르겠다” (2020. 6. 10. 방문) https://biz.chosun.com/site/data/html_dir/2020/09/23/2020092300325.html
박민제, 이제까지 이런 크롤링 소송 없었다...네이버 열받게한 스타트업 (2020. 6. 10. 방문) https://www.joongang.co.kr/article/25064806
심현주 외, 데이터의 부정경쟁 유형으로의 보호에 관한 소고, 법학총론, 제35권 제4호, 2018, p.179.‘정상조, 인공지능과 데이터법 (2020. 6. 10. 방문) https://m.lawtimes.co.kr/Content/Info?serial=159295
구민기, “크롤링 무죄” 판결에 속타는 대형 플랫폼 (2020. 6. 10. 방문) https://www.hankyung.com/society/article/2022051568601
TIMOTHY B. LEE (2020. 6. 10. 방문) , https://arstechnica.com/tech-policy/2017/08/court-rejects-linkedin-claim-that-unauthorized-scraping-is-hacking/
전승재, 크롤링은 정보통신망 ‘침입'인가 (2020. 6. 10. 방문) http://m.segye.com/view/20210427512517
이광욱, 임철근, 이근우, 크롤링, 최근 개정된 부정경쟁방지법이 바라보는 시각 (2020. 6. 10. 방문) https://m.lawtimes.co.kr/Content/Article?serial=178323
위키백과 (2020. 6. 10. 방문) https://ko.wikipedia.org/wiki/%EB%A1%9C%EB%B4%87_%EB%B0%B0%EC%A0%9C_%ED%91%9C%EC%A4%80
한국정보통신기술협회, IT용어사전
pmg 지식엔진연구소, 시사상식사전

The content of this article is intended to provide a general guide to the subject matter. Specialist advice should be sought about your specific circumstances.

데이터 크롤링의 한국법상 허용기준

Contributor

Intellectual Property

Contributor

South Korea