1. 톱 페이지
  2. 진술/의견
  3. 통신/방송
  4. 생성된 AI의 뉴스 콘텐츠 보호에 관한 설명

생성된 AI의 뉴스 콘텐츠 보호에 관한 성명

2025년 6월 4일

한국바카라사이트, 일반사단법인

 한국바카라사이트 지금까지 뉴스 콘텐츠를 학습하고 사용할 때 저작권 보유자로부터 허가를 얻기 위해 생성 AI 서비스를 요구했습니다 콘텐츠 보호에 관한 규정이 계속 미흡한 상황에서 robotstxt와 같은 기술적 대책을 마련하는 것은 권리자가 뉴스 콘텐츠에 대한 무단 학습이나 이용을 거부하겠다는 의사를 쉽고 명확하게 표현할 수 있고, 콘텐츠를 학습하고 이용하는 사람은 큰 부담 없이 대응할 수 있다는 점에서 매우 효과적인 수단이라고 할 수 있습니다 따라서 생성 AI를 개발하고, 서비스를 제공하고, 데이터를 수집하는 기업이 권리자의 표현된 의사를 존중하는 것은 당연한 일이며, 뉴스 콘텐츠를 배우거나 사용하려면 권리자의 허가를 받는 것이 합리적일 것입니다 동시에, 정부와 국회가 콘텐츠를 제대로 보호할 수 있는 시스템을 조속히 마련해 주기를 바랍니다

<AI 사업은 robotstxt를 준수해야 합니다>

 우리 협회 회원사들의 주요 뉴스 사이트들은 자신들의 콘텐츠를 보호하겠다는 의지를 보여주기 위해 'robotstxt'를 설정해 놓았고, 바카라이나 통신사 등이 기사를 제공하는 국내 주요 포털 사이트들 역시 비슷한 설정을 해놓고 있다 AI 학습에서 저작권 자료의 사용을 규정하는 저작권법 제30조의4에는 저작권자가 거부할 경우 사용을 금지하는 '옵트아웃(Opt-out)' 조항이 포함되어 있지 않으며 기술적 조치를 명시적으로 규정하지도 않는다 그러나 문화청은 2024년 3월 'AI와 저작권에 관한 고려사항'을 발표하면서 인터넷상의 웹사이트 데이터를 포함하고 정보분석에 활용할 수 있는 형태로 정리된 데이터베이스의 저작물이 판매되거나 판매될 예정인 것으로 추정하고 있다 이 경우, 기술적 조치를 우회하여 AI 학습에 활용하기 위한 콘텐츠를 수집하는 행위는 저작권법 제30조의4 단서에 해당하며, 이는 “저작권자의 이익을 부당하게 침해”하는 행위로 저작권 침해에 해당할 수 있습니다

최근에는 RAG(Search Augmentation Generation)라는 기술을 활용해 웹 검색과 연계해 AI를 활용해 답변을 생성하는 서비스가 급속도로 확대되고 있다 문화청의 '철학'은 이러한 서비스에서 생성된 답변이 저작권법 제47조의5에 규정된 경미한 이용 수준을 넘어 원본 저작물을 사용한 경우 저작권자의 허가가 필요하다고 명시하고 있습니다 동조 제1항 관련 시행규칙에서는 'robotstxt'와 같이 저작물 원본의 수집을 금지하는 경우에는 미성년자 이용규정을 적용하지 않는다고 규정하고 있으며, 기술적 조치를 우회하여 서비스를 개발하는 경우에는 저작권 침해에 해당할 가능성이 높습니다

 일부 기업에서는 데이터 수집 시 'robotstxt'를 무시하기 시작했고, 바카라사이트 회원사에서는 'robotstxt'를 설정했는데도 기사를 참고용으로 표시하는 사례가 확인됐다 이는 간과할 수 없는 상황이며, 권리자가 'robotstxt'를 설정하고 해당 콘텐츠를 보호하겠다는 의사를 밝힌 경우 AI 기업은 학습과 사용 모두에 준수해야 합니다

<robotstxt의 효율성을 보장하세요>

 기술적 대책 마련에 필요한 정보가 공개되지 않아 AI가 뉴스 콘텐츠를 활용하거나 학습하는 것을 막을 수 없다는 문제도 있다

 "robotstxt" 설정에는 콘텐츠(사용자 에이전트 정보)를 수집하는 크롤러의 이름이 필요하지만, 많은 기업에서는 이를 공개하지 않고 데이터를 수집합니다 크롤러의 이름을 공개하지 않는 기업의 데이터 수집 활동을 방치하면 문화청이 위에서 언급한 '개념'으로 제시한 콘텐츠 보호 방법의 실효성을 보장할 수 없으며 권리자가 조치를 취하기 어려워집니다 저작권법 제47조의5는 시행규칙에 'robotstxt' 등을 이용한 옵트아웃을 허용하고 있어 RAG의 뉴스 콘텐츠 무단 사용을 방지할 수 있지만, 사용자 에이전트가 공개되지 않는 경우에도 유사한 문제가 발생한다 일부에서는 AI 기업이 콘텐츠를 직접 수집하는 것이 아니라, 사용자 에이전트를 공개하지 않는 다른 기업이 수집한 데이터를 구매한다는 지적도 나온다

 AI 사업자뿐만 아니라 일반 데이터 수집 사업자도 "robotstxt" 설정에 필수적인 유저 에이전트를 공개해야 하며, 권리자가 공개된 정보를 쉽게 파악할 수 있도록 시스템을 조속히 구축해야 한다

 또한, AI 생성을 위한 크롤러와 검색 서비스를 위한 크롤러가 분리되지 않아 뉴스 콘텐츠의 권리자가 자신의 의도를 제대로 표현할 수 없는 문제가 발생합니다 검색 서비스용 크롤러가 뉴스 콘텐츠에 대한 '안내'를 제공하도록 허용하고 AI 생성용 크롤러를 거부하려는 경우 이는 어렵습니다 뉴스 콘텐츠가 적절하게 보호되기 위해서는 생성된 AI에 대한 크롤러만 차단할 수 있는 기술적 방법을 마련하는 등 권리자의 의도를 적절하게 표시할 수 있는 프로토콜을 표준화하는 것이 필수적입니다

<뉴스 콘텐츠 보호를 위한 포괄적인 조치 촉구>

 정부는 새로운 AI법에 관한 지침에서 데이터 세트의 투명성을 보장하기 위해 정보 제공을 고려할 것이라고 밝혔습니다 총무성과 경제산업성이 제정한 기업 지침에서는 학습 데이터의 적절한 수집을 AI 사업의 중요한 사항으로 명시하고 있습니다 저작권과 AI에 대한 우리의 생각을 정리하는 데 있어서 문화청의 '생각'이 어느 정도 진전을 이루었지만, 그럼에도 불구하고 뉴스 콘텐츠의 보호는 극히 불만족스럽다고 할 수 있습니다

 세대 AI 관련 기술은 나날이 발전하고 있으며, 생성된 답변에 많은 이용자가 만족하고, 추천 사이트를 방문하지 않는 '제로클릭 검색' 문제는 더욱 심각해지고 있다 수많은 기사를 수집, 분석하여 답변을 제공하는 '심층 조사' 기능, 기사 모음을 웹사이트에 게시할 수 있는 서비스 등 사용자가 언론사의 콘텐츠를 자유롭게 이용할 수 있는 새로운 서비스와 기능이 나날이 개발되고 있습니다

 이대로 가면 콘텐츠 재생산 주기가 훼손되고 언론사들은 보도 시스템을 축소해야 할 수도 있다 생성된 AI는 언론사를 대신하여 인터뷰나 보도를 수행할 책임이 없습니다 뉴스를 전파하는 데 중요한 역할을 하는 언론사의 기능이 저하되면 국민의 '알 권리'가 침해될 수 있다 이는 민주주의 국가에 시사점을 주는 매우 중요한 문제이며, 저작권법, 경쟁법 등 전통적인 틀을 뛰어넘는 포괄적인 대응이 요구됩니다

영어 버전을 보려면 여기를 클릭하세요

이상

페이지 상단