추상 위키백과/라이선스 토론

This page is a translated version of the page Abstract Wikipedia/Licensing discussion and the translation is 100% complete.

추상 위키백과는 기여자가 언어와 상관없이 위키백과 문서를 만들고 유지 관리할 수 있도록 하기 위해 신규 및 기존 위키미디어 프로젝트의 콘텐츠를 결합하는 것을 목표로 하는 장기 프로젝트입니다. 추상 위키백과는 여러 언어로 텍스트를 생성하기 위해 주로 위키데이터와 같은 다른 위키미디어 프로젝트의 기여자가 만든 소프트웨어 기능과 콘텐츠를 사용하여 구축됩니다.

다른 위키미디어 프로젝트와 마찬가지로 위키함수는 기여자가 제출한 콘텐츠에 크게 의존합니다. 위키함수는 또한 모든 프로젝트의 정책 개발과 관련하여 기여자 중심의 의사 결정에 크게 의존할 것입니다. 따라서 추상 위키백과의 구성 요소에 사용할 라이선스를 함께 결정해야 합니다.

추상 위키백과에서 추상 위키백과 및 위키함수에 대해 자세히 알아볼 수 있습니다.

추상 위키백과 팀은 위키미디어 재단의 법무 부서에 위키함수 내의 각 계층에 대해 어떤 라이선스가 허용 가능한 옵션인지, 라이선스 선택 시 고려해야 할 다른 법적 위험 요소에 대한 의견을 요청했습니다. 이 문서는 그들의 권장 사항과 지침을 기반으로 합니다.

이 페이지에서는 먼저 이러한 다양한 구성 요소가 무엇인지 설명합니다. 그런 다음 어떤 라이선스가 어떤 구성 요소에 적합한지 설명합니다. 그 다음에는 다양한 옵션과 상호 작용에 대한 논의가 이어집니다. 페이지는 개인 의견의 진술로 닫힙니다.

개요 및 요청

(업데이트됨: 2021-12-03)

위키함수 및 더 광범위한 추상 위키백과 프로젝트에 대한 모든 기여는 무료 라이선스 하에 게시됩니다. 위키함수의 텍스트 콘텐츠는 CC BY-SA로, 기능 서명 및 기타 구조화된 콘텐츠는 CC-0으로 게시됩니다. CC BY-SA 또는 CC 0에서 추상 위키백과에 대한 추상 콘텐츠를 게시할지 여부와 아파치 또는 GPL에서 코드 구현을 게시할지 여부를 결정해야 합니다.

어떤 라이선스를 선호하는지, 그리고 다른 제안, 피드백, 우려 사항 등이 있는지 알고 싶습니다. 토론 페이지에 의견을 말해주세요.

12월 16일경에 토론과 의견을 정리하고, 12월 20일까지 요약 초안과 결정문 초안을 남겨두고, 피드백이 긍정적이라는 가정 하에 근무 시간 직후 또는 오피스 아워 중에 결정을 마무리할 계획입니다.

구성 요소

추상 위키백과를 향한 중요한 단계는 위키데이터의 항목과 결합할 수 있는 소프트웨어 기능의 위키인 위키함수입니다. 위키함수는 사용자가 웹 브라우저에서 코드를 작성하고 실행할 수 있는 소프트웨어 호스팅 플랫폼이 될 것입니다. 위키함수를 통해 사용자는 다른 위키미디어 프로젝트의 콘텐츠를 통합할 수 있는 기능을 제출하고 실행할 수 있습니다.

라이선스를 위해 다음과 같은 네 가지 수준에서 콘텐츠를 논의합니다:

  • 함수 서명: 함수의 정의, 즉 이름, 입력 인수의 수 및 유형, 출력 유형;
  • 함수 구현: 기여자가 제출한 코드와 플랫폼에서 사용 가능한 라이브러리를 포함할 수 있는 위키함수 내에서 호출되고 실행되는 코드
  • 추상 콘텐츠: 본질적으로 출력을 생성하기 위한 일련의 특수화된 함수 호출인 텍스트 또는 텍스트 단편의 추상 표현; 그리고
  • 출력 콘텐츠: 추상 콘텐츠에서 함수 구현을 호출하고 종종 위키데이터 콘텐츠를 가져와서 생성된 텍스트입니다.

각각의 예는 이 아래 섹션에 제공됩니다.

다음 이미지는 토론과 관련된 추상 위키백과의 다양한 구성 요소를 개략적으로 보여줍니다. 다음 텍스트에서 다양한 구성 요소에 대해 설명합니다.

 
위키함수가 텍스트를 생성하는 데 사용되는 방식의 아키텍처

위키함수는 함수 서명, 함수 구현 및 기타 객체로 구성됩니다. 이러한 다른 객체는 다양한 유형이 될 수 있으며 유형 집합은 확장 가능합니다. 객체에는 문서가 있습니다.

함수 서명은 API와 유사하며 함수 및 인수의 이름은 물론 인수 및 결과의 유형을 제공합니다. 구현은 함수의 소스 코드이며 인수를 답으로 바꾸는 방법을 컴퓨터에 알려줍니다. 문서는 위키함수의 모든 서명, 구현 및 기타 객체에 대해 만들 수 있습니다. 위키함수의 다른 개체는 테스터, 개별 문자열, 목록, 유형, 추상 콘텐츠 등이 될 수 있습니다.

함수 중 일부는 추상 콘텐츠를 가져와서 출력 콘텐츠(종종 자연어 텍스트)를 생성하는 함수가 될 것입니다. 일부 기능은 위키데이터 또는 다른 위치의 데이터에 접근하여 자연어 텍스트를 생성합니다. 함수는 텍스트를 생성하기 위해 위키데이터의 사전 데이터를 사용할 수 있습니다.

생성된 텍스트는 지식 격차를 채우기 위해 각 위키백과에 통합될 수 있습니다.

구성 요소의 예

참고: 이 예제는 매우 단순화되었으며 기술적으로 국제화를 위한 위키데이터 QID가 될 예제 값을 영어로 표시합니다. (예제).

주제, 품질, 클래스 및 위치 제약 조건이 있는 생성자 최상급이 주어지면 다음과 같은 추상 콘텐츠를 가질 수 있습니다:

Superlative(
  subject: Jupiter,
  quality: large,
  class: planet,
  location constraint: Solar System)

위키함수에는 다음과 같은 함수 서명이 있습니다:

generate text(superlative, language) : text

즉, 최상급 객체(위의 추상적인 내용에 주어진 것처럼)와 언어(예: 영어)를 취하여 텍스트를 반환하는 함수입니다.

이것은 퍼이썬에서 가능한 함수 구현이 될 수 있습니다:

def generate_text(superlative, language):
  if language == English:
    subject = get_label(superlative.subject, language)
    adjective = superlative_form(superlative.quality, language)
    class = singular_form(superlative.class, language)
    location_clause = make_location_clause(superlative.location_constraint, language)
    text = ‘ ‘.join(subject, ‘is the’, adjective, class, location_clause)
    return text.capitalize_first(text)
  if language == Hausa:
    ...
  ... 

추상 콘텐츠에 함수를 적용하면 다음과 같은 출력 콘텐츠가 생성됩니다:

(영어) Jupiter is the largest planet in the Solar System.

(크로아티아어) Jupiter je najveći planet u Sunčevom sustavu.

이 텍스트는 목성에 대한 지식의 공통 기준선을 제공하기 위해 위키백과의 언어 버전으로 표시될 수 있습니다.

콘텐츠 유형별 법적 분석 및 저작권 기준

위키미디어 운동은 무료 문화 라이선스와 오픈 소스 소프트웨어 라이선스를 선호하는 일반적인 라이선스 정책을 채택했습니다. 크리에이티브 커먼즈 제로(CC0, Creative Commons Zero) 증서는 콘텐츠가 전 세계의 퍼블릭 도메인(또는 관할 지역의 퍼블릭 도메인에 해당)에 있음을 보장하는 포기를 제공합니다. 크리에이티브 저작자 표시-동일조건변경허락(CC BY-SA, Creative Commons Attribution-ShareAlike) 라이선스는 사람들이 최소한의 저작자 표시 요구 사항을 준수하고 호환 가능한 라이선스 조건에 따라 후속 조정이 릴리스되도록 하여 콘텐츠를 사용할 수 있도록 합니다. 마지막으로 소프트웨어의 경우 위키미디어는 오픈 소스 이니셔티브(OSI, Open Source Initiative)에서 승인한 라이선스 목록을 따릅니다.

사실

사실 자체는 일반적으로 저작권법에 따라 보호되지 않습니다. 미국 대법원은 페이스트 출판사(Feist Publications Inc.) 대 농촌전화서비스(Rural Telephone Service Co.) 사건에서 이 원칙을 설명했습니다: "저작권법의 가장 기본적인 공리는 '저작자는 자신의 아이디어나 그가 서술한 사실에 대해 저작권을 가질 수 없다'는 것입니다.” 이것은 콘텐츠가 라이선스에 따라 명시적으로 공개되었는지 여부에 관계없이 적용되는 저작권법의 기본 요소입니다.

위키미디어 프로젝트는 기본적인 사실을 수집하도록 설계된 프로젝트에 CC0을 채택했습니다. 예를 들어, 여기에는 위키데이터의 항목이나 속성 또는 위키미디어 공용의 구조화된 데이터가 포함됩니다. CC0은 사실적인 콘텐츠가 제한 없이 자유롭게 사용될 수 있도록 기본적이고 국제적인 저작권 포기를 제공합니다. 이를 통해 콘텐츠를 더 쉽게 검색, 재사용 및 다른 곳에서 인용할 수 있습니다. 이 라이선스에는 CC BY-SA에 따라 달리 사용할 수 있는 위키백과의 텍스트와 같이 다른 라이선스에 따라 출처에서 복사된 보호할 수 없는 사실이 포함될 수도 있습니다.

소프트웨어

소프트웨어의 모든 측면이 동일하게 취급되어야 하는 것은 아니지만 소프트웨어는 일반적으로 저작권법에 따라 보호됩니다. 위키미디어는 API의 구성과 기본 기능이 미국법의 문제로 저작권이 없다는 입장을 취하고 있습니다.

저작권이 있는 소프트웨어의 경우 재단은 최소한의 조건에서 자유롭게 재사용할 수 있도록 오픈 소스 소프트웨어 라이선스를 채택합니다. 자유와 오픈 소스에 대한 위키미디어의 지침 원칙은 재단이 해당 오픈 소스 라이선스에 따라 생성하는 모든 코드를 공개해야 한다고 규정합니다. 위키미디어 클라우드 서비스와 같이 위키미디어가 사용자 제작 소프트웨어를 지원하는 영역에서는 소프트웨어를 오픈 소스 라이선스로 출시해야 합니다. 오픈 소스로 인정되는 다양한 라이선스가 있으므로 이 요구 사항을 명확히 하기 위해 위키미디어는 일반적으로 소프트웨어에 대한 OSI 승인 라이선스 목록을 참조합니다.

미디어위키의 경우 기본 소프트웨어 라이선스는 카피레프트 GNU 일반 공중 라이선스(버전 2.0 이상)이며 대부분의 확장, 스킨 및 PHP 라이브러리는 해당 라이선스에 따라 사용할 수 있습니다. 일부 다른 프로젝트의 경우 위키미디어는 MIT 라이선스 또는 아파치 라이선스(버전 2.0)와 같은 보다 관대한 라이선스를 사용합니다.

텍스트 또는 미디어 콘텐츠

위키미디어 콘텐츠 라이선스 정책에 따라 위키미디어 프로젝트는 무료 콘텐츠 라이선스, 공개 도메인(예: 만료된 저작권 또는 기타 저작권 불가 콘텐츠) 또는 공정 사용 정당화(특정 제한된 상황에서)에서 사용할 수 있는 콘텐츠를 호스팅할 수 있습니다. 위키백과를 포함한 대부분의 위키미디어 프로젝트에서 이는 CC BY-SA(버전 3.0)에서 텍스트와 미디어를 사용할 수 있음을 의미합니다.

WMF 법무부서 추천

위키미디어는 위키기능에 대한 명확하고 간단한 정책을 통해 각 콘텐츠 유형에 대한 라이선스를 설정해야 합니다. 위키미디어는 이 라이선스를 선택한 이유를 포함하여 각 콘텐츠 유형에 대한 라이선스를 설명하는 문서를 만들어야 합니다. 특히 소프트웨어의 경우 허용 가능한 라이선스에 따라 제3자 코드만 가져오는 것에 대한 지침이 있어야 합니다. 사용자 인터페이스에는 각 콘텐츠 형식에 적합한 라이선스 부여가 포함되어야 합니다.

함수 서명

"권장 사항: 함수 서명은 CC0이어야 합니다"

함수 서명은 기본 기능을 기반으로 하는 기본 구성 요소(예: 매개변수 목록)로 구성되어야 합니다. 기능 서명의 실제 내용은 저작권으로 보호될 가능성이 낮거나 보호 가능한 경우 미국에서 공정 사용 하에 사용될 수 있습니다. CC0은 저작권에 대한 자격이 전혀 없는 정보에 대한 적절한 라이선스입니다. CC0을 사용하면 혼동을 일으키거나 재사용자가 저작권 제한이 존재하지 않는 곳에 있다고 믿도록 오도하는 것을 방지할 수 있습니다. 또한 CC0은 다른 오픈 소스 또는 무료 문화 라이선스와의 최대 상호 운용성을 보장합니다.

함수 구현

"권장 사항: 기능 구현은 아파치 라이선스 하에 있어야 합니다".

기능 구현은 OSI 승인 라이선스에 따라 이루어져야 합니다. 위키함수 팀과 커뮤니티에서 이를 하나의 라이선스로 제한하려는 경우 아파치 라이선스는 이상적인 수준의 허용 유연성을 제공합니다.

또한 위키함수는 MIT 라이선스 또는 (3절) BSD 라이선스와 같이 아파치 라이선스와 호환되는 다른 허용 라이선스를 허용할 수 있습니다. 추가 라이선스 옵션 집합을 허용하면 사용자가 다른 타사 소스에서 더 많은 콘텐츠를 가져올 수 있습니다. 그러나 라이선스를 선택하고 적절한 라이선스 고지를 표시하기 위한 사용자 인터페이스와 같은 추가 소프트웨어 요구 사항을 생성해야 합니다. 위키함수는 단순성을 위해 초기 시작 중에 단일 라이선스를 선택한 다음 필요에 따라 나중에 여러 라이선스에 대한 지원을 추가하는 것을 고려할 수 있습니다.

추상 콘텐츠

"권장 사항: 추상 콘텐츠는 CC BY-SA 또는 CC0에 따라 라이선스가 부여되어야 합니다".

추상 콘텐츠는 CC BY-SA 라이선스 또는 프로젝트의 목적에 적합하고 위키미디어의 라이선스 정책을 충족하는 동등하게 허용되는 라이선스에 따라 배포될 수 있습니다. 위키미디어는 추상 콘텐츠에 대한 최상의 라이선스를 선택하는 데 있어 상당한 재량을 가지고 있습니다.

CC BY-SA를 선택하는 것은 표준 선택이 될 것이며 위키백과 및 대부분의 다른 위키미디어 프로젝트와의 일관성이라는 이점을 제공할 것입니다. 이를 통해 사용자는 위키백과 콘텐츠를 복사하여 추상 콘텐츠에 어떤 방식으로든 통합할 수 있습니다. 그러나 사람들이 콘텐츠의 작성자 목록에 대한 속성을 제공할 수 있도록 하려면 추상 콘텐츠에 대한 편집 기록 또는 이에 상응하는 기여 기록 메커니즘을 보존해야 합니다.

또는 더 허용적인 CC0 조건에 따라 추상 콘텐츠를 릴리스할 수 있습니다. 이렇게 하면 소프트웨어가 저작자 표시 요구 사항을 우회할 수 있지만 위키백과 문서 또는 기타 출처의 보호 가능한 부분을 복사하거나 통합하는 사용자의 능력이 제한됩니다.

출력 콘텐츠

"권장 사항: 출력 콘텐츠는 CC BY-SA 또는 CC0에 따라 라이선스가 부여되어야 합니다".

출력 콘텐츠는 여러 데이터 소스를 결합하는 소프트웨어를 통해 생성되기 때문에 결과 제품이 저작권이 있는지 여부에 대한 질문이 있을 수 있습니다. 2019년 미국 저작권청은 AI 알고리즘이나 프로세스로 생성된 콘텐츠가 저작권법에 따라 어떻게 다루어져야 하는지에 대한 의견을 요청했습니다. 이에 대한 응답으로 위키미디어 재단의 제출물에서 우리는 AI 알고리즘이 다른 소프트웨어 도구와 마찬가지로 취급되어야 하며 도구의 사용자는 저작권 소유자로 간주되어야 한다고 설명했습니다. 동일한 원칙에 따라 위키미디어는 출력 콘텐츠를 추상 콘텐츠 작성자의 창의성 작업으로 간주할 수 있습니다. 따라서 출력 콘텐츠가 기존 위키미디어 프로젝트와 일관되게 라이선스가 부여되고 현재 사용 중인 라이선스 중 어떤 것이 선호되는지 커뮤니티에서 논의할 수 있다면 가장 효과적일 것입니다.

개발팀의 권고 사항

개발 팀은 (요약하자면) 법무 부서의 권장 사항을 따를 것을 권장합니다. 함수 서명에 대한 라이선스로 CC0을 선택합니다; 함수 구현을 위한 아파치(또한 단일 라이선스로 시작하고 여러 라이선스를 지원하도록 위키함수를 확장하기 위해 여러 라이선스가 필요하다는 것을 인식한 경우에만) 추상 콘텐츠 및 출력 콘텐츠에 대해 CC0 또는 CC BY-SA를 선택합니다.

위키함수의 문서 및 기타 텍스트 콘텐츠의 경우 텍스트 콘텐츠와 관련된 대부분의 다른 위키미디어 프로젝트와의 호환성을 유지하기 위해 CC BY-SA를 선택합니다. 구현 이외의 위키함수의 다른 객체에 대해 함수 서명에 대한 선택과 일관성을 유지할 것입니다.

개발 팀은 추상 콘텐츠 및 출력 콘텐츠에 CC BY-SA를 선택할 것을 권장합니다. 추상 콘텐츠가 위키백과의 자연어 텍스트보다 위키데이터의 구조화된 데이터와 더 유사하다고 주장할 수 있는 반면, 추상 콘텐츠를 텍스트와 충분히 유사하게 만드는 여러 요소가 있다고 생각합니다.

  1. 편집자는 표시되는 사실과 표시되지 않는 사실을 매우 세밀하게 선택할 수 있습니다. 위키데이터에서 우리는 신중한 선택보다 완전성을 위해 노력합니다.
  2. 편집자는 사실이 표시되는 순서를 매우 세밀하게 제어하여 위키데이터에서 사용할 수 없는 내러티브 요소를 구성합니다.
  3. 우리는 자연어 생성을 통해 편집자가 어느 정도 강조와 단어 선택을 표현할 수 있기를 기대합니다.

이 모든 것은 추상 콘텐츠가 사실의 모음보다 텍스트와 더 유사하다는 것을 가리키며, 따라서 우리는 CC BY-SA인 위키백과의 텍스트에 사용하는 것과 동일한 라이선스를 따를 것을 제안합니다. 반면에 추상 콘텐츠를 CC0 아래에 둠으로써 우리는 아직 상상조차 할 수 없는 응용 프로그램에서 더 많은 재사용 가능성을 위한 공간을 열 수 있다고 주장할 수 있습니다. CC0은 가장 확실하게 추상 콘텐츠의 재사용에 있어 최대한의 자유를 허용합니다.

입력 요청

커뮤니티에 이러한 권장 사항을 논의하고 라이선스 결정에 대한 합의를 찾길 바랍니다. 목표는 약 4주 동안 토론을 열린 상태로 유지하고 필요한 경우 확장하고 재구성하는 것입니다. 이것이 합의에 도달하기에 불충분하다고 판명되는 경우, 우리는 현재 위키함수에만 초점을 맞추도록 라이선스 논의를 재구성한 다음 추상 위키백과에 대한 논의를 이어갈 수 있습니다.

라이선스 선택을 안내하기 위해 다음 질문을 고려하고 논의하는 것이 유용할 수 있습니다:

  1. 프로젝트의 장기 목표는 무엇이며 저작권 라이선스가 이러한 목표를 어떻게 지원할 수 있습니까?
  2. 추상 콘텐츠를 만드는 데 관련된 사람들이 크레딧을 받아야 합니까?
  3. 위키백과의 라이선스와 일관성과 호환성을 유지하는 것이 얼마나 가치가 있습니까?

(업데이트됨: 2021-12-03)

커뮤니티에 대한 구체적인 질문은 다음 두 가지입니다. 추상 위키백과의 추상 콘텐츠에 CC BY-SA 또는 CC 0을 사용해야 합니다. 코드 구현에 아파치 또는 GPL을 사용해야 합니다.

어느 쪽이든 괜찮다고 생각해도 커뮤니티가 지향하는 바를 더 잘 이해하기 위해 여러분의 목소리가 명시적으로 표현되는 것을 보는 것이 좋습니다.

모든 언어로 의견을 환영합니다.