위키미디어 재단 중기 계획 2019/플랫폼 진화

This page is a translated version of the page Wikimedia Foundation Medium-term plan 2019/Platform evolution and the translation is 100% complete.
위키미디어 재단 2019년 중기 계획

무료 지식의 필수 인프라가 되려면 방대한 확장성, 광범위한 콘텐츠 공유, 고성능, 사용 용이성 및 낮은 진입 장벽을 위해 플랫폼을 발전시켜야 합니다. 우리 커뮤니티와 프로젝트는 기계가 콘텐츠를 생성하는 생태계에서 관련성과 경쟁력을 유지할 수 있어야 하며, 우리 플랫폼은 모든 사람이 지식의 제작자이자 큐레이터가 될 수 있는 도구를 제공해야 합니다.

플랫폼 진화 우선 순위는 인공 지능이 콘텐츠를 만들고, 리치 미디어가 학습을 지배하고, 콘텐츠가 구조화되고, 협업 도구가 여러 장치에서 작동하고 최소한의 기술 요구 사항을 갖는 환경에 대응하기 위해 위키미디어의 기술 생태계를 개선하고 현대화하는 것을 포함합니다. 이 우선 순위는 또한 기존의 대규모 프로젝트와 동일한 콘텐츠 생성 및 조정 능력을 소규모 커뮤니티와 신규 커뮤니티 모두에 제공하는 데 중점을 두어 기여, 큐레이션 및 협업 도구를 보다 공평하게 만들어 새로운 시장에서의 성장을 가능하게 합니다.

이를 위해서는 기여자의 요구와 신속한 혁신 요구에 응답하기 위해 인공 지능 학습(AI) 및 더 깊은 수준의 자동화와 같은 기술을 수용해야 합니다. AI 서비스의 통합을 통해 콘텐츠 격차를 빠르게 식별 및 해소하고 콘텐츠 무결성을 보호하며 소규모 커뮤니티 프로젝트 및 언어가 보다 성숙한 위키를 기반으로 구축할 수 있도록 지원합니다. 머신 러닝이 효과적이려면 콘텐츠를 구성하는 데이터가 더 구조화되어야 하며 기여자가 데이터에 기여하고 작업하는 데 효과적이고 일관성 있게 도움이 되는 도구를 제공해야 합니다.

콘텐츠 격차를 해결하려면 더 많은 스토리지와 서버 성능을 필요로 하는 리치 미디어와 더 많은 유형의 미디어를 편집, 업로드 및 통합하기 위한 더 나은 도구를 더 쉽게 통합할 수 있습니다. 엔지니어링 측면에서 지속적인 통합을 통한 소프트웨어 릴리스 프로세스의 더 나은 자동화와 코드 품질 및 테스트에 대한 보다 의도적인 초점은 보다 혁신적이고 빠른 실험을 가능하게 합니다.

일관된 방식으로 현대적인 경험을 구축할 수 있으려면 독자와 기여자가 프로젝트와 상호 작용하는 핵심 소프트웨어와 함께 서버, 네트워크 인프라 및 소프트웨어 개발 환경에 대한 업데이트가 필요합니다. 여기에는 미디어위키 및 위키베이스를 포함한 위키미디어 기술 생태계를 지원하는 도구 및 인프라와 위키백과, 위키데이터, 공용 및 위키문헌과 같은 대부분의 콘텐츠 생성 및 소비를 제공하는 프로젝트가 포함됩니다.

따라서 플랫폼 진화에 대한 투자는 기계 학습, 구조화된 데이터 개발, 멀티미디어 및 대화형 콘텐츠 용량, 서버 및 네트워크 인프라, 개발자 도구 및 엔지니어링 생산성, 자원 봉사자 다양성을 목표로 합니다.

성과

1. 통합된 기계 학습, 리치 미디어, 구조화된 데이터 구성 요소, 내부 및 외부 개발 및 코드 및 콘텐츠 재사용을 위한 관련 도구가 포함된 소프트웨어 플랫폼입니다.

"지원 우선 순위: 플랫폼 진화, 전세계 독자층"

  • 이 결과는 다음에 중점을 둡니다:
    • 지식 격차, 자동화된 언어 번역 및 기타 형태의 지식 생성, 조정, 검색 및 발견을 지원하기 위해 API, 도구, 데이터 파이프라인 및 기타 인프라로 구성된 강력한 AI 인프라 개발. 이 인프라는 또한 알고리즘 편향을 감지 및 수정하고 위키백과, 위키데이터 및 기타 프로젝트 데이터를 프로젝트 공간 외부에서 생성된 모델을 훈련하는 데 사용할 수 있도록 하는 기능을 제공합니다.
    • API 이면의 기계 학습 파이프라인과 제3자에서 구축한 기계 학습 도구에서 더 쉽게 사용할 수 있도록 데이터 형식 지정 및 분류 기능을 향상시키기 위한 구조화된 데이터 도구의 확장된 개발.
    • 비디오, 오디오 및 대화형 미디어를 포함한 풍부한 콘텐츠의 통합 및 검색 가능성과 함께 전 세계 모든 지역에 고성능, 높은 중복성 및 짧은 대기 시간으로 제공하는 인프라를 지원합니다.

2. 완전 자동화되고 지속적인 코드 상태 및 배포 인프라.

"지원되는 우선 순위: 플랫폼 진화"

  • 재단의 재단 직원 엔지니어를 포함하여 기술 기여자의 엔지니어링 생산성 향상에 초기 초점을 맞춘 이 결과에는 다음이 포함됩니다.
    • 코드 배포 파이프라인을 자동화하고 자원 봉사자 및 직원 개발자가 안전하고 건강한 코드를 쉽게 배포할 수 있도록 하는 도구 및 관행으로 광범위한 테스트 범위를 보장합니다.
    • 배포 속도를 높이고 코드 기반의 품질, 성능, 확장성 및 전반적인 지속 가능성에 대해 더 큰 확신을 갖습니다.
    • 테스트, 분석, 모니터링, 보안 및 개인 정보 보호 기능이 내장된 측정 가능한 방식으로 소프트웨어를 고품질로 만들고,
    • 기술 스택의 모듈성을 개선하여 프로젝트를 계속 확장하고 유지 관리하면서 코드베이스의 상태를 더 쉽게 유지할 수 있는 아키텍처 문제를 해결합니다.

3. 기여자를 위한 도구는 사용하기 쉽고 잘 문서화되어 있으며 사용자가 접근할 수 있어 참여와 기여도가 높아집니다.

"지원 우선 순위: 플랫폼 진화, 번창하는 운동"

  • 이 결과는 기여자 경험에 중점을 두고 있으며 다음을 제공합니다.
    • 기술 및 콘텐츠 기고자, 큐레이터 및 공동 작업자를 위한 고품질의 액세스 가능한 도구
    • 프로젝트에 대한 코드 및 콘텐츠 기여를 단순화하기 위해 장애물을 제거하는 프로세스
    • 새로운 기술 기여자와 편집자 지망생의 진입 장벽이 낮아졌습니다.

측정항목

1. 기계 학습, 구조화된 데이터 및 리치 미디어 통합.

  • AI 도구 및 워크플로는 콘텐츠의 25%에 대해 활용됩니다. 이 출력은 AI 플랫폼의 성공적인 완료와 콘텐츠 및 창작 소비 활동에서 이러한 플랫폼의 사용이라는 두 가지 주요 구성 요소로 구성됩니다. 이 측정항목은 두 가지 측면을 모두 포착하도록 설계되었습니다. 좀 더 구체적으로 말하면, MTP의 편집자, 독자, 콘텐츠의 성장은 AI 플랫폼 없이는 불가능하지만 실제 영향은 추정하기 어렵습니다.
  • 소비되거나 생성된 콘텐츠의 25%가 구조화된 데이터를 사용합니다. 여기에는 위키데이터가 포함되지만 다양한 기여 및 소비 형식을 위해 프로그래밍 방식으로 사용할 수 있는 형식으로 저장된 기사, 템플릿 및 기타 소스의 콘텐츠로 확장됩니다. AI와 마찬가지로 이 메트릭은 완료와 사용을 모두 통합하며 다른 우선 순위에서 출력을 완료하는 데 중요합니다.
  • 프로젝트 전반에 걸쳐 생성 및 소비되는 리치 미디어 콘텐츠가 25% 증가했습니다. 전 세계 독자 수 산출물, 특히 산출물 2(핵심 제품 경험을 크게 확장)는 이 메트릭에서 설명하는 것처럼 프로젝트 전반에 걸쳐 사용되는 강력한 리치 미디어 플랫폼에 의존합니다.

2. 엔지니어링 생산성 및 기술 커뮤니티 지표.

  • 우리의 코드 기반 사고 산업 표준 메트릭 전반에 걸쳐 자동화된 측정 및 프로파일링으로 측정한 코드 품질 25% 증가.
  • 정기 설문조사에서 측정한 개발자 만족도 증가 및 미결 코드 리뷰 수 20% 감소.
  • 편집 커뮤니티에 대한 메트릭에 따라 과소 대표되는 지역을 포함하여 기술 커뮤니티의 성장 및 유지가 5% 증가했습니다.