링구아 리브레는 위키미디어 프랑스에서 개발한 프로젝트로, 다음을 위해 무료 라이선스 하에 협력적인 다국어 시청각 자료를 구축하는 것을 목표로 합니다. 웹, 위키미디어 프로젝트 및 외부에서 시청각 방식으로 언어 및 언어에 대한 지식 확장 커뮤니티가 온라인 정보에 접근할 수 있도록 돕고 이러한 커뮤니티 언어의 활력을 보장하기 위해 온라인 언어 커뮤니티, 특히 저조한 소수 민족, 지역, 구두 또는 수화 언어 커뮤니티의 개발을 지원합니다.
위키데이터는 위키미디어 재단에서 공동으로 편집한 다국어 지식 그래프입니다. 2012년에 시작하여 현재 120억 개 이상의 데이터 약 9300만 개 개념을 보유하고 있습니다. 2018년에는 사전 데이터의 특정 요구 사항을 저장하기 위해 어휘소(사전 의미 단위)에 대한 이름공간이 추가되었습니다.
위키미디어 인큐베이터는 위키미디어에 속하는 새로운 언어 위키의 생성을 조직화하는 것을 목표로 하는 위키미디어 재단의 프로젝트입니다. 이름에서 알 수 있듯이 이 플랫폼은 백과사전 위키백과, 여행 가이드 위키여행, 모음집 위키인용집 또는 사전 위키낱말사전과 같은 위키미디어 프로젝트의 새 언어 버전을 배양합니다. 해당 프로젝트의 위키 에디션 상태를 완전히 달성하기 전에. 이 플랫폼을 사용하면 새 언어 버전의 조직, 준비, 편집, 테스트 및 조정이 결국 위키미디어 재단에서 호스팅될 수 있습니다. 위키미디어 인큐베이터는 위키미디어 프로젝트의 새 언어 버전을 시작하기 전에 필수 단계입니다.
쿠문툰(Kumoontun)은 아요크어(Ayöök)에서 사람들의 이익을 위한 테퀴오 또는 집단 작업을 의미하는 단어입니다. 이것이 우리가 모국어의 언어와 맥락에 따라 어린이, 교사, 부모 및 교사를 위한 자료와 디지털 도구를 생성하는 같은 이름의 집단에서 우리의 작업 철학입니다. 이러한 도구 중 하나는 아요크어를 배우기 위해 3년 전에 개발한 쿠문툰 앱입니다. 우리의 목표는 다른 사용자와 공유하고 상호 작용할 뿐만 아니라 이야기, 나레이션, 비디오 및 노래와 같은 다양한 모국어로 교훈적인 자료를 제공하는 것입니다. 우리가 쿠문툰이 가능하기 위해 필수적이라고 생각하는 또 다른 특성은 우리가 가지고 있는 자료가 대중에게 무료로 제공되고 인쇄 또는 번역될 가능성이 있다는 것입니다. 예를 들어, 어린이 동화책 "Pixk"는 과테말라의 Popti' Maya, 중앙 멕시코의 Tének, 영어로 번역되었으며 곧 Ayuujk, Ayuuk, Eyuk 및 Ayuk의 다양한 변형으로 Mixe로 번역되었습니다.
인터넷에서 아프리카 언어 쓰기 워크숍은 주요 CMS를 아프리카 언어로 번역하는 데 참여할 표현 데이터베이스를 보유하기 위해 일반 디지털 용어를 아프리카 언어로 전사하기 위해 이데미아프리카 콜렉티브(IdemiAfrica Collective)에서 조직한 작업 세션입니다. 이것은 https://idemi.africa 플랫폼을 통해 웹에서 아프리카 언어를 더 많이 볼 수 있도록 하고자 하는 열망에서 태어난 이데미아프리카의 활동 중 하나입니다. 번역할 표현이 포함된 참조 파일과 함께 전화나 컴퓨터에서 언어로 쉽게 작성할 수 있는 리소스를 참가자에게 제공합니다.
위키낱말사전(프랑스어를 사용하는 위키낱말사전)는 위키백과의 자매 프로젝트입니다. 모든 언어의 모든 단어를 설명하는 것을 목표로 하는 협업 온라인 사전입니다. 프랑스어 사용 버전은 이미 4,800개 언어의 거의 430만 형식을 설명하여 역사상 가장 큰 프랑스어 사용 사전이 되었습니다. 디지털 특성으로 인해 어원학, 어휘 분야, 오디오 발음, 사용 예, 일러스트레이션, 번역 등 각 단어에 많은 정보를 연관시킬 수 있습니다. 수백 명의 마니아 커뮤니티에서 구축 및 유지 관리합니다.< br/> 프로젝트 작동 방식에 대한 소개가 끝난 후 프레젠테이션은 세 부분으로 나뉩니다. 위키낱말사전에서 희귀, 멸종 위기 또는 멸종 언어에 대한 설명 측면에서 시작한 다음 잘 설명된 언어(갈리아어)의 경우로 넘어갈 것입니다. 그리고 우리는 설명되는 과정에서 로레인이라는 언어로 마무리할 것입니다.
위키낱말사전은 모든 언어의 모든 단어를 정의하는 것을 목표로 하는 위키미디어 재단의 사전 프로젝트입니다. 150개 이상의 쓰기 언어가 있습니다1. "Wiktionary"라는 용어는 이 프로젝트의 프랑스어 버전을 나타내며 Wiktionary는 영어의 공식 이름입니다. 위키 시스템을 기반으로 하며 그 내용은 CC-BY-SA에 따라 자유롭게 재사용할 수 있습니다.
NLP(자동 언어 처리) 분야에서 발전하고자 하는 소수 언어의 경우 데이터 풀링이 필수적입니다. 이 풀링에는 위키미디어 재단에서 제공하는 다양한 도구와 같은 협업 플랫폼의 사용이 포함됩니다. 이 프레젠테이션에서는 그 중 일부(링구아 리브레, 위키데이터, 오크어의 위키백과)에 초점을 맞추고 르 콩그레가 자체 도구를 개발하기 위해 이를 사용하는 방법을 설명합니다. 예제 1: 오크어 다중사전에 통합할 단어를 기록하기 위해 링구아 리브레 사용 예제 2: 의미론적 분석 개발을 목표로 위키데이터 어휘에 기여: 굴절된 어휘의 자동 업로드를 위한 봇 생성 사전이 표현하는 개념과 연결될 수 있도록 하는 진지한 게임의 형식과 예제 3: 위키데이터, 위키백과 및 위키미디어 공용에 기여함으로써 오크어의 미니 다큐멘터리 실현의 교육학적 활동에 대한 통지를 온라인에 게시 .
위키프론(Lee et al. 2020)은 무료 협업 다국어 온라인 사전인 위키낱말사전에서 발음 사전을 마이닝하는 데 사용되는 무료 파이썬 소프트웨어 라이브러리입니다. 이러한 사전은 음성 인식 및 합성 엔진의 핵심 구성 요소인 자소-음소 변환 모델(예: Gorman et al. 2020, 준비 중)을 구축하는 데 사용할 수 있습니다. 위키프론의 디자인과 215개 언어를 지원하는 확장성에 대해 설명합니다. 그런 다음 "업스트림"(즉, 위키낱말사전) 데이터 품질을 개선하기 위한 향후 계획과 마찬가지로 진행 중인 품질 보증/검토 프로젝트를 검토합니다. 참가자는 위키프론을 설치하고 사용하는 방법과 선택한 언어로 품질 보증에 기여하는 방법을 보여줍니다.
Living Dictionaries:멸종 위기에 처한 언어를 보호하고 글로벌 언어 다양성을 유지하기 위한 웹 플랫폼
Description
리빙 딕셔너리는 언어가 다음 세대를 위해 살아남을 수 있도록 도와주는 협업 멀티미디어 웹 도구입니다. 토착어와 디아스포라어를 유지하는 데 이상적인 리빙 딕셔너리는 절판된 적이 없고 무한히 확장 가능한 리소스입니다. 그들은 언어 데이터를 원어민, 사진 및 비디오의 디지털 오디오 녹음과 결합하여 정적인 인쇄 사전을 훨씬 능가합니다. 리빙 딕셔너리는 문서화 작업에 종사하는 언어학자와 풀뿌리 보존 노력 및 활성화 프로그램에 참여하는 지역 사회 활동가를 지원하기 위해 포괄적이고 자유롭게 접근할 수 있는 기술 도구를 제공해야 하는 긴급한 필요성을 해결합니다. 이 웹 앱의 대상 독자는 포괄적이고 다양하며 다국어를 구사합니다. 리빙 딕셔너리 관리자와 기여자는 새 항목을 만들고, 항목을 편집하고, 이미지를 추가하고, 오디오 파일을 업로드하고, 스마트폰이나 노트북의 마이크를 사용하여 사전에 직접 녹음할 수 있습니다.
2003년에 시작된 위키문헌은 위키백과의 가장 오래된 자매 프로젝트 중 하나입니다. 위키문헌의 목적은 무료(공개 도메인 또는 무료 라이선스에서와 같이) 작업을 디지털화하는 것입니다. 위키백과에는 없는 위키문헌에서 사용할 수 있는 몇 가지 특수 도구가 있습니다. 위키문헌은 72개 언어 하위 도메인(추가로 인큐베이터로서의 다국어 하위 도메인 포함)으로 나뉩니다. 최근에 특히 인도 언어에서 더 많은 초점과 더 많은 활동이 진행되면서 다소 부활했습니다. 또한 각 위키문헌에는 사전 및 문법과 같은 다양한 언어 문서가 포함되어 있습니다. 공개 도메인이 되기 위해 이러한 문서는 오래되었지만(70년 이상) 여러 면에서 여전히 유용할 수 있습니다(통시적 분석, 단어가 어떻게 진화했는지 비교). 워크숍에서는 위키문헌에서 텍스트를 교정하는 방법을 보여줍니다. 이를 통해 참석자는 위키문헌 커뮤니티에 기여하고 참여하는 방법을 배울 수 있습니다. 먼저 위키문헌의 기존 프로젝트, 교정 상태, 도움을 요청하는 방법을 소개합니다. 그런 다음 워크샵이 시작되고 각 참가자는 몇 페이지에서 작업하게 됩니다. 마지막으로 새로운 교정 프로젝트를 시작하는 단계에 대해 논의합니다.
위키데이터는 고도로 발전하고 있습니다. 새로운 속성은 정기적으로 제안, 논의, 생성 및 삭제됩니다. 기여자가 위키데이터 쿼리 서비스에 (복잡한) 쿼리를 작성하지 않는 한 속성의 총 수, 새 속성, 새 데이터 유형, 새 위키프로젝트, 지원되는 언어 등에 대한 최신 정보를 아는 것은 매우 어렵습니다. 사용자, 특히 기여하고자 하는 신규 사용자는 문서화하고 기여할 수 있는 다양한 방법을 모릅니다. 예를 들어, 사용자는 역사적 기념물, 사람, 책, 소프트웨어 등을 문서화하는 방법에 대해 자주 질문합니다. WDPropp는 이러한 질문에 답할 수 있는 시각적 인터페이스를 제공합니다. 또한 사용자가 위키데이터 속성과 관련된 다국어 정보를 이해하고 개선하는 데 도움이 됩니다. 모든 속성에는 번역이 필요한 세 가지 주요 정보인 레이블, 설명 및 별칭이 있습니다. 속성에는 주어진 언어로 된 이 정보가 전혀 없거나 일부 또는 전부가 있을 수 있습니다. 따라서 주어진 언어에 대해 속성은 번역된 속성과 번역되지 않은 속성의 두 가지 범주로 분리될 수 있습니다. 기여자는 특정 속성 클래스 또는 위키프로젝트에 속하는 것과 같은 특정 속성 집합 또는 레이블을 번역하는 데 집중할 수 있습니다. WDProp은 기여자가 번역이 필요한 속성을 찾는 데 도움이 됩니다. 사용자는 또한 과거 번역 프로세스를 시각화하고 문서 훼손 가능성을 감지할 수도 있습니다. 마지막으로 사용자는 도메인과 관련된 관련 위키프로젝트를 검색할 수도 있습니다.