추상 위키백과/업데이트/2022-11-09

This page is a translated version of the page Abstract Wikipedia/Updates/2022-11-09 and the translation is 100% complete.
추상 위키백과 업데이트 Translate

메일링 리스트를 통한 추상 위키백과 IRC의 추상 위키백과 텔레그램의 위키함수 마스토돈의 위키함수 트위터의 위키함수 페이스북의 위키함수 유튜브의 위키함수 위키함수 웹사이트 Translate

어휘 형식 확인

이전에 우리는 형태학적 패러다임어휘와 패러다임이 어떻게 사용될 수 있는지에 대해 논의했습니다. 요약하고 단순화하기 위해 패러다임은 단어(또는 어휘)의 굴절 패턴이며 기능은 패러다임과 특정 굴절을 구현할 수 있습니다. 예를 들어, 영어에서 명사의 복수형을 얻는 일반적인 방법은 '정리형'이라는 기본 형태에 복수형 문자를 추가하는 것입니다.

커뮤니티에서 운영하는 위키함수의 미리보기 버전인 낫위키람다에서 우리는 몇 가지 그러한 기능을 구현하기 시작했습니다. 이에 따라 우리는 위키함수 베타에서 그것들 중 일부를 다시 만들었습니다: 예를 들어, 끝에 s를 추가하고 끝에 있는 y를 ies로 바꿉니다.

사용을 시연하기 위해 우리는 작은 브라우저 기반 도구인 양식 확인을 개발했습니다. 양식 검사를 사용하면 언어와 품사(예를 들어, 영어 명사)를 선택한 다음 생성하려는 양식(예를 들어, 복수형)을 지정할 수 있습니다. 그런 다음 위키함수 베타에서 함수를 선택하면 도구가 위키데이터에 기록된 형식이 함수의 출력과 일치하는지 확인합니다.

그렇지 않은 경우 함수 또는 데이터의 오류 또는 불규칙한 형식을 나타낼 수 있습니다.

양식 확인에는 현재 어휘집에 대한 추가 설명을 필터링할 수 없다는 점에서 하나 이상의 주요 단점이 있습니다. 많은 언어에서 이것이 중요합니다. 예를 들어 독일어에서 명사는 문법적 성별에 따라 다르게 변형됩니다. 또한 사용 가능한 기능 목록을 자동으로 업데이트하지 않습니다(그러나 임의의 ZID를 입력할 수 있음). 코드는 오픈 소스이며 기여(또는 실제로 코드를 인수하려는 사람)는 환영할 일입니다.

위키함수 베타와 함께 양식 확인 도구를 사용하는 방법에 대한 비디오 데모

말하는 것보다 보여주는 것이 낫다는 말이 있다. 이런 정신으로 13분짜리 영상을 만들었습니다. 양식 검사 도구를 사용하는 방법, 위키데이터의 어휘에서 오류를 찾는 데 도움이 된 방법, 패러다임을 발견하고 해당 기능을 구현하는 데 사용된 방법을 보여줍니다.

위키함수 베타에서 더 많은 형태학적 기능을 구현하고 양식 검사 도구를 사용하여 시도해 보십시오. 도중에 발견한 오류를 신고해 주시면 수정할 수 있습니다. 또한 결과를 공유하고 기능을 사용하여 언어의 모든 다양한 언어적 변형을 얼마나 잘 다룰 수 있는지 공유하세요!


이 데모에는 여러 가지 흥미로운 측면이 있습니다.

첫째, 현재 자연어 관련 기능에 구현된 위키함수의 사용 가능성을 보여줍니다. 위키데이터의 데이터와 직접 연결되며 데이터에서 오류를 찾는 방법과 데이터에서 패턴을 찾는 데 도움이 될 수 있는 탐색을 제공하여 이러한 기능을 더 많이 생성할 수 있습니다. 저는 우크라이나어를 할 줄 모르지만 특정 우크라이나어 형태의 형태를 포착하는 함수를 만들 수 있었습니다. 그런 다음 이러한 기능을 통해 더 많은 불일치를 발견하거나 오류가 발생하지 않는 방식으로 더 빠르게 데이터를 입력할 수 있습니다. 예를 들어, 위키데이터 어휘 형식의 필드에 함수를 첨부하는 방법이 있으면 정말 좋아할 것입니다. 그래서 보조정리만 입력하면 위키함수의 결과에 따라 다른 필드가 자동으로 채워집니다. 그런 다음 필요한 경우 게시하기 전에 결과를 수정하여 수동으로 수정할 수 있습니다.

둘째, 함수, 테스터 및 구현을 작성하는 것이 얼마나 상대적으로 쉬운지 보여줍니다. 이 경우 함수를 정의하고 테스터를 작성하고 구현을 제공하는 데 4분도 채 걸리지 않았습니다. 우리의 UX는 현재 이러한 많은 단계를 더 쉽고 직관적으로 개선하고 있습니다. 모든 함수가 구현하기 쉬운 것은 아닙니다. 하지만 이 경우에는 합성, 교체에 사용할 수 있는 관련 함수가 있었기 때문에 코딩이 전혀 필요하지 않았습니다. 우리의 희망은 그러한 다재다능한 함수의 견고한 라이브러리가 형태학적 함수의 꽤 좋은 범위를 향한 먼 길을 데려갈 수 있다는 것입니다. 그러나 구현이 더 복잡해야 한다고 해도 함수를 정의하고 테스트 케이스를 제공하는 것은 많은 잠재적 기여자들에게 가능할 것으로 예상되는 일입니다.

그리고 세 번째로, 아마도 처음으로 위키함수에서 함수를 호출하는 외부 도구(베타지만)를 보여줍니다. 위키함수 앞에 서서 기능 평가를 요청하는 웹사이트일 뿐입니다. 양식 검사는 위키데이터의 SPARQL 끝점을 호출하고 거기에서 오는 데이터를 사용하여 위키함수에 함수를 평가하도록 요청합니다. 모든 것이 정적 웹사이트이고 라이브러리가 전혀 필요하지 않고 그저 평범한 오래된 자바스크립트이며 어디에서나 호스팅될 수 있습니다.

양식 검사 도구가 훌륭하고 유용한 도구인지 확신할 수 없습니다. 각 개별 사용자별로 수천 개의 양식을 확인해야 합니까? 대신 이 평가를 수행하기 위한 공유 리소스가 필요할 것입니다. 이 도구는 더 강력하고 재사용이 가능하며 커뮤니티 작동 방식과 밀접하게 연결된 다른 도구, 라이브러리 및 워크플로로 이어질 수 있는 초기 영감을 의미합니다.

자원봉사 코너

월요일 자원봉사자 코너에 참여해주신 모든 분들께 감사드립니다. 활기찼다. 참석해주신 모든 분들께 감사드립니다! 다음 날짜는 12월 5일 월요일 18:30 UTC입니다.

위키컨퍼런스 북아메리카 2022

이번 위키함수 주간은 오픈스트리트맵 USA와 공동으로 개최되는 위키컨퍼런스 북아메리카에서 발표될 것입니다. 프레젠테이션은 11월 12일 토요일 20:15 UTC에 있을 예정이며 지도 세계에서 위키함수와 가능한 사용 사례에 초점을 맞출 것입니다.

직원 편집 정책

현재로서는 직원 편집 정책의 뜨거운 단계를 닫고 있습니다. 이 정책은 커뮤니티에 속하며 항상 여러분이 발전시키고 조정할 수 있습니다. 출시 시 위키함수에 복사하고 이 정책을 따를 것입니다.

개발 업데이트

경험 및 성능:

  • 더 많은 FE 버그 수정
  • 오류 관리와 관련된 병합 패치
  • 기본 구성 요소 기술 사양을 작성하는 데 큰 진전이 있었습니다.

메타 데이터:

  • 모든 오류 유형에 대한 읽기 가능한 요약 완료 및 어떤 구현이 선택되었는지 기록하는 기능 (T312611, T320457)

자연어 생성:

  • 완성된 템플릿 언어 문서
  • isiZulu에 대한 종속성에 대한 추가 분석