ハッシュタグ
Hashtags(ハッシュタグ)は、ウィキメディアの編集要約の全件について、ハッシュタグの利用を監視します。ウィキメディアの全プロジェクトが対象 (ただし下記の詳細のようにウィキデータを除外)、利用者が検索に使えます。初期の導入は2016年でしたが、2018年に大幅に書き替えました。
- プロジェクト担当者:Samwalton9 (WMF)
- ソースコードの保存先:Github
- Phabricator の案件名: Hashtags
使用法
このツールのホスト先は Cloud VPS インスタンスで、所在は https://hashtags.wmflabs.org/ です。画面右に置いた 'Trending Tags' というリンクは流行のタグをまとめ、過去30日間に最も利用されたハッシュタグを拾ってあります。
To search for a specific hashtag, simply enter it in the Hashtag field and click Submit. Results can be further limited by Project (e.g. `fr.wikisource.org`) and within a date range with one or both of a start and end date. To search for multiple hashtags within the same search, simply separate them with commas, e.g. 1lib1ref, 1bib1ref
. Edits with multiple searched hashtags in the same edit summary are only returned once.
URLs take the form https://hashtags.wmflabs.org/?query=<hashtag>&project=<project>&startdate=<YYYY-MM-DD>&enddate=<YYYY-MM-DD>.
Any parameter except query can be omitted.
To get into more details for a particular search, click on the Show statistics
button. Currently, three graphs will be displayed – Top projects, Top users and Edits over time. The Top projects and Top users graphs show the top 10 Wikimedia projects and top 10 users respectively, both sorted by decreasing number of edits. To view the full list of projects and users click on View full stats
button. The Edits over time graph shows edits over days if the range of search results is less than 90 days, edits over months if the range is more than 90 days but less than 3 years, and edits per year in other cases. You can also download each of these statistics as a CSV file by clicking the Download CSV
button.
ツールのホスト先は2018年以前は https://tools.wmflabs.org/hashtags でした。リソースの高度な利用と膨大なデータベースであることから、ツールを大幅改定して専用の Cloud VPS インスタンスに移設しました。旧来のツールで使った URL 類の大半は新規のものにリダイレクトが済み、検索クエリもその対象です。
ハッシュタグ
ハッシュタグツールはウィキデータのみを除外して、ウィキメディアの全プロジェクトでハッシュタグの使用を監視し、最近の更新 recentchanges EventStream を利用します。ハッシュタグは正規表現 regex (?:^|\s)[##]{1}(\w+)
を使って照合し、数字限定のハッシュタグ以外を見つけてきます。
Wikidata is currently excluded from data collection due to the large volume of data it would generate. As an example, nearly 7 million monthly edits are tagged with #quickstatements there. See T207029 for details.
Bot edits are also excluded from data collection due to high edit rates. Individual bot edits can easily be tracked by looking at the contribution history of those individual bot accounts.
From 2016 to 2018 data was collected from various language Wikipedia projects, as each was requested by editors. Therefore data earlier than August 2018 does not include other Wikimedia projects or many Wikipedia languages. There is a gap in the data from August 8th to early September 2018 as a result of the time between the old tool being taken down and the new one starting up.
技術上の問題が影響し、2021年には9月30日から同11月13日までデータが飛んでいます。
貢献する
ハッシュタグツールの開発に貢献する人を歓迎します。ソースコードの公開は Github で、未完成のタスク一覧は Phabricator にあります。ツールは Docker コンテナ経由で Django で走らせます。ローカルの設定の手順は、Github の README を参照してください。
関連項目
- User:Shizhao/hashtagslink.js, はユーザースクリプトで、編集要約欄に記入したハッシュタグからこのツールにリンクを張ります