Open main menu

Connectivity Project/site interface/ru

category14Edit

pagetitle="Связность дерева категорий" thish1="связность дерева категорий" actualnote1="Обновление информации о структуре дерева категорий производится на околоежедневной основе.
" actualnote2="

" rootcatnote1="Приведённый список, по хорошему, должен содержать единственную категорию с именем Всё.
" rootcatnote2="Остальные записи рассматриваются как некатегоризованные категории.
" clsizenote1="Приведённый список состоит из категорий, образующих кластер размера " clsizenote2="Кластеров размером более 1 в дереве категорий быть не должно.
" cattreedesc1="Каждая строка в таблице представляет слой в развёртке дерева категорий." cattreedesc2="Слои отражают категоризацию категорий и, в идеале, не должны содержать циклов." cattreedesc3="Все слои, имя которых заканчивается числом большим 1 соответствуют циклу соответствующего размера." cattreedesc4="Важно также следить, чтобы в корневом слое с именем <a href=\"./category14.sh?language=$language&interface=ru&networkpath=_1\">_1</a> содержалась только одна корневая категория.
" struchead="Структура дерева категорий" queryname1="пустые категории-перенаправления" query1note1="Пространство имён категорий не предназначено для перенаправлений.
" query1note2="Категоризация через перенаправления не приводит к попаданию в нужную категорию.
" queryname2="категории-перенаправления с излишними ссылками или непустые" query2note1="Данный список содержит, возможно, несколько более сложный в разрешении вид перенаправлений.
" query2note2="Здесь собраны перенаправления в пространстве категорий, в которые включены статьи, будто это не перенаправления, а полноценные категории, а также здесь могут встречаться перенаправления, в которых в скрытом тексте имеются излишние ссылки.
" query2note3="Перенаправления в главное пространство имён, в которые включены статьи, возможно, следует переделать в полноценные категории.
" query2note4="Прочие перенаправления в пространство категории сначала должны быть избавлены от включённых в них статей, а затем удалены.
"

categoryEdit

pagetitle="Изолированные статьи по категориям" thish1="изолированные статьи по категориям" howoften="Данные обновляются вручную околоежедневно." example="Пример: Писатели России" catnamereq="Введите имя категории" catnamedo="и нажмите Enter" top1name="категории по содержанию изолированных статей" top2name="категории по доле изолированных статей" submenudesc="здесь приведён список изолированных статей для категории" seealso="см. также" submenusf="только" submenudsmbg="со ссылками из изолированных статей, на которые есть ссылки" submenulnk="с подсказкой по установке ссылок" submenutrns="с подсказкой по переводу для установки ссылок" suggest="подсказка"

commonEdit

mainh1="Википедия:Проект:Связность" motivation="задача" isolatedarticles="изолированные статьи" bycategory="по категориям" catns="Категория" allsuggestions="подсказки" fortext="для" resolvedisambigs="толкование ссылок" justlink="интервики-шпион" parttranslate="перенять ссылки" translatenlink="к переводу" wholelist="списки" byclastertype="по типам кластеров" orphanes="статьи-сироты" bycreator="по создателям" graphdata="графики" usrns="Участник" deadend="тупиковые статьи" disambig="толкование ссылок" cattreecon="связность дерева категорий" contactme="для связи" mywikipage="моя вики-страница" botwikipage="вики-страница бота" commondisc="наше общее обсуждение" attext="на" srclocation="Исходные коды на" nohost="не доступен, вероятно, проблемы на $dbhost" nodata="данные для заданного языкового раздела не подготовлены" noudb="пользовательская база не существует, вероятно, проблемы на $dbhost" hostisnotallowed="сервер hemlock лишён права доступа к sql серверу на $dbhost" dbjustcreated="запрашиваемая таблица не существует, возможно, пользовательская база только что создана, и значит сервис скоро заработает" next="следующие" previous="предыдущие" listend="конец списка" reptext="По данным на" runtext="Скрипт запущен" acttext="Эта страница обновлена" agotext="тому назад" daystext="сут" hourstext="час" mintext="мин" sectext="сек"

creatorsEdit

pagetitle="Создатели изолированных статей" thish1="создатели изолированных статей" example="Пример: Maximaximax" unamereq="Введите имя участника" unamedo="и нажмите Enter" list1expl="это список изолированных статей, созданых участником" list2name="участники по числу созданных изолированных статей" whatisit="Здесь собран список участников Википедии, отсортированный по убыванию числа созданных изолированных статей." suggest="подсказка"

disambigEdit

pagetitle="Страницы значений со ссылками из статей" thish1="страницы значений со ссылками из статей" whatisit="Здесь собран список <a href="http://ru.wikipedia.org/w/index.php?title=%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%A1%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D1%8B_%D0%B7%D0%BD%D0%B0%D1%87%D0%B5%D0%BD%D0%B8%D0%B9">страниц значений</a>, упорядоченный по числу <a href="http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%A1%D1%82%D0%B0%D1%82%D1%8C%D1%8F">статей</a>, ссылающихся на них. Ссылки, имеющие обратную пару (вроде ссылок из шаблона {{<a href="http://ru.wikipedia.org/wiki/%D0%A8%D0%B0%D0%B1%D0%BB%D0%BE%D0%BD:%D0%94%D1%80%D1%83%D0%B3%D0%B8%D0%B5_%D0%B7%D0%BD%D0%B0%D1%87%D0%B5%D0%BD%D0%B8%D1%8F">другие значения</a>}}), не принимаются во внимание.

Служебный список страниц основного пространства имён, ссылающихся на страницы значений, можно найти <a href="http://ru.wikipedia.org/wiki/%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:Disambiguations">здесь</a>." _of_X_does_="ссылок вместо статей ссылается на" _of_X="страниц значений" drdi_text="<a href="http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%98%D0%BD%D0%B4%D0%B5%D0%BA%D1%81_%D0%BF%D1%80%D0%B5%D0%BD%D0%B5%D0%B1%D1%80%D0%B5%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F_%D0%BF%D1%80%D0%B0%D0%B2%D0%B8%D0%BB%D0%BE%D0%BC_%D1%82%D0%BE%D0%BB%D0%BA%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F">Индекс пренебрежения правилом толкования</a>"

znsEdit

pagetitle='Википедия:Проект:Связность' scope='структура основного пространства имён' par1='<a href="http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%A1%D1%82%D0%B0%D1%82%D1%8C%D1%8F">Статьёй</a> назовём поименованный связный текст в основном пространстве имён, содержание которого отражает одно значение термина, употреблённого в качестве заголовка данного текста.' par2='<a href="http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%A1%D0%A0%D0%9D">Страницы значений</a> описывают несколько различных значений термина, а <a href="http://ru.wikipedia.org/wiki/%D0%9A%D0%B0%D1%82%D0%B5%D0%B3%D0%BE%D1%80%D0%B8%D1%8F:%D0%A1%D0%BF%D0%B8%D1%81%D0%BA%D0%B8_%D1%81%D1%82%D0%B0%D1%82%D0%B5%D0%B9_%D0%B4%D0%BB%D1%8F_%D0%BA%D0%BE%D0%BE%D1%80%D0%B4%D0%B8%D0%BD%D0%B0%D1%86%D0%B8%D0%B8_%D1%80%D0%B0%D0%B1%D0%BE%D1%82">списки статей для координации работ</a> и <a href="http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%9F%D0%B5%D1%80%D0%B5%D0%BD%D0%B0%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F">страницы перенаправления</a> совсем не содержат связного текста. Ни те, ни другие не попадают под определение статьи.' par3='Ссылки из хронологических статей признаются недостаточными с точки зрения доступности по ссылкам и не учитываются при поиске <a href="http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%A1%D0%A1%D0%A1">статей-сирот</a> и прочих <a href="http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%98%D0%B7%D0%BE%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5_%D1%81%D1%82%D0%B0%D1%82%D1%8C%D0%B8">изолированных статей</a>.' par4='<a href="http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%A2%D1%83%D0%BF%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5_%D1%81%D1%82%D0%B0%D1%82%D1%8C%D0%B8">Тупиковой статьёй</a> будем называть статью, не содержащую ссылок на другие существующие нехронологические статьи. Это шире, чем просто "содержит ссылку", идущую неведомо куда.' zns_contains_="Основное пространство имён содержит" _articles1="статью" _articles1_do="статья" _articles234="статьи" _articles5678901234="статей" _pages1="страница" _pages234="страницы" _pages5678901234="страниц" _lists1="список" _lists234="списка" _lists5678901234="списков" _of_them_crono="из них являются хронологическими статьями" _disambigs="значений" _and_="и" _cllt="для координации работ" avg_chrono_links_="Средняя хронологическая статья ссылается на" other_links_="Остальные статьи ссылаются в среднем только на" _of_links_are_to_chrono="ссылок в статьях ведёт на хронологические статьи" avg_chrono_is_linked_by_="В среднем на хронологическую статью ссылается"

zns1Edit

текущее состояние проекта

В настоящий момент решены следующие задачи:

  • Список тупиковых статей в соответствии с данным выше определением
  • Список статей-сирот в соответствии с данным выше определением
  • Все найденные типы изолированных кластеров размером не больше заданного и цепочки из таких кластеров

Кое-что из найденного по ходу дела:

  • Список перенаправлений на перенаправления, который почему-то более полон, чем список, собираемый MediaWiki
  • Список ошибочных перенаправлений (содержащие после "магического слова" незакомментированный текст, содержащий ссылки)
  • Статистика видов изолированных кластеров по типам цепочек
  • Данные для выборки изолированных статей по авторам и категориям
  • Советы по усыновлению изолированных статей путём разрешения ссылок на страницы значений, а также советы, основанные на подглядывании за интервики.

что не так

Отлично работает для 300 000 статей, но для :en слишком прожорлив в смысле потребления ресурсов.

Для установки и снятия шаблонов в настоящий момент используется AWB. Эта проблема решится, когда моя тупая бошка превозможет задачу управления шаблонами на perl, или, возможно, если более светлые головы сделают это за меня.

сподвигайлово

Движок MediaWiki среди прочего собирает два списка: страницы-сироты и тупиковые страницы. Посмотрим, насколько они хороши.

Важно прежде всего понимать, в чём заключается разница между страницами и статьями. Страница — это всё, в главном пространстве имён, что не является перенаправлением, включая страницы значений. Под статьями обычно мы понимаем меньшее — страницы за исключением всех страниц значений.

MediaWiki считает, что страница доступна по ссылкам, если на неё есть ссылка хотя бы ещё из одной страницы. Даже если это ссылка из другого пространства имён (например, если обсуждался текст или вопрос об удалении данной страницы) или со страницы значений (на которые не должно быть ссылок, а значит страницы значений не помогают повышению доступности по ссылкам).

Движок MediaWiki также не распознаёт ссылки из списков, предназначенных для координации работ и хронологических статей. Редко такие ссылки могут быть причиной перехода по ним. Впрочем можно выработать любые правила по мере повышения требований к качеству связей.

Размышляя о связности, мы можем интересоваться не только страницами-сиротами. Возможны группы, состоящии из двух, трёх и более статей, доступные по ссылкам друг из друга, но не доступные не из статей, не входящих в группу. Такие статьи называют изолированными статьями, а группы изолированными кластерами (сильно связными компонентами графа). Кластеры могут быть доступны по ссылкам друг из друга, и также могут существовать целые цепочки изолированных кластеров, не доступные по ссылкам из статей вне этой цепи. Движок MediaWiki не распознаёт никаких изолированных кластеров кроме страниц-сирот.

Похожая ситуация складывается с поиском тупиковых страниц. Движок проверяет лишь, содержит ли статья ссылку. Куда ведёт эта ссылка MediaWiki не распознаёт, хотя это может быть как ссылка на другую статью, так и ссылка из служебного шаблона, повествующего о проблемах на странице. Ссылки на страницы значений также считаются.

Анализ связности статей даёт авторам возможность сделать их статьи лучше, привлекая к ним внимание других, будь то читатели, или авторы других статей.

Ещё одна причина к анализу связности - попытка решить эту задачу необычным образом, не прибегая к реализации алгоритмов на традиционных для этого языках программирования, работающих по экспортируемым данным. Для повышения актуальности получаемого анализа необходимо избегать пересылки слишком больших порций данных и запускать приложение ближе к актуальной базе данных Википедии. Таким образом, пишем на SQL. Пока ещё никто не делал этого на SQL. Here we go.

listsEdit

pagetitle="Списки изолированных статей" thish1="доступные списки изолированных статей" description="Некоторые данные по изолированным статьям доступны в виде списков. В том числе:" fl_disambig="Полный список изолированных статей с советами по толкованию ссылок" fl_interlink="Полный список изолированных статей с советами по переёму ссылок" fl_translate="Полный список изолированных статей с советами по установке ссылок через перевод"

suggestEdit

pagetitle="Подсказка ссылок на изолированные статьи" thish1="подсказка ссылок на изолированные статьи" ianamereq="Введите имя изолированной статьи" ianamedo="и нажмите Enter" clause1="Подсказки затруднительно показать все разом, да ещё и по категориям. Используйте для отдельных статей (форма выше) или по типам подсказок (меню слева)." clause2="Что если подсказок нет?" clause3="Скорее всего у статьи нет или слишком мало интервики ссылок. Добавьте интервики, и после околоежедневного обновления данных подсказок может стать больше." clause4="Возможно, статья не является изолированной, не существовала или не была изолированной на момент последнего сбора данных." sggclause0="связывание путём толкования ссылок на страницы значений" sggclause1="Статьи из приведённого списка содержат ссылки на страницы значений, ссылающихся, в свою очередь, на эту изолированную статью:" sggclause2="Помните, что хронологические статьи и списки для координации работ не формируют валидных ссылок." sggclause3="Они приведены здесь исключительно с целью разрешения ссылок на страницы значений." sggclause4="связывание путём подглядывания за другими языками через интервики" sggclause5="Статьи других разделов, связанные с этой статьёй интервики-ссылками, могут в своих языковых разделах не быть изолированными, и статьи, которые на них ссылаются, также, судя по интервики, присутствуют в русскоязычном разделе:" sggclause6="связывание путём перевода статей" sggclause7="Статьи, связанные с данной интервики-ссылками, могут не быть изолированными в своих языковых разделах, эти ссылающиеся страницы могут быть переведены для повышения связности:" googleonwikipedia="поиск по Википедии с помощью Google" submenu1desc="здесь приведён список изолированных статей с подсказками по толкованию ссылок для категории" submenu2desc="здесь приведён список изолированных статей с подсказками по переёму ссылок для категории" submenu3desc="здесь приведён список изолированных статей с подсказками по переводу для категории" subclause1="На изолированные статьи из этого списка ссылаются страницы значений, на которые есть ссылки из других статей.
Список даёт возможность как устанавливать ссылки на изолированные статьи, так и улучшать точность ссылок на прочие статьи путём толкования ссылок на страницы значений." subclause2="Это список категорий, упорядоченный по числу изолированных статей, для которых имеются подсказки по толкованию ссылок." subclause3="Изолированные статьи в этом списке связаны интервики-ссылками с неизолированными статьями, на которые ссылаются статьи обратными интервики-ссылками в русскоязычный раздел." subclause4="Это список категорий, упорядоченный по числу изолированных статей, для которых имеются подсказки интервики-шпиона по переёму ссылок." subclause5="Изолированные статьи в этом списке связаны интервики-ссылками с неизолированными статьями, на которые ссылаются статьи, предлагаемые к переводу." subclause6="Это список категорий, упорядоченный по числу изолированных статей, для которых имеются подсказки интервики-шпиона по переводу статей." r_notrecognized="Данная статья не распознаётся как изолированная статья. В связи с ограничениями на производительность, подсказка доступна только для <a href="http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%98%D0%B7%D0%BE%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5_%D1%81%D1%82%D0%B0%D1%82%D1%8C%D0%B8">изолированных статей</a>."

r_orphaned="Данная статья распознана как статья-сирота.

«<a href=\"http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%98%D0%B7%D0%BE%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5_%D1%81%D1%82%D0%B0%D1%82%D1%8C%D0%B8\">Статьи-сироты</a> — это <a href=\"http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%A1%D1%82%D0%B0%D1%82%D1%8C%D1%8F\">статьи</a>, на которые нельзя перейти по гиперссылке при прочтении других статей (при этом не учитываются ссылки из хронологических статей); деятельность по установке ссылок на страницы-сироты из других тематически близких статей всячески приветствуется.

Особо заметим: Ссылки через перенаправления и даже множественные перенаправления — учитываются.
»

" r_isolated="Данная статья распознана как изолированная статья, на которую ссылаются другие изолированные статьи.

«<a href=\"http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%98%D0%B7%D0%BE%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5_%D1%81%D1%82%D0%B0%D1%82%D1%8C%D0%B8\">Изолированные статьи</a> — <a href=\"http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%A1%D1%82%D0%B0%D1%82%D1%8C%D1%8F\">статьи</a>, на которые нельзя перейти по ссылкам из подавляющего большинства других статей.

Изолированные статьи могут группироваться в <a href=\"http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%98%D0%B7%D0%BE%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5_%D0%BA%D0%BB%D0%B0%D1%81%D1%82%D0%B5%D1%80%D1%8B\">изолированные кластеры</a>. Внутри изолированных кластеров возможен переход из любой статьи в кластере на любую другую.

Связанные невзаимными ссылками кластеры могут группироваться в <a href=\"http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%A6%D0%B5%D0%BF%D0%BE%D1%87%D0%BA%D0%B8_%D0%B8%D0%B7%D0%BE%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_%D0%BA%D0%BB%D0%B0%D1%81%D1%82%D0%B5%D1%80%D0%BE%D0%B2\">цепочки изолированных кластеров</a>

При учёте анализе изолированных статей не учитываются ссылки из хронологических статей и списков для координации работ.
»

"