Help:Special characters/ru
Системы кодирования символов
editНачиная с MediaWiki 1.5, все проекты используют Unicode (UTF-8) character encoding.
До конца июня 2005, когда эта новая версия становится рабочей в проектах Wikimedia, Wikipedia на языках English, Dutch, Danish и Swedish использовали ISO-8859-1 (также называемую Latin-1). Существующий викитекст в их базах данных продолжает храниться в IS0-8859-1 и конвертируется при загрузке. Новые редакции будут храниться в базе данных как UTF-8. Эта конвертация в процессе загрузки — невидима для пользователей.
- Unicode (UTF-8)
- переменное количество байт на символ
- специальные символы, включая символы CJK, могут рассматриваться как обычные; не только страница, но и поле ввода показывает эти символы; кроме того, возможно использование много-символьных кодов; они не конвертируются автоматически в поле ввода.
- ISO 8859-1
- один байт на символ
- специальные символы, которые недоступны в ограниченом множестве символов, сохраняются в форме мульти-символьного кода; обычно существует два или три эквивалентных представления, напр., для символа € именованная ссылка на символ € и десятичная ссылка на символ € и щестнадцатиричная ссылка на символ €. Поле ввода показывает введенный код, веб-страница — результирующий символ. Недоступные символы, которые были скопированы в поле ввода, сперва изображаются в виде символа, и автоматически конвертируются к их десятичным кодам при исполнении команд Предварительный просмотр либо Записать страницу.
- часто используемые спецсимволы, такие как é, находятся во множестве символов, так что такие коды как é, хотя и допустимы, но не нужны.
Note that Special:Export exports using UTF-8 even if the database is encoded in ISO 8859-1, at least that was the case for the English Wikipedia, already when it used version 1.4.
Чтобы определить, какое множество символов применяется в проекте, используйте возможность браузера "Просмотр HTML-кода" и поищите что-то вроде:
<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />
или
<meta http-equiv="Content-type" content="text/html; charset=utf-8" />
Эсперанто
editИнсталляции Mediawiki, настроенные для Эсперанто, используют UTF-8 для хранения и отображения. Однако, при редактировании текст конвертируется в форму, которая разработана для упрощения редактирования с использованием стандартной клавиатуры.
Символы, для которых это применяется, это: Ĉ, Ĝ, Ĥ, Ĵ, Ŝ, Ŭ, ĉ, ĝ, ĥ, ĵ, ŝ, ŭ. Вы можете вводить их прямо в поле редактирования, если вам это удобно. Однако, когда вы будете редактировать страницу снова, вы увидите что они закодированы как Sx. Такая форма упоминается как "x-sistemo" или "x-kodo". Для того, чтобы сохранить совместимость при преобразованиях «туда и обратно», когда один или более иксов следуют за этими символами или их не-акцентированными формами (A, G, H, J, S, U, c, g, h, j, s, u), количество иксов в поле редактирования вдвое больше их числа в реально сохраняемом тексте статьи.
в поле редактирования | в базе данных и при отображении |
S | S |
Sx | Ŝ |
Sxx | Sx |
Sxxx | Ŝx |
Sxxxx | Sxx |
Sxxxxx | Ŝxx |
Например, межязыковая ссылка [[en:Luxury car]] в en:Luxury car на eo: должна быть введена в поле редактирования как [[en:Luxxury car]]. В прошлом это вызывало проблемы с ботами, обновляющими интервики.
Ways to enter special characters
editПЕРЕВОД НЕ ЗАКОНЧЕН
ISO-8859-1 Characters
editПЕРЕВОД НЕ ЗАКОНЧЕН
Unsafe characters
editПЕРЕВОД НЕ ЗАКОНЧЕН
Possibly usable non-ISO characters
editПЕРЕВОД НЕ ЗАКОНЧЕН
Typeset-style Punctuation
editПЕРЕВОД НЕ ЗАКОНЧЕН
Греческие буквы и математические символы
editСравните ∇ и <math>\nabla</math>, дающие ∇ and соответственно. В зависимости от настроек, второе может выглядеть так же как и первое (отображение в виде HTML), или как рисунок. HTML-символ зависит от размера и начертания шрифта, рисунок имеет фиксированный размер (в пикселах). Цвет и фон символа в первом случае тот же что и у текста в целом, в соответствии с установками, а для рисунка он всегда черный на белом.
- Примечание: большая часть текста, приведенного ниже относительно математических символов — устарела, поскольку теперь MediaWiki поддерживает на страницах внедренный TeX. Нетривиальные математические выражения вероятнее всего выглядят в TeX'е с использованием тэгов math. Подробнее об этом см. на странице MediaWiki User's Guide: Editing mathematical formulae.
Веб-стандарты на математическую запись довольно свежи (Действительно, MathML 2.0 был выпущен только в 2001 году.), поэтому многие браузеры, созданные до этих стандартов, были вынуждены компенсировать это, по крайней мере, допуская символы, часто используемые в математике, включая большую часть греческого алфавита. These are necessarily entered as character entity references. Браузеры могли изображать их, переключаясь на шрифт "Symbol" или каким-то подобным способом.
ПЕРЕВОД НЕ ЗАКОНЧЕН
α | α | Γ | Γ |
β | β | Λ | Λ |
γ | γ | Σ | Σ |
π | π | Π | Π |
σ | σ | Ω | Ω |
ς | ς (final sigma, только в нижнем регистре) |
Другие часто используемые математические символы:
≠ | ≠ | ′ | ′ |
≤ | ≤ | ″ | ″ |
≥ | ≥ | ∂ | ∂ |
≡ | ≡ | ∫ | ∫ |
≈ | ≈ | ∑ | ∑ |
∞ | ∞ | ∏ | ∏ |
√ | √ |
ПЕРЕВОД НЕ ЗАКОНЧЕН
Other common symbols
editПЕРЕВОД НЕ ЗАКОНЧЕН
Unicode
editПЕРЕВОД НЕ ЗАКОНЧЕН
Advanced Entities
editПЕРЕВОД НЕ ЗАКОНЧЕН
Египетские иероглифы
editНапр. <hiero>P2</hiero> даёт
|
Это не зависит от возможностей браузера, поскольку использует изображения с сервера.
- Продолжите здесь перевод статьи Help:Special characters или примите участие в переводе справки на сайте MediaWiki.org.
Внешние ссылки
edit- http://www.unicode.org/charts/ Unicode character charts; hexadecimal numbers only; PDF files showing all characters independent of browser capabilities
- Table of Unicode characters from 1 to 65535 - shows how the decimal character references look in one's browser
- HTML 4.0 Character Entity References - shows how the named and decimal character references look in one's browser
- FileFormat.Info - details of many Unicode characters, including the named, decimal and hexadecimal character reference, showing how it should look and for each, how it looks in one's browser
- Alan Wood's Unicode Resources - comprehensive resource with character test pages for all Unicode ranges, as well as OS-specific Unicode support information and links to fonts and utilities.