Writing systems/it
Questa pagine fornisce informaioni di base sul supporto per i vari aspetti dei sistemi di scrittura: idiomi che utilizzano più scritture; direzione di scrittura; renderizzazione dei font e dell'input.
Molteplici scritture, molteplici dialetti
Molti linguaggi sono scritti usando più sistemi di scrittura. Spesso questo è possibile ma il supporto nel software è assente, e a volte è difficoltoso se non impossibile da implementare. Alcuni linguaggi haanno un LanguageConverter che aggiunge il supporto per multipli sistemi di scrittura.
Alcuni linguaggi hanno dialetti molto simili che sono scritti negli stessi sistemi di scrittura e possono—a livello tecnico essere trattati nello stesso modo dei sistemi di scrittura differenti.
LanguageConverter
Per la documentazione su come usare LanguageConverter, vedi Scrivendo sistemi/Sintassi
LanguageConverter (LC) è un sistema basato su varianti di linguaggi che converte automaticamente il contenuto di una pagina in una variante diversa Una variante è principalmente lo stesso linguaggio in un sistema di scrittura diverso. Per usare LanguageConverter, vai alle tue preferenze d'internazionalizzazione. Se sei su una wiki che supporta la conversione, vedrai un'opzione extra per scegliere il sistema di scrittura.
Phab:T21044 -- questo necessita di più documentazione!
È implementato per i seguenti linguaggi (a Luglio 2023; vedi languagesWithVariants per la lista più recente):
- balinese (ban): Balinese (ban-bali), Latin (ban-latn) [1.36+]
- turco crimeo (crh): Latin (crh-latn), Cyrillic (crh-cyrl)
- inglese (en): Normal (en), Pig Latin (en-x-piglatin) (per testing, solo quando $wgUsePigLatinVariant è abilitato)
- gan (gan): Simplified (gan-hans), Traditional (gan-hant)
- inuktitut (iu): Latin (ike-latn), Syllabics (ike-cans) [1.18+]
kazako (kk): Cyrillic (kk-cyrl), Latin (kk-latn), Arabic (kk-arab)Discontinuato nel 2023, vedi i motivi a phab:T268143 e phab:T350684- curdo (ku): Latin (ku-latn), Arabic (ku-arab) [1.11+]
- serbo-croato (sh): Cyrillic (sh-cyrl), Latin (sh-latn) [1.40+]
- tashelhit (shi): Tifinagh (shi-tfng), Latin (shi-latn) [1.19+]
- serbo (sr): Cyrillic (sr-ec), Latin (sr-el)
- tagico (tg): Cyrillic (tg-cyrl), Latin (tg-latn)
- taliscio (tly): Cyrillic (tly-cyrl), Latin (tly-latn) [1.36+]
- uzbeco (uz): Cyrillic (uz-cyrl), Latin (uz-latin) [1.20+]
- wu (wuu): Simplified (wuu-hans), Traditional (wuu-hant) [1.41+]
- tamazight del Marocco standard (zgh): Tamazigh (zgh-tfng), Latin (zgh-latn) [1.42+]
- cinese (zh):
- cinese semplificato (zh-hans): China (zh-cn), Singapore (zh-sg), Malaysia (zh-my)
- cinese tradizionale (zh-hant): Taiwan (zh-tw), Hong Kong (zh-hk),[1] Macau (zh-mo)
Ed è necessario per molte altre lingue!
Le etichette per i codici dei linguaggi dovrebbero seguire lo standard ISO 15924.
Ciò nonostante, per ragioni storiche, serbo è un'eccezione, con sr-ec
invece di sr-cyrl
e sr-el
invece di sr-latn
.
Questo è in discussione in phab:T117845.
Una limitazione attuale di questo sistema è che potrebbe essere particolarmente inadeguato nel gestire più sistemi di scrittura basati sullo stesso alfabeto.
I wikipediani cinesi occasionalmente usano =>
(unidirezionale) nei casi fallimentari.
Poiché LC prova sempre a mangiare i pezzi più grandi di parole usando strtr
in PHP, -{}-
(suddividendo le parole) può spesso anche essere utile.
Configurazione di supporto
Le funzioni wgULS/wgUVS in libreria del sito di zhwp (ora deprecata, vedi zh:Wikipedia:HanAssist per la versione corrente) permette una selezione semplice delle varianti nelle UI userscript.
Questo può aiutare gli autori di script a produrre un'interfaccia che riconosca le varianti per gli utenti
Per altri luoghi inaccessibili da LC, {{int:Conversionname}}
può essere usato per prendere il linguaggio o la variante attuale dell'UI.
Il gadget PreviewWithVariant permette ai Wikipediani di controllare i risultati della conversione nell'anteprima dell'editor. Puoi configurarlo per la tua wiki.
"Foreign language marker" templates like {{lang}} should add "disable conversion" markers -{ text }-
around the quoted foreign text to avoid mis-conversion.
On Hans/Hant wikipedias this becomes a concern for Japanese Kanji and Vietnamese Han Nom, while on Wikipedias with Latin text marked for conversion this concern should be immediate.
Il modulo WikitextLC permette di inserire facilmente comandi LC all'output Lua. Il sistema NoteTA e CGroup permette di accedere a degli insiemi predefiniti di conversioni specifiche per materia. Module:地区用词 allows for an adaptive output of the form "foo, known in PLACE and PLACE as bar, and PLACE as baz".
Il reindirizzamento automatico dei titoli negli URL potrebbe causare un'apparente inconvenienza per le interfacce senza questa funzionalità. Vedi T49725 per la task Lua e T160952 per la task sezione-ancora.
Reindirizzamento URL
In alcune installazioni di MediaWiki, un URL corto è utilizzato.
For example, in Chinese Wikipedia, instead of https://zh.wikipedia.org/wiki/维基百科
(if no variant is specified) or https://zh.wikipedia.org/w/index.php?title=维基百科&variant=zh-cn
(if the variant is specified without rewrite rules), a shortened URL such as https://zh.wikipedia.org/zh-cn/维基百科
can be used as a temporary link to the specified script variant (zh-cn
in this case).
This behaviour can be seen several language Wikipedia such as Chinese Wikipedia, Serbian Wikipedia, etc.
However, others like Gan Chinese Wikipedia and Balinese Wikipedia often keeps the long url with index.php&variant=
.
Questo è controllato da $wgVariantArticlePath e le regole di rewrite del web server (vedi i manuali per gli URL corti in Apache e nginx ).
Vedi anche
- m:Conversione automatica tra cinese semplificato e tradizionale
- m:Wikipedie in multipli sistemi di scrittura
- Specifiche/HTML#Blocchi di conversione dei linguaggi
- Parsoid/Conversione del linguaggio
Direzionalità
La maggior parte dei sistemi di scrittura opera come caratteri scritti da sinistra a destra (LTR), con le righe disposte dall'alto verso il basso (TtB).
A few common scripts (Arabic and Hebrew in particular) write characters right-to-left (RTL) -- see directionality support for more details on how we handle right-to-left and mixed bidirectional text with HTML output and CSS styles.
Note that an individual language can be used with scripts that have different directionalities, such as Kazakh and Kurdish which support Latin and Arabic variants.
Note also that the World Wide Web Consortium has defined more directionalities for the use in web pages, such as North East Asian top-to-bottom ones, with lines stacked either from left to right or right to left.[2]
Rendering dei font e dell'inserimento
Molti sistemi di scrittura non dispongono di font adeguati facilmente disponibili per gli utenti. Questo può dipendere dal fatto che i sistemi operativi non includono questi font, oppure gli utenti non sanno come installarli o non hanno i permessi necessari per farlo. L'estensione UniversalLanguageSelector/it cerca di risolvere questo incorporando i font nella wiki stessa. I font verranno serviti dal server e il sistema dell'utente non necessiterebbe di avere i font installati.
UniversalLanguageSelector aggiunge il supporto per essere in grado di scrivere un certo sistema di scrittura, in modo che gli utenti non debbano dipendere da strumenti esterni o dal supporto dei loro sistemi.
Note
- ↑ Taiwan e Hong Kong sono due varianti maggiori scritti nello stesso sistema di scrittura tradizionale con differenze signicative nell'uso delle frasi a causa della separazione del mercato e l'influenza da linguaggi
zho
locali, quindi dovresti tenere almeno CN, TW e HK nella tua lista di varianti. Se insisti nel ridurre la portata delle varianti cinesi a una separazione Simp/Trad basata su sistemi di scrittura, segui quello che ha fatto il reporter in phab:T149278. - ↑ CSS Writing Modes Level 3