Language Onboarding and Development/cs

Taxonomie mezer ve znalostech Knowledge mezery výzkumného týmu kategorizuje mezery v obsahu na reprezentaci a interakci. Mezery v zastoupení jsou rozděleny do kategorií geografie, jazyka, socioekonomického statusu, důležitých témat atd. Celý článek, strana 22 a dále. Strana 23 zdůrazňuje jazykovou propast a definuje ji jako rozdíl v pokrytí obsahu v různých jazycích. Doporučení strategie hnutí "2. zlepšit uživatelskou zkušenost" dále doporučuje "Vyjasnit cesty pro prosazování nových návrhů wiki (včetně nových jazykových verzí) a pro opětovné použití softwarových funkcí vyvinutých komunitou."

Wiki o stavu jazyka

V lednu 2025 existovalo 342 jazyků, které měly alespoň jeden obsahový projekt hostovaný na Wikimedii (zdroji), ve srovnání s více než 7000 jazyky používanými dnes podle ethnologie. ( Poznámka: Mnoho z těchto jazyků nemusí být psané jazyky nebo jazyková komunita nemusí chtít, aby měly obsahový projekt Wikimedie.) V inkubátoru se v současné době pracuje na stovkách těchto jazyků s cílem jejich úspěšného dokončení. Vize WMF nás vyzývá k představě světa, ve kterém se lidé mohou "svobodně podílet na souhrnu veškerého poznání". Vzhledem k tomu, že uvažujeme o jazyku jako vědění a jako prostředku sdílení znalostí, je pochopení mezer, které máme v oblasti pokrytí a reprezentace jazyka, zásadní.

As of February 2025, according to the List of Wikipedia, there are 100+ languages hosted on the Wikimedia platform with 20 or fewer active editors, even though some of them are languages spoken by many millions of people. Důvody, proč mají tyto jazyky nízké zastoupení na Wikimedii a obecně nízké zastoupení v online i offline psaných publikacích, jsou systémové, složité a rozmanité. Existují určité věci, které můžeme udělat pro to, aby byl vývoj obsahu Wikimedie v těchto jazycích přístupnější. Některé z nich se zaměřují na produktový vývoj a infrastrukturu a některé spíše na podporu mezilidské komunity.

Nové jazykové verze procházejí několika fázemi, než se stanou wikinami (odkaz). V každé z těchto fází čelí různým výzvám, a to jak sociálním, tak technickým. Existující výzkum a materiály odhalují technické výzvy v každé fázi zavádění jazyků: přidávání nových jazyků do inkubátoru, složitost vývoje a kontroly obsahu a pomalý proces vytváření stránek wiki po absolvování jazyka z inkubátoru. Jakmile je wiki plně vytvořena, začíná skutečný život komunity: psaní článků, vzájemná komunikace, zvení dalších autorů, rozšiřování obsahu atd.

Areas of Work

  • Strategic interventions aimed at contributing to the Foundation's Product and Tech pillars to achieve the strategic goals for the department and help languages through tooling and support approaches to develop their languages, primarily through content growth.
  • Technical interventions and engagements aimed at addressing existing gaps in technical workflows or features related to language wikis. This might include handling requests appropriately, ensuring important bugs are fixed, etc., among other areas. See here. These include adding new languages (specifically to Language data, Translatewiki, Mediawiki core when specifically asked by language speakers), occasional removal of languages, support for new languages including keyboard support, namespaces configuration, etc.

Disclaimer: The process of onboarding languages entails different stages as shown in the diagram above. There are areas that are outside the scope of this initiative, including evaluating the feasibility of new languages (owned by the Language committee), Wiki creation, Incubator maintenance, etc.

Resources