Publishing from MediaWiki/cs
MediaWiki je skvělý nástroj pro společné psaní dokumentů, ale nemusí vám nutně poskytnout hotový dokument ve vhodném formátu pro použití mimo kontext wiki. Tato stránka zkoumá nejlepší způsoby, jak extrahovat obsah MediaWiki způsobem vhodným pro publikování pomocí jiných médií.
V dnešní době se nedigitální formáty běžně vytvářejí z digitálních zdrojových materiálů, takže tato otázka se z velké části scvrkává na to, 'do jakých formátů mohu extrahovat svá data'.
Typy obsahu, které byste mohli chtít extrahovat
Obecně existují čtyři typy dat, která můžete chtít publikovat z MediaWiki:
- Jednotlivé stránky
- Soubory stránek
- Jednotlivé mediální soubory (např. obrázky)
- Soubory mediálních souborů
V případě posledních dvou se tyto soubory obvykle nevytvářejí společně na wiki, ale wiki mohla být použita ke shromažďování souborů z různých zdrojů. Manipulace s tímto souborem mimo MediaWiki vám však pravděpodobně přinese nejlepší výsledky, ať už na jakémkoli jiném médiu plánujete publikovat. V případech, kdy je vyžadován jednotlivý obrázek/soubor, jednoduše přejděte na stránku s popisem souboru a stáhněte si originál odtud. V případech, kdy chcete stáhnout více souborů, postupujte podle pokynů na export všech souborů wiki , ale seznam souborů filtrujte tak, aby obsahoval pouze požadované soubory.
Zbytek této stránky se proto zaměřuje na první dvě položky: jednotlivé stránky a kolekce stránek.
Vestavěné metody exportu dat přes rozhraní
- HTML obsah stránky můžete exportovat přidáním
?action=render
k URL adrese, takto. Tím se vygeneruje pouze vykreslený HTML obsah stránky bez jakýchkoli prvků vzhledu MediaWiki. Upozorňujeme, že se nejedná o platnou HTML stránku, ale o fragment stránky a neobsahuje žádné CSS styly. - Jednu nebo více stránek můžete exportovat pomocí Special:Export. Tím získáte surový wikitext zabalený do struktury XML. Aby byl tento výstup užitečný, budete muset provést další zpracování.
- Stránky byste měli být schopni extrahovat pomocí API .
Vestavěné metody exportu dat pomocí příkazového řádku
/maintenance/getText.php
vám umožňuje získat text wiki pro konkrétní stránku.* Jako hack, následující příkaz vypíše HTML stránku (nezapomeňte jej spustit ve vašem adresáři údržby. Nahraďte Main_Page požadovanou stránkou)
echo '$a = new ApiMain( new FauxRequest( array( "action" => "parse", "page" => "Main_Page", "prop" => "text" ))); $a->execute(); $d = $a->getResultData(); echo $d["parse"]["text"]["*"];'|php eval.php
- Výše uvedené by mohlo být nahrazeno řádným skriptem pro údržbu, pokud by byla poptávka (podobně jako getText.php za text stránky).
Rozšíření pro pomoc s exportem dat
Tento seznam není v žádném případě vyčerpávající a neměl by být považován za doporučení k používání kteréhokoli z těchto rozšíření. Je spíše ukazatelem některých rozšíření, která by mohla stát za další zkoumání.
- Můžete si nainstalovat různá rozšíření, která umožňují export jednotlivých stránek do PDF souborů:
- Extension:Collection umožňuje publikovat jednotlivé stránky nebo kolekce stránek v řadě formátů.
- Extension:OpenDocument Export exportuje ve formátu ODF.
- Kategorie:Rozšíření extrakce dat je v současné době poněkud smíšený produkt, ale obsahuje několik užitečných věcí, které již nebyly uvedeny výše.