Wikimedia Language and Product Localization/ja

ウィキメディア言語・ 製品現地化チームは、ウィキメディア財団の製品・技術部門に所属します(Language and Product Localization、Foundation’s Product and Technology)。当チームの使命として、ウィキメディア運動内の多言語主義を支援して、標準ベースのツールを確保すること、知識の格差を減らすこと、言語の公平性を促進することを目指して技術の取り組みの地域化を推進しています。

当チームはグローバルに展開し、さまざまな国と地域に分散しています。合計約25言語の現行の知識を備えています。

前身のWMFイヌカ・チーム(2019年設置Inuka team)ならびにWMF 言語チーム(2011年設置)を統合しました。

私たちの仕事

ウィキメディアのプロジェクト群は、インターネット空間で最も多言語化が進んだウェブサイト群でもあり、ウィキメディアはそのうちの最大で300超の言語版があります。 言語・製品ローカル化チームが作成して管理するツール類は、メディアウィキを用いるウェブサイト群における言語利用を調整しています。 当財団はローカライズと翻訳のために強力なツールを提供して、ウィキペディアで新しい記事の作成に使用された実績は100万件超です。 当チームはウィキメディアのプロジェクト単位のコミュニティと密接に連携して機能の作成、技術支援を提供し、知識の構築と共有に向けた取り組みの推進を支援します。 詳細情報:現地化(L10n)(ローカライゼーション)と 国際化(i18n)

インターネットを初めて利用する人々が百万人単位で増え続ける近年、私たちのプロジェクト類はインターネット上のコンテンツ作成や消費方法に適した公平性を知識と言語に提供し、新規利用者を支えて歓迎することが欠かせません。私たちは、変化する知識ニーズに対応するため改革を地域化して構築、サポートシステムの育成を目標としています。

チーム

製品設計

エンジニア

言語の技術支援と普及

データと分析

プロジェクト

特徴

  • コンテンツ翻訳コンテンツ翻訳ツールはウィキペディアの記事を翻訳する多言語翻訳者を補佐します。 このツールは、ウィキペディアに数十万、数千万もの記事が作成されました。 手順は速く簡単になり、結果としてその記事はコミュニティの査読に合格する率が高まります。 セクション翻訳 と呼ぶ最近の開発では初期機能を拡張してあり、モバイル機器でも記事を見出し単位で翻訳し、既存の記事を拡張できるようになりました。 詳細はこちら
  • 翻訳Translate 拡張機能という機能豊富でブラウザ上で使う拡張機能は利用者がソフトウェアの文字列やページを翻訳できるようにします。 ソフトウェア翻訳とページ翻訳の両方において、翻訳メモリ、グループごとおよび言語ごとの統計、複数言語の高度な文法支援などに対応しています。
  • ウィキペディア プレビュー によりウィキペディアのコンテンツを文脈を含む情報として第三者のウェブサイトに提供できます。 提携先ウェブサイト上でウィキペディアをプレビューできると、読者はページを読みながら文脈を把握し、文脈に沿った知識をウィキペディアから得ることができますが、わざわざウィキペディアをクリックして詳細を確認する必要はなく、さらに詳しく読みたいならウィキペディアへ飛ぶオプションも提供してあります。 ページプレビューに似ていて、外部サイト対応です。コードをそのサイトに統合することも、WordPress を採用する外部サイト の場合は、https://wordpress.org/plugins/wikipedia-preview/ にあるWordPress プラグインを使うこともできます。
  • ユニバーサル言語選択ユニバーサル言語選択(ULS= Universal Language Selector)というユーザーインターフェースでは、使用言語を柔軟に選んだり設定できます。フォントと入力方法を選択するオ選択肢もあります。言語の検索にはISO言語コードを用います。言語名の表記には現在のユーザーインターフェース言語または独自のスクリプト(自称)を使います。ユーザーインターフェース言語は、利用者の所在地やブラウザ/オペレーティングシステムの言語に応じて提案します。言語間検索は、任意のスクリプトも使用可能です。 続きはこちら
  • 機械翻訳サービス MinT(ミンティ=Machine in Translationの略語)とは、オープンソースのニューラル機械翻訳モデルに基づいています。このサービスはウィキメディア財団のインフラにホストしてあり、実行する翻訳モデルは他の組織がオープンソースライセンスで公開しています。オープンな機械翻訳サービスとして、無償の知識のエコシステムに不可欠なインフラの重要な構成要素となり得ます。 解説の続きはこちら
  • 翻訳 suggestions:トピック単位とコミュニティ定義の一覧(Topic-based & Community-defined lists)は試験運用のプロジェクトとしてウィキメディア財団2024-2025年次計画作業に由来する仮説2件(WE2.12、WE2.1.4)を検証または無効化する目的で、コンテンツ翻訳ツールの翻訳提案機能を改善します。 詳細はこちら

ライブラリ

  • プロジェクト・ミルクシェイク(Project Milkshake)は MediaWiki を介してウィキメディアのプロジェクト群で利用できるように開発され、一般に必要な国際化機能コンポーネント用の汎用 JavaScript コンポーネントの作成を目指しています。入力方法、ウェブ用フォント、言語の文法規則などが対象に含まれます。参加しやすく、より広く採用しできるように、ソースコード・リポジトリは GitHub にホストしてあり、コンポーネントは GPL と MIT のデュアルライセンスを適用しました。
    • jQuery.uls – フル機能の言語セレクターは数百言語に対応。
    • jQuery.ime – jQuery.ime を採用、多言語の入力方式合計150件超を提供しており、これまでにその入力法の多くは、ウィキメディアのコミュニティが提供しました。デモを表示
    • banana-i18n – このライブラリは言語それぞれの文法規則に対応するよう国際化の要素を提供し、対象には複数形や性別も含まれます。
    • jQuery.i18n – バナナ-i18n を優先するのでこのライブラリは廃止され、現在管理モードで存在します。プロトタイプを参照
    • jQuery.webfonts – jQuery.webfonts は WebFonts 技術を採用し、フォント・リポジトリからフォントを利用できるようにします。これらの言語でページを閲覧する際に、システム・フォントに依存しなくなります。ウェブ・フォントの詳細はこちら
  • 言語データ・ライブラリ は数百言語に関して重要な言語データを提供します。すなわち自称、スクリプト、筆記法です。言語セレクターの構築や、言語コンテンツに正しい筆記法をタグ付けするのに役立ちます。
  • ウィキペディア プレビュー によりウィキペディアのコンテンツを文脈のつながる情報として第三者のウェブサイトに表示します。提携先ウェブサイトでは、当該サイトの読者はページの閲覧中に文脈を理解できるようウィキペディア・プレビューに補佐されてウィキペディアから文脈に沿った知識を得ることができ、何度もクリックしてわざわざウィキペディアに遷移しなくても、オプションを使うとウィキペディアの内容が読めて学びを深めることができます。ページ・プレビュー機能と似てはいますが、外部サイト対応です。サイトにコードを組み込むか、あるいは WordPress を組み込んだ外部サイトであれば、https://wordpress.org/plugins/wikipedia-preview/ にある WordPress プラグインを利用してください。

その他のプロジェクト

  • 'MediaWiki 言語拡張バンドル (Language Extension Bundle)は多言語化を目指すウィキに必要な、厳選した MediaWiki 拡張機能集です。四半期ごとのサイクルに従ってリリースされます。
  • ウィキメディアのソフトウェアのほとんどは、その翻訳をtranslatewiki.netで実施するボランティア翻訳者に頼っています。私たちは translatewiki.net の保守と開発を支援し、ウィキメディアのソフトウェア・プロジェクト類に迅速かつ確実に翻訳が提供されるようにしています。
  • ウィキストーリーズ(Wikistories)を使う編集者はウィキペディアから短く視覚的で信頼性の高い知識を作成すると、すぐに消費して簡単に共有できます。
    • ウィキ・ハイライト(Wiki-Highlights)というテストプロジェクトは仮説を肯定的または否定的に検証するために使うもので、その仮説では世界中の若者にサードパーティのプラットフォームにおける読書の代替体験を提供して、人間が評価した視覚的な記事を自動で読めるようになった人は、ウィキメディアのプロジェクト群を認知して読者および貢献者として関与を進めるとしています。ウィキ・ハイライトは、ウィキストーリーズ(Wikistories)というプロジェクトからコンセプトを継承し、簡潔で視覚的かつ信頼性の高い知識を創出しています。
  • Phonos(フォノス)という拡張機能は、コミュニティ技術部門(Community Tech)が 2022年コミュニティ要望リスト調査( Community Wishlist Survey)をもとに作成し、現在は私たちがメンテナンスしています。
  • Language Onboarding and Development entails integrating languages into the Wikimedia ecosystem and setting them up for success through tooling and support systems

さまざまなプロジェクトの維持について、詳細は以下を参照してください:

  • コードレビューに関する意志の声明
  • Phabricatorにおけるメンテナンスと責任範囲

WMF 年次計画の作業 - 2024-25会計年度

言語・製品地域化チームは2024年7月1日を初日とする2024-25年度には、ウィキメディア財団の年間計画に沿って活動計画を建て、ウィキメディア運動の2030年戦略方針に沿って進めます。 私たちはWMF 製品技術部門の一環として公平性目標に準拠して計画した目標と主要な成果を追求し、ウィキメディア運動の技術系ニーズ対応は知識格差対応とコンテンツ拡充を中心とします。 私たちの提携先はウィキメディア財団Advancement部門の配下にある コミュニティ成長チームと提携します。 年次計画に組み込んだ作業の情報更新は、2024年7月に配信を始めるニュースレターで確認してください。

目標

(ウィキ体験 2/知識の公平性)

注記
コミュニティは知識の格差を効果的に埋めるよう、アクセスや適応、改善が容易なツールとサポート用システムによって支援を受け、信頼できる百科事典コンテンツの成長を促進します。
FY24-25会計年度の第1、第2四半期における主な成果と仮説
WE 2.1 第2四半期末までに主催者と貢献者および機関を支援して、主な主題の領域をまとめた質が高いコンテンツを増やし、実験を介した具体的な対象領域とはジェンダー(女性の健康や女性の伝記)ならびに地理(生物多様性)の記事合計138件とします。
WE2.1.1 ウィキペディア記事に対して国レベルの推論モデルを構築した場合、特定の地域に関する記事をフィルター処理して精度 70% 超で再現率50% 超の一覧が入手できるようになると見込まれます。 [1]
WE2.1.2 利用者が選んだ主題領域に基づいて翻訳を提案する概念実証を構築すると、現段階で利用できる一般的な提案と比べて、翻訳者は関心を寄せる分野でもっと多くの翻訳の機会を見つけ、より多く貢献できるかどうか、効果的にテストできるようになります。 [2]
WE2.1.3 リスト作成をサービスとして提供すると、5件以上のコミュニティはそれぞれのトピック領域において、さらに的を絞った貢献ができるようになります。その評価基準とは、(1) 関連ウィキにおける関連のトピックと標準的な品質範囲の変化、(2) 主催者に対してウィキにおけるトピック領域がどれくらい網羅してあるか簡単な満足度アンケート。
WE2.1.4 概念実証を開発してウィキ・プロジェクトその他のリスト作成の取り組みから翻訳タスクを取得して追加し、CXモバイル・ワークフロー内で示して提案すれば、より多くの編集者が主題クの格差に焦点を当てた記事を発見し、翻訳するようになるはず。 [4]
WE 2.2 第2四半期末までにテストと導入予定の推奨事項2件はどちらも社会ならびに技術面に対応、小規模な言語コミュニティで言語の新規話者と多言語対応を補佐し、コミュニティから寄せられるフィードバックの分析を評価します。
WE2.2.1 ユネスコおよびエスノローグ(UNESCO、Ethnologue)とデータ共有の協定を結んで、ウィキメディアの言語状況データを拡充したなら、少なくともパートナー1件はウィキメディアの言語包摂の進捗状況を先方のデータ製品やコミュニケーションに反映しようと決定すると見込まれます。 パートナー機関にとって有用な拡張データセットは、さらに意思決定に役立つ重要な文脈情報を提供し、コミュニティには介入の領域特定に必須の情報を提供します。
WE2.2.2 ウィキメディアンの皆さんが過去2年にわたって実施した言語の文書化活動をマッピングすると、新言語の導入に当たってベースラインが作成でき、それはコミュニティ体験に関するデータに基づいています。
WE2.2.3 インキュベータの有無にかかわらず、新しく5言語の本番環境向けにウィキ・アクセスを提供すると、ウィキペディア英語版で利用可能な最新機能(コンテンツ翻訳やウィキデータ対応、高度な編集機能、検索結果など)を備えた本格的なウィキへのアクセスは編集の迅速化に役立つかどうか判明するはずで。 最終的に、このアプローチを使うと方向性として新規言語または既存言語への言語紹介を実行できるかどうか判明して、さらに調査を重ねる理由を正当化します。 [4]

コミュニティ空間

開発を検討するべきアイデアや機能をぜひ当チームのトークページで共有し、私たちに協力してください。

読者、編集者、翻訳者が対象

開発者向け

  • 問題を見つけた、または新規機能を提案するには:
    • MediaWikiの国際化や拡張機能に関する問題や機能の要望を報告
    • ミルクシェイク(Milkshake)のライブラリに関して問題や機能の要望は GitHub ページに報告
    • 誤訳の訂正をするには皆さん自身でtranslatewiki:translatewiki.netに参加登録をしてください。
    • 翻訳関連のエラーやバグ、機能の問題は、Translatewiki.net のサポートページを使ってください。
  • 利用者、開発者またはシステム管理者の方なら、特定のプロジェクトに関する支援を求める場合は、このウィキ内で該当するプロジェクトのトークページをご利用ください。まずはヘルプページをお読みください。
  • 技術系タスクを探している場合は、さまざまな [ウィキメディア Phabricator の https://phabricator.wikimedia.org/maniphest/query/YksQsizHhlUA/#R 言語プロジェクト・リポジトリ] で簡単なタスクだけれども、まだ担当者の割り当てが決まっていないものを探してみましょう。
  • 入力方法用のユニットテストの執筆を補佐してください
  • If you are contributing patches to our repositories, see our code review statement of intent.

フォローしてつながるには

  • 言語コミュニティのミーティングに参加しませんか
  • ニュースレターを購読すると、プロジェクトの更新、年次計画の進捗状況、コミュニティのイベント報告が載っています。
  • ディフ(Diff)はウィキメディアの公式ブログ投稿
  • ご連絡は当チームのトークページもしくは担当プロジェクトのトークページへどうぞ!
  • 当言語・製品現地化チームに連絡して言語サポートならびに翻訳に関する課題を打ち合わせたい場合は、Libera Chat のチャットルーム #wikimedia-language が連絡先もしくは Telegram グループに参加しましょう – これら2件は互いにミラーしあっています。その場で答えがほしい場合あるいは重要な課題の伝達などにご利用ください。