Growth/Personalized first day/Structured tasks/Add an image/ja

モバむル版の「画像を远加」機胜

このペヌゞでは「画像の远加」構造化タスクに぀いおの取り組みを解説したす。「画像の远加」構造化タスクずは、Growth チヌムが新芏参加者ホヌムペヌゞを通じお提䟛する予定の構造化タスク のひず぀です。

このペヌゞでは䞻芁なアセット、蚭蚈、未決の課題、意思決定に぀いお述べたす。

進行䞭の増分曎新のほずんどは党般的なGrowthチヌムの曎新ペヌゞに投皿されたす。このペヌゞにはいく぀かの倧芏暡たたは詳现な曎新を掲茉したす。

珟状

  • 2020-06-22: 画像をお勧めするための単玔なアルゎリズム䜜成のアむデアに関しお最初の怜蚎
  • 2020-09-08: マッチングアルゎリズムの初回詊䜜の評䟡、察象は英語版、フランス語版、アラビア語版、朝鮮語版、チェコ語版、ベトナム語版
  • 2020-09-30: マッチングアルゎリズムの第2回詊䜜の評䟡、察象は英語版、フランス語版、アラビア語版、朝鮮語版、チェコ語版、ベトナム語版
  • 2020-10-26: 実行性のありそうな画像掚薊サヌビスに぀いお、技術面に関する内郚の協議
  • 2020-12-15: 利甚者テストの初回を実斜しお、新芏参加者がこのタスクをうたく習埗するかどうか、把握を開始
  • 2021-01-20: プラットフォヌム技術班が画像掚薊のための抂念実蚌 API の構築を開始
  • 2021-01-21: Android チヌムは調査甚に䜿える最小限のバヌゞョン開発に着手
  • 2021-01-28: 利甚者テストの結果を公衚
  • 2021-02-04: コミュニティの協議内容のたずめず、適甚の統蚈を公衚
  • 2021-05-07: Android MVP を利甚者に公開
  • 2021-08-06: Android 版の公衚結果ず実甚版暡型むテレヌション1
  • 2021-08-17: むテレヌション1でバック゚ンドの䜜業を開始
  • 2021-08-23: 英語版ずスペむン語版で、察話匏の詊䜜品を投入し、利甚者テストを開始
  • 2021-10-07: 利甚者テストで発芋したこず、それに立脚した蚭蚈の最終案を掲出
  • 2021-11-19: 補品版のりィキペディアで倧䜿がテストを開始
  • 2021-11-22: むテレヌション1を利甚者に公開する前に画像おすすめデヌタセットをリフレッシュ
  • 2021-11-29: むテレヌション1をアラビア語版、チェコ語版、およびベンガル語版りィキペディアでモバむルアカりントの40に展開。
  • 2021-12-22: 目を匕く指暙を提瀺
  • 2022-01-28: デスクトップ版の展開はアラビア語版、チェコ語版、ベンガル語版の新芏登録アカりントの40%に展開。
  • 2022-02-16: スペむン語版りィキペディアの新芏参加者に「画像を远加」タスクの提䟛を開始
  • 2022-03-22: りィキペディアのポルトガル語版、ペルシャ語版、フランス語版、トルコ語版の新芏参加者に「画像を远加」機胜の提䟛を開始
  • 2023-02-07: セクション・レベルの画像の提案の評䟡を完了 (T316151)
  • 2023-10-16: Image Recommendations added to the Android Wikipedia app
  • 2024-04-11: Publish "Add an image" Experiment Analysis
  • 次: Release "Add an image" to more Wikipedias

抂芁

構造化タスクは線集タスクを段階ごずのワヌクフロヌに分割しお、新芏参加者に理解しやすく、そしおモバむル機噚で理解しやすいようにするこずを目的ずしおいたす。 Growthチヌムは、これら新しい皮類の線集ワヌクフロヌによっお、より倚くの新芏参加者がりィキペディアぞの関䞎を始めやすくなり、その䞭にはより実質的な線集を孊んでコミュニティぞ参加する人も出おくるだろうず信じおいたす。 構造化タスクのアむデアをコミュニティず議論した埌、最初の構造化タスクの構築を決めたした。「リンクの远加」です。

2021幎5月に「リンクを远加」を展開埌、初期デヌタを採ったずころ、新芏参加者にずっおタスクはやり甲斐があり、線集は差し戻される率は䜎いずわかり -- 構造化タスクは新芏参加者の䜓隓に、たたりィキにずっお䟡倀があるず瀺唆されたした。

その最初のタスクを構築しながらも、次の構造化タスクは䜕がよいか、新芏参加者に適したものずしお画像の远加はどうかず考えおいたした。単玔なアルゎリズムで画像のない蚘事に眮くべき画像をコモンズからお勧めしおはどうだろうかずいう発案です。手始めに、りィキデヌタで芋぀けるこずができる既存の接続のみを利甚し、蚘事にその画像を䜿うかどうかは新芏参加者が自分で刀断するようにしおみたす。

このタスクがどのように機胜するのかに぀いお倚くの未解決の疑問、および䞊手くいかないかもしれない倚くの朜圚的な理由があるこずを把握しおいたす。だからこそ、倚くのコミュニティの皆さんからご意芋を聞き、議論をしながらどのように進めおいくのかを決定したいず考えたす。

関連するプロゞェクト矀

Android チヌムは同じ構成芁玠を利甚し、Android 版りィキペディア アプリ向けの類䌌の画像お勧めタスクに取り組みたした。 これに加え、構造化デヌタチヌムは、コモンズの構造化デヌタを利甚しお、より経隓を積んだ利甚者を察象ずした画像お勧め通知をリリヌスしたした。

なぜ画像か

「なぜ画像か」節を展開しお読む

実質的な貢献を求める

コミュニティのメンバヌず最初に構造化タスクに぀いお議論したずき、倚くの人がりィキリンクの远加は特に䟡倀の高い線集の皮類ではないず指摘したした。 コミュニティのメンバヌは新芏参加者がもっず実質的な貢献できる方法に぀いおのアむデアも持ち出したした。 ひず぀のアむデアが画像です。 りィキメディア・コモンズには6500䞇の画像がありたすが、倚くのりィキペディアでは50%以䞊の蚘事に画像がありたせん。 コモンズからの倚くの画像がりィキペディアを実質的にもっず図解できるに違いないず考えおいたす。

新芏参加者の関心床

私たちは倚くの新芏参加者が画像の远加に興味を持っおいるこずを知っおいたす。「画像の远加」は歓迎アンケヌトでアカりントを䜜成した理由に察する新芏参加者のよくある回答です。ヘルプパネルの質問でも画像の远加方法に関するものは最もよくある質問のひず぀で、私たちが扱うすべおのりィキにわたっおそうでした。これらの新芏参加者のほずんどはおそらく远加したい独自の画像を持っおくるのでしょうが、これは画像がいかに魅力的で゚キサむティングたりえるか瀺唆しおいたす。新芏参加者が参加しおいる他のプラットフォヌムInstagramやFacebookのようなものが画像に重きを眮いおいるこずを考えれば理にかなっおいたす。

画像を扱う難しさ

画像に関する倚くのヘルプパネルの質問は、蚘事に画像を远加する工皋が難しすぎるこずを反映しおいたす。新芏参加者はりィキペディアずコモンズの違い、著䜜暩呚蟺のルヌル、および適正な堎所に画像を挿入しキャプションを付けるための技術的な郚分を理解する必芁がありたす。図解されおいない蚘事のためにコモンズで画像を芋぀けるには、りィキデヌタやカテゎリの知識のような、さらなるスキルが芁求されたす。

「写真を募集䞭のりィキペディアのペヌゞ」キャンペヌンの成功事䟋

写真を募集䞭のりィキペディアのペヌゞキャンペヌンでは、600人の利甚者が 85,000 ペヌゞに画像を远加したした。

写真を募集䞭のりィキペディアのペヌゞキャンペヌン (WPWP)は予想倖の成功を収めたした。600人の利甚者が 85,000 ペヌゞに画像を远加したのです。これを達成するため利甚した耇数のコミュニティ・ツヌルは、画像がないペヌゞを抜出し、りィキデヌタを介しお適合しそうな画像を提案したす。 新芏参加者がうたく画像を远加するのを助ける方法に関しお孊ぶべき重芁な教蚓がありたすが、これは利甚者に画像の远加に関するやる気を出させ、ツヌルで補助できるずいう自信を私たちに䞎えおくれたす。

これを総合するず

この情報を総合しお考えるず、新芏参加者にずっお楜しく、なおか぀りィキペディアにずっお生産的である「画像の远加」構造化タスクを構築するこずが可胜であるず考えおいたす。

アむデアの怜蚌

2020幎6月から2021幎7月にかけお、Growthチヌムは「画像の远加」タスク呚蟺のコミュニティ議論、背景調査、評䟡、および抂念実蚌に取り組みたした。これにより2021幎8月に最初のむテレヌションを構築するずいう決定に至りたしたむテレヌション1参照。この節にはむテレヌション1に至るたでの背景䜜業のすべおが含たれおいたす。

「アむデアの怜蚌」節を展開しお読む

アルゎリズム

画像の远加に぀いお構造化タスクを䜜るこずができるかどうかは、十分に良奜なお勧めを生成できるアルゎリズムを䜜成できるかどうかに䟝存したす。間違った画像を远加するように新芏参加者を駆り立おお、巡回者に埌始末をさせる結果になるこずは断じお望んでいたせん。したがっお、良奜なアルゎリズムを䜜るこずができるかどうか芋おみるこずが私たちが最初に取り組んだこずのひず぀です。

ロゞック

私たちはWikimedia Research teamず協力しお、これたで正確さず人間の刀断を優先するアルゎリズムをテストしおきたした。いかなるコンピュヌタの芖点も予期せぬ結果を生成しおしたう可胜性があるので、それよりもむしろ単玔に経隓を積んだ投皿者によっお行われた接続に頌っおいるりィキデヌタにある既存の情報を統合したす。以䞋は図解されおいない蚘事に合臎する提案をする3぀の䞻芁な方法です

  • その蚘事に察するりィキデヌタの項目を芋たす。もし画像(P18)があれば、その画像を遞びたす。
  • その蚘事に察するりィキデヌタの項目を芋たす。もし関連付けられたコモンズのカテゎリ(P373)があれば、そのカテゎリから画像を遞びたす。
  • 他蚀語版りィキペディアで同じトピックに関する蚘事を芋たす。それらの蚘事から導入の画像を遞びたす。

アルゎリズムには、アむコンやナビボックスの䞀郚ずしお蚘事に存圚しおいそうな画像を陀倖するずいったようなこずをするロゞックも含たれおいたす。

正確さ

2021幎8月珟圚、私たちはアルゎリズムのテストを既に3回行っおおり、各回で6蚀語英語、フランス語、アラビア語、ベトナム語、チェコ語、および韓囜語の蚘事の合臎を芋たした。評䟡は私たちのチヌムの倧䜿およびその蚀語を母囜語ずしお話すその他の熟緎りィキメディアンによっお行われたした。

最初の2回の評䟡

各蚀語で提案された50個の合臎を芋お、それらを以䞋のグルヌプに分類したした

区分 説明 䟋
2 蚘事にずおも良く合臎しお、蚘事のタむトルを図解するものである。 蚘事が「チョり蝶」であり、画像がチョり蝶である。
1 良く合臎するが、利甚者が䜕らかの文脈を持っおいない限り蚘事を補匷するこずは難しく、良いキャプションが必芁である。 蚘事が「チョり蝶」であり、画像がチョり蝶を研究した重芁な科孊者である。
0 蚘事に党く適合しない。 蚘事が「チョり蝶」であり、画像が自動車である。
-1 画像が䞻題にずっお正しいが、ロヌカルな文化に合臎しない。 蚘事が「チョり蝶」であり、画像が䞖界の䞀郚からきたロヌカルな皮類ずは異なる特定のチョり蝶である。
-2 新芏参加者がうっかり正しいず考えおしたう可胜性のある誀解を招く画像である。 蚘事が「チョり蝶」であり、画像がガ蛟である。
-3 ペヌゞが画像を持぀べきではない。 曖昧さ回避ペヌゞ、䞀芧、あるいは「人の名前」の蚘事。

アルゎリズムに぀いおの䜜業を通じおこのような疑問が浮かんできたすどのくらいの正確さが必芁か75%の合臎が良奜ならば十分か90%の正確さが必芁かあるいは正確さが50%たで䜎䞋しおもいいのかこれはそれを利甚する新芏参加者の刀断がどのくらい良奜か、およびどのくらい匱い合臎を耐えるこずができるのかに䟝存したす。これに関しおはアルゎリズムを実際の新芏参加者で利甚者テストするずきにもっず知るこずができるでしょう。

最初の評䟡で、最も重芁なこずは、陀倖すべき蚘事や画像の皮類を含む、簡単にできるアルゎリズムの改善点がたくさん芋぀かったこずです。それらの改善なしでも、玄20-40%の合臎が「2」、぀たり蚘事にずおも良く合臎したしたりィキによっお異なりたす。最初の評䟡からの党結果ず泚蚘はこちらをご芧ください。

2回目の評䟡には、倚くの改善が組み蟌たれ、正確さが向䞊したした。50-70%の間の合臎が「2」でしたりィキによっお異なりたす。しかし正確さの向䞊は網矅率、぀たり合臎させるこずができる蚘事の数を枛少させる可胜性がありたす。保守的な基準を䜿うず、䜕十䞇あるいは䜕癟䞇ずいう蚘事があるりィキでさえ、アルゎリズムは数䞇の合臎しか提案できないかもしれたせん。そのような量は、この機胜の初期バヌゞョンを構築するには十分であるず確信しおいたす。2回目の評䟡からの党結果ず泚蚘はこちらをご芧ください。

3回目の評䟡

2021幎5月、構造化デヌタチヌムは画像マッチングアルゎリズムおよびメディア怜玢アルゎリズムのさらに倧芏暡なテストをアラビア語版、セブアノ語版、英語版、ベトナム語版、ベンガル語版、およびチェコ語版りィキペディアで実斜したした。このテストでは、画像マッチングアルゎリズムずメディア怜玢アルゎリズムの䞡方からの玄500個の合臎が各蚀語の熟緎者によっお評䟡され、合臎を「良」、「可」、あるいは「䞍可」ずしお分類できるようにしたした。以䞋で詳述する結果によっお、これらのこずが瀺されたした

  • 画像マッチングアルゎリズムの正確さは「良」を集蚈するか「良+可」を集蚈するかによっお、そしおりィキ/評䟡者によっお65-80%の範囲にありたす。興味深いこずに、画像の合臎を評䟡する経隓では、画像が蚘事に盞応しいかどうか皆が独自の基準を持っおいるので、しばしば熟緎りィキメディアンの意芋が互いに異なるこずがありたす。
  • りィキデヌタのP18「りィキデヌタ」は合臎の最も匷力な゜ヌスで、85%-95%の範囲の正確さです。他のりィキペディアからの画像「りィキ暪断」ずりィキデヌタの項目に付されたコモンズのカテゎリからの画像「コモンズのカテゎリ」は同皋床のより䜎い正確さです。
  • 他のりィキペディアからの画像「りィキ暪断」は最もありふれた合臎の゜ヌスです。蚀い換えれば、他の2぀の゜ヌスよりも倚くのものをアルゎリズムが利甚可胜です。
゜ヌス 正確さ良 正確さ良+可 網矅率のシェア
りィキデヌタ 85% 93% 7%
りィキ暪断 56% 76% 80%
コモンズのカテゎリ 51% 76% 13%
すべお 63% 80% 100%

結果の党デヌタセットはこちらで芋おください.

網矅率

アルゎリズムの正確さは明らかに非垞に重芁な芁玠です。同様に重芁なのはその「網矅率」です -- これはどれだけ倚くの画像を合臎させるこずができるかずいうこずです。正確さず網矅率は盞反する傟向にありたすアルゎリズムが正確であればあるほど、提案の数は少なくなりたす確信があるずきだけ提案するからです。私たちはこれらの疑問に答える必芁がありたすそのアルゎリズムは機胜を構築する䟡倀があるくらい十分な合臎を提䟛できたすかりィキに実質的な圱響を及がすこずができたすかその答えを感じ取るために22のりィキペディアを芋たした。衚がこれらの芁点の䞋にありたす

  • 衚に反映されおいる網矅率の数字は、「画像の远加」機胜の最初のバヌゞョンずしおは十分そうです。十分な合臎の候補が各りィキにあり、(a)利甚者が䜿い果たすこずなく、(b)機胜がりィキの図解のあり方に実質的な圱響を及がすこずができたす。
  • りィキは20%が図解されおいないもの セルビア語版から69%が図解されおいないものベトナム語版たで範囲がありたす。
  • 7,000 個ベンガル語版から 155,000 個英語版の合臎する候補がある図解されおいない蚘事を芋぀けるこずができたす。䞀般的には、これはタスクの最初のバヌゞョンずしおは十分な量であり、利甚者が豊富な合臎に取り組むこずができたす。ベンガル語版のような、䞀郚のたばらなりィキでは、利甚者が興味のあるトピックを絞るず少数になるかもしれたせん。ずはいえ、ベンガル語版は党郚で玄 100,000 蚘事しかなく、その7%に぀いお合臎を提案しおいたすので、実質的ず蚀えたす。
  • このアルゎリズムでりィキにどれだけ倧きな図解の改善できるかずいう芳点では、䞊限は1% (cebwiki)から9% (trwiki)たでの範囲です。これはすべおの合臎が良奜でりィキに远加されるずした堎合に図解されるこずになる远加の蚘事の党䜓的な割合です。
  • 合臎を芋぀けるこずができる図解されおいない蚘事の割合が最も䜎いりィキはarzwikiずcebwikiで、䞡方ずもボットによっお䜜成された蚘事が倧量にありたす。そのような蚘事の倚くはコモンズに画像がないであろう特定の町や皮に぀いおのものなので、これは理にかなっおいたす。しかしそれらのりィキにはずおも倚くの蚘事があるので、なおもアルゎリズムが合臎したものが䜕䞇もありたす。
  • さらに将来的には、画像マッチングアルゎリズム、あるいはメディア怜玢、あるいは画像のアップロヌド/キャプション付け/タグ付けのワヌクフロヌをより倚くの候補が合臎するように改善したいず考えおいたす。
りィキ 党蚘事 図解のない蚘事 図解のない割合 画像の合臎 合臎した図解のない蚘事の割合
enwiki 6,199,587 2,932,613 47% 154,508 5%
trwiki 382,825 151,620 40% 35,561 23%
bnwiki 99,172 33,642 34% 6,921 21%
frwiki 2,273,610 952,994 42% 94,594 10%
ruwiki 1,680,385 584,290 35% 60,415 10%
fawiki 755,709 304,253 40% 55,382 18%
arwiki 1,080,564 581,710 54% 59,551 10%
dewiki 2,506,229 1,190,517 48% 110,771 9%
ptwiki 1,048,255 388,605 37% 79,483 20%
hewiki 282,232 73,261 26% 14,453 20%
cswiki 467,573 182,177 39% 37,300 20%
kowiki 526,990 274,338 52% 48,417 18%
plwiki 1,441,429 560,334 39% 71,456 13%
ukwiki 1,058,563 365,209 35% 51,154 14%
svwiki 3,514,965 1,686,664 48% 91,337 5%
huwiki 479,215 170,936 36% 26,559 16%
euwiki 364,458 105,412 29% 21,481 20%
hywiki 278,487 96,729 35% 13,531 14%
arzwiki 1,171,440 759,418 65% 32,956 4%
srwiki 640,678 126,102 20% 27,326 22%
viwiki 1,259,538 867,672 69% 83,785 10%
cebwiki 5,377,763 1,357,405 25% 61,839 5%

メディア怜玢

䞊述のように、構造化デヌタチヌムは網矅率を向䞊させ、より倚くの候補を合臎させるためにメディア怜玢アルゎリズムを利甚しお探玢しおいたす。

メディア怜玢は蚀語に䟝存しない方法で関連性のある怜玢結果を提䟛するために旧来のテキストベヌスの怜玢ず構造化デヌタを組み合わせお機胜したす。コモンズの構造化デヌタの䞀郚ずしお画像に远加されたりィキデヌタの文を怜玢ランキングの入力ずしお利甚するこずによっお、メディア怜玢は別名、関連のある抂念、および倚蚀語のラベルを画像マッチの関連性を向䞊させるために掻甚できたす。メディア怜玢が機胜する方法に関しおさらなる情報はこちらをご芧ください。

2021幎2月珟圚、チヌムはメディア怜玢からの合臎が画像マッチングタスクに利甚するのに十分な品質であるか決定するために画像掚奚アルゎリズムが消費しお利甚できるメディア怜玢の合臎に察する信頌床スコアを提䟛する方法を実隓しおいたす。メディア怜玢を機胜に組み蟌む前に、メディア怜玢が提䟛する掚奚を利甚者が信頌しおいるこずを確かめたいです。

構造化デヌタチヌムは、利甚者が䜜成したボットが画像掚奚アルゎリズムずメディア怜玢の䞡方によっお生成された結果を自動的に蚘事に画像を远加するために利甚する方法に぀いおも探玢および詊䜜しおいたす。これはボットに重きを眮くりィキで、コミュニティのボット䜜成者ず協力しおの実隓ずなる予定です。phabricatorタスクに参加しお、この取り組みに関しおもっず知ったり、関心があるこずを衚明しおください。

2021幎5月、䞊述の「正確さ」節で匕甚したのず同じ評䟡で、メディア怜玢は画像マッチングアルゎリズムよりもはるかに正確さが䜎いこずがわかりたした。画像マッチングアルゎリズムが玄78%の正確さだったのに察しお、メディア怜玢からの合臎は玄38%の正確さでした。したがっお、Growthチヌムは「画像の远加」タスクの最初のむテレヌションではメディア怜玢を利甚しない蚈画です。

疑問ず議論

未解決の疑問

画像はりィキペディアのずおも重芁で目に芋える郚分です。機胜が画像の远加を簡単にするこずがどのように䜜甚するのか、萜ずし穎になるかもしれないものは䜕か、そしおコミュニティのメンバヌにどのような関わりがあるのかに぀いお、しっかりず考えるこずが重芁です。それに向けお、倚くの未解決の疑問がありたすし、コミュニティのメンバヌからさらに持ち䞊がっおくる可胜性のある疑問に耳を傟けたいず考えおいたす。

  • アルゎリズムは良奜な合臎を豊富に提䟛できるくらい十分な正確さでしょうか
  • 新芏参加者は画像を远加するかどうか決定するために、コモンズず図解されおいない蚘事からどのようなメタデヌタを必芁ずしたすか
  • お勧めを芋るずきに新芏参加者は十分に良奜な刀断力を持っおいるでしょうか
  • 倚くのコモンズのメタデヌタが英語だずするず、英語を読たない新芏参加者が同様に良奜な決定ができるでしょうか
  • 新芏参加者は蚘事に眮いた画像に䞊行しお良奜なキャプションを曞くこずができるでしょうか
  • 新芏参加者はどれぐらい「関連性」ず察照的に「品質」に基づいお刀断すべきでしょうか
  • 新芏参加者はこのタスクをどう思うでしょう興味深い楜しい難しい簡単退屈
  • どの蚘事に画像がないのかをどのくらい厳密に決定すべきでしょうか
  • 図解されおいない蚘事のどこに画像を眮くべきでしょうか蚘事の冒頭に眮けば十分でしょうか
  • お勧めにおける朜圚的なバむアス、぀たりアルゎリズムがペヌロッパず北米のトピックに぀いおより倚く合臎するかもしれないこずにどのようにしお気を配るこずができるでしょうか。
  • このようなワヌクフロヌは荒らしの媒介ずなるでしょうかこれをどのようにしお防ぐこずができるでしょうか

2021幎02月04日のコミュニティ議論からのメモ

2020幎12月から、「画像の远加」のアむデアに関しお5぀の蚀語英語、ベンガル語、アラビア語、ベトナム語、チェコ語でコミュニティのメンバヌを招埅しお話し合いたした。英語の議論は䞻にこちらの議論ペヌゞで実斜され、ロヌカル蚀語の察話はその他4぀のりィキペディアで実斜されたした。28人のコミュニティのメンバヌから聞き取りを行っおおり、この節で最も䞀般的で興味深い考えの䞀郚を芁玄したす。これらの議論は次の䞀連の蚭蚈に倧きな圱響を䞎えおいたす。

  • 党䜓的には: コミュニティのメンバヌはこのアむデアに関しお、䞀般的には慎重ながらも楜芳しおいたす。蚀い換えれば、りィキペディアに画像を远加するためにアルゎリズムを䜿うこずには䟡倀があるだろうけれど、特に新芏参加者には、朜圚的な萜ずし穎や間違った方向に進む可胜性がある、ずいうのが人々の合意のようです。
  • アルゎリズム
    • 䜕らかの予枬䞍可胜な人工知胜ではなく、経隓を積んだ利甚者によっおりィキデヌタに曞き蟌たれた関連付けに頌っおいるだけなので、コミュニティのメンバヌはアルゎリズムを信頌しおいるようでした。
    • アルゎリズムに察する3぀の゜ヌスりィキデヌタP18、りィキ間リンク、およびコモンズのカテゎリのうち、コモンズのカテゎリが最も貧匱そしおりィキデヌタが最も匷力であるずいうのが人々の合意でした。これはテストによっお裏付けられおおり、将来のむテレヌションからコモンズのカテゎリを陀倖するかもしれたせん。
    • 特定の皮類のペヌゞ曖昧さ回避、䞀芧、幎、良質な蚘事、および秀逞な蚘事などを機胜から陀倖するずいう良い助蚀を埗たした。存呜人物の䌝蚘も陀倖した方がいいかもしれたせん。
    • コモンズで削陀テンプレヌトが貌られおいる画像および以前そのりィキペディアのペヌゞから陀去されたこずがある画像も陀倖すべきです。
  • 新芏参加者の刀断
    • コミュニティのメンバヌは䞀般的には新芏参加者が貧匱な刀断を適甚しおアルゎリズムの利益に疑いの目を向けるこずを懞念しおいたした。利甚者テストから新芏参加者は良奜な刀断ができるずわかっおおり、適正な蚭蚈によっおそれが促進されるず信じおいたす。
    • 写真を募集䞭のりィキペディアのペヌゞキャンペヌン (WPWP) に぀いお議論したずころ、新芏参加者の倚くは良い刀断を瀺すこずができたものの、あたりに熱䞭した利甚者は短時間に倚くの䞍良な合臎を行い、巡回者の䜜業を増やしおしたう可胜性があるこずがわかりたした。画像をあたりにも速く远加したり、䜕床も差し戻されおいるのに画像の远加を続けないよう、䜕らかの怜蚌を远加した方がいいず思っおいたす。
    • 画像が盞応しいかずいうこずになるず、たいおいのコミュニティのメンバヌは「品質」よりも「関連性」が重芁であるこずを肯定したした。蚀い換えれば、ある人物の写真が䞍鮮明なものしかなくおも、たいおいは画像が党くないよりはたしであるずいうこずです。新芏参加者がタスクをするずきに、この芏範を教える必芁がありたす。
    • 利甚者はできるだけ倚くの合臎をこなそうずするのではなく、気を付けおゆっくり行動すべきであるず、むンタヌフェヌスが䌝えるべきです。
    • 画像は単なる装食ではなく、教育的であるべきだず利甚者に教えるべきです。
  • ナヌザヌ むンタヌフェむス
    • 䜕人かの人々から、ひず぀ではなくいく぀かの画像の候補を利甚者に衚瀺しお、そこから遞ぶようにしおはどうかずいう提案がありたした。これによっお良い画像が蚘事に添付される可胜性が高たるでしょう。
    • 倚くのコミュニティのメンバヌは、新芏参加者が取り組む蚘事ずしお興味のあるトピックの領域特に地理を遞べるようにするこずを掚奚したした。新芏参加者が䜕らかの知識を持っおいる領域を遞べば、より匷力な遞択をするこずが可胜になるかもしれたせん。幞いなこずに、これはGrowthチヌムが構築したあらゆる機胜に自動的に組み蟌たれおいお、既に利甚者がお勧めの線集タスクを遞ぶずきに、64個のトピック領域から遞ぶこずができるようになっおいたす。
    • コミュニティのメンバヌは、新芏参加者は単にプレビュヌするだけではなく、蚘事の文脈をできるだけたくさん芋るべきであるず掚奚したした。これはタスクの重倧さを理解し、刀断をするために䜿う豊富な情報を埗るための助けになるでしょう。
  • 蚘事における配眮
    • 私たちはりィキデヌタinfoboxに関しお孊びたした。りィキデヌタinfoboxを䜿っおいるりィキでは、画像を蚘事ではなくりィキデヌタに远加しお、りィキデヌタinfoboxを介しお衚瀺されるようにするのが望たしいこずがわかりたした。このようなわけで、これらのinfoboxが様々なりィキでどれくらい普及しおいるのか再調査するこずになるでしょう。
    • 䞀般的には、蚘事で「画像をテンプレヌトの䞋か぀コンテンツの䞊に眮く」ずいうルヌルがほずんどのずきにうたくいきそうです。
    • コミュニティのメンバヌの䞀郚は、たずえ蚘事における配眮が完璧でなくおも、適正な画像を探すずいう倧倉な䜜業は既に終わっおいるのだから、他の利甚者が喜んで配眮を蚂正するだろうず私たちに助蚀したした。
  • 非英語利甚者
    • コミュニティのメンバヌは、キャプションや題材文のようないく぀かのコモンズのメタデヌタの芁玠は蚀語に䟝存しない可胜性があるこずに気づかせおくれたした。この節で正確にはそれがどのくらい普及しおいるのか芋たした。
    • たずえ利甚者が英語が流暢でなくずも、ラテン文字を読めるならばメタデヌタを利甚できるかもしれないずいう提蚀を聞きたした。これは倚くの合臎をするには、利甚者は本質的には画像メタデヌタのどこかにある蚘事のタむトルを探すだけだからです。
    • ある人はこの機胜のためのメタデヌタを機械翻蚳䟋えば Google翻蚳を利甚しおロヌカルな蚀語に翻蚳するずいうアむデアも提案したした。
  • キャプション
    • コミュニティのメンバヌそしおGrowthチヌムのメンバヌは、新芏参加者の適切なキャプションを曞く胜力に関しお懐疑的です。
    • キャプションの䟋、そしおキャプションを付けようずしおいる蚘事の皮類に合わせたガむドラむンを利甚者に瀺すずいう助蚀を受けたした。

利甚者テストの蚈画

利甚者テストで䜿甚された、画像マッチングワヌクフロヌになる可胜性のある詊䜜品からのスクリヌンショット。利甚者は䞋にスクロヌルしおコモンズからの画像に関するさらなるメタデヌタを参照できたす。

䞊蚘の未解決の疑問に関しお考えるず、コミュニティから提䟛されたものに加えお、「画像の远加」機胜を構築する実行可胜性を評䟡する助けずするためにいく぀かの定量的および定性的な情報を生成したいです。スタッフずりィキメディアンの間で既にアルゎリズムを評䟡したしたが、新芏参加者がどのような反応をするのか、そしお画像が蚘事に盞応しいか決定するずきにどのように刀断をするのかを芋るこずは重芁です。

それに向けお、usertesting.comでテストを実斜しおいたす。そこではりィキペディアを初めお線集する人々が詊䜜品で朜圚的な画像の合臎に目を通しお、「はい」、「いいえ」、あるいは「わからない」ず答えたす。テストのために珟状のアルゎリズムからの実際の合臎に裏打ちされた、簡単な詊䜜品を構築したした。詊䜜品は䟛絊されたすべおの合臎を次々ず衚瀺するだけです。画像は以䞋のようなコモンズからのすべおの関連性のあるメタデヌタず共に衚瀺されたす

  • ファむル名
  • サむズ
  • 日付
  • 利甚者
  • 解説
  • キャプション
  • カテゎリ
  • タグ

これは将来の実際の利甚者のためのワヌクフロヌのようなものではないかもしれたせんが、詊䜜品は倚くの情報を生成しお、テスタヌができるだけ倚くの朜圚的な合臎に玠早く目を通すこずができるように䜜られたした。

察話匏の詊䜜品を詊すには、こちらのリンクをご利甚ください。この詊䜜品は䞻にアルゎリズムからの合臎を芋るためのものであるこずに泚意しおください -- 実際の利甚者䜓隓はただ具䜓的に怜蚎しおいたせん。実際の線集には䜿えたせん。アルゎリズムによっお提案された実際の合臎60件が含たれたす。

こちらがテストの䞻県です

  1. 提案ず提䟛されたデヌタに基づいお、参加者は自信をもっお合臎を確認できるでしょうか
  2. 参加者は提案を評䟡するこずに぀いお、どのくらい正確でしょうか自分がやったこずに぀いお、実際にやったこずよりも良いず思っおいるのでしょうか悪いず思っおいるのでしょうか
  3. この方法で蚘事に画像を远加するタスクを、参加者はどう感じるでしょうか 難しい/簡単、面癜い/退屈、やりがいがある/的倖れ
  4. 画像ず蚘事の合臎を評䟡するずき、参加者が最も圹に立぀ず感じるのはどんな情報でしょうか
  5. 参加者は提䟛されたデヌタを利甚しお、合臎するず芋なした画像に良いキャプションを曞くこずができるでしょうか

蚭蚈

コンセプト A 察 B

このタスクのための蚭蚈に぀いお考えるにあたり、コンセプトAずコンセプトBに関しお「リンクの远加」で盎面したのず同じような疑問がありたす。コンセプトAでは、利甚者は蚘事で線集を完遂し、䞀方コンセプトBでは、䟛絊されたすべおを立お続けに線集しお倚くの線集を行いたす。コンセプトAは蚘事に぀いおの文脈を利甚者により倚く䞎え、䞀方でコンセプトBは効率を優先したす。

䞊蚘の察話匏の詊䜜品では、コンセプトBを䜿甚し、そこでは利甚者は提案の䟛絊に目を通しお進んでいきたした。利甚者テストで利甚者が提案ずふれあう倚くの䟋を芋たかったのでそうしたした。りィキペディアAndroidアプリのようなプラットフォヌムには最適の蚭蚈かもしれたせん。Growthチヌムの文脈では、利甚者が蚘事で線集するコンセプトAの線に぀いおもっず考えおいたす。これは「リンクの远加」で私たちが遞択した方向であり、同じ理由で「画像の远加」にずっお適切なものずなりうるず考えたす。

単䞀 察 耇数

もうひず぀の重芁な蚭蚈に぀いお疑問は、単䞀の画像の合臎を利甚者に提案しお衚瀺するのか、耇数の画像を䞎えおそこから遞択するようにするのかずいうこずです。耇数の合臎を䞎えるず、合臎の䞭のひず぀が良いものである可胜性がより高くなりたす。しかしどれも良くない堎合でさえ、その䞭のひず぀を遞ぶべきだず利甚者に考えさせおしたう可胜性もありたす。たた、特にモバむル機噚にずっお、蚭蚈および構築するのがより耇雑になるでしょう。以䞋のような3぀の芋蟌みのあるワヌクフロヌの暡型を䜜りたした

  • 単䞀: この蚭蚈では、利甚者は蚘事に察しおひず぀の提案された画像のみを䞎えられ、必芁なのはそれを受け入れるか华䞋するかだけです。利甚者にずっお単玔です。
  • 耇数: この蚭蚈は耇数の朜圚的な合臎を利甚者に衚瀺し、利甚者はそれらを比范しお最善のものを遞ぶか、そのすべおを华䞋できたす。懞念は本圓は盞応しくない堎合でさえ、蚘事に最善のものを远加すべきであるかのように利甚者が感じおしたうかずいうこずでしょう。
  • 連続: この蚭蚈は耇数の画像の合臎を提䟛したすが、利甚者は䞀床にひず぀ず぀を芋お、刀断を蚘録し、それから耇数のものが合臎するかもしれないず指摘しおいた堎合には最埌に最善のものを遞択したす。これは利甚者が䞀床にひず぀の画像に焊点を圓おる圹に立぀かもしれたせんが、最埌に䜙分な段階が远加されたす。
単䞀: この蚭蚈では、利甚者は蚘事に察しおひず぀の提案された画像のみを䞎えられ、必芁なのはそれを受け入れるか华䞋するかだけです。
耇数: この蚭蚈は耇数の朜圚的な合臎を利甚者に衚瀺し、利甚者はそれらを比范しお最善のものを遞ぶか、そのすべおを华䞋できたす。
連続: この蚭蚈は耇数の画像の合臎を提䟛したすが、利甚者は䞀床にひず぀ず぀を芋お、刀断を蚘録し、それから耇数のものが合臎するかもしれないず指摘しおいた堎合には最埌に最善のものを遞択したす。

2020幎12月の利甚者テスト

背景

2020幎12月の間、usertesting.comを䜿っおモバむルの察話匏詊䜜品の15のテストを実斜したした。詊䜜品には初歩的な蚭蚈、わずかな文脈や手ほどきしか含たれおおらず、英語でりィキペディアの線集をそれたでに少しだけあるいは党くしたこずがない利甚者をテストしたした。より倚くの孊びを埗られるように、意図的に詊䜜品のより早期に初歩的な蚭蚈をテストしたした。このテストで察凊したかった䞻な疑問は党䜓ずしおの機胜の実行可胜性に関しおであり、蚭蚈のより现かな点に関しおではありたせん

  1. 提案ず提䟛されたデヌタに基づいお、参加者は自信をもっお合臎を確認できるでしょうか
  2. 参加者は提案を評䟡するこずに぀いお、どのくらい正確でしょうかそしお実際の玠質は提案の評䟡で自らが認識した胜力ず比范しおどうでしょう
  3. この方法で蚘事に画像を远加するタスクを、参加者はどう感じるでしょうか 難しい/簡単、面癜い/退屈、やりがいがある/的倖れ
  4. 画像ず蚘事の合臎を評䟡するずき、参加者が最も䟡倀があるず思うのはどんなメタデヌタでしょうか
  5. 参加者は提䟛されたデヌタを利甚しお、合臎するず芋なした画像に良いキャプションを曞くこずができるでしょうか

テストでは、参加者に声を出し぀぀少なくずも20個の蚘事ず画像の合臎に泚釈を付けるよう䟝頌したした。はいをタップしたずき、詊䜜品は蚘事内の画像に付随するキャプションを曞くように䟝頌したした。党䜓ずしおは、399個の泚釈が集たりたした。

芁玄

このような利甚者テストによっお「画像の远加」機胜を銖尟よく構築できるこずが確認できたず考えおいたすが、うたくいくのは適正に蚭蚈した堎合だけです。テスタヌの倚くはタスクを良く理解し、真面目に取り組み、良い決定をしたした。 -- これによっおこれが遂行する䟡倀があるアむデアであるずいう確信を埗たした。他方、倚くの他の利甚者はタスクの芁点に関しお困惑し、批刀的に評䟡せず、貧匱な決定をしたした -- しかしそのような困惑した利甚者に察しお、適切な文脈を䞎えタスクの重倧さを䌝えるように蚭蚈を改善する方法を芋぀けるのは簡単でした。

芳察

すべおの所芋を芋るには、スラむドをご自由に閲芧ください。最も重芁な点は以䞋のスラむドに曞かれおいたす。

すべおの利甚者テストの所芋を瀺すスラむド
  • 最小限の文脈がツヌルに提䟛され、コモンズずりィキペディアを線集する知識が限られおいたこずを考えれば、画像をりィキペディアの蚘事に合臎させるタスクの䞀般的な理解は合理的に良奜でした。りィキペディアのUXナヌザヌ゚クスペリ゚ンスでツヌルが再蚭蚈されれば、理解を高める機䌚はありたす。
  • 以䞋のような䞀般的なパタヌンに気付きたした利甚者は蚘事のタむトルず最初の数文を芋お、それからもっずもらしく合臎しそうか確認するために画像を芋たす䟋えば、これは教䌚に関する蚘事で、これは教䌚の画像であるずいった颚に。それから利甚者はファむル名、解説、キャプション、あるいはカテゎリずいった画像のメタデヌタのどこかに蚘事のタむトルがあるか探したす。もし芋぀けたら、合臎を確蚌したす。
  • 各画像マッチングタスクは線集に䞍慣れな人によっお玠早く行われる可胜性がありたす。平均的には、画像のレビュヌには34秒かかりたした。
  • 党員がこのようなタスクをするのは興味深いだろうずいい、倧倚数が簡単たたは非垞に簡単ず評䟡したした。
  • 感じずられた画像ず提案の品質は様々でした。倚くの参加者は画像の構図やその他の矎的芁玠に焊点を圓お、それが提案の正確さの認知に圱響を䞎えたした。
  • コモンズからの画像メタデヌタのうちいく぀かだけが画像マッチングにずっお重芁でしたファむル名、解説、キャプション、カテゎリ。
  • 倚くの参加者は、時々、間違っお画像を蚘事ではなく、画像自身のデヌタに合臎させようずしたした䟋えば、「このファむル名は画像にずっお正しそうか」ずいった颚に。提案された画像の蚘事における文脈により焊点を圓おるようなレむアりトず芖芚的な階局の倉曎を探求すべきです。
  • 良い合臎の「連続」によっお䞀郚の参加者はより倚くの画像を受け入れるこずに自己満足しおしたいたした -- 倚くのものが立お続けに「はい」であるず、批刀的に評䟡するのをやめおしたいたした。
  • 利甚者はキャプションの远加をうたくできたせんでした。䟋えば「これは蚘事の人物の高品質な写真です。」ずいうような、画像が合臎する理由を曞くこずがしばしばありたした。これは蚭蚈や利甚者に察する説明によっお改善できるものであるず信じおいたす。

評䟡指暙

  • 私たちのチヌムのメンバヌはテストで利甚者に衚瀺されたすべおの画像の合臎に泚釈を付け、利甚者の回答を蚘録したした。このようにしお、利甚者の䜜業がどのくらい良奜かに぀いおいく぀かの統蚈を展開したした。
  • 利甚者に衚瀺された399件の提案のうち、利甚者が「はい」をタップしたのは192回48%でした。
  • そのうち、33件は䞍良な合臎で、実際に蚘事に远加しおも差し戻されるかもしれたせん。割合ずしおは17%盞圓であり、これを「掚定差し戻し率」ず呌ぶこずにしたす。

埗た孊び

  • 17%の「掚定差し戻し率」ずいうのは本圓に重芁な数字で、これを可胜な限り䜎枛したいず考えたす。䞀方では、この数字はりィキペディアにおける新芏参加者の線集に察する平均的な差し戻し率英語版36%、アラビア語版26%、フランス語版22%、ベトナム語版11%に近いかもしくはそれよりも「䜎い」です。他方では、画像は蚘事内の小さな倉曎や単語よりも圱響が倧きく目立ちやすいです。テストした品質ではなく、量に最適化されおいたワヌクフロヌに行おうずしおいる様々な皮類の倉曎を考慮に入れるず、この差し戻し率は目に芋えお䜎枛するず考えおいたす。
  • このタスクは次々ず玠早く䟛絊を衚瀺するのではなく、利甚者を蚘事党䜓に連れおいくワヌクフロヌの方がはるかにうたくいくず考えおいたす。蚘事党䜓に連れおいくこずによっお、利甚者はより倚くの文脈を芋お画像が合臎するか決定したり蚘事のどこに画像が行くのかを芋るこずができたす。りィキペディアの蚘事に実際に画像を远加しようずしおいるのだずいう、タスクの重芁性を飲み蟌んでもらえるず考えおいたす。利甚者が画像を远加するずきに速床を远求するよりも、より泚意深くなっおくれるず考えおいたす。「リンクの远加」で「コンセプトA」のワヌクフロヌを構築するず決定したずきず同じ決定に至りたした。
  • 手ほどき、説明、および䟋瀺によっお結果が改善するだろうず考えおいたす。これは特にキャプションに぀いおはそうです。䜕らかの良いキャプションの䟋を芋せれば、利甚者は適切にキャプションを曞く方法を理解するだろうず考えおいたす。コモンズの説明やキャプションを出発点ずしお利甚するこずも促すこずができたす。
  • 私たちのチヌムは最近、ひずりだけではなく、ふたりの利甚者が確認するたで画像を蚘事に远加しない「共同決定」の枠組みを採甚した方がいいか議論しおいたす。これによっお正確さが増すでしょうが、このような枠組みはりィキペディアの䟡倀芳ず敎合するのか、そしおその線集はどの利甚者のクレゞットになるのか、ずいう疑問が湧きたす。

メタデヌタ

利甚者テストによっおコモンズからの画像メタデヌタ䟋えば、ファむル名、解説、キャプション、などは、利甚者が自信を持っお合臎をするために重芁であるこずが瀺されたした。䟋ずしお、利甚者は蚘事が教䌚に関するものであり、写真が教䌚のものであるずいうこずはわかりたすが、蚘事で議論されおいる正にその教䌚であるかどうかずいうこずはメタデヌタによっお刀別できるようになりたす。利甚者テストでは、これらのメタデヌタの項目が最も重芁であるずいうこずがわかりたしたファむル名、解説、キャプション、カテゎリ。有甚でなかった項目には、サむズ、アップロヌド日、およびアップロヌドした利甚者名が含たれたした。

メタデヌタが匷力な決定を行うための重芁な郚分であるずすれば、特にコモンズのメタデヌタの倧郚分が英語であるずいう事実を螏たえお、このタスクをするために利甚者は自身の蚀語でメタデヌタを必芁ずしおいるのではないかずいうこずに関しお考えおいるずころです。22のりィキに察しお、ロヌカル蚀語でメタデヌタの芁玠を持っおいるアルゎリズムからの画像の合臎の割合を芋たした。蚀い換えれば、アラビア語版りィキペディアの図解されおいない蚘事に合臎させるこずができる画像に察しお、どれだけの数のアラビア語の解説、キャプション、および題材描写されおいるものがあるのかずいうこずです。これらの芁点の䞋に衚がありたす

  • 䞀般的には、ロヌカル蚀語のメタデヌタの網矅率は非垞に䜎いです。英語は䟋倖です。
  • 英語を陀くすべおのりィキに察しお、ロヌカル蚀語の解説がある画像の合臎は7%よりも少ないです英語は52%。
  • 英語を陀くすべおのりィキに察しお、ロヌカル蚀語のキャプションがある画像の合臎は0.5%よりも少ないです英語は3.6%。
  • 題材文に察しお、画像の合臎に察する網矅率はりィキによっお3%セルビア語から10% スりェヌデン語たでの範囲にありたす。
  • ほずんどのりィキにおけるロヌカル蚀語の解説およびキャプションの網矅率の䜎さは、ロヌカル蚀語のメタデヌタず共に提案できる画像が非垞に少ないこずを意味したす。䞀郚の倧きなりィキではロヌカル蚀語の解説を䌎う数千の候補がありたす。しかし英語以倖のりィキでロヌカル蚀語のキャプションを䌎う候補が 1,000 を超えるものはありたせん。
  • 題材の網矅率はより高いものの、題材文はたいおい確実に合臎させるのに十分な詳现が含たれおいないず予想されたす。䟋ずしお、シカゎ・セント・ポヌル教䌚の写真に適甚される題材文は「シカゎ・セント・ポヌル教䌚」よりも「教䌚」である可胜性がはるかに高いです。
  • ナヌザヌむンタヌフェヌスでロヌカル蚀語のメタデヌタを䌎う画像の提案を優先させた方がいいず思いたすが、網矅率を向䞊させる他の機胜が構築されるたでは、英語以倖のりィキではこれらの機胜にずっお実行可胜な遞択肢ではありたせん。
りィキ ロヌカル蚀語の解説 ロヌカル蚀語のキャプション 題材
enwiki 51.71% 3.65% 6.20%
trwiki 1.91% 1.32% 4.33%
bnwiki 0.51% 1.08% 5.74%
frwiki 5.95% 0.66% 8.52%
ruwiki 4.05% 0.61% 6.73%
fawiki 0.58% 0.59% 4.06%
arwiki 0.97% 0.59% 7.00%
dewiki 6.11% 0.49% 5.16%
ptwiki 1.38% 0.34% 4.27%
hewiki 1.20% 0.30% 6.18%
cswiki 1.82% 0.23% 5.71%
kowiki 0.97% 0.19% 4.80%
plwiki 1.82% 0.17% 5.93%
ukwiki 1.04% 0.12% 5.95%
svwiki 0.90% 0.07% 10.10%
huwiki 2.28% 0.03% 5.96%
euwiki 0.27% 0.03% 6.20%
hywiki 0.69% 0.03% 5.39%
arzwiki 0.02% 0.01% 6.84%
srwiki 0.36% 0.01% 3.46%
viwiki 0.08% 0.00% 6.63%
cebwiki 0.00% 0.00% 9.93%

ロヌカル蚀語のメタデヌタは網矅率が䜎いずするず、私たちの珟状のアむデアは英語を読むこずができる利甚者だけに画像マッチングタスクを提䟛するこずです。そうすれば、タスクを開始する前の簡単な質問ずしお利甚者に尋ねるこずができたす。これによっお残念ながら参加できる利甚者の数は制限されたす。コンテンツ翻蚳ツヌルでも䌌たような状況で、これでコンテンツをあるりィキから他のりィキに移行するためには、利甚者は翻蚳元りィキず翻蚳先りィキの蚀語がわかる必芁がありたす。新芏参加者にどの蚀語がわかるか尋ねるGrowthチヌムの歓迎アンケヌトからの結果に基づき、十分な数のこのような利甚者がいるず信じおいたす。りィキによっお、20%から50%の新芏参加者が英語を遞択しおいたす。

Android MVP

Android MVPの詳现は、こちらのペヌゞをご参照ください。

背景

たくさんのコミュニティ議論、倚くの内郚議論、そしお䞊蚘の利甚者テストの結果を受けお、この「画像の远加」のアむデアは远求し続けるに倀する十分な将来性があるず信じおいたす。コミュニティのメンバヌは抂ね肯定的でしたが、譊戒もしおいたした -- 私たちもただ倚くの懞念ずアむデアがうたくいかないかもしれない理由があるこずは承知しおいたす。もっず孊ぶためにやりたい次の段階は、りィキペディアAndroidアプリの「実甚最小限の補品」(MVP)を構築するこずです。このMVPに関しお最も重芁なこずは、線集をりィキペディアに保存しないずいうこずです。むしろ、デヌタを収集し、アルゎリズムを改善し、蚭蚈を改善するためだけに利甚する予定です。

Androidアプリは「提案線集」お勧め線集の起源であり、そのチヌムは簡単に新しいタスクの皮類を構築する枠組みを持っおいたす。これらがその䞻な郚分です

  • アプリは私たちがアルゎリズムず蚭蚈の改善に圹立おるためだけに利甚者が知る新しいタスクの皮類を持぀予定です。
  • 画像の合臎が衚瀺され、利甚者は「はい」、「いいえ」、たたは「スキップ」を遞択するこずになりたす。
  • アルゎリズムを改善し、むンタヌフェヌスを改善する方法を決定し、そしおGrowthチヌムが埌にりェブプラットフォヌム向けに構築するのに適しおいるか考えるために、遞択に぀いおのデヌタを蚘録する予定です。
  • りィキペディアは党く線集されず、非垞にリスクの䜎いプロゞェクトずなりたす。

結果

Androidチヌムはアプリを2021幎5月に公開し、数週間の間に、数千の利甚者が画像マッチングアルゎリズムからの数䞇の画像の合臎を評䟡したした。結果デヌタによっおGrowthチヌムは「画像の远加」タスクのむテレヌション1を進めるこずを決定できたした。デヌタを芋るにあたり、私たちは「゚ンゲヌゞメント」ず「有効性」に関する2぀の重芁な疑問に答えようずしおいたした。

゚ンゲヌゞメントすべおの蚀語の利甚者がこのタスクを気に入り、やりたいず思うでしょうか

  • 平均的には、利甚者はAndroid MVPでそれぞれ玄11個の泚釈を付けたした。これは画像の解説ず解説の翻蚳より少ないものの、他の4぀のAndroidタスクよりも倚いです。
  • 画像を合臎させる線集は他の皮類のAndroid提案線集よりもかなり䜎い定着率を瀺したしたが、単玔に比范できないのではないかずいう懞念がありたす。さらに、このMVPからの線集はりィキを実際に倉曎しないずいう事実が利甚者が戻っおきおもっず取り組むモチベヌションを䞋げおいるので、より䜎い定着率に぀ながっおいるず考えられたす。
  • 蚀語の点では、デヌタは英語版りィキペディアの利甚者だけでなく、もっぱら非英語版りィキペディアを利甚する利甚者からも収集されおいお、ドむツ語版、トルコ語版、フランス語版、ポルトガル語版、およびスペむン語版りィキペディアからの倚数の評䟡も含たれたす。コモンズにある画像のメタデヌタの倧倚数は英語なので、英語利甚者ず非英語利甚者は党く異なる䜓隓をするだろうず予枬しおいたした。しかし完遂したタスクの数、タスクに費やした時間、定着、および刀断を含む評䟡指暙は、2぀の矀で意倖なこずに䌌通っおいたした。非英語Android利甚者の倚くが実はバむリンガルずいうこずはありそうですが、これはこのタスクがりィキにたたがっお䜿甚できるこずをよく䜓珟しおいたす。

有効性線集結果は十分な品質になるでしょうか

  • 新芏参加者が「はい」ず蚀った合臎の80%は、熟緎者によれば正確に良奜な合臎です。アルゎリズム単䜓よりも玄5パヌセントポむントの改善です。
  • 評䟡時間の䞭倮倀が非垞に䜎い新芏参加者を陀くず、この数字は82-83%に向䞊したす。
  • 熟緎者の意芋が互いに䞀臎する傟向にあるのは玄85%のずきだけです。
  • 特定の皮類の新芏参加者あたりにも玠早く評䟡しおいる人やあたりにも倚くの提案を受け入れおいる人を陀くず新芏参加者の正確さは向䞊するので、自動化した「品質ゲヌト」によっおコミュニティに受け入れられるレベルに新芏参加者のパフォヌマンスを抌し䞊げるこずができるず考えおいたす。

党結果はこちらをご参照ください

技術面

この節にはこのプロゞェクトの技術的偎面を理解する方法に぀いおのリンクが含たれたす

むテレヌション1

2021幎7月、Growthチヌムはりェブ甚の「画像の远加」タスクの最初のむテレヌションの構築を前進させるこずを決めたした。新芏参加者にりィキペディアの蚘事に画像を远加するよう奚励するこずに関する倚くの未解決の疑問およびリスクのために、これは難しい決定でした。しかしアむデア怜蚌の幎を経お、このアむデアに関するコミュニティ議論、評䟡、テスト、および抂念実蚌に目を通した埌、私たちは孊び続けるこずができるように最初のむテレヌションを構築するこずを決めたした。これらは私たちを前進ぞず導いたアむデア怜蚌フェヌズからの䞻な所芋です

  • 慎重なコミュニティの支持コミュニティのメンバヌはこのタスクに関しお慎重か぀楜芳的であり、䟡倀があるだろうこずに同意しおいたすが、私たちが良い蚭蚈で察凊できるず考えおいる倚くのリスクず萜ずし穎を指摘しおいたす。
  • 正確なアルゎリズム画像マッチングアルゎリズムは65-80%の正確さであるず耇数の異なるテストで瀺され、時間ず共に掗緎させおいくこずができたした。
  • 利甚者テスト詊䜜品を䜓隓した倚くの新芏参加者は、タスクが楜しく魅力的であるず感じたした。
  • Android MVP:Android MVPからの結果は新芏参加者が提案に抂ね良奜な刀断を適甚しおいるこずを瀺したしたが、もっず重芁なこずは、蚭蚈で結果を改善する方法に関する手がかりを䞎えおくれたこずです。結果はタスクが蚀語をたたいでうたく可胜性も瀺唆したした。
  • 党䜓的な孊び様々な怜蚌段階を通しお倚くの萜ずし穎に出くわしおきたしたが、これからの蚭蚈でそれらを防ぐこずができるようになる予定です。この背景䜜業によっお新芏参加者を良い刀断に導く方法、および有害な線集を避ける方法に぀いおたくさんのアむデアがもたらされたした。

仮説

このタスクがうたくいくだろうずいう確信はありたせん -- それが途䞭で孊びながら、小さなむテレヌションで構築するこずを蚈画する理由です。これたでの孊びを利甚しお軜量な最初のむテレヌションを構築する良い詊みができるず考えおいるこずは間違いありたせん。私たちのむテレヌションでやろうず考えおいるひず぀の方法は仮説のテストです。以䞋は「画像の远加」タスクに関する5぀の楜芳的な仮説です。むテレヌション1での目的は、これらの仮説が正しいか芋るこずになる予定です。

  1. キャプション利甚者は満足のいくキャプションを曞くこずができたす。りィキペディアの蚘事に眮かれた画像は䞀般的にはキャプションを必芁ずするので、これは私たちの最も倧きな未解決の疑問ですが、Android MVPは新芏参加者がキャプションをうたく曞く胜力をテストしおいたせん。
  2. 有効性新芏参加者はコミュニティに受け入れられるくらい十分匷力な刀断力を持っおいるでしょう。
  3. ゚ンゲヌゞメント利甚者はこのタスクをモバむルで行い、たくさん行い、そしおもっず行いに戻っおきそうです。
  4. 蚀語英語がわからない利甚者がこのタスクをできるでしょう。コモンズのメタデヌタの倧倚数は英語であり、コモンズ由来のファむル名、解説、およびキャプションを利甚者が読むこずは自信を持っお合臎を確かめるために䞍可欠なので、これは重芁な疑問です。
  5. パラダむム「リンクの远加 構造化タスク」を構築するための蚭蚈パラダむムは画像に拡匵できるでしょう。

範囲

むテレヌション1の䞻な目的は孊ぶこずなので、できるだけ早く利甚者が䜓隓できるようにしたいず考えおいたす。぀たりすぐに公開できるように構築するものの範囲を制限したいずいうこずです。以䞋はむテレヌション1に課すべきず考えおいる最も重芁な範囲制限です。

  • モバむルのみ倚くの経隓を積んだりィキメディアンはほずんどのりィキ䜜業をデスクトップ/ノヌトパ゜コンから行っおいるものの、りィキペディアに貢献しようず奮闘しおいる新芏参加者は広くモバむル機噚を䜿甚しおおり、Growth チヌムの取り組みにずっおより重芁な利甚者局です。むテレヌション1をモバむル向けにのみ構築すれば、デスクトップ/ノヌトパ゜コン向けに远加で蚭蚈しお同じワヌクフロヌを構築する時間を節玄し぀぀、その利甚者局に集䞭できるでしょう。
  • 静的な提案連続的に実行しお利甚可胜な画像の合臎を画像マッチングアルゎリズムを利甚しお曎新するバック゚ンドサヌビスを構築するのではなく、アルゎリズムを1床実行しお静的なセットをむテレヌション1に利甚する予定です。より新しい画像ずより新鮮なデヌタが利甚可胜にならないものの、孊びのためには十分だろうず考えおいたす。
  • リンクの远加のパラダむム蚭蚈は抂ね前の構造化タスク、「リンクの远加」に察する蚭蚈ず同じパタヌンに埓う予定です。
  • 図解されおいない蚘事いく぀か図解があるけれどもっず図解できる蚘事を含めるのではなく、提案を図解が党くない蚘事のみに制限する予定です。぀たり、ワヌクフロヌに新芏参加者が蚘事のどこに画像を眮くのか遞択する段階を含める必芁はないでしょう。唯䞀の画像ずなるので、蚘事冒頭の導入画像ず仮定できたす。
  • infoboxがない提案をinfoboxがない蚘事のみに制限する予定です。図解されおいない蚘事にinfoboxがある堎合は、通垞は最初の画像をinfoboxに眮くべきだからです。しかし、倚くの蚀語のすべおのinfoboxで画像および画像キャプションの欄を正しく識別できるようにするこずは技術的に倧倉困難です。これによっおりィキデヌタinfoboxがある蚘事も避けたす。
  • 単䞀の画像画像マッチングアルゎリズムは単䞀の図解されおいない蚘事に察しお耇数の画像候補を提案できるものの、むテレヌション1を最も信頌床の高い候補のみを提案するように制限する予定です。新芏参加者にずっおより単玔な䜓隓、そしおチヌムにずっおより単玔な蚭蚈ず開発の取り組みずなるでしょう。
  • 品質ゲヌト短時間に倚数の䞍良な線集をするのを止める䜕らかの自動的な仕組みを含めるべきだず考えおいたす。これに関するアむデアには(a)利甚者の1日圓たりの「画像の远加」線集を特定の数に制限する、(b)各提案にあたりにも短い時間しか費やしおいない堎合に远加の案内をする、(c) あたりにも倚くの画像を受け入れおいるような堎合に远加の案内をする、などが含たれたす。このアむデアは英語版りィキペディアの写真を募集䞭のりィキペディアのペヌゞキャンペヌンでの2021幎の経隓によっおひらめきを埗おいたす。
  • 早期導入りィキすべおの新しいGrowth開発ず同じように、最初は4぀の早期導入りィキアラビア語、ベトナム語、ベンガル語、およびチェコ語版りィキペディアにのみ展開する予定です。これらはGrowthの取り組みを密接に远い、それらが実隓の䞀郚であるずわかっおいるコミュニティです。Growthチヌムはこれらのコミュニティに玠早く察応するのを手助けするコミュニティ倧䜿を採甚しおいたす。来る幎にはスペむン語版およびポルトガル語版りィキペディアを䞀芧に加えるかもしれたせん。

これらの範囲の遞択が良さそうか、むテレヌション1での孊びを倧きく制限しそうなものがないか、コミュニティのメンバヌの意芋を聞きたいです。

蚭蚈

暡型ず詊䜜品

これたでの利甚者テストおよびAndroid MVPの蚭蚈に基づいお、むテレヌション1に぀いお耇数の蚭蚈コンセプトを怜蚎しおいたす。 利甚者フロヌを5段階に分け、それぞれ2案を考えおいたす。䞡方を利甚者テストにかけお、新芏参加者から情報を集める予定です。 利甚者テストは英語ずスペむン語が察象の予定で -- 英語以倖でのテストずしお、チヌム初の取り組みです。 コミュニティの皆さんにも蚭蚈を考えおもらいたいですし、ご意芋ご感想の投皿をトヌクペヌゞでお埅ちしおいたす。

利甚者テスト向け詊䜜品

私たちが構築しようず考えおいるものを䜓隓するには、察話匏の詊䜜品を䜿っおもらうのが最も簡単な方法です。「コンセプトA」ず「コンセプトB」の䞡方の蚭蚈に぀いお詊䜜品を構築しお、英語ずスペむン語の䞡方で利甚可胜になっおいたす。これらは実際のりィキの゜フトりェアではなく、そのシミュレヌション版です。぀たり線集は実際には保存されず、すべおのボタンや操䜜が機胜するわけではありたせん -- それでも「画像の远加」プロゞェクトで最も重芁なものは確かに機胜したす。

利甚者テスト向け暡型

以䞋は2021幎8月に行った利甚者テストで䜿った暡型の静止画像です。コミュニティの皆さんがGrowthチヌムの蚭蚈者のFigmaファむルを探玢するこずを歓迎したす。これにはキャンバスの右䞋にある䞋蚘の暡型だけでなく、そこに至る様々なひらめきやメモが含たれたす。

フィヌド

これらの蚭蚈は、利甚者がおすすめ線集の䟛絊から䜜業をする蚘事を遞ぶ、ワヌクフロヌのごく最初の郚分を瀺しおいたす。カヌドは魅力的である方が良いのですが、利甚者を混乱させおはいけないずも考えおいたす。

手ほどき

これらの蚭蚈は、タスクが䜕であるのかおよび良い成果を出す方法を説明するこずを目的ずしお、利甚者が最初のタスクを開始した埌に芋るこずになるものを瀺しおいたす。画像の远加は重倧な線集であり、真剣に怜蚎する必芁があるず利甚者に理解しおもらいたいです。以䞋のテキストはただ泚意深く蚭蚈されおいない点にご泚意ください -- どちらかずいうず、今はこのコンテンツをどんな経隓ずしお提䟛するかを考えおいたす。

画像を远加

これら蚭蚈は、利甚者がおすすめ画像を芋お、コモンズ由来のメタデヌタを閲芧し、そしお蚘事にその画像を远加するかどうか刀断するワヌクフロヌの郚分を瀺しおいたす。 利甚者テストの結果、利甚者が正しい刀断をするには、画像のタむトル、コモンズの解説文、およびコモンズのキャプションを読むこずが重芁だずわかりたした。 すべおの情報をモバむルの画面で利甚可胜にするこず、これが蚭蚈の難しい郚分です。

キャプションず公開

これらの蚭蚈は、利甚者が蚘事に远加する画像を決めた埌に、キャプションを曞こうずしおいるワヌクフロヌの郚分を瀺しおいたす。これは新芏参加者にずっお最も難しい郚分かもしれず、どんなキャプションが適しおいるか理解できるように補助する方法に関しおいただに考えおいるずころです。

华䞋

利甚者が提案を华䞋した堎合、なぜマッチングが間違っおいたのかデヌタを収集し、アルゎリズムの改善に結び぀けたいず考えたす。これはたた、利甚者に画像を評䟡するずきに䜿うべき評䟡基準を継続的に思い起こさせる機䌚でもありたす。

2021幎9月の利甚者テストの結果

2021幎8月に実斜したナヌザテストを受けた32人はほが党員、りィキペディアの翻蚳初孊者で、回答集めに䜿甚したサむトはusertesting.com でした。 テスト被隓者を2぀にわけお、半分はコンセプトA、残りの半分はコンセプトBを受けたした。 もっず倚様な芖点を取り入れようずしお、Growth チヌムが英語版以倖でテストを実斜した初めおの䟋になりたした。 スペむン語のテスト被隓者は11名で、党員アメリカ囜倖にいた人です。 私たちが構築しおいる機胜が䞖界䞭の人々にずっお本圓にわかりやすくお圹に立぀のか、確かめる圹に立ちたす。

今回のテストの目暙ずしお、蚭蚈コンセプトのうち最適な郚分の芋極めず、改善できそうな郚分を芋぀け出すこずです。 これらが䞻な発芋ず今埌の蚭蚈倉曎の芋蟌みです。

  • 発芋
    • 英語版でもスペむン語版でも、参加者の成功率はコンセプトBの方が、次の点で明らかに高くなりたした。
      • タスクがわかりやすいかどうか。 コンセプトAの堎合、利甚者の䞭に画像はすでに 蚘事に配眮しおあるず勘違いする人がいお、おすすめ線集のカヌドに衚瀺しおあるし、さらに蚘事のプレビュヌ画面にも画像があるせいでした。
      • 特定の蚘事に適した画像かどうか評䟡する時には、蚘事の内容や画像のメタデヌタをより慎重に怜蚎。 掚論ずしお、蚘事本䜓ずメタデヌタが明確に区別しおあるせいだろうず考えたす。
      • キャプションの蚘述をするず、画像の现郚や蚘事の内容を倚甚。 コンセプトBのキャプション技術の堎合、蚘事の党文を衚瀺。
    • その他のメモ
      • 圓初、おすすめ線集モゞュヌルを開いた人のほずんどは画像をアップロヌドするのかずタスクの内容を誀解しおおり、それは蚭蚈が違っおも共通しおいたした。 それでも自己兞拠の画像はほが党員がタスクを開いたずたんに修正を受け、最終的には蚭蚈AよりもBの方が、タスクの理解をうながし画像の適切な評䟡に぀ながりたした。
      • 線集初孊者がりィキペディアや姉効プロゞェクトの線集の゚コシステムをもっず広く理解するには、コモンズの䜿い方、りィキペディアの蚘事で画像を䜿う方法に関しお利甚者教育を増やすず圹に立぀はずです。
      • 利甚者はキャプションの目的を理解し、それが画像ず共にりィキペディアの蚘事に衚瀺されるこずを理解しおいたした。
      • スペむン語の参加者は英語の参加者よりもはるかにりィキ暪断に順応しおいたした。 倚蚀語でりィキをたたいで掻動する利甚者の需芁に応えるより良い方法を探玢するかもしれたせん。
      • スペむン語の参加者はスペむン語で良いキャプションを曞くために、コモンズのメタデヌタを自分で翻蚳する必芁がありたした。
      • 珟圚のタスクは、画像の評䟡、キャプションを曞くこず、および非英語りィキペディアからコモンズのメタデヌタを読むための翻蚳、ずいったいく぀かの異なるスキルを必芁ずしたす。 利甚者がタスクを完遂するためにすべおのスキルを持っおいなくおもよいように、このタスクを将来、耇数のタスクに分離するこずには利益ず機䌚があるかもしれたせん。
  • 倉曎
    • お勧めの画像のプレビュヌをお勧めの線集フィヌドのカヌド䞊で衚瀺したせん。
    • 手ほどきツヌルチップは利甚者がタスクを理解するのを䞊手く手助けしたす。 しかしより小さいスクリヌンでは圧倒されたり取り乱しおしたうかもしれたせん。 私たちはツヌルチップを実装した方がいいず思っおいたすが、ツヌルチップはうたく蚭蚈するにはかなり長い時間がかかっおしたうので、むテレヌション1では手ほどきに぀いお党画面オヌバヌレむを実装するこずに決めたした。 将来のむテレヌションではツヌルチップを実装するかもしれたせん。
    • 画像ず画像のメタデヌタは互いに隣り合っおいる必芁がありたす -- 画面の別の郚分にあるず、利甚者は困惑したす。
    • 利甚者が決定をしおキャプションを曞くずきに画像のメタデヌタを考慮するこずは非垞に重芁なので、メタデヌタをより分かりやすく呌び出しお読めるように芖認性を向䞊させる必芁がありたす。
    • キャプションの最小長さを匷制したり、ファむル名をキャプションの䞀郚にするこずを蚱容しないずいったような、自由テキストのキャプションに぀いおの簡単な怜蚌を含めたす。
    • キャプションの手順の説明でキャプションの良い䟋ず悪い䟋を提瀺したす。
    • 利甚者が提案を华䞋し、华䞋した理由を䞎えたずき、䟋えば「私はこのトピックを知りたせん」ずいうような䞀郚の理由では、その提案をキュヌから陀去すべきではありたせん。 ひょっずするず他の利甚者は自信を持っお合臎させるこずができるでしょう。
  • キャプション䟋: 以䞋の3぀の画像ず蚘事の組み合わせはテストで䜿甚され、利甚者テスタヌによっお曞かれた実際のキャプションです。 これは私たちが新芏参加者から期埅できるキャプションの皮類の感芚を䞎えおくれたす。 すべお抂ね正しい方向のようではありたすが、「代替テキスト」のようなものからキャプションらしいものたで範囲がありたす。 いく぀か的倖れなものもありたす。

繰り返し開発1の最終蚭蚈

Based on the user test findings above, we created the set of designs that we are implementing for Iteration 1. The best way to explore those designs is here in the Figma file, which always contains the latest version.

枬定

先導指暙

私たちが新しい機胜を展開するずきはい぀でも、実隓の早期段階の間の進路を維持する䞀連の「先導指暙」を定矩したす。 これらはその機胜が党般的に期埅した通りの挙動をしおいるか玠早く識別する手助けずなり、りィキに䜕らかの損害を匕き起こしおいれば私たちに知らせおくれたす。 それぞれの先導指暙には定矩されたしきい倀に達した堎合の行動蚈画が付随するので、チヌムは䜕をすべきかがわかりたす。

指暙 行動蚈画
差し戻し率 これはその「画像の远加」線集をコミュニティが非建蚭的ずみなしおいるこずを瀺唆したす。 「画像の远加」に぀いおの差し戻し率が非構造化タスクよりもかなり高い堎合、この原因が䜕なのか理解するために差し戻しを分析し、線集が差し戻される傟向を枛少させるためにタスクを調敎したす。
利甚者华䞋率 これは良く合臎しない画像をたくさん提案しおいるこずを瀺しおいる可胜性がありたす。 华䞋率が40%を超える堎合、私たちは画像提案アルゎリズムのQA品質保蚌をしお、お勧めの品質を改善するためにしきい倀を調敎するか倉曎を行いたす。
過剰受け入れ率 これは䞀郚の利甚者が実はタスクに぀いお刀断をしおいないこずを瀺しおいるかもしれず、぀たりは別の品質ゲヌトを実装した方がいいのかもしれたせん。 (画像を华䞋したりスキップしたりするこずなく完了したセッションがある利甚者の割合は 画像を华䞋したりスキップしたりするこずなく完了したセッションが5぀以䞊ある利甚者の割合は 党利甚者で受け入れのみを含むセッションの数は)
タスク完遂率 これは線集ワヌクフロヌに問題があるこずを瀺しおいるかもしれたせん。 「画像の远加」タスクを開始しお完遂する利甚者の比率が55%「リンクの远加」の完遂率よりも䜎い堎合、ワヌクフロヌのどこで利甚者が去っおいるのか調査し、継続できるように蚭蚈の倉曎を展開したす。

2021幎11月29日の展開から2021幎12月14日たでの「画像の远加」の䜿甚に぀いおのデヌタを収集したした。 「画像の远加」はモバむルりェブサむトでのみ利甚可胜になっおおり、そのプラットフォヌム䞊での登録の無䜜為な50%に提䟛されたした20%の党䜓的な察照矀を陀く。 したがっお開発埌に登録したモバむル利甚者に焊点を圓おおいたす。 このデヌタセットは既知のテストアカりントを陀倖し、䟋えば広告ブロッカヌによっおむベントログをブロックしおいる利甚者からのデヌタは含みたせん。

党䜓: 先導指暙デヌタに関しお最も特筆すべきこずは、これたでに完遂した線集者がいかに少ないかずいうこずです最初の二週間で89線集のみです。 「リンクの远加」の最初の二週間では、およそ300線集が行われたした。 その機胜はデスクトップずモバむル䞡方の利甚者に展開されおいたしたが、それだけではこの差が生たれるこずはありたせん。 䞋蚘の先導指暙はいく぀かのヒントを䞎えおくれたす。 䟋えば、タスク完遂率は顕著に䜎いです。 「リンクの远加」では、利甚者が䜕十個も立お続けに行ったのに察しお、こちらは人々が倚くのタスクを立お続けに行わなかったこずもわかりたした。 これは将来の調査における最重芁領域です。

差し戻し率: 線集ず差し戻しを識別するために線集タグを利甚し、差し戻しは線集から48時間以内に行われるものずしたす。 埌者は差し戻しの䞀般的な慣習に則しおいたす。

タスクの皮類 線集数 差し戻し数 差し戻し率
画像の远加 69 13 18.8%
リンクの远加 209 4 1.9%
æ ¡æ­£ 93 19 20.4%

「画像の远加」の差し戻し率は校正の差し戻し率ず同皋床で、「リンクの远加」よりもかなり高いです比率の怜定を䜿甚。 「画像の远加」は非構造化タスクず差し戻し率が同皋床なので、先導指暙の衚で述べたしきい倀に抵觊せず、譊戒する理由はありたせん。 ずは蚀え、なぜ差し戻しが発生しおいるのか調査を続けおいたす。 これたでにわかっおいるひず぀の問題は、倚数の利甚者が「画像の远加」ワヌクフロヌの倖偎から線集を保存しおいるずいうこずです。 ビゞュアル゚ディタヌに切り替えるこずによっおこれが可胜ですが、「リンクの远加」よりもはるかに頻繁に起こっおいるので、「キャプション」の手順に関しお玛らわしいものがあっお、それによっお利甚者が倖偎に迷い出おいるず考えおいたす。

华䞋率: 線集の芁玄ダむアログたたはスキップダむアログに到達するたでを線集「セッション」ず定矩し、その時点で提案された画像が受け入れられたか、华䞋されたか、あるいはスキップされたかを集蚈したす。 戻っお画像を芋盎したりキャプションを線集するのは合理的な遞択だず考えたすので、利甚者がこのダむアログに耇数回到達する可胜性がありたす。

受け入れ数  % 华䞋数  % スキップ数  % 合蚈数
53 41.7 38 29.9 36 28.3 127

先導指暙の衚で华䞋率しきい倀は40%であり、このしきい倀に抵觊しおいたせん。 ぀たり利甚者は期埅通りの比率で提案を华䞋しおおり、アルゎリズムが性胜䞍足であるず考える理由はないずいうこずです。

過剰受け入れ率: 华䞋率の分析から「線集セッション」の抂念を再利甚し、画像を受け入れおいるセッションのみである利甚者の数を集蚈したす。 このような利甚者が倚数の線集を行っおいるかどうか理解するために、党利甚者に察しおだけでなく、線集セッションが耇数および5以䞊の利甚者に察しおもこれを枬定したした。 䞋衚で、「合蚈数」列は線集セッション数が該圓する利甚者の総数、「党受け入れ数」は提案されたすべおの画像を受け入れた線集セッションのみである利甚者の数を瀺したす。

線集 合蚈数 党受け入れ数  %
≥1 線集 97 34 35.1
≥2 線集 21 8 38.1
≥5 線集 0 0 0.0

5぀以䞊の画像線集を完遂した利甚者はおらず、耇数の線集を完遂した利甚者ではすべおの提案を受け入れた利甚者は38%なので、このデヌタセットでは過剰受け入れが問題になっおいないこずが明らかです。 アルゎリズムがたいおいは良奜な提案を行うずすれば、これは想定の範囲内です。

タスク完遂率: 「タスクの開始」を「機械の提案モヌド」を衚瀺するこずず定矩したす。 蚀い換えれば、利甚者が「画像の远加」タスクがある゚ディタヌを読み蟌んでいるずいうこずです。 タスクの完遂は、線集の保存をクリックたたは提案された画像をスキップしたこずを確認するこずず定矩したす。

タスク開始数 1+ タスク完遂数  %
313 96 30.7

先導指暙の衚で定矩したしきい倀は「55%よりも䜎い」であり、このしきい倀に抵觊しおいたす。 ぀たり、私たちは利甚者がなぜワヌクフロヌ党䜓を通過しおいないのか懞念しおおり、どこで行き詰ったり諊めたりしおいるのかを理解したいず考えおいるずいうこずです。

Add an Image Experiment Analysis

Review the full report: "Add an Image" Experiment Analysis, March 2024

セクションぞの「画像の远加」

セクション・レベルの「画像の远加」提案

「画像の远加」構造化タスクが展開されおいるりィキでは、新芏参加者ホヌムペヌゞからアクセスできたす。 既存の「画像の远加」タスクは、党く図解されおいない蚘事に察しお蚘事レベルの画像を提案したす。 蚘事の抂念を党䜓ずしお図解する圹に立぀ように、画像は蚘事の導入郚に远加されたす。

セクションレベル「画像の远加」タスクのキャプション手ほどき

タスクに぀いおの手ほどきがあり、続いお具䜓的な提案画像が提案された理由を含むがありたす。 画像が蚘事のセクションによく適しおいるず新芏参加者が決定した堎合、その埌キャプションを曞くこずに぀いお案内を受けたす。 構造化タスクは画像の詳现、必芁ならばさらにキャプションの曞き方のヘルプを提䟛し、それから新芏参加者に線集を芋盎しお公開するよう促したす。

構造化デヌタチヌムずの協力

Growthチヌムは構造化デヌタチヌムず協力しお「画像の远加」タスクのセクションレベル版に取り組んでいたす。

りィキペディア暪断構造化デヌタプロゞェクトの䞀環です。 この新しいタスクは蚘事内の特定のセクションに関連する画像の提案を提䟛する予定です。 このセクションレベルの画像提案タスクはより難しいタスクずみなされ、珟状の蚘事レベルの「画像の远加」に成功した新芏参加者にのみ提案される予定です。

りィキメディア暪断構造化デヌタチヌムの取り組みの詳现はこちらをお読みください: Section-level image suggestions 。

仮説

  • 構造化線集䜓隓は参入障壁を䞋げ、それによっおより倚くの新芏参加者、そしお構造化されおいない䜓隓よりも倚くの皮類の新芏参加者を匕き蟌むでしょう。  
  • ワヌクフロヌで新芏参加者は最初のセッションでより倚くの線集を完遂し、さらに完遂するために戻っおくる可胜性が高たるでしょう。
  • 新しい皮類の「画像の远加」タスクを远加するこずによっお、各蚀語で利甚可胜な画像提案の数が増加するでしょう。

範囲

Key deliverable: completion of the Section-Level Images (newcomer structured task) Epic (T321754).

蚭蚈

Screenshots from two mobile designs can be seen on the right. Section-level "add an image" designs are visible in this Figma file.

利甚者テスト

蚭蚈の最初の利甚者テストは2023幎4月に英語で完了したした。 6人のテスタヌに指瀺をしお、このセクションレベルの蚭蚈詊䜜品で実隓をし、タスクの簡単さず楜しさを評䟡するように䟝頌したした。 テスタヌの幎霢は18歳から55歳たでの範囲で、異なる5か囜出身で、ほずんどの人はそれたでにりィキペディアを線集したこずはありたせんでした。 テスタヌのうち3人は男性、3人は女性でした。 2぀の画像をレビュヌするよう䟝頌したした。ひず぀は「良い」画像提案、ひず぀は「悪い」画像提案でした。

利甚者テストからわかった重芁なこずは

  • すべおの参加者が手ほどきを理解したした「明確で、理解しやすく、単玔です。」
  • 参加者はタスクず決定をするずきにセクションに焊点を圓おる必芁があるこずを理解しおいるようでした。 1人の参加者が「悪い」画像提案を受け入れたした
    • 2/6の参加者が「良い」画像提案を受け入れたした3人が画像を华䞋、1人が画像をスキップしたした。
    • 5/6の参加者が「悪い」画像提案を华䞋したした。
      • 泚蚘画像提案を䟛絊するアルゎリズムは「悪い」画像提案よりも「良い」画像提案を倚く提䟛するはずですが、アルゎリズムは完璧ではなく、それがこのタスクが人間のレビュヌを必芁ずし新しい線集者に適しおいる理由です。
  • セクション圓たりひず぀よりも倚くの画像がほしいず述べた参加者もいたした “ひず぀の提案は十分ではなく、もっず倚くの画像から遞択できるように提瀺しおくれれば、おそらくもっず適切な画像を遞択するこずができたす。”

アルゎリズム評䟡

Growthチヌムは新芏参加者向け構造化タスクが少なくずも70%のずきに正確な提案を新芏参加者に提䟛できるようにするこずを目指しおいたす。 画像提案アルゎリズムの正確さを怜蚌するために数回の評䟡を実斜したした。

最初の評䟡では、提案はただかなり䞍正確でした (T316151)。 画像を持぀べきではないセクションで画像を提案したり、セクションのひず぀のトピックに関連しおいるもののセクション党䜓を衚さない画像を提案したりするこずが倚くありたした。 この評䟡からのフィヌドバックに基づき、構造化デヌタチヌムは提案がより正確になるよう改善するロゞックずフィルタリングに取り組み続けたした (T311814)。

2回目の評䟡では、平均的には、提案ははるかに良くなりたした (T330784)。 もちろん結果は蚀語によっお倧きく異なりたすが、平均的な正確さは倚くのりィキでかなり高かったです。 However, there are some wikis in which the suggestions are still not good enough to present to newcomers, unless we only utilized the "good intersection" suggestions. That would severely limit the number of image suggestions available, so we are looking instead at increasing the confidence score of the suggestions we provide.

wiki % good alignment % good intersection % good p18/p373/lead image total rated suggestions
arwiki 71 91 54 511
bnwiki 28 86 26 204
cswiki 41 77 23 128
enwiki 76 96 75 75
eswiki 60 67 48 549
frwiki N.A. N.A. 100 3
idwiki 66 81 37 315
ptwiki 92 100 84 85
ruwiki 73 89 69 250
overall 64 86 57 2,120

このタスクはSpecial:EditGrowthConfigでコミュニティが蚭定可胜であるこずを芚えおおくず良いです。 私たちはすべおのりィキで䞊手く動䜜させるこずができるずころたでタスクを改善したいず考えおいたすが、究極的にはコミュニティがこのタスクが良く適合しおいお有効なたたにしおおくべきかを決定するこずになりたす。

コミュニティずの話し合い

Growthパむロットりィキずの議論は2023幎5月に蚈画されおいたす (T332530)。 蚭蚈、蚈画、および質問をアラビア語版りィキペディア、ベンガル語版りィキペディア、チェコ語版りィキペディア、スペむン語版りィキペディアに投皿し、さらに詳现をここMediaWikiで共有したす。

枬定

A/Bテストでこの機胜を展開せず、代わりに利甚者が新芏参加者ホヌムペヌゞのタスク遞択ダむアログ、あるいはレベルアップ機胜の䞀郚である線集埌の「新しいタスクを詊す」ダむアログでオプトむンできるようにするこずに決定したした。 This meant that we focused on measuring a set of leading indicators to understand if the task was performing well. More details about this can be found in T332344.

We pulled data from Growth's KPI Grafana board from 2023-07-31 to 2023-08-28 (available here) for Section-Level and Article-Level suggestions. This timeframe was chosen because it should not be as much affected by the June/July slump in activity that we often see on the wikis. The end date is limited by the team shutting off image suggestions in late August (see T345188 for more information). This data range covers four whole weeks of data. While this dataset does not allow us to separate it by platform (desktop and mobile web), nor does it allow us more fine-grained user filtering, it was easily available and provides us with a reasonably good picture that's sufficient for this kind of analysis at this time. Using this dataset we get the overview of task activity shown in Table 1.

衚1: タスクの皮類ごずのタスクのクリック、完遂、および差し戻し。
タスクの皮類 タスクのクリック 保存された線集 差し戻し タスク完遂率 差し戻し率
Section-level 1,149 688 60 58.1% 9.0%
Article-level 6,800 2,414 105 35.5% 4.3%

We see from the table that the task completion rate for section-level image suggestions is high, on par with Add a Link (ref) when that was released. This is likely because the section-level task is something users either choose themselves in the task selection dialogue, or choose to try out after being asked through the "Try a new task" dialogue that's part of Levelling Up. Those users are therefore likely already experienced editors and don't have too many issues with completing this task.

The revert rate for the section-level task is higher than the article-level task. We don't think this difference is cause for concern for two reasons. First, it might be harder to agree that an article is clearly improved by adding a section-level image compared to adding an article-level image.

Secondly, articles suggested for section-level images already have a lead image, which might mean that they're also longer and have more contributors scrutinizing the edit.

Impact

Add an image experiment analysis, March 2024

This analysis finds that the Add an Image structured task leads to an increase in newcomer participation on the mobile web platform, particularly by making constructive (non-reverted) article edits:

  • The likelihood that mobile web newcomers make their first article edit (+17.0% over baseline)
  • The likelihood that they are retained as newcomers (+24.3% over baseline)
  • The number of edits they make during their first two weeks on the wiki (+21.8% over baseline)
  • A lower probability of the newcomers' edits to be reverted (-3.3% over baseline).

On the desktop platform, the results are mixed: no increase in activation and retention, but an increase in number of edits made (+3.0% over baseline) combined with the same reduction in revert rates. Lastly, when comparing Add an Image to the Add a Link task, we find both tasks to perform similarly well.

Spanish Wikipedia, from September 1, 2024 to March 1, 2025

The data provided below is the number of reverts, for users with less than 90 days of presence, who made less than 100 edits in the Mainspace (articles space).

Filter Total Edit Count Total Edit Count Reverted Revert Percentage
ALL edits (No edit tag filter) 140,860 38,075 27.03%
Narrowed to edits with the Suggested: add images edit tag 722 32 4.43%
Narrowed to edits with the Suggested: add images to sections edit tag 891 53 5.95%

FAQ regarding these numbers:

  • We don't have time to review all the changes to the suggested images, and some images may remain when they should be removed. Could the number therefore be wrong?
    • This reasoning applies to all edits, including the ones that aren't images additions. Proportionally, we think these figures are correct. As more attention is paid to modifications concerning images, there probably have a higher reverts rate.
Category:WMF Projects/ja