TimedText:Wikidata Editing with OpenRefine - Part 1.webm.ar.srt

1 00:00:00,000 --> 00:00:05,333 مرحبًا بك في هذه السلسلة التعليمية حول استخدام OpenRefine لاستيراد البيانات إلى ويكي بيانات.

2 00:00:05,333 --> 00:00:06,833 اسمي أنطونين

3 00:00:06,850 --> 00:00:09,674 سأقوم بإرشادك خلال العملية برمتها

4 00:00:09,674 --> 00:00:11,489 لتنظيف مجموعة البيانات،

5 00:00:11,489 --> 00:00:13,468 ومطابقتها مع عناصر ويكي بيانات،

6 00:00:13,468 --> 00:00:17,601 وتحميل المعلومات كبيانات حول هذه العناصر.

7 00:00:17,612 --> 00:00:20,133 ليست هناك حاجة إلى معرفة سابقة بـ OpenRefine لمتابعة هذا البرنامج التعليمي

8 00:00:20,133 --> 00:00:23,333 لكن بعض الإلمام بويكي بيانات سيساعد.

9 00:00:24,078 --> 00:00:26,627 جميع الروابط اللازمة لمتابعة البرنامج التعليمي

10 00:00:26,627 --> 00:00:28,485 يمكن العثور عليها في وصف الفيديو.

11 00:00:28,485 --> 00:00:30,828 اذا هيا بنا نبدأ!

12 00:00:30,828 --> 00:00:35,561 OpenRefine هو برنامج مجاني يمكنك تنزيله على openrefine.org.

13 00:00:35,930 --> 00:00:40,330 بمجرد تثبيته، سيتم تشغيله في متصفحك بهذه الطريقة.

14 00:00:40,679 --> 00:00:43,363 في هذا البرنامج التعليمي، سنقوم باستيراد البيانات

15 00:00:43,363 --> 00:00:46,496 حول مواقع تصوير الأفلام في باريس.

16 00:00:47,592 --> 00:00:49,947 مجموعة البيانات التي سنعمل عليها متاحة

17 00:00:49,947 --> 00:00:52,947 على بوابة البيانات المفتوحة الباريسية

18 00:00:53,455 --> 00:00:55,962 ويمكننا تنزيله كملف CSV.

19 00:00:55,962 --> 00:00:58,501 يمكننا فقط نسخ عنوان URL لهذا الملف

20 00:00:58,501 --> 00:01:01,501 والصقه في OpenRefine.

21 00:01:01,794 --> 00:01:04,395 لدينا الآن معاينة للجدول

22 00:01:04,395 --> 00:01:06,604 ونحن سعداء بهذا الشكل

23 00:01:06,604 --> 00:01:10,004 لذلك نعطي اسمًا للمشروع ونقوم بإنشائه.

24 00:01:13,482 --> 00:01:15,824 الخطوة الأولى لاستيراد هذه البيانات في ويكي بيانات

25 00:01:15,824 --> 00:01:17,324 هو مطابقة أسماء الأفلام

26 00:01:17,324 --> 00:01:20,191 مع عناصر ويكي بيانات التي تتوافق معها.

27 00:01:20,766 --> 00:01:22,266 انقر على العمود الذي يحتوي على الأسماء

28 00:01:22,266 --> 00:01:23,600 من الكيانات التي تريد مطابقتها.

29 00:01:23,600 --> 00:01:26,667 واختر "تسوية" -> "بدء التسوية".

30 00:01:27,200 --> 00:01:30,200 اختر خدمة تسوية ويكي بيانات.

31 00:01:31,150 --> 00:01:33,100 يحاول OpenRefine التخمين

32 00:01:33,100 --> 00:01:37,100 نوع الكيان الذي تتوافق معه هذه الأسماء.

33 00:01:37,100 --> 00:01:37,688 في حالتنا هذه،

34 00:01:37,688 --> 00:01:40,688 أفضل تخمين له هو "فيلم"

35 00:01:40,953 --> 00:01:43,638 الذي يبدو مناسبا.

36 00:01:43,638 --> 00:01:46,572 سوف يأخذ OpenRefine بعين الاعتبار مثيلات تلك الفئة فقط

37 00:01:46,572 --> 00:01:48,488 أو فئات فرعية منه

38 00:01:48,488 --> 00:01:51,472 عند البحث عن المباريات.

39 00:01:51,472 --> 00:01:54,302 يتيح لك OpenRefine أيضًا مطابقة الخصائص الأخرى

40 00:01:54,302 --> 00:01:56,993 المخزنة في أعمدة أخرى من الجدول.

41 00:01:56,993 --> 00:01:59,785 في حالتنا، عمود "Réalisateur".

42 00:01:59,785 --> 00:02:02,145 يحتوي على اسم مخرج الفيلم

43 00:02:02,145 --> 00:02:05,021 وهو أمر مفيد جدًا لتوضيح.

44 00:02:05,021 --> 00:02:07,594 لذا ضع علامة على هذا العمود واختر

45 00:02:07,594 --> 00:02:10,114 خاصية ويكي بيانات التي يجب أن تتم مطابقتها معها.

46 00:02:10,114 --> 00:02:13,066 انقر فوق "بدء التسوية"

47 00:02:13,066 --> 00:02:16,066 وانتظر حتى تكتمل العملية.

48 00:02:26,998 --> 00:02:29,153 والآن تمت المصالحة

49 00:02:29,153 --> 00:02:30,803 تحولت بعض الأسماء إلى روابط زرقاء

50 00:02:30,803 --> 00:02:34,270 والتي تشير إلى عناصر ويكي بيانات المقابلة.

51 00:02:34,990 --> 00:02:36,969 والبعض الآخر لم تكن متطابقة

52 00:02:36,969 --> 00:02:39,185 على سبيل المثال لأن المخرج لم يتطابق

53 00:02:39,185 --> 00:02:42,185 في حالة فيلم "نادية".

54 00:02:42,411 --> 00:02:44,042 بعض الأفلام الأخرى لم تكن متطابقة

55 00:02:44,042 --> 00:02:47,698 لأن ويكي بيانات لا يعرف من هو مديرهم.

56 00:02:47,698 --> 00:02:49,116 اذا لديك وقت،

57 00:02:49,116 --> 00:02:51,265 يمكنك المرور عبر هذه الخلايا التي لا مثيل لها

58 00:02:51,265 --> 00:02:53,290 والتوفيق بينهما يدويًا.

59 00:02:53,290 --> 00:02:55,097 ولكن يمكنك أيضًا تركها كما هي:

60 00:02:55,097 --> 00:02:58,430 سيتم تجاهل هذه الصفوف عند الاستيراد.

61 00:03:00,100 --> 00:03:02,993 على الجانب الأيسر، يمكنك رؤية وجهين.

62 00:03:02,993 --> 00:03:04,530 يمكن استخدامها لتصفية الصفوف

63 00:03:04,530 --> 00:03:06,200 بناءً على حالة المطابقة الخاصة بهم

64 00:03:06,200 --> 00:03:08,381 ومطابقة النتيجة.

65 00:03:08,381 --> 00:03:10,896 يمكنك تحديد الصفوف التي نجحت فيها المطابقة

66 00:03:10,896 --> 00:03:13,896 من خلال النقر على الحالة "مطابق".

67 00:03:15,450 --> 00:03:17,200 من المهم أن تقوم بالفحص

68 00:03:17,200 --> 00:03:19,500 جودة هذه المباريات الآلية،

69 00:03:19,500 --> 00:03:21,250 وهناك طرق عديدة للقيام بذلك.

70 00:03:21,250 --> 00:03:23,250 وفي حالتنا، يحتوي الجدول

71 00:03:23,250 --> 00:03:25,000 مواعيد إطلاق النار

72 00:03:25,000 --> 00:03:26,700 حتى نتمكن من مقارنة ذلك

73 00:03:26,700 --> 00:03:28,774 إلى تاريخ إصدار الأفلام

74 00:03:28,774 --> 00:03:30,440 والتحقق من أنها متسقة.

75 00:03:30,440 --> 00:03:32,855 انقر على العمود التوفيق،

76 00:03:32,855 --> 00:03:36,000 اختر "تحرير العمود" -> "إضافة عمود من القيم التي تمت تسويتها"

77 00:03:36,000 --> 00:03:39,000 واختر "تاريخ النشر".

78 00:03:46,700 --> 00:03:49,050 سنقوم الآن بإنشاء عمود

79 00:03:49,050 --> 00:03:50,650 التي سوف تحتوي على الفرق

80 00:03:50,650 --> 00:03:52,150 بين تاريخ النشر

81 00:03:52,150 --> 00:03:54,350 وتاريخ انتهاء التصوير .

82 00:03:57,278 --> 00:04:01,211 اختر "تحرير العمود" -> "إضافة عمود بناءً على هذا العمود"

83 00:04:02,498 --> 00:04:04,800 اللغة المستخدمة للتعبير هنا

84 00:04:04,800 --> 00:04:06,750 يسمى GREL.

85 00:04:06,750 --> 00:04:08,550 إنها لغة بسيطة

86 00:04:08,550 --> 00:04:10,150 التي يمكنك تعلمها على موقع OpenRefine wiki.

87 00:04:10,150 --> 00:04:12,065 يمكنك أيضًا تحديد لغات أخرى

88 00:04:12,065 --> 00:04:14,398 إذا كنت أكثر دراية بهم.

89 00:04:14,750 --> 00:04:17,588 هذا التعبير سوف يحسب الفرق

90 00:04:17,588 --> 00:04:19,150 بين التاريخين

91 00:04:19,150 --> 00:04:22,159 كعدد من الأيام.

92 00:04:22,159 --> 00:04:24,196 قم بتسمية العمود الجديد

93 00:04:24,196 --> 00:04:27,196 وإنشاء العمود.

94 00:04:31,079 --> 00:04:32,579 يمكننا الآن إنشاء وجه رقمي

95 00:04:32,579 --> 00:04:33,682 في عمودنا الجديد

96 00:04:33,682 --> 00:04:37,149 وفحص توزيع الاختلافات.

97 00:04:39,704 --> 00:04:42,124 بعض هذه الاختلافات سلبية

98 00:04:42,124 --> 00:04:44,700 مما يشير إلى أنه ربما يكون لدينا خلايا متطابقة

99 00:04:44,700 --> 00:04:48,443 للأفلام التي تم إصدارها قبل التصوير.

100 00:04:48,443 --> 00:04:52,200 في الواقع، هذا فقط بسبب تاريخ الإصدار بالنسبة لهم

101 00:04:52,200 --> 00:04:55,952 لديك دقة سنة على ويكي بيانات.

102 00:04:57,041 --> 00:04:59,229 الحد الأقصى للفارق أقل من عامين

103 00:04:59,229 --> 00:05:00,643 وهو أمر منطقي أيضًا،

104 00:05:00,643 --> 00:05:02,020 لذلك نحن واثقون

105 00:05:02,020 --> 00:05:05,020 أن هذه المباريات موثوقة.

106 00:05:08,515 --> 00:05:11,258 هذه هي نهاية الجزء الأول من البرنامج التعليمي

107 00:05:11,258 --> 00:05:13,315 في الفيديو التالي سنتصالح

108 00:05:13,315 --> 00:05:16,315 أماكن إطلاق النار.