Vikimedija Srbije

Blog Vikimedije Srbije

Рачунарска лингвистика о родном јазу на Википедији

Тим научника из Немачке и Швајцарске спровео је научно истраживање како би се испитале родне неједнакости на Википедији. Резултати су охрабрујући и врло интересантни. Ипак, у неким аспектима је уочена суптилна пристрасност у начину писања биографија о женама и мушкарцима, што даје корисне смернице за даље унапређење садржаја Википедије.

Позната је чињеница да велику већину уредника Википедије чине мушкарци. Задужбина Викимедија је међу своје стратешке приоритете до 2015. поставила подизање процента жена међу активним уредницима Википедије на 25%. Постоје два главна разлога због којих је веће учешће жена у уређивању Википедије један од приоритета: Прво, уколико жене које чине око 50% читалаца, чине око или мање од 10% уредника Википедије, охрабривање већег процента жена да уређују је сјајан начин да се повећа и укупан број уредника Википедије. Друго, уколико Википедију пишу мушкарци, да ли то Википедију чини пристрасном? Да ли су „женске теме“ мање заступљене од мушких? Да ли је начин на који се пише о овим темама мањкав због тога што о њима пишу углавном мушкарци? Управо овим другим питањем се позабавио тим научника из Лајбниц института за друштвене науке, Техничког универзитета у Цириху („ETH Zürich“) и Универзитета у Кобленцу и Ландауу.

Научници су потенцијалну пристрасност у садржају Википедије узроковану родним јазом испитивали на основу четири димензије:

  • пристрасност покривености („Coverage Bias“)
  • структурна пристрасност („Structural Bias“)
  • лексичка пристрасност („Lexical Bias“)
  • пристрасност видљивости („Visibility Bias“)

Ове четири димензије пристрасности су анализиране на шест језичких издања Википедије (енглеском, немачком, руском, француском, шпанском и италијанском). Следи детаљнији приказ сваке димензије, тестова који су коришћени у анализи, и добијених резултата.

1. Испитивање пристрасности покривености се бави питањем да ли постоји адекватан број чланака о женама, то јест да ли су биографије енциклопедијски значајних жена у истом односу заступљене на Википедији као биографије енциклопедијски значајних мушкараца. Методологија мерења је подразумевала упоређивање броја чланака о особама на Википедији са више независних база података значајних људи. Добијени закључак је да жене нису неједнако представљене на Википедији, већ су чак благо заступљеније од мушкараца. Додатна охрабрујућа чињеница која је откривена је да се не ради само о пуком броју чланака, већ да су биографије жена у просеку дуже од биографија мушкараца. Аутори закључују да ово може бити последица свесног напора Википедијанаца да побољшају покривеност чланака о женама.

2. Испитивање структурне пристрасности представља проучавање броја веза које повезују чланке о мушкарцима и женама. Испитиван је однос вероватноће да чланак о жени садржи везу ка чланку о неком мушкарцу, и вероватноће да чланак о мушкарцу садржи везу ка чланку о некој жени. Ове вероватноће су анализиране помоћу неколико тестова. Резултати показују да на неким језичким издањима Википедије (на енглеском, руском и немачком) постоји статистички значајно већа вероватноћа да чланак о жени садржи везу ка чланку о мушкарцу него обратно. На Википедији на шпанском (и у случају једног теста, Википедијама на италијанском и француском) је стање уравнотежено, или чак „претеже“ број веза из чланака о мушкарцима ка чланцима о женама.

3. Испитивање лексичке пристрасности се тицало проучавања речи које су специфичне за чланке о женама и оних које су специфичне за чланке о мушкарцима. Резултати показују да на овом пољу постоји значајна пристрасност. Од 150 најспецифичнијих речи у чланцима о женама, између 23 и 32 процента се тиче породице, пола или брачних/љубавних односа. Кад су чланци о мушкарцима у питању, само 0 до 4 процента најспецифичнијих речи упада у ове категорије. Изрази као што су „удата/ожењен“, „разведен(а)“, „деца“ и „породица“ су много заступљенији у чланцима о женама. Најспецифичније речи у чланцима о мушкарцима се пак тичу професија („бејзбол“, „фудбал“, „пешадија“).

4. Испитивање пристрасности видљивости је покушај да се оцени да ли су чланци о женама и чланци о мушкарцима подједнако истакнути на Википедији. У овом испитивању је коришћен тест који је подразумевао упоређивање броја чланака о женама и о мушкарцима који се појављују на главној страни Википедије на енглеском језику. Резултати овог теста су показали да не постоји пристрасност у избору особа које ће се појавити на главној страни.

У својој дискусији резултата, аутори наводе да је анализа показала да је висока вероватноћа да ће значајна жена бити заступљена на Википедији, као и да википедијанска заједница подједнако истиче чланке о мушкарцима и женама. Међутим, резултати су открили и суптилну лексичку и структурну пристрасност која је присутна на Википедији. Даље, аутори истичу да добри резултати по питању покривености и видљивости сугеришу да је заједница уредника Википедије сензитивна што се тиче родних питања. Од четири димензије које су испитиване, две највидљивије (покривеност и видљивост) на Википедији нису проблематичне, што је индикатор да тамо где пристрасност на Википедији постоји, она није изазвана свесним злонамерним деловањем. Проблеми који постоје су учесталост узајамних линкова и изрази који доминирају у чланцима о мушкарцима и женама. Пристрасност која постоји по питању коришћених израза је истакнутија и свакако значајнија, тако да је ово дефинитивно проблем о коме би википедијанске заједнице широм света требало да поведу рачуна.

Истраживање је врло интересантно, и прилично пажљиво спроведено. Резултати су охрабрујући и корисни јер дају смернице за даље унапређење Википедије. Штета је што истраживањем није обухваћен већи број језичких издања, јер би било врло занимљиво и корисно видети како у вези по овим питањима стоји Википедија на српском језику.

Оригинални рад је доступан на следећој локацији: http://arxiv.org/pdf/1501.06307v1.pdf

Аутор текста: Горан Обрадовић

Share Button

Komentari su onemogućeni.