Oddano: 12. 7. 2012 - Sprejeto: 8. 1. 2013
1.01 Izvirni znanstveni clanek
1.01 Original Scientific Article
UDK 001.89:030:004.738.5(497.4)
Izvlecek
Namen: Namen raziskave je bil preveriti, koliko in kaksne vire citirajo izbrani clanki slovenske Wikipedije ter primerjati vzorec izbranih clankov z vzorcem nakljucnih clankov, oboje z namenom, da bi se dobila okvirna predstava o kvaliteti enih in drugih.
Metodologija: Pregledanih je bilo 122 izbranih clankov slovenske Wikipedije iz let 2009, 2010 in 2011. Analizirani so bili predvsem naslednji vidiki clankov: tema in popolnost clanka ter stevilo, jezik in vrsta virov. Vzorec izbranih clankov je bil primerjan z vzorcem 194 nakljucnih clankov, ki predstavljajo povprecne clanke na slovenski Wikipediji.
Rezultati: Rezultati so pokazali, da je vecina izbranih clankov prirejena po angleski Wikipediji, najpogostejse tematike pa so naravoslovje, sport in zgodovina. Izkazalo se je, da vecino nakljucnih clankov predstavljajo skrbine in clanki z minimalnim stevilom referenc, najpogosteje z vojasko, sportno ali biografsko tematiko. Na podlagi rezultatov se je potrdilo, da izbrani clanki, kljub nekaterim pomanjkljivostim, v primerjavi z nakljucnimi clanki predstavljajo najkvalitetnejse clanke slovenske Wikipedije.
Omejitve raziskave: Najvecja problematika in omejitev raziskave je izjemno slaba kvaliteta nakljucnih clankov, saj so to vecinoma skrbine, za katere je bilo tezko najti smiselne parametre, po katerih bi se jih lahko analiziralo.
Izvirnost/uporabnost raziskave: To je prva tovrstna raziskava slovenske Wikipedije, ki se ukvarja specificno z analizo citiranja v izbranih clankih. Rezultati raziskave urednikom izbranih clankov na slovenski Wikipediji ponujajo dragocene informacije glede njihovega dela ter opozarjajo na nekatere pomanjkljivosti, ki jih je mogoce odpraviti.
Kljucne besede: slovenska Wikipedija, izbrani clanki, analiza citiranja, celovitost clankov
Abstract
Purpose: The purpose of this research was to examine the number and type of sources cited by featured articles on the Slovenian Wikipedia and to compare a sample of featured articles with a sample of random articles, with the purpose of determining an indicative framework for the quality of both.
Methodology: 122 featured Wikipedia articles created in 2009, 2010 and 2011 were analysed, particularly the topic and originality of an article and the number, language and type of sources. A sample of featured articles was compared to a sample of 194 random articles which represent average Wikipedia articles.
Results: The results showed that most of the featured articles were adapted from the English Wikipedia, the most common topics being natural science, sports and history. It turned out that the majority of random articles were stubs and articles with a minimal number of references, with military, sports or biographic topic. Based on these results it has been confirmed that despite their deficiencies the featured articles represent the highest-quality Wikipedia articles as compared to random articles.
Research limitation: The biggest limitation of the research was the very low quality of random articles as they were mostly stubs, so it was hard to even determine sensible parameters upon which they could be analysed.
Originality/practical implications: This is the first research of the Slovenian Wikipedia that focuses on citation analysis of featured articles. Results of this research offer valuable information to editors of featured articles on their own work as well as point out certain deficiencies which can be eliminated.
Keywords: Slovenian Wikipedia, selected articles, citation analysis, article comprehensiveness
1 Uvod
Spletna enciklopedija Wikipedija je kljub pogostim kritikam ze nekaj casa eden od zelo priljubljenih ponudnikov informacij, predvsem zaradi svoje odprtosti in preprostega dostopa. Ne le, da deluje po principu prostega dostopa, ampak vsakemu uporabniku ponuja tudi moznost, da prispeva in ureja vnose. Da bi zagotovila cim boljso kvaliteto informacij, je Wikipedia razvila sistem pravil in smernic. Clanki, ki naj bi tem pravilom se posebej zvesto sledili, so izbrani clanki, ki predstavljajo najkvalitetnejsi del Wikipedije. Uporabnik naj bi se ob branju teh clankov celovito, naceloma tocno in hitro poucil o doloceni tematiki.
Upraviceno se postavlja vprasanje, zakaj sploh raziskovati Wikipedijo. Dejstvo je, da je Wikipedija sesta najbolj obiskana spletna stran na svetu in sedma najbolj obiskana spletna stran v Sloveniji. Pri ucencih, dijakih in studentih je vedno bolj priljubljen in pogosto citiran vir, kljub nejevolji profesorjev. Eijkman (2010) glede studentske uporabe Wikipedije pise, da akademiki odklanjajo Wikipedijo prav zaradi njenih odprtih recenzijskih procesov in odsotnosti natancnega akademskega (uredniskega) nadzora. Vendar isti avtor meni, da je neodgovorno, da izobrazevalne ustanove ne poucujejo o novih tehnologijah znanja, kakrsna je Wikipedija, saj ta spreminja nacin, na katerega clovek ustvarja, deli in zapisuje znanje. Zato ima izjemno pomemben vpliv na pristop k izobrazevanju v vseh vedah. Tezava citiranja Wikipedije v znanstvene namene je, da so studenti vse prehitro zadovoljni z najdenimi informacijami, zato se po navadi zadovoljijo s tistimi, ki jih najdejo v clanku. Ne zavedajo pa se, da vsak dobro napisan clanek citira reference, ki bi jim lahko pomagale pri kvalitetni izdelavi seminarske naloge. Mnogi od teh virov so v danasnjem casu prosto dostopni, zato so vse informacije, ki jih potrebujejo, oddaljene le se en klik - vendar v vecini primerov na zalost en klik prevec. Zato so raziskave virov, ki jih citirajo clanki Wikipedije, izjemnega pomena, saj tako lahko vsakdo preveri, ali so ti viri dovolj kvalitetni za nadaljnjo uporabo, kaksne vrste virov clanki citirajo in ali so ti viri sploh dostopni vsakokratnemu bralcu posameznega clanka. To so pomembna vprasanja, ki se jim je posvetila tudi raziskava, predstavljena v tem clanku.
Wilkinson in Huberman (2007) sta v raziskavi primerjala stevilo urejanj in urednikov v vzorcu izbranih clankov z vzorcem nakljucnih clankov, pri tem pa upostevala starost clankov in priljubljenost teme. Teme, ki so posebej priljubljene ali trenutno relevantne in zanimive, so v ospredju zanimanja in tudi urejanja, posledicno pa so clanki na te teme kvalitetnejsi, saj so rezultati pokazali mocno povezavo med stevilom urejanj, stevilom posameznih urednikov in kakovostjo clanka. Poleg kakovosti clankov na Wikipediji je pomembna tudi tematska pokritost Wikipedije, ki je seveda precej odvisna od osebnega zanimanja urednikov, ki se odlocijo za avtorstvo ali urejanje dolocenega clanka. Poderi (2009) ugotavlja, da je kategorizacija izbranih clankov sicer arbitrarna in se lahko spremeni, vendar nekatere kategorije oziroma tematski sklopi vsebujejo tudi po desetkrat vec clankov kot druge. Ocitno je, da clanki v dolocenih kategorijah lazje pridobijo status izbranih clankov. Poderi je zato v svoji raziskavi preveril, kateri dejavniki (poleg kriterijev, ki so doloceni) vplivajo na sprejem clanka med izbrane clanke. Tudi nasa raziskava se izdatno posveca temam izbranih clankov in ugotavlja, da je priljubljenost teme skupaj z osebnimi zanimanji najbolj zagretih urednikov velikega pomena pri odlocanju o statusu izbranega clanka.
Lindsey (2010) je preverjal ucinkovitost procesa potrjevanja izbranih clankov, in sicer tako, da je prosil strokovnjake, naj ocenijo splosno kvaliteto in tocnost izbranega clanka z njihovega strokovnega podrocja. Med 22 preverjenimi izbranimi clanki jih je le 12 uspesno prestalo test z Wikipedijinimi lastnimi kriteriji. V clanku polemizira tudi z raziskavami, ki so pokazale, da je dolzina clanka dober pokazatelj, ali je clanek izbran ali ne. Lindsey namrec meni, da je vecina obstojecih raziskav predpostavila, da so izbrani clanki visoke kakovosti, in je zato izhajala iz napacnih hipotez. Dejstvo, da so izbrani clanki naceloma daljsega obsega, zgolj pomeni, da se tisti, ki glasujejo o statusu izbranih clankov, osredotocajo zgolj na kriterije, ki jih je lahko dolociti - torej predvsem na dolzino - in kvaliteti ne posvecajo dovolj pozornosti. Nekdo, ki ni strokovnjak na dolocenem podrocju, lazje presoja na podlagi dolzine clanka kot pa na podlagi njegove resnicne izcrpnosti.
Na podlagi pregledane dostopne literature na temo Wikipedije in izbranih clankov je bila zasnovana raziskava, ki se osredotoca predvsem na stanje izbranih clankov v slovenski Wikipediji. Kriteriji, po katerih so bili izbrani clanki analizirani, so izvor izbranih clankov (ali gre za izvirni slovenski vnos ali zgolj za prevod ali povzetek ze obstojecega vnosa v tujem jeziku) in viri, ki jih clanki citirajo (ali so spletni ali tiskani, znanstveni ali poljudni, v slovenskem ali tujem jeziku).
2 Wikipedijina merila za izbrane clanke
Za izbrane clanke poleg standardnih pravil in smernic, ki veljajo za vse clanke na Wikipediji,1 veljajo tudi posebna merila.2
1. Izbrani clanek je dobro napisan, celovit, tocen, nepristranski in stabilen.
a. Dobro napisan pomeni, da je besedilo na kar se da visoki ravni.
b. Celovit pomeni, da clanek zaobjame vsa pomembna dejstva in podrobnosti.
c. Tocen pomeni, da je trditve mogoce preveriti v zanesljivih virih in da tocno predstavlja s predmetom clanka povezano objavljeno znanje. Trditve so podprte z navedbami zanesljivih zunanjih objav. Pri tem morajo snovalci imeti v mislih dve temeljni pravili Wikipedije, in sicer Preverljivost in Brez izvirnega raziskovanja.
d. Nepristranski pomeni, da clanek predstavlja stalisca posteno in nepristransko. To nacelo sloni na tretjem temeljnem pravilu Wikipedije, ki je Nepristranskost.
e. Stabilen pomeni, da clanek ni neprestano predmet urejevalnih vojn in da se njegova vsebina ne spreminja iz dneva v dan.
2. Izbrani clanek ustreza slogovnim smernicam Wikipedije, kar pomeni, da ima:
a. jedrnat uvodni odstavek, ki povzame celotno temo in bralca pripravi na visjo raven podrobnosti v naslednjih odstavkih;
b. ustrezno hierarhicno urejene podnaslove;
c. daljse, vendar ne preobsezno kazalo vsebine.
3. Kjer je treba, vsebuje slike z jedrnatimi napisi in sprejemljivim polozajem avtorskih pravic.
4. Je primerne dolzine in ostaja osredotocen na glavno temo, ne da bi postal pretirano podroben.
3 Zasnova raziskave
Namen raziskave je bil prouciti, koliko in kaksne vire citirajo avtorji clankov, ki so kasneje ob splosnem konsenzu urednikov Wikipedije oznaceni za Izbrane clanke, te rezultate primerjati z vzorcem clankov, pridobljenih prek funkcije Nakljucni clanek, na podlagi vseh rezultatov pa odgovoriti na naslednja raziskovalna vprasanja:
1. Ali se dejstvo, da so to izbrani clanki, odraza v stevilu citiranih virov?
2. Kaksni so viri, ki jih izbrani clanki citirajo, glede na njihov jezik in vrsto?
3. Ali so clanki izvirno slovenski ali so prevzeti iz drugih Wikipedij?
4. Kaksne so znacilnosti nakljucnih clankov?
3.1 Metodologija
Wikipedija je bila v slovenskem jeziku ustanovljena marca 2002. Do 15. maja 2012 je bilo na Wikipediji objavljenih 133.494 clankov v slovenscini, med njimi 273 izbranih clankov. Vzorec v tej raziskavi predstavljajo izbrani clanki v letih 2009, 2010 in 2011, kar obsega 122 clankov ali 44,7 odstotka vseh izbranih clankov.
Posebej za potrebe raziskave je bila razvita metodologija za vrednotenje izbranih clankov slovenske Wikipedije. To je prva tovrstna raziskava, zato so bili kriteriji vrednotenja postavljeni glede na Wikipedijina lastna pravila in smernice ter njena merila za izbrane clanke. Wikipedija ima jasno postavljene kriterije o tem, kaj sodi na Wikipedijo, za kaj si Wikipedija kot celota prizadeva in kako naj bi bil videti primeren vnos. Glede na to, da Wikipedija clanke, ki so po mnenju urednistva najboljsi glede na zastavljene kriterije, nagrajuje s statusom izbranega clanka, ti clanki verjetno najbolj sledijo smernicam in pravilom. Zbran je bil vzorec 122 izbranih clankov iz Wikipedijinega arhiva izbranih clankov za leta 2009, 2010 in 2011. Presteti so bili viri v izbranih clankih, dolocena njihova vrsta, oblika in jezik, v katerem so napisani, poleg tega pa je bil na osnovi primerjave z vsakokratnimi ustreznicami clankov v drugih Wikipedijah dolocen izvor izbranih clankov. Analizirani so bili naslednji vidiki:
1. Izvor izbranih clankov v slovenski Wikipediji: koliko so ti clanki neodvisni od clankov na isto temo v drugih jezikih - ali gre zgolj za prevod ali povzetek ze obstojecega vnosa v tujem jeziku ali gre za izvirno slovenski clanek.
2. Izvor oziroma jezik virov - ali izbrani clanki navajajo slovenske ali tuje vire.
3. Vrsta virov - ali so viri znanstveni ali poljudni, ali gre za monografske publikacije, znanstvene clanke, casopisne clanke ali spletne strani.
4. Oblika virov - ali so viri tiskani ali spletni.
Da bi se prvi vzorec primerjal z vzorcem, ki predstavlja povprecje clankov na Wikipediji, je bil prek funkcije Nakljucni clanek v razmiku enega tedna pridobljen se vzorec dvakrat po 97 nakljucnih clankov, ki jih iz celotne baze ponudi Wikipedija. Ker gre, kot receno, pri nakljucnih clankih za povprecje, jih na zalost ni bilo mogoce analizirati po enakih kriterijih kot izbrane clanke, saj je bila diskrepanca med njimi preprosto prevelika, tako v smislu obsega in kvalitete clanka kot v stevilu in vrsti referenc. Pri nakljucnih clankih je bil pregledan, prestet in opredeljen vir. Ker so clanki vecinoma obcutno krajsi, se je dolocalo stevilo besed in opredelilo, ali gre za obicajen clanek, za skrbino, za razlocitveno stran ali za seznam.
4 Rezultati
4.1 Izbrani clanki
4.1.1 Izbrani clanki v letu 2009
Leta 2009 so uredniki status izbranega clanka podelili 44 clankom. Teme clankov so raznovrstne, vseeno pa se jih da kategorizirati na nekaj temeljnih skupin, saj prevladujejo clanki s podrocja sporta, zgodovine in naravoslovja.
Clanki skupno citirajo 1378 virov, kar pomeni, da v povprecju en clanek citira 31,3 reference. 20 clankov citira clanke v znanstvenih revijah, vsak v povprecju 18,3. 37 clankov citira monografske publikacije, vsak v povprecju 11,8. 41 clankov citira spletne strani, vsak v povprecju 10,02, in 17 clankov citira casopisne clanke, vsak v povprecju 9,7. Skupno je citiranih 366 clankov v znanstvenih revijah (26 odstotkov), 437 monografskih publikacij (32 odstotkov), 411 spletnih strani (30 odstotkov) in 164 casopisnih clankov (12 odstotkov).
Glede na temo zgodovinski clanki skupno citirajo 258 virov (19 odstotkov), naravoslovni clanki 578 (42 odstotkov), clanki s sportno temo 366 (26 odstotkov) in preostali clanki 176 virov (13 odstotkov).
Med pregledom tem izbranih clankov so se pokazale nekatere zanimive lastnosti citiranja clankov z doloceno tematiko. Vecino casopisnih clankov citirajo clanki s sportno vsebino, saj skupno ti clanki citirajo kar 85 odstotkov casopisnih clankov (glej Sliko 1).
Vecino monografskih publikacij citirajo clanki z zgodovinskimi (osebnosti, dogodki) in naravoslovnimi temami, skupno ti clanki citirajo 71 odstotkov vseh monografskih publikacij (glej Sliko 2). Prav tako naravoslovni clanki citirajo vecino clankov v znanstvenih revijah, in sicer 88 odstotkov vseh clankov v znanstvenih revijah (Slika 3).
Citiranje spletnih strani je dokaj enakomerno porazdeljeno med vse teme izbranih clankov, zato glede na njihovo temo ni mogoce dolociti statisticno pomembnih lastnosti clankov, ki citirajo spletne strani.
43 od 44 izbranih clankov leta 2009 citira angleske vire, v povprecju 30,02 na clanek, skupno pa izbrani clanki leta 2009 vsebujejo 1291 angleskih referenc (94 odstotkov).
14 izbranih clankov leta 2009 citira slovenske vire, v povprecju 2,9 na clanek, skupno pa izbrani clanki leta 2009 citirajo 40 slovenskih referenc (3 odstotki). 11 izbranih clankov citira vire v drugih tujih jezikih, skupno 47 (3 odstotki).
Med izbranimi clanki leta 2009 je 12 izvirnih slovenskih clankov (27 odstotkov), kar pomeni, da nimajo neposredne ustreznice v drugem jeziku, pa tudi ce jo imajo, se ta od slovenske bistveno razlikuje. 13 clankov je skrajsanih (30 odstotkov), kar pomeni, da clanek sledi predlogi clanka iz angleske Wikipedije, vendar je bistveno skrajsan. 9 clankov je prevedenih iz angleske Wikipedije (20 odstotkov), kar pomeni, da je clanek lahko sicer skrajsan, a ne bistveno, vecinoma pa gre za dobeseden prevod, kar se pogosto vidi po okornejsem jeziku v slovenskem clanku, napacnem slovenjenju nekaterih imen ali ustaljenih besednih zvez ipd. Najbolj zanimivi so lokalizirani clanki, ki jih je bilo leta 2009 med izbranimi clanki 10 (23 odstotkov). Predstavljajo tiste clanke, ki so povzeti po clanku z Wikipedije v drugem jeziku, a so razsirjeni in prirejeni za slovenske bralce. Tak clanek ima lahko dodane slovenske reference, podatke, ki orisujejo slovenske razmere, ali pa dodatna pojasnila, zaradi katerih lahko slovenski bralci bolje razumemo tematiko, ki jim je sicer oddaljena.
4.1.2 Izbrani clanki v letu 2010
Arhiv izbranih clankov za leto 2010 vsebuje 53 clankov. Prevladujoce teme ostajajo sport, geografija, zgodovina in naravoslovje. V primerjavi z izbranimi clanki 2009 se je pojavila nova kategorija clankov, in sicer clanki o popularni kulturi. Clanki skupno citirajo 1944 referenc, kar pomeni, da vsak clanek v povprecju citira 36,7 reference.
28 clankov citira clanke v znanstvenih revijah, vsak v povprecju 12,6. 46 clankov citira monografske publikacije, vsak v povprecju 10,8. 48 clankov citira spletne strani, vsak v povprecju 17,4. 27 clankov citira casopisne clanke, v poprecju 9,6 na clanek. Skupno je citiranih 354 strokovnih clankov (18 odstotkov), 497 monografskih publikacij (26 odstotkov), 835 spletnih strani (43 odstotkov) in 258 casopisnih clankov (13 odstotkov). Glede na temo clanka naravoslovni clanki citirajo 517 virov (26 odstotkov), sportni 309 (16 odstotkov), zgodovinski 402 (21 odstotkov), clanki o popularni kulturi 409 (21 odstotkov), clanki o geografiji 272 (14 odstotkov), preostali clanek pa citira 35 virov (2 odstotka).
Naravoslovni izbrani clanki ponovno citirajo vecino clankov v znanstvenih revijah, skupno teh 18 clankov citira 308 znanstvenih clankov ali 87 odstotkov vseh citiranih znanstvenih clankov (glej Sliko 4).
Najvec monografskih publikacij citirajo clanki z zgodovinskimi temami (dogodki ali osebnosti), skupno 14 zgodovinskih clankov citira 284 od 497 citiranih monografskih publikacij, kar je 57 odstotkov vseh citiranih monografskih publikacij (glej Sliko 5).
Najvec casopisnih clankov citirajo clanki o znanih osebnostih, popularni kulturi in sportnikih, saj skupno clanki o popularni kulturi citirajo 155 od 258 casopisnih clankov, kar predstavlja 60,08 odstotka vseh casopisnih clankov (glej Sliko 6). Citiranje spletnih strani je tudi leta 2010 porazdeljeno tako, da se tezko sklepa, da bi bilo za doloceno temo bolj znacilno.
52 od 53 izbranih clankov leta 2010 citira vire v angleskem jeziku, in sicer v povprecju vsak clanek citira 32,06 vira v anglescini, skupno pa citirajo 1667 virov v anglescini (86 odstotkov). 22 clankov citira vire v slovenskem jeziku, in sicer v povprecju 8,6, skupno pa 189 (10 odstotkov).
Med izbranimi clanki leta 2010 je 13 izvirnih clankov (24 odstotkov), 18 je skrajsanih clankov (34 odstotkov), 11 prevedenih clankov (21 odstotkov) in 11 lokaliziranih clankov (21 odstotkov).
4.1.3 Izbrani clanki v letu 2011
Arhiv izbranih clankov leta 2011 vsebuje 25 clankov. Prevladujoce teme ostajajo sport, zgodovina in naravoslovje, ostaja tudi kategorija clankov o popularni kulturi. Clanki skupno citirajo 1212 referenc, kar pomeni, da vsak clanek v povprecju citira 48,5 reference. Med izbranimi clanki leta 2011 je 6 izvirnih clankov, 3 skrajsani clanki, 3 prevedeni clanki in 11 lokaliziranih clankov.
9 clankov citira clanke v znanstvenih revijah, vsak v povprecju 25,2. 21 clankov citira monografske publikacije, vsak v povprecju 13,4. 24 clankov citira spletne strani, vsak v povprecju 21,6. 12 clankov citira casopisne clanke, v poprecju 15,75 na clanek. Skupno je citiranih 277 znanstvenih clankov (18 odstotkov), 281 monografskih publikacij (22 odstotkov), 519 spletnih strani (46 odstotkov) in 189 casopisnih clankov (14 odstotkov).
Glede na temo clanka naravoslovni clanki citirajo 302 vira (25 odstotkov), sportni 504 (41 odstotkov), zgodovinski 298 (25 odstotkov), clanki o popularni kulturi 59 (5 odstotkov), clanek o geografiji pa 49 virov (4 odstotkov). Naravoslovni izbrani clanki ponovno citirajo vecino clankov v znanstvenih revijah, skupno teh 5 clankov citira 211 znanstvenih clankov ali 93 odstotkov vseh citiranih znanstvenih clankov (glej Sliko 7).
Najvec monografskih publikacij citirajo clanki z zgodovinskimi in naravoslovnimi temami, skupno 13 naravoslovnih in zgodovinskih clankov citira 207 od 281 citiranih monografskih publikacij, kar je 74 odstotkov vseh citiranih monografskih publikacij (glej Sliko 8).
Najvec casopisnih clankov citirajo clanki o sportu, saj skupno citirajo 145 od 185 casopisnih clankov, kar predstavlja 78 odstotkov vseh casopisnih clankov (glej Sliko 9).
Citiranje spletnih strani je tudi leta 2011 enakomerno porazdeljeno po vseh tematskih podrocjih.
24 od 25 izbranih clankov leta 2011 citira vire v angleskem jeziku, in sicer v povprecju vsak clanek citira 42,7 vira v anglescini, skupno pa citirajo 1024 virov v anglescini (84 odstotkov). 9 clankov citira vire v slovenskem jeziku, in sicer v povprecju 14,3, skupno pa 129 (11 odstotkov). 15 clankov citira skupno se 59 virov v drugih tujih jezikih (5 odstotkov).
Med izbranimi clanki 2011 je 6 izvirnih clankov (24 odstotkov), 3 skrajsani clanki (12 odstotkov), 3 lokalizirani clanki (3 odstotki) in 13 prevedenih clankov (52 odstotkov).
4.2 Nakljucni clanki
Vzorec je bil zbran s pomocjo funkcije Nakljucni clanek, prvi del vzorca 19. novembra 2010, drugi del vzorca pa teden dni kasneje, 26. novembra 2010. Vzorca sta bila pridobljena loceno s tedenskim razmikom, da so lahko rezultati verodostojnejsi, saj imata vzorca resnicno primerljive lastnosti, kar pomeni, da nakljucni clanki tvorijo vzorec, ki kaze realno sliko slovenske Wikipedije. Vzorec sestavljajo vecinoma krajsi clanki, vecina poleg besedila vsebuje se preglednice. V vzorcu nakljucnih clankov je malo referenc. Vecinoma se clanki nanasajo na osebnosti, geografske (vasi, mesta, reke) in vojaske teme. Clanki so v povprecju dolgi 160 besed, od 194 clankov jih vsaj eno referenco citira 66, oziroma 34 odstotkov vzorca. Teh 66 clankov skupno citira 172 virov, kar je povprecno 2,6 vira na clanek, med temi viri je 108 spletnih strani, 53 monografskih publikacij in 11 clankov (glej Sliko 10). Med clanki je 13 seznamov, 17 razlocitvenih strani, 99 skrbin in 65 obicajnih clankov, med temi pa je celo en izbrani clanek, in sicer Darej I, ki je bil s statusom izbranega clanka nagrajen leta 2008 (glej Sliko 11).
5 Razprava
Slovenska Wikipedija je majhna skupnost, z majhnim stevilom aktivnih uporabnikov in se manjsim stevilom administratorjev (dne 20. avgusta 2011 jih je bilo 31). Ceprav ni nobenega izrecnega pravila o skrbnistvu nad izbranimi clanki, na slovenski Wikipediji zanje vecinoma skrbijo administratorji (jih ustvarijo, predlagajo, urejajo, popravljajo, sodelujejo v razpravi in glasujejo o statusu clanka). Zaradi majhnega stevila dejavnih administratorjev in zaradi njihovega sicer gotovo nenamernega monopolnega polozaja nad izbranimi clanki se slovenska Wikipedija v tej kategoriji povsem ocitno ne more izogniti pristranskosti. Tovrstna pristranskost odraza interese vodilnih oziroma najbolj zagnanih uporabnikov, ki imajo vecinoma status administratorjev, najbolj pa se kaze v temah izbranih clankov. Uredniki se vecinoma odlocajo za avtorstvo, prevod in priredbo clankov, katerih teme so jim pri srcu oziroma se nanje najbolj spoznajo. Prevladuje naravoslovje z 92 izbranimi clanki, sledi druzboslovje s 86 izbranimi clanki, kategorija Sport vsebuje 42 izbranih clankov, kategorija Geografija in kraji pa 25. Vidimo lahko, da uredniki clanke ustvarjajo glede na svoje interese, znanja in izobrazbo, in ne toliko glede na morebitne potrebe oz. vrzeli, ki obstajajo v slovenski Wikipediji.
Leta 2009 prevladujejo sportni clanki, leta 2010 naravoslovni, leta 2011 pa sportni in zgodovinski (glej Sliko 12). Leta 2009 so uredniki izglasovali 44 izbranih clankov, leta 2010 kar 9 vec, torej 53, leta 2011 pa vec kot pol manj, in sicer le 25. Ni presenetljivo, da izbrani clanki leta 2010 zaradi vecjega stevila skupno citirajo vec virov, in sicer 1944, medtem ko so clanki leta 2009 citirali 1378 virov. Zanimivo je, da clanki leta 2011 kljub majhnemu vzorcu citirajo skupno 1212 virov, kar je 48,5 na clanek. Najbolj ocitna razlika med leti 2009, 2010 in 2011 je v citiranju spletnih strani, saj jih izbrani leta 2010 citirajo kar dvakrat vec (835, leta 2009 pa 411), izbrani clanki leta 2011 pa 519, kar je glede na majhno stevilo clankov visoka stevilka. Tako v izbranih clankih leta 2009 kot med tistimi leta 2010 in 2011 kot viri prevladujejo monografske publikacije in spletne strani, najvec virov pa v vseh treh letih citirajo izbrani clanki z naravoslovno tematiko (glej Sliko 13). Ceprav si na Wikipediji prizadevajo za korektno citiranje v vseh clankih, se posebej v izbranih, so clanki z naravoslovno oz. znanstveno tematiko ocitno bolj »zavedni« glede citiranja ali pa so znanstvenega citiranja bolj vajeni. Poleg tega je prav tako ocitno, da se stevilo virov glede na stevilo clankov vsako leto povecuje.
Posebej zanimiva in ne povsem pricakovana je povezava, ki se je pokazala med pregledom tem izbranih clankov in primerjavo z vrsto citiranih virov. Za izbrane clanke na doloceno temo je bolj znacilno citiranje dolocene vrste virov kot za druge. Tako izbrani clanki s sportno tematiko citirajo najvec casopisnih clankov, naravoslovni in zgodovinski clanki citirajo najvec monografskih publikacij, poleg tega naravoslovni clanki citirajo najvec znanstvenih clankov. Citiranje spletnih strani je med vsemi tematikami dokaj enakomerno porazdeljeno. Glede na to, da je med skupno 122 izbranimi clanki zgolj 31 izvirnih clankov, torej je bilo kar 75 odstotkov clankov prevzetih z drugih Wikipedij, je ocitno, da je tovrsten vzorec citiranja znacilen za dolocene tematike. O sportnih temah se res najvec pise v dnevnem casopisju, napredek v naravoslovju se najlazje spremlja prek clankov v znanstvenih revijah, poleg tega je tudi citiranje monografskih publikacij v naravoslovnih in zgodovinskih clankov povsem na mestu. Clanki v znanstvenih revijah in monografske publikacije predstavljajo primernejse in naceloma zanesljivejse vire kot casopisni clanki in spletne strani, ki so prevec fluidne. Kot je bilo nakazano ze v prejsnjem odstavku, rezultati kazejo povezanost med tematiko in citiranjem dolocene vrste virov. Naravoslovni izbrani clanki citirajo vec, poleg tega so njihovi viri zanesljivejsi. Seveda se nobena tematika ne more izogniti spletnim virom, se posebej zato, ker splet ponuja mnogo raznovrstnih, prosto dostopnih podatkov, kar se posebej prilega duhu enciklopedije Wikipedije, zato prevladujoce citiranje spletnih strani tudi ni presenetljivo.
Med skupno 122 izbranimi clanki je torej zgolj dobrih 25 odstotkov clankov izvirnih, kar pomeni, da nimajo neposredne ustreznice v drugih Wikipedijah ali pa da se clanki z istim naslovom v drugih jezikih bistveno razlikujejo od slovenskega. Zato verjetno ne preseneca, da leta 2009 43 od 44 izbranih clankov citira vsaj en vir v angleskem jeziku, v povprecju 30 na clanek, skupno 1291; med izbranimi clanki leta 2010 jih vsaj en vir v angleskem jeziku citira 52 od 53, v povprecju 32 na clanek, skupno kar 1667. Leta 2011 pa jih vsaj en angleski vir citira 24 od 25, v povprecju 42,7 na clanek, skupno pa 1024. Skrb zbujajoce majhno stevilo virov v slovenskem jeziku iz leta 2009 (le 14 izbranih clankov citira vsaj en slovenski vir, skupno pa le 40) se leta 2010 poveca skoraj za petkrat, na 189 slovenskih referenc, vendar ostaja (pre)majhno. Leta 2011 vsaj en slovenski vir citira 9 clankov, skupno pa 129, kar kaze na postopno povecevanje slovenskih virov v izbranih clankih, vendar bi se za potrditev tega moralo analizirati izbrane clanke v prihodnjih letih (glej Sliko 14). Na slovenski Wikipediji bi bilo med izbranimi clanki vseeno pricakovati vec referenc v slovenskem jeziku ali pa vsaj referenc, ki so dostopne tudi slovenskim uporabnikom Wikipedije. Delez izvirnih in lokaliziranih clankov se ni povecal, oziroma se je glede na leto 2009 celo zmanjsal, kar pomeni, da manj clankov citira vec slovenskih virov. Majhno stevilo referenc v slovenskem jeziku (pa tudi v drugih tujih jezikih razen anglescine) je povezano z majhnim stevilom izvirnih clankov. Jezik referenc je torej najbolj zgovoren pokazatelj, da je vecina izbranih clankov prevzeta z angleske Wikipedije, ne glede na obseg priredbe clanka za slovensko Wikipedijo.
Med vsemi prevzetimi clanki so slovenski Wikipediji najpomembnejsi lokalizirani clanki, saj jih vecina vsebuje tudi slovenske reference, s katerimi so podkrepljeni podatki, ki se nanasajo na Slovenijo, Slovence, slovensko ... Glede na to, da gre za izbrane clanke na slovenski Wikipediji, bi bilo v prihodnje smiselno spodbujati vec izvirnih clankov oziroma vsaj lokaliziranih clankov, ki bi uporabnikom ponujali slovenske vire. V ta namen bi bilo smiselno oblikovanje nove smernice oziroma dopolnitev slogovnega prirocnika za izbrane clanke s kriterijem, po katerem bi moral vsak kandidat za izbrani clanek imeti vsaj 25 odstotkov virov v slovenskem jeziku, pri temah, ki so lokalne in zadevajo Slovenijo, pa vsaj 50 odstotkov.
Med vsemi izbranimi clanki je 52 takih, ki so izbrani clanki tudi v vsaj enem drugem jeziku, od tega 42 prevedenih ali prirejenih, 8 izvirnih in 2 lokalizirana. Podatki nakazujejo, da uredniki novih izbranih clankov glede na svoje interese pogosto poiscejo clanke, ki so ze dosegli status izbranega clanka v kakem drugem jeziku, in tako ocitno poskusajo ze od zacetka clanku zagotoviti cim visjo kvaliteto, kar je seveda z dolocenega vidika pohvalno. Iskanje kvalitetnih clankov na drugih Wikipedijah nedvomno skrajsa cas ustvarjanja clanka, saj urednikom preostane zgolj prevod in koncno urejanje clanka. Kljub prihranku casa lahko sam proces prevajanja in urejanja traja kar nekaj casa, saj je treba doseci konsenz, poleg tega je nekatere teme tezko prevajati iz tujih jezikov, se posebej ce avtor jezika ni vesc. Ce se bo trend zmanjsevanja izvirnosti clankov nadaljeval v tako velikih korakih, bodo izbrani clanki kmalu vsebovali se manj slovenskih virov kot sedaj.
Glede na temo je dalec najvec dobesedno prevedenih izbranih clankov na podrocju sporta, skrajsani clanki so enakomerno porazdeljeni med zgodovino, naravoslovje in sport, najvec izvirnih in lokaliziranih clankov pa je z zgodovinsko, naravoslovno in geografsko tematiko (glej Sliko 15).
Izbrani clanki so napisani na zadovoljivo visoko ravni. Uporabnik se ob branju lahko celovito, naceloma tocno in hitro pouci o doloceni tematiki, vecina izbranih clankov ponuja tudi vire zadovoljive kvalitete. Kar zadeva dostopnost teh virov, pa se slovenska Wikipedija ne more izogniti kritiki. Slovenski izbrani clanki so namrec najslabsi v tocki preverljivosti, ki je eno od treh temeljnih nacel Wikipedije. Izbranim clankom sicer formalno ne gre ocitati pomanjkanja preverljivih virov, vendar v resnici vsi skrajsani in prevedeni izbrani clanki citirajo prevec virov, ki prav gotovo niso dostopni v slovenskem jeziku, kaj sele, da bi bili dostopni v Sloveniji (to so predvsem monografske publikacije in znanstveni clanki v angleskem jeziku), da bi lahko verjeli, da je urednik dolocenega clanka preveril prav vsako referenco, ki jo je zapisal oziroma prepisal pod clanek. Wikipediji prepisovanje virov v izbranih clankih prav gotovo ne koristi, poleg tega je to v nasprotju s slogovnim prirocnikom o navajanju virov, ki jasno doloca, naj uporabnik: »... navaja le vire, ki jih je sam imel v rokah. Skopirati navedek iz posrednega vira je primerno le, kadar jasno navedemo, da gre za posredni vir. Verodostojnost clanka je odvisna od verodostojnosti virov, cesar pa ne moremo zagotoviti, ce sami virov nismo preverili.« (Wikipedija: Navajanje virov)
Poleg tega je v nasprotju s prirocnikom tudi nadomescanje potencialnih slovenskih virov z viri v tujih jezikih, saj se: » ... slovenska Wikipedija zavzema za citiranje slovenskih virov, kjer je to mogoce. Ti imajo pri enaki kakovosti vselej prednost pred viri v tujih jezikih.« (Wikipedija: Navajanje virov) Glede na rezultate in analizo izbranih clankov v dveh letih bi se lahko uredniki nekaterih clankov potrudili in nasli slovenske vire ter z njimi ustrezno in kakovostno nadomestili vsaj 10 odstotkov virov v angleskem jeziku. Vendar pa je treba pri vsakrsni kritiki Wikipedije priznati, tako kot Andrew Dalby (7, 2009): »Ker uporabljam Wikipedijo, so napake v clankih Wikipedije, ki jih omenjam, moja krivda. Opazil sem jih, torej bi jih lahko popravil. Napake, ki ste jih opazili vi in jih se niste popravili, so vasa krivda ... Ne samo, da jo beremo, ampak jo tudi pisemo. Ce je ne bi, sploh ne bi obstajala.«
Na podlagi vzorca nakljucnih clankov je povprecen clanek na slovenski Wikipediji mogoce opisati na naslednji nacin: tema povprecnega clanka na slovenski Wikipediji je sportna, geografska, vojaska ali biografska. Povprecen clanek je dolg okrog 165 besed in vsebuje vsaj eno preglednico. Vsaj en vir citira vsak tretji clanek na slovenski Wikipediji, povprecno 2,5 vira na clanek. Okrog 64,5 odstotka virov predstavljajo spletne strani, okrog 29,5 odstotka monografske publikacije in okrog 6 odstotkov clankov. Slovenska Wikipedija vsebuje priblizno 51 odstotkov skrbin, 33 odstotkov dejanskih clankov, 6,5 odstotka seznamov in 9,5 odstotka razlocitvenih strani.
6 Zakljucek
Rezultati raziskave so pokazali, da je vecina izbranih clankov prirejenih po angleski Wikipediji, najpogostejse tematike so naravoslovje, sport in zgodovina. Med pregledom tem izbranih clankov so se pokazale nekatere zanimive lastnosti citiranja clankov z doloceno tematiko. Vecino casopisnih clankov citirajo clanki s sportno vsebino, vecino monografskih publikacij citirajo clanki z zgodovinskimi (osebnosti, dogodki) in naravoslovnimi temami. Prav tako naravoslovni clanki citirajo vecino clankov iz znanstvenih revij. Najvecja pomanjkljivost izbranih clankov se kaze v jeziku virov, ki jih citirajo. Glede na to, da je kar 75 odstotkov izbranih clankov prevzetih iz angleske Wikipedije, je prevladujoc jezik virov anglescina. Poleg tega tudi tisti clanki, ki so izvirni, citirajo pretezno tuje vire. Deloma je mogoce to dejstvo razloziti s temami izbranih clankov - naravoslovni clanki citirajo znanstvene vire v angleskem jeziku, ker so bolje dostopni in jih je vec, sportni clanki o tujih sportnikih citirajo casopisne clanke v angleskem jeziku, ker gre vecinoma za angleske in ameriske sportnike in so teme v njihovih medijih bolje pokrite kot v slovenskih. V splosnem se izbrani clanki, tudi tisti, ki so izvirni, zelo malo ukvarjajo s tematikami, ki bi bile izrazito slovenske. Tako so nakljucni clanki bolj »slovenski «, pokrivajo slovenske geografske pojme, biografski clanki se osredotocajo na slovenske znane osebnosti iz sveta kulture in politike, vendar gre vecinoma za skrbine ali pa za zelo kratke clanke, ki citirajo zelo malo virov, ce sploh. Prav to je predstavljalo najvecjo omejitev raziskave, saj je bilo za vzorec nakljucnih clankov tezko najti smiselne parametre, po katerih bi se jih lahko analiziralo. Ker jih ni bilo mogoce analizirati po enakih kriterijih kot izbrane clanke, je bila primerjava med vzorcema otezena.
Ocitno je, da se uredniki ne posvecajo veliko temu, da bi slovenska Wikipedija ponujala slovenske clanke, ampak sledijo osebnim interesom in pisejo o stvareh, ki zanimajo njih. Pri izbranih clankih dejstvo, da se morebiti ukvarjajo s tematiko, ki bi bila pomembna za slovenski prostor in zanimiva za slovenske bralce, ne pomeni tako rekoc nicesar. Vsakdo lahko predlaga kandidata za izbrani clanek in o njem se glasuje bolj kot ne na podlagi tehnikalij - ali ustreza minimalnim merilom, ali sta jezik in slog ustrezna, ali je dovolj obsiren, ali citira dovolj referenc, predvsem pa ne sme vsebovati veliko rdecih povezav.
Kar zadeva stevilo citiranih virov, obsega in izcrpnosti clankov, so izbrani clanki prav gotovo najkvalitetnejsi clanki slovenske Wikipedije. Glede tematike, ki jih obravnavajo, jezika virov in izvirnosti pa bi se lahko reklo, da nakljucni clanki bolje odrazajo dejstvo, da je to slovenska Wikipedija. Ce se zeli nekdo pouciti o sportu ali naravoslovju, so izbrani clanki slovenske Wikipedije prav gotovo ustrezna zacetna postaja, prek katere je mogoce pridobiti lepo stevilo referenc za nadaljnjo radovednost. Ce pa uporabnik zeli izvedeti kaj o Sloveniji, Slovencih in slovenskih posebnostih, slovenska Wikipedija za to ni dobro izhodisce.
Za konec je treba opozoriti le se na eno dejstvo. Rezultati, ki so predstavljeni zgoraj, ta trenutek najverjetneje ne drzijo vec v celoti. Kot sta opozorili ze Royal in Capila (2008), so namrec informacije na Wikipediji izredno dinamicne. Clanki se lahko cez cas neprepoznavno spremenijo, zato so rezultati studije relevantni sedaj, ze jutri pa morda nic vec.
1 Wikipedija: Pravila in smernice: http://sl.wikipedia.org/wiki/Wikipedija:Pravila_in_smernice
2 Wikipedija: Opredelitev izbranega clanka: http://sl.wikipedia.org/wiki/Wikipedija:Opredelitev_ izbranega_%C4%8Dlanka)
Navedeni viri
Dalby, A. (2009). The world and Wikipedia: How we are editing reality. Draycott, Sommerset: Siduri Books.
Eijkman, H. (2010). Academics and Wikipedia Reframing Web 2.0+ as a disruptor of traditional academic power-knowledge arrangements. Campus-Wide Information Systems, 27 (3), 173-185. Pridobljeno 27. avgusta 2011 s spletne strani: http://www.emeraldinsight.com. nukweb.nuk.uni-lj.si/journals.htm?issn=1065-0741&volume=27&issue=3&articleid=186544 6&PHPSESSID=ai7iu1oech6c855b63gbdippm0
Lindsey, D. (2010). Evaluating quality control of Wikipedia's featured articles. First Monday, 15 (4). Pridobljeno 22. junija 2011 s spletne strani: http://www.uic.edu/htbin/cgiwrap/bin/ ojs/index.php/fm/article/viewArticle/2721/2482
Poderi, G. (2009). Comparing featured article groups and revision patterns correlations in Wikipedia. First Monday, 14 (5). Pridobljeno 2. julija 2011 s spletne strani: http://www.uic. edu/htbin/cgiwrap/bin/ojs/index.php/fm/article/viewArticle/2365/2182
Royal, C. in Kapila, C. (2008). What's on Wikipedia, and What's Not ...? Assessing Completeness of Information. Social Science Computer Review, 27 (1), 138-148. Pridobljeno 3. julija 2011 s spletne strani: http://ssc.sagepub.com.nukweb.nuk.uni-lj.si/content/27/1/138.full.pdf+html
Wikipedija: Navajanje virov. Pridobljeno 2. julija 2011 s spletne strani: http://sl.wikipedia.org/ wiki/Wikipedija:Navajanje_virov
Wikipedija:Opredelitev izbranega clanka. Pridobljeno 1. 7. 2011 s spletne strani: http:// sl.wikipedia.org/wiki/Wikipedija:Opredelitev_izbranega_%C4%8Dlanka
Wikipedija: Pravila in smernice. Pridobljeno 28. junija 2011 s spletne strani: http://sl.wikipedia. org/wiki/Wikipedija:Pravila_in_smernice
Wilkinson, D. in Huberman, B. Cooperation and quality inWikipedia. V WikiSym '07 Proceedings of the 2007 international symposium on Wikis. 157-164. New York: ACM. Pridobljeno 25. junija 2011 s spletne strani: http://www.wikisym.org/ws2007/_publish/Wilkinson_WikiSym2007_ WikipediaCooperationQuality.pdf
Manca Noc
Filozofska fakulteta, Askerceva 2, 1000 Ljubljana
e-posta: [email protected]
red. prof. dr. Maja Zumer
Filozofska fakulteta, Univerza v Ljubljani, Askerceva 2, 1000 Ljubljana
e-posta: [email protected]
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
Copyright Zveza Bibliotekarskih Drustev Slovenije 2012
Abstract
The purpose of this research was to examine the number and type of sources cited by featured articles on the Slovenian Wikipedia and to compare a sample of featured articles with a sample of random articles, with the purpose of determining an indicative framework for the quality of both. 122 featured Wikipedia articles created in 2009, 2010 and 2011 were analysed, particularly the topic and originality of an article and the number, language and type of sources. A sample of featured articles was compared to a sample of 194 random articles which represent average Wikipedia articles. The results showed that most of the featured articles were adapted from the English Wikipedia, the most common topics being natural science, sports and history. It turned out that the majority of random articles were stubs and articles with a minimal number of references, with military, sports or biographic topic.
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer