Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Mészöly Tamás: A Wikimédia és a könyvtárak közös világa
1
Tartalom
• Wikimédia-világ
• Wikipédia és története
• Más Wikimédia-projektek
• Wikidata
• WikiCite, Wikipedia Library, #1Lib1Ref
• GLAM-együttműködések
• Wikimédia 2030
• Esettanulmányok
2
A Wikimédia-világ
• Wikimédia Alapítvány (WMF; Wikimedia Foundation)
• Wikimédia-szervezetek (világszerte 37+1+82 helyi szervezet/csoport, Mo.)
• Projektek (Wikipédia, Wikimédia Commons, Wikidata, Wikiforrás, Wikiszótár,
Wikikönyvek, Wikidézet, Wikifajok, Wikiegyetem, Wikihírek, Wikivoyage, MediaWiki stb.)
3
A Wikimédia-világ
• Wikimédia Alapítvány (WMF; Wikimedia Foundation)
• Wikimédia-szervezetek (világszerte 37+1+82 helyi szervezet/csoport, Mo.)
• Projektek (Wikipédia, Wikimédia Commons, Wikidata, Wikiforrás, Wikiszótár,
Wikikönyvek, Wikidézet, Wikifajok, Wikiegyetem, Wikihírek, Wikivoyage, MediaWiki stb.)
4
A Wikimédia-világ
• Wikimédia Alapítvány (WMF; Wikimedia Foundation)
• Wikimédia-szervezetek (világszerte 37+1+82 helyi szervezet/csoport, Mo.)
• Projektek (Wikipédia, Wikimédia Commons, Wikidata, Wikiforrás, Wikiszótár,
Wikikönyvek, Wikidézet, Wikifajok, Wikiegyetem, Wikihírek, Wikivoyage, MediaWiki stb.)
5
A Wikipédia előtörténete
• i. e. 3-1. század: Alexandiai (papirusz) vs. Pergamoni (pergamen) könyvtár versengése – a világ összes tudásának és
könyvének összegyűjtése – teljesen elpusztultak
• arab tudásgyűjtemények – tudományos módszerek, okiratok igazsághoz
való hűsége, a források beható elemzése, szkeptikus kutatás
• középkori könyvtárak (pl. avignoni pápai könyvtár, Sorbonne, Bibliotheca
Corviniana; Jung-lö encyclopédia)
csak beavatottak számára hozzáférhetőek
• Cyclopædia, or an Universal Dictionary of Arts and Sciences (1728–)
• Encyclopédie „véget vetni a babonáknak és hozzáférést nyújtani az általános
emberi tudáshoz”: ismeretek, tudás eljuttatása mindenkihez, felvilágosodás alapeszméje
• Encyclopédie méthodique: bővítés 35 kötetről 216 kötetre (több ezren
dolgoztak rajta közel 60 éven át)
6
A Wikipédia előtörténete
• Encyclopædia Britannica (angol), Enciclopedia Espasa (spanyol), Meyers Konversations-Lexikon, Brockhaus (német), Révai nagy lexikona (magyar)
• nyomdászattal párhuzamosan a könyvtári gyűjtemények fejlődése
tudásátadás fizikai (nyomtatott) formájú, könyvalapú
• digitális enciklopédiák ötlete (1930-as évektől)
• Gutenberg projekt: digitális könyvtár létrehozása (1971–) “provide as many e-books in as many formats as possible for the entire world to read in as many languages as possible”
• 1990-es évek: digitalizációs projektek (korábbi művek)
• Microsoft Encarta (1993–2000 CD-ROM/DVD, 2000–2009: előfizetőknek online)
7
A Wikipédia története
• Galaxis útikalauz stopposoknak (1978) a Galaxisról szóló útikönyvet
maguk az utazók írták, módosították Project Galactic Guide (1991–2000), h2g2 (1999–2011)
• 1993: Interpedia: online (web-based) enciklopédia, amibe bárki bekapcsolódhat
• 1995: wiki: szoftver, ami támogatja az online közösségi együttműködést (WikiBase,
WikiWikiWeb, Ward Cunningham) – számos szabad változat, pl. UseModWiki (1999)
• 1999: szabad, univerzális enciklopédia alapelvei + GFDL (Richard
Stallman, a szabadszoftver-mozgalom és a Free Software Foundation (FSF) alapítója)
• 2000: Nupedia (Jimmy Wales, Larry Sanger) szerkesztőség szakértőkkel
• 2000. december: központi ellenőrzés nélküli szerkesztőség (Richard Stallman)
• 2001. január 15.: Wikipédia angol nyelvű változatának indulása
• 2001. január 17.: DNUPedia (később GNE)
8
A Wikipédia története
• 2001. szeptember: magyar nyelvű változat létrejötte
• 2001 vége: Nupedia 25 cikk, Wikipédia: 20 ezer cikk 18 nyelven
• 2002. augusztus: .com .org és reklámmentességről való döntés
• 2003. július 8.: magyar változat sikeres újraindulása
• 2004. szeptember: 1 millió szócikk (valamennyi nyelvi változat)
• 2008. március: 10 milliomodik szócikk (Pataki Márta!)
• 2017. december: összesen 47 millió szócikk; az angol 5,5 millió szócikkel rendelkezik, a magyar változat 420 ezer szócikkel a 23. legnagyobb
• világszerte 500 millió olvasó és havi 20 milliárd lapletöltés
9
Wikipédia
• Szabad licenc, szabad tartalom (GFDL, CC-BY-SA)
• Bárki által szerkeszthető
• Sok nyelvi változat (288 működik jelenleg)
• Transzparencia (laptörténet, rendszernaplók)
• Alapelvek:
- ellenőrizhetőség, megbízható források
- semleges nézőpont, tárgyilagos megfogalmazás
- nevezetesség
- feltételezz jóindulatot!, civilizált viselkedés
- közösségi konszenzusra törekvés
10
Wikimédia-projektek
• Wikimédia-projektek közös tulajdonságai:
• szabad szerkeszthetőség (központi ellenőrzés nélküli, közösségi
együttműködésen alapuló munka)
• szabad felhasználhatóság (bárki számára, bármilyen célból)
• MediaWiki-alapúak (transzparencia, változás- és jogosultságkezelés stb.)
• reklámmentes, kizárólag adományokból működik
• azonos alapelvek (semleges nézőpont, ellenőrizhetőség stb.)
• fenntartó/üzemeltető a Wikimédia Alapítvány
11
Wikimédia-projektek
• Wiki =/= Wikipédia !
• MediaWiki: szabad forráskódú wikimotor, a háttérszoftver
• Nupedia, Wikipédia UseModeWikin indult, de hamar kiderült, hogy szükség van egy saját szoftverre
• Magnus Manske, Wikipédia-szerkesztőként írta meg az első változatát, 2002. januárban áttért rá az angol Wikipédia
• 2003: Wikimédia Alapítvány létrejön: hardver + szoftver
12
Wikimédia-projektek
• Wikipédia: „nagyjából” az enciklopédia műfajában maradna
13
Wikimédia-projektek
• „A Wikipédia nem szótár, a Wikipédia-szócikkek nem
szótári bejegyzések”
• 2002. december: Wikiszótár
• többnyelvű szótár (értelmezés, szinonimák, idegen nyelvi változatok, hangos kiejtési útmutatók, etimológiai magyarázatok stb.)
14
Wikimédia-projektek
• „A Wikipédia-szócikkek nem idézetek gyűjteményei”
• 2003. július: Wikidézet
• híres idézetek (emberek, irodalmi alkotások, filmek stb.) és közmondások gyűjteménye
15
Wikimédia-projektek
• „A Wikipédia nem digitális könyvtár, nem forrásművek
gyűjteménye, a Wikipédia-szócikkek nem csak egy mű cselekményének ismertetői”
• 2003. november: Wikiforrás
• szabad forrásművek (klasszikus írásművek, könyvek teljes szövege, forráskódok, történelmi dokumentumok, levelek, törvények,
beszédek stb., és ezek fordításainak) gyűjteménye
16
Wikimédia-projektek
• „A Wikipédia nem saját kutatás vagy az első publikáció
helye, nem irodalmi alkotás, nem használati útmutató vagy receptgyűjtemény stb.”
• 2003. július: Wikikönyvek
• könyvek (tankönyvek, nyelvkönyvek, kézikönyvek, jegyzetek...) létrehozása
• Wikijunior: gyerekkönyvek, mesekönyvek
• Wikiegyetem: jegyzetek és tanulási segédletek gyűjteménye 2006. augusztustól önálló projekt
17
Wikimédia-projektek
• „A Wikipédia nem hírportál, a Wikipédia-szócikkek nem
aktuális események, hírek tudósítására való”
• 2004. november: Wikihírek
• szabad tartalmú, független hírportál (saját anyagok, interjúk!)
18
Wikimédia-projektek
• „A Wikipédia-szócikk nem útleírás, turisztikai tájékoztató”
• 2003. július: Wikitravel (Evan Prodromou and Michele Ann Jenkins)
• 2006. december: Wikivoyage
• 2013. januártól: Wikimédia-projekt
• szabad útikalauz (helyszín- és útleírások, helyi nevezetességek, tippek, ajánlások, menetrendek, nyitvatartási idők stb.)
19
Wikimédia-projektek
• 2004. szeptember: Wikifajok
• az élővilág rendszertani és nevezéktani adatbázisa
• nyelvfüggetlen (latin) szakmai/tudományos műhely
• az összes (földi) létformáról legyen rendszertani és nevezéktani leírás (nem szöveges!)
20
Wikimédia-projektek
• „A Wikipédia nem képgyűjtemény, a Wikipédia-szócikkek
nem galériák” + technológiai megfontolások
• 2004. szeptember: Wikimédia Commons
• közös médiatár, többnyelvű projekt
• > 43 millió szabad médiaállomány (fényképek, grafikák, festmények, animációk, videók stb.)
• társadalmi kapcsolatok, bárhonnan elérhető (API), jogilag ellenőrzött, képfeldolgozás (restaurálás, vektorgrafikai
átalakítás), többnyelvű leírás
21
Wikimédia-projektek
• Technológiai megfontolások
• 2012. október: Wikidata
• szabad tudásbázis, > 40 millió lap
• társadalmi kapcsolatok, bárhonnan elérhető (API), többnyelvű
22
A Wikidata története
23
A Wikidata története
24
A Wikidata története
25
A Wikidata története
26
A Wikidata története
• Gépi olvasásra, feldolgozásra alkalmas adatszerkezet
• DBpedia (2007–): Wikipédia infoboxainak kinyerése, adatbázisban tárolása, szolgáltatása külünböző formátumban (Wikimédiától függetlenül, német egyetemek)
• hasonló projektek:
• Cyc,
• BabelNet,
• YAGO,
• Knowledge Graph (Google),
• True Knowledge (Amazon felvásárolta: Amazon Alexa/Echo)
• stb.
27
A Wikidata története
• Freebase (2007–2016):
• önkéntes közreműködésen alapuló (nem Wikmédia-) projekt
• adatok gyűjtése és szolgáltatása
• cél: szabadon felhasználható adatbázis minden elérhető forrás összegyűjtésével: általános tudásbázis
• API, RDF, adatbázisdump…
• 2010-ben a Google felvásárolta Knowlegde Graph
• 2014 legvégén a Google bejelentette a projekt tervezett fokozatos lezárását (2015. június végén befagyasztás)
• az adatok Wikidatába való importját követően 2016. májusában teljesen leállította
28
A Wikidata története
• Semantic MediaWiki (SMW):
• 2005: MediaWiki-kiterjesztés
• egy adott MediaWiki-példánynak szemantikus tulajdonságok, vizuális (grafikon, naptár, táblázat, térkép stb.) megjelenítés
• egy- vagy néhány nyelvű felület, egyszerűbb
• sok száz nagy MediaWiki-alapú oldal átvette, de
• skálázhatósági problémák a nagy Wikimédia-projektek nem
• WikiBase:
• 2012: a SMW továbbfejlesztése Wikidata
• önálló adatbázisban tárolja az adatokat: központi tárhely
• nem csak egy projekten belül biztosítja a konzisztenciát
• komplex adatformátumokat is lehetővé tesz
• források az adatokhoz
• soknyelvűség támogatása; bonyolultabb 29
DBpedia vs. Wikidata
• DBpedia
• adatok (fél)automatikus kigyűjtése a Wikipédiából (és más Wikimédia-projektekből)
• ezek szolgáltatása kifelé
• Wikimédiától független
• Wikidata:
• adatok gyűjtése és tárolása közösségi együttműködés alapján
• soknyelvű, általános tudásbázis
• szolgáltatás a Wikimédia-projektek számára és
• szolgáltatás külső partnerek felé
30
Wikidata
31
Wikidata
• 1. fázis
• projektek közötti linkek (interwikilinkek)
• 2013. január: magyar Wikipédia az első, ahol kísérletként bekapcsolták, majd néhány hónap alatt fokozatosan a többin is
32
Wikidata
• 1. fázis
• projektek közötti linkek (interwikilinkek)
• 2013. január: magyar Wikipédia az első, ahol kísérletként bekapcsolták, majd néhány hónap alatt fokozatosan a többin is
33
34
Wikidata
• 1. fázis
• projektek közötti linkek (interwikilinkek)
• 2013. január: magyar Wikipédia az első, ahol kísérletként bekapcsolták, majd néhány hónap alatt fokozatosan a többin is
• 2. fázis
• állítások bevezetése, közvetlen adatlekérdezés
• 2013 első felében fokozatosan
• 2015 vége: adatok áttételes lekérdezésének lehetősége
35
Wikidata
• 1. fázis
• projektek közötti linkek (interwikilinkek)
• 2013. január: magyar Wikipédia az első, ahol kísérletként bekapcsolták, majd néhány hónap alatt fokozatosan a többin is
• 2. fázis
• állítások bevezetése, közvetlen adatlekérdezés
• 2013 első felében fokozatosan
• 2015 vége: adatok áttételes lekérdezésének lehetősége
• 3. fázis
• adatbázislekérdezés és listák generálása az adatbázisból
• szolgáltatások fejlesztése
36
Wikidata
• 1. fázis
• projektek közötti linkek (interwikilinkek)
• 2013. január: magyar Wikipédia az első, ahol kísérletként bekapcsolták, majd néhány hónap alatt fokozatosan a többin is
• 2. fázis
• állítások bevezetése, közvetlen adatlekérdezés
• 2013 első felében fokozatosan
• 2015 vége: adatok áttételes lekérdezésének lehetősége
• 3. fázis
• adatbázislekérdezés és listák generálása az adatbázisból
• szolgáltatások fejlesztése
37
Wikidata
• https://query.wikidata.org/
SELECT ?universityLabel ?universityDescription ?website ?coord WHERE {
?university (wdt:P31/wdt:P279*) wd:Q3918.
?university wdt:P17 wd:Q28.
?university wdt:P625 ?coord.
OPTIONAL { ?university wdt:P856 ?website. }
SERVICE wikibase:label { bd:serviceParam wikibase:language "hu". }
}
38
Wikidata
• https://www.wikidata.org/wiki/Wikidata:How_to_use_data_on_Wikimedia_projects
• https://www.wikidata.org/wiki/Wikidata:Wikidata_in_Wikimedia_projects
• https://www.wikidata.org/wiki/Wikidata:Tools/Visualize_data
• Reasonator: https://tools.wmflabs.org/reasonator/
• https://tools.wmflabs.org/reasonator/?q=Q316556&lang=hu
• https://tools.wmflabs.org/autodesc?q=316556&lang=&mode=long&links=reasonator&redlinks=reasonator&format=html
• ArticlePlaceholder: https://www.mediawiki.org/wiki/Extension:ArticlePlaceholder
• https://se.wikipedia.org/w/index.php?search=János+Arany
• Listák automatikus generálása
• Structured data on Commons:
• WikiBase telepítése a Wikimédia Commonsra
• soknyelvűség megoldása (pl. kategóriarendszerben, leíró adatoknál)
• fejlett kereső, szűrők, lekérdezési lehetőségek
• gépi hozzáférés továbbfejlesztése; alkalmazások hozzákapcsolhatósága
• külső partnerségek jobb támogatása 39
WikiCite
• szabad bibliográfiai (és idézettségi) adatbázis
• 2005: tervek, de a Wikidata megjelenése után volt lehetőség rá
• könnyen megtalálhatóak legyenek a forrásművek
• könnyen beilleszthetőek legyenek a MediaWiki-oldalakon
• több tudományos műre hivatkozás (mint hírportálok, újságok…)
• kutatási célok támogatása; adatok, lekérdezések
• szlogen: „az emberi tudás összességének megbízható forrásokkal való ellátása”
• Wikidatán belüli projekt
40
WikiCite
• közös műhelyt biztosít:
• informatikai ontológiával foglalkozó szakemberek
• könyvtárosok
• kiadók
• kutatók
• szoftverfejlesztők, mérnökök
• Wikipédia-szerkesztők
• Wikidata-közreműködők
• adatmegjelenítéssel foglalkozó szakemberek
• https://meta.wikimedia.org/wiki/WikiCite_2016
• https://meta.wikimedia.org/wiki/WikiCite_2016/Report
• https://meta.wikimedia.org/wiki/WikiCite_2017
41
WikiCite
42
WikiCite
43
WikiCite
44
WikiCite
• Jelenlegi működése
• 9780241263198
• elmúlt fél évben a Wikidata bővülésének nagy része a WikiCite adatimportjából származik
• 4000 tulajdonság (property) kb. fele hozzá tartozik!
• A Wikipédia már most is az 5. legnagyobb számban hivatkozik tudományos folyóiratcikkekre
• A Wikipédiáról érkezik a legtöbb olvasó a tudományos folyóiratokhoz, irodalomhoz!
Geoffrey Bilder, CrossRef
45
Wikipedia Library
• forrásművekhez való hozzáférés biztosítása
• a Wikipéda-szerkesztők számára
• írott művek, amik nem elérhetőek az interneten (pl. papírkönyv)
• tudományos művek, melyekhez csak fizetés esetén lehet hozzáférni
• együttműködés kiadókkal, digitális könyvtárakkal, adatbázisokkal
• jelenleg egyedi kérelem alapján, korlátozott számban és időre, de folyamatban van ennek kibővítése
• https://meta.wikimedia.org/wiki/The_Wikipedia_Library
• https://wikipedialibrary.wmflabs.org/partners/
46
Wikipedia Library
• Célok általánosabban:
• hozzáférés biztosítása kiadók, adatbázisok, könyvtárak, egyetemek gyűjteményeihez
• segítség az információk, állítások forrásait megtalálásához
• együttműködés elősegítése: a szerkesztők, könyvtárak és könyvtárasok
• szerkesztők irányítása a helyi könyvtárakhoz és más adatforrásokhoz
• nyílt/szabad elérésű publikációs és kutatási formák népszerűsítése (pl.)
• Magyarországi együttműködések:
• BME OMIKK (2010)
• KSH Könyvtár (2016)
• ELTE Egyetemi Könyvtár és Levéltár (2017)
47
#1Lib1Ref
• 1 könyvtáros => 1 forráshivatkozás
• a Wikipédia követelményei szigorodtak az évek alatt
• Cél: állítások forrásokkal való ellátása
• a könyvtárosok hozzáállása általában hasonló
• hozzáférnek a forrásművekhez
• a könyvtárosok érdeklődésének felkeltése, bevonása
• Részvétel módjai:
• adott területen otthonos: az adott témában ad hozzá
• egy szócikk kiválasztása böngészés közben
• a forráshiányos szócikekk/állítások listájából választás
• erre írt játék segítségével
• #1Lib1Ref hozzáadása a szerkesztési összefoglalóhoz
• https://meta.wikimedia.org/wiki/The_Wikipedia_Library/1Lib1Ref 48
GLAM
• GLAM = Galleries, Libraries, Archives, Museums
• Együttműködés memóriaintézményekkel:
• gyűjtemény közös digitalizálása, bemutatása
• gyűjtemény feltöltése a Wikimédia Commonsra
• ötletek, ismeretek megosztása (pl. hogyan lehet megjeleníteni a gyűjteményt, hogyan lehet a Wikimédia-projekteket felhasználni...)
• közös rendezvények, programok (előadások, képzések, konferenciák, intézménylátogatások, Wikipedian in residence stb.)
• https://outreach.wikimedia.org/wiki/GLAM
• https://outreach.wikimedia.org/wiki/GLAM/Case_studies
• https://commons.wikimedia.org/wiki/Commons:GLAM
49
GLAM
• Miért?
• Wikimédia célja a kulturális örökség megőrzése és bemutatása
• százmilliós, globális látogatottság gyűjtemény elérése, látogatottsága, ismertsége nagyságrendekkel nő
• hatalmas forgalomra optimalizált platform, szolgáltatások
• a gyűjtemény nem csak egy elzárt adatbázis lesz, hanem élő, használt (művek kontextusban, leírásokkal, Wikipédiában; más hasonló művekkel együtt egy nagyobb gyűjtemény)
• önkéntes közösség tud ellenőrizni a leírásokban, fordításban, ellenőrzésben, korrektúrában, rendszerezésben, kategorizálásban
• képjavítás, képhelyreállítás vektorizálálás stb.
• a feltöltött művek visszalinkelnek az eredeti gyűjteményre
• részletes statisztikák a művek felhasználásáról, egyéb eszközök
• non-profit szervezet, szabad szoftverek és licencek
50
Wikimédia 2030
• Wikimédia-stratégia a következő 15 évre
• ismeretek, kulturális örökség összegyűjtése
• a hiányok kitöltése prioritást kap
• nyílt platform, szolgáltatások, egy ökoszisztéma elérése
• https://meta.wikimedia.org/w/index.php?title=Wikimedia_2030
• Wikimédia Commons, Wikidata, WikiCite, Wikipedia Library …
• helyi együttműködések kialakítása, kölcsönös előnyök
51
GND
• GND (Gemeinsame Normdatei): német nemzeti könyvtár
üzemeltetésében, >1000 tagszervezettel (No., A., Svájc):
• személyek
• szervezetek
• rendezvények
• földrajzi nevek
• (szerzői) alkotások stb.
• gyűjtése, rendszerezése; közös(ségi) munkával.
• GND: 4,4 millió személy, 330 ezer földrajzi hely
• WD: 3,8 millió személy, > 2 millió közigazgatási egység
52
GND
• GND:
• felülről szervezett hatósági nyilvántartás
• állandó és egyenletes minőség
• megbízhatóság (minőség, elérhetőség)
• WD:
• önkéntes közösségi irányítású kapcsolati csomópont,
• ellenőrizhetőség
• soknyelvűség
• Mindkettő
• közösségi együttműködésen alapuló; nyílt, szabadon felh.
• Forrás: Sarah Hartmann, Barbara Pfeifer, Jürgen Ket https://media.ccc.de/v/wikidatacon2017-10017-fostering_the_cooperation_between_gemeinsame_normdatei_gnd_and_wikidata#video&t=273
53
GND
• az adatlapok linkelnek a Wikidata-elemre, és fordítva
• Wikimédia-közreműködők összehasonlítják a kettőt: hibakeresés, eltérések feltárása
• ezzel foglalkozó Wikimédia-közreműködők számára hozzáférés a GND-hez: hibák javítása, új elemek felvitele
• tervezik a WikiBase-re váltást, együttműködés kiszélesítését
54
Holland Nemzeti Könyvtár
• Wikidatát használ a többi tudásbázissal való kapcsolatra
(>2000 külső adatbázis-azonosítót tartalmaz)
• más, külső információkat is megjelenít
55
Holland Nemzeti Könyvtár
56
Holland Nemzeti Könyvtár
57
Holland Nemzeti Könyvtár
58
Licenc
Copyright (2017): Mészöly Tamás
Az előadáshoz felhasznált illusztrációk:
Wikimédia-szervezetek térképe, közkincs, Effeietsanders
Mi nem való a Wikipédiába?, CC-BY-SA 3.0, Wikipédia-szerkesztők
Arany János, CC-BY-SA 3.0, Wikipédia-szerkesztők
Budapest, CC-BY-SA 3.0, Wikipédia-szerkesztők
A Wikidata adatmodellje, CC-BY-SA 3.0, Charlie Kritschmar (WMDE) és Mészöly Tamás
A WikiCite modellje, CC-BY-SA 3.0, DarTar
A Holland Nemzeti Könyvtár és a Wikidata, CC-BY-SA 4.0, Theo van Veen
A Wikimedia/Wikimédia név és logó, valamint a Wikimédia-projektek nevei (pl. Wikipédia)
és logói a Wikimédia Alapítvány (Wikimedia Foundation, Inc.) bejegyzett védjegyei,
felhasználásuk kizárólag külön engedéllyel lehetséges!
Az előadás Tomasz Ganicz sablonjának felhasználásával készült. 59