ETO-jelzetek posztkoordinált visszakeresése

  • View
    35

  • Download
    0

Embed Size (px)

DESCRIPTION

ETO-jelzetek posztkoordinlt visszakeresse. Piros Attila T mavezet: Dr Boda Istvn. Cl. Olyan indexel s keres algoritmus s azt megvalst program kidolgozsa, ami lehetv teszi dokumentumok tartalmi feltrst s visszakeresst az Egyetemes Tizedes Osztlyozs felhasznlsval. - PowerPoint PPT Presentation

Transcript

  • ETO-jelzetek posztkoordinlt visszakeressePiros AttilaTmavezet: Dr Boda Istvn

  • Cl Olyan indexel s keres algoritmus s azt megvalst program kidolgozsa, ami lehetv teszi dokumentumok tartalmi feltrst s visszakeresst az Egyetemes Tizedes Osztlyozs felhasznlsval.

  • Mirt az ETO?Egyetemes, minden szakterletre kiterjed, hierarchikus rendszer0 ltalnos tartalm rsmvek.00 A tudomny s kultra legltalnosabb alapjai.004 Szmtstechnika.004.4 Szoftver. Program.004.42 Programozs.004.422 Programok elemei.004.422.3 Vltoz.004.422.35 Vltoz deklarci.004.422.352 Explicit vltoz deklarci.

  • Mirt az ETO?Rugalmas A hierarchiban nem szerepl fogalmak lersra ltalnos s specilis alosztsok rendszere ll rendelkezsre510.6+510.2(075.8)(47+51)=161.1 Matematikai logika s halmazelmlet. Egyetemi tanknyv orosz nyelven.004.451.7:004.7 Osztott idej adatfeldolgozs szmtgpes hlzatokban.Nvalosztsok is hasznlhatk004.655.3 T-SQL Szabvnyos lekrdez nyelv (SQL) T-SQL004.912=93C++ C++ -ban rt szvegszerkeszt programBvthet ms osztlyozsi nyelvbl vett jelzetekkel

  • Mirt az ETO?Vilgszerte elterjedt s hasznltEgyike a vilg kt legelterjedtebb osztlyozsi rendszernekA tblzatok legalbb 51 nyelvre le vannak fordtvaTbb, mint szz ve hasznljk (Magyarorszgon is) dokumentumok tartalmi feltrsraLtez nagy gyjtemnyek vannak mr feldolgozva veleOlyan rendszerre van szksgnk, ami mr rgztett jelzetek feldolgozsra (retrospektv konverzi) is alkalmasFolyamatosan karbantartott s aktualizlt

  • Mirt az ETO?Online elrhet:egyelre csak 2.600 osztly, 51 nyelven (magyarul is!)UDC Summary (bngszhet) http://www.udcc.org/udcsummaryUDCS Linked Data, letlthet SKOS (XML/RDF) formtumban: http://udcdata.info/Minden osztly s aloszts (mveletek is) sajt URI-al rendelkezik

  • Eddigi megoldsokCsak rszmegoldsok vannakOk: az ETO termszetes nyelvi jellege, a szablyainak ebbl add bonyolultsga s kvetkezetlensgePldul:mveletek hasznlhatsga s jelentse tblzatonknt vltoz Pl. sszekts, viszonyts, aposztrfrszjelzetek hatra s szerepe nem mindig egyrtelmszempont szerinti ltalnosan kzs alosztsok s specilis alosztsok szmjelzetes specilis alosztsokpont-nulls alosztsok (372.814.08 vilgnzet alapja tantrgy)

  • MegoldstpusokPrekoordinci: Jelzetelemek manulis kiemelse. gy mkdtek az offline szakkatalgusok is.Htrnyai:Nem automatizlhatIntervallumok kezelsre alkalmatlan (megfelel keres algoritmus megoldhatn)Csak a kiemelt jelzetek kereshetk, minden ms elvsz a keres szmraNagy az indexel felelsge

  • MegoldstpusokJelzetelemek egyesvel trtn bevitele: A rendszer nem a ksz ETO-szm berst vrja el, hanem az egyes jelzetelemek megadst.Elnye: bngszhetv tehetk az elemek, ami megknnytheti az indexelstHtrnyai:Krlmnyes a jelzetbevitelNem automatizlhatNem kezeli elgg az ETO rugalmassgt (tbb azonos tpus aloszts, alosztsok mveletei stb.)

  • MegoldstpusokKeress csonkolssal: Htrnyai:A keres szemlyre nagy terhet r az ETO rugalmassga miatt (mindig szmba kell venni minden lehetsget, alaposan ismerni kell az ETO-t s a rendszert (!) is)nagyon lassak ezek a keressek, s indexszel sem gyorsthatk intervallumok kezelse lehetetlen (visszahvs srl)szmok egymshoz val kapcsoldsa (teht az az informci, hogy pl. melyik aloszts melyik rszjelzethez kapcsoldik) elvsz (nagy a zaj, a preczi srl)mivel az ETO maga is hierarchikus rendszer, egy keres algoritmusnak ezt csonkols nlkl is kezelnie kell.

  • ClOlyan mdszert adni a jelzetek eltrolsra s visszakeressre, amely a lehet legnagyobb pontossg s teljessg tallati listt eredmnyezi anlkl, hogy akr a indexeltl akr a kerestl az elmentend illetve visszakeresend jelzetek szablyos elksztsn vagy kivlasztsn tl brmifle erfesztst ignyelne (mint pldul a fontosnak vlt jelzetelemek kiemelst, a jelzetek csonkolst, permutcijt vagy a szabvnyos jelzetelemek ms karakterrel trtn helyettestst).A hatkonysg empirikus vizsglata.

  • TeendkETO ltal felvetett krdsek s problmk elemzse:A jelzeten bell milyen informcikat kell figyelembe venni s invertlni illetve elmenteniMire kell figyelni a jelzetek elemzsekor, milyen problmk lehetnekKsz (jhetnek el j krdsek, az ETO is vltozik)

  • TeendkAutomata elksztse:Vges automata, bemen jelei az index karakterei, kimenet egy XML, ami reprezentlja a jelzetet.Diagram ksz, implementci folyamatbanXML sma definci:Elssorban technikai clt szolglA UDC Summary URI-ainak segtsgvel felhasznlhat a komplex jelzetek sszektsre a UDC Linked Data-valA sma definci kszen van

  • TeendkAz adatok adatbzisba mentseAlapelvek le vannak rvaKeress rszletes kidolgozsa s implementlsaAlapelvek le vannak rva

  • IrodalomjegyzkAdatbzis transzformcialap kereshetsgjavtsa: ETO-kereshetsg a BME OMIKK Aleph rendszerben / Marton Jzsef; Prokn Palik Mria.- Bp.: TMT, 56. vf. (2009) 2. sz.Egyetemes Tizedes Osztlyozs. Bp.: OSZK-KI, 2005.Az ETO alkalmazsa a gpestett dokumentcis s knyvtri munkban / Orosz Gbor. In: Szveggyjtemny az osztlyozs s indexels krdseinek tanumnyozshoz. Bp.: Tanknyvkiad., 1988.Az ETO az Orszgos Szchnyi Knyvtr szmtgpes rendszerben / Zldi Pter. In: Knyvtri Figyel, 1993. 3. sz. - http://ki.oszk.hu/kf/1993/10/az-eto-az-orszagos-szechenyi-konyvtar-szamitogepes-rendszerebenBevezets az informcikeres nyelvek elmletbe s gyakorlatba. B. Hajdu gnes; Babiczky Bla. Bp.: Universitas kiad., 1998szrevtelek egy ETO-rl szl tanulmnyhoz / Ungvry Rudolf. In: Knyvtri Figyel, 2011. 2. sz. - http://ki.oszk.hu/kf/2011/07/eszrevetelek-mandy-gabor-tanulmanyahozKnyvtri feldolgoz munka : Osztlyozs s szakkatalgus szerkeszts / Babiczky Bla Bp.: Tanknyvkiad, 1975.Knyvtri informcikeress / Ungvry Rudolf, Vajda Erik. Bp.: Typotex, 2002.Knyvtri osztlyozsi segdletek : a segdknyvtroskpzs cljra / Mndy Gbor. - http://etotanf.x3.huKutatsi tervezet az ETO-nak mint gpestett referencia-keresrendszer indexelsi nyelvnek kirtkelsre / Orosz Gbor. In: Szveggyjtemny az osztlyozs s indexels krdseinek tanumnyozshoz. Bp.: Tanknyvkiad., 1988. p. 231-233Rgi ETO, j ETO / Mndy Gbor. In: Knyvtri Figyel, 2011. 2. sz. - http://ki.oszk.hu/kf/2011/07/regi-eto-uj-eto/Research Project for the Evaluation of the UDC as the Indexing Language for a Mechanized Reference Retrieval System: Progress Report for the Period July 1, 1965-January 31, 1966 / Pauline Atherton Cochrane; Robert R. FreemanUDC Summary Linked Data. - http://udcdata.info/UDC as Linked Data. In: UDC Blog, 2012.08.26. - http://universaldecimalclassification.blogspot.hu/2012/08/udc-as-linked-data.htmlUDC Summary. - http://www.udcc.org/udcsummary/php/index.phpKnyvtrosok kziknyve : 2. ktet / Horvth Tibor; Papp IstvnAz Egyetemes Tizedes Osztlyozs (ETO) alapelvei, revizijnak s kiadsnak szablyai / Csengdy Eszter. Budapest: OMIKK, 1983 Szemlletvltozs az ETO jelzetszerkesztsben / Babiczky Bla. In: Knyvtri Figyel, 1985. 1. sz.

  • Ksznm a figyelmet.