D O K U M E N T U M A Z O N O S Í T Ó F á j l n é v : drotos_laszlo_az_oszk_webarchivumanak_ujdonsagai.jpg F ő c í m : Az OSZK webarchívumának újdonságai B e s o r o l á s i c í m : OSZK webarchívumának újdonságai S z e r e p : létrehozó B e s o r o l á s i n é v : Drótos U t ó n é v : László I n v e r t á l a n d ó n é v : N E s e m é n y : felvéve I d ő p o n t : 2020-01-29 E s e m é n y : elérhető I d ő p o n t : 2019-11-14 D á t u m r a v o n a t k o z ó m e g j e g y z é s : A prezentáció előadásának időpontja. A t í p u s n e v e : prezentáció A t í p u s n e v e : előadás M e g n e v e z é s : Prezentáció M e g n e v e z é s : Könyvtártudomány - prezentáció M e g n e v e z é s : OSZK MEK A j o g t u l a j d o n o s n e v e : Drótos László S z e r z ő i j o g i m e g j e g y z é s e k : Jogvédett T é m a k ö r : Számítástechnika, hálózatok A l t é m a k ö r : Elektronikus publikáció T é m a k ö r : Számítástechnika, hálózatok A l t é m a k ö r : Internetes technológia T é m a k ö r : Könyvtártan, információtudomány A l t é m a k ö r : Elektronikus szöveg és könyvtár T á r g y s z ó : digitális könyvtár M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : digitális archívum M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : internet M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : web M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : tartalomszolgáltatás M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : elektronikus szolgáltatás M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : archivált példány M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : hipermédia M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : gyűjtemény M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : on-line katalógus M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : időszaki kiadvány M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : nemzetközi kapcsolat M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : 2018 M i n ő s í t ő : időszak
L E Í R Á S N y e r s v a g y O C R - e s s z ö v e g : Drótos László
Az OSZK
webarchívumának újdonságai
"404 Not Found - Ki őrzi meg az internetet?" workshop
Országos Széchényi Könyvtár
Budapest, 2019. november 14.
A web egy hipermédia dokumentum?
https://boon.hu/kozelet/helyi-kozelet/uj-gazdara-talalhatnak-a-lomjaink-3875754/
208 fájlkérés
29 doménről
15-féle fájlformátum
15 megabájt összméret
157 kimenő link
58 domén irányába
9-féle bitsüti
A web egy hipermédia dokumentum?
CMS: WordPress 5.0.3
Widget: Facebook, Twitter
Analytics: Google Analytics, Gemius,
Chartbeat
Blog: WordPress 5.0.3
Captcha: reCAPTCHA
Font Script: Google Font API
Web Framework: Bootstrap
Miscellaneous: Twitter Emoji (Twemoji),
HTTP/2
Cache Tool: Varnish5.0
Programming Language: PHP
CDN: CloudFlare
Database: MySQL
Advertising Network: Adverticum
SEO: Yoast SEO9.4
JavaScript Libraries: jQuery 1.12.4, jQuery Migrate 1.4.1, jQuery UI 1.12.1
Egy mai weboldal részben már szoftver, melyet a webszerver és a böngésző együttesen futtat.
Az OSZK webarchívuma
indulás 2017-ben az Országos Könyvtári Rendszer projekt keretében;
ideiglenes szerverek a KIFÜ-nél (zárt archívum) és az OSZK-ban (nyilvános demó);
használt/tesztelt szoftverek: Heritrix, WAIL, WCT, NAS, Brozzler, Webrecorder, WARCreate, Warcit, Wget, HTTrack, Web ScrapBook, PyWb, OpenWayback, SolrWayback, Webrecorder Player, Nimbus, Grab Them All, Puppeteer ...;
2017-2019 közötti aratások
téma szerint: közgyűjtemény, felsőoktatás, kutatás/tudomány, kormányzat/önkormányzat, vallás/egyház, közművelődés/kultúra általában, szépirodalom, egyéb művészet
(előkészítés alatt: könyvkiadás/könyvkereskedelem);
esemény szerint: téli olimpia, országgyűlési/EP/önkormányzati választás, Rákóczi-emlékév;
intézmény szerint: az Országos Széchényi Könyvtár online szolgáltatásai;
műfaj szerint: elektronikus periodikák;
a .hu domén szerint: az első 2018 szeptemberében (291 ezer domén), a következő várhatóan 2019 decemberében (az eddig mentett weboldalakban linkelt további .hu végű domének és aldomének is);
zárt gyűjtemény: válogatott webhelyek száma: kb. 20 ezer, az archívum összmérete:
29 terabájt, a lementett fájlok/URL-ek száma közel 500 millió;
nyilvános gyűjtemény: 186 honlap, blog és időszaki kiadvány + 44 OSZK-s webhely
(teljes szövegű keresővel).
Az OSZK webarchívuma
Periodikák weboldalainak archiválása
Periodikák weboldalainak archiválása
Periodikák weboldalainak archiválása
Periodikák weboldalainak archiválása
A projekt egyéb újdonságai
A projekt egyéb újdonságai
A projekt egyéb újdonságai
Ismeretterjesztés
Ismeretterjesztés
Ismeretterjesztés
Nemzetközi kapcsolatok
Nemzetközi kapcsolatok
Nemzetközi kapcsolatok
Nemzetközi kapcsolatok
magyar tartalom átvétele az ArchiveTeam gyűjteményéből (626 gigabájt WARC fájl);
javaslatok az IIPC felé (pl. ajánlás az archiválást segítő mikroformátumokra) és válaszok a kérdőívekre (pl. az OpenWayback használatáról);
archiválási célból magyar linkek gyűjtése az IIPC tagok számára (pl. a christchurchi terrorista támadás, a Notre Dame leégése, klímaváltozás, mesterséges intelligencia, az EP választások);
szoftvertesztek és javaslatok a fejlesztőknek (pl. WCT, SolrWayback, Memento Tracer);
személyes kapcsolatok szlovák, cseh, osztrák, holland, belga, dán ... webarchiváló kollégákkal;
EU-s COST Action projekt-javaslatok támogatása: Transnational Research Use of Web ARChives (TRUeWARC) és Web ARChive Studies Network Researching Web Domains and Events (WARCnet);
részvétel és előadások külföldi konferenciákon (pl. IIPC WAC, IFLA, BOBCATSSS, CDA, Colloquium of Library and Information Experts of the V4+ Countries);
jövő évi terv: közép-európai együttműködés kezdeményezése a környező országok webarchívumai között (pl. közös portál és keresőfelület).
Középtávú tervek
tananyag a személyes webarchiválásról;
új tematikus gyűjtemények (pl. történelem/helytörténet, média, sport, közoktatás);
a nyilvános gyűjtemény bővítése és metaadatolása;
az RDA-alapú metaadatolás előkészítése;
új infrastruktúrára költözés;
új honlap, böngésző- és keresőfunkciókkal;
kapcsolódás az OKP moduljaihoz (pl. partner nyilvántartás, jogkezelés, hozzáférés kezelés, discovery eszköz, hosszú távú megőrzés, MNB), a Nemzeti Névtérhez (pl. települések honlapjai) és a többi digitális gyűjteményhez (pl. periodikák archivált weboldalainak kereshetősége az EPA-ban);
együttműködés a KDS pályázat nyerteseivel és más közgyűjteményekkel, egyetemekkel és kutatóintézetekkel, stb.
Rákóczi-emlékév webarchívum
Rákóczi-emlékév webarchívum
Rákóczi-emlékév webarchívum
Rákóczi-emlékév webarchívum
Rákóczi-emlékév webarchívum
Köszönöm a figyelmet! D o k u m e n t u m n y e l v e : magyar K a p c s o l ó d ó d o k u m e n t u m n e v e : Drótos László - Németh Márton: Kísérleti webaratás projekt az OSZK-ban A f o r m á t u m n e v e : PowerPoint prezentáció O l d a l a k s z á m a : 26 T e c h n i k a i m e g j e g y z é s : Microsoft Office PowerPoint 2003 M e t a a d a t a d o k u m e n t u m b a n : N A f o r m á t u m n e v e : HTML dokumentum T e c h n i k a i m e g j e g y z é s : HTML 5 verzió M e t a a d a t a d o k u m e n t u m b a n : N L e g j o b b f o r m á t u m : JPEG képállomány L e g n a g y o b b k é p m é r e t : 770x433 pixel L e g j o b b f e l b o n t á s : 71 DPI S z í n : színes T ö m ö r í t é s m i n ő s é g e : közepesen tömörített A z a d a t r e k o r d s t á t u s z a : KÉSZ A d o k u m e n t u m s t á t u s z a : INSIDE S z e r e p / m i n ő s é g : katalogizálás A f e l d o l g o z ó n e v e : Nagy Zsuzsanna |