D O K U M E N T U M A Z O N O S Í T Ó F á j l n é v : pallinger_peter_science.jpg B é l y e g k é p : https://dka.oszk.hu/130100/130135/pallinger_peter_science_kiskep.jpg F ő c í m : Kutatási adatrepozitórium: science-data.hu B e s o r o l á s i c í m : Kutatási adatrepozitórium: science-data.hu E g y é b c í m : Technológiai áttekintés M i n ő s í t ő : alcím S z e r e p : létrehozó B e s o r o l á s i n é v : Pallinger U t ó n é v : Péter I n v e r t á l a n d ó n é v : N E s e m é n y : felvéve I d ő p o n t : 2022-06-22 E s e m é n y : kibocsátva I d ő p o n t : 2022-04-21 D á t u m r a v o n a t k o z ó m e g j e g y z é s : Az előadás időpontja. A t í p u s n e v e : prezentáció A t í p u s n e v e : előadás M e g n e v e z é s : Prezentáció M e g n e v e z é s : Könyvtártudomány - prezentáció M e g n e v e z é s : Networkshop 2022 M e g n e v e z é s : Panopto A j o g t u l a j d o n o s n e v e : Pallinger Péter S z e r z ő i j o g i m e g j e g y z é s e k : Jogvédett T é m a k ö r : Könyvtártan, információtudomány A l t é m a k ö r : Könyvtárvezetés, könyvtárügy T á r g y s z ó : kutatás M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : repozitórium M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : adat M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : adatmodell M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : 2022 M i n ő s í t ő : időszak K é p a l á í r á s : Kutatási adatrepozitórium: science-data.hu Technológiai áttekintés N y e r s v a g y O C R - e s s z ö v e g : Kutatási adatrepozitórium: science-data.hu
Technológiai áttekintés
Pallinger Péter, SZTAKI DSD
2022. 04. 21.
pallinger.peter@sztaki.hu
Az adatrepozitórium története
2020-ban jött létre CONCORDA néven
SZTAKI és WIGNER intézetek összefogásában
Régi MTA/ELKH felhőben
mind a SZTAKI, mind a WIGNER telephelyen
Valmint a DSD fehőjében
Harvard dataverse 4.20 alapokon
A Dataverse
Harvard által fejlesztett adatrepozitórium kifejezetten kutatási adatok megosztására
Adatmodell
Tárolók (Dataverse)
Tárolókban további tárolók vagy adatcsomagok lehetnek
Adatcsomagok (Dataset)
Részletes és gazdag metaadatok az adatcsomagokban
Adatcsomagok csak fájlokat tartalmazhatnak
A Dataverse adatmodellje
Dataverse változtatások a CONCORDA-ban
Felület kétnyelvűsítése (magyar/angol)
Párhuzamos angol-magyar metaadatolás
Ansible telepítő szkriptek adaptálása Debianra és idempotenssé tétele
Eredetileg CentOS volt, ami már "megszűnt"
Megosztva, és nagyrészt visszaolvasztva a Github-on
Concorda eredeti architektúra
Dataverse technológiai rétegzés
Haproxy: SSL lezárás, terheléselosztás, DOS védelem
Apache2+mod_shib: SAML azonosítás (EduID)
Payara: Dataverse Java servlet
SOLR: metaadat full-text index
PostgreSQL: metaadat-adatbázis
Fájlrendszer / Amazon S3 / SWIFT: Adatok tárolása
ELKH adatrepozitórium projekt 2022
ELKH által támogatott országos kutatási adatrepozitórium felállítására
Minden ELKH tagintézmény számára elegendő adattárolási kapacitással és megfelelő funkciókkal
A CONCORDA továbbvitele és továbbfejlesztése mellett döntöttünk
Már megtörtént változások
Új domain: science-data.hu
Az új ELKH felhő (science-cloud.hu) mintájára
Friss dataverse (5.10)
Átköltözés az új ELKH felhőbe
Érvényes handle azonosítók regisztrációja
Ansible telepítőszkriptek fejlesztése és megosztása
Jelenlegi architecktúra
Használati statisztika (2022 Április)
51 tároló
1194 adatcsomag
7300 fájl
2.5 TB adat
51 felhasználó
16 intézetből
Tervezett fejlesztések
API feltöltőszkriptek fejlesztése
Magyarítás aktualizálása
ARK azonosítók támogatása (https://arks.org/)
SWIFT objektumtárra átállás dedikált CEPH klaszteren
Adatcsomagok, fájlok közvetlen elérhetősége az ELKH felhőben futó projektekből
Köszönöm a figyelmet!
SZTAKI: www.sztaki.hu
DSD: dsd.sztaki.hu
Adatrepozitóium projekt: science-research-data.hu
CONCORDA: science-data.hu
ELKH CLOUD: science-cloud.hu D o k u m e n t u m n y e l v e : magyar K a p c s o l ó d ó d o k u m e n t u m n e v e : Meiszterics Enikő, Gárdos Judit: Az ELKH kutatók igényeinek felmérése adatrepozitóriumok létrehozására A f o r m á t u m n e v e : PowerPoint prezentáció O l d a l a k s z á m a : 14 T e c h n i k a i m e g j e g y z é s : Microsoft Office PowerPoint 2016 M e t a a d a t a d o k u m e n t u m b a n : N A f o r m á t u m n e v e : PDF dokumentum O l d a l a k s z á m a : 14 M e t a a d a t a d o k u m e n t u m b a n : N A f o r m á t u m n e v e : HTML dokumentum T e c h n i k a i m e g j e g y z é s : HTML 5 verzió M e t a a d a t a d o k u m e n t u m b a n : N L e g j o b b f o r m á t u m : JPEG képállomány L e g n a g y o b b k é p m é r e t : 770x433 pixel L e g j o b b f e l b o n t á s : 96 DPI S z í n : színes T ö m ö r í t é s m i n ő s é g e : közepesen tömörített Á l t a l á n o s m e g j e g y z é s : Networkshop konferencia 2022 A z a d a t r e k o r d s t á t u s z a : KÉSZ A d o k u m e n t u m s t á t u s z a : INSIDE S z e r e p / m i n ő s é g : katalogizálás A f e l d o l g o z ó n e v e : Nagy Zsuzsanna |