D O K U M E N T U M A Z O N O S Í T Ó F á j l n é v : horvath_zoltanne_konyvtari_intelligens.jpg F ő c í m : Gondolatok a könyvtári intelligens rendszerekről és a mesterséges intelligenciáról B e s o r o l á s i c í m : Gondolatok a könyvtári intelligens rendszerekről és a mesterséges intelligenciáról S z e r e p : létrehozó B e s o r o l á s i n é v : Horváth Zoltánné U t ó n é v : Marcsi I n v e r t á l a n d ó n é v : N S z e r e p : közreadó T e s t ü l e t i n é v : Magyar Könyvtárosok Egyesülete S z é k h e l y : Budapest O r s z á g : Magyarország E s e m é n y : felvéve I d ő p o n t : 2019-08-23 E s e m é n y : elérhető I d ő p o n t : 2018-07-03 D á t u m r a v o n a t k o z ó m e g j e g y z é s : A prezentáció előadásának időpontja. A t í p u s n e v e : prezentáció A t í p u s n e v e : előadás M e g n e v e z é s : Prezentáció M e g n e v e z é s : Könyvtártudomány - prezentáció M e g n e v e z é s : Magyar Könyvtárosok Egyesülete A j o g t u l a j d o n o s n e v e : Horváth Zoltánné Marcsi S z e r z ő i j o g i m e g j e g y z é s e k : Jogvédett T é m a k ö r : Könyvtártan, információtudomány A l t é m a k ö r : Tudománytörténet T é m a k ö r : Könyvtártan, információtudomány A l t é m a k ö r : Elektronikus szöveg és könyvtár T é m a k ö r : Számítástechnika, hálózatok A l t é m a k ö r : Mesterséges intelligencia T á r g y s z ó : könyvtár M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : digitális könyvtár M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : könyvtári rendszer M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : intelligens rendszer M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : mesterséges intelligencia M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : szakértői rendszer M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : 2018 M i n ő s í t ő : időszak
L E Í R Á S N y e r s v a g y O C R - e s s z ö v e g : Gondolatok
a könyvtári intelligens rendszerekről
és a mesterséges intelligenciáról
Magyar Könyvtárosok Egyesülete 50. Vándorgyűlés,
Keszthely, 2018. július 3-6.
"Értékeink a jövőt formálják - Vándorgyűléseink öröksége"
Horváth Zoltánné
Paradigmaváltás a könyvtári intelligens rendszerekben
Szemantikus adatmodellek
Szemantikus hálók
Új típusú adatsémák
Linked open data
Digitális, globális
Géppel olvasható
Open, kooperatív
Emberi intelligencia szimulálásának lépései a rendszerekben
Neurális hálók mintájára épülő tudásgráfok
Mesterséges intelligencia a korábbi manuális elemző és szakértői rendszerek programozása és transzformálása, természetes nyelvi keresés és válaszok
Útközben a mesterséges intelligencia felé – okok és feltételek
Digitális transzformáció
növekvő tartalom számítógépes kapacitás
Szakértői tudásbővülés
Fejlődő informatika
Web technológia a könyvtárakban, táguló globális forrásadatok
Dinamikus szemantikus adathálózati kapcsolatok
Keresés szemantikai alapon
Az intelligens alkalmazások gépi tanulás alapján képesek az emberrel és más rendszerekkel kommunikálni
"open" digitális
Nyílt, kodifikált adatok, szemantikai tárolók, dinamikus könyvtári jelenlét a tudáshálókon, globális könyvtári vállalkozások (OCLC, EXLIBRIS, ALA, IFLA, EBSCO, LC, stb.
"data of web" RFID szenzorok
Géppel értelmezhető adatok
Nagy mennyiségű mintavétel az elemzéshez Beszéd,kép- és hangfelismerés szövegelemzés, következtetések, analízis
Intelligencia szimulálása a rendszerekben
Paradigmaváltás
más módon, más eszközökkel, más eredménnyel
új technológiákkal
Behálózott adatok RDF - MARC transzformációk "behálózva"
VIAF ID: 100194456 (Personal)
Tudás elérés problémák
az áttekintés emberi lehetőségéhez képest
túlméretezettek a források
Géppel értelmezhető szemantikus adatkapcsolatok
Mesterséges intelligencia válaszok Tudományos és mérnöki fejlődés
"mobil-first" world
"AI - first world?"
(Sundar Pichai)
A mesterséges intelligencia - digitális eszközkészlet
Intelligens szoftverrel szimulálják intelligencia néhány vagy több komponensét
Bonyolult feladatok számítógépes megoldása,
az embertől is kellő szakértelmet, kreativitást és intuíciót kíván
tudásreprezentáció
Tudásbázis az intelligens emberi viselkedés jellemzői (adatbázisok, leírások)
alapvető tudományos értelmezések, szakértői rendszerek
programozott manipulációs eljárások
folyamatszabályozás, emberi probléma megoldási folyamat utánzása, következtetés, jóslás, analízis
Folyamatos tanulás ember és gép között, a fejlődő technológia új megoldásokat követel
Kölcsönhatás: Emberi intelligencia mélyebb megismerése, magasabb szintű programozás és felhasználás
A szakterületen jellemző emberi funkciók gépi programozása a könyvtári működési folyamatok logikája szerint
Könyvtári mesterséges intelligencia területek
Géppel olvasható adatok növelése
kódolás, azonosítás, egységesítés, adatmodellek és adatmenedzsment
szenzitív adatok menedzselése, copyright szabályok egységesítése
access és ID szabályzatok és eljárások egységesítése (repozitóriumok)
Adatok megbízhatóságának fejlesztése
nagy mintavétel elemzések alapján (kodifikált adatok), nemzetközi szakértői rendszerek (VIAF, Wikidata, ISNI...)
Keresés fejlesztése tudásháló és mesterséges intelligencia technológiával
szakértői rendszerek, szövegelemzések, adatbányászat, mély keresések, kép-, hang- és szövegfelismerés
Gépi tanulás előkészítése
Emberi gondolkodás szimulálás algoritmusokkal, mesterséges intelligencia kiterjesztése a használói rendszerekre, programozott útmutatók, szabad szöveges kérdések és válaszok, szöveg- és kép felismerés, stb.
Saját fejlesztések és külső eszközök integrációi
mesterséges intelligencia szolgáltatások begyűjtése, alkalmazása, használata, transzformálása
Könyvtári mesterséges intelligencia tudásreprezentáció alapokon
Tudásreprezentációs intézményi feladatokhoz
heterogén gyűjtemények kombinálása
metaadat sémák, ontológiák, szakértői szótárak integrációja a saját és külső rendszerekből
szintaktikai és szemantikai struktúrák átvétele és tervezése
Fogalmi- és szöveganalízis
Bizonyítási és elemzési folyamatok, tér- és időbeli összefüggések
Intelligens interfészek tudásreprezentációs eszközök kommunikációjához
Kommunikációs folyamat tervezése
Perszonalizáció,
Szemantikai és audiovizuális eszközök integrációja
Automatikus annotációk
Ontológia kiterjesztések
természetes nyelvi megoldások, stb. (IEEE Intelligent Systems, 16.)
A KISZOLGÁLT SZAKTERÜLET TUDÁSBÁZISAI, SZAKÉRTŐ RENDSZEREI
A könyvtári szakértői rendszerek
A mesterséges intelligencia
kibővíti a könyvtári döntéshozás és elemzés folyamatához szükséges képességeket, de teljes mértékben itt sem helyettesíti azt.
A könyvtári szakértői rendszer számítógéppel támogatott probléma megoldás emberi intelligenciát részben helyettesítő módon
Képessé tesz terjedelmes, bonyolult, vagy sok adatot és hivatkozást igénylő feladatvégzésre, vagy a kiszolgált terület átlátására/
Minél több az adat, annál pontosabban teljesíthető a gépi "agy" vagyis az algoritmus felkészítése az új helyzetekre és a mintavétel - alapú szabályok alkotására
Több száz szabály programozása
Tudásbázis alap a tárgyról (példák, workflow, alkalmazási szabályok)
Inference - következtető motor
Használói felület
Átmenetek: programozott oktatás linkekkel, beépített automatikával
Minden könyvtári területen:
Katalogizálás, beszerzés, adatbázis kiválasztás, keresés, publikációs eljárások és informatikai eszközök, hatásvizsgálat, használói és kompetencia vizsgálatok, web,stb.
Kooperatív könyvtári szakértői rendszerek
VIAF (Virtual Authority File) egységesített besorolási adatok nemzetközi virtuális adatbázisa
VIAF Identity Network authority adatok összegzése grafikusan is
ISNI - International Stadard (author) number identification
FAST - Facetted Application of Subject Terminology - webes subject heading séma / OCLC és a Library of Congress együttműködésében az LC Subject Headings alapján
Schema.org - a Bing, a Google, a Jahoo! és a Yandex (orosz keresőmotor) fejlesztésében az interneten szereplő információk strukturálására alkalmas egységes jelölőnyelv
Wikidata - a Wikipédia, WorldCat és VIAF kapcsolat az adatminőség javítására, adatok egységesítésére, azonosítására, nemzeti könyvtárak együttműködésében
Az intelligens rendszer az összegyűjtött ismereteket rendszerezi, elemzi, értékeli, tömöríti (lényegkiemelés, absztrakció)
IISTE Tudásmegosztó partnerek közös platformon
http://pakacademicsearch.com/pdf-files/com/507
165 works in 260 publications in 8 languages and 1,713 library holdings
Listából kiválasztott e-book
Közeli könyvtárak, ahol meg van a példány
Pl. Electronic database selection Expert system
Wei Ma, Timothy W. Cole, több kiadásban (7.)
A mély rétegek - meta-adatoktól a szemantikai hálókon át a mesterséges intelligenciáig
A HTML dokumentumokban
adott metaelemek a teljes weboldalról vagy dokumentumról adnak kereshető információt
Az RDF alapú szemantikai struktúrákban URI azonosítókkal ellátott adatokat kereshetünk a weben, a gépi értelmezés és automatikus keresés támogatásával. Az RDF elemek a keresést korlátlan adatkapcsolatokkal terjeszthetik ki.
A mesterséges intelligencia alkalmazásával gépi programozással szimuláljuk az emberi intelligenciát az információk kereséséhez és szolgáltatásához, szabad szöveges kérdések és válaszok formájában is, a gépi szövegfelismerés és szöveg-értelmezés, fordítás, stb. lehetőségével.
a "mély web" vagy rejtett web - , vagyis a html-ben tárolt, de nem indexelt adatok nem érhetők el a keresőmotorok számára
https://www.youtube.com/watch?v=78-1MlkxyqI
Keresés az adatok mélyén – könyvtári intelligens megoldások
A betáplált és közzétett adatok közötti rétegekhez (rejtett adatok) speciális elemző és adatbányászati módszerek szükségesek (Nielsen,2.)
Online és batch lekérdezés
Predefiniált kérdések
Jelentések futtatása
Szeparált adattárak
Dashboardok és vizualizációs elemző eszközök használata
Jelentések adatgyűjtésről, adatbázisokról
mennyiségi és minőségi kimutatások
web analízis, statisztika
könyvtári fókusz csoportok elemzése
adatok összetétele, integritása
gyűjteményelemzés, adattisztítás, stb.
OCLC Collection analysis
Student success focus/imperatives
Data-driven decision-making
Increasing complexity of technology, architecture, and data
Hallgatói sikerek előrejelzése könyvtárhasználat alapján
Szemantikus keresők - útközben a szabad szöveges gépi kommunikációhoz
A nagy digitális meta adattárak és fogalomtárak alapján eredményesebb a szemantikai tudásgráfok és kapcsolati hálórendszerek kiépítése
Szemantikai keresők fejlődése
Google fejlesztések
nagy könyvtári elméleti és szakmai központokkal (OCLC, LC, stb.)
2012-ben a Google megvásárolja a Freeweb tudásbázist 12 millió bejegyzéssel, (Ekkor a Wikipédia 3,5 milliót tartalmaz); 2016-ban már 400 millió bejegyzés
Szakértők bevonásával előkészítés és tesztelés
W3C szabványosítás - adattudomány, adatspecialista globális irány
elméleti alapok, kutatás, együttműködés könyvtárosokkal a szemantikus meta-adat kezelés és fogalmi elemzés terén (RDF, SKOS, stb.)
Mintavétel és kategorizálás – könnyebb a nagy tömegű digitális adatokból
Minták felismerése, szövegértelmezés, szövegelemzés, szöveges, audió- és képi keresés fejlődése (orvoslás, művészet, hadiipar, sejtbiológia, stb. Coleman,29.)
Példa: ONLI: Ontology-based Natural Language Interface : An ontology-based system for querying DBpedia using natural language paradigm. (B. Sujatha, 70.)
Mesterséges intelligencia "keresi a tűt a szénakazalban"
Semantic Scholar - 2015
Gépi tanulás, a természetes nyelvi folyamatok programozása,
szemantikai elemző és idézés analízis eszköz beépítése grafikus megjelenítéssel is
a Google Scholar és PubMed, mintájára a legjelentősebb források beépítése, főként orvosi forrásanyagokkal.
http://www.kithirlevel.hu/index.php?kh=mesterseges_intelligencia_keresi_a_tut_a_szenakazalban
A fejlesztő Paul Allen Microsoft
Évente megjelenő közel 2 millió tudományos folyóirat automatikus elolvasása, feldolgozása és kategorizálása
Szöveg komponensek megértése szemantika alapokon kombinált gépi technológiákkal
Gépi tanulás, természetes nyelvi folyamatok, szemantikai elemzések, fejlődési stratégiák, víziók (Oren Etzioni, 57.)
Alkotórészek
keresőrobot, amely begyűjti a publikációkat
Szemantikai index előállítás a letöltött anyagokhoz
Kiszolgálói rendszer a szemantikai index innovatív használatához
Komponensek
"core metadata" kiválasztás, idézettség grafikonnal és relevancia szűréssel, dokumentumtípusok fazettákkal,
GitHub -on tárolt forráskódok, munkaelemek és szoftverhivatkozások
Jelenleg 40 milliónál több forrásból!
Talk to books - a Google új mesterséges intelligencia keresője
Szabad szöveges kérdések, azonnali válaszok.
A leginkább releváns válaszokat egy öntanuló "robot" keresi meg a Google Könyvek (Google Books) tartalmából.
angol nyelvű kérdésekre egészen jó válaszok
a keresőkérdések módosítása nyomán változó, de hasonló a találati listák
A Talk to Books könyvekben őrzött tudásra alapoz a Google Books tudásbázis alapján.
A mesterséges intelligencia gépi tanulással értelmezi a szöveges kérdést,
több 100 ezernyi könyv teljes szövegéből értelmes, releváns válaszok
Öntanuló rendszer
a relevancia korlátait meghatározza a beépített könyvek tematikája
Helyes válaszok vannak, de teljes válasz még nincs a kis minta következtében
A találati lista elemei referencia műnek jelenleg még nem kezelhetők, a könyvek érték szerinti válogatása valószínű nem történt még meg.
A robotok már a könyvtárban vannak...
Automatizált feladatok akár közvetlen emberi felügyelet nélkül
program vagy általános iránymutatások alapján mesterséges intelligencia technikák beépítésével
kérdés-válasz interakciók, zene lejátszás, listakészítés, "alert" funkciók, real-time információk (események, marketing, közérdekű információk pl. nyitva tartás, stb.)
fejlesztett vagy beépített természetes nyelvi folyamatok, információkeresésre alkalmas tudás reprezentációk gépi tanulási technikával, öntanuló rendszerek, stb.
Hasonló viselkedés a természetes intelligenciával rendelkező élőlényekhez
egyedi sajátosságok (jellemek, szleng, stílus)
adaptációk, következtetések, utasítások, cselekvések képessége
ALEXA, SIRI, Sophia, IBM Watson, Teneo, Niki, Google new, stb.
Számítógépes játékok, videók, gamifikáció
Korlátlan és gyors memória, a hatékony mintafelismerés,
célszerűen változtatott viselkedés (tanulás, helyzetfelismerések)
RFID és szenzorok hálózata - IoT - Internet of Things
orvoslás, mobil eszközökre épített perszonális egészségügy
okos város, okos ipar, intelligens közlekedés, háztartás, stb.
VANDA - a T-csoport digitális asszisztense hang- és chat szolgáltatással, akár 86 nyelven
Architektúra
A Nuance cég vezető beszéd felismerő, beszéd generáló, szemantikai és biometriai moduljaira épül, amelyeket kiegészítettünk a T-Systems Magyarország saját szoftver komponenseivel, hogy könnyebb legyen a kliens központú, kontextus vezérelt, háttérrendszerek integrációját igénylő párbeszéd alapú rendszerek kialakítása.
Azonosítja a hívót, aki szabványos mondatot mond,. felismeri, ha valaki egy másik ügyfél "ellopott", felvett hangjával próbál ügyeskedni. Tudja azonosítani a hívót egy bizonyos idő után annak szabad beszédét hallgatva, ha mégsem, kéri a PIN manuális begépelését.
Internet of Things (IoT)
Szenzorokkal behálózva!
IoT rétegek
Végponti eszközök, szenzorok, RFID címkék, webkamerák, autós fedélzeti egység Gateway : eszközök közötti átjárás
Hálózat : Az összegyűjtött adatok eljuttatása a tároló és feldolgozó helyre
Interfészek : A hálózaton beérkezett adatok értelmezése és egységesítése
Tároló rendszerek
Feldolgozás - analitikai zóna
A végponti eszközökből begyűjtött információk elemzése, utasítások kiadása, analitikai zóna
Megjelenítés - kommunikációs rendszer, interaktivitás
Okos IoT campus sémája központi adattárolóval és dashboarddl
Megszelídített adattenger : "Az IoT világában szenzorok tömegéből nyert adatok automatikus tárolásával, keresésével, elemzésével gyorsan jutunk információkhoz.
Az IoT az adatok továbbításán túl magába foglalja az adatokra épülő analitikai megoldásokat is"
Intelligens rendszerek fejlődési irányai (Gartner)
1. AI foundations - alapok
A cégek foglalkoznak a mesterséges intelligenciával, kérdés, hogy az emberi tanulás képességét milyen mértékben lehet átültetni algoritmusokkal a gépi tanulás módszereibe (nyelv megértés, ellenőrzött környezet) (Cearley, 61.)
3. Intellinget things - intelligens eszközök
Az intelligens alkalmazások a gépi tanulás következtében képesek kommunikálni az emberrel és más alkalmazásokkal (smart cars, RFID - orvostudomány, robotika, katonaság, drónok, kereskedelem)
6. trend: Conversational platforms - párbeszéd platformok
a rendszerek képesek egyszerű válaszokra, vagy komplikált interakciókra, párbeszédekre
7. trend: Immersive experience: augmented reality, virtual reality AR, VR - immersive web
az emberek érzékelik és kapcsolatba lépnek a digitális világgal, a határok elmosódnak a való és virtuális valóság között (turisztika, művészet, okos város programok)
9. trend: Event-drived esemény-vezérelt rendszerek.
Az IoT és más technológiák detektálják és gyorsan képesek analizálni a jelzéseket
10. Folyamatos risk és trust - folyamatos kockázat és védelem
a security környezet beépítése fontos elem a fake news és más fals információk vagy fenyegetések ellensúlyozására
Káros alkalmazások kivédése
Globális termék- és technológia menedzsment Disztributor: T-Systems
WorldCat világkatalógus - 2,6 milliárd rekord, a világon a legnagyobb
linked data: unikális szerep a globális tudásmegosztásban, 20 milliárd triplets
Összekapcsolja a világ könyvtárainak rekord- és authority adatait VIAF, ID Network, ISNI, Wikidata
automatizált munkafolyamatok, kooperatív Workflow, rekordmenedzsment
Integrált platformon további rendszerek alaprendszereként elemző, értékelő, összegző funkciók
WorldCat Discovery Services
Egy kereséssel egy milliárdnál több elektronikus, digitális és nyomtatott forrás elérése a világ könyvtáraiból
Adatmodellek, tudásmegosztás, többnyelvűség - WorldCat háttérrel
A reconciliation service - kapcsolódás meglévő linked data entitásokhoz
An editor service - linked data és kapcsolataik szerkesztése
Wikibase Reposit
Wikibase Client
Könyvtári partnereink - OCLC,T-Systems termékekkel OLIB IKR, WorldCat, ADVISE, portálok repozitóriumok, digitális könyvtárak
WorldCat – MTA Könyvátr, ELTE, Szegedi Egyetem
Connexion (WorldCat háttérrel gyors rekordletöltés) - ELTE
CatExpress (gyors rekord letöltés és feltöltés WorldCat rendszerből ) - DENK
WorldShare Management könyvtárközi kölcsönzés: OSZK, BME, DENK, stb.
Exproxy: távsingle-sign-on- elektronikus források hozzáférésére Liszt Ferenc Zeneművészeti Könyvtár
A T-Systems VEZETŐ SmartUNIVERZUM - SZOLGÁLTATÓ Referenciák
Való életbeli megoldások már 19 városban
TATABÁNYA Smart felügyelet
BUDAPEST Tömegközlekedés; üzemeltetési és utastájékoztató rendszer; közösségi kerékpármegosztás; energiagazdálkodás; nyilvános wifi
NYÍREGYHÁZA: Smart kioszkok és padok; Home Care; City Card diákoknak; biztonsági felügyelet; Smart City Core rendszer; forgalom- és közlekedésfelügyeleti rendszer; nyilvános wifi
DEBRECEN Innovációs projekt; forgalom- és közlekedésfelügyeleti rendszer; nyilvános wifi
SOPRON Energiakezelés
ZALAEGERSZEG
Forgalom- és közlekedésfelügyeleti rendszer; nyilvános wifi
NAGYKANIZSA Smart hulladékgazdálkodás
KAPOSVÁR Forgalom- és közlekedésfelügyeleti rendszer
PÉCS E-authority; E-polling; e-Assembly-kezelés; nyilvános wifi
KECSKEMÉT Energiagazdálkodás; nyilvános wifi
SZOLNOK Energiagazdálkodás
Mesterséges intelligencia -
Lehet jól vagy rosszul használni
Rajtu(n)k múlik? D o k u m e n t u m n y e l v e : magyar K a p c s o l ó d ó d o k u m e n t u m n e v e : Horváth Zoltánné Marcsi: Fenntartható fejlődés intelligens technológiákkal - T-szemszögből A f o r m á t u m n e v e : PowerPoint prezentáció O l d a l a k s z á m a : 27 T e c h n i k a i m e g j e g y z é s : Microsoft Office PowerPoint 2007 M e t a a d a t a d o k u m e n t u m b a n : N A f o r m á t u m n e v e : HTML dokumentum T e c h n i k a i m e g j e g y z é s : HTML 5 verzió M e t a a d a t a d o k u m e n t u m b a n : N L e g j o b b f o r m á t u m : JPEG képállomány L e g n a g y o b b k é p m é r e t : 770x562 pixel L e g j o b b f e l b o n t á s : 96 DPI S z í n : színes T ö m ö r í t é s m i n ő s é g e : közepesen tömörített A z a d a t r e k o r d s t á t u s z a : KÉSZ S z e r e p / m i n ő s é g : katalogizálás A f e l d o l g o z ó n e v e : Nagy Zsuzsanna |