Software

Kulturarvsclusteret stiller IBM’s BigInsights platform til rådighed for forskningsprojekterne. Denne platform består af Open Data Platform (ODPi), hvorpå der ligger et sæt af avancerede analyseværktøjer.

Open Data Platform er et nyt initiativ fra de største Hadoop distributører og indeholder en lang række af de gængse Hadoop teknologier. Der kan læses om ODPi på odpi.org, hvorfra der også kan downloades en virtuel og fuldt funktionsdygtig OPDi server, som kan køre på en gængs desktop pc, så man i et lille setup kan afprøve teknikkerne. ODPi er styret af Apache Ambari,

Ovenpå ODPi har IBM lagt en række kommercielle systemer: Text Analytics, BigSheets, BigSQL og BigR. Disse fire systemer danner tilsammen grundlaget for at udføre analyser ved hjælp af kendte teknikker - men at gøre det på enorme datamængder.

Text Analytics er et browserbaseret arbejdsområde til tekstanalyse. Der medfølger en række færdigbyggede moduler til fx NER og sentiment analysis. BigR muliggør anvendelse af R programmet på datamængder, der overstiger en enkelt computers ressourcer. Denne video giver en kort introduktion til Text Analytics og BigR

BigSheets udnytter regnearksmetaforen. Er man vant til at arbejde i Excel, vil dette være en måde at komme i gang på.

BigSQL er en ANSI SQL, der muliggør SQL forespørgsler mod tilsvarende store datamængder af en størrelse, som traditionelle relationelle databaser ikke kan håndtere. Har man allerede en arbejdsgang eller viden om SQL, kan man koble eksisterende SQL klientprogrammer op mod BigSQL via ODBC eller JDBC.

Selvom de er skrevet til en Cloud Bluemix installation af BigInsights, kan disse sider vise vejen frem: https://developer.ibm.com/clouddataservices/docs/biginsights/get-started/sample-scripts/ og https://developer.ibm.com/clouddataservices/docs/biginsights/get-started/biginsights-on-cloud-for-analysts/

Senere vil denne side komme til at indeholde egentlige instruktioner og manualer til brugen af Kulturarvsclusterets systemer.

Kontakt

KOntakt

 

PER MØLDRUP-DALUM
Koordinator og generel kontakt

pmd@kb.dk
8946 2177

 

TONY BRIAN ALBERS
Drift

tba@kb.dk
8946 2316ASGER ASKOV BLEKINGE

abr@kb.dk
8946 2100

 

 

KATRINE HOFMANN GASSER

khg@kb.dk
8946 2301

DeIC