Interview med  Software Architect-konsulent Vidar Ingebretsen, Standard Norge.

Norske standarder baseret på NoSQL

Interview med Software Architect-konsulent Vidar Ingebretsen, Standard Norge

Ønsket om bedre søgemuligheder og XML-sprog fik Standard Norge til at skifte sin traditionelle SQL-database ud med NoSQL-databasen MarkLogic. Sæt tid og ressourcer af til kompetenceomskolingen, lyder ét af de gode råd fra den ansvarlige projektleder i Standard Norge. Ellers risikerer man at komme ud på dybt vand.

Standard Norge – den norske ækvivalent til Dansk Standard – er en organisation, der lever af at udvikle og udgive standarder. Det vil sige, at de hjælper med at ensrette produktudvikling på tværs af landegrænser, så man ikke laver flere næsten ens udgaver af samme produkt. Det er ikke kun en god ide for virksomheder; det er også en god ide for forbrugere, fordi standarder sikrer dokumentation for, at et produkt overholder en række specifikke krav – eksempelvis inden for miljø. De mange tusind standarder sælger Standard Norges salgsselskab Standard Online enten direkte til det norske marked eller i ”adopterede” varianter, hvor internationale standarder er blevet udgivet som norske standarder. Standarderne sælges online i en løsning, hvor informationen gennem flere år har ligget som pdf-filer. Det vil sige, at brugerne kun kunne søge i dokumentets metadata, når de gik på jagt efter den ønskede standard.
“Pdf er i det hele taget et meget ufleksibelt format,” indleder Vidar Ingebretsen, som er Software Architect konsulent i Standard Norge.

“Derfor begyndte man i 2013 at kigge sig omkring efter et nyt system, som kunne understøtte XML. XML giver mulighed for avanceret søgning, det understøtter HTML, så man eksempelvis kan læse en standard på nettet med hyperlinking – dels til andre standarder og dels internt i dokumentet. Og det understøtter produktionen af e-books, så man eksempelvis kan lave en elektronisk version af en standard. Alt det gør XML muligt,” forklarer Vidar Ingebretsen og siger, at traditionelle databaser, som dem, Standard Norge oprindeligt havde, ikke understøttede XML særligt godt, og derfor gik de på jagt efter en NoSQL-database.

Nye muligheder kræver nye kompetencer

Den NoSQL-database fandt de ved at skæve til International Organization for Standardization – bedre kendt som ISO – som er den globale standardiseringsorganisationen med 162 medlemslande. ISO havde for nylig stået over for mange af de samme problemstillinger som Standard Norge, og de havde valgt en leverandør og en NoSQL-databaseløsning, som de mente, var i stand til at løfte opgaven: MarkLogic.

“Derfor faldt vores valg også ret hurtigt på MarkLogic. Deres database har rigtigt gode søgefunktioner, understøtter XML godt, og derudover kan vi lagre alle binære data i systemet, hvilket vil sige, at vi fortsat kan lagre alle pdf-filer og word-dokumenter i samme database,” siger Vidar Ingebretsen. Han forklarer, at MarkLogic dels har stået for at undervise de ansatte i Standard Norge i brugen af MarkLogic-databasen, og dels har haft faste konsulenter tilknyttet opgaven, så Standard Norge hele tiden havde adgang til superbrugere af systemet. Efter nogle måneder med analyse blev projektet påbegyndt i januar 2014, og per april 2014 er man i fuld gang med migreringen af data mellem det gamle og det nye system.

Er der noget, der er kommet bag på jer i forbindelse med projektet?
“Der skal laves rigtig meget scripting i databasen, ligesom der er også er meget funktionel programmering, som er en anden form for programmering, end jeg har været vant til. Så videnskurven har været noget stejlere, end jeg havde troet i forhold til at bruge NoSQL. Men vi kan også se, at det bliver godt, fordi vi har et meget tæt samarbejde med MarkLogic. Uden det havde det været en stor udfordring. Meget er anderledes i forhold til traditionel SQL, og selvom der er mange muligheder i systemet, kræver det en del oplæring at kunne udnytte dem,” siger Vidar Ingebretsen.

God business case

Selvom selve beslutningen om at skifte fra SQL til NoSQL blev truffet før Vidar Ingebretsens tid i Standard Norge, så er han overbevist om, at det dengang har været en forretningsdrevet og ikke en IT-drevet beslutning.

“ISO har sat en trend i markedet ved at skifte til NoSQL, og det er der mange, der har ladet sig inspirere af. Man har set med ISO, at bedre datakvalitet, bedre søgemuligheder, e-book-muligheder og bedre link-muligheder giver kunderne en langt bedre brugeroplevelse. Forventningen er selvfølgelig, at det i sidste ende vil føre til et øget salg i netbutikken,” siger Vidar Ingebretsen og tilføjer:
“Derudover regner vi også med, at der ligger en betydelig besparelse gemt i optimeringen af interne forretningsprocesser. I dag foregår meget af produktionen af standarder manuelt, og det kan nu automatiseres med det nye system. Det er eksempelvis kvalitetssikring af pdf-filerne, hvor vi i fremtiden vil bruge et system, der hedder Pitstop til at kvalitetssikre data og delvis reparere pdf’er ved at tilføje fonter, som ikke findes i filen,” forklarer Vidar Ingebretsen.

Selvom han overordnet beskriver NoSQL-projektet som et succesprojekt, har der dog også været udfordringer undervejs.

“Vi har især haft problemer med at migrere data fra det gamle system til det nye og få koblet data på en god måde. Primært fordi datakvaliteten i det gamle system var dårligere, end vi havde forventet. Kompleksiteten i løsningen har også været en udfordring. Det kræver gode kompetencer på XML at begive sig ud i sådan et projekt. Det har vi dels fået gennem MarkLogics konsulenter, og dels har vores egne ressourcer fået opgraderet og videreudviklet deres kompetencer. Det har været en nødvendighed, og det skal man være sig bevidst, hvis man overvejer at kaste sig ud i et lignende projekt,” afslutter Vidar Ingebretsen.

Hovedpunkter i MarkLogic

  • Understøtter ACID-transaktioner, horisontal skalering, indeksering i realtid og disaster recovery
  • Understøtter søgninger på tværs af forskellige datatyper – tekst, billeder, dato/tid, geospatiale data og valutaer – fra mange forskellige datakilder 
  • Mulighed for at køre MarkLogic direkte på Hadoop Distributed File System (HDFS) og flytte data mellem MarkLogic og Hadoop i selve applikationerne
  • Understøtter Analytics og Business Intelligence i realtid Gode tools og API’er til hurtig applikationsudvikling
  • Gode tools og API’er til hurtig
    applikationsudvikling

NoSQL fra Warszawa

ProData Consults afdeling i Norge leverer via vores Nearshore Center i Warszawa et team på fem ekspertkonsulenter til Standard Norge. Teamet har været de primære tekniske ressourcer i opbygningen af Standard Norges onlineløsning baseret på NoSQL. Løsningen gik live og blev præsenteret som et referenceprojekt for MarkLogic, medio maj 2014.

Om Standard Norges onlineløsning

Standard Norges onlineløsning er baseret på e-handelsløsningen EPiServer Commerce med en avanceret produktdatabase fra MarkLogic i bunden. Produktdatabasen leverer både metadata og indhold fra produkterne til EPiServer Commerce. Udover enkeltkøb af standarder i www.standard.no tester man også en abonnementsløsning baseret på sikkerhedsløsningen i MarkLogic.