I denne artikel
Inden I skifter system: Datavask
Datavask er processen med at ’rengøre’ en database og fjerne eventuelle fejl og ufuldkommenheder, såsom duplikerede poster, ufuldstændige eller fejlagtige data og forældede oplysninger. Dette gøres for at sikre, at Cicero får korrekte og opdaterede data, der kan anvendes så effektivt som muligt i det nye bibliotekssystem.
Datavask handler også om, at I ser på, hvordan I kan forenkle jeres eksisterende datastrukturer, fx placeringer og lånergrupper. I dette dokument kan I læse, hvilke data, I kan få med fra det gamle til det nye system. Det kan være en fordel at lave en oversigt, hvor I matcher jeres eksisterende datastruktur til Ciceros struktur.
I kan her se et eksempel på nogle af de data, I kan få med fra det gamle bibliotekssystem, og hvordan disse data afhænger af hinanden. Fx afhænger gode udlånsdata af, at der er gode bibliografiske poster og gode beholdnings- og lånerdata. Hav i datavasken specifikt fokus på bibliografiske poster, materialebeholdning, placeringer, udlån, reservationer, gebyrer, erstatninger og lånere, da det er er nøgledata i forhold til at få en god struktur i Cicero.
Her er et par forslag til, hvad I med fordel kan kigge på i jeres gamle bibliotekssystem. Se Datamigrering til Cicero via CSV-filer for, hvordan data præcis skal formateres for at komme ind i Cicero.
Datavask: Bibliografiske poster
Slet bibliografiske poster, I ikke længere bruger. Tjek, at ISBN er korrekt på de bibliografiske poster, og at der i de enkelte poster ikke er dubletter af felter, der kun må være én gang.
For DBC-kunder er det vigtigt at verificere FAUST-numrene på jeres bibliografiske poster. Slå evt. tvivlstilfælde op i fx bibliotek.dk eller netpunkt.dk.
Datavask: Lånere
Slet inaktive lånere og lånergrupper, fx udgåede elever på skoler.
Ryd op i/ajourfør lånere med mangelfulde data. Tjek fx at personnumre og telefonnumre er i korrekt format, og at e-mail-adresser er korrekte (indeholder ét @ og ét .). Tjek, at der ikke bruges fx smileys eller andre eksotiske tegn i felterne.
Slet kommentarer i felter, der ikke er beregnet til kommentarer, fx nummerfelter. Verificér at alle obligatoriske felter er udfyldt.
Datavask: Gebyrer og erstatninger
Slet gebyrer og erstatninger, der ikke længere er relevante, fx forældede. Verificér at alle obligatoriske felter er udfyldt.
Datavask: Udlån og reserveringer
Ryd op i reserveringer og udlån. Slet dem, I ikke længere bruger. Få lukket gamle udlån og reserveringer, der har stået stille i mange år. Verificér at alle obligatoriske felter er udfyldt.
Datavask: Beholdning, materialer
Ryd op i materialer og materialegrupper (udlånstid). Har I materialegrupper med ganske få materialer, kan I overveje, om disse skal bestå.
Har I materialegrupper med materialer, I ikke længere kan finde - fx fra lukkede filialer - bør I afvikle både materialerne og materialegrupperne. Kør gerne en udvidet kassationsrunde, hvor I fokuserer på at slanke bredden af samlingen, altså mængden af forskellige materialegrupper- og placeringer.
Ryd op i materialer med enslydende materialenumre. De skal være unikke.
Reducér og forenkel. Tænk på tværs af biblioteker. Har I på forskellige biblioteker hver sin materialegruppe med samme udlånstid, fx 30 dages udlån? Så kan I nøjes med én for de biblioteker, der samles i Cicero.
Gennemgå nummer- og år-betegnelsen på jeres periodika, der skal mindst være én af de to på hvert eksemplar. Gør dem ensartede og enkle.
Ryd op i materialernes placeringer (nogle steder kaldet hylder eller opstillinger). Lav en oversigt, hvor I matcher jeres eksisterende struktur med Ciceros struktur, der består af fem niveauer:
-
- Bibliotek
- Sektion
- Afdeling
- Opstilling
- Delopstilling
I Cicero skal der ikke nødvendigvis være data i alle placeringsniveauer for et materiale. En placering kunne fx hedde Hovedbiblioteket/-/Voksen/Skønlitteratur/Krimi. Her er Sektion tom.
Verificér at alle obligatoriske felter er udfyldt.
Hvilke data får I med?
I kan her læse, hvilke bibliografiske og administrative data det er muligt at overføre ved overgangen til Cicero.
Bibliografiske data
Bibliografiske poster skal leveres i gyldigt MARC XML-format (Machine Readable Cataloging XML) og have et id og gyldigt ISBN-nummer.
For MARC21: Det kan anbefales, at man overholder repeatable/non-repeatable som defineret i MARC21 (https://www.loc.gov/marc/bibliographic/). Der er risiko for at indeksering af poster fejler, hvis det ikke er overholdt. Eksempel på dette kunne være felt 245, som er et non-repeatable felt.
Administrative data
I praksis foregår det på den måde, at I skal eksportere og opsamle administrative data fra jeres gamle bibliotekssystem og aflevere det til Systematic i en række CSV-filer. I (eller jeres nuværende systemleverandør) skal tilpasse data fra jeres gamle bibliotekssystem, så de overholder de retningslinjer, der er for CSV-filer til import i Cicero. Dette er også en service, som I kan tilkøbe hos Systematic.
I Datamigrering til Cicero via CSV-filer er det beskrevet, hvad CSV-filerne kan og skal indeholde.
Læs også denne guide, der beskriver, hvad I skal være opmærksomme på ift. konverterede data i Cicero.