I denne artikkelen
Før dere bytter system: Datavask
Datavask er en prosess hvor dere ’vasker’ databasen deres og rydder bort eventuelle feil og mangler for eksempel dupliserte poster, uferdige eller feilaktige data og ugyldige opplysninger. Datavask er viktig fordi dette sikre at Cicero mottar korrekte og oppdaterte data som kan anvendes så effektivt som mulig i det nye biblioteksystemet.
Når dere datavasker bør dere også forenkle de eksisterende datastrukturene for eksempel for plasseringer. Dette dokumentet gir dere en oversikt over hvilke data dere kan overføre fra det gamle til det nye systemet. Vi anbefaler at dere lager en oversikt der dere tilpasser de eksisterende dataene deres til Ciceros strukturer. Se eksempel her.
Illustrasjonen viser eksempel på hvordan nogle data dere kan overføre fra det gamle til det nye biblioteksystemet er avhengige av hverandre. For eksempel avhenger gode utlånsdata av at det også er god datakvalitet for bibliografiske poster, beholdning og lånere. Husk i datavasken å ha særlig fokus på bibliografiske poster, materialbeholdning, placeringer, utlån, reserveringer, gebyrer, erstatninger og lånere da disse er nøkkeldata for å oppnå en god struktur i Cicero.
Her kommer det forslag til hva dere kan gå gjennom i det gamle biblioteksystemet. Se hvordan data må formateres for å bli overført til Cicero her: Datamigrering til Cicero via CSV-filer.
Datavask: Bibliografiske poster
Slett de bibliografiske postene som dere ikke bruker. Sjekk at ISBN er korrekt, og at det i postene ikke finnes dubletter av de feltene som det kun kan være et av, for eksempel Marc21-felt 245 (se regler her).
Datavask: Lånere
Slett de inaktive lånerne og lånergruppene, for eksempel utgåtte elever på skoler.
Rydd i og oppdater lånere med mangelfulle data. Sjekk for eksempel at fødselsnummer og telefonnummer er lagt inn i det rette formatet og e-postadresser er korrekte (inneholder @ og .). Sjekk også at det ikke er skrevet inn smilefjes eller lignende i feltene.
Slett kommentarer i felter der det ikke er meningen det skal stå kommentarer, for eksempel i nummerfeltene som telefonnummer.
Datavask: Gebyrer og erstatninger
Slett gebyrer og erstatninger som ikke er relevante, for eksempel foreldete gebyrer.
Datavask: Utlån og reserveringer
Rydd i reserveringer og utlån. Slett de dere ikke bruker og avvikle de lån og reserveringer som har stått stille i flere år.
Datavask: Beholdning, materialer
Ta gjerne noen runder med kasseringer i samlingen deres hvor dere fokuserer på å gjøre samlingen mindre bred - det vil si redusere mengden av for eksempel fjernlån, som er utløpt.
Rydd i materialer med enslydende materialnumre. De må være unike.
Reduser og forenkle. Tenk på tvers av biblioteker. Har dere på ulike biblioteker for eksempel hver sin materialgruppe med 30-dagers utlånstid? Da trenger dere kun en for de biblioteker som er samlet i Cicero.
Se gjennom nummer- og år-betegnelsen på tidsskriftene deres. Sjekk at de er ensartet og enkle. Se mere info om konverterte data her.
Rydd i materialenes plasseringer (også kallet hyller eller oppstillinger). Lag en oversikt hvor dere sammenlikner den eksisterende strukturen deres med Ciceros struktur som består av fem nivåer:
-
- Bibliotek
- Avdeling
- Område
- Samling
- Delsamling
I Cicero trenger dere ikke data for alle plasseringsnivåene for et materiale. En plassering kan for eksempel se slik ut Hovedbiblioteket/-/Voksen/Skjønnlitteratur/Krim. Her er Område ikke tatt med.
Hvilke data får dere med?
Her kan dere lese mer om hvilke bibliografiske og administrative data som kan overføres ved overgangen til Cicero. Les også denne veiledningen som beskriver hvordan dere kan bruke de konverterte dataene i Cicero.
Bibliografiske poster
Bibliografiske poster må leveres i et gyldig MARC XML-format (Machine Readable Cataloging XML) og må ha en gyldig ID og ISBN-nummer.
For MARC21: Det anbefales å følge "repeatable/non-repeatable" reglene som er definert i MARC21 (https://www.loc.gov/marc/bibliographic/). Hvis dette ikke overholdes, kan det være risiko for feilindeksering av postene. Et eksempel på dette er felt 245, som er et non-repeatable felt.
Administrative data
I praksis foregår det slik at dere må eksportere og samle inn administrative data fra det forhenværende biblioteksystemet deres og levere disse til Systematic i op til 9 CSV-filer:
- Holdings
- Balances*
- Loans
- Reservations*
- Bookings*
- Patrons
- Patron favorites*
- Loaner consents*
- Shelves*
*Ikke alle bibliotekssystemer har disse typer data.
Enten dere selv, IKT-avdelingen eller en ekstern levrandør må tilpasse dataene fra det gamle bibliotekssystemet deres, slik at de overholder retningslinjene for CSV-filer for import til Cicero. Dette er også en tjeneste dere kan kjøpe fra Systematic.
I Datamigrering til Cicero via CSV-filer beskrives hva CSV-filene kan og bør inneholde.
Les også denne veiledningen som beskriver hva dere må være oppmerksomme på angående konverterte data i Cicero.