Zotero als databank

2017/10/09: onderstaande workflow is enkel bedoeld ter informatie/demonstratie. Het is geen leerstof of opdracht.

Wat kan je doen met zotero als database?

1. exporteren naar csv, importeren in excel, importeren in drupal

  • exporteer naar csv-formaat

  • importeer het csv-bestand in excel of openoffice (is er een verschil tussen beide?)

all data is dirty, but you can do something about it

(zie 3. opkuisen met openrefine) waarom zijn deze data 'dirty': oorspronkelijk aangemaakt in een andere applicatie (biblio module van drupal), zijn daaruit geïmporteerd; over de jaren heen zijn gegevens door verschillende personen toegevoegd, met elk hun eigen workflow en opvattingen; door tijdsgebrek zijn niet altijd alle velden ingevuld

  • drupal import

    • voorbeeldwebsite in drupal 7

    • formulier voor mangavolume

    • matchen velden met csv-importer
    • importeren csv-bestand
    • voorbeeld volume

    • hoe zou je dit verder kunnen uitwerken:

      • covers toevoegen: manueel, amazon ...
      • uitleengegevens
      • mailtje laten versturen bij aflopen uitleentermijn - naar admin én gebruiker
      • link naar besprekingen; embed besprekingen
      • disqus webservice
      • ...

= van 'dode' data op je harde schijf naar een levende applicatie

2. visualiseren in Gephi

Waarom is visualiseren belangrijk? Een andere kijk op data - structuren zien; informatie gebald, compact weergeven - de aandacht winnen.

  • installeer Gephi Let wel: Gephi werkt alleen met Java 7, niet met Java 8. Java 7 is niet meer publiek downloadbaar. De Java 7 versies voor Mac en Windows kan je op Toledo vinden (onder cursusdocumenten in gezipte vorm). Verwijder Java 8 en installeer deze versie van Java 7 op je PC/Mac (eerst zip file uitpakken). Dan zou Gephi moeten werken. Voor Windows-gebruikers is er ook deze howto.
  • importeer csv-bestand

De twee laatste voorbeelden halen de data bij de DBpedia Knowledge Base. De moeite om te bekijken.

3. data opkuisen met OpenRefine

OpenRefine is niet enkel een tool om data op te kuisen maar ook om data te scrapen ("webscraping"). Op dat laatste gaan we hier niet in, de instructiefilmpjes op de voorpagina geven een goed idee van wat bedoeld wordt met data cleaning. Principes en praktijk van data cleaning, geïllustreerd met oefeningen, worden nog duidelijker via deze les van de Programming Historian.

4. analyseren met NVivo

NVivo is vorige week uitvoerig gedemonstreerd. Het excel bestand uit par. 1 inladen en twee eenvoudige queries laten uitvoeren is hier voldoende.

5. queries uitvoeren in sqlbrowser