Für Analysen von großen Datenmengen wie die von Unpaywall wird Google Cloud Platform verwendet. Vorteil: Kollaboration mit anderen Einrichtungen, die mit den gleichen Datenquellen arbeiten und Analysen nachnutzen. #vbib20
Ich glaube, dass in vielen Fällen die Datenmenge nicht ausschlaggebend für eine Cloud-Lösung ist. Man kann auch 40 Mio. Marc-Datensätze lokal auf dem Laptop mit Solr und R auswerten. Aber die leichte Nachnutzung von (Roh-)Daten und Code schon.
Ich glaube, dass in vielen Fällen die Datenmenge nicht ausschlaggebend für eine Cloud-Lösung ist. Man kann auch 40 Mio. Marc-Datensätze lokal auf dem Laptop mit Solr und R auswerten. Aber die leichte Nachnutzung von (Roh-)Daten und Code schon.