Ich habe vor einiger Zeit (das ist tatsächlich schon rund 5 Jahre her!) zwei Artikel über verschiedene kleine CMS ohne Datenbank veröffentlicht. Das war hier (von 2010!) und hier (von 2011!). Trotz ihres Alters sind die Artikel weiterhin recht populär, trotzdem freue ich mich, dass es wieder was Neues gibt.
Schlagwort: Datenmanagement Seite 1 von 2
Yahoo macht Frühjahrsputz (von Google lernen) und schließt einige Dienste und Funktionen. Die vollständige Pressemitteilung gibt’s hier.
Auch für Pipes läutet die Totenglocke. Auf der Website heißt es knapp
Thank you for using Yahoo Pipes! To help focus our efforts on core Yahoo product experiences, users will no longer be able to create new Pipes starting August 30th 2015. The service will be put in read-only mode until we will discontinue Yahoo Pipes on September 30th 2015.
Heißt: Ende August wird Schluss sein und nur noch Lesezugriff möglich. Ab Ende September ist dann auch damit Schluss.
Ein paar wenige Details zum Export gibt’s dann noch im zugehörigen Blog:
You can download your Pipe definition by specifying your Pipe-ID (_id) and the output format (_out=json) to the following end-point: http://pipes.yahoo.com/pipes/pipe.info
Ganz ehrlich, für mich kommt das nicht sehr überraschend. Pipes war schon seit langer Zeit ein Dienst, der zwar seine Daseinsberechtigung hatte, aber nicht mehr die Aufmerksamkeit bekam, die es gebraucht hätte, um den Service weiterzuentwickeln. Und an der Stelle treten andere Anbieter auf den Plan, etwa IFTTT.
Trotzdem schade um ein kleines, feines und mächtiges Tool, dass das Verdrahten von Netzquellen wunderbar einfach gemacht hat (warum ich es u.a. hier auch mal empfohlen habe).
OpenRefine (vorher Google Refine, vorher Freebase Gridworks) hat in der letzten Zeit einige Änderungen erfahren. Unter anderem hat das Projekt eine neue Homepage http://openrefine.org und ist zu GitHub umgezogen, Überbleibsel gibt es aber nach wie vor noch unter der alten Adresse http://code.google.com/p/google-refine/. Damit der Einstieg in die Arbeit mit Refine etwas leichter fällt, hier kurz ein paar Eckpunkte zur Orientierung, vom Download über Starten/Sichern/Beenden, erste Schritte mit der GREL und zum Schluss noch ein paar weitere Quellen.
Ich habe an dieser Stelle ja schon öfter mal erwähnt, dass ich vor einiger Zeit den Datenbanken-Einführungskurs in Stanford belegt hatte. Das war „damals“ noch vor Udacity, vor EdX und vor dem Hype den die MOOCs (Massiv Open Online Courses) insgesamt erlebten. Jetzt hat Stanford den kostenlosen Kurs „Einführung in Datenbanken“ erneut angekündigt, wieder unter der Leitung von Prof. Widom aber mit neuem technischen Unterbau und einem etwas überarbeiteten Konzept.
Vor nicht allzu langer Zeit hab ich in diesem Blog noch über die mögliche Überführung von Needlebase-UI und -Features in Google Refine sinniert und es als sinnvolle Erweiterung des Projekts eingeschätzt. Jetzt sieht es so aus, als werden die Karten neu gemischt denn Refines‘ Zukunft in der Google Familie wird bald enden.
Google hat bekanntgegeben Needlebase, ein Tool zum Auslesen, Bereinigen, Kombinieren und Bereitstellen von Datensätzen, einzustellen. Bei Nutzern wie Datenjournalismus-Interessierten hat dies zu einiger Verwunderung geführt und es kamen Fragen auf, welche Dienste den Platz von Needlebase einnehmen können. Ich sehe zwei Tools, die das Potential haben den Platz einzunehmen, Scraperwiki und Refine. Für eins der beiden sehe ich jedoch eine deutlich höhere Wahrscheinlichkeit.
Google Refine hat jetzt offiziel die Version 2.5 erreicht. Das Changelog, das neue Features, Bugfixes und Verbesserungen auflistet, ist umfangreich. Insgesamt wurde die Integration mit Google Spreadsheets und Fusion Tables vorangetrieben.
Das Open Source Datenbreinigungstool Google Refine ist in Version 2.1 erschienen. Die offizielle Ankündigung spricht zwar von einem „maintenance release“ mit diversen Bugfixes, einige neue Funktionen sind trotzdem dazugekommen. Interessant finde ich dabei den Import von Google Fusion Tables und den jsoup basierten HTML Parser, der jetzt Funktionen wie parseHtml, select, htmlAttr, htmlText, innerHtml, ownText unterstützt. Die Tutorial Videos wurden ebenfalls erneuert, auch wenn sie weiterhin die irreführende Betitelung „Goolge Refine 2.0“ tragen.
Nach viel zu langer Funkstille mal wieder Links – die jetzt übrigens auch so heißen oder alternativ auch keinen Titel tragen werden. Das „Lesenswert“ im Titel der alten Linklisten bleibt, klingt mir aber irgendwie mittlerweile zu verschwurbelt. Hier gibt’s also ab sofort harte Fremdfakten im Linkbett 🙂
Eigentlich wollte ich nur die Datenbank des Live-Systems dieses Blogs auf meiner lokalen XAMPP-Installation einspielen, um lokal daran rumzuwerkeln, statt in aller Öffentlichkeit mein Blog zu überarbeiten. Sozusagen eine Bastelstunde mit echten Daten ohne den Patienten zu gefährden. Eigentlich ist das auch kein größeres Problem, vollständige Backups hat man sowieso (hat man doch, oder?) oder sind schnell gemacht und ein XAMPP ist wenn es ihn noch nicht gibt, ebenso schnell aufgesetzt. Da aus einem gedankenlosen „eigentlich ganz schnell gemacht“ schnell ein „eigentlich dauert so eine Fehlersuche viel zu lang“ wird, hier eine Notiz an mich, worauf ich beim nächsten Mal besser achten sollte: