Google Refine wird zu Communityprojekt OpenRefine

Google Refine Icon by stefano.mazzocchi Vor nicht allzu langer Zeit hab ich in diesem Blog noch über die mögliche Überführung von Needlebase-UI und -Features in Google Refine sinniert und es als sinnvolle Erweiterung des Projekts eingeschätzt. Jetzt sieht es so aus, als werden die Karten neu gemischt denn Refines’ Zukunft in der Google Familie wird bald enden. Weiterlesen

Datenjournalismus Handbuch veröffentlicht

The Data Journalism Handbook Es ist soweit. Nach rund einem halben Jahr Arbeit wurde das erste Data Journalism Handbook veröffentlicht. Unter http://datajournalismhandbook.org/ kann das Buch kostenlos gelesen werden. Eine gedruckte Variante bzw ein eBook-Version werden via O’Reilly angeboten. Weiterlesen

Google Refine 2.5 veröffentlicht

Google Refine Icon by stefano.mazzocchi Google Refine hat jetzt offiziel die Version 2.5 erreicht. Das Changelog, das neue Features, Bugfixes und Verbesserungen auflistet, ist umfangreich. Insgesamt wurde die Integration mit Google Spreadsheets und Fusion Tables vorangetrieben. Weiterlesen

Google Refine 2.1 erschienen

Google Refine Icon by stefano.mazzocchi Das Open Source Datenbreinigungstool Google Refine ist in Version 2.1 erschienen. Die offizielle Ankündigung spricht zwar von einem “maintenance release” mit diversen Bugfixes, einige neue Funktionen sind trotzdem dazugekommen. Interessant finde ich dabei den Import von Google Fusion Tables und den jsoup basierten HTML Parser, der jetzt Funktionen wie parseHtml, select, htmlAttr, htmlText, innerHtml, ownText unterstützt. Die Tutorial Videos wurden ebenfalls erneuert, auch wenn sie weiterhin die irreführende Betitelung “Goolge Refine 2.0″ tragen.

Links: Datenjournalismus, re:publica, XML und RSS Einführung

Kurzer Zwischenruf mit zwei praktischen Links:

Google-Tools und Datenjournalismus: Public Data Explorer öffnet sich, OCR in 34 Sprachen

Google Google hat zwei seiner Produkte weiter ausgebaut, was Sie noch interessanter als Tool zur Datenvisualisierung bzw für Datenjournalisten macht. Zum einen wurde der Public Data Explorer für eigene Datasets geöffnet und die OCR (Optical Character Recognition), sprich: automatische Texterkennung, in Google Docs wurde deutlich erweitert. Weiterlesen

Lesenswert: Schnüffel-Apps, Verbraucherpreise Treemap, PDF to HTML Preview, Data Converter und JSON Editoren

Wall Street Journal: What the know - Mobile

Wall Street Journal: What the know - Mobile

Ich gebe zu, ich habe in die Überschrift bewusst ein paar Keywords mit dem Holzhammer eingepflegt. Schnüffel-Apps klingt zum Beispiel unheimlich konspirativ, meint aber auch eigentlich nichts anderes als das, was die Werbeindustrie eh schon seit eh und je tut – Daten sammeln und verwenden – nur diesmal per App. Der Artikel des Wall Street Journal ist allerdings nicht nur informativ, sondern auch ein guter Aufhänger um doch nochmal ein paar Links loszuwerden, bevor ich mich offiziell in die Weihnachtspause verabschiede. Hier also meine letzten “lesenswerten” Links für dieses Jahr, auch diesmal nur grob in Schubladen gedacht und kategorisiert. Weiterlesen

Google Refine 2.0 erschienen

Google Refine (ehemals Freebase Gridworks) ist in der Version 2.0 erschienen. Wie im Google Open Source Blog nachzulesen ist, hat sich das Tool zur Datenbereinigung seit der Übernahme von Metaweb wieder einen großen Sprung weiterentwickelt. Neben einer neuen Extension Architektur und verbesserten Datenabgleichmöglichkeiten hat es auch eine Reihe neuer Features gegeben. Dazu zählen neue Commands, erweiterte Importfunktionen zu CSV und TSV und die Erweiterung der Google Refine Expression Language, die nun auch JSON unterstützt. Alle Änderungen gibt es im Überblick im Changelog

Außerdem hat Google drei neue Einführungsvideos zu Refine veröffentlicht. Das erste habe ich mal eingebunden, alle weiteren stehen im Open Source Blog bzw auf Youtube.