Vor nicht allzu langer Zeit hab ich in diesem Blog noch über die mögliche Überführung von Needlebase-UI und -Features in Google Refine sinniert und es als sinnvolle Erweiterung des Projekts eingeschätzt. Jetzt sieht es so aus, als werden die Karten neu gemischt denn Refines’ Zukunft in der Google Familie wird bald enden. Weiterlesen
Schlagwort-Archive: Datenverarbeitung
Datenjournalismus Handbuch veröffentlicht
Es ist soweit. Nach rund einem halben Jahr Arbeit wurde das erste Data Journalism Handbook veröffentlicht. Unter http://datajournalismhandbook.org/ kann das Buch kostenlos gelesen werden. Eine gedruckte Variante bzw ein eBook-Version werden via O’Reilly angeboten. Weiterlesen
Google Refine 2.5 veröffentlicht
Google Refine hat jetzt offiziel die Version 2.5 erreicht. Das Changelog, das neue Features, Bugfixes und Verbesserungen auflistet, ist umfangreich. Insgesamt wurde die Integration mit Google Spreadsheets und Fusion Tables vorangetrieben. Weiterlesen
Google Refine 2.1 erschienen
Das Open Source Datenbreinigungstool Google Refine ist in Version 2.1 erschienen. Die offizielle Ankündigung spricht zwar von einem “maintenance release” mit diversen Bugfixes, einige neue Funktionen sind trotzdem dazugekommen. Interessant finde ich dabei den Import von Google Fusion Tables und den jsoup basierten HTML Parser, der jetzt Funktionen wie parseHtml, select, htmlAttr, htmlText, innerHtml, ownText unterstützt. Die Tutorial Videos wurden ebenfalls erneuert, auch wenn sie weiterhin die irreführende Betitelung “Goolge Refine 2.0″ tragen.
Links: Datenjournalismus, re:publica, XML und RSS Einführung
Kurzer Zwischenruf mit zwei praktischen Links:
- Lorenz Matzat hat für Datenjournalismus-Interessierte die thematisch passenden Veranstaltung auf der kommenden Re:Publica 2011 zusammengefasst: Datenjournalismus auf der re:publica 2011. Wer vor Ort ist (was auf ziemlich viele Personen zutrefen dürfte) sollte sich insbesondere die Vorträge von Nicolas Kayser-Brill und Gregor Aisch nicht entgehen lassen. Die re:publica 2011 startet morgen und endet am Freitag.
- Ein kurzer Ausflug in die Grundlagen der Datenstruktur: In Data for journalists: understanding XML and RSS erklärt Paul Bradshaw das wesentliche zu beiden Formaten und zeigt in einem Mini-Tutorial wie man z.B. mit Yahoo Pipes Datenströme bearbeiten, filtern und verwenden kann.
Google-Tools und Datenjournalismus: Public Data Explorer öffnet sich, OCR in 34 Sprachen
Google hat zwei seiner Produkte weiter ausgebaut, was Sie noch interessanter als Tool zur Datenvisualisierung bzw für Datenjournalisten macht. Zum einen wurde der Public Data Explorer für eigene Datasets geöffnet und die OCR (Optical Character Recognition), sprich: automatische Texterkennung, in Google Docs wurde deutlich erweitert. Weiterlesen
Lesenswert: Schnüffel-Apps, Verbraucherpreise Treemap, PDF to HTML Preview, Data Converter und JSON Editoren
Ich gebe zu, ich habe in die Überschrift bewusst ein paar Keywords mit dem Holzhammer eingepflegt. Schnüffel-Apps klingt zum Beispiel unheimlich konspirativ, meint aber auch eigentlich nichts anderes als das, was die Werbeindustrie eh schon seit eh und je tut – Daten sammeln und verwenden – nur diesmal per App. Der Artikel des Wall Street Journal ist allerdings nicht nur informativ, sondern auch ein guter Aufhänger um doch nochmal ein paar Links loszuwerden, bevor ich mich offiziell in die Weihnachtspause verabschiede. Hier also meine letzten “lesenswerten” Links für dieses Jahr, auch diesmal nur grob in Schubladen gedacht und kategorisiert. Weiterlesen
Google Refine 2.0 erschienen
Google Refine (ehemals Freebase Gridworks) ist in der Version 2.0 erschienen. Wie im Google Open Source Blog nachzulesen ist, hat sich das Tool zur Datenbereinigung seit der Übernahme von Metaweb wieder einen großen Sprung weiterentwickelt. Neben einer neuen Extension Architektur und verbesserten Datenabgleichmöglichkeiten hat es auch eine Reihe neuer Features gegeben. Dazu zählen neue Commands, erweiterte Importfunktionen zu CSV und TSV und die Erweiterung der Google Refine Expression Language, die nun auch JSON unterstützt. Alle Änderungen gibt es im Überblick im Changelog
Außerdem hat Google drei neue Einführungsvideos zu Refine veröffentlicht. Das erste habe ich mal eingebunden, alle weiteren stehen im Open Source Blog bzw auf Youtube.
