Google hat bekanntgegeben Needlebase, ein Tool zum Auslesen, Bereinigen, Kombinieren und Bereitstellen von Datensätzen, einzustellen. Bei Nutzern wie Datenjournalismus-Interessierten hat dies zu einiger Verwunderung geführt und es kamen Fragen auf, welche Dienste den Platz von Needlebase einnehmen können. Ich sehe zwei Tools, die das Potential haben den Platz einzunehmen, Scraperwiki und Refine. Für eins der beiden sehe ich jedoch eine deutlich höhere Wahrscheinlichkeit. Weiterlesen
Archiv der Kategorie: Open Source
Google Refine 2.5 veröffentlicht
Google Refine hat jetzt offiziel die Version 2.5 erreicht. Das Changelog, das neue Features, Bugfixes und Verbesserungen auflistet, ist umfangreich. Insgesamt wurde die Integration mit Google Spreadsheets und Fusion Tables vorangetrieben. Weiterlesen
Rezension: “Python von Kopf bis Fuß”
Hier im Blog habe ich schon öfter über Python, bzw den Einstieg in Python geschrieben. Dabei habe ich auf einige Tutorials im Netz hingewiesen, darunter u.a. Showmedo, Google, freiesMagazin oder andere Wege um die Sprache zu erlernen, bislang aber nur online Quellen und kein klassisches Buch. Das ändert sich jetzt, denn kürzlich erschien die deutsche Ausgabe von “Head First, Python” und O’Reilly hat mir ein Exemplar von “Python von Kopf bis Fuss” geschickt, damit ich mir darüber eine Meinung bilden kann. Ich habe mich also die letzten Tage eingelesen und mir das Buch genauer angeschaut. Weiterlesen
LimeSurvey: Basissprache ändern
Ich schätze das offene Umfragetool LimeSurvey ja wirklich sehr. Es ist sehr flexibel, intuitiv zu bedienen, hat eine Wagenladung an Features mit an Bord und wird – nicht zuletzt durch die Teilnahme am Google Summer of Code – ziemlich zügig weiterentwickelt, was neue Features und schnell behobene Bugs verspricht.
Mit dem Tool lassen sich u.a. auch sehr einfach mehrsprachige Umfragen realisieren. Das erspart zwar nicht die Übersetzung einzelner Fragen, aber der Standardbausteine – wie Vor-/zurück-Buttons, Hinweise zum Ausfüllen etc. Klickt man eine weitere Sprache hinzu, sind alle Standardbausteine direkt übersetzt. Das ist solange alles nützlich und richtig, wie die ursprüngliche Umfrage und alle weiteren Sprachversionen identisch sind. Gibt es Abweichungen (andere Fragekonstellation, neue Struktur, unterschiedlicher Fragetyp in anderer Sprache) oder will man eine alte Umfrage in weiteren Sprachen neu starten hilft meist nur noch eine neue Umfrage. Weiterlesen
Termine: Cloudcamp Munich, Typo3Camp München, PHP Monday
Ein wenig Lokalpatriotismus hält Einzug ins Blog: Hier sind drei aktuelle Terminhinweise aus München und Umgebung:
- Das Typo3Camp Munich findet vom 9. bis 11. September 2011 in der Mediadesign-Hochschule in München statt. Es gibt leider nur noch Wartelistenplätze. Alle weiteren Infos auf der Webseite.
- Am 22. August findet der erste PHP-Monday in München statt. Bei Interesse bitte @MunichPHP folgen oder die Facebook-Gruppe besuchen.
- Cloud-Interessierte sollten sich am 10. September auf dem CloudCamp Munich einfinden. Auch hier weiß die Webseite mehr Details. Freie Plätze sind noch vorhanden. Veranstaltungsort ist Burg Schwaneck in Pullach
Google Refine 2.1 erschienen
Das Open Source Datenbreinigungstool Google Refine ist in Version 2.1 erschienen. Die offizielle Ankündigung spricht zwar von einem “maintenance release” mit diversen Bugfixes, einige neue Funktionen sind trotzdem dazugekommen. Interessant finde ich dabei den Import von Google Fusion Tables und den jsoup basierten HTML Parser, der jetzt Funktionen wie parseHtml, select, htmlAttr, htmlText, innerHtml, ownText unterstützt. Die Tutorial Videos wurden ebenfalls erneuert, auch wenn sie weiterhin die irreführende Betitelung “Goolge Refine 2.0″ tragen.
Chicago Tribune: Open Source Twitterfeed-Alternative und CSV-Toolkit in Python
Die Entwickler der Chicago Tribune haben kürzlich einige Eigenentwicklungen als Open Source veröffentlicht. Darunter ist auch der Appengine Autotweeter, der eine Alternative zur Verwendung des Webservice Twitterfeed darstellt und – wie der Name vermuten lässt – auf Googles App Engine läuft. In einem Blogpost erkären die Entwickler, dass Grund für die Eigenentwicklung die starren bzw zu langen Updateintervalle von Twitterfeed sind. Twitterfeed erlaubt nur Updates von maximal allen 30 Minuten – im schnelllebigen Nachrichtengeschäft oft deutlich zu lang.
Im selben Blogpost stellen die Entwickler weitere Open Source Tools vor. Darunter CSVkit (Dokumentation), eine Toolsammlung zur Bearbeitung von csv Datensätzen – ebenfalls in Python realisiert – und das bislang weit mehr beachtete PANDA (Presentation). PANDA gewann kürzlich $150.000 Förderung der Knight Foundation im Rahmen des Media Innovation Contest und soll das Datenmanagement bzw Datenjournalismus in Redaktionen vereinfachen.
Links: semantische CSS-Timeline, Python Sonderausgabe, JSON, praktischer DDJ, Processing
TimelineSetter & Tiki-Toki: Zeitleisten-Tools für Entwickler und Journalisten
Mit TimelineSetter von ProPublica und Tiki-Toki sind vor kurzem zwei neue Tools zur Visualisierung von chronologischen Abläufen erschienen. Die Ansätze sind dabei gänzlich unterschiedlich, einmal als bunte Webanwendung (Tiki-Toki.com) und im Gegensatz dazu TimelineSetter, das als Open Source Lösung hauptsächlich für Entwickler bereitsteht. Da ich bereits früher hier im Blog kurz TimeFlow angesprochen hatte, ein erster Blick auf die beiden neuen Tools. Weiterlesen
Links: Googles Python Anfängerkurs, Firefox 4 Visualisierungen, Data Science Toolkit, RSS Tuning, McLuhan
Nach viel zu langer Funkstille mal wieder Links – die jetzt übrigens auch so heißen oder alternativ auch keinen Titel tragen werden. Das “Lesenswert” im Titel der alten Linklisten bleibt, klingt mir aber irgendwie mittlerweile zu verschwurbelt. Hier gibt’s also ab sofort harte Fremdfakten im Linkbett
Weiterlesen
