Google hat bekanntgegeben Needlebase, ein Tool zum Auslesen, Bereinigen, Kombinieren und Bereitstellen von Datensätzen, einzustellen. Bei Nutzern wie Datenjournalismus-Interessierten hat dies zu einiger Verwunderung geführt und es kamen Fragen auf, welche Dienste den Platz von Needlebase einnehmen können. Ich sehe zwei Tools, die das Potential haben den Platz einzunehmen, Scraperwiki und Refine. Für eins der beiden sehe ich jedoch eine deutlich höhere Wahrscheinlichkeit. Weiterlesen
Schlagwort-Archive: Datenjournalismus
Google Refine 2.5 veröffentlicht
Google Refine hat jetzt offiziel die Version 2.5 erreicht. Das Changelog, das neue Features, Bugfixes und Verbesserungen auflistet, ist umfangreich. Insgesamt wurde die Integration mit Google Spreadsheets und Fusion Tables vorangetrieben. Weiterlesen
Links: semantische CSS-Timeline, Python Sonderausgabe, JSON, praktischer DDJ, Processing
TimelineSetter & Tiki-Toki: Zeitleisten-Tools für Entwickler und Journalisten
Mit TimelineSetter von ProPublica und Tiki-Toki sind vor kurzem zwei neue Tools zur Visualisierung von chronologischen Abläufen erschienen. Die Ansätze sind dabei gänzlich unterschiedlich, einmal als bunte Webanwendung (Tiki-Toki.com) und im Gegensatz dazu TimelineSetter, das als Open Source Lösung hauptsächlich für Entwickler bereitsteht. Da ich bereits früher hier im Blog kurz TimeFlow angesprochen hatte, ein erster Blick auf die beiden neuen Tools. Weiterlesen
Links: Datenjournalismus, re:publica, XML und RSS Einführung
Kurzer Zwischenruf mit zwei praktischen Links:
- Lorenz Matzat hat für Datenjournalismus-Interessierte die thematisch passenden Veranstaltung auf der kommenden Re:Publica 2011 zusammengefasst: Datenjournalismus auf der re:publica 2011. Wer vor Ort ist (was auf ziemlich viele Personen zutrefen dürfte) sollte sich insbesondere die Vorträge von Nicolas Kayser-Brill und Gregor Aisch nicht entgehen lassen. Die re:publica 2011 startet morgen und endet am Freitag.
- Ein kurzer Ausflug in die Grundlagen der Datenstruktur: In Data for journalists: understanding XML and RSS erklärt Paul Bradshaw das wesentliche zu beiden Formaten und zeigt in einem Mini-Tutorial wie man z.B. mit Yahoo Pipes Datenströme bearbeiten, filtern und verwenden kann.
Google-Tools und Datenjournalismus: Public Data Explorer öffnet sich, OCR in 34 Sprachen
Google hat zwei seiner Produkte weiter ausgebaut, was Sie noch interessanter als Tool zur Datenvisualisierung bzw für Datenjournalisten macht. Zum einen wurde der Public Data Explorer für eigene Datasets geöffnet und die OCR (Optical Character Recognition), sprich: automatische Texterkennung, in Google Docs wurde deutlich erweitert. Weiterlesen
Lesenswert: Drupal 7, Scraping für Journalisten, DDJ und Berichterstattung, HTML5 und Visualisierung, YQL, Linkevolution
Ein verspätetes frohes neues Jahr meinen Lesern! – Und ohne viel Worte direkt weiter mit den Links:
Content Management
- Von vielen bereits erwartet ist Drupal 7 nach rund drei Jahren Entwicklungszeit erschienen. Die offizielle deutsche Anlaufstelle für das Release ist http://drupal.org/drupal-7.0/de, ausserdem gibt es weltweit eine Menge Release Parties die unter www.drupal7releaseparty.org gelistet werden. Berichte über die Änderungen und Verbesserungen von Drupal 7 gibt es unter anderem bei t3n und golem.de Wer die volle Ladung Drupal (und Drupal 7) haben möchte ist wieder einmal mit dem knapp 2 stündigen XXL Podcast der Technikwürze bedient: #175 – Drupal total
Redaktion
- Auf Netzpolitik.org hat Lorenz Mazat (datenjournalist.de) einen Gastbeitrag zum Thema “Datenjournalismus und die Zukunft der Berichterstattung” veröffentlicht. Wer einmal einen gelungen Überblick und Ausblick zum Thema, den Auswirkungen und möglichen Entwicklungen lesen möchte, dem sei die Lektüre dringend empfohlen
- Auf ProPublica ist eine sehr gelungene Artikelreihe zum Thema “Scraping for Journalism – A Guide for Collecting Data” erschienen. Der Artikel bzw das Thema setzt zwangsläufig eine gewisse Technikaffinität voraus. Daher sind auch Ausflüge in die Welt von u.a. Ruby mit Nokogiri zu finden und entsprechende Codebeispiele werden genannt, was den Leser nicht abschrecken sollte. Um zu zeigen wie HTML-Seiten, pdfs und Textextraction aus Bildern funktioniert kommen auch Google Refine, OCR Methoden und Firebug zum Einsatz.
- EagerEyes hat einen guten Einführungsartikel zum Thema “HTML5 and Visualization on the Web” veröffentlicht und spricht darin einige Grundlagen der Technik an.
Webentwicklung
- Christian Heilmann hat erneut einen sehr lesenswerten Artikel auf Smashing Magazine veröffentlicht: “YQL: Using web content for non-programmers“
- Die New York Times versucht sich an der Weiterentwicklung des Hyperlinks. Mit erweiterten Links ist der direkte Sprung zu einzelnen Absätzen, Sätzen oder auch das Hervorheben einzelner Textabschnitte möglich: “NYT introduces the evolution of the hyperlink” berichtete The Next Web bereits Anfang Dezember.
Lesenswert: Schnüffel-Apps, Verbraucherpreise Treemap, PDF to HTML Preview, Data Converter und JSON Editoren
Ich gebe zu, ich habe in die Überschrift bewusst ein paar Keywords mit dem Holzhammer eingepflegt. Schnüffel-Apps klingt zum Beispiel unheimlich konspirativ, meint aber auch eigentlich nichts anderes als das, was die Werbeindustrie eh schon seit eh und je tut – Daten sammeln und verwenden – nur diesmal per App. Der Artikel des Wall Street Journal ist allerdings nicht nur informativ, sondern auch ein guter Aufhänger um doch nochmal ein paar Links loszuwerden, bevor ich mich offiziell in die Weihnachtspause verabschiede. Hier also meine letzten “lesenswerten” Links für dieses Jahr, auch diesmal nur grob in Schubladen gedacht und kategorisiert. Weiterlesen
Lesenswert: Tableau Software, Processing Tutorials, Data Blogs, Data Mining Tools, Scraperwiki
Generative Gestaltung Lecture – Intro Showreel from Benedikt Groß.
Lange gab es keine Linktipps mehr und meine Bookmarkliste platzt aus allen Nähten. Da es aber jeglichen Rahmen sprengen würde alle hier zu posten, nur eine kleine Auswahl der für mich interessantesten Fundstücke der letzten Wochen. Wer keinen Link verpassen will, darf sich gerne an mein Twitter-Profil hängen. Weiterlesen
Short notice: Design Meets Data, Berlin, 29.11.2010
Für Kurzentschlossene und alle Design und Code-Interessierte die sich am kommenden Montag in Berlin aufhalten:
Am 29. November wird es ein erstes Treffen von DESIGN MEETS DATA geben, einem losen Zusammenschluss von Designern und Entwicklern, Aktivisten und Experten verschiedenster Fachrichtungen, die auf den Gebieten Datenvisualisierung, Data-Driven Journalism und Open Data arbeiten oder sich dafür interessieren.
Das Treffen wird mit zwei Vorträgen von Friedrich Lindenberg (Open Data Network) und Georgi Kobilarov (Uberblic) starten und anschließend in ein informelles Meet & Greet übergehen.
Ort, Datum, Zeit:
29.11.2010 um 18 Uhr in den Räumen von impakt berlin, Erkelenzdamm 59-61 in Kreuzberg
Hier geht’s zur Anmeldung und Mailingliste Alles weitere wissenswerte über Twitter unter @designmeetsdata

