Open Source | Content Management | Redaktion

Schlagwort: Datenjournalismus Seite 1 von 3

Google Refine Icon by stefano.mazzocchi

Open Refine Starter: Erste Schritte und Orientierung für Einsteiger

Google Refine Icon by stefano.mazzocchi OpenRefine (vorher Google Refine, vorher Freebase Gridworks) hat in der letzten Zeit einige Änderungen erfahren. Unter anderem hat das Projekt eine neue Homepage http://openrefine.org und ist zu GitHub umgezogen, Überbleibsel gibt es aber nach wie vor noch unter der alten Adresse http://code.google.com/p/google-refine/. Damit der Einstieg in die Arbeit mit Refine etwas leichter fällt, hier kurz ein paar Eckpunkte zur Orientierung, vom Download über Starten/Sichern/Beenden, erste Schritte mit der GREL und zum Schluss noch ein paar weitere Quellen.

The Data Journalism Handbook

Datenjournalismus Handbuch veröffentlicht

The Data Journalism Handbook Es ist soweit. Nach rund einem halben Jahr Arbeit wurde das erste Data Journalism Handbook veröffentlicht. Unter http://datajournalismhandbook.org/ kann das Buch kostenlos gelesen werden. Eine gedruckte Variante bzw ein eBook-Version werden via O’Reilly angeboten.

"link" by Alex Eylar @ Flickr (c) CC-By-NC-SA

Links: TV-Abgesang, Vocer, free your metadata, DDJ Resourcen, Graphinsight

"link" by Alex Eylar @ Flickr (c) CC-By-NC-SA

"link" by Alex Eylar @ Flickr (c) CC-By-NC-SA

Es ist viel zu lange her, dass es an dieser Stelle Linktipps gab. Die meisten davon finden auch nur noch auf Google+ und Twitter statt. Wer also schneller informiert sein möchte, kann ja mal da vorbeischauen.

Needle Macro by fdecmoite @flickr | CC-BY

Nach dem Needlebase-Aus: Scraperwiki und Google Refine als Alternative?

Needle Macro by fdecmoite @flickr | CC-BY Google hat bekanntgegeben Needlebase, ein Tool zum Auslesen, Bereinigen, Kombinieren und Bereitstellen von Datensätzen, einzustellen. Bei Nutzern wie Datenjournalismus-Interessierten hat dies zu einiger Verwunderung geführt und es kamen Fragen auf, welche Dienste den Platz von Needlebase einnehmen können. Ich sehe zwei Tools, die das Potential haben den Platz einzunehmen, Scraperwiki und Refine. Für eins der beiden sehe ich jedoch eine deutlich höhere Wahrscheinlichkeit.

Google Refine Icon by stefano.mazzocchi

Google Refine 2.5 veröffentlicht

Google Refine Icon by stefano.mazzocchi Google Refine hat jetzt offiziel die Version 2.5 erreicht. Das Changelog, das neue Features, Bugfixes und Verbesserungen auflistet, ist umfangreich. Insgesamt wurde die Integration mit Google Spreadsheets und Fusion Tables vorangetrieben.

Links: semantische CSS-Timeline, Python Sonderausgabe, JSON, praktischer DDJ, Processing

"link" by Alex Eylar @ Flickr (c) CC-By-NC-SA

"link" by Alex Eylar @ Flickr (c) CC-By-NC-SA

Damit über Ostern der Lesestoff nicht ausgeht hier noch schnell ein paar Links. Viel Spaß beim Lesen und frohe Ostern!

TimelineSetter & Tiki-Toki: Zeitleisten-Tools für Entwickler und Journalisten

Mit TimelineSetter von ProPublica und Tiki-Toki sind vor kurzem zwei neue Tools zur Visualisierung von chronologischen Abläufen erschienen. Die Ansätze sind dabei gänzlich unterschiedlich, einmal als bunte Webanwendung (Tiki-Toki.com) und im Gegensatz dazu TimelineSetter, das als Open Source Lösung hauptsächlich für Entwickler bereitsteht. Da ich bereits früher hier im Blog kurz TimeFlow angesprochen hatte, ein erster Blick auf die beiden neuen Tools.

Links: Datenjournalismus, re:publica, XML und RSS Einführung

Kurzer Zwischenruf mit zwei praktischen Links:

  • Lorenz Matzat hat für Datenjournalismus-Interessierte die thematisch passenden Veranstaltung auf der kommenden Re:Publica 2011 zusammengefasst: Datenjournalismus auf der re:publica 2011. Wer vor Ort ist (was auf ziemlich viele Personen zutrefen dürfte) sollte sich insbesondere die Vorträge von Nicolas Kayser-Brill und Gregor Aisch nicht entgehen lassen. Die re:publica 2011 startet morgen und endet am Freitag.
  • Ein kurzer Ausflug in die Grundlagen der Datenstruktur: In Data for journalists: understanding XML and RSS erklärt Paul Bradshaw das wesentliche zu beiden Formaten und zeigt in einem Mini-Tutorial wie man z.B. mit Yahoo Pipes Datenströme bearbeiten, filtern und verwenden kann.

Google-Tools und Datenjournalismus: Public Data Explorer öffnet sich, OCR in 34 Sprachen

Google Google hat zwei seiner Produkte weiter ausgebaut, was Sie noch interessanter als Tool zur Datenvisualisierung bzw für Datenjournalisten macht. Zum einen wurde der Public Data Explorer für eigene Datasets geöffnet und die OCR (Optical Character Recognition), sprich: automatische Texterkennung, in Google Docs wurde deutlich erweitert.

Lesenswert: Drupal 7, Scraping für Journalisten, DDJ und Berichterstattung, HTML5 und Visualisierung, YQL, Linkevolution

Ein verspätetes frohes neues Jahr meinen Lesern! – Und ohne viel Worte direkt weiter mit den Links:

Content Management

  • Von vielen bereits erwartet ist Drupal 7 nach rund drei Jahren Entwicklungszeit erschienen. Die offizielle deutsche Anlaufstelle für das Release ist http://drupal.org/drupal-7.0/de, ausserdem gibt es weltweit eine Menge Release Parties die unter www.drupal7releaseparty.org gelistet werden. Berichte über die Änderungen und Verbesserungen von Drupal 7 gibt es unter anderem bei t3n und golem.de Wer die volle Ladung Drupal (und Drupal 7) haben möchte ist wieder einmal mit dem knapp 2 stündigen XXL Podcast der Technikwürze bedient: #175 – Drupal total

Redaktion

  • Auf Netzpolitik.org hat Lorenz Mazat (datenjournalist.de) einen Gastbeitrag zum Thema „Datenjournalismus und die Zukunft der Berichterstattung“ veröffentlicht. Wer einmal einen gelungen Überblick und Ausblick zum Thema, den Auswirkungen und möglichen Entwicklungen lesen möchte, dem sei die Lektüre dringend empfohlen
  • Auf ProPublica ist eine sehr gelungene Artikelreihe zum Thema „Scraping for Journalism – A Guide for Collecting Data“ erschienen. Der Artikel bzw das Thema setzt zwangsläufig eine gewisse Technikaffinität voraus. Daher sind auch Ausflüge in die Welt von u.a. Ruby mit Nokogiri zu finden und entsprechende Codebeispiele werden genannt, was den Leser nicht abschrecken sollte. Um zu zeigen wie HTML-Seiten, pdfs und Textextraction aus Bildern funktioniert kommen auch Google Refine, OCR Methoden und Firebug zum Einsatz.
  • EagerEyes hat einen guten Einführungsartikel zum Thema „HTML5 and Visualization on the Web“ veröffentlicht und spricht darin einige Grundlagen der Technik an.

Webentwicklung

  • Christian Heilmann hat erneut einen sehr lesenswerten Artikel auf Smashing Magazine veröffentlicht: „YQL: Using web content for non-programmers
  • Die New York Times versucht sich an der Weiterentwicklung des Hyperlinks. Mit erweiterten Links ist der direkte Sprung zu einzelnen Absätzen, Sätzen oder auch das Hervorheben einzelner Textabschnitte möglich: „NYT introduces the evolution of the hyperlink“ berichtete The Next Web bereits Anfang Dezember.

Seite 1 von 3

Präsentiert von WordPress & Theme erstellt von Anders Norén