Open Source | Content Management | Redaktion

Schlagwort: Scraping

Lesenswert: Drupal 7, Scraping für Journalisten, DDJ und Berichterstattung, HTML5 und Visualisierung, YQL, Linkevolution

Ein verspätetes frohes neues Jahr meinen Lesern! – Und ohne viel Worte direkt weiter mit den Links:

Content Management

  • Von vielen bereits erwartet ist Drupal 7 nach rund drei Jahren Entwicklungszeit erschienen. Die offizielle deutsche Anlaufstelle für das Release ist http://drupal.org/drupal-7.0/de, ausserdem gibt es weltweit eine Menge Release Parties die unter www.drupal7releaseparty.org gelistet werden. Berichte über die Änderungen und Verbesserungen von Drupal 7 gibt es unter anderem bei t3n und golem.de Wer die volle Ladung Drupal (und Drupal 7) haben möchte ist wieder einmal mit dem knapp 2 stündigen XXL Podcast der Technikwürze bedient: #175 – Drupal total

Redaktion

  • Auf Netzpolitik.org hat Lorenz Mazat (datenjournalist.de) einen Gastbeitrag zum Thema „Datenjournalismus und die Zukunft der Berichterstattung“ veröffentlicht. Wer einmal einen gelungen Überblick und Ausblick zum Thema, den Auswirkungen und möglichen Entwicklungen lesen möchte, dem sei die Lektüre dringend empfohlen
  • Auf ProPublica ist eine sehr gelungene Artikelreihe zum Thema „Scraping for Journalism – A Guide for Collecting Data“ erschienen. Der Artikel bzw das Thema setzt zwangsläufig eine gewisse Technikaffinität voraus. Daher sind auch Ausflüge in die Welt von u.a. Ruby mit Nokogiri zu finden und entsprechende Codebeispiele werden genannt, was den Leser nicht abschrecken sollte. Um zu zeigen wie HTML-Seiten, pdfs und Textextraction aus Bildern funktioniert kommen auch Google Refine, OCR Methoden und Firebug zum Einsatz.
  • EagerEyes hat einen guten Einführungsartikel zum Thema „HTML5 and Visualization on the Web“ veröffentlicht und spricht darin einige Grundlagen der Technik an.

Webentwicklung

  • Christian Heilmann hat erneut einen sehr lesenswerten Artikel auf Smashing Magazine veröffentlicht: „YQL: Using web content for non-programmers
  • Die New York Times versucht sich an der Weiterentwicklung des Hyperlinks. Mit erweiterten Links ist der direkte Sprung zu einzelnen Absätzen, Sätzen oder auch das Hervorheben einzelner Textabschnitte möglich: „NYT introduces the evolution of the hyperlink“ berichtete The Next Web bereits Anfang Dezember.

Datenvisualisierung (3) – Tipps, Tools, Webservices und Links

Data Mining - Mapping The Blogosphere

Data Mining: Mapping the Blogosphere

Im dritten und vorerst letzten Teil meiner Kurz-Serie zum Thema Datenvisualisierung gibt es einen Überblick über diverse Möglichkeiten wie man Datensätze grafisch aufbereiten kann. Wer sich zuvor die ersten beiden Teile der Serie durchlesen möchte findet sie hier:
Teil 1: Einführung und Beispiele
Teil 2: Warum Daten visualisieren?

Bevor ich zum eigentlichen Thema dieses Beitrags komme, zunächst ein kurzes Video von Tim Berners Lee’s Kurzansprache auf der TED Konferenz. Ich finde „The Year Open Data Went Worldwid“ bietet eine sehr gute Zusammenfassung und Einführung ins Thema. In meinem anschließenden Beitrag nehme ich das angesprochene Thema „Open Data“ kurz auf, mache einen kurzen Abstecher in zum Thema „Datenaggregation“ und außerdem gibt’s jede Menge nützliche und lesenswerte Links.

Präsentiert von WordPress & Theme erstellt von Anders Norén