tobiaskut.de

Open Source | Content Management | Redaktion

Google Refine Icon by stefano.mazzocchi

Google Refine wird zu Communityprojekt OpenRefine

Google Refine Icon by stefano.mazzocchi Vor nicht allzu langer Zeit hab ich in diesem Blog noch über die mögliche Überführung von Needlebase-UI und -Features in Google Refine sinniert und es als sinnvolle Erweiterung des Projekts eingeschätzt. Jetzt sieht es so aus, als werden die Karten neu gemischt denn Refines‘ Zukunft in der Google Familie wird bald enden.

Vor kurzem gab es eine wegweisende Mitteilung zum Projekt Google Refine. Mitentwickler David Huynh postete auf der offiziellen Mailingliste im Namen der Google Mitarbeiter des Refine Projekts einige grundlegende Entscheidungen zur weiteren Entwicklung und Ausrichtung des Data Reconciliation Tools. Jeder der mit Google Refine bereits gearbeitet hat und das Tool aktiv verwendet wird sich voraussichtlich schon bald auf Änderungen einstellen müssen.

Änderungen und Zukunft des Refine-Projekts

Die Änderungen sind im wesentlichen Folgende

  • Refine war seit der Übernahme durch Google bereits ein Open Source Tool, dass unter der Schirmherrschaft von Google maßgeblich weiterentwickelt wurde. Das war historisch bedingt (durch die Übernahme von Metaweb / Freebase Gridworks) und ändert sich nun.
  • Google wird die „Projektleitung“ aufgeben und Refine noch mehr als bislang an die Community übergeben
  • Damit verbunden ist der Übergang von Google Code zu einer anderen Codeverwaltung. Hierzu gab es innerhalb der Community eine Diskussion und administrative Umfrage welche Codeverwaltung gewünscht und machbar ist oder ob es Wege gibt Refine auf Google Code zu belassen. Das Ergebnis ist, das Refine zu Git überführt wird. Details zur Überführung stehen in diesem Thread.
  • Die zunächst wohl auffälligste Änderung: Mit der Abgabe von Refine an die Community wurde auch ein neuer Name ohne Google Prefix gesucht. Die Entscheidung fiel auf OpenRefine (ohne Leerzeichen!).
  • Es wird ein neues Logo geben. Die Abstimmung dazu läuft aktuell. Den Entwurfsprozess kann man hier nachvollziehen.

Das ändert sich nicht

Trotz der teils erheblichen Änderungen die anstehen, bleiben auch einige Dinge beim Alten. So ist und bleibt Refine ein Open Source Projekt. Interessierte Entwickler sind jederzeit willkommen, jetzt vielleicht sogar noch mehr als zuvor und die Gelegenheit zum Einstieg scheint günstig.

Zudem bleibt Refine kostenlos verfügbar und es wird auch noch Bugfixes geben, davon einige bereits in Kürze mit dem Release der neuen Version. Was danach geschieht und wie schnell die Community das Projekt übernehmen kann um neue Features zu releasen oder Bugs zu fixen bleibt abzuwarten. Offen ist auch, wie Entwickler von Refine-Erweiterungen reagieren und ob es weiter Anpassungen an künftige Refine-Entwicklungsschritte gibt.

Umfrage zum Nutzungsverhalten

Damit es einfacher wird abzuschätzen wie Refine derzeit tatsächlich genutzt wird, welche Features populär und welche Anforderungen dringend notwendig sind, wurde eine Umfrage zum Nutzungsverhalten von Google Refine durchgeführt. Die Ergebnisse liegen mittlerweile vor. Erste Einblicke gibt Martin Magdinier in seinem Blog.

Fazit

Die gesamte Situation inklusive kurzem Abriss woher Refine kommt (Stichworte: Metaweb, Freebase, Gridworks) und was von der aktuellen Situation zu halten ist hat Martin Magdinier in einem längeren Blogpost sehr gut zusammengefasst.

Ich persönlich sehe die Entwicklung mit gemischten Gefühlen. Ich hätte gerne gesehen, dass Needlebase (ebenfalls seit kurzem im Google Portfolio) in Refine aufgeht. Beide Projekte hätten sich meiner – zugegeben sehr UI-getriebenen – Ansicht nach sehr gut ergänzt. Aber auch wenn dies jetzt (ziemlich sicher) nicht mehr passieren wird ist die Neuaufstellung auch eine Chance. Ich rechne damit, dass die Entwicklung zunächst langsamer vorangeht, aber das Projekt selbst sich stärker den Nutzerbedürfnissen nähern wird. Da die Nutzerbasis von Refine mittlerweile recht stattlich ist und das Projekt deutlich an Popularität gewonnen hat sicher keine einfache Aufgabe. Es ist spannend diese Entwicklung zu beobachten.

Zudem wurde angekündigt, dass der Support durch Google nicht schlagartig endet, sondern ausläuft. Auch hier gehe ich davon aus, dass es einen sanften Übergang in die Community geben wird.

Refine bleibt meiner Kenntnis nach das bislang umfangreichste (kostenlose) Tool zum Datenmanagement, -bereinigung und –kontrolle, das zur Zeit verfügbar ist. Es gibt zwar Alternativen, diese sind allerdings entweder noch im Alpha-Stadium oder hinsichtlich des Featuresets weit weniger umfangreich als Refine. Letzteres muss dagegen kein Nachteil sein, denn das Userinterface von Refine ist meiner Meinung nach oft nicht ideal und stößt angesichts der diversen Möglichkeiten des Tools gerade deutlich an seine Grenzen.

Vorheriger Beitrag

kostenloses eBook: 15 Open Source CMS im Vergleich

Nächster Beitrag

Windows 7: Python Idle über Eingabeaufforderung starten

  1. Disclaimer: I’ve read this article using Google translation to English.

    Thanks for your article and inputs regarding this transition for OpenRefine (let’s use the new name now!).

    I would just like to react regarding Google Refine extension developers. The code have been moved as is to GitHub and all current extension will continue to work. I would love to see all those people getting more involved in OpenRefine development in the next coming weeks and months so the community can make OpenRefine and its extension grows together.

    Feel free to join the discussion list to share your ideas. We need you!

    Martin

    • Hi Martin,
      Thanks for your reply and the update. I also hope for many developers to continue their work on refine/exstensions and more people joining them. I’m just not sure if all current devs will make the switch to GitHub and continue the work on existing extensions and integration in future releases. But I do hope they do!
      Best
      Tobias

Schreibe einen Kommentar

Präsentiert von WordPress & Theme erstellt von Anders Norén