Der spinnt, der heise-Ticker

Sicher lässt sich unter Informationsjunkies über den Wert des vom heise-Verlag angebotenen RSS-Feeds streiten. Mehr als den Titel bekommt man im Feedreader nicht angezeigt – da ist Golem.de schon wesentlich großzügiger. Aber ich will mich hier nicht wieder über gekürzte Feeds, die gerade mir als Bahnfahrer aufstoßen, auslassen, sondern eher über ein anderes Detail im Zusammenhang mit dem RSS-Angebot von heise.

Im Zusammenhang mit einer Übungsaufgabe für unseren Auszubildenden sollte er mit PHP 5 einen kleinen XML und RSS-Parser basteln, der die Schlagzeilen von heise auf einer Webseite anzeigen kann. Irgendwie ging das jedoch nicht. Die anzuzeigende Seite würde immer wieder von einem jungfräulichen weiß geschmückt. Mit lokalen XML-Dateien kam der Parser jedoch gut zurecht. So lag denn die Vermutung nah, dass es an der Netzwerkverbindung liegen könnte.

Jedoch ließ sich auch nicht aus der lokal gespeicherten Datei die Information auslesen. Nach längerem ausprobieren und Gewissensbissen meinerseits (hatte ich eine zu nicht lösbare Aufgabe gestellt?) fanden wird letztendlich gemeinsam die Ursache. Die Aufgabe war in der Konstellation wirklich unlösbar, was deutlich wurde, als wir es alternativ mit dem RSS-Feed von spiegel online versuchten. Das ging nämlich auf Anhieb ohne Probleme.

Ein Vergleich beider Feeds zeigte, dass der von heise eine ungewöhnliche Struktur hat. Er wird von einigen XML-Parsern auch nicht als gültiges XML-Dokument erkannt. Schade eigentlich für einen IT-Fachverlag.

Update: Es scheint wohl daran zu legen, dass der Parser mit einem Atom-Feed nicht zurecht kommt – die Struktur sieht anders aus als bei einem RSS-Feed. Evtl. hat ja jemand noch eine Idee, wie sich der Heise-Feed einlesen lässt (ohne externe Tools).

Kommentar verfassen