Suchmaschine Wolfram Alpha: Was der Google-Gegner weiß – und was nicht (Spiegel Online, 6.5.2009, mit Matthias Kremp)

Kreative Vertipper im Web

Frisch verpackt und eingescheißt

Clevere Präsentation, schwache Datenbasis: Die Suchmaschine Wolfram Alpha wurde vorab schon als „Google Killer“ gehandelt – jetzt hat SPIEGEL ONLINE eine erste Version getestet. Sie weiß viel über Aspirin, versagt bei Kultur – und hält die CDU für einen Regionalflughafen.

Spiegel Online, 6.5.2009 (mit Matthias Kremp)

Wolfram Alpha ist kein Google-Killer, und es ist auch keine Suchmaschine. Vielmehr soll es eine Antwortmaschine sein, sagt Stephen Wolfram, der Erfinder des neuen Web-Angebots. Der bezeichnet seine Kreation ganz unbescheiden als „ein neues Paradigma für den Gebrauch von Computern und den des Web“. Sein Ziel: Endlich das Versprechen einlösen, das die Computerpioniere der fünfziger Jahre gegeben haben: Computer sollen künftig selbst die Antworten auf Sachfragen geben.

Den nötigen Hintergrund für diese Aufgabe mag man Wolfram zutrauen. Das von ihm entwickelte Software-Paket „Mathematica“ machte den Physiker reich. Vor allem für Naturwissenschaftler, Statistiker und Mathematiker ist das Programm ein universeller Problemlöser für mathematische Fragestellungen aller Art. Und weil es so enorm viel Rechenleistung benötigt, wird es von manchen Computerzeitschriften sogar benutzt, um die Leistung von PCs zu testen.

Jetzt will Wolfram die Art und Weise revolutionieren, wie wir im Web nach Antworten suchen. Den Weg dahin soll die Antwortmaschine Wolfram Alpha weisen, ein Web-Angebot, das viel von dem kann, was auch Google kann – nur besser. In der Theorie.

Wahlergebnisse, Umsatzzahlen, Einschaltquoten und Medaillenspiegel – SPIEGEL ONLINE testet, wie gut sich Wolfram Alpha in verschiedenen Themen auskennt.

Politik – welche Wahlen?

Wie sind die US-Präsidentschaftswahlen 2008 eigentlich genau ausgegangen? So eine Frage müsste Wolfram Alpha doch sehr anschaulich beantworten können. Leider führt die Suchanfrage „presidential election 2008 results“ nur zu dem Hinweis, dass die Suchmaschine die Anfrage nicht versteht („isn’t sure what to do with your input“). Auch die vereinfachte Anfrage presidential election versteht die Suchmaschine nicht. Sucht man nach „election“, kommt endlich eine Erklärung: Als Oberbegriff wird „Government“ (Regierung) angezeigt, darunter steht der kryptische Hinweis: „Die Entwicklung dieses Themas wird untersucht.“

Bei Google führt der erste Treffer der Suchanfrage „presidential election 2008 results“ zur Übersichtsseite von CNN – Google schlägt sogar einen direkten Link zu den Ergebnissen landesweit und in den einzelnen Staaten vor.

Wolfram Alpha enttäuscht bei Suchanfragen zu politischen Themen:

  • Democratic Party? Noch nicht erfasst
  • CDU? Camden Airport in Australien (der aber immerhin mit aktuellem Wetter).
  • New York Crime Rate? Keine Ergebnisse.
  • New York Mayor? Wolfram Alpha kennt den Bürgermeister nicht, Googles erster Treffer führt zu Bloombergs offizieller Seite.

Natürlich muss Wolfram Alpha als erklärtes US-zentriertes Projekt mit ausschließlich englischer Spracherkennung die CDU nicht kennen. Aber spätestens beim offiziellen Start sollte Wolfram Alpha Datenbanken mit Wahlergebnissen auswerten und vielleicht auch Informationen zur Regierung in US-Bundesstaaten oder Staaten überhaupt abgreifen. Dieser Mangel fällt umso deutlicher auf, da Wolfram Alpha zu einzelnen Staaten sehr umfangreiche Profile zusammenträgt. Nur wer gerade regiert, weiß Wolfram Alpha nicht.

Länder – viele Deutsche sprechen Kölsch

Wolfram Alpha arbeitet die Informationen zu einzelnen Staaten sehr anschaulich auf. Wer nach „Germany“ sucht, sieht auf einen Blick Details wie zum Beispiel:

 

  • die angrenzenden Staaten samt der exakten Grenzlänge in Kilometern (786 mit Österreich, 68 mit Dänemark)
  • eine Aufzählung der zehn größten Städte (mit Einwohnerzahlen).

Allerdings stimmen einige der Zahlen etwas misstrauisch: Als kulturelle Rahmendaten zählt Wolfram Alpha zum Beispiel Sprachen auf, ohne weiter zu erklären, was mit diesen ausgespuckten Prozentwerten eigentlich mit diesen Angabe gemeint ist:

  • German 96%
  • Upper Saxon 2,6%
  • Kölsch 0,32 %
  • Bavarian 0,31 %
  • Polish 0,31 %

Heißt das, dass Polnisch ein deutscher Dialekt ist? Werden hier Dialekte und Sprachen vermischt, weil es um die im Alltag verwendeten Sprachen geht? Was aber ist dann mit Türkisch, was mit der offiziellen Minderheitensprache Dänisch? Woher die Angaben stammen, und was da eigentlich gezählt wird, erklärt Wolfram Alpha nicht. Als Quellenangabe steht da nur: „Wolfram|Alpha curated data, 2009; Wolfram Mathematica CountryData“.

Eine Googlesuche nach „Germany“ (in der englischen Sprachversion) führt als ersten Treffer den Wikipedia-Artikel auf.

Ein Alleinstellungsmerkmal von Wolfram Alpha offenbart eine Suche nach zwei, drei oder mehr Staaten: Eine Suchanfrage wie „US vs China“ oder „US vs China vs Germany vs Russia“ liefert eine eigens generierte Ergebnisseite, auf der Wolfram Alpha alle verfügbaren Daten miteinander vergleicht. Ein Blick zeigt, welcher Staat die höchste Arbeitslosigkeit hat, wo die Lebenserwartung der Bürger am niedrigsten ist und welchen Rang der Staat damit weltweit einnimmt. Das ist beeindruckend – ein Gegenstück dazu liefert Google nicht.

Solch ein Vergleich ist bei Wolfram Alpha auch zwischen Städten möglich. Tippt man als Anfrage zum Beispiel Hamburg und San Francisco ein, vergleicht Wolfram Alpha nicht nur statistische Kennzahlen zur Bevölkerung, sondern errechnet auch Entfernung, Flugzeit und Ortszeit.

Wirtschaft – ein paar schöne Vergleiche

Wann immer es darum geht, eindeutig definierte und numerische Kennwerte zu vergleichen, glänzt Wolfram Alpha. Vergleich man mit der Suchanfrage „Nokia vs Motorola“ die beiden Konzerne, kann man unmittelbar Umsatzzahlen, Schulden und so weiter vergleichen. Bei Google führt der erste Treffer zu einem Blogeintrag von 2006, der fragt: „Nokia vs. Motorola: Who’s the Boss?“, aber darauf keine Antwort gibt.

Mit ähnlichen Vergleichsanfragen kann man sich von Wolfram Alpha auch die Auflagenzahlen von US-Zeitungen anzeigen lassen. Beim Vergleich von „New York Times“, „Wall Street Journal“, „Washington Post“, „Los Angeles Times“ liegt das Hauptstadtblatt ganz hinten, allerdings fehlt eine exakte Angabe dazu, aus welchem Zeitrum die Daten eigentlich stammen – damit sind diese so schön aufbereiteten Statistiken für jede journalistische, wissenschaftliche oder sonst wie professionelle Nutzung unbrauchbar. Die Auflagenzahlen kann man sich auch für einzelne Titel anzeigen lassen – aber auch hier sind Zeitreihen oder auch nur brauchbar datierte Angaben nicht drin.

Ähnliche Vergleiche für Zuschauerzahlen von US-Fernsehsendern kann Wolfram Alpha nicht liefern. Die Suche nach „CNN vs CBS (TV)“ versteht die Maschine nicht, CNN interpretiert Wolfram Alpha als Suchanfrage nach dem „Caledonian Trust“, einer britischen Anlagefirma. Den Nachrichtensender CNN kennt Wolfram nicht.

Auch sonst ist Wolfram Alpha für Wirtschaftsthemen wenig ergiebig. Man kann zwar mit der Anfrage „Germany import value vs export value“ Außenhandelsumsatz und Einfuhrwert vergleichen. Allerdings verrät Wolfram Alpha nur beim Export, dass der angegebene Wert ein „2007 estimate“ ist. Die Angabe für die Importe wird nicht zeitlich eingeordnet, eine genauere Quellenangabe dazu, wer da schätzt, ist nicht zu finden. Das gleiche Ergebnis bei der gleichen Suchanfrage zu US-Werten. Schwach!

Computerthemen – Macs sind Schmierstoffe

In Fragen Internet und Technik zeigt sich einmal mehr, wie weit die Ansätze von Google und Wolfram Alpha auseinander gehen. Eine Suche nach den Begriffen Microsoft und Google beantwortet Wolfram Alpha mit einem ausführlichen Tabellenwerk, das die Finanzdaten der beiden Unternehmen einander gegenüberstellt, die Entwicklung der Börsenkurse aufzeigt. Googles Suchmaschinisten leiten die Anfrage, offenbar in sicherer Erwartung, dass sie kommen wird, auf eine am den Stil von Windows XP angelehnte Google-Suchseite um. Da hat jemand Spaß gehabt. Die eigentlichen Suchergebnisse, mit Online-Artikeln und Pressemitteilungen, folgen darunter.

Wer sich über das Verhältnis von Macs zu PCs und die Verkaufszahlen der Apple-Rechner informieren will, wird von Google mit einem Füllhorn an Unterhaltung und Infos überschüttet. Da werden Werbespots gezeigt und Umfragen wiedergeben, dass es nur so kracht. Konkrete Angaben über Apples installierte Basis findet man aber nicht, auch nicht bei Wolfram Alpha. Die Maschine interpretiert den Begriff „Macs“ als Kürzel für Schmierstoffe aus der Gruppe der mehrfach alkylierten Cyclopentane (multiply alkylated cyclopentane) und liefert zu dieser Stoffgruppe die physikalischen Daten. Schön, aber falsch.

Zu Hochform läuft Wolfram Alpha dagegen auf, fragt man nach den Computereinheiten „Bits, Bytes, Mebibytes und Gibibytes“. Google führt hier einmal mehr einen Wikipedia-Artikel auf, listet aber gleich darunter eine weitere Seite, auf die verschiedenen Einheiten für Speichermengen einander übersichtlich gegenübergestellt sind.

Wolfram Alpha hält sich mit so etwas nicht lange auf, sondern generiert eine Übersichtsseite mit Umrechnungstabellen, Verhältnisdarstellungen und ähnlichen mathematischen Vorlagen. Für besonders Interessierte sicher eine feine Sache. Wer sich einfach nur einen Überblick über die alten und neuen Maßeinheiten verschaffen will, ist bei Google besser aufgehoben.

Promis – Welchen Job hat Angela Dorothea Kasner?

Geht es um Promis und Berühmtheiten, liegen die Suchergebnisse von Google und Wolfram Alpha weit auseinander. Ein paar Beispiele:

Eine Frage nach der Angela Merkel beantwortet Wolfram Alpha ganz pragmatisch. Die Dame sei in den fünfziger Jahren als Angela Dorothea Kasner in Hamburg geboren und arbeite heute als Politikerin, mehr steht da nicht – weder, welcher Partei sie angehört, noch, welches Amt sie bekleidet. Dass sie Bundeskanzlerin ist, erfährt man erst aus dem daneben angezeigten Wikipedia-Eintrag. Auf den stützt sich auch Google, verweist an zweiter Stelle aber auf die Homepage der Kanzlerin und listet danach Regierungs- und Zeitungsseiten.

Richtig düster wird es, sucht man nach der aktuellen Miss California, Carrie Prejean. Google zeigt zuerst und vollkommen korrekt eine Liste tagesaktueller Nachrichten zu der umstrittenen Schönheitskönigin an, bringt kurz darunter Bilder und Videos der Dame auf die Seite. Wolfram Alpha dagegen kennt die Frau nicht einmal, verkürzt ihren Namen auf Carrie und spuckt darauf hin statistische Daten darüber aus, wie viele Frauen in den USA diesen Namen tragen.

Nicht wesentlich erfolgreicher verläuft die Suche nach den Namen Steve, Larry, Sergey. Alle drei auf einmal eingetippt sind Wolfram Alpha zu viel. Beschränkt man sich auf die ersten beiden, erfährt man, dass es in den USA 201.739 Steves und 701.582 Larrys gibt. Google geht die Sache ganz anders an, zeigt als Ergebnis Seiten an, auf denen es vor allem und die Google-Gründer Larry Page und Sergey Brin geht, mal in Kombination mit Steve Jobs, mal mit Steve Ballmer.

Wissenschaft – Alles über Aspirin

Wissenschaftliche Anfragen beantwortet Wolfram Alpha mit Bravour, aber ohne sich lange mit Erklärungen aufzuhalten. Auf die Frage nach dem Refraktionsindex, einer optischen Eigenschaft von Wasser, zupft Wolfram ohne Zögern den korrekten Zahlenwert hervor: 1,333. Google hingegen bietet nicht weniger als 781.000 Seiten zum selben Thema an. Ganz oben wieder die Wikipedia mit einer Liste von Refraktionsindizes, aus dem an sich den Wert für Wasser erst heraussuchen muss.

Ein ähnliches Bild ergibt sich bei der Suche nach der Dichte von Wasser. Wolfram liefert hier allerdings nicht nur den reinen Zahlenwert, sondern auch gleich ein Liste mit Umrechnungen in anderen Maßeinheiten und ein paar Vergleiche mit der Dichte des menschlichen Körpers und sogar ein Phasendiagramm. Google stellt einmal nicht die Wikipedia, sondern eine britische Seite mit Umrechnungstabellen an die erste Stelle. Die allerdings präsentiert nicht nur die Dichte, sondern auch noch etliche andere Informationen rund ums Wasser.

Bei der Suche nach dem Medikament Aspirin spielt Wolfram Alpha seine volle Stärke aus. Neben chemischen und Strukturformeln des Wirkstoffs Acetylsalicylsäure werden räumliche Modelle der Molekülstruktur und etliche chemische Kennzahlen übersichtlich und sauber geordnet angezeigt. Was fehlt, ist eine Erklärung, wozu das Zeug eigentlich gut sein soll. Die liefert Google. Nicht nur mit einem Wikipedia-Eintrag, sondern auch mit einem direkten Link zu einer Produktseite des Herstellers.

Kultur – Wer ist bloß dieser „Star Trek“?

Mit Kultur hat Wolfram Alpha nicht viel am Hut. Nicht einmal eigentlich nerdige Anfragen kann die Maschine befriedigend beantworten.

Will man erfahren, wie viele Folgen von der ersten Star-Trek-Serie gedreht wurden, bekommt man Infos zu einigen, aber nicht allen Star-Trek-Kinofilmen angeboten. Wolfram-typisch werden dann Angaben wie Spieldauer, Einspielergebnis und Regisseur aufgeschlüsselt. Google hingegen verweist sowohl auf einen Eintrag auf Wikianswers, der die Gesamtzahl aller Folgen rund um das Star-Trek-Universum auf 617 taxiert. Und wer es genauer wissen will, gelangt über die Wikipedia zu einer Liste die zeigt, wie viele Folgen es denn nun von „Next Generation“, „Voyager“ und all den anderen gegeben hat.

Die Suche nach „Kurt Cobain“ und MTV beantwortet Google mit einer Bildergalerie des Nirvana-Sängers. Daran schließen sich eine MTV-Webseite mit Infos zur Kultband sowie zu den unvermeidlichen YouTube-Videos vom Unplugged-Auftritt an. Wolfram Alpha hält dagegen nur staubtrockene Infos zu Cobain bereit, kennt seinen vollen Namen und weiß wann und wo er gestorben ist. Immerhin: Rechts neben dem Suchergebnis wird ein Link zu Cobains Wikipedia-Eintrag gesetzt.

Sport – Olympische Spiele? Unbekannt.

Immerhin weiß Wolfram Alpha etwas über Baseball: Bittet man den Dienst um einen Vergleich der New York Yankees mit den Boston Red Sox, verrät die Ergebnisseite, wer in welchem Jahr die World Series gewonnen hat. Die Ergebnisseiten der einzelnen Teams zähen auch jahresweise auf, wie viele Spiele die Mannschaft verloren und gewonnen hat. Suchanfragen nach den Olympischen Medaillen oder auch nur den Olympischen Spielen beantwortet Wolfram Alpha lapidar mit dem Hinweis: „Alpha isn’t sure what to do with your input“.

Der erste Google-Treffer zur Anfrage „olympic games medals“ führt zu einer Seite, die den Medaillenspiele länderweise aufschlüsselt – allerdings ohne Hinweis zum ausgewerteten Zeitraum und der Quellenbasis.

Fazit – schönes Design, schwache Datenbasis

Wenn man Wolfram Alpha als Demonstration sieht, was diese Software mit Daten anstellen könnte, ist das Ergebnis beeindruckend. Die Suchmaschine schafft es tatsächlich, Daten so aufzubereiten, dass ein Informationsgewinn entsteht. Wer zum Beispiel mehrere Staaten eintippt, erhält einen Vergleich der wichtigsten statistischen Kennwerte – so etwas schafft Google ebenso wenig wie andere heute verfügbare Suchmaschinen. Wolfram Alpha funktioniert da ganz wunderbar als Informations-Aufbereiter.

Aber das gelingt bei der derzeit verfügbaren Vorabversion nur sehr selten. Wolfram Alpha funktioniert nur dann richtig gut, wenn die angeschlossenen Datenbanken die notwendigen Daten zum Aufbereiten liefern können. Will man zum Beispiel die Einschaltquoten von US-Fernsehsendern wissen, versteht Wolfram Alpha nicht einmal die Frage.

Man hat das Gefühl, dass dieses Werkzeug von Naturwissenschaftlern für Naturwissenschaftler erstellt wurde. Bei manchen technischen und naturwissenschaftlichen Fragen liefert Wolfram Alpha wunderbar aufbereitete Antworten.

Bei wirtschaftlichen Themen muss man an der Qualität der präsentierten Ergebnisse zweifeln: Was nützen einem zum Beispiel Auflagenzahlen von Tageszeitungen ohne Angaben zum Zeitraum? Hier geht es um in Zahlenwerten codierte Informationen, eigentlich die Art von Daten, bei der Wolfram Alpha glänzt. Doch die Entwickler scheinen auf die Breite der Datenbasis und die Qualität der Aufbereitung von Fakten aus den Gebieten Wirtschaft, Politik und Kultur weit weniger Wert gelegt zu haben als in anderen Wissensgebieten.

Das könnte man als notwendige Beschränkung entschuldigen – vielleicht ist das ganze Projekt als Demonstration für neue Möglichkeiten der Informationsaufbereitung gedacht. Aber auch in diesem Fall ist es kaum zu erklären, dass Wolfram Alpha in einigen Fällen (in Deutschland verbreite Sprachen zum Beispiel) merkwürdige Ergebnisse ohne konkrete Quellenangabe liefert. Wie soll man einem Informationsaufbereiter vertrauen, der bisweilen Angaben ausspuckt, die man nicht nachvollziehen kann, ohne zu erklären, wie diese Werte eigentlich zustande kommen und aus welchen Quellen die Daten stammen?

Auf dem derzeit sichtbaren Niveau ist Wolfram Alpha eine beeindruckende Demonstration: Mit dieser Software ist viel möglich. Als Such-Werkzeug für den Alltag ist das Angebot hingegen noch unbrauchbar.