Zum Inhalt springen

Woher weiß Google, wann meine Katze stirbt?

Konrad Lischka
Konrad Lischka
4 minuten gelesen
Woher weiß Google, wann meine Katze stirbt?

Wie lange leben Katzen? Exakt 15 Jahre, sagt Google.com. Bähm! Nicht “10 bis 15”, nicht “ungefähr 15 Jahre”, sondern „15 Jahre“. Das ist die Antwort auf die Suchanfrage „How long do cats live“.

Mich überrascht dieser exakte Wert.

Woher kommt die Zahl?

01 Katze

Zunächst dachte ich: Vielleicht steht es so in der Wikipedia. Aber nein, der von Google in einer anderen Box verlinkte Artikel auf en.wikipedia.org gibt 12 bis 15 Jahre als Lebenserwartung an – unter Verweis auf die so-la-la-Quelle about.com. Laut dem deutschen Magazin „Geliebte Katze“ liegt die Lebenserwartung heute bei 15 bis 20 Jahren.

Ich habe keine Ahnung, wie alt Katzen im Durchschnitt heute werden. Aus den wenigen mir öffentlichen zugänglichen Quellen im Netz weiß ich, dass die Lebenserwartung gestiegen ist und dass es mangels aktueller Empirie keine exakten Daten gibt.

Das Katzenbeispiel veranschaulicht sehr gut eine schleichende, aber grundlegende Veränderung der Funktionen von Suchmaschinen und anderen Vermittlern im Netz. Sie werden selbst zu Quellen statt auf Quellen zu verweisen. Nehmen wir die Google-Trefferliste zum Durchschnittsalter von Katzen: Die Nutzer haben ein enormes Vertrauen, dass Google die relevantesten Treffern oben in dieser Liste anzeigt. Und nun steht über dieser Liste die Aussage: 15 Jahre. Ohne Quelle. Meine Vermutung ist, dass viele Menschen die verinnerlichte hohe Glaubwürdigkeit Googles bei der Relevanzbestimmung auf diese Aussage übertragen.

Dabei ist es etwas grundsätzlich anderes, eine Antwort zu geben als mehrere Quellen aufzuführen. Wir können zitierte Quellen vergleichen, ihre Glaubwürdigen selbst einschätzen und die Relevanz der Trefferliste auf der Basis hinterfragen. Das geht bei einer referenzfreiens Antwort wie „15 Jahre“ nicht.

Ich glaube, dass diese Art der Suchergebnisse zunehmen wird. Dafür sprechen: Die Ausgaben für Schnittstellen wie Siri, Cortona oder Google Now. Die Dominanz von Mobiltelefonen. Die Möglichkeiten zur Monetarisierung einer zentralen, geschlossenen Mobilplattform wie sie Wechat in China demonstriert.

Und wir haben immer noch keine Ahnung, warum da „15 Jahre“ steht. Anders als eine Trefferliste zeigt diese Art der Präsentation in einer Antwortbox nicht die Vielfalt durchaus widersprüchlicher Quellen.

Tippt man „goat lifespan“ als Suchanfrage ein, sieht die Antwort etwas anders aus: 15-18 Jahre. Diese Angabe könnte aus einem Wikipedia-Artikel stammen, der als Quelle „Handbook of Biological Data“ von 1956 angibt. Ich weiß nicht, ob sich die Lebenserwartung von Ziegen in den vergangenen 60 Jahren gar nicht verändert hat und ob es überhaupt so etwas wie DIE Lebenserwartung von Ziegen gibt.

01 Ziege

Googles Knowledge Graph weiß das vielleicht, verrät es aber nicht. Eine interessante Theorie zum Entstehen dieser Angaben hat The Verge. Der Autor schreibt nach einem Gespräch mit dem der Knowledge-Graph-Produktmanagerin Emily Moxley:

„There’s also no specific place that Google trusts as a source for actor information, or animal information. It’s just that when you look for lengths of time that are associated with “goat + lifespan,” they tend to fall between 15 and 18 years. It’s ambient data, coming from everywhere and nowhere. If you get enough of a consensus, it turns into something that looks an awful lot like a fact.“

Das könnte auch stimmen.

Eine Erklärung, die beides zusammenbringt: Vielleicht schreiben die Menschen auf vielen Webseiten die Angaben aus der englischsprachigen Wikipedia zur Lebenserwartung von Ziegen ab, die aus einem Handbuch von 1956 stammen. Und in der Google-Antwort auf die Frage nach der Lebenserwartung von Ziegen erscheint dieser Wert dann ohne jede Referenz als derzeit gültiges Wissen – obgleich die Empirie mehr als ein halbes Jahrhundert alt ist (wenn die Angaben im „Handbook of Biological Data“ denn auf Empirie beruhen).

Bei Wörtern in englischer Sprache liefert Google direkt auf den Trefferseiten Definitionen als eigenen Inhalt ohne Quellenangabe. Hier ist aber vergleichsweise einfach, den Ursprung zu ermitteln – man sucht einfach nach Fundstellen für den Text der Definition im Netz. Und so zeigt sich dann, dass Google für den Begriff transgender diese Definition des Oxford Dictionary allen anderen vorzieht:
„denoting or relating to a person whose self-identity does not conform unambiguously to conventional notions of male or female gender.“

04 transgender

Warum wird diese Definition als einzige angezeigt? Ist sie treffender als die – sehr unterschiedlichen Definitionen – von Collins, Merriam-Webster, Macmillan, Wiktionary, Wikipedia? Oder hat die Verwendung dieser Definition nichts mit der Qualität des Inhalts zu tun, sondern ist sie zum Beispiel der Tatsache geschuldet, dass nur mit einigen Anbieter (oder nur mit einem?) Verträge über die Nutzung solche Inhalte ohne Quellenhinweis geschlossen wurden? Keine Ahnung.

Beim tennis elbow scheint die Definition des Oxford Pocket Dictionary of Current English von 2009 anderen überlegen zu sein.

Die Lebenserwartung von Katzen, Ziegen und Wortdefinitionen mag man als Kleinigkeiten abtun. Was ist schon schlimm daran, wenn unklar ist, woher die Daten kommen, wie aktuell und wie belegt sie sind? Es geht ja nur um eine ungefähre Vorstellung. Stimmt schon. Problematisch finde ich es dennoch, das Nutzer keine Möglichkeit haben, das Entstehen dieser Angaben nachzuvollziehen. Schließlich fragen Menschen ihre digitalen Assistenten (formerly known as Suchmaschinen) nicht unbedingt nur nach der Lebenserwartung von Katzen und Ziegen. Sondern auch nach Gesundheitstipps.
Zum Beispiel: how to lose weight?

Als Antwort darauf ist über den Suchtreffern eine Acht-Punkte-Liste zu sehen, die von einer Seite namens Dietdoctor.com stammt. Sie beginnt mit:
„1. Choose a Low-Carb Diet. If you want to lose weight you should start by avoiding sugar and starch (like bread).“

Warum ist dieser Hinweis so prominent hervorgehoben und der Text von der verlinkten Seite übernommen worden? Ich habe keine Ahnung. Ich weiß nur, dass die Empirie zur Überlegenheit von Low-Carb-Diäten ähnlich unübersichtlich wie beim Alter von Katzen und Ziegen ist. Ich finde: Wenn ein Medium die Fragen der Nutzer beantwortet, sollte es dem Nutzer die Quellenlage immer transparent machen. Und wenn es keine klare Antwort gibt, sollte die Antwort sein: Es ist kompliziert. Und nicht: “15 Jahre!“ Oder: „Low Carb!“

03 diet

Das Beitragsbild ist gemeinfrei und wurde vom norwegischen Nationalarchiv digitalisiert.

Blog

Konrad Lischka

Projektmanagement, Kommunikations- und Politikberatung für gemeinnützige Organisationen und öffentliche Verwaltung. Privat: Bloggen über Software und Gesellschaft. Studien, Vorträge + Ehrenamt.
Immer gut: Newsletter abonnieren


auch interessant

gelesen & gelernt: CO2-Preis, China, Schaltjahr im 56. Jahrhundert

Reality Check: Das EU-Emissionshandelssystem im Schweinezyklus Reality Check des Mantras, CO2-Preis über Emissionszertifikate sei per se das smarte Instrument: Binnen eines Jahres hat sich der Preis in der EU auf 52 € / Tonne halbiert. Weil die Industrieproduktion fällt. Und weil der CO2-Preis 2022 so hoch war und Fertigung gestrichen wurde. Was

gelesen & gelernt: CO2-Preis, China, Schaltjahr im 56. Jahrhundert

Bürokratiekostenindex abbauen!

Bürokratie... abbauen! Das ist die Autovervollständigung in allen Debatten. Wie viel haben wir davon eigentlich in Deutschland? Mehr als 2012? Wie viel? Wie misst man Bürokratie? Das Statistische Bundesamt pflegt den Bürokratiekostenindex. Der beginnt bei 100 im Jahr 2012 - und liegt im September 2024 bei 95,82. Weniger Bürokratie

Bürokratiekostenindex abbauen!

Kinderarbeit, Armut, Lieferketten - das muss man wissen

Der Streit in Deutschland um die EU-Lieferkettenrichtlinie macht mich wütend. Und zwar, weil ich in vielen Überschriften und Statements Kinderarbeit lese. Aber immer nur als bloßes Schlagwort, als Argument zum Punkten in der Auseinandersetzung. Aber nirgends die Details, was Kinderarbeit heute ist, wie viele betoffen sind, wie wir die Lage

Kinderarbeit, Armut,  Lieferketten -  das muss man wissen