Das Ranking-Problem
Eine Suchanfrage
Suchmaschinen sind zu einem festen Bestandteil unseres täglichen Lebens geworden. So gibt es allein bei der Suchmaschine Google 6 Millionen Suchanfragen pro Minute. [1]
Aufgabe 1
(a) Wann hast du das letzte Mal eine Suchmaschine verwendet?
(b) Welche anderen Suchmaschinen als Google nutzt du? Denke dabei nicht nur an die Suche nach Webseiten, sondern auch an die Suche nach Videos etc.
Aufgabe 2
Einigt euch auf eine Suchmaschine und einen Suchbegriff – z.B. „Informatik“ – und sucht dann nach diesem Begriff. Vergleicht die Ergebnisse untereinander. Gibt es große Unterschiede in den zehn ersten Suchergebnissen?
Ranking von Webseiten
Wenn man im Internet (genauer: im World Wide Web; mehr zum Unterschied findest du hier) nach Information sucht, dann benutzt man sehr häufig eine Suchmaschine. Hier gibt man einen oder mehrere Suchbegriffe ein und die Suchmaschine liefert dann die Adressen von Webseiten zu diesem Suchbegriff.
Die Abbildung zeigt das Ergebnis einer solchen Internetrecherche zum Suchbegriff „Informatik“.
Die hier benutzte Suchmaschine Google hat ungefähr 57 Millionen Suchergebnisse gefunden. Die ersten 10 dieser Suchergebnisse werden direkt mit einer Kurzbeschreibung angezeigt. In der Abbildung ist nur das allererste zu sehen. Weitere Suchergebnisse kann man sich dann nach und nach anzeigen lassen.
Die Suchmaschine liefert die Suchergebnisse nicht in einer völlig willkürlichen Reihenfolge, sondern versucht, eine Art Rangfolge zu bilden. Das führt zu folgendem Problem:
Ranking-Problem
Wie können/sollen die Suchergebnisse (Webseiten zu einem Suchbegriff) sinnvoll der Reihe nach angeordnet werden?
Das Ranking-Problem kann man auch so umformulieren: Wie lässt sich für eine Webseite die Relevanz im Bezug auf den Suchbegriff bestimmen. Ist das Relevanz-Problem gelöst, müssen die Ergebnisse nach dieser Relevant sortiert werden.
Aufgabe 3
Bei dieser Aufgabe bietet es sich an, wenn du über Aufgabenteil (a) erst selbst nachdenkst und dann deine Überlegungen zunächst mit einem Partner und schließlich mit der gesamten Lerngruppe besprichst. Bearbeitet Aufgabenteil (b) erst, wenn ihr eure eigenen Ideen aus Teil (a) verglichen habt.
(a) Welche Kriterien könnte man benutzen, um das Ranking-Problem zu lösen? Denke dabei sowohl an technische als auch an ethische/moralische Aspekte.
(b) Wenn du auf den Knopf drückst, werden einige Lösungsansätze eingeblendet. Bewerte diese Ansätze – auch im Vergleich zu deinen eigenen Überlegungen.
Lösungsansätze ein-/ausblenden
- Domainname: Ein Domainname wie www.bahn.de deutet darauf hin, dass es auf dieser webseite um die (deutsche Bundes-) Bahn geht.
- Seiteninhalt: Man könnte untersuchen, welche Schlüsselwörter im Header genannt werden. Man könnte auch untersuchen, wo und wie oft die Suchbegriffe im Text vorkommen.
- Zugriffszahlen, Verweildauer: Man könnte die Anzahl der Zugriffe auf die Webseite und die Verweildauer ermitteln
- Aktualität: Man könnte die Aktualität der Webseite berücksichtigen: Wann ist sie zuletzt aktualisiert worden?
- Verlinkung: Man könnte die Anzahl der Links zählen, die auf eine Webseite verweisen.
Quellen
- [1]: Media usage in an internet minute as of December 2023(letzter Zugriff: 28.04.2024) - Urheber: statista