Aufbau einer normalen Suchmaschine

Schlagwörter:
Referat, Hausaufgabe, Aufbau einer normalen Suchmaschine
Themengleiche Dokumente anzeigen

Beschreibung / Inhalt
Das Dokument beschreibt den Aufbau und die Funktion einer Suchmaschine. Es gibt vier Teile einer Suchmaschine: Roboter, Indexserver, Datenbank und Abfrageserver. Roboter suchen nach URLs von Webseiten und erstellen Indexdaten zu den Seiten. Der Indexserver steuert das Vorgehen der Roboter und analysiert die WWW-Seiten. Die Datenbank speichert die Indexdaten und den gerichteten Graph des Netzes. Der Abfrageserver bietet eine graphische Oberfläche, in der die Suchanfrage eingegeben werden kann. Eine Suchmaschinendatenbank enthält Informationen zu den einzelnen Seiten, darunter die URL, der Titel und charakteristische Stichwörter. Das größte Problem bei der Suche nach Informationen im Internet ist, dass sie auf zahlreichen Servern liegen und kein zentrales Inhaltsverzeichnis existiert. Daher basieren fast alle Suchmaschinen auf einem Automatismus, dessen wesentliche Stütze sogenannte Spider sind. Ein Spider startet auf der Homepage eines Servers und verfolgt nacheinander alle Links. Auf diese Weise bewegen sich Spider seitenweise über den Server. Wenn ein Spider auf eine neue oder geänderte Seite trifft, generiert er eine Liste mit Schlüsselwörtern, und die Datenbank der jeweiligen Suchmaschine wird entsprechend aktualisiert. Eine Suchmaschinendatenbank enthält jedoch nicht das komplette Netz. Es gibt auch verschiedene Suchtechnologien, die bei der Suche in der Datenbank unterstützen, darunter die Boolesche Suche, die Fuzzy Boolesche Suche und die auf Vektoren basierende Suche. Manche Suchmaschinen erlauben auch die Möglichkeit, Satzstücke zu suchen oder nach bestimmten Feldern zu suchen, wie z.B. Überschrift, Autoren, Datum oder URL. Es gibt auch eine Oberfläche mit erweiterter Suche. Das Dokument erklärt in einfachen Worten den Aufbau und die Funktionsweise einer Suchmaschine.
Direkt das Referat aufrufen

Auszug aus Referat
Aufbau einer normalen Suchmaschine Eine Suchmaschine besteht aus 4 Teilen: Robotern (robots): Roboter dienen der Suchmaschine um möglichst viele Adressen (URLs) von WWW-Seiten zu bekommen. Was ist ein Roboter ? (Roboter im Web) : Programm das Hyperlinks folgt und diese für seine Zwecke auswertet incl. einer rekursiven Verfolgung der enthaltenen Links. Andere Namen dafür: Spider, Agent, Web Wanderer ... Erster Roboter wurden 1993 eingesetzt um die Anzahl der Webseiten zu bestimmen. Indexserver (search engine indexer) Die Suchmaschine steuert das Vorgehen der Roboter und analysiert die WWW-Seiten, die der Roboter liefert und erstellt die Indexdaten zu den Seiten. Datenbank (database) Die Datenbank dient zum Abspeichern der Indexdaten, zusätzlich wird der gerichtete Graph des Netzes gespeichert. Abfrageserver (query server) Der Abfrageserver bietet meist eine graphische Oberfläche in der die Suchanforderung eingegeben werden kann. Der Abfrageserver analysiert die Eingabe des Users und durchsucht die Datenbank nach den gewüschten Schlüsselwörtern. Funktion Das größte Problem bei der Suche nach Informationen im Internet sind Datenbestände unterschiedlichster Art und Herkunft. Sie liegen auf zahlreichen Servern, wobei jeder Server weitgehend keiner zentralen Verwaltung unterworfen ist. Folglich gibt es kein zentrales Inhaltsverzeichnis. Jeder Suchmaschine liegt eine eigene Datenbank zugrunde, in der Informationen zu den einzelnen Seiten gespeichert sind. Ein Datensatz besteht ...
Direkt das Referat aufrufen

Autor:
Kategorie:
Sonstiges
Anzahl Wörter:
1931
Art:
Referat
Sprache:
Deutsch
Bewertung dieser Hausaufgabe
Diese Hausaufgabe wurde bislang noch nicht bewertet.
Zurück