Akademik

Suchmaschine
Such|ma|schi|ne 〈f. 19; EDVProgramm, mit dessen Hilfe bestimmte Informationen aus einer Datenbank (z. B. mit Internetadressen) gezielt gesucht werden können ● die Suchanfrage wird von mehreren \Suchmaschinen gleichzeitig bearbeitet; eine \Suchmaschine im Internet anwählen

* * *

Such|ma|schi|ne, die:
auf einen bestimmten Namen lautendes Programm im Internet, das mithilfe umfangreicher, aus Internetadressen bestehender Datenbanken die gezielte Suche nach Informationen im Internet ermöglicht:
eine Homepage mit einer S. finden.

* * *

Suchmaschine
 
(Search Engine, Dokumentensuchsystem), ein System, bestehend aus einem oder mehreren Computern sowie einer leistungsfähigen Software, das eine Sammlung von Dokumenten nach bestimmten Inhalten durchsucht (Dokumentensuchsystem). Der Begriff wird meist eingeschränkt auf das Internet verwendet, die zu durchsuchende Dokumentensammlung ist hierbei das komplette Internet.
 
Suchmaschinen rufen Internetseiten auf, nehmen ihre Inhalte auf und gliedern sie in ihre zentrale Datenbank ein. Benutzer, die nach bestimmten Inhalten suchen, geben eine Reihe von Suchbegriffen in spezielle Abfragefelder auf der Webseite der Suchmaschine ein; diese sucht die zu den Begriffen passenden Internetadressen im WWW und präsentiert sie in Listenform auf einer oder mehreren Antwortseiten.
 
Zu jeder der auf den Antwortseiten gelisteten Fundstellen werden i. d. R. die folgenden Informationen angezeigt: die URL, der Titel der zugehörigen Webseite, meist auch einige Zeilen des Inhalts und eventuell ein Aktualisierungsdatum. Zu jeder Fundstelle gibt es mindestens einen Hyperlink, sodass der Benutzer die betreffende Seite direkt anspringen kann.
 
Wichtige Suchmaschinen sind Google, Lycos, Web.de, Yahoo, Altavista, Hotbot, Excite oder Metacrawler. Die meisten dieser Suchmaschinen bieten eine Reihe von Suchoptionen an. Zu den wichtigsten Suchoptionen gehört die logische Verknüpfung von Suchbegriffen, die mit sog. booleschen Operatoren durchgeführt wird. Eine weitere sinnvolle Suchoption ist die Bündelung von Suchbegriffen zu Phrasen. Üblicherweise interpretieren Suchmaschinen mehrere Suchbegriffe als einzelne Suchstichworte. Soll aber nach einem Begriff gesucht werden, der aus mehreren Worten besteht, etwa ein bestimmtes Zitat, dann muss dieses in Hochkommata eingeschlossen werden.
 
Suchoptionen, die nicht von allen Suchmaschinen angeboten werden, sind: die Datumsabfrage (durch die eine Suche auf einen bestimmten Zeitraum eingeschränkt werden kann), die Suche nach bestimmten Dateitypen (beispielsweise nach Bildern, Musik oder Videos), die Möglichkeit, die Suche innerhalb der Treffer einer vorhergehenden Suche einzuschränken.
 
Suchmaschinen sind die einzige Möglichkeit, um Informationen im Internet schnell zu finden, denn anders als in Bibliotheken gibt es keine zentrale Registratur von Seiteninhalten, d. h., jede veröffentlichte Seite bleibt so lange unbekannt, bis sie der zuständige Webmaster bekannt gemacht hat. Damit Suchmaschinen die im Netz vorhandenen Seiteninhalte aufnehmen können, bedarf es einer Anmeldung der Seite. Sie kann über den manchmal sehr versteckten Link »Seite anmelden« bzw. »Add URL« auf der Hauptseite der Suchmaschine durchgeführt werden. Von hier aus erreicht der Webmaster ein Formular, das mehrere Angaben von ihm erwartet: neben der URL üblicherweise eine kurze Beschreibung der Seite sowie einige Schlagworte, die den Seiteninhalt wiedergeben. Nach erfolgter Anmeldung wird die Seite von der Suchmaschine überprüft und indiziert. Je nach dem Bekanntheitsgrad der Suchmaschine liegen die Wartezeiten zwischen Anmeldung und Aufnahme in die Datenbank bei einigen Wochen.
 
Suchmaschinen nutzen mehrere Möglichkeiten, um die Seiteninhalte aufzunehmen. Der Fall, dass ein Mensch die Seite ansteuert, um die Inhalte persönlich zu überprüfen, ist nur noch extrem selten. In der Regel wird die Seite von automatisierten Programmen untersucht, die früher als Spider, heute aber als Robots (Roboter) bezeichnet werden. Sie führen meist auch eine automatische Indizierung des Inhalts durch.
 
Aus diesen Informationen sowie den Anmeldedaten des Webmasters weben die Suchmaschinen ein mehr oder weniger dichtes Informationsnetz für ihre Datenbanken. So generieren einige Suchmaschinen Kategorien, die wiederum Unterkategorien besitzen können. Für diese Informationen wird meist auf Anmeldedaten zurückgegriffen. Beispiele hierfür liefern Yahoo und Web.de. Kategorien ermöglichen eine erste Orientierung beim Surfen. Ihr Nachteil ist, dass sie meist nicht alle Seiten enthalten, somit nur einen Ausschnitt aus einem bestimmten Themenspektrum anbieten.
 
Die meisten Suchmaschinen führen noch einen Index, der aus Begriffen innerhalb der Seite sowie von Stichwortzeilen am Seitenanfang aufgebaut wird. Der Vorteil liegt im raschen Finden der relevanten Seiten innerhalb der Datenbank. Für derartige Indizes werden meist die für die Alltagssprache relevanten Füllworte (wie »und« oder »oder«) herausgefiltert, sodass möglichst nur relevante Begriffe verbleiben. Eine weitere wichtige Informationsquelle von Suchmaschinen sind die sog. Metainformationen (Meta-Tag), die Webmaster auf ihren Seiten unterbringen können. Sie ermöglichen Hinweise auf den verwendeten Zeichensatz, den Autor, den Seiteninhalt (durch einige Schlagworte) sowie Anweisungen für die Roboter der Suchmaschinen.
 
Da viele Suchanfragen eine sehr große Trefferanzahl nach sich ziehen, ist die Frage der Relevanz, d. h. die Einschätzung, wie passend und aussagekräftig ein Treffer ist, von großer Bedeutung. Daher versuchen die Suchmaschinen mit mehreren unterschiedlichen Ansätzen, die Fundstellen so zu ordnen, dass die wichtigsten Treffer am Anfang der Liste stehen; dieser Vorgang wird als Ranking bezeichnet. Eine einfache Methode beruht darauf, dass bei mehreren vorgegebenen Suchbegriffen die Anzahl der Suchbegriffe gezählt wird, die mit den Worten im Seitentext übereinstimmen. Eine weitere Ranking-Methode untersucht die Position der Worte im Text. Begriffe aus der URL, dem Seitentitel und in Überschriften sind im Allgemeinen von höherer Relevanz für den Inhalt als Worte im Text. Auch Stichworte in Meta-Tags führen zu einem höheren Ranking, allerdings nur dann, wenn sich die Begriffe darin nicht wiederholen. Im eigentlichen Seitentext wird Begriffen umso mehr Relevanz zugesprochen je näher sie am Seitenanfang stehen. Neben ästhetischen Gründen ist dies einer der Gründe, warum Webmaster längere Texte in Unterkapitel gliedern und auf unterschiedliche Seiten verteilen. Manche Suchmaschinen nutzen die Anzahl der Links, die auf eine gegebene Seite führen, als hauptsächliches oder zusätzliches Bewertungskriterium. Sie gehen davon aus, dass eine häufig zitierte Seite für die jeweiligen Webmaster auch eine wertvolle Informationsquelle darstellt. Damit verwandt ist ein Ranking nach der Häufigkeit, mit der eine bestimmte Fundstelle angesprungen wird. Ist die Adresse einer Webseite erst einmal in der Datenbank einer Suchmaschine gelandet, kann man ohne weiteres registrieren, wie oft die Anwender die Fundstelle anwählen. Häufig genutzte Seiten bekommen dabei einen Bonus, der sie im Ranking weiter in Richtung der Spitze der Liste transportiert.
 
Eine von den Anwendern weniger gern gesehene Form des Rankings orientiert sich an der Finanzkraft der aufgeführten Seiten. Beim bezahlten Ranking zahlt ein Webmaster, meist eine Firma, dafür, möglichst weit oben in der Suchliste aufzutauchen. Bisweilen wird dies mit Werbebannern verknüpft, die neben der Fundstelle eingeblendet werden.
 
Um ihre Attraktivität für die Anwender zu steigern, sind viele Suchmaschinen dazu übergegangen, einen Zusatznutzen anzubieten. Er nimmt oft die Form von Online-Diensten an, enthält also Nachrichtenbereiche, Diskussionsforen, Kommunikationsdienste, Nachschlagebereiche, Werbezonen usw. Ein Teil dieser Angebote beruht auf automatisierten Diensten, ein geringer Teil allerdings, etwa die Nachrichtenbereiche, wird redaktionell aufbereitet.
 
Eine besondere Form von Suchmaschinen stellen die sog. Metasuchmaschinen dar. Sie untersuchen die Datenbankbestände anderer Suchmaschinen mit deren Zustimmung und entfernen aus den Trefferlisten Dubletten. Ein eventuelles Ranking beruht dann oft auf den Gewichtungen der liefernden Suchmaschinen. Metasuchmaschinen haben i. d. R. keine eigene Datenbank, in der eine Suche stattfinden kann. Ihr Vorteil für den Anwender liegt in den meist relativ umfangreichen Ergebnislisten (wie bei Metager), die durch Einschränkung auf die hochrangigsten Ergebnisse auch sehr kompakt ausfallen können (etwa bei Metacrawler). Im Gegensatz dazu gilt eine Kooperation zwischen verschiedenen Suchmaschinen, bei denen eine Suchmaschine auf die Datenbestände einer anderen zugreifen kann, nicht als Metasuchmaschine, da die Maschinen selbst Datenbestände durchforsten.
 
Suchmaschinen können sehr unterschiedliche thematische Schwerpunkte aufweisen. So existieren allgemeine Suchmaschinen, die alle eingehenden Anmeldungen aufnehmen, etwa Google, Web.de oder Yahoo. Daneben existieren auch Tausende thematisch orientierter Suchmaschinen, beispielsweise zu Ökologie, Physik, Ärzteverzeichnissen, Gastronomie, Reisen usw. Auch diese Suchmaschinen beruhen darauf, dass Webmaster die Webseiten anmelden. Da sie außerhalb ihres Spezialgebiets oft nur wenig bekannt sind, erhalten sie nur wenig Aufmerksamkeit. Ein Vorteil solcher kleineren Suchmaschinen, die sich oft aus sog. Web-Guides entwickelt haben, liegt darin, dass sie die Inhalte tatsächlich noch handverlesen anbieten.

* * *

Such|ma|schi|ne, die: auf einen bestimmten Namen lautendes Programm im Internet, das mithilfe umfangreicher, aus Internetadressen bestehender Datenbanken die gezielte Suche nach Informationen im Internet ermöglicht: Die -n machen sich ... auf die Suche nach den gewünschten Seiten. Sie ermitteln in Sekundenschnelle, wo die gewünschten Informationen zu finden sind. Suchmaschinen lassen sich mit immens großen Katalogen vergleichen ... (Schieb, Internet 136); Das World Wide Web ... kann erschlossen werden mithilfe einer S. (search engine). Eine S. ist ein Werkzeug, das Webseiten nach Stichworten oder Begriffen durchforstet (Börsenblatt 68, 1997, A 424).

Universal-Lexikon. 2012.