Wie Suche Suchmaschinen arbeiten

March 22

Wie Suche Suchmaschinen arbeiten

Suchmaschinen sind eines der wichtigsten Werkzeuge, die Sie, beim Surfen im World Wide Web verwenden können. Sie fungieren als Portal für die Unmengen von verfügbaren Informationen online. Als Suchmaschinen in ihren Anfängen waren, wurden sie zu ein paar tausend Anfragen pro Tag eingesetzt. Nun steht die Figur in zweistelliger Millionenhöhe, mit Hunderten von Millionen von Seiten indiziert. Suchmaschinen wie Google, Yahoo und Bing sind im Web jeden Tag kriechen, um zu helfen, organisieren und präsentieren neuen Informationen in einem Suche-fähigen Format.

Web crawlen

Vor der Anzeige der Suchergebnisse auf einer Abfrage basiert, müssen die Suchmaschinen eine lokale Datenbank, um die Ergebnisse zu liefern. Dies erfolgt mit der Software "Roboter", bekannt als "Spinnen". Jeden Tag kriechen diese Roboter durch Webseiten, Indizierung, wie sie gehen. Sobald die Suchmaschine Index-Seite einer Website besucht hat, wird es dann durch die einzelnen nachfolgenden Seiten, die auf der Suche nach Schlüsselwörtern speichern und Hyperlinks auf, um seine Reise fortzusetzen crawlen. Verschiedenen Suchmaschinen arbeiten auf unterschiedliche Weise. Googles Spinnen lassen Sie Wörter wie "a", "ein" und "die", während AltaVistas Spinnen jedes Wort auf der Seite indizieren. Deshalb verschiedene Dienste unterschiedliche Ergebnisse bekommen.

Indizierung

Wenn eine Spinne eine Website besucht, scannt es für bestimmte Wörter als Stichwörter, zu verwenden, die die Website in den Suchergebnissen auslöst. Diese Worte müssen irgendeine Art von Priorität die Website genau einzuordnen zugewiesen werden. Spinnen sucht nach Häufigkeit der Wörter, die Position der Wörter (im Header, als Titel und Hyperlinks) und innerhalb der HTML-Code für Meta tags und wenden Sie dann zu jedem Eintrag ein "Gewicht". Dies stellt die Ergebnisse der Suche in den Vordergrund und bietet eine genaue Übersicht der wahren Inhalt einer Webseite.

Verschlüsselung und Hashing

Wenn eine Suchmaschine Spinnen ihre Keyword-Listen erstellt haben, werden Daten codiert, um Speicherplatz zu sparen. Alle gesammelten Daten komprimieren wird sichergestellt, dass es schnell gefunden und als wirtschaftlich wie möglich gespeichert werden kann. Codierte Daten ist dann indiziert, und eine Hashtabelle erstellt. Die Hash-Tabelle ist ein wichtiges Instrument bei der Indizierung, wie es jedes Schlüsselwort mit Hilfe einer Formel einen numerischen Wert zuweist. Diese Formel verteilt die indizierte Schlüsselwörter auf einer definierten Anzahl von Abteilungen, Einträge leicht zugänglich zu machen. Dadurch wird sichergestellt, dass selbst komplizierte Suchanfragen, die betreffen viele Keywords mit den Zahlenwert zugewiesen das Schlüsselwort, anstatt eine alphabetische Abfrage schnell zugegriffen werden können.

Meta-Tags

Meta-Tags sind Stichworte, die innerhalb einer Webseite HTML enthalten. Sie befinden sich im Dokument speziell von einem Suchmaschinen-Spider gefunden zu werden. Website-Inhaber können direkt auf die Spinne angeben, welchen Inhalt die Seite enthält und Schlüsselwörter, die in eine Suche relevant wären. Es gibt nichts stoppen des Autors einer Seite hinzufügen von Meta-Tags, die nicht zur Seite, um die Zugriffszahlen zu erhöhen anwendbar sind. So viele Spinnen jetzt die Meta-Tags mit Wörtern innerhalb der Seite auf Richtigkeit überprüfen Meta-Tags sind nützlich, wenn ein Wort hat mehrere Bedeutungen, die sicherstellen, dass die Spinne Inhalt korrekt indiziert hat.

Boolesche Logik

Boolescher Logik wurde von George Boole in der Mitte des 19. Jahrhunderts entwickelt und in Suchmaschinen implementiert wurde. Mit einer Vielzahl von "Operatoren", ist es möglich, anzugeben, ob, ausschließen und ganz besondere Ergebnisse zu gewinnen. Allgemeine Operatoren in Suchmaschinen zu verwenden sind:

UND: sorgt für zwei Wörter zusammen mit und sind in der Suche Ergebnisse – Wein und Kalifornien

OR: sorgt für mindestens eines der Wörter zusammen mit oder in Ergebnisse – California erscheint rot OR weiss

NICHT: sorgt für Begriff nicht ist vom ausgenommen Ergebnisse – California Wein nicht rot

GEFOLGT von: sorgt für einen der Suchbegriffe direkt folgt der anderen – California gefolgt von Wein

Anführungszeichen "": für die Suche nach einem exakten Ausdruck innerhalb einer Seite – "California wine 2009"

Diese Operatoren können verwendet werden, leiten die Suchmaschine, um die richtigen Teile seiner lokalisierte Datenbank und weit genauere Ergebnisse liefern.