googl- Web-Suche - Foto-Suche - persönlicher Blog - Videos

Web Suche

Suchsysteme bestehen üblicherweise aus drei Komponenten:
Agent (Spider oder Crawler), die das Internet und sammelt Informationen bewegt; Datenbank, die alle Informationen von einer Spinne gesammelt enthält; Suchmaschine, die Menschen benutzen als Schnittstelle für die Interaktion mit der Datenbank.

Wie Googl Suchmaschinen


Die Mittel der Suche und Strukturierung, manchmal Suchmaschinen aufgerufen wird, werden verwendet, um den Menschen helfen, finden Sie Informationen, die sie benötigen. Means Art Such-Agenten, Spinnen, Raupen und Roboter werden verwendet, um Informationen über die Dokumente, die über das Internet zu sammeln. Dieses spezielle Programm, das für die Web-Seiten suchen ist, entfernen Sie Hypertext-Links zu diesen Seiten und automatisch indiziert die Informationen, die sie finden, eine Datenbank aufzubauen. Jede Suchmaschine hat ihre eigenen Regeln, die definieren, wie cobirat Dokumente. Einige folgen jedem Link auf jeder Seite zu finden, und dann wiederum prüfen jeden Link auf jeder der neuen Seiten, und so weiter. Einige ignorieren die Links zu den Grafiken, Tondokumente, Animationen führen, während andere Verbindungen zu Ressourcen wie Datenbanken zu ignorieren, WAIS, andere proinstruktirova-HN, die zuerst betrachtet werden sollte und vor allem die beliebtesten Seiten.
Agents - der intelligenteste der Suchmaschinen. Sie können mehr tun als nur schauen: sie können sogar eine Transaktion in Ihrem Namen durchführen. Schon jetzt kann sie suchen Sites spezifischen Themen und zurück Listen von Webseiten (Googl), durch ihre Anwesenheit sortiert. Bevollmächtigte verarbeiten kann den Inhalt von Dokumenten, finden und indizieren andere Arten von Ressourcen, nicht nur Seiten. Sie können auch so programmiert, dass Informationen aus vorhandenen Datenbanken zu extrahieren. Unabhängig von der Information, die Agenten indiziert sind, geben sie es zurück in die Datenbank-Suchmaschine. Die allgemeine Suche nach Informationen über das Netzwerk Programme wie Spinnen bekannt. Spinnen haben auf die Inhalte der gefundenen Dokument, Index gemeldet und es zusammenfassende Informationen zu extrahieren. Auch scannen sie die Schlagzeilen, einige Links und senden die Informationen an die indizierte Datenbank-Suchmaschine. Crawlers halten sich die Titel und nähren nur das erste Glied.
Roboter können so programmiert werden, auf der verschiedene Links mit unterschiedlicher Tiefe der Verschachtelung zu wechseln, führen Sie die Indizierung und selbst überprüfen Sie die Links in dem Dokument. Aufgrund ihrer Art, sie in Zyklen können stecken bleiben, so die Weitergabe des Links, müssen sie erhebliche Ressourcen im Netz. Es gibt jedoch Methoden, die zur Roboter von der Suche nach Sites, deren Eigentümer nicht wollen, sie, die indiziert sind, vorzubeugen. Agenten abrufen und Index der verschiedenen Arten von Informationen. Einige, zum Beispiel, Indexierung jedes einzelne Wort in dem Dokument auftreten, während andere index nur die wichtigsten 100 Wörter jeweils indizierte Dokument Größe und die Anzahl der Wörter im Titel, Überschriften, und so weiter. Typ gebaut Index bestimmt, welche Suche recherchierbar gemacht werden können, und wie die Informationen interpretiert werden.
Agents können auch die Navigation im Internet und finden Sie Informationen, und dann steckte sie in eine Datenbank-Suchmaschine. Search-Administratoren können bestimmen, welche Arten von Sites oder Sites zu besuchen und Agenten indiziert werden sollen. Indizierte Informationen an eine Datenbank-Suchmaschine wie oben beschrieben geschickt.
Menschen können Informationen direkt in einen Index post-, Füll eine besondere Form für den Abschnitt, in dem sie gern ihre Informationen stellen würden. Diese Daten sind Datenbank übertragen.

Wenn jemand Informationen über das Internet zugänglich finden will, besucht er eine Webseite Suchmaschine und füllt ein Formular mit den Informationen, die benötigt wurde. Es können Keywords, Termine und andere Kriterien verwendet werden. Die Kriterien im Suchformular müssen den Kriterien von Agenten für die Indizierung der Informationen verwendet werden, fanden sie beim Navigieren im Web.
Die Datenbank findet, die Gegenstand der Anfrage, über die Informationen in das ausgefüllte Formular angegebenen Basis und zeigt die relevanten Dokumente in der Datenbank bereit. Um festzustellen, in welcher Reihenfolge die Liste der Dokumente angezeigt werden, gilt die Datenbank der Ranking-Algorithmus. Idealerweise sollte die wichtigsten Dokumente des Benutzers Anfrage wird den ersten Platz in der Liste sein. Unterschiedliche Suchmaschinen verwenden unterschiedliche Ranking-Algorithmen, aber die grundlegenden Prinzipien für die Bestimmung der Relevanz der folgenden Schritte aus:
Anzahl der gesuchten Wörter im Text Inhalt des Dokuments (dh in den HTML-Code).
Tags, in denen diese Worte sind.
Lage unbekannte Wörter im Dokument.
Anteil der Wörter, nach denen bestimmt nach Relevanz ist, die Gesamtzahl der Wörter des Dokuments.
Diese Grundsätze gelten für alle Suchmaschinen. Und unten werden von einigen verwendet vorgestellt, aber recht gut bekannt (zB AltaVista, HotBot, Googl).

Times - wie lange eine Seite in einer Googl Suchmaschine Datenbank ist. Zunächst scheint es, dass es ziemlich sinnlos ist Prinzip. Aber wenn Sie darüber nachdenken, wie viele es sind Online-Sites, die höchstens einen Monat zu leben! Wenn die Website ist es für eine lange Zeit, bedeutet dies, dass der Besitzer sehr in das Thema erfahren und der Benutzer ist geeigneter Ort ist, die Sendungen in ein paar Jahren die Welt, wie man am Tisch, als die, die vor einer Woche mit dem gleichen Thema erschienen verhalten.
Citation Index Googl wie viele Links auf dieser Seite führen zu anderen Seiten im Datenbank-Suchmaschine gelistet.
Die Datenbank zeigt eine ähnlich Rangliste der Googl Dokumente mit und gibt sie an die Person, die den Antrag gestellt hat. Verschiedene Suchmaschinen wählte auch verschiedene Möglichkeiten, die resultierende Liste zeigt - einige zeigen nur die Links, Links andere Befunde c die ersten Sätze in das Dokument oder den Titel des Dokuments mit ccylkoy.

Wenn Sie auf den Link, um eines der Dokumente, die Sie interessiert sind, klicken, wird dieses Dokument vom Server, auf dem sie sich befindet, angefordert.