Verwalten von Crawlregeln

Sie können eine Crawlregel hinzufügen, um spezifische Pfade hinzuzufügen, wenn Sie Inhalt crawlen. Wenn Sie einen Pfad einbeziehen, können Sie optional alternative Anmeldeinformationen für das Konto bereitstellen, um den Inhalt zu crawlen. Um neue Crawlregeln hinzuzufügen, können Sie außerdem vorhandene Crawlregeln testen, bearbeiten, löschen oder neu sortieren.

Crawlregeln werden in der Reihenfolge angewendet, in der sie aufgelistet sind.

Hinweis : Zum Verwalten von Crawlregeln müssen Sie zuerst die Seite "Crawlregeln verwalten" öffnen. Klicken Sie auf der Seite "Suchverwaltung" unter Crawl wird ausgeführt auf Crawlregeln.

Was möchten Sie tun?

Hinzufügen einer Crawlregel

Testen von Crawlregeln für eine URL

Bearbeiten einer Crawlregel

Löschen einer Crawlregel

Neuanordnen von Crawlregeln

Hinzufügen einer Crawlregel

  1. Klicken Sie auf der Seite Crawlregeln verwalten auf Neue Crawlregel.

  2. Geben Sie auf der Seite Crawlregel hinzufügen im Abschnitt Pfad im Feld Pfad den von der Regel betroffenen Pfad ein. Sie können im Pfad Standardplatzhalterzeichen verwenden, wie in den folgenden Beispielen:

    • http://server1/ordner* enthält alle Webressourcen einer URL, die mit http://server1/ordner startet.

    • *://*.txt enthält alle Dokumente mit der Erweiterung TXT.

  3. Wählen Sie im Abschnitt Crawlkonfiguration eine der folgenden Optionen aus:

    • Alle Einträge in diesem Pfad ausschließen. Aktivieren Sie diese Option, wenn alle im angegebenen Pfad enthaltenen Einträge von dem Crawlvorgang ausgeschlossen werden sollen. Wenn Sie diese Option aktivieren, können Sie den Einschluss durch Auswahl des Folgenden weiter verfeinern:

      • Komplexe URLs (URLs mit Fragezeichen(?)) einschließen. Aktivieren Sie diese Option, wenn Sie URLs einbeziehen möchten, die Parameter enthalten, die die Fragezeichennotation (?) verwenden.

    • Alle Einträge in diesem Pfad einschließen. Wählen Sie diese Option aus, wenn alle Einträge in dem Pfad gecrawlt werden sollen. Wenn Sie diese Option auswählen, können Sie die Einbeziehung weiter verfeinern, indem Sie eine der folgenden Kombinationen auswählen:

      • Hyperlinks für die URL folgen, ohne die URL selbst zu crawlen. Wählen Sie diese Option aus, wenn Hyperlinks innerhalb der URL gecrawlt werden sollen, aber nicht die URL selbst.

      • Komplexe URLs (URLs mit Fragezeichen (?)) crawlen. Wählen Sie die Option aus, wenn URLs gecrawlt werden sollen, die Parameter enthalten, die die Fragezeichen-Notation (?) verwenden.

      • SharePoint-Inhalt als HTTP-Seiten crawlen. Normalerweise werden SharePoint-Websites unter Verwendung eines speziellen Protokolls gecrawlt. Wählen Sie diese Option aus, wenn SharePoint-Inhalt stattdessen als HTTP-Seiten gecrawlt werden soll. Wenn der Inhalt unter Verwendung des HTTP-Protokolls gecrawlt werden soll, werden keine Elementberechtigungen gespeichert.

  4. Führen Sie im Abschnitt Authentifizierung angeben eine der folgenden Aktionen aus:

    • Um das Standardkonto für den Inhaltszugriff zu verwenden, wählen Sie Standardkonto für den Inhaltszugriff verwenden.

    • Um ein anderes Konto zu verwenden, wählen Sie Geben Sie ein anderes Konto für den Inhaltszugriff an aus und führen dann folgende Aktionen aus:

      1. Geben Sie im Feld Konto den Kontonamen ein, der auf die von dieser Crawlregel definierten Pfade zugreifen kann.

      2. Geben Sie in den Feldern Kennwort und Kennwort bestätigen das Kennwort für dieses Konto ein.

      3. Um zu verhindern, dass die Standardauthentifizierung verwendet wird, aktivieren Sie das Kontrollkästchen Keine Standardauthentifizierung zulassen.

        Der Server versucht, die Windows NTLM-Authentifizierung zu verwenden. Wenn die NTLM-Authentifizierung fehlschlägt, versucht der Server die Standardauthentifizierung zu verwenden, außer das Kontrollkästchen Keine Standardauthentifizierung zulassen ist aktiviert.

    • Um ein Clientzertifikat für die Authentifizierung zu verwenden, wählen Sie Clientzertifikat angeben aus und klicken dann im Menü Zertifikat auf ein Zertifikat.

    • Aktivieren Sie Anmeldeinformationen für ein Formular angeben, geben Sie dann die Formular-URL (die Position der Seite, die Anmeldeinformationen akzeptiert) in das Feld Formular-URL ein, und klicken Sie anschließend auf die Schaltfläche Anmeldeinformationen eingeben, um die Formularanmeldeinformationen für die Authentifizierung zu verwenden.

      1. Wenn die Anmeldeaufforderung des Remoteservers in einem neuen Fenster geöffnet wird, geben Sie die Formularanmeldeinformationen ein und melden sich an.

      2. Sie werden gefragt, ob die Anmeldung erfolgreich war. Wenn dies der Fall ist, werden die für die Authentifizierung erforderlichen Anmeldeinformationen auf der Remotesite gespeichert.

    • Um die Cookie-Authentifizierung zu verwenden, aktivieren Sie die Option Cookie zum Crawlen verwenden, und führen Sie dann einen der folgenden Schritte durch:

      1. Klicken Sie auf Cookie unter einer URL abrufen, um ein Cookie von einer Website oder einem Server abzurufen.

      2. Klicken Sie auf Cookie zum Crawlen angeben, um ein Cookie aus dem lokalen Dateisystem oder von einer Dateifreigabe zu importieren. Sie können optional Fehlerseiten im Feld Fehlerseiten (mit Semikolatrennung) angeben.

  5. Klicken Sie auf OK.

Seitenanfang

Testen von Crawlregeln für eine URL

Sie können Crawlregeln für eine URL testen, um festzustellen, welche Regeln angewendet werden, wenn die URL gecrawlt wird, und welches Ergebnis die Anwendung der Regeln ergibt (entweder Einschließen oder Ausschließen von Inhalt). Bedenken Sie, dass beim Testen von Crawlregeln für eine URL die URL nicht wirklich gecrawlt wird.

  1. Geben Sie auf der Seite Crawlregeln verwalten im Feld Geben Sie eine URL ein, und klicken Sie auf 'Testen', um zu ermitteln, ob sie eine Regel erfüllt die URL ein, die getestet werden soll.

  2. Klicken Sie auf Testen.

  3. Das Testergebnis wird in Form einer Liste unter dem Feld Geben Sie eine URL ein, und klicken Sie auf 'Testen', um zu ermitteln, ob sie eine Regel erfüllt angezeigt.

Seitenanfang

Bearbeiten einer Crawlregel

Wenn Sie eine Crawlregel bearbeiten, werden die Änderungen erst wirksam, wenn der nächste Crawl gestartet wird.

  • Klicken Sie auf der Seite Crawlregeln verwalten in der Liste der Crawlregeln im Menü der Crawlregel, die Sie bearbeiten wollen, auf Bearbeiten.

    Weitere Informationen zu den Einstellungen für Crawlregeln finden Sie im Abschnitt Hinzufügen einer Crawlregel.

Seitenanfang

Löschen einer Crawlregel

Wenn Sie eine Crawlregel löschen, wird die Löschung erst nach dem Start des nächsten vollständigen Crawls angezeigt.

  1. Klicken Sie auf der Seite Crawlregeln verwalten in der Crawlregelliste im Menü der Crawlregel, die Sie löschen wollen, auf Löschen.

  2. Klicken Sie im Meldungsfeld auf OK, um zu bestätigen, dass Sie die Crawlregel löschen wollen.

Seitenanfang

Neuanordnen von Crawlregeln

  • Wählen Sie auf der Seite Crawlregeln verwalten in der Spalte Reihenfolge in der Liste der Crawlregeln einen Wert aus der Dropdownliste aus, der die Position für die Regel angibt. Andere Werte werden entsprechend verschoben.

    Crawlregeln werden in der Reihenfolge angewendet, in der sie aufgelistet sind. Wenn zwei Regeln denselben oder überlappenden Inhalt abdecken, wird die zuerst aufgelistete Regel angewendet.

Seitenanfang

Teilen Facebook Facebook Twitter Twitter E-Mail E-Mail

War diese Information hilfreich?

Sehr gut. Noch anderes Feedback?

Was können wir verbessern?

Vielen Dank für Ihr Feedback!

×