Planifier l'analyse de contenu

Important :  Cet article a été traduit automatiquement, voir l’avertissement. Vous pouvez consulter la version en anglais de cet article ici.

Remarque : Ce contenu est préliminaire pour une version du logiciel préliminaire. Il peut être incomplet et est soumis à modifier.

Contenu de cet article

À propos de l’analyse de contenu

Planifier les sources de contenu

Considérations relatives à l’analyse de plan pour les fournisseurs de services partagés

Planifier les considérations relatives à l’analyse de batteries de serveurs

Avant de pouvoir utiliser la fonctionnalité de recherche d’entreprise dans Microsoft Office SharePoint Server 2007 pour rechercher du contenu au sein de votre organisation, vous devez déterminer quel contenu à inclure dans la recherche et planifier l’analyse du contenu afin que le contenu et ses propriétés peuvent être utilisées dans la recherche requêtes.

Microsoft Office SharePoint Server 2007 utilise les sources de contenu pour analyser le contenu dans vos collections de sites ou sur les sites externes ou les applications de données métiers afin que les données pertinentes apparaissent dans les résultats de recherche. Autres fonctionnalités de recherche filtrent ou modifient le contenu une fois qu’il a été analysée. Une bonne planification pour les sources de contenu permet de vous permet de générer la fonctionnalité de recherche pendant le déploiement initial qui permet de configurer et gérer le contenu au sein de votre organisation en fonction de sous-ensembles clés de contenu et de données, du contenu et données externes à votre serveur Office déploiement, ou de contenu et de données externes à votre organisation. Vous envisagez également pour les analyses, les règles d’analyse, gestion des propriétés et les paramètres de pertinence pour chaque source de contenu.

À propos de l’analyse de contenu

Analyse est un processus d’indexation du contenu, les données et les métadonnées afin que les requêtes de recherche peuvent fournir des résultats de recherche pertinents. Une source de contenu est un point de départ utilisé par Office SharePoint Server 2007 analyse de contenu pour le rendre disponible pour les requêtes de recherche. Sources de contenu sont composés d’une ou plusieurs adresses de démarrage, qui sont des URL contenant les données que vous souhaitez inclure dans les recherches dans votre organisation. Le contenu est inclus ou exclu dans un index de contenu en fonction des règles qui sont sélectionnés par l’administrateur de Services fournisseur (partagés) pour la recherche. Après l’analyse de contenu et les données dans une source de contenu, les serveurs de requête traitent les requêtes basées sur les propriétés gérées de recherche et la possibilité du service de recherche et fournissent des résultats de recherche pertinents. Par défaut, tout le contenu sur chaque application Web qui utilise le fournisseur de services partagés est analysé dans une seule source de contenu.

Les administrateurs de fournisseur de services partagés pour la recherche peuvent créer des sources de contenu supplémentaires pour les sous-ensembles clés de contenu. Ils peuvent sélectionner des règles d’analyse pour les adresses de démarrage qui s’appliquent à toutes les sources de contenu dans le fournisseur de services partagés en fonction de contenu et des données à chaque adresse de démarrage est pertinent pour l’organisation et configurer les paramètres pour chaque source de contenu.

Avec des versions précédentes de Microsoft SharePoint Portal Server, les administrateurs gèrent contenu à partir d’index, qui sont des collections sous-jacentes de tout le contenu analysé par les sources de contenu. Avec Microsoft Office SharePoint Server 2007, ce n’est plus nécessaire. Index unique de contenu pour chaque fournisseur de services partagés est créé automatiquement selon les paramètres sélectionnés pour chaque source de contenu, et les index de contenu ne sont plus affichés pour les administrateurs.

Haut de la Page

Planifier les sources de contenu

La source de contenu par défaut pour le fournisseur de services partagés analyse le contenu de toutes les applications Web qui utilisent le fournisseur. Les adresses de démarrage pour toutes les applications Web dans le fournisseur de services partagés sont automatiquement ajoutés à la source de contenu, afin que tout le contenu dans le fournisseur de services partagés n’est pas disponible pour effectuer une recherche après la première analyse complète de la source de contenu.

Votre architecture d’informations doit en outre suggérer des sources de contenu supplémentaires à créer pour chacun de vos collections de sites dans chacune de vos applications Web. Pour gérer et planifier des analyses séparément, vous pouvez créer des sources de contenu qui analysent un sous-ensemble de contenu dans l’ensemble du fournisseur.. Ceci est utile pour analyser le contenu avec une priorité élevée ou modifier rapidement plus fréquemment sans avoir besoin d’analyser tout le contenu.

Exemples de contenu que vous souhaiterez peut-être planifier des sources de contenu supplémentaires pour inclure :

  • Le contenu sur les partages de fichiers au sein de votre organisation.

  • Contenu du serveur Exchange.

  • Dans Lotus Notes au contenu serveurs.

  • Sites dans l’annuaire de sites.

  • Autre contenu de votre organisation non trouvée dans les sites SharePoint.

  • Contenu externe à votre fournisseur de services partagés ou à votre organisation.

  • Données métiers dans des applications métier.

Chaque source de contenu peut contenir un ou plusieurs adresses qui pointent vers des emplacements de n’importe quelle combinaison de ces types de contenu de démarrage. Si vous groupez du contenu dans une source de contenu ou créez des sources de contenu supplémentaires en fonction des paramètres considérations relatives à l’administration. Administrateurs souvent apporter des modifications qui nécessitent une mise à jour complète d’une source de contenu spécifique. Modifications apportées à analyser, les règles le compte de l’analyse ou access ou les propriétés gérées nécessitent une mise à jour complète. Pour faciliter l’administration, organiser des sources de contenu de façon à ce que la mise à jour de ce contenu en même temps est pratique pour les administrateurs et leurs autres planifiée tâches d’administration.

Le contenu sur les serveurs en dehors de votre batterie de serveurs tels que des serveurs de messagerie et les partages de fichiers, les serveurs Web qui ne contiennent pas de sites SharePoint, ou serveurs d’application métier données doivent être organisés par disponibilité. Si les serveurs hébergeant le contenu sont disponibles en même temps, vous êtes probablement plus analyser tout le contenu dans la source de contenu, sans avoir à exécuter complètes mises à jour ultérieurement.

Au-delà de ces considérations, pour analyser efficacement tout le contenu nécessaire au sein de chaque collection de sites de votre organisation, utilisez plus petit nombre de sources de contenu que possible. Utiliser la feuille de calcul « Plan pour l’analyse et interroger des fonctionnalités de recherche » pour enregistrer les décisions que vous prenez sur les sources de contenu pour votre déploiement initial.

Planifier les sources de contenu externe

Contenu externe fait référence à deux types de contenu utile pour les personnes de votre organisation :

  • Le contenu d’une application Web qui utilise un autre fournisseur de services partagés que vous souhaitez analyser en utilisant ce fournisseur.

  • Contenu Internet ou extranet qui n’est pas créé ou contrôlé par les personnes de votre organisation.

En règle générale, si le contenu sur une application Web est assez pertinent pour être inclus dans une source de contenu, cette application Web devrait probablement utiliser le même fournisseur de services partagés que d’autres applications Web dans les adresses de démarrage dans la source de contenu. Dans certains cas, vous souhaiterez peut-être inclure un sous-ensemble de contenu dans votre organisation à partir d’une application Web qui utilise des services partagés différents. Si vous le pouvez, éviter cette situation en planifiant avec soin votre architecture d’informations, fournisseurs de services partagés et structure du site. Si vous devez analyser du contenu dans une application Web qui utilise un autre fournisseur de services partagés, vérifiez que le compte d’analyse correspondant a une autorisation lecture sur le contenu et essayez de grouper l’adresse de démarrage dans une source de contenu avec d’autres contenus disponibles au même moment, ou qui est concept est lié.

Un scénario courant implique du contenu en dehors du contrôle de votre organisation qui se rapporte au contenu sur vos sites SharePoint. Vous pouvez ajouter les adresses de démarrage pour ce contenu à une source de contenu existante ou créer une nouvelle source de contenu pour le contenu externe. Étant donné que la disponibilité des sites externes varie largement, il est utile ajouter des sources de contenu distinctes pour autre contenu externe. Vous pouvez ensuite à jour chaque jeu de contenus externes dans une planification d’analyse qui est pertinent pour la disponibilité de chaque site.

Règles d’impact du robot sont particulièrement importants lors de l’analyse des sources de contenu externe, car l’analyse utilise des ressources sur les serveurs analysées. Demande trop peu de contenu sur des serveurs externes ou effectuent des demandes trop fréquemment peut entraîner les administrateurs de ces sites limiter l’accès vos analyses de l’utilisation des ressources trop ou trop la bande passante. Vous pouvez également utiliser les paramètres d’analyse pour chaque contenu source et analyse des règles pour le fournisseur de services partagés pour limiter l’impact sur des serveurs externes.

Planifier les sources de contenu pour les données métiers

Données métiers contenues sources requièrent que les applications qui héberge les données sont d’abord enregistrées dans le catalogue de données métiers, ainsi que les propriétés mappées sur les propriétés gérées qui sont cohérentes avec votre schéma de recherche. Adresses de démarrage de données professionnelles ne peut pas être combinés avec les adresses de démarrage pour un autre contenu, afin que vous devez gérer séparément de sources de contenu de données métiers.

Souvent, les personnes qui planifier l’intégration de données métiers dans vos collections de sites ne sera pas les mêmes personnes impliquées dans le processus de planification du contenu global. Inclure les administrateurs d’application dans le contenu de votre planification des équipes afin qu’ils peuvent vous conseiller comment intégrer leurs données davantage de contenu et les présenter efficacement sur vos collections de sites.

Planifier les paramètres d’analyse

Pour chaque source de contenu, vous pouvez également sélectionner la portée d’analyse les adresses de démarrage dans cette source de contenu. Les options disponibles dans les propriétés pour chaque source de contenu sont :

  • Analyser tout sous le nom d’hôte pour chaque adresse de démarrage.

  • Analyser uniquement le site SharePoint de chaque adresse de démarrage.

Comme avec d’autres décisions de source de contenu, les facteurs les plus importantes à prendre en considération lorsque vous planifiez les paramètres d’analyse des sources de contenu sont la pertinence des informations et l’impact sur les performances. Pour obtenir de meilleurs résultats :

  • Analyser uniquement le site SharePoint si le contenu disponible sur les sites liés n’est pas susceptible d’être pertinents et le contenu sur le site lui-même est pertinent.

  • Analyser tout si les liens sur l’adresse de départ tendent vers contenu pertinent.

Planifier les planifications d’analyse

Chaque source de contenu peut être mis à jour indépendamment basé sur une planification d’analyse pour cette source de contenu. Planifications d’analyse doivent être planifiées reposant sur les considérations de disponibilité, les performances et la bande passante des serveurs exécutant le service de recherche et les serveurs hébergeant le contenu analysé.

Pour obtenir de meilleurs résultats, planifier planification d’analyse basée sur les considérations suivantes :

  • Groupe les adresses de démarrage dans les sources de contenu en fonction de disponibilité similaire et avec acceptable utilisation globale des ressources pour les serveurs hébergeant le contenu.

  • Planifier des analyses incrémentielles pour chaque source de contenu pendant les heures lorsque les serveurs hébergeant le contenu sont disponibles, mais la demande sur les ressources du serveur sont faibles.

  • Décaler les analyses afin que la charge sur les serveurs de votre batterie de serveurs est répartie dans le temps.

  • Planifier des analyses complètes moins fréquemment.

  • Planifiez les modifications administratives nécessitant une analyse complète se produise peu de temps avant l’échéancier planifiée pour analyses complètes.

Vous pouvez adapter les planifications après le déploiement initial basé sur les performances et la capacité des serveurs dans la batterie de serveurs et les serveurs hébergeant du contenu.

Haut de la Page

Considérations relatives à l’analyse de plan pour les fournisseurs de services partagés

Après avoir identifié les sources de contenu pour planifier votre déploiement initial, vous pouvez planification du fournisseur de services partagés. Les paramètres pour l’analyse dans les pages d’Administration de Services partagés pour le fournisseur de services partagés affectent l’analyse de toutes les sources de contenu du fournisseur. Dans la plupart des organisations, qu’un seul fournisseur de services partagés est utilisé pour analyser et interroger tout le contenu, afin que ces paramètres s’appliquent à toutes les sources de contenu dans votre organisation.

Au cours du déploiement, vous créerez fournisseurs de services partagés et puis créer des sources de contenu pour chaque fournisseur. Lors de la planification, il peut être utile de planifier tout d’abord les sources de contenu. Dans le petit nombre de cas où les fournisseurs supplémentaires sont nécessaires, la planification des sources de contenu permet d’identifier qu’il soit nécessaire pour plusieurs fournisseurs de services partagés. planification des sources de contenu également vous aide à que vous identifiez le contenu qui pourrait bénéficier de nouveaux types de fichiers ou des règles d’analyse.

Paramètres de fournisseur de services partagés qui affectent le contenu analysé sont les suivantes :

  • Définir le compte d’accès au contenu par défaut.

  • Configuration des règles d’analyse pour les adresses de démarrage spécifiques utilisées par une de vos sources de contenu.

  • Y compris les types de fichiers.

Planifier le compte d’accès au contenu par défaut

Le compte d’accès au contenu par défaut est le compte utilisé par défaut lors de l’analyse des sources de contenu. Ce compte est sélectionné par l’administrateur du fournisseur de services partagés lors de la configuration après l’installation. Le compte d’accès par défaut doit avoir accès en lecture à tout le contenu analysé, ou le contenu ne sera pas analysé et ne sera pas disponible au cours des requêtes de recherche. Pour des sites individuels dans une source de contenu, vous pouvez utiliser les règles d’analyse pour utiliser un autre compte d’accès. La meilleure solution consiste à sélectionner un compte d’accès au contenu par défaut qui comporte le plus large accès au contenu analysé et d’autres comptes d’accès qui utilisent uniquement lorsque considérations relatives à la sécurité requièrent des comptes séparés. Pour chaque source de contenu que vous planifiez, identifier le début accéder compte et prévoyez d’ajouter des comptes d’accès pour les adresses de démarrage d’adresses qui ne sont pas accessible par le contenu par défaut. Les administrateurs peuvent configurer des comptes d’accès supplémentaires dans les règles d’analyse pour les adresses concernées. Pour plus d’informations sur les considérations de planification pour les comptes d’accès, voir la section suivante sur les règles d’analyse.

Planifier les règles d’analyse

Règles d’analyse servent à limiter le contenu analysé à des sources de contenu pour réduire l’utilisation des ressources du serveur et le trafic réseau et pour améliorer la pertinence des résultats de recherche. Règles d’analyse s’appliquent simultanément à toutes les sources de contenu. Créer des règles d’analyse pour exclure un site spécifique ou un emplacement de l’analyse, pour configurer la manière dont un site particulier est analysé, ou pour changer le compte d’analyse pour être différent du compte d’accès au contenu par défaut.

Chaque règle d’analyse comprend une URL ou un ensemble d’URL représentées par des caractères génériques, une inclusion ou exclusion règle et un compte d’analyse.

Vous pouvez utiliser les règles d’exclusion pour éviter l’analyse de contenu inutile. Souvent, la plupart du contenu pour une adresse de site s’appliquent, mais un sous-site ou une plage de sites n’est pas. En sélectionnant une combinaison ciblée d’adresses de début et de règles d’analyse d’exclusion, les administrateurs de fournisseur de services partagés peuvent optimiser le contenu analysé tout en réduisant l’impact sur l’analyse des performances et la taille des bases de données de contenu. Règles d’exclusion sont particulièrement utiles lors de la planification des adresses de contenu externe, où l’impact sur l’utilisation des ressources n’est pas sous le contrôle des personnes de votre organisation.

Vous pouvez utiliser des règles d’inclusion pour inclure du contenu d’une URL spécifique ou un ensemble d’URL, avec les options pour modifier la manière dont ce contenu est analysé. N’importe quelle combinaison des trois options pour les règles d’inclusion sont disponibles :

  • Suivre les liens et pas le contenu de l’URL de l’adresse de départ. Cette option est utile pour les sites avec des liens de contenu pertinent lorsque la page contenant les liens contient des informations superflues.

  • Analyser les URL complexes. Cette option analyse les URL qui contiennent des caractères complexes. Selon le site, ces URL peut-être ou ne peut-être pas inclure du contenu pertinent. Étant donné que les URL complexes pointent souvent vers des sites non pertinents, il est judicieux de sélectionner uniquement activer cette option sur les sites où le contenu disponible à partir des URL complexes est vraiment pertinent.

  • Analyser le contenu des sites SharePoint en tant que HTTP.

Quelle que soit indique si une règle d’analyse inclut ou exclut du contenu, les administrateurs ont la possibilité de changer le compte d’analyse de la règle. Le compte d’accès au contenu par défaut est utilisé, sauf si un autre compte spécifié dans une règle d’analyse. La principale raison d’utiliser un autre compte de l’analyse d’une règle d’analyse est la valeur par défaut contenu compte d’accès n’a pas accès à toutes les adresses de démarrage. Pour les adresses de démarrage, vous pouvez créer une règle d’analyse et sélectionnez le compte qui a accès.

Une bonne pratique pour le déploiement initial est d’utiliser des règles d’analyse pour mettre en évidence le contenu analysé sur ce qui est plus pertinent selon les concepts et les processus d’entreprise qui peuvent être utiles à votre organisation, comme indiqué dans l’architecture d’informations. Étant donné que l’analyse de contenu consomme des ressources et bande passante, il est préférable d’inclure une plus petite quantité de contenu que vous connaissez pertinent plutôt qu’une plus grande quantité de contenu qui peut-être être inutile. Après le déploiement initial, vous pouvez consulter les journaux d’analyse et de requête et ajuster les sources de contenu et d’analyse des règles qui vous convient et inclure plus de contenu.

Planifier les inclusions de type de fichier

Le contenu est analysé uniquement si l’extension de fichier est incluse dans la liste inclusions de type de fichier. Plusieurs types de fichiers sont inclus automatiquement pendant l’installation initiale. Lorsque vous planifiez les sources de contenu dans votre déploiement initial, il est recommandé de vérifier si le contenu n’utilise les types de fichiers qui ne sont pas inclus. Si c’est le cas, ajoutez ces types de contenu. Si certains types de fichiers contient principalement que le contenu inutile, vous pouvez décider de supprimer l’inclusion de type de fichier pour cette extension, qui va exclure les noms de fichiers qui ont cette extension des analyses.

Lorsque vous ajoutez des types de fichiers, vous devez également vous assurer que vous disposez d’un IFilter qui peut être utilisé pour analyser le type de fichier. IFilters pour plusieurs types de fichiers sont disponibles à partir des fournisseurs tiers, et si les développeurs de logiciels nécessaires peuvent créer IFilters pour les nouveaux types de fichiers.

Haut de la Page

Planifier les considérations relatives à l’analyse de batteries de serveurs

Outre les paramètres qui sont configurés au niveau du fournisseur de services partagés, certains paramètres gérés par le serveur batterie administrateurs affecte-t-elle organiser analysées des sources de contenu. Pensez à ces paramètres lors de la planification pour l’analyse.

Paramètres de batteries de serveurs affectant l’analyse incluent :

  • Paramètres de recherche au niveau de la batterie de serveurs.

  • Règles d’impact du robot.

  • Services de batterie de serveurs.

  • Les services partagés des déploiements de batteries de plusieurs.

Planifier les paramètres de recherche au niveau de la batterie de serveurs

Paramètres de recherche au niveau de la batterie de serveurs incluent les paramètres suivants :

  • Adresse de messagerie du contact

  • Paramètres de proxy

  • Paramètres de délai d’attente

  • Paramètres SSL

L’adresse de messagerie du contact est l’adresse de la personne à contacter à propos de l’impact créé par l’analyse des sources de contenu. Cette adresse apparaît dans les journaux pour les administrateurs des serveurs contenant les adresses de démarrage, afin qu’ils puissent contacter quelqu'un si l’impact de l’analyse de leurs performances et de bande passante est trop élevée, ou autres problèmes se produisent. L’adresse de messagerie du contact doit être une personne ou son alias avec les compétences et la disponibilité rapidement répondre aux requêtes. Quelle que soit l’indique si le contenu analysé est stocké en interne à l’organisation ou non, le temps de réponse rapide est important.

Paramètres de proxy incluent le serveur proxy à utiliser lors de l’analyse du contenu. Le serveur proxy à utiliser dépend de la topologie de votre déploiement de SharePoint et l’architecture d’autres serveurs de votre organisation. Les paramètres de délai d’expiration sont utilisés pour limiter la durée pendant laquelle le serveur de recherche attend lors de la connexion à d’autres services. Les paramètres SSL déterminent si le certificat SSL doit correspondre exactement à afin d’analyser le contenu.

Planifier les règles d’impact du robot

Règles d’impact du robot vous permet de gérer la charge sur les serveurs analysés. Règles d’impact du robot limitent la fréquence à laquelle vous demandez des documents d’un site lors de l’analyse, ou le nombre de documents vous demande à la fois.

Pour le contenu au sein de votre organisation, vous pouvez coordonner avec les administrateurs d’autres sites pour définir l’impact du robot les règles basées sur les performances et la capacité des serveurs. Pour la plupart de ces sites, cette débute n’est pas possible, afin que la meilleure solution consiste à analyser trop peu plutôt que d’analyse trop et risque de perdre l’accès pour analyser le contenu approprié.

Lors du déploiement initial, définissez les règles d’impact du robot pour rendre plus petit renforcer votre impact sur d’autres serveurs en tant que tout en analysant suffisamment contenu suffisamment souvent pour rendre l’analyse intéressante.

Au cours des opérations, vous pouvez ajuster l’impact du robot les règles basées sur votre expérience et les données des journaux d’analyse.

Planifier pour plusieurs déploiements de batterie de serveurs

Grandes entreprises planifient souvent des déploiements avec plusieurs batteries de serveurs basées sur les considérations relatives à la sécurité ou d’architecture. Par exemple, une organisation peut utiliser une batterie de serveurs pour générer du contenu et une autre batterie de serveurs pour la publication du contenu sur internet. Autres exemples incluede un déploiement géographiquement avec batteries de serveurs pour chaque filiale ou une batterie de serveurs supplémentaire pour un projet confidentiel ou sensible qui doit être conservé distinct à partir d’autres projets.

Si vous avez plus d’une batterie de serveurs, vous devez planifier pour les services partagés comment sont configurés sur les batteries. Dans la page Gestion des applications pour l’Administration centrale de chaque batterie de serveurs, dans la section Services partagés Office SharePoint Server, vous pouvez sélectionner l’option pour accorder ou configurer les services partagés entre des batteries. Vous pouvez configurer chaque batterie de serveurs pour utiliser un des trois options :

  • Ne pas participer aux services partagés entre des batteries    Batteries de serveurs à l’aide de cette option ne pas participer aux services partagés entre batteries et s’appuient sur les services partagés d’un fournisseur de services partagés sur la même batterie de serveurs. Il s’agit de la configuration typique pour une petite ou moyenne entreprise qui comporte un petit déploiement à l’aide d’une batterie de serveurs unique.

  • Fournir des services partagés aux autres batteries    Batteries de serveurs fournissant des services à d’autres batteries sont conçues pour gérer les services partagés entre batteries dans les grandes organisations et qui disposent généralement une capacité supérieure à celle de batteries de serveurs pour les entreprises.

  • Consommer des services d’une autre batterie partagés    Batteries de serveurs qui utilisent des services partagés sont généralement divisions batteries de serveurs exécutant des sites portails ou des applications de gestion de petite taille. Ces batteries peuvent avoir leurs propres fournisseurs de services partagés, afin que lorsque le fournisseur de services partagés centrale n’est pas disponible, ils peuvent utiliser les services disponibles dans la batterie de serveurs locale.

Haut de la Page

Remarque : Avertissement traduction automatique : cet article a été traduit par un ordinateur, sans intervention humaine. Microsoft propose cette traduction automatique pour offrir aux personnes ne maîtrisant pas l’anglais l’accès au contenu relatif aux produits, services et technologies Microsoft. Comme cet article a été traduit automatiquement, il risque de contenir des erreurs de grammaire, de syntaxe ou de terminologie.

Développez vos compétences
Découvrez des formations
Accédez aux nouvelles fonctionnalités en avant-première
Rejoignez le programme Office Insider

Ces informations vous ont-elles été utiles ?

Nous vous remercions pour vos commentaires.

Merci pour vos commentaires. Il serait vraisemblablement utile pour vous de contacter l’un de nos agents du support Office.

×