Planear el contenido de rastreo

Importante:  Este artículo se ha traducido con traducción automática; vea la declinación de responsabilidades. Para su referencia, puede encontrar la versión en inglés de este artículo aquí.

Nota: Este contenido es contenido preliminar para una versión preliminar del software. Podría estar incompleto y está sujeto a cambios.

En este artículo

Acerca del rastreo de contenido

Planear orígenes de contenido

Planear consideraciones de rastreo de SSP

Planear consideraciones de rastreo para granjas de servidores

Antes de que puede usar la funcionalidad de búsqueda empresarial en Microsoft Office SharePoint Server 2007 para buscar contenido en su organización, debe decidir qué contenido desea incluir en la búsqueda y planear el rastreo del contenido para que el contenido y sus propiedades pueden utilizarse en la búsqueda consultas.

Microsoft Office SharePoint Server 2007 usa orígenes de contenido para rastrear el contenido de las colecciones de sitios o en sitios externos relacionados o aplicaciones de datos profesionales para que los datos y contenido relevante aparece en los resultados de búsqueda. Otras características de búsqueda filtran o modifican el contenido después de haber sido rastreado. Buena planeación de orígenes de contenido le ayuda a crear la capacidad de búsqueda durante la implementación inicial que le permite configurar y administrar contenido en toda la organización basándose en subconjuntos clave de contenido y datos, contenido y datos externos a su servidor de Office implementación, o contenido y datos externos a su organización. También plan de programaciones de rastreo, reglas de rastreo, administración de propiedades y configuración de relevancia para cada origen de contenido.

Acerca del rastreo de contenido

Rastreo es un proceso de indización de contenido, datos y metadatos para que las consultas de búsqueda puedan proporcionar resultados de búsqueda importantes. Un origen de contenido es un punto de partida usado por Office SharePoint Server 2007 para rastrear contenido para que esté disponible para las consultas de búsqueda. Orígenes de contenido se compone de una o más direcciones de inicio, que son direcciones URL que contienen contenido o los datos que desea incluir en las búsquedas de su organización. Contenido se incluye o no en un índice de contenido basado en reglas seleccionadas por el administrador del proveedor de servicios compartidos (SSP) para la búsqueda. Después de rastrear contenido y los datos en un origen de contenido, servidores de consultas procesan las consultas basándose en las propiedades administradas de búsqueda y la capacidad del servicio de búsqueda y proporcionan resultados de búsqueda importantes. De forma predeterminada, todo el contenido de cada aplicación Web que usa el SSP se rastrea en un origen de contenido.

Los administradores SSP de búsqueda pueden crear orígenes de contenido adicionales para subconjuntos clave de contenido. Pueden seleccionar reglas de rastreo para direcciones de inicio que se aplican a todos los orígenes de contenido en el SSP en función de qué contenido y los datos de cada dirección de inicio es relevante para la organización y configuración los valores para cada origen de contenido.

Con versiones anteriores de Microsoft SharePoint Portal Server, los administradores administran contenido índices, que son colecciones subyacentes de todo el contenido rastreados por orígenes de contenido. Con Microsoft Office SharePoint Server 2007, ya no es necesario. El índice de contenido único para cada SSP se crea automáticamente en función de la configuración seleccionada para cada origen de contenido y ya no se muestran los índices de contenido a los administradores.

Volver al principio

Planear orígenes de contenido

Origen de contenido predeterminado para el SSP rastrea el contenido de todas las aplicaciones Web que usan el SSP. Las direcciones de inicio para todas las aplicaciones Web en el SSP se agregan automáticamente al origen de contenido, para que todo el contenido en el SSP esté disponible para su búsqueda después del primer rastreo completo del origen de contenido.

La arquitectura de la información también sugiere orígenes de contenido adicionales para crear para cada una de las colecciones de sitios en cada una de las aplicaciones Web. Para administrar y programar rastreos de manera independiente, puede crear orígenes de contenido que rastrean un subconjunto de contenido a lo largo del SSP. Esto es útil para rastrear el contenido de prioridad alta o que cambia rápidamente con más frecuencia sin tener que rastrear todo el contenido.

Ejemplos de contenido, es posible que desee plan orígenes de contenido adicionales para incluir:

  • Contenido en recursos compartidos de archivos dentro de su organización.

  • Contenido de Exchange Server.

  • Tipo de contenido de Lotus Notes servidores.

  • Sitios del directorio de sitios.

  • Otro contenido de su organización que no se encuentra en los sitios de SharePoint.

  • Contenido externo al SSP o externo a su organización.

  • Datos de empresa almacenados en aplicaciones empresariales.

Cada origen de contenido puede contener una o más direcciones de inicio que señalan a ubicaciones de cualquier combinación de estos tipos de contenido. Ya agrupe el contenido en un origen de contenido o cree orígenes de contenido adicionales depende en gran medida de consideraciones de administración. Los administradores con frecuencia realizan cambios que requieren una actualización completa de un origen de contenido determinado. Cambios para rastrear reglas, la cuenta de rastreo o access o las propiedades administradas requieren una actualización completa. Para facilitar la administración, organice los orígenes de contenido de manera que la actualización de dicho contenido al mismo tiempo es adecuada para los administradores y sus otras tareas de administración planeadas.

Contenido en recursos compartidos de archivos y servidores fuera de su granja de servidores como servidores de correo, servidores Web que no contienen sitios de SharePoint o servidores de aplicaciones de datos de negocio deben estar organizados por disponibilidad. Si los servidores que contienen contenido están disponibles al mismo tiempo, es más probable que rastrear todo el contenido del origen de contenido, con menos necesidad de ejecutar posteriormente actualizaciones completas.

Además de estas consideraciones para rastrear con eficacia todo el contenido necesario dentro de cada colección de sitios de su organización, use orígenes de contenido como pocos como sea posible. Use la hoja de cálculo "Plan de rastreo y consultas de características de búsqueda" para grabar las decisiones acerca de orígenes de contenido para su implementación inicial.

Planear orígenes de contenido externos

Contenido externo hace referencia a dos tipos de contenido útil para las personas de su organización:

  • Tipo de contenido dentro de una aplicación Web que usa un SSP diferente que desee rastrear usando este SSP.

  • Internet o extranet contenido que no se creó o controlado por personas de su organización.

Normalmente, si el contenido de una aplicación Web es lo suficientemente importante que se incluirán en un origen de contenido, dicha aplicación Web probablemente debería estar usando el mismo SSP que otras aplicaciones Web en las direcciones de inicio del origen de contenido. En algunos casos, que podría querer incluir un subconjunto de contenido de su organización desde una aplicación Web que usa distintos servicios compartidos. Si es posible, evite esta situación por planear detenidamente la arquitectura de la información, el SSP y la estructura del sitio. Si debe rastrear contenido en una aplicación Web que usa un SSP diferente, asegúrese de que la cuenta de rastreo pertinente tiene permiso lectura para el contenido e intente agrupar la dirección de inicio en un origen de contenido con otro contenido disponible en períodos similares, o que es Conceptualmente relacionados.

Un escenario común implica contenido fuera del control de su organización que se relaciona con el contenido en los sitios de SharePoint. Puede agregar las direcciones de inicio para este contenido a un origen de contenido existente o crear un nuevo origen de contenido de contenido externo. Dado que la disponibilidad de los sitios externos varía mucho, resulta útil agregar orígenes de contenido independientes para contenido externo diferente. A continuación, puede actualizar cada conjunto de contenido externo en una programación de rastreo que tenga sentido para la disponibilidad de cada sitio.

Reglas de impacto del rastreador son particularmente importantes cuando rastrea orígenes de contenido externos porque el rastreo utiliza recursos en los servidores rastreados. Solicitar demasiado contenido en servidores externos o realizar consultas con demasiada frecuencia puede provocar que los administradores de dichos sitios limitar el acceso en el futuro si los rastreos están usando demasiados recursos o demasiado ancho de banda. También puede usar configuración de rastreo para cada contenidas origen y reglas de rastreo para el SSP para limitar el impacto en los servidores externos.

Planear orígenes de contenido para datos profesionales

Datos profesionales contenidos orígenes requieren que las aplicaciones que aloja los datos se primera registran en el catálogo de datos profesionales y las propiedades asignadas a las propiedades administradas que son coherentes con el esquema de búsqueda. No se puede combinar direcciones de inicio de datos profesionales con direcciones de inicio de otro contenido, por lo que debe administrar orígenes de contenido de datos profesionales por separado.

A menudo, las personas que plan de integración de datos profesionales en las colecciones de sitios no serán los mismos implicados en el proceso de planeación de contenido general. Incluir los administradores de la aplicación de empresa en sus equipos de planeación para que puedan guiarle cómo integrar sus datos en su otro contenido y presentarlo de forma eficaz en las colecciones de sitios de contenido.

Planear la configuración de rastreo

Para cada origen de contenido, también puede seleccionar el grado de rastreo de las direcciones de inicio en ese origen de contenido. Las opciones disponibles en las propiedades para cada origen de contenido son:

  • Rastrear todo bajo el nombre de host de cada dirección de inicio.

  • Rastrear el sitio de SharePoint de cada dirección de inicio.

Al igual que otras decisiones de origen de contenido, los factores más importantes a tener en cuenta al planear la configuración de rastreo de orígenes de contenido son la importancia de la información y el impacto en el rendimiento. Para obtener los mejores resultados:

  • Rastrear sólo el sitio de SharePoint si el contenido disponible en sitios vinculados no es probable que sean de interés y el contenido en el propio sitio es relevante.

  • Rastrear todo si los vínculos de la dirección de inicio tienden a apuntar a contenido pertinente.

Planear programaciones de rastreo

Cada origen de contenido se puede actualizar independientemente basándose en una programación de rastreo para ese origen de contenido. Las programaciones de rastreo deben planeadas basándose en las consideraciones de disponibilidad, rendimiento y ancho de banda de los servidores que ejecutan el servicio de búsqueda y los servidores que alojan el contenido rastreado.

Para obtener los mejores resultados, planear programaciones de rastreo basándose en las siguientes consideraciones:

  • Direcciones de inicio de grupo orígenes de contenido basándose en una similar disponibilidad y con aceptable uso global de recursos para los servidores que alojan el contenido.

  • Programe rastreos incrementales para cada origen de contenido durante ocasiones en los servidores que alojan el contenido están disponibles pero son bajo la demanda de los recursos del servidor.

  • Alternar programaciones de rastreo para que la carga de los servidores de su granja de se distribuye a lo largo del tiempo.

  • Programar rastreos completos con menos frecuencia.

  • Cambios de administración de programación que requieren un rastreo completo para que se produzca poco antes de la programación planeada de rastreos completos.

Puede ajustar las programaciones después de la implementación inicial basándose en el rendimiento y la capacidad de los servidores de la granja y los servidores que alojan contenido.

Volver al principio

Planear consideraciones de rastreo de SSP

Una vez haya identificado los orígenes de contenido para planear la implementación inicial, considere la posibilidad de planeación de SSP. La configuración de rastreo en las páginas de administración de servicios compartidos para el SSP afecta al rastreo de todos los orígenes de contenido en el SSP. En la mayoría de las organizaciones, se utiliza solo un SSP para rastrear y consultar todo el contenido, por lo que esta configuración se aplica a todos los orígenes de contenido de la organización.

Durante la implementación, creará varios SSP y, a continuación, crear orígenes de contenido para cada SSP. Durante la planeación, resulta útil planear primero los orígenes de contenido. En un pequeño número de casos donde se necesita SSP adicionales, la planeación de los orígenes de contenido puede ayudar a identificar la necesidad de varios SSP. planear orígenes de contenido también le ayuda a que identificar el contenido que podría beneficiarse de reglas de rastreo o nuevos tipos de archivo.

Configuración de SSP que afecta al contenido rastreado incluye:

  • La configuración de la cuenta predeterminada de acceso al contenido.

  • Configurar reglas de rastreo para direcciones de inicio específicas utilizadas por alguno de los orígenes de contenido.

  • Incluidos los tipos de archivo.

Planear la cuenta de acceso al contenido de forma predeterminada

La cuenta predeterminada de acceso al contenido es la cuenta que se usa de forma predeterminada al rastrear orígenes de contenido. Esta cuenta está seleccionada por el administrador SSP durante la configuración posterior. La cuenta de acceso predeterminada debe tener acceso a todo el contenido que se rastree, o el contenido no se puede rastrear y no estará disponible durante las consultas de búsqueda. Para sitios individuales de un origen de contenido, puede usar reglas de rastreo para usar una cuenta de acceso diferente. Lo mejor es seleccionar una cuenta de acceso al contenido predeterminado que tiene el acceso más amplio a la mayoría de su contenido rastreado y sólo usar otras cuentas de acceso cuando las consideraciones de seguridad requieren cuentas separadas. Para cada origen de contenido que planea, identificar el inicio de las direcciones que el contenido predeterminado no pueden acceder a tener acceso a la cuenta y va a agregar cuentas de acceso para las direcciones de inicio. Los administradores pueden configurar cuentas de acceso adicionales en reglas de rastreo para las direcciones de inicio pertinentes. Para obtener más información sobre las consideraciones de diseño para las cuentas de acceso, vea la siguiente sección acerca de las reglas de rastreo.

Planear reglas de rastreo

Reglas de rastreo se utilizan para limitar el contenido rastreado por orígenes de contenido para minimizar el uso de recursos de servidor y tráfico de red y para aumentar la relevancia de los resultados de búsqueda. Reglas de rastreo se aplican simultáneamente a todos los orígenes de contenido. Crear reglas de rastreo para excluir un sitio o ubicación específicos del rastreo, para configurar cómo se rastrea un sitio concreto, o cambiar la cuenta de rastreo para que sea distinta de la cuenta predeterminada de acceso al contenido.

Cada regla de rastreo incluye una dirección URL o un conjunto de direcciones URL representados por caracteres comodín, una inclusión o regla de exclusión y una cuenta de rastreo.

Puede usar las reglas de exclusión para evitar el rastreo contenido relevante. A menudo, la mayor parte del contenido de una dirección de sitio en particular es relevante, pero no es un subsitio específico o un rango de sitios. Al seleccionar una combinación centrada de direcciones de inicio y reglas de rastreo de exclusión, los administradores SSP pueden maximizar contenido rastreado minimizando el impacto en el rendimiento de rastreo y el tamaño de las bases de datos de contenido. Reglas de exclusión son particularmente útiles al planear las direcciones de inicio para contenido externo, donde el impacto en el uso de recursos no está bajo el control de las personas de su organización.

Puede usar las reglas de inclusión para incluir contenido para una dirección URL o el rango de direcciones URL, con opciones para cambiar cómo rastrear el contenido específico. Cualquier combinación de las tres opciones para las reglas de inclusión están disponibles:

  • Seguir los vínculos y no el contenido en la dirección URL de la dirección de inicio. Esta opción es útil para los sitios con vínculos de contenido pertinente cuando la página que contiene los vínculos contiene información relevante.

  • Rastrear direcciones URL complejas. Esta opción rastrea las direcciones URL que contienen caracteres complejos. Dependiendo del sitio, estas direcciones URL pueden o no pueden incluir contenido relevante. Dado que las direcciones URL complejas con frecuencia pueden redireccionar a sitios no importantes, es una buena idea solo habilitar esta opción en sitios donde se sabe que el contenido disponible en las direcciones URL complejas relevante.

  • Rastrear contenido en sitios de SharePoint como HTTP.

Independientemente de si una regla de rastreo incluye o excluye contenido, los administradores tienen la opción de cambiar la cuenta de rastreo para la regla. A menos que se especifique otra cuenta en una regla de rastreo, se utiliza la cuenta predeterminada de acceso al contenido. La razón principal para usar una cuenta de rastreo distinta para una regla de rastreo es que el predeterminado contenido access cuenta no tiene acceso a todas las direcciones de inicio. Para las direcciones de inicio, puede crear una regla de rastreo y seleccione una cuenta que tenga acceso.

Una buena práctica para la implementación inicial es el uso de reglas de rastreo para centrarse contenido rastreado en ¿qué es más relevante según los conceptos y procesos empresariales que son más relevantes para su organización, como se indica en la arquitectura de información. Dado que el contenido de rastreo consume recursos y ancho de banda, es mejor incluir menos cantidad de contenido que se sabe que es relevante que una gran cantidad de contenido que podría ser relevante. Después de la implementación inicial, puede revisar los registros de consulta y de rastreo y ajustar los orígenes de contenido y reglas que sean más importantes e incluir más contenido de rastreo.

Planear inclusiones de tipos de archivo

Contenido sólo se rastrea si se incluye la extensión de archivo relevante en la lista inclusiones de tipo de archivo. Varios tipos de archivo se incluyen automáticamente durante la instalación inicial. Cuando planea orígenes de contenido en su implementación inicial, es una buena idea comprobar si un contenido importante utiliza tipos de archivo que no están incluidos. Si es así, agregue estos tipos de contenido. Si ciertos tipos de archivo contienen principalmente contenido relevante, puede decidir eliminar la inclusión de tipo de archivo para esa extensión, que se excluir nombres de archivo que tengan esa extensión de rastreos.

Cuando agrega tipos de archivo, debe asegurarse de que dispone de un IFilter que se puede utilizar para rastrear el tipo de archivo. IFilters varios tipos de archivo están disponibles de los proveedores de terceros y si los desarrolladores de software necesario pueden crear IFilter para nuevos tipos de archivo.

Volver al principio

Planear consideraciones de rastreo para granjas de servidores

Además de la configuración que se han configurado en el nivel SSP, varias opciones administradas por los administradores de servidor granja afecta cómo se rastrean los orígenes de contenido. Tenga en cuenta estas opciones planificación de rastreo.

Configuración de conjunto de servidores que afectan al rastreo incluye:

  • Configuración de búsqueda de la granja de servidores.

  • Reglas de impacto del rastreador.

  • Servicios de conjunto de servidores.

  • Servicios compartidos para varias implementaciones de granja de servidores.

Planear la configuración de búsqueda del conjunto de servidores

Configuración de búsqueda de la granja de servidores incluye las siguientes opciones:

  • Dirección de correo electrónico de contacto

  • Configuración de proxy

  • Configuración de tiempo de espera

  • Configuración de SSL

La dirección de correo electrónico del contacto es la dirección de la persona de contacto sobre el impacto creado al rastrear orígenes de contenido. Esta dirección aparece en los registros para los administradores de los servidores que contiene las direcciones de inicio para que los administradores pueden ponerse en contacto con alguien si el impacto del rastreo sobre el rendimiento y el ancho de banda es demasiado alto o se producen otros problemas. La dirección de correo electrónico del contacto debe ser una persona o un alias bien supervisado con la experiencia necesaria y disponibilidad para responder rápidamente a las solicitudes. Independientemente de si el contenido rastreado se almacena internamente en la organización o no, es importante una respuesta rápida.

Configuración de proxy incluye el servidor proxy para utilizarlo al rastrear contenido. El servidor proxy para usar depende de la topología de la implementación de SharePoint y la arquitectura de otros servidores de su organización. Se usa la configuración de tiempo de espera para limitar el tiempo que espera el servidor de búsqueda mientras se conecta a otros servicios. La configuración de SSL determina si el certificado SSL debe coincidir exactamente para rastrear el contenido.

Planear reglas de impacto del rastreador

Usar reglas de impacto del rastreador para administrar la carga en los servidores rastreados. Reglas de impacto del rastreador limitan qué frecuencia se solicitan documentos desde un sitio de durante el rastreo o cuántos documentos solicita a la vez.

Contenido de la organización, puede coordinar con los administradores de otros sitios para establecer las reglas que se basan en el rendimiento y la capacidad de los servidores de impacto del rastreador. Para los sitios más externos, ésta no es posible, por lo que es la práctica recomendada rastrear demasiado poco en lugar de rastrear demasiado y evitar el riesgo de perder el acceso para rastrear el contenido relevante.

Durante la implementación inicial, establezca las reglas de impacto del rastreador a Impresione más pequeño en otros servidores como sea posible mientras sigue rastrear contenido suficientemente con la frecuencia suficiente para realizar el rastreo la pena.

Durante las operaciones, puede ajustar las reglas que se basan en sus experiencias y datos de los registros de rastreo de impacto del rastreador.

Plan para varias implementaciones de granja de servidores

Las organizaciones grandes a menudo planean implementaciones con varios conjuntos de servidores basándose en consideraciones de seguridad o de arquitectura. Por ejemplo, una organización puede usar un conjunto de servidores para producir contenido y otro conjunto de servidores para publicar contenido en internet. Otros ejemplos incluyen una implementación distribuida geográfico con granjas de servidores para cada subsidiaria principal o una granja de servidores adicional para un proyecto confidencial que debe mantenerse separado de otros proyectos.

Si tiene más de un conjunto de servidores, tendrá que planear para los servicios compartidos de cómo se configuran distintas granjas. En la página de administración de aplicaciones para la Administración Central de cada conjunto de servidores, en la sección servicios compartidos de Office SharePoint Server, puede seleccionar la opción para conceder o configurar servicios compartidos entre conjuntos de servidores. Puede configurar cada conjunto de servidores para usar una de las tres opciones:

  • No participar en servicios compartidos entre conjuntos de servidores    Conjuntos de servidores con esta opción no participar en servicios compartidos y dependen de los servicios compartidos de un SSP en el mismo conjunto de servidores. Esta es la configuración típica para una organización pequeña o mediana que tenga una implementación pequeña usando un único conjunto de servidores.

  • Proporcionar servicios compartidos a otros conjuntos de servidores    Proporcionar servicios a otros conjuntos de servidores de conjuntos de servidores están diseñados para administrar servicios compartidos en empresas grandes y normalmente tienen una mayor capacidad de conjuntos de servidores de divisiones u organizaciones más pequeñas.

  • Consume compartido servicios desde otro conjunto de servidores    Conjuntos de servidores que consumen servicios compartidos son por lo general conjuntos de servidores que ejecutan portales de divisiones o aplicaciones empresariales a pequeña escala. Estos conjuntos también pueden tener sus propios SSP, para que cuando el SSP central no está disponible, puede usar los servicios disponibles en el conjunto de servidores local.

Volver al principio

Nota: Declinación de responsabilidades de traducción automática: Este artículo se ha traducido con un sistema informático sin intervención humana. Microsoft ofrece estas traducciones automáticas para que los hablantes de otros idiomas distintos del inglés puedan disfrutar del contenido sobre los productos, los servicios y las tecnologías de Microsoft. Puesto que este artículo se ha traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática.

Ampliar sus conocimientos
Explorar los cursos
Obtener nuevas características primero
Únase a los participantes de Office Insider

¿Le ha sido útil esta información?

¡Gracias por sus comentarios!

Gracias por sus comentarios. Quizá le interese ponerse en contacto con uno de nuestros agentes de soporte de Office.

×