Planejar a rastrear conteúdo

Importante :  Este artigo foi traduzido por um sistema de tradução automática, leia o aviso de isenção de responsabilidade. Para sua referência, veja a versão em inglês deste artigo aqui.

Observação : Este conteúdo é preliminar para uma versão preliminar do software. Ele pode estar incompleto e está sujeita a alterações.

Neste artigo

Sobre como rastrear conteúdo

Fontes de conteúdo de plano

Planejar Considerações sobre rastreamento de SSPs

Planejar Considerações de rastreamento para server farms

Antes de poder usar a funcionalidade de pesquisa corporativo no Microsoft Office SharePoint Server 2007 para pesquisar conteúdo em toda a organização, você deve decidir qual conteúdo para incluir em pesquisa e planos para rastrear o conteúdo para que o conteúdo e suas propriedades podem ser usadas na pesquisa consultas.

Microsoft Office SharePoint Server 2007 usa fontes de conteúdo para rastrear conteúdo em seus conjuntos de sites ou em sites externos relacionados ou aplicativos de negócios de dados para que dados e o conteúdo relevante apareça nos resultados da pesquisa. Outros recursos de pesquisa de filtro ou modifique o conteúdo depois que ela tenha sido rastreada. Bom planejamento para fontes de conteúdo de ajuda você a criar o recurso de pesquisa durante sua implantação inicial que permite configurar e gerenciar o conteúdo em toda a organização com base em chaves subconjuntos de conteúdo e dados, conteúdo e dados externos ao seu servidor do Office implantação, ou conteúdo e dados externos à sua organização. Você também planejar cronogramas de rastreamento, regras de rastreamento, gerenciamento de propriedade e configurações de relevância para cada fonte de conteúdo.

Sobre como rastrear conteúdo

Rastreando é um processo de indexação de conteúdo, dados e metadados para que as consultas de pesquisa podem fornecer resultados de pesquisa relevantes. Uma fonte de conteúdo é um ponto de partida usado pelo Office SharePoint Server 2007 para rastrear conteúdo para disponibilizá-lo para consultas de pesquisa. Fontes de conteúdo são compostos de um ou mais endereços de início, que são URLs contendo conteúdo ou dados que você deseja incluir em pesquisas em sua organização. Conteúdo é incluído ou excluído em um índice de conteúdo com base em regras que são selecionadas pelo administrador do provedor de serviços compartilhados (SSP) para pesquisa. Após o rastreamento de conteúdo e dados em uma fonte de conteúdo, servidores de consulta processam consultas com base em propriedades gerenciadas de pesquisa e a capacidade do serviço de pesquisa e fornecem resultados de pesquisa relevantes. Por padrão, todo o conteúdo em cada aplicativo Web que usa o SSP é rastreado em uma única fonte de conteúdo.

Administradores SSP para pesquisa podem criar fontes de conteúdo adicionais para chaves subconjuntos de conteúdo. Eles podem selecionar regras de rastreamento para endereços de início que se aplicam a todas as fontes de conteúdo no SSP com base em qual conteúdo e os dados em cada endereço inicial é relevante para a organização e definir configurações para cada fonte de conteúdo.

Com versões anteriores do Microsoft SharePoint Portal Server, os administradores gerenciados conteúdo índices, que são as coleções subjacentes de todo o conteúdo rastreados por fontes de conteúdo. Com Microsoft Office SharePoint Server 2007, isso não é necessário. O índice de conteúdo único para cada SSP é criado automaticamente com base nas configurações selecionadas para cada fonte de conteúdo e índices de conteúdo não são mais exibidos para administradores.

Início da página

Fontes de conteúdo de plano

A fonte de conteúdo padrão para o SSP rastreia o conteúdo em todos os aplicativos da Web que usam o SSP. Os endereços iniciais de todos os aplicativos Web no SSP são automaticamente adicionados à fonte de conteúdo, para que todo o conteúdo no SSP está disponível para pesquisar após o primeiro rastreamento completo da fonte de conteúdo.

Sua arquitetura de informações também deve sugerir fontes de conteúdo adicionais para criar para cada um dos seus conjuntos de sites em cada um dos seus aplicativos da Web. Para gerenciar e agendar rastreamentos de maneira independente, você pode criar fontes de conteúdo que rastreie um subconjunto de conteúdo em todo o SSP. Isso é útil para rastrear conteúdo de alta prioridade ou alteração rapidamente com mais frequência sem precisar rastrear todo o conteúdo.

Exemplos de conteúdo que você talvez queira planejar fontes de conteúdo adicionais para incluem:

  • O conteúdo em compartilhamentos de arquivos dentro de sua organização.

  • Conteúdo do Exchange Server.

  • Conteúdo no Lotus Notes servers.

  • Sites no diretório de sites.

  • Outro conteúdo em sua organização não encontrado nos sites do SharePoint.

  • Conteúdo externo para o seu SSP ou externo à sua organização.

  • Dados de negócios armazenados em linha de aplicativos de negócios.

Cada fonte de conteúdo pode conter um ou mais endereços que apontam para locais para qualquer combinação desses tipos de conteúdo iniciais. Se você agrupa conteúdo em uma fonte de conteúdo ou cria fontes de conteúdo adicionais depende em grande parte considerações de administração. Administradores geralmente fazer alterações que exigem a atualização completa de uma fonte de conteúdo específica. Alterações para rastrear regras, a conta de acesso ou rastreando ou propriedades gerenciadas exigem uma atualização completa. Para facilitar a administração, organizar fontes de conteúdo de forma que a atualização de conteúdo ao mesmo tempo é conveniente para administradores e seus outros planejadas tarefas administrativas.

O conteúdo em compartilhamentos de arquivos e servidores fora de seu farm de servidores como servidores de email, servidores Web que não contêm sites do SharePoint ou servidores de aplicativo de dados de negócios devem ser organizados por disponibilidade. Se os servidores que tenha conteúdo estão disponíveis ao mesmo tempo, você provavelmente mais com êxito rastrear todo o conteúdo na fonte de conteúdo, com menos preciso executar atualizações completas mais tarde.

Além dessas considerações, para efetivamente rastrear todo o conteúdo necessário dentro de cada conjunto de sites em sua organização, use alguns como fontes de conteúdo, como você pode. Use a planilha de "Plano para rastrear e recursos de pesquisa de consulta" gravar as decisões que você fazer sobre fontes de conteúdo para a sua implantação inicial.

Planejar fontes de conteúdo externo

Conteúdo externo refere-se a dois tipos de conteúdo útil para as pessoas em sua organização:

  • O conteúdo em um aplicativo Web que usa um SSP diferentes que você deseja rastrear usando este SSP.

  • Internet ou extranet conteúdo que não é criado ou controlado por pessoas em sua organização.

Normalmente, se o conteúdo em um aplicativo Web é a serem incluídos em uma fonte de conteúdo relevante, aplicativo Web provavelmente deve estar usando o mesmo SSP como outros aplicativos da Web no início endereços na fonte de conteúdo. Em alguns casos, talvez você queira incluir um subconjunto de conteúdo em sua organização de um aplicativo Web que usa serviços compartilhados diferentes. Se possível, evite essa situação cuidadosamente Planejando sua arquitetura de informações, SSPs e estrutura do site. Se você deve rastrear conteúdo em um aplicativo Web que usa um SSP diferente, certifique-se de que a conta de rastreamento relevante tem permissão de leitura para o conteúdo e tente agrupar o endereço inicial em uma fonte de conteúdo com outros tipos de conteúdo disponíveis em momentos semelhantes, ou que seja forma conceitual relacionados.

Um cenário comum envolve conteúdo fora do controle da sua organização que se relacionam com o conteúdo em seus sites do SharePoint. Você pode adicionar os endereços de início para esse conteúdo em uma fonte de conteúdo existente ou criar uma nova fonte de conteúdo de conteúdo externo. Porque a disponibilidade de sites externos varia muito, é útil adicionar fontes de conteúdo separado para diferentes de conteúdo externo. Você pode atualizar cada conjunto de conteúdo externo em um cronograma de rastreamento que faça sentido para a disponibilidade de cada site.

Regras de impacto do rastreador são particularmente importantes quando rastrear fontes de conteúdo externo porque rastreando usa recursos nos servidores rastreados. Solicitando muito conteúdo em servidores externos ou fazendo solicitações muito frequentemente pode causar desses sites aos administradores limitar o acesso futuro se seus rastreamentos estão usando muitos recursos ou muita largura de banda. Você também pode usar as configurações de rastreamento para cada regras de origem e o rastreamento de conteúdo para o SSP para limitar o impacto em servidores externos.

Planejar fontes de conteúdo para dados corporativos

Dados corporativos conteúdos fontes exigem que os aplicativos que hospedam os dados são primeiro registrado no catálogo de dados corporativos e as propriedades mapeadas propriedades gerenciadas que são consistentes com seu esquema de pesquisa. Endereços de início de dados de negócios não podem ser combinados com endereços de início para outros tipos de conteúdo, para que você separadamente deve gerenciar fontes de conteúdo de dados corporativos.

Muitas vezes, as pessoas que plano de integração de dados corporativos em seus conjuntos de sites não serão as mesmas pessoas envolvidas no processo de planejamento de conteúdo de geral. Inclua os administradores de aplicativos de negócios em seu conteúdo planejamento equipes para que eles podem informar a você como integrar seus dados o outros tipos de conteúdo e efetivamente apresentá-lo em seus conjuntos de sites.

Planejar configurações de rastreamento

Para cada fonte de conteúdo, você também pode selecionar como extensivamente rastrear os endereços de início na fonte de conteúdo. As opções disponíveis nas propriedades de cada fonte de conteúdo são:

  • Rastrear todo o nome do host para cada endereço inicial.

  • Rastrear apenas o site do SharePoint de cada endereço inicial.

Como com outras decisões de fonte de conteúdo, os fatores a considerar ao planejar as configurações de rastreamento de fontes de conteúdo mais importantes são a relevância das informações e o impacto de desempenho. Para obter melhores resultados:

  • Rastrear apenas o site do SharePoint se o conteúdo disponível nos sites vinculados não provavelmente ser relevantes e o conteúdo do site em si é relevante.

  • Rastrear todo se os links no endereço inicial tendem apontar para o conteúdo relevante.

Planejar cronogramas de rastreamento

Cada fonte de conteúdo pode ser atualizado independentemente com base em um agendamento de rastreamento para essa fonte de conteúdo. Cronogramas de rastreamento devem ser planejadas com base nas considerações de disponibilidade, desempenho e largura de banda de servidores que executam o serviço de pesquisa e os servidores que hospedam o conteúdo rastreado.

Para obter melhores resultados, planeje cronogramas de rastreamento com base em considerando o seguinte:

  • Grupo Iniciar endereços nas fontes de conteúdo com base na disponibilidade semelhante e com aceitável uso geral de recursos para os servidores que hospedam o conteúdo.

  • Agende rastreamentos incrementais para cada fonte de conteúdo durante horários quando os servidores que hospedam o conteúdo estão disponíveis, mas a demanda dos recursos do servidor são baixos.

  • Escalone cronogramas de rastreamento para que a carga nos servidores em seu farm é distribuída ao longo do tempo.

  • Agende rastreamentos completos com menos frequência.

  • Alterações de administração do cronograma que exigem um rastreamento completo para ocorrer logo antes do cronograma planejado de rastreamentos completos.

Você pode ajustar agendas após a implantação inicial com base no desempenho e capacidade dos servidores do farm e os servidores que hospedam o conteúdo.

Início da página

Planejar Considerações sobre rastreamento de SSPs

Depois de ter identificado fontes de conteúdo para planejar sua implantação inicial, considere a possibilidade de planejamento de SSP. As configurações para rastrear nas páginas de administração de serviços compartilhados para o SSP afetam o rastreamento de todas as fontes de conteúdo do SSP. Na maioria das organizações, apenas um SSP é usado para rastrear e todo o conteúdo da consulta para que essas configurações se aplicam a todas as fontes de conteúdo na organização.

Durante a implantação, você criará SSPs e, em seguida, criar fontes de conteúdo para cada SSP. Durante o planejamento, realmente pode ajudar a planejar fontes de conteúdo primeiro. Em pequeno número de casos onde SSPs adicionais são necessários, o planejamento de fontes de conteúdo pode ajudar a identificar a necessidade de vários SSPs. planejamento de fontes de conteúdo também ajuda a que identificar conteúdo que poderia se beneficiar com regras de rastreamento ou novos tipos de arquivo.

Configurações de SSP que afetam o conteúdo rastreado incluem:

  • Configurando a conta de acesso a conteúdo padrão.

  • Configurando regras de rastreamento para endereços de início específica usados por qualquer uma das suas fontes de conteúdo.

  • Incluindo tipos de arquivo.

Planejar a conta de acesso a conteúdo padrão

A conta de acesso a conteúdo padrão é a conta que é usada por padrão quando rastrear fontes de conteúdo. Esta conta está selecionada pelo administrador do SSP durante a configuração de pós-instalação. A conta de acesso padrão deve ter acesso de leitura a todo o conteúdo é rastreado ou o conteúdo não será rastreado e não estará disponível durante as consultas de pesquisa. Para sites individuais em uma fonte de conteúdo, você pode usar regras de rastreamento para usar uma conta de acesso diferente. A prática recomendada é selecionar uma conta de acesso a conteúdo padrão que tenha o acesso mais amplo para a maioria do conteúdo rastreado e use somente a outras contas de acesso quando considerações de segurança exigem contas separadas. Para cada fonte de conteúdo que você planeja, identifique o início endereços que não podem ser acessados pelo conteúdo padrão acessar a conta e planeja adicionar contas de acesso para aqueles endereços iniciais. Os administradores podem configurar contas de acesso adicionais nas regras de rastreamento para os endereços relevantes iniciar. Para obter mais informações sobre as considerações de planejamento para contas de acesso, consulte a seção a seguir sobre as regras de rastreamento.

Regras de rastreamento de plano

Regras de rastreamento são usadas para limitar o conteúdo rastreado por fontes de conteúdo para minimizar o uso de recursos do servidor e o tráfego de rede e para aumentar a relevância dos resultados da pesquisa. Regras de rastreamento simultaneamente aplicadas a todas as fontes de conteúdo. Criar regras de rastreamento para excluir um site específico ou local do rastreamento, para configurar como um determinado site é rastreado, ou para alterar a conta de rastreamento para ser diferente da conta padrão do acesso ao conteúdo.

Cada regra de rastreamento inclui uma URL ou um conjunto de URLs representado por caracteres curinga, uma inclusão ou exclusão regra e uma conta de rastreamento.

Você pode usar regras de exclusão para evitar o rastreamento conteúdo sem importância. Geralmente, a maioria do conteúdo para um endereço de site em particular é relevante, mas um subsite específico ou o intervalo de sites não está. Selecionando uma combinação com foco de endereços iniciais e regras de rastreamento de exclusão, administradores SSP podem maximizar o conteúdo rastreado minimizando o impacto no desempenho de rastreamento e o tamanho de bancos de dados de conteúdo. Regras de exclusão são particularmente úteis quando planejar endereços iniciais de conteúdo externo, onde o impacto sobre o uso do recurso não está sob o controle de pessoas em sua organização.

Você pode usar inclusão regras podem para incluir conteúdo de uma URL específica ou um intervalo de URLs, com opções para alterar como o conteúdo é rastreado. Qualquer combinação das três opções para regras de inclusão estão disponíveis:

  • Siga os links e não o conteúdo na URL para o endereço de início. Essa opção é útil para sites com links de conteúdo relevante quando a página que contém os links contém informações sem importância.

  • Rastrear URLs complexas. Esta opção rastreia URLs que contêm caracteres complexos. Dependendo do site, essas URLs podem ou não podem incluir o conteúdo relevante. Porque URLs complexas com frequência podem redirecionar para sites sem importância, é uma boa ideia apenas habilitar essa opção em sites onde o conteúdo disponível de URLs complexas é conhecido a ser relevantes.

  • Rastrear conteúdo nos sites do SharePoint como HTTP.

Independentemente se uma regra de rastreamento inclui ou exclui conteúdo, os administradores têm a opção de alterar a conta de rastreamento para a regra. A conta de acesso a conteúdo padrão é usada, a menos que outra conta é especificada em uma regra de rastreamento. O motivo principal para usar uma conta de rastreamento diferente para uma regra de rastreamento é que o conteúdo de conta de acesso não tem acesso a todas as padrão iniciar endereços. Para aqueles iniciar endereços, você pode criar uma regra de rastreamento e selecione uma conta que tenha acesso.

Uma prática recomendada para a implantação inicial é usar regras de rastreamento para foco conteúdo rastreado no que é mais relevante de acordo com os conceitos e processos de negócios que são mais relevantes para sua organização, conforme identificado na arquitetura de informações. Como rastrear conteúdo consome recursos e largura de banda, é melhor incluir uma quantidade menor de conteúdo que você sabe que é relevante que uma grande quantidade de conteúdo que pode ser sem importância. Após a implantação inicial, você pode revisar os logs de rastreamento e de consulta e ajustar fontes de conteúdo e regras para ser mais relevantes e incluir mais conteúdo de rastreamento.

Planejar inclusões de tipo de arquivo

Apenas o conteúdo é rastreado se a extensão de arquivo relevante é incluída na lista de inclusões de tipo de arquivo. Vários tipos de arquivo são incluídos automaticamente durante a instalação inicial. Quando você planeja para fontes de conteúdo na sua implantação inicial, é recomendável verificar se qualquer conteúdo principal usa tipos de arquivo que não estão incluídos. Em caso afirmativo, adicione esses tipos de conteúdo. Se determinados tipos de arquivo contém, principalmente, sem importância conteúdo, você pode decidir excluir a inclusão de tipo de arquivo para essa extensão, que excluirá nomes de arquivo que têm essa extensão de rastreamentos.

Quando você adicionar tipos de arquivo, você também deve garantir que você tenha um IFilter que pode ser usado para rastrear o tipo de arquivo. IFilters para vários tipos de arquivo estão disponíveis de fornecedores de terceiros, e se os desenvolvedores de software necessário podem criar IFilters para novos tipos de arquivo.

Início da página

Planejar Considerações de rastreamento para server farms

Além das configurações que estão configuradas no nível do SSP, várias configurações gerenciadas pelo afeta de administradores de farm de servidor como conteúda fontes são rastreadas. Considere estas configurações durante o planejamento de rastreamento.

Configurações de nível de farm que afetam rastreando incluem:

  • Configurações de pesquisa de nível de farm.

  • Regras de impacto do rastreador.

  • Serviços de farm.

  • Serviços para várias implantações de farm compartilhados.

Planejar configurações de pesquisa de nível de farm

Configurações de pesquisa de nível de farm incluem as seguintes configurações:

  • Endereço de email do contato

  • Configurações de proxy

  • Configurações de tempo limite

  • Configurações de SSL

O endereço de email do contato é o endereço da pessoa de contato sobre o impacto criado pelo rastreamento de fontes de conteúdo. Esse endereço aparece em logs para os administradores dos servidores que contém os endereços de início, para que os administradores podem contato com alguém se o impacto do rastreamento no desempenho e largura de banda é muito alto ou outros problemas ocorrem. O endereço de email do contato deve ser uma pessoa ou o alias bem monitorar com a disponibilidade e a experiência necessárias para responder rapidamente às solicitações. Independentemente se o conteúdo rastreado é armazenado internamente para a organização ou não, tempo de resposta rápida é importante.

Configurações de proxy incluem o servidor proxy para usar quando rastrear conteúdo. O servidor proxy para usar depende da topologia da sua implantação do SharePoint e a arquitetura de outros servidores em sua organização. As configurações de tempo limite são usadas para limitar o tempo que o servidor de pesquisa aguarda durante a conexão com outros serviços. As configurações de SSL determinam se o certificado SSL deve corresponder exatamente para rastrear conteúdo.

Planejar as regras de impacto do rastreador

Você pode usar regras de impacto do rastreador para gerenciar a carga nos servidores rastreadas. Regras de impacto do rastreador limitam a frequência de solicitação de documentos de um site durante o rastreamento ou quantos documentos você solicitação por vez.

Para conteúdo dentro de sua organização, é possível coordenar com administradores de outros sites para definir o impacto do rastreador regras com base no desempenho e capacidade dos servidores. Para sites mais externos, essa coordenação não é possível, portanto, a prática recomendada é rastrear muito pouco em vez de rastreamento muito e risco de perder o acesso para rastrear o conteúdo relevante.

Durante a implantação inicial, defina as regras de impacto do rastreador para tornar o menor impacto em outros servidores possível durante o rastreamento ainda suficiente conteúdo com frequência suficiente para fazer o rastreamento vale a pena.

Durante as operações, você pode ajustar o impacto do rastreador regras de acordo com suas experiências e dados de logs de rastreamento.

Planejar para várias implantações de farm de servidores

Organizações maiores geralmente planejar implantações com vários server farms com base em considerações de segurança ou de arquitetura. Por exemplo, uma organização pode usar um farm para produzir conteúdo e outro farm para publicação de conteúdo na internet. Outro exemplos incluede uma implantação geograficamente distribuída com farms para cada subsidiária principal ou um farm adicional para um projeto confidencial que deve ser mantido distinto de outros projetos.

Se você tiver mais de um farm, você precisará planejar para serviços como compartilhados são configurados entre farms. Na página Gerenciamento de aplicativo de Administração Central para cada farm, na seção de serviços compartilhados do Office SharePoint Server, você pode selecionar a opção para conceder ou configurar os serviços compartilhados entre farms. Você pode configurar cada farm para usar uma das três opções:

  • Não participam de serviços compartilhados entre farms    Farms usando essa opção não participar de serviços compartilhados entre farms e contam com os serviços compartilhados de um SSP no mesmo farm. Esta é a configuração típica para uma organização de pequena ou médio porte com uma implantação pequena usando um farm de servidores único.

  • Fornecer serviços compartilhados a outros farms    Farms fornecendo serviços a outros farms foram projetados para gerenciar serviços compartilhados entre farms em grandes organizações e geralmente têm uma maior capacidade de farms para divisões ou empresas menores.

  • Consume compartilhados serviços de outro farm    Farms que consumirem serviços compartilhados são normalmente divisões farms executando sites de portal divisões ou aplicativos de negócios em pequena escala. Esses farms também podem ter seus próprios SSPs, para que quando o SSP central não estiver disponível, eles podem usar os serviços disponíveis no farm local.

Início da página

Observação : Aviso de Isenção de Tradução Automática: Este artigo foi traduzido por computador, sem intervenção humana. A Microsoft oferece essas traduções automáticas para ajudar as pessoas que não falam inglês a aproveitar os textos escritos sobre produtos, serviços e tecnologias da Microsoft. Como este artigo foi traduzido automaticamente, é possível que contenha erros de vocabulário, sintaxe ou gramática.

Expanda suas habilidades
Explore o treinamento
Obtenha novos recursos primeiro
Ingressar no Office Insider

Essas informações foram úteis?

Obrigado por seus comentários!

Agradecemos pelos seus comentários! Parece que pode ser útil conectar você a um de nossos agentes de suporte do Office.

×