Investigating partially indexed items in Office 365 eDiscovery

Nota:  Riteniamo importante fornire il contenuto della Guida più recente non appena possibile, nella lingua dell'utente. Questa pagina è stata tradotta automaticamente e potrebbe contenere errori di grammatica o imprecisioni. L'intento è quello di rendere fruibile il contenuto. Nella parte inferiore della pagina è possibile indicare se le informazioni sono risultate utili. Questo è l' articolo in lingua inglese per riferimento.

Una ricerca di contenuto che verrà eseguita automaticamente da Centro sicurezza e conformità di Office 365 include gli elementi parzialmente indicizzati nei risultati della ricerca stimato quando si esegue una ricerca. Parzialmente indicizzata elementi sono elementi della cassetta postale Exchange e documenti nei siti SharePoint e OneDrive for Business che per qualche motivo non sono state indicizzazione completa per la ricerca. La maggior parte dei messaggi di posta elettronica e i documenti del sito vengono indicizzati correttamente perché rientrano l' indicizzazione limiti per Office 365. Tuttavia, alcuni elementi possono superare i limiti di indicizzazione e verranno parzialmente indicizzate. Ecco altri motivi perché gli elementi non possono essere indicizzati per la ricerca e vengono restituiti come elementi parzialmente indicizzati quando si esegue una ricerca di contenuto:

  • Messaggi di posta elettronica dispongono di un file allegato di un tipo di file che non può essere indicizzato; Nella maggior parte dei casi, il tipo di file è sconosciuto o non supportata per l'indicizzazione

  • I messaggi hanno un file allegato senza un gestore valido, ad esempio file di immagine. si tratta probabilmente di elementi di posta elettronica parzialmente indicizzata

  • Troppi file allegati a un messaggio di posta elettronica

  • Un file allegato a un messaggio di posta elettronica è troppo grande

  • Il tipo di file è supportato per l'indicizzazione ma si è verificato un errore di indicizzazione per un file specifico

Sebbene varia, la maggior parte dei Office 365 organizzazioni hanno meno dell'1% di contenuto, volume e inferiore a 12% di contenuto per dimensioni parzialmente indicizzata. Il motivo per cui la differenza tra il volume e dimensioni è dispongano di un file di dimensioni maggiori probabilità di contenuto che non possono essere indicizzate completamente.

Perché modifica il numero di elementi parzialmente indicizzata per una ricerca?

Dopo aver eseguito una ricerca di contenuto in Centro sicurezza e conformità di Office 365, il numero totale e le dimensioni degli elementi parzialmente indicizzati nelle posizioni in cui sono stati ricercati sono elencate nelle statistiche di risultati di ricerca che vengono visualizzate in statistiche dettagliate per la ricerca. Nota che detti elementi non indicizzati nelle statistiche di ricerca. Ecco alcuni aspetti che vengono influenzata dal numero di elementi parzialmente indicizzati restituiti nei risultati della ricerca:

  • Se un elemento parzialmente indicizzato e trova le corrispondenze la query di ricerca, viene incluso il conteggio (e dimensioni) di voci dei risultati di ricerca e gli elementi parzialmente indicizzati. Tuttavia, quando vengono esportati i risultati della ricerca stessa, l'elemento è incluso solo set di risultati della ricerca; non è incluso come elemento parzialmente indicizzato.

  • Se si specifica un intervallo di date per una query di ricerca (mediante inserendolo nella query parola chiave) o una condizione, qualsiasi elemento parzialmente indicizzata che non corrisponda all'intervallo di date non include il numero di elementi parzialmente indicizzati. Solo gli elementi parzialmente indicizzati che rientrano nell'intervallo di date sono inclusi nel calcolo del numero di elementi parzialmente indicizzati.

Nota: Parzialmente indicizzata elementi presenti in SharePoint e OneDrive siti non sono incluse nella stima degli elementi parzialmente indicizzati che viene visualizzata in statistiche dettagliate per la ricerca. Tuttavia, è possono esportare elementi parzialmente indicizzati quando si esportano i risultati della ricerca contenuto. Ad esempio, se la ricerca solo siti di una ricerca di contenuto, il numero stimato parzialmente indicizzati elementi sarà zero.

Calcolare il rapporto tra gli elementi parzialmente indicizzati all'interno dell'organizzazione

Per comprendere esposizione dell'organizzazione per gli elementi parzialmente indicizzati, è possibile eseguire una ricerca per tutto il contenuto in tutte le cassette postali (utilizzando una query con parole chiave vuoto). Nell'esempio seguente riportata di seguito, esistono 56,208 (4,830 MB) indicizzato completamente gli elementi e 470 (316 MB) parzialmente indicizzata elementi.

Example of search statistics showing partially indexed items

È possibile determinare la percentuale di articoli parzialmente indicizzate utilizzando i calcoli seguenti.

Per calcolare il rapporto tra gli elementi parzialmente indicizzati all'interno dell'organizzazione:

(Total number of partially indexed items/Total number of items) x 100
(470/56,208) x 100 = 0.84%

Usando i risultati della ricerca dell'esempio precedente. 84% di tutti gli elementi delle cassette postali sono parzialmente indicizzata.

Per calcolare la percentuale delle dimensioni della parzialmente indicizzati elementi all'interno dell'organizzazione:

(Size of all partially indexed items/Size of all items) x 100
(316 MB/4830 MB) x 100 = 6.54%

Nell'esempio precedente, in modo 6,54. % della dimensione totale di elementi della cassetta postale sono dagli elementi parzialmente indicizzati. Come già specificato, la maggior parte delle organizzazioni Office 365 hanno meno dell'1% di contenuto, volume e inferiore a 12% di contenuto per dimensioni parzialmente indicizzata.

Utilizzo di parzialmente indicizzata elementi

In casi quando è necessario esaminare parzialmente gli elementi per convalidare che non contengono informazioni rilevanti, è possibile esportare un report di ricerca contenuto che contiene informazioni sugli elementi parzialmente indicizzati. Quando si esporta una relazione di ricerca di contenuto, assicurarsi di selezionare una delle opzioni di esportazione che include gli elementi parzialmente indicizzati.

Choose the second or third option to export partially indexed items

Quando si esporta i risultati di ricerca del contenuto o un report di ricerca contenuto utilizzando una di queste opzioni, l'esportazione include un report denominato Items.csv non indicizzati. Il report include la maggior parte delle stesse informazioni come file ResultsLog.csv. Tuttavia, il file non indicizzati Items.csv include due campi correlati a elementi parzialmente indicizzati: Errore tag e Le proprietà di errore. Questi campi contengono informazioni sull'errore indicizzazione per ogni elemento parzialmente indicizzata. Con le informazioni in questi due campi consentono di determinare se l'errore indicizzazione per un particolare influisce l'analisi. In caso affermativo, è possibile eseguire una ricerca di contenuto target e recuperare ed esportare i messaggi di posta elettronica specifico e SharePoint o OneDrive documenti in modo che è possibile esaminare in modo da verificare se sono i contenuti pertinenti per l'analisi. Per istruzioni dettagliate, vedere preparare un file CSV per una ricerca di contenuto target in Office 365.

Nota: Il file non indicizzati Items.csv contiene anche campi denominati Tipo di errore e Messaggio di errore. Si tratta legacy campi che contengono informazioni simili alle informazioni nei campi Errore tag e Le proprietà di errore , ma con informazioni meno dettagliate. È possibile ignorare questi campi legacy.

Errori relativi agli elementi parzialmente indicizzati

Tag di errore sono costituiti da due elementi di informazioni, l'errore e il tipo di file. Ad esempio, in questa coppia di errore/tipo di file:

 parseroutputsize_xls

parseroutputsize è l'errore e xls è il tipo di file del file di cui che si è verificato l'errore. In casi utilizzato il tipo di file non è stato riconosciuto o il tipo di file non si applica a errori, verrà visualizzato il valore noformat al posto del tipo di file.

Di seguito è un elenco di indicizzazione errori e una descrizione delle possibili cause dell'errore.

Contrassegno di errore

Descrizione

attachmentcount

Un messaggio di posta elettronica ha troppi allegati e alcuni di questi allegati non sono state elaborate.

attachmentdepth

Il contenuto parser proiettore e documento trovata troppi livelli di allegati nidificati in altri allegati. Alcuni di questi allegati non sono stati elaborati.

attachmentrms

Allegato Impossibile decodificare perché non è stato protetto RMS.

attachmentsize

Un file allegato a un messaggio di posta elettronica è troppo grande e non può essere elaborato.

indexingtruncated

Quando si scrive il messaggio di posta elettronica elaborati per l'indice, le proprietà indicizzabile è troppo grande e troncata. Proprietà troncate sono elencate nel campo di proprietà di errore.

invalidunicode

Un messaggio di posta elettronica contiene testo che non può essere elaborato come Unicode valido. L'indicizzazione per questa voce potrebbe essere incompleto.

parserencrypted

Il contenuto dell'allegato o messaggio di posta elettronica verrà crittografato e Office 365 non riuscita decodificare il contenuto.

parsererror

Si è verificato un errore sconosciuto durante l'analisi. I risultati in genere da un bug software o un arresto anomalo del servizio.

parserinputsize

Un allegato è troppo grande per il parser per la gestione e l'analisi di tale allegato non viene eseguita o non è stata completata.

parsermalformed

Un allegato non valido e non è stato gestito dal parser. Questo risultato dal file precedente può formati, i file creati da software incompatibile o virus FALSO diversa richiesto.

parseroutputsize

L'output di analisi di un allegato è troppo grande e doveva essere troncati.

parserunknowntype

Allegato aveva un tipo di file non è stato rilevato che Office 365.

parserunsupportedtype

Un allegato è stato un tipo di file Office 365 è stato possibile rilevare, ma il tipo di file di analisi non è supportato.

propertytoobig

Il valore di una proprietà di posta elettronica Exchange Store è troppo grande per essere recuperati e non può essere elaborato il messaggio. Questa operazione in genere si verifica solo alla proprietà del corpo di un messaggio di posta elettronica.

retrieverrms

Il contenuto proiettore Impossibile decodificare un messaggio protetto con RMS.

wordbreakertruncated

Troppe parole sono state identificate nel documento durante l'indicizzazione. Elaborazione della proprietà interrotta quando raggiunto il limite e la proprietà viene troncata.

Campi errore descrivono i campi sono interessati dall'errore di elaborazione elencata nel campo errore tag. Per cercare una proprietà, ad esempio subject o participants, gli errori nel corpo del messaggio non è possibile avere un impatto i risultati della ricerca. Può essere utile per determinare esattamente quali elementi parzialmente indicizzate può essere necessario eseguire ulteriori analisi.

Utilizzo di uno script di PowerShell per determinare esposizione dell'organizzazione per gli elementi di posta elettronica parzialmente indicizzata

La procedura seguente viene illustrato come eseguire uno script di PowerShell che consente di cercare tutti gli elementi di tutte le cassette postali Exchange, genera un report sul rapporto dell'organizzazione degli elementi di posta elettronica parzialmente indicizzata (a cura conteggio e dalle dimensioni) e visualizza il numero di elementi (e il tipo di file) per ogni errore di indicizzazione che si verifica. Utilizzare le descrizioni dei tag di errore nella sezione precedente per identificare l'errore di indicizzazione.

  1. Salvare il testo seguente in un file di script Windows PowerShell utilizzando nomefile suffisso ps1; ad esempio PartiallyIndexedItems.ps1.

    write-host "**************************************************"
    write-host "     Office 365 Security & Compliance Center      " -foregroundColor yellow -backgroundcolor darkgreen
    write-host "   eDiscovery Partially Indexed Item Statistics   " -foregroundColor yellow -backgroundcolor darkgreen
    write-host "**************************************************"
    " " 
    
    # Create a search with Error Tags Refinders enabled
    Remove-ComplianceSearch "RefinerTest" -Confirm:$false -ErrorAction 'SilentlyContinue'
    New-ComplianceSearch -Name "RefinerTest" -ContentMatchQuery "size>0" -RefinerNames ErrorTags -ExchangeLocation ALL
    Start-ComplianceSearch "RefinerTest"
    # Loop while search is in progress
    do{
        Write-host "Waiting for search to complete..."
        Start-Sleep -s 5
        $complianceSearch = Get-ComplianceSearch "RefinerTest"
    }while ($complianceSearch.Status -ne 'Completed')
    
    $refiners = $complianceSearch.Refiners | ConvertFrom-Json
    $errorTagProperties = $refiners.Entries | Get-Member -MemberType NoteProperty
    
    $partiallyIndexedRatio = $complianceSearch.UnindexedItems / $complianceSearch.Items
    $partiallyIndexedSizeRatio = $complianceSearch.UnindexedSize / $complianceSearch.Size
    
    " "
    "===== Partially indexed items ====="
    "         Total          Ratio"
    "Count    {0:N0}{1:P2}" -f $complianceSearch.Items.ToString("N0").PadRight(15, " "), $partiallyIndexedRatio
    "Size(GB) {0:N2}{1:P2}" -f ($complianceSearch.Size / 1GB).ToString("N2").PadRight(15, " "), $partiallyIndexedSizeRatio
    
    " "
    Write-Host ===== Reasons for partially indexed items =====
    foreach($errorTagProperty in $errorTagProperties)
    {
        $name = $refiners.Entries.($errorTagProperty.Name).Name
        $count = $refiners.Entries.($errorTagProperty.Name).TotalCount
    
        $frag = $name.Split("{_}")
    
        $errorTag = $frag[0]
        $fileType = $frag[1]
    
        if ($errorTag -ne $lastErrorTag)
        {
            $errorTag
        }
        "    " + $fileType + " => " + $count
        $lastErrorTag = $errorTag
    }
    
  2. Connettersi a sicurezza di Office 365 e sessione PowerShell centro conformità.

  3. In Centro sicurezza e conformità PowerShell, passare alla cartella in cui lo script è stato salvato nel passaggio 1 e quindi eseguire lo script; Per esempio:

    .\PartiallyIndexedItems.ps1

Ecco un esempio fo output restituito dallo script.

Example of output from script that generates a report on your organization's exposure to partially indexed email items

Tieni presente quanto segue:

  1. Il numero totale e le dimensioni degli elementi di posta elettronica e rapporto dell'organizzazione degli elementi di posta elettronica parzialmente indicizzata (dal conteggio e la dimensione)

  2. Un tag dell'elenco di errore e i corrispondenti tipi di file per cui si è verificato l'errore.

Torna all'inizio

Argomenti correlati

Parzialmente indicizzati elementi nella ricerca contenuto in Office 365

Amplia le tue competenze su Office
Esplora i corsi di formazione
Ottieni in anticipo le nuove caratteristiche
Partecipa al programma Office Insider

Queste informazioni sono risultate utili?

Grazie per il feedback!

Grazie per il tuo feedback! Potrebbe essere utile metterti in contatto con uno dei nostri operatori del supporto di Office.

×