Elementi non indicizzati in ricerca contenuto in Office 365

Importante :  Il presente articolo è stato tradotto automaticamente, vedere la dichiarazione di non responsabilità. Per visualizzare la versione inglese dell'articolo, fare clic qui.

Una ricerca di contenuto che verrà eseguita automaticamente da Centro sicurezza e conformità di Office 365 include gli elementi non indicizzati nei risultati della ricerca stimato quando si esegue una ricerca. Gli elementi non indicizzati sono elementi della cassetta postale Exchange e documenti nei siti di SharePoint che per qualche motivo non sono stati indicizzati per la ricerca. In Exchange, un elemento non indicizzato contiene in genere un file, ovvero di un tipo di file che non può essere indicizzato, che è collegato a un messaggio di posta elettronica. Di seguito sono riportati alcuni motivi perché gli elementi non possono essere indicizzati per la ricerca e vengono restituiti come elementi non indicizzati quando si esegue una ricerca:

  • Il tipo di file non è supportato o l'indicizzazione per il tipo è disabilitata.

  • Il tipo di file è supportato per l'indicizzazione ma si è verificato un errore di indicizzazione per un file specifico.

  • A un messaggio di posta elettronica sono allegati troppi file.

  • Un file allegato a un messaggio di posta elettronica è troppo grande.

  • Un file è crittografato con tecnologie non Microsoft.

  • Un file è protetto da password.

Per le indagini legali, all'organizzazione potrebbe venire richiesto di esaminare gli elementi non indicizzati. È anche possibile specificare se includere elementi non indicizzati quando si esportano i risultati della ricerca in un computer locale o quando si preparano i risultati per un'ulteriore analisi con Office 365 Advanced eDiscovery.

Sommario

Tipi di file non indicizzati per la ricerca

Messaggi e documenti con tipi di file non indicizzati possono essere restituiti nei risultati della ricerca

Elementi non indicizzati inclusi nei risultati della ricerca

Elementi non indicizzati esclusi dai risultati della ricerca

Limiti di indicizzazione per i messaggi di ricerca contenuto

Ulteriori informazioni sugli elementi non indicizzati

Tipi di file non indicizzati per la ricerca

Alcuni tipi di file, ad esempio bitmap o file MP3, non includono contenuto che può essere indicizzato. Di conseguenza, i server di indicizzazione della ricerca Exchange e SharePoint non eseguono l'indicizzazione full-text in questi tipi di file. Questi tipi di file vengono considerati tipi di file non supportati. Ci sono anche tipi di file per i quali l'indicizzazione full-text è stata disabilitata, per impostazione predefinita o da un amministratore. I tipi di file non supportati e quelli per cui l'indicizzazione è stata disabilitata sono considerati elementi non indicizzati nelle ricerche contenuto. Come affermato in precedenza, gli elementi non indicizzati possono essere inclusi nel set di risultati quando si esegue una ricerca, si esportano i risultati della ricerca in un computer locale o si preparano i risultati della ricerca per Advanced eDiscovery.

Per un elenco dei formati di file supportati e disabilitati, vedere gli argomenti seguenti:

Inizio pagina

Possibilità di restituire messaggi e documenti con tipi di file non indicizzati nei risultati della ricerca

Non tutti i messaggi di posta elettronica con un file allegato non indicizzato o i documenti di SharePoint non indicizzati vengono restituiti automaticamente come elemento non indicizzato. Questo succede perché altre proprietà del messaggio o del documento, ad esempio la proprietà Subject nei messaggi di posta elettronica e la proprietà Title o Author per i documenti, sono indicizzate e disponibili per la ricerca. Se, ad esempio, si esegue la ricerca della parola chiave "finanziario", verranno restituiti elementi con un file allegato non indicizzato se la parola chiave è presente nell'oggetto di un messaggio di posta elettronica oppure nel nome file o nel titolo di un documento. Se tuttavia la parola chiave è presente solo nel corpo del file, il messaggio o il documento verrà restituito come elemento non indicizzato.

Analogamente, i messaggi con file allegati non indicizzati e documenti di un tipo di file non indicizzato sono inclusi nei risultati della ricerca quando altre proprietà del messaggio o del documento, indicizzate e disponibili per la ricerca, soddisfano i criteri di ricerca. Le proprietà dei messaggi indicizzate per la ricerca includono date di invio e ricezione, mittente e destinatario, nome file di un allegato e testo nel corpo del messaggio. Le proprietà dei documenti indicizzate per la ricerca includono le date di creazione e di modifica. Anche se un allegato di un messaggio può essere un elemento non indicizzato, il messaggio verrà quindi incluso nei normali risultati della ricerca se il valore di altre proprietà del documento o del messaggio soddisfa i criteri di ricerca.

Per un elenco di proprietà di posta elettronica e documenti che è possibile cercare usando la caratteristica di ricerca nel Centro sicurezza e conformità, vedere Query con parola chiave e condizioni di ricerca per Ricerca contenuto.

Inizio pagina

Elementi non indicizzati inclusi nei risultati della ricerca

L'organizzazione potrebbe essere necessario identificare ed eseguire ulteriori analisi sugli elementi non indicizzati per determinare quali sono, il tipo di contenuto e fanno i contenuti pertinenti per una specifica indagini. Come descritto in precedenza, gli elementi non indicizzati nelle posizioni contenute che vengono eseguita la ricerca vengono inclusi automaticamente con i risultati della ricerca stimata. Viene offerta la possibilità di includere questi elementi non indicizzati quando si esportano i risultati di ricerca o preparare i risultati della ricerca per Advanced eDiscovery. Per includere elementi non indicizzati quando si esportazione dei risultati di ricerca o loro preparazione di Advanced eDiscovery, selezionare una delle opzioni per includere elementi che hanno un formato non riconosciuto, vengono crittografati o non sono stati indicizzati per altri motivi.

Tenere presente quanto segue in relazione agli elementi non indicizzati:

  • Quando si esegue una ricerca di contenuto, il numero totale e le dimensioni degli elementi non indicizzati (restituiti dalla query di ricerca) vengono visualizzati nelle statistiche ricerca nel riquadro dei dettagli.

  • Quando si esportano i risultati della ricerca e si includono elementi non indicizzati, gli elementi di Exchange non indicizzati vengono esportati in un file PST distinto per ogni cassetta postale in cui si trovano o come singoli messaggi se si seleziona l'opzione per scaricare gli elementi di Exchange come messaggi. Gli elementi di SharePoint non indicizzati vengono esportati in una cartella denominata Uncrawlable.

  • Se la ricerca da cui si stanno esportando i risultati è stata eseguita in percorsi di contenuto specifici o in tutti i percorsi di contenuto all'interno dell'organizzazione, da questi percorsi verranno esportati solo gli elementi non indicizzati che contengono elementi che soddisfano i criteri di ricerca. In altre parole, se nella cassetta postale o nel sito non viene trovato alcun risultato della ricerca, non verrà esportato alcun elemento non indicizzato della cassetta postale o del sito. Il motivo è che l'esportazione di elementi non indicizzati da molti percorsi nell'organizzazione può aumentare la probabilità di errori di esportazione e prolungare in modo significativo le attività di esportazione e download dei risultati della ricerca.

    Per esportare gli elementi non indicizzati da tutti i percorsi di contenuto per una ricerca, configurare la ricerca in modo che restituisca tutti gli elementi (rimuovendo le parole chiave dalla query di ricerca) e quindi esportare solo gli elementi non indicizzati quando si esportano i risultati della ricerca (facendo clic su Solo elementi in formato non riconosciuto, crittografati o non indicizzati per altri motivi in Includi questi elementi della ricerca).

  • Se si sceglie di includere tutti gli elementi della cassetta postale nei risultati della ricerca, oppure se una query di ricerca non specifica parole chiave o specifica solo un intervallo di date, gli elementi non indicizzati potrebbero non venire copiati nel file PST contenente gli elementi non indicizzati. Questo si verifica perché tutti gli elementi, inclusi gli elementi non indicizzati, verranno inseriti automaticamente nei normali risultati della ricerca.

  • Gli elementi non indicizzati non sono disponibili per la visualizzazione in anteprima. È necessario esportare i risultati della ricerca per visualizzare gli elementi non indicizzati restituiti dalla ricerca.

Inizio pagina

Elementi non indicizzati esclusi dai risultati della ricerca

Se un elemento non è indicizzato ma non soddisfa i criteri della query di ricerca, non sarà incluso come elemento non indicizzato nei risultati della ricerca. In altre parole, l'elemento viene escluso dai risultati della ricerca. Si supponga, ad esempio, di eseguire una ricerca e non includere proprietà o parole chiave perché si vuole includere tutto il contenuto. Si include però un intervallo di date come condizione per la query. Se un elemento non indicizzato non rientra in tale intervallo di date, non sarà incluso come elemento non indicizzato. Gli intervalli di date rappresentano un modo efficace per escludere gli elementi non indicizzati dai risultati della ricerca.

Analogamente, se si sceglie di includere gli elementi non indicizzati quando si esportano i risultati della ricerca, gli elementi non indicizzati che sono stati esclusi dai risultati della ricerca non verranno esportati.

Un'eccezione a questa regola è quando si crea un'esenzione basate su query associato a un caso di eDiscovery. Se si crea un'esenzione basate su query, tutti non indicizzati gli elementi vengono inseriti in attesa. Sono inclusi gli elementi non indicizzati che non corrispondono ai criteri di query di ricerca e non indicizzati gli elementi che possono rientrare all'esterno di una condizione di intervallo di date. Per ulteriori informazioni sulla creazione basate su query contiene, vedere gestire casi di eDiscovery nella sicurezza di Office 365 e Allinea al centro conformità.

Limiti di indicizzazione per i messaggi di ricerca contenuto

Nella tabella seguente descrive i limiti di indicizzazione che potrebbero verificarsi in un messaggio di posta elettronica che viene restituito come un elemento non indicizzato o un elemento in una ricerca di contenuto in Office 365parzialmente indicizzato.

Per un elenco di indicizzazione limiti per i documenti di SharePoint , vedere limiti della ricerca per SharePoint Online.

Limite di indicizzazione

Valore massimo

Descrizione

Dimensioni massime degli allegati (esclusi i file di Excel)

150 MB

Dimensioni massime di un allegato di posta elettronica che verrà analizzato per l'indicizzazione. Un allegato che supera questo limite non verrà analizzato per l'indicizzazione e il messaggio che lo contiene verrà contrassegnato come non indicizzato.

Nota : L'analisi è il processo con il quale il servizio di indicizzazione estrae il testo dall'allegato, rimuove i caratteri non necessari, come la punteggiatura e gli spazi, e quindi divide il testo in parole (con un processo denominato tokenizzazione), che vengono quindi archiviate nell'indice.

Dimensione massime dei file di Excel

4 MB

Dimensione massime di un file di Excel in un sito o allegato a un messaggio di posta elettronica che verrà analizzato per l'indicizzazione. Un file di Excel che supera questo limite non verrà analizzato e il file o il messaggio a cui è allegato verrà contrassegnato come non indicizzato.

Numero massimo di allegati

250

Numero massimo di file allegati a un messaggio di posta elettronica che verranno analizzati per l'indicizzazione. Se un messaggio ha più di 250 allegati, vengono analizzati e indicizzati i primi 250 allegati e il messaggio viene contrassegnato come parzialmente indicizzato perché contiene allegati aggiuntivi che non sono stati analizzati.

Profondità massima degli allegati

30

Numero massimo di allegati annidati che vengono analizzati. Ad esempio, se a un messaggio di posta elettronica è allegato un altro messaggio e a quest'ultimo è allegato un documento di Word, vengono indicizzati sia il documento di Word che il messaggio allegato. Questo comportamento continuerà fino a un massimo di 30 allegati annidati.

Numero massimo di immagini allegate

0

Un'immagine allegata a un messaggio di posta elettronica viene ignorata dal parser e non viene indicizzata.

Tempo massimo per l'analisi di un elemento

30 secondi

L'analisi di un elemento per l'indicizzazione può durare al massimo 30 secondi. Se l'analisi si protrae per più di 30 secondi, l'elemento viene contrassegnato come parzialmente indicizzato.

Output parser massimo

2 milioni di caratteri

Quantità massima di output di testo del parser che viene indicizzato. Ad esempio, se il parser estrae 8 milioni di caratteri da un documento, vengono indicizzati solo i primi 2 milioni di caratteri.

Token di annotazione massimi

2 milioni

Quando un messaggio di posta elettronica è indicizzato, ogni parola viene annotata con specifiche istruzioni di elaborazione che determinano come deve essere indicizzata. Ogni set di istruzioni di elaborazione è detto token di annotazione. Per mantenere la qualità del servizio in Office 365, è previsto un limite di 2 milioni di token di annotazione per un messaggio di posta elettronica.

Dimensione massima del corpo nell'indice

67 milioni di caratteri

Il numero totale di caratteri nel corpo di un messaggio di posta elettronica e in tutti gli allegati. Quando un messaggio di posta elettronica è indicizzato, tutto il testo nel corpo del messaggio e in tutti gli allegati viene concatenato in un'unica stringa. La dimensione massima della stringa indicizzata è 67 milioni di caratteri.

Token univoci massimi nel corpo

1 milione

Come spiegato in precedenza, i token vengono ricavati estraendo il testo dal contenuto, rimuovendo punteggiatura e spazi e dividendolo in parole (denominate token) che vengono archiviate nell'indice. Ad esempio, la frase "cat, mouse, bird, dog, dog" contiene 5 token. Solo 4 di questi token, però, sono univoci. È previsto un limite di 1 milione di token univoci per messaggio di posta elettronica, per evitare che l'indice raggiunga dimensioni eccessive con token casuali.

Torna all'inizio

Altre informazioni sugli elementi non indicizzati

  • Come descritto in precedenza, perché le proprietà di documenti e messaggi e i metadati siano indicizzati, una ricerca di parole chiave potrebbe restituire risultati se viene visualizzata la parola chiave nei metadati indicizzati. Tuttavia, la ricerca di parole chiave stessa potrebbe non restituire lo stesso elemento se la parola chiave viene visualizzato solo il contenuto di un elemento a un tipo di file non supportati. In questo caso, vengono restituito l'elemento come elemento non indicizzato.

  • Se un elemento non indicizzato è incluso nei risultati della ricerca perché soddisfa i criteri della query di ricerca (e quindi non è stato escluso), non sarà incluso come elemento non indicizzato nelle statistiche di ricerca stimate. Non verrà inoltre incluso con gli elementi non indicizzati quando si esportano i risultati della ricerca.

  • Anche se un tipo di file supportato per l'indicizzazione e verrà indicizzato, possono essere presenti errori di indicizzazione o ricerca che causano un file devono essere restituiti come un elemento non indicizzato. Ad esempio, la ricerca di un file di Excel grandi potrebbe essere completata parzialmente (perché siano indicizzati i primi 4 MB), ma non riuscirà quindi perché è superato il limite di dimensioni file. In questo caso, è possibile che venga restituito lo stesso file con i risultati della ricerca e come elemento non indicizzato.

  • I file allegati crittografati con tecnologie Microsoft sono indicizzati e consentono le ricerche. I file crittografati con tecnologie non Microsoft non sono indicizzati.

  • I messaggi di posta elettronica crittografati con S/MIME non sono indicizzati. Sono inclusi i messaggi crittografati con o senza allegati.

  • I messaggi protetti con Information Rights Management (IRM) sono indicizzati e verranno inclusi nei risultati della ricerca se corrispondono alla query di ricerca.

Inizio pagina

Nota : Dichiarazione di non responsabilità per la traduzione automatica: Il presente articolo è stato tradotto tramite un software di traduzione automatica e non da una persona. Microsoft offre le traduzioni automatiche per consentire a coloro che non conoscono la lingua inglese di leggere gli articoli sui prodotti, sui servizi e sulle tecnologie Microsoft. Dal momento che l'articolo è stato tradotto automaticamente, potrebbe contenere errori di sintassi, di grammatica o di utilizzo dei vocaboli.

Amplia le tue competenze
Esplora i corsi di formazione
Ottieni in anticipo le nuove caratteristiche
Partecipa al programma Office Insider

Queste informazioni sono risultate utili?

Grazie per i tuoi commenti e suggerimenti

Grazie per il tuo feedback! Potrebbe essere utile metterti in contatto con uno dei nostri operatori del supporto di Office.

×