Conseils pour la recherche


Langage de requête

Vous pouvez rechercher n'importe quel mot ou groupe de mots dans un site Web en tapant ce mot ou groupe de mots dans un formulaire de requête et en cliquant sur le bouton qui déclenche l'exécution de la requête (par exemple le bouton Execute dans l'exemple de formulaire de requête fourni). Cette section traite des sujets suivants :

Les recherches produisent une liste de fichiers contenant le mot ou le groupe de mots spécifié, quel que soit son emplacement dans le texte. Cette liste fournit les règles de formulation des requêtes :

Opérateurs booléens et de proximité

Les opérateurs booléens et de proximité permettent de créer des requêtes plus précises.

Pour rechercher Exemple Résultats
Deux termes présents dans la même page accès et base
Ou
accès & base
Pages contenant les deux mots « accès » et « base »
L'un ou l'autre de deux termes dans une page cgi ou isapi
Ou
cgi | isapi
Pages contenant le mot « cgi » ou « isapi »
Le premier terme sans le second dans une page accès et sans base
Ou
accès & ! base
Pages contenant le mot « accès » mais pas le mot « base »
Les pages ne correspondant pas à la valeur d'une propriété not @size = 100
Ou
! @size = 100
Pages qui ne font pas 100 octets
Deux termes dans la même page, à proximité l'un de l'autre excel près project
Ou
excel ~ project
Pages contenant le mot « excel » près du mot « project »

Conseils :

Remarque   Les symboles (&, |, !, ~) et les mots clés ET, OU, SANS et PRES fonctionnent de la même façon avec toutes les langues prises en charge par Index Server. Les mots clés localisés sont également disponibles lorsque le jeu de paramètres régionaux du navigateur a pour valeur l'une des six langues suivantes :

Langue Mots clés
Allemand UND, ODER, NICHT, NAH
Français ET, OU, SANS, PRES
Espagnol Y, O, NO, CERCA
Néerlandais EN, OF, NIET, NABIJ
Suédois OCH, ELLER, INTE, NÄRA
ItalienE, O, NO, VICINO

Remarque   L'opérateur PRES ne peut être appliqué qu'à des mots ou groupes de mots.

Caractères génériques

Les opérateurs génériques vous aident à trouver des pages contenant des mots similaires à un mot donné.

Pour rechercher Exemple Résultats
Des mots commençant par le même préfixe compt* Pages contenant des mots commençant par « compt », comme « compter », « comptoir », etc.
Des mots de même racine boir** Pages contenant des mots dérivés de la même racine que « boir », comme « boire », « buvions », « bu », etc.

Requêtes en texte libre

Le moteur de recherche trouve des pages qui correspondent le mieux aux mots et aux groupes de mots d'une requête en texte libre. Cela se fait en trouvant automatiquement des pages qui correspondent à la signification, plutôt qu'au libellé exact, de la requête. Les opérateurs booléens, de proximité et génériques ne sont pas pris en compte dans une requête en texte libre. Les requêtes en texte libre sont préfixées par $contents.

Pour rechercher Exemple Résultats
Des fichiers contenant le texte de la requête $contents comment imprimer dans Microsoft Excel ? Pages qui traitent de l'impression et de Microsoft Excel.

Requêtes d'espace vectoriel

Le moteur de recherche prend en charge les requêtes d'espace vectoriel. Les requêtes d'espace vectoriel renvoient des pages qui correspondent à une liste de mots et de groupes de mots. Le classement de chaque page indique le degré de correspondance par rapport à la requête.

Pour rechercher Exemple Résultats
Des pages contenant des mots spécifiques ampoule, électrique Fichiers contenant les mots les plus proches des mots recherchés
Des pages contenant des préfixes, des mots et des groupes de mots pondérés invent*, ampoule[50], électrique[10], "ampoule électrique"[400] Fichiers contenant des mots commençant par « invent », les mots « ampoule », « électrique » et le groupe de mots « ampoule électrique » (les termes sont pondérés)

 

Requêtes des valeurs de propriété

Les requêtes portant sur les valeurs de propriété permettent de trouver des fichiers dont les valeurs de propriété répondent à un critère donné. Les propriétés que vous pouvez ainsi interroger concernent des informations élémentaires sur les fichiers, par exemple le nom et la taille de fichier, mais aussi des propriétés ActiveX telles que le résumé du document qui est stocké dans les fichiers créés par des applications compatibles ActiveX.

Il existe deux types de requêtes de propriété :

Cette section traite des sujets suivants :

Noms de propriétés

Les noms de propriétés commencent par le signe @ ou le signe #. Utilisez @ pour les requêtes relationnelles et # pour les requêtes sur expression régulière.

Si aucun nom de propriété n'est spécifié, c'est la propriété @contents qui est prise en compte.

Propriétés communes à tous les fichiers :

Nom de propriété Description
All Permet de rechercher des mots, des groupes de mots et toutes les propriétés.
Contents Mots et groupes de mots contenus dans le fichier
Filename Nom du fichier
Size Taille du fichier
Write Date de la dernière modification du fichier

Il est également possible d'utiliser dans des requêtes les valeurs de propriétés ActiveX. Les sites Web contenant des fichiers créés avec la plupart des applications compatibles ActiveX peuvent être interrogés sur les propriétés suivantes :

Nom de propriété Description
DocTitle Titre du document
DocSubject Sujet du document
DocAuthor Auteur du document
DocKeywords Mots clés du document
DocComments Commentaires sur le document

Pour obtenir la liste complète des noms de propriétés, consultez Liste des noms de propriétés, plus loin dans cette page.

Opérateurs de relation

Les opérateurs de relation sont utilisés dans les requêtes de propriété relationnelles.

Pour rechercher Exemple Résultats
Les valeurs de propriété par rapport à une valeur fixe @size < 100
@size <= 100
@size = 100
@size != 100
@size >= 100
@size > 100
Fichiers dont la taille répond à la requête
Les valeurs de propriété dont tous les bits sont activés @attrib ^a 0x820 Fichiers compressés dont le bit d'archivage est activé
Les valeurs de propriété dont certains bits sont activés @attrib ^s 0x20 Fichiers dont le bit d'archivage est activé

Valeurs des propriétés

Pour rechercher Exemple Résultats
Une valeur précise @DocAuthor = Bernard Guyot Fichiers dont l'auteur est « Bernard Guyot »
Des valeurs commençant par un préfixe donné #DocAuthor George* Fichiers dont la propriété DocAuthor commence par « George »
Des fichiers présentant certaines extensions #filename *.|(exe|,dll|,sys|) Fichiers dont le nom est doté de l'extension .exe, .dll ou .sys
Des fichiers modifiés après une date donnée @write > 96/2/14 10:00:00 Fichiers modifiés après le 14 février 1996 à 10:00 GMT
Des fichiers modifiés après une date relative @write > -1d2h Fichiers modifiés au cours des dernières 26 heures
Des vecteurs qui correspondent à un vecteur donné @vectorprop = { 10, 15, 20 } Documents ActiveX dont la propriété vectorprop a la valeur { 10, 15, 20 }
Des vecteurs dont chaque valeur satisfait à un critère donné @vectorprop >^a 15 Documents ActiveX dont la propriété vectorprop est un vecteur dont toutes les valeurs sont supérieures à 15
Vecteurs dont une valeur au moins satisfait à un critère @vectorprop =^s 15 Documents ActiveX dont la propriété vectorprop est un vecteur dont au moins une valeur est égale à 15

 

Expressions régulières

Dans les requêtes de propriétés, les expressions régulières sont définies comme suit :

Exemples de requêtes

Exemple Résultats
@size > 1000000 Pages d'une taille supérieure à un million d'octets
@write > 95/12/23 Pages modifiées après la date spécifiée
tarte aux pommes Pages contenant le groupe de mots « tarte aux pommes »
"tarte aux pommes" Exemple identique au précédent
@contents tarte aux pommes Exemple identique au précédent
Microsoft et @size > 1000000 Pages contenant le mot « Microsoft » et dont la taille est supérieure à un million d'octets
"microsoft et @size > 1000000" Pages contenant le groupe de mots littéral spécifié (exemple différent du précédent)
#filename *.avi Fichiers vidéo (le préfixe # est utilisé, car la requête contient une expression régulière)
@attrib ^s 32 Pages où l'attribut archive est activé
@docauthor = Clément Beaune Pages rédigées par l'auteur spécifié
$contents pourquoi le ciel est-il bleu ? Pages répondant à la requête
@size < 100 & #filename *.gif Fichiers GIF (Graphics Interchange Format) dont la taille est inférieure à 100 octets

Liste des noms de propriétés

Les propriétés suivantes sont toujours acceptées dans les requêtes. Il est possible que d'autres propriétés soient également disponibles, en fonction de la configuration du serveur Web.

Nom complet Type de données Propriété
A_HRef DBTYPE_WSTR | DBTYPE_BYREF Texte de HTML HREF. Ce nom de propriété a été créé pour Microsoft® Site Server et correspond au nom de propriété HtmlHRef d'Index Server. Peut faire l'objet d'une requête, mais pas d'une extraction.
Access VT_FILETIME Date/heure du dernier accès au fichier.
All(sans objet) Recherche une chaîne dans toutes les propriétés. Peut faire l'objet d'une requête, mais pas d'une extraction.
AllocSizeDBTYPE_I8 Espace disque alloué au fichier.
AttribDBTYPE_UI4 Attributs de fichier. Voir le Kit de développement Win32 (SDK).
ClassIdDBTYPE_GUID ID de classe d'un objet, par exemple WordPerfect, Word, etc.
CharacterizationDBTYPE_WSTR | DBTYPE_BYREF Caractérisation ou descriptif du document. Calculée par Index Server.
Contents(sans objet) Principal contenu d'un fichier. Peut faire l'objet d'une requête, mais pas d'une extraction.
CreateVT_FILETIME Date/heure de création du fichier.
DirectoryDBTYPE_WSTR | DBTYPE_BYREF Chemin d'accès physique du fichier, nom de fichier non compris.
DocAppNameDBTYPE_WSTR | DBTYPE_BYREF Nom de l'application dans laquelle le fichier a été créé.
DocAuthorDBTYPE_WSTR | DBTYPE_BYREF Auteur du document.
DocByteCountDBTYPE_14Nombre d'octets dans un document.
DocCategoryDBTYPE_STR | DBTYPE_BYREFType de document, par exemple un mémo, un agenda ou un livre blanc.
DocCharCountDBTYPE_I4 Nombre de caractères dans le document.
DocCommentsDBTYPE_WSTR | DBTYPE_BYREF Commentaires sur le document.
DocCompanyDBTYPE_STR | DBTYPE_BYREFNom de la société pour laquelle le document a été rédigé.
DocCreatedTmVT_FILETIME Heure à laquelle le document a été créé.
DocEditTimeVT_FILETIME Durée totale passée à modifier le document.
DocHiddenCountDBTYPE_14Nombre de diapositives masquées dans un document Microsoft® PowerPoint.
DocKeywordsDBTYPE_WSTR | DBTYPE_BYREF Mots clés d'un document.
DocLastAuthorDBTYPE_WSTR | DBTYPE_BYREF Dernier utilisateur ayant modifié le document.
DocLastPrintedVT_FILETIME Date de dernière impression du document.
DocLastSavedTmVT_FILETIME Date/heure à laquelle le document a été enregistré pour la dernière fois.
DocLineCountDBTYPE_14Nombre de lignes contenues dans un document.
DocManagerDBTYPE_STR | DBTYPE_BYREFNom du responsable dont dépend l'auteur du document.
DocNoteCountDBTYPE_14Nombre de pages avec commentaires dans un document PowerPoint.
DocPageCountDBTYPE_I4 Nombre de pages dans un document.
DocParaCountDBTYPE_14Nombre de paragraphes dans un document.
DocPartTitlesDBTYPE_STR | DBTYPE_VECTORNoms des sections du document. Dans le cas d'un document Microsoft Excel, il s'agit du nom des feuilles de calcul ; dans le cas d'un document PowerPoint, du titre des diapositives ; dans le cas d'un document Word pour Windows, du nom des documents mentionnés dans le document maître.
DocPresentationTargetDBTYPE_STR|DBTYPE_BYREFFormat cible (35mm, imprimante, vidéo, etc.) d'une présentation dans PowerPoint.
DocRevNumberDBTYPE_WSTR | DBTYPE_BYREF Numéro de la version actuelle du document.
DocSlideCountDBTYPE_14Nombre de diapositives dans un document PowerPoint.
DocSubjectDBTYPE_WSTR | DBTYPE_BYREF Sujet du document.
DocTemplateDBTYPE_WSTR | DBTYPE_BYREF Nom du modèle associé au document.
DocTitleDBTYPE_WSTR | DBTYPE_BYREF Titre du document.
DocWordCountDBTYPE_I4 Nombre de mots dans un document.
FileIndexDBTYPE_I8 ID unique du fichier.
FileNameDBTYPE_WSTR | DBTYPE_BYREF Nom du fichier.
HitCountDBTYPE_I4 Nombre de correspondances (mots répondant à la requête) trouvées dans le fichier.
HtmlHRefDBTYPE_WSTR | DBTYPE_BYREF Texte de HTML HREF. Peut faire l'objet d'une requête, mais pas d'une extraction.
HtmlHeading1DBTYPE_WSTR | DBTYPE_BYREF Texte du document HTML en style H1. Peut faire l'objet d'une requête, mais pas d'une extraction.
HtmlHeading2DBTYPE_WSTR | DBTYPE_BYREF Texte du document HTML en style H2. Peut faire l'objet d'une requête, mais pas d'une extraction.
HtmlHeading3DBTYPE_WSTR | DBTYPE_BYREF Texte du document HTML en style H3. Peut faire l'objet d'une requête, mais pas d'une extraction.
HtmlHeading4DBTYPE_WSTR | DBTYPE_BYREF Texte du document HTML en style H4. Peut faire l'objet d'une requête, mais pas d'une extraction.
HtmlHeading5DBTYPE_WSTR | DBTYPE_BYREF Texte du document HTML en style H5. Peut faire l'objet d'une requête, mais pas d'une extraction.
HtmlHeading6DBTYPE_WSTR | DBTYPE_BYREF Texte du document HTML en style H6. Peut faire l'objet d'une requête, mais pas d'une extraction.
Img_Alt DBTYPE_WSTR | DBTYPE_BYREF Texte de substitution pour les balises <IMG>. Peut faire l'objet d'une requête, mais pas d'une extraction.
PathDBTYPE_WSTR | DBTYPE_BYREF Chemin d'accès physique complet d'un fichier, nom de fichier compris.
RankDBTYPE_I4 Rang de la ligne, compris entre 0 et 1000. Plus les valeurs sont élevées, plus les correspondances sont exactes.
RankVectorDBTYPE_I4 | DBTYPE_VECTOR Rangs des différents composants d'une requête vectorielle.
ShortFileNameDBTYPE_WSTR | DBTYPE_BYREF Nom de fichier court (format 8.3).
SizeDBTYPE_I8 Taille du fichier, exprimée en octets.
USNDBTYPE_I8 Numéro USN (Update Sequence Number). Lecteurs NTFS uniquement.
VPathDBTYPE_WSTR | DBTYPE_BYREF Chemin d'accès virtuel complet d'un fichier, nom de fichier compris. S'il existe plusieurs chemins possibles, celui qui correspond le plus exactement à la requête est retenu
WorkIdDBTYPE_I4 ID interne du fichier. Utilisé avec Index Server.
WriteVT_FILETIME Date/heure de la dernière opération d'écriture dans le fichier.

Définition de nouveaux noms de propriétés

Pour définir des propriétés qui ne figurent pas dans la liste précédente, vous devez répertorier chacune d'entre elles dans une section [Names] du fichier .idq. Pour utiliser ces propriétés dans une restriction de requête ou une spécification de tri, ou encore comme colonne extraite, vous devez les définir dans le fichier .idq en respectant le format suivant :

[Names]
#Propriétés ne figurant pas dans la liste standard
Propertyname ( Datatype ) = GUID

Dans la syntaxe, "Name" est le nom de propriété ("Ventes" dans l'exemple suivant), et propid est l'ID de propriété au format hexadécimal. Notez au passage que vous devez placer entre guillemets le nom complet, mais pas l'ID de propriété.

Par exemple, supposons que vous souhaitiez définir une balise meta HTML en tant que nom de propriété pouvant faire l'objet d'une recherche. La propriété que vous définissez se nomme donc Ventes.

Pour définir la propriété Ventes

  1. Dans la section [Names] du fichier .idq, ajoutez la ligne suivante :
  2. MetaDescription(DBTYPE_WSTR) = d1b5d3f0-c0b3-11cf-9a92-00a0c908dbf1 "Ventes"

    Le numéro d'identification GUID découle du paramètre de registre MetaTagClsid qui se trouve à l'emplacement suivant :

    HKEY_LOCAL_MACHINE
    \SYSTEM
     \CurrentControlSet
      \Control
       \HtmlFilter
        \MetaTagClsid
  3. Ensuite, dans les fichiers HTML où vous souhaitez insérer la balise, définissez la méta-description.
  4. Par exemple, si vous recherchez tous les fichiers qui fournissent des prévisions de ventes pour les années à venir :

    Dans Fichier1.htm:

    <META NAME="Ventes" CONTENT="Prévisions pour 1998">

    Dans Fichier2.htm:

    <META NAME="Ventes" CONTENT="Prévisions pour 1999">

    Dans Fichier3.htm:

    <META NAME="Ventes" CONTENT="Ventes en 1997">

Remarque   Veillez à ajouter les balises META NAME entre les balises HTML <head> et </head> au début du fichier.

Vous pouvez maintenant rechercher tous les fichiers qui contiennent des prévisions de ventes. Envoyez la requête suivante :

@metadescription prévisions

Cette requête renvoie tous les fichiers qui contiennent le mot prévisions dans le champ CONTENT de la balise meta. Dans cet exemple, les fichiers Fichier1.htm et Fichier2.htm sont renvoyés.

Supposons maintenant que vous souhaitiez obtenir les chiffres des ventes par an, par exemple les ventes réalisées en 1997. Envoyez la requête suivante :

@metadescription 1997

Le fichier Fichier3.htm est renvoyé.