Elasticsearch: Récupérer le document avec le contenu de la pièce jointe

Cette documentation fait partie du guide Plugin d'ingestion des pièces jointes. Consultez le guide complet ici : Comment extraire des données des fichiers PPT, XLS et PDF vers Elasticsearch.

👋 Bienvenue sur la documentation de Stackhero !

Stackhero propose une solution Elasticsearch cloud prête à l'emploi offrant de nombreux avantages, notamment :

  • Une performance optimale et une sécurité robuste grâce à une VM privée et dédiée.
  • Un nom de domaine personnalisable sécurisé avec le support du chiffrement HTTPS.

Gagnez du temps et simplifiez-vous la vie : il suffit de 5 minutes pour essayer la solution Elasticsearch cloud hosting de Stackhero !

Pour voir le document traité, récupérez-le en utilisant son ID :

GET my_index/_doc/my_id

La réponse devrait ressembler à ce qui suit :

{
  "_index" : "my_index",
  "_type" : "_doc",
  "_id" : "my_id",
  "_version" : 1,
  "found" : true,
  "_source" : {
    "data" : "e1xydGYxXGFuc2kKVGhpcyBpcyB0aGUgY29udGVudCBvZiBhIFJURiBmaWxlClxwYXIgfQ==",
    "attachment" : {
      "content_type" : "application/rtf",
      "language" : "en",
      "content" : "This is the content of a RTF file",
      "content_length" : 35
    }
  }
}

Notez que le champ _source inclut maintenant à la fois les données originales en Base64 et les détails de l'attachement extrait tels que le type de fichier et le contenu.