Elasticsearch: Récupérer le document avec le contenu de la pièce jointe
Cette documentation fait partie du guide Plugin Ingest Attachment. Consultez le guide complet ici : Comment extraire des données depuis des fichiers PPT, XLS et PDF vers Elasticsearch.
👋 Bienvenue sur la documentation de Stackhero !
Stackhero propose une solution Elasticsearch cloud prête à l'emploi qui offre de nombreux avantages, notamment :
- Performance optimale et sécurité renforcée grâce à une VM privée et dédiée.
- Nom de domaine personnalisable sécurisé avec le support du chiffrement HTTPS.
Gagnez du temps et simplifiez-vous la vie : il suffit de 5 minutes pour essayer la solution Elasticsearch cloud hosting de Stackhero !
Pour afficher le document traité, récupérez-le en utilisant son ID :
GET my_index/_doc/my_id
La réponse devrait ressembler à ceci :
{
"_index" : "my_index",
"_type" : "_doc",
"_id" : "my_id",
"_version" : 1,
"found" : true,
"_source" : {
"data" : "e1xydGYxXGFuc2kKVGhpcyBpcyB0aGUgY29udGVudCBvZiBhIFJURiBmaWxlClxwYXIgfQ==",
"attachment" : {
"content_type" : "application/rtf",
"language" : "en",
"content" : "This is the content of a RTF file",
"content_length" : 35
}
}
}
Vous remarquerez que le champ _source contient désormais à la fois les données originales en Base64 et les informations extraites de la pièce jointe, comme le type de fichier et le contenu.