Elasticsearch: Recuperar el documento con el contenido del adjunto

Esta documentación forma parte de la guía Plugin de Ingest attachment. Consulte la guía completa aquí: Cómo extraer datos de archivos PPT, XLS y PDF a Elasticsearch.

👋 ¡Bienvenido a la documentación de Stackhero!

Stackhero ofrece una solución Elasticsearch cloud lista para usar que proporciona una serie de beneficios, incluyendo:

  • Rendimiento óptimo y seguridad robusta impulsados por una VM privada y dedicada.
  • Nombre de dominio personalizable asegurado con soporte de cifrado HTTPS.

Ahorre tiempo y simplifique su vida: ¡solo toma 5 minutos probar la solución de Elasticsearch cloud hosting de Stackhero!

Para ver el documento procesado, recupérelo usando su ID:

GET my_index/_doc/my_id

La respuesta debería ser similar a la siguiente:

{
  "_index" : "my_index",
  "_type" : "_doc",
  "_id" : "my_id",
  "_version" : 1,
  "found" : true,
  "_source" : {
    "data" : "e1xydGYxXGFuc2kKVGhpcyBpcyB0aGUgY29udGVudCBvZiBhIFJURiBmaWxlClxwYXIgfQ==",
    "attachment" : {
      "content_type" : "application/rtf",
      "language" : "en",
      "content" : "This is the content of a RTF file",
      "content_length" : 35
    }
  }
}

Observe que el campo _source ahora incluye tanto los datos originales en Base64 como los detalles del adjunto extraído, como el tipo de archivo y el contenido.