Elasticsearch: Pobierz dokument z zawartością załącznika

Ta dokumentacja jest częścią przewodnika Wtyczka Ingest Attachment. Pełny przewodnik znajdziesz tutaj: Jak wyodrębnić dane z plików PPT, XLS i PDF do Elasticsearch.

👋 Witamy w dokumentacji Stackhero!

Stackhero oferuje gotowe do użycia rozwiązanie Elasticsearch cloud, które zapewnia wiele korzyści, w tym:

  • Optymalną wydajność i solidne zabezpieczenia dzięki prywatnej i dedykowanej VM.
  • Dostosowywalną nazwę domeny zabezpieczoną wsparciem szyfrowania HTTPS.

Oszczędzaj czas i upraszczaj sobie życie: wystarczy 5 minut, aby wypróbować rozwiązanie Elasticsearch cloud hosting Stackhero!

Aby zobaczyć przetworzony dokument, pobierz go używając jego ID:

GET my_index/_doc/my_id

Odpowiedź powinna wyglądać podobnie do poniższej:

{
  "_index" : "my_index",
  "_type" : "_doc",
  "_id" : "my_id",
  "_version" : 1,
  "found" : true,
  "_source" : {
    "data" : "e1xydGYxXGFuc2kKVGhpcyBpcyB0aGUgY29udGVudCBvZiBhIFJURiBmaWxlClxwYXIgfQ==",
    "attachment" : {
      "content_type" : "application/rtf",
      "language" : "en",
      "content" : "This is the content of a RTF file",
      "content_length" : 35
    }
  }
}

Zauważ, że pole _source teraz zawiera zarówno oryginalne dane Base64, jak i wyodrębnione szczegóły załącznika, takie jak typ pliku i zawartość.