Elasticsearch: Haal het document met de bijlage-inhoud op

Deze documentatie maakt deel uit van de Ingest attachment plugin-gids. Bekijk de volledige gids hier: Hoe gegevens uit PPT-, XLS- en PDF-bestanden naar Elasticsearch te extraheren.

👋 Welkom bij de documentatie van Stackhero!

Stackhero biedt een kant-en-klare Elasticsearch cloud oplossing die tal van voordelen biedt, waaronder:

  • Optimale prestaties en robuuste beveiliging aangedreven door een privé en toegewijde VM.
  • Aanpasbare domeinnaam beveiligd met HTTPS encryptie ondersteuning.

Bespaar tijd en vereenvoudig uw leven: het kost slechts 5 minuten om de Elasticsearch cloud hosting oplossing van Stackhero te proberen!

Om het verwerkte document te bekijken, haalt u het op met behulp van zijn ID:

GET my_index/_doc/my_id

De reactie zou er als volgt uit moeten zien:

{
  "_index" : "my_index",
  "_type" : "_doc",
  "_id" : "my_id",
  "_version" : 1,
  "found" : true,
  "_source" : {
    "data" : "e1xydGYxXGFuc2kKVGhpcyBpcyB0aGUgY29udGVudCBvZiBhIFJURiBmaWxlClxwYXIgfQ==",
    "attachment" : {
      "content_type" : "application/rtf",
      "language" : "en",
      "content" : "This is the content of a RTF file",
      "content_length" : 35
    }
  }
}

Merk op dat het _source-veld nu zowel de originele Base64-gegevens als de geëxtraheerde bijlagegegevens zoals bestandstype en inhoud bevat.