Elasticsearch: 檢索帶有附件內容的文件

本文件是Ingest 附件插件指南的一部分。請在此處查看完整指南:如何從 PPT、XLS 和 PDF 文件中提取數據到 Elasticsearch

👋 歡迎來到 Stackhero 文件!

Stackhero 提供即用型的 Elasticsearch cloud 解決方案,帶來多項優勢,包括:

  • 專用私有 VM提供的最佳性能和強大的安全性
  • 支援 HTTPS 加密的可自訂域名

節省時間簡化您的生活:只需 5 分鐘即可嘗試 Stackhero 的 Elasticsearch cloud hosting 解決方案!

要查看處理過的文件,請使用其 ID 檢索它:

GET my_index/_doc/my_id

回應應類似於以下內容:

{
  "_index" : "my_index",
  "_type" : "_doc",
  "_id" : "my_id",
  "_version" : 1,
  "found" : true,
  "_source" : {
    "data" : "e1xydGYxXGFuc2kKVGhpcyBpcyB0aGUgY29udGVudCBvZiBhIFJURiBmaWxlClxwYXIgfQ==",
    "attachment" : {
      "content_type" : "application/rtf",
      "language" : "en",
      "content" : "This is the content of a RTF file",
      "content_length" : 35
    }
  }
}

注意,_source 字段現在包括原始的 Base64 數據和提取的附件詳細信息,如文件類型和內容。