Elasticsearch: 检索带有附件内容的文档

本文档属于Ingest attachment 插件指南的一部分。您可以在此处查看完整指南:如何从 PPT、XLS 和 PDF 文件中提取数据到 Elasticsearch

👋 欢迎使用 Stackhero 文档!

Stackhero 提供现成的 Elasticsearch 云 解决方案,具有众多优势,包括:

  • 通过 私有和专用 VM 提供的最佳性能和强大的安全性
  • 支持 HTTPS 加密的可定制域名

节省时间简化生活:只需 5 分钟即可试用 Stackhero 的 Elasticsearch 云托管 解决方案!

要查看处理后的文档,请使用其 ID 检索它:

GET my_index/_doc/my_id

响应应类似于以下内容:

{
  "_index" : "my_index",
  "_type" : "_doc",
  "_id" : "my_id",
  "_version" : 1,
  "found" : true,
  "_source" : {
    "data" : "e1xydGYxXGFuc2kKVGhpcyBpcyB0aGUgY29udGVudCBvZiBhIFJURiBmaWxlClxwYXIgfQ==",
    "attachment" : {
      "content_type" : "application/rtf",
      "language" : "en",
      "content" : "This is the content of a RTF file",
      "content_length" : 35
    }
  }
}

请注意,_source 字段现在包括原始 Base64 数据和提取的附件详细信息,如文件类型和内容。