Graylog: 資料對應問題
如何解決 Graylog 索引資料對應問題
👋 歡迎來到 Stackhero 文件!
Stackhero 提供即用型的 Graylog cloud 解決方案,帶來多項好處,包括:
- 包含無限和專用的 SMTP 電郵伺服器。
- 只需一鍵即可輕鬆更新。
- 使用 HTTPS 保護的可自訂域名(例如,https://logs.your-company.com)。
- 由專用私有 VM提供的最佳性能和強大安全性。
節省時間並簡化您的生活:只需 5 分鐘即可嘗試 Stackhero 的 Graylog cloud hosting 解決方案!
在 Graylog 中,一個常見的問題是資料對應(mapping)衝突,這會導致索引失敗。當您看到類似以下的日誌時,可能就遇到了這個問題:
ElasticsearchException[Elasticsearch exception [type=mapper_parsing_exception, reason=failed to parse field [level] of type [long] in document with id '34fd4d11-36ed-11f0-afc9-0242ac140002'. Preview of field's value: 'error']]; nested: ElasticsearchException[Elasticsearch exception [type=illegal_argument_exception, reason=For input string: "error"]];
問題原因
這個問題源於 OpenSearch 的動態對應(dynamic mapping)功能。動態對應會根據寫入索引的第一份文件,自動判斷每個欄位的資料類型。一旦資料類型被設定,該欄位的型別就會被「鎖定」,之後如果有文件傳入同一欄位但資料型別不同,就會被拒絕,並產生 mapper parsing exception。
當新索引建立時,第一份文件會決定索引的 mapping。例如,如果該文件的「level」欄位值為 3(數值),OpenSearch 會將「level」的資料型別設定為「long」(數值型別)。如果之後有文件傳送到 Graylog,該文件的「level」欄位值為「error」(字串型別),就會因為資料型別不一致而被拒絕,並觸發 mapper_parsing_exception,錯誤訊息為 failed to parse field [level] of type [long] in document with id 'xxx'.
如果不同文件之間欄位的資料型別不一致,這個問題可以發生在任何欄位上。
解決方法
要解決這個問題,您有兩個選擇:
1. 確保所有系統的資料型別一致
最理想的做法是統一所有發送到 Graylog 的系統所使用的欄位資料型別。例如,確保「level」欄位要麼始終以字串(如「error」、「warn」等)傳送,要麼始終以數字(如 3、4 等)傳送。這種一致性可以避免 mapping 衝突,確保所有文件都能正確寫入。
2. 使用 Graylog Pipelines 進行資料型別轉換
如果無法在所有系統中統一資料型別,您可以利用 Graylog 的 Pipelines 功能,在資料進入時進行型別轉換。Pipelines 允許您根據特定條件定義規則,對資料進行轉換。
實作步驟如下:
- 在 Graylog 網頁介面中,前往「System」>「Pipelines」。
- 點擊「Add new pipeline」建立新 Pipeline。
- 定義規則,將「level」欄位(或其他欄位)轉換為所需的資料型別。例如,您可以將數值型的 level 轉換為對應的字串(如 3 轉為「error」、4 轉為「warning」等)。
這種方式可以確保所有進入的資料都符合預期的資料型別,避免 mapping 衝突。
檢視及修改索引 mapping
對於進階用戶,Graylog 也提供檢視及手動調整索引 mapping 的功能:
- 在 Graylog 網頁介面中,前往「System」>「Indices」。
- 選擇相關索引。
- 前往「Configuration」>「Configure index field types」以檢視或修改欄位 mapping。
不過,手動調整 mapping 時請務必小心,因為錯誤的 mapping 可能會導致更多資料寫入問題。