優(yōu)惠活動 - 12周年慶本月新客福利
優(yōu)惠活動 - 12周年慶本月新客福利
優(yōu)惠活動 - 12周年慶本月新客福利

積極利用日志文件

利用應(yīng)用的日志文件診斷問題并防止問題出現(xiàn)。落實監(jiān)控日志文件的流程,強制人們對發(fā)現(xiàn)的問題采取措施。利用各種監(jiān)控工具,如定制的腳本或者Splunk,觀察應(yīng)用的日志,找出錯誤。導(dǎo)出這些錯誤,指派人員識別并解決相關(guān)的問題。

日志文件是很好的信息源,可以了解應(yīng)用是如何執(zhí)行的。不要對它置之不理。好好利用日志文件,可以減少系統(tǒng)的生產(chǎn)問題。



本著要用正確的工具完成工作的精神,讓我們來看看可能每個人都有但卻常常被忽略的工具一日志文件。除非你故意關(guān)閉了Web或應(yīng)用服務(wù)器的記錄日志功能,否則幾乎各種應(yīng)用都有錯誤和訪問日志。 Apache有錯誤和訪問日志,Tomcat有java.util.logging或Log4j,Webshpere有Systremerr和Systemout日志。這些日志是非常有用的工具,可以讓我們了解應(yīng)用的性能和可能會妨礙擴(kuò)展的問題。要最合理利用這種工具,需要遵守下面幾個簡單但重要的步驟。

使用日志文件的第一步是把它們集合起來。因為你可能有幾十甚至幾百臺服務(wù)器,那么需要把數(shù)據(jù)集合起來才能使用。如果數(shù)據(jù)量太大,無法集合起來,那么可以采樣,如每N個服務(wù)器采集一次。另一種策略是把幾臺服務(wù)器的日志集合到一臺日志服務(wù)器上,然后由這臺服務(wù)器把這些半集合的日志傳遞到最終集合地點。專用的日志服務(wù)器可以把日志數(shù)據(jù)集合起來,然后發(fā)送到數(shù)據(jù)存儲設(shè)備上。這種集合操作通常是經(jīng)過帶外網(wǎng)絡(luò)執(zhí)行的,與生產(chǎn)環(huán)境使用的不是同一個網(wǎng)絡(luò)。要避免日志數(shù)據(jù)、監(jiān)控數(shù)據(jù)或集合數(shù)據(jù)影響生產(chǎn)環(huán)境的流量。
 
下一步是監(jiān)控這些日志。令人吃驚的是,許多客戶花費了時間和計算資源記錄和集合日志,但是卻忽略了其中的數(shù)據(jù)。雖然你會使用發(fā)生事故時的日志文件幫助恢復(fù)服務(wù),但這沒有最大化利用日志。首先可以采用的方式是利用自動化工具監(jiān)控這些日志文件??梢允褂枚ㄖ频哪_本進(jìn)行監(jiān)控,如一個shel腳本,可以按給定模式搜索文件內(nèi)容,累計錯誤數(shù)量,當(dāng)超過閾值時進(jìn)行修改。更復(fù)雜的工具,像Cricket或 Cacti,具有繪制圖形的能力。同時具有集合和監(jiān)控日志文件功能的工具是Splunk在集合了日志并監(jiān)控錯誤后,最后一步是修正問題。這需要分配程序員和QA人員,識別與個別問題相關(guān)的一般錯誤。通常,應(yīng)用程序流中的一個bug會造成形式各異的錯誤。發(fā)現(xiàn)這個bug的程序員很可能會被指派為修正它的人,也可能會把這個任務(wù)分配給其他程序員。

雖然我們希望日志文件中完全沒有錯誤,但是不可能一直這樣。日志文件中的錯誤很常見,需要建立一個流程,確保它們不會失控或被忽略了。有些小組會定期(每發(fā)布三個版本或四個版本)清理那些不需要立即處理的錯誤。這些錯誤很簡單,可能是應(yīng)用中沒有重定向配置,或者沒有處理已知錯誤的條件等。

必須記住,記錄日志也是有成本的。不僅有保存額外數(shù)據(jù)的成本,還有事務(wù)響應(yīng)時間的成本。通過不時地總結(jié)日志、歸檔、在日志價值下降時清除它,有助于減少保存數(shù)據(jù)的成本??梢酝ㄟ^異步模式記錄日志,從而最小化存儲日志的成本。最終,我們要注意記錄日志的成本,關(guān)于記錄多少數(shù)據(jù)以及保留多少數(shù)據(jù),需要作出高性價比的決策。

希望我們說服了你,讓你相信在網(wǎng)站建設(shè)調(diào)試和監(jiān)控應(yīng)用時日志文件是個重要的工具。利用這么一個你很可能已經(jīng)有的工具,能夠幫助你極大地增強客戶體驗和應(yīng)用的可擴(kuò)展性。

本文地址:http://blackside-inc.com//article/3465.html
相關(guān)文章:
最新文章: