張明傑道:“先不急吧,問題正在分析的呢,從目前已經分析出來的一些問題看,我們在數據同步,Redis使用,音視頻的SDK上都存在嚴重的問題,功能上的web類的,APP的體驗類的也比較多,但是這些應該可以通過版本的快速迭代解決”
金偉忠道:“秦園,你怎麼看,問題的列表我也看了一遍,按照道理,性能穩定性的問題,我們都壓測過好幾遍的,你們的壓測報告我都看了,很多場景也覆蓋測試了,但是實際情況比我們現象的差很多啊”
金偉忠就喜歡問,某某怎麼看,搞的秦園有點尷尬,隻道:“具體的根因還沒有分析出來,但是從問題發生的場景上看,大部分我們是有壓測過的”
朱權道:“那就有點不對啊,我們可以漏一兩個,但是不能有這麼多的崩潰啊”
張明傑道:“很多崩潰的原因是一樣的,我也看了幾個崩潰的bug分析,數組越界的發生五六次,內存泄漏的一批”
秦園道:“我剛才想了下,這個是不是壓測的工具問題啊,我們的工具是自己造的,開發自己寫程序,自己造測試工具,測試部用這工具來測,尤其是入會後進行一些操作,都是按照正常的邏輯操作,異常的比較少,當是在做工具的時候,我提了此建議,但是這些實現起來比較麻煩,都推到下一個工具版本了”
朱權道:“嗯,不錯,是一個風險點,林美雲你記下,後麵董曉峰你在負責複盤下工具類的問題,我們要真實模擬客戶的行為”
“好的”林美雲在一邊寫著會議紀要。
金偉忠道:“明天我們在組織運維陳建誌和中間件王俊複盤下這些問題,感覺很多是我們的用法不對,比如Redis,RocketMq,這些業界很多公司在用,本次也竟然出現了服務器不可用的情況,應該是什麼的使用方式不對,我們不能懷疑這個些組件本身的問題”
晚上20點的時候,測試部的同學,把問題都梳理了出來,過濾掉重複的問題,崩潰類的,21個Bug,嚴重Bug 51個,普通的bug 132個,優化建議需求類的208個,拿到這個問題列表,張明傑心中感覺在滴血,咱們這個版本也太挫了吧,然後就想到謝寧台那天晚上的醉話,難道我們的這個版本就是一坨大垃圾。
周天的時候,都在公司加班忙,晚上又更新了一個版本上去,把崩潰的問題解決了19個,嚴重的解決了20個,其他的問題就暫時不先不管了。
測試部也沒有那麼多的精力來驗證,張明傑在Git係統上看版本的代碼的提交記錄,看了有點想吐血的感覺。
有主從服務器切換的時候,地址寫錯的,導致redis的選主失敗;
有對前端傳遞過來的字符串,沒有格式化處理的,導致服務崩潰;
對自定義的表情包,沒有處理,導致顯示亂碼的;在細看原來是一直有處理,後麵是測試部提的Bug說法表情包太慢,程序員優化了一把,然後忘記把原來的代碼合並進去,速度是快了,導致亂碼產生了;