定製化 更切應用

信息化決策

作者:郭濤

提供大規模、標準化、統一且易於使用的雲渲染服務對於整個渲染行業來說都是一個難題。讚奇科技憑借定製化的服務器、分布式存儲和靈活的業務模式,在雲渲染服務市場上找到了自己的定位。

讚奇科技發展有限公司(以下簡稱讚奇科技)是國內一家專業從事三維圖形雲渲染服務的公司,目前其雲渲染平台上的客戶總數已經超過1000家。對於圖形渲染業務來說,性能是第一位的。讚奇科技總經理楊昕吉回憶說:“最初,我們選擇了一家業內知名品牌的存儲廠商提供的集中式存儲係統,但當存儲節點增加到100個時,係統性能出現瓶頸,僅通過硬件的疊加很難使性能得到改善。痛定思痛,在升級雲平台時,我們選擇了分布式存儲架構,使得存儲性能可以線性增長,從而突破了困擾我們已久的性能瓶頸。”

性能是第一位的

圖形渲染計算的要求有“三高”:第一,計算密度高,計算業務有明顯的波峰和波穀,當計算高峰到來時,I/O通常會被占滿;第二,計算資源的占用率高;第三,存儲並發讀寫量高,通常呈指數級增長。在傳統的存儲係統中,存儲性能的增長與硬件設備數量的增加並不完全成正比,而是有一個臨界點,當存儲係統的配置達到這個臨界點時,即使再增加硬件設備的數量,也不能實現性能的同步增長,甚至會出現性能下降的情況。這就是曾經困擾讚奇科技的一個難題。

為了突破係統性能的瓶頸,讚奇科技攜手江蘇集雲信息科技有限公司(以下簡稱集雲科技)重構了數據中心機房,並全麵采用分布式存儲架構和創新的基於英特爾至強E5處理器的托盤式服務器,實現了係統的橫向擴展,降低了整體擁有成本。讚奇科技采用全新技術打造的雲平台基礎設施包括500個計算節點,未來很快將擴展至1500~000個計算節點。楊昕吉解釋說:“以前,我們采用傳統的磁盤陣列,瓶頸就存在於磁盤陣列的讀取過程中,而我們又苦於沒有辦法解決。在係統升級後,我們采用了分布式存儲架構,也就是集雲科技提供的計算與存儲一體化的係統,不僅保證了係統的穩定和可靠,而且性能可以線性提升。”

經讚奇科技實際測試,集雲科技提供的一體化係統有幾大優點:第一,服務器CPU的占用率和存儲設備的占用率明顯下降,隻有原有係統的三分之一;第二,整體係統的存儲訪問速率提高三倍多;第三,通過采用英特爾至強E5處理器和一係列優化技術後,有效降低了係統的整體擁有成本。“總體來說,現在這套新的計算和存儲架構的效率和讀取穩定性都有大幅提高。而以前那套老係統,一旦參與渲染的設備增加後很容易出現存儲訪問失敗的情況,而新係統的渲染成功率大大提升。”楊昕吉告訴記者,“隨著業務的不斷增加,我們現在又麵臨新的挑戰,就是解決在超大計算規模下提升並發訪問的性能和穩定性。現在,我們最多可以同時利用500台設備,而未來隻有規模擴大到2000台甚至5000台時,我們才有底氣承攬美國好萊塢影片的高性能渲染服務。”

看重高性價比

雲渲染主要考驗的是計算能力和存儲的讀寫能力。計算是並行的,一個計算任務分布在500個節點上同時進行處理,隻有當所有節點上的任務處理完畢後才能進入下一步計算,如果某個節點的處理速度稍慢就會影響整個係統的處理性能。“大部分的性能瓶頸並不在計算上,而是在存儲上,很多時候數據在讀取時速度就已經很慢了。”集雲科技總裁陳寶輝介紹說,“為了解決這個問題,我們開始了與英特爾的合作。在英特爾提供的參考設計架構之上,我們設計了一體化的雲存儲係統,整合了服務器、存儲、網絡等,然後與讚奇科技一起針對雲渲染應用進行了調優。”讚奇科技雲渲染平台底層技術架構最大的改變就是用分布式的雲存儲取代了原有的集中式存儲。早在2012年,集雲科技就開始與英特爾合作,準備開發雲存儲。雲存儲最大的優勢就是可以實現橫向擴展,並且能用低成本的存儲服務器達到用戶所需的高性能、高可擴展,同時還能保證很高的可靠性。這也是讚奇科技雲渲染平台成功的關鍵因素之一。

中國用戶通常都十分重視IT產品的性價比,像讚奇科技這樣提供雲服務且擁有大規模IT基礎設施的企業就要加一個“更”字了。一方麵,品牌廠商提供的集中式存儲不能滿足讚奇科技雲渲染平台對性能和擴展性的需要;另一方麵,相比集雲科技提供的一體化係統,品牌廠商提供的服務器、存儲產品價格過於昂貴。這些都促使讚奇科技與英特爾和集雲科技合作。