張一鳴:禁區闖入者
封麵
作者:汪再興
31歲的張一鳴喜歡用坐標和矩陣來表現事物。在這位不善言談的極客眼中,數學才是對事物之間最基礎關係的描繪。他告訴《博客天下》:“世界上很多關係都可以表示成幾何關係,不論是包含、臨近、正交還是分類,都可以用數學表達出來。”
這位極客締造了擁有1億用戶的今日頭條。這個推薦搜索引擎的邏輯起點也與數學相關。2012年6月,張一鳴開始撰寫這款能精準推送用戶感興趣內容的軟件的初始代碼,他大概花費1個月編寫完成。8000多行代碼構成的算法也讓今日頭條初步具備了人類嬰兒階段的智商。
1807年,富爾頓發明的在哈德遜河上飛馳的蒸汽船被人視為怪物,200多年後的今天,張一鳴發明的今日頭條誕生之初卻把作為締造者的他嚇到。
在這個係統新生的時候,它內部蘊含的算法並不是對所有人的興趣都判斷準確。係統內測當天,一個意外是,這套算法判斷張一鳴的一位員工有同性戀傾向,這令這位締造了係統的工程師哭笑不得。
目前,馴養今日頭條算法的團隊約有60個人,1000多台購買自華為和戴爾等公司的服務器,這些服務器相當於生命體的存儲介質,像人類的大腦皮層,幫助係統把學到的東西存下來。
2012年7月31日,這套能夠感知人們興趣信息的算法最終與人們見麵。誕生之初,有的員工重點關注它的缺點,覺得不靠譜,有的員工則看它帶來的可能性,覺得雖然有時候可能不準,但這件事本身很有意義。但張一鳴說:“這個係統的誕生與人類第一次把顯像管裝在電視上的意義相同,盡管當時熒幕上布滿雪花片,但意義很不一樣。它是第一個全網內容因每個人不同並且在變化著的產品。”
張一鳴把算法看成一個生命體。他說:“你要調教它,馴養它,它就會自我演化。”此前,這位CEO和工程師們每天都會花大量的時間馴服這套算法。
在這個極客眼中,算法才是今日頭條這款興趣推薦搜索引擎的核心,是與傳統媒體的本質區別。談及他設計的算法,張一鳴總用一種玄而又玄的語氣說:“它就是一個生命體,你可以觀察它,它(算法)同時又在屏幕後看你。”
這種極客式的思維很難令傳統媒體人理解,同時,也構成了日後張一鳴引發傳統媒體一致討伐的那句“今日頭條的商業模式不需要版權”的邏輯。
2014年7月1日下午,今日頭條知春路總部,字節跳動資深工程師張永華緊緊盯住電腦屏幕上兩條顏色分別為藍色和紅色的波狀曲線。這位工程師正在做一項算法改進試驗,他從算法係統後台抽取了兩組人數分別為78萬的今日頭條用戶—被抽取的兩組用戶相當於工程師馴養算法的“小白鼠”,藍、紅兩條曲線則分別代表算法改進後,兩組78萬用戶的閱讀行為變化。
一旁的張一鳴解釋,傳統媒體並不能做到及時觀察用戶,而今日頭條隻需要不到一秒鍾的時間就能準確抽取用戶,並觀察他們的行為。
在這一次的試驗中,今日頭條的資深工程師張永華改進了此前算法中的一項指數,並將改進後的算法應用到第二組78萬用戶中,希望可以增加用戶在頁麵的停留時長。從6月28日到7月1日,他一直跟蹤監測這兩組用戶的閱讀記錄,他想觀察一個算法上的改動能否影響到客戶端那頭用戶的閱讀行為。
衡量今日頭條工程師實驗成敗的標準主要是四組數據—閱讀文章篇數、收藏文章篇數、頁麵停留時間和用戶進行長閱讀的文章篇數。
通過分析數據張永華發現,相較於24小時內,平均閱讀了11.1篇文章的對照組,改動算法後的實驗組裏的用戶平均多讀了0.5篇文章。他同時觀察到,在用戶進行長閱讀文章篇數的這項數據中,實驗組裏用戶進行長閱讀的文章篇數為9.5篇,比對照組多出了0.4篇。
綜合兩項數據說明,實驗組裏用戶平均多讀的0.5篇文章中有0.4篇是由長閱讀用戶貢獻的。同時,這項算法的改進實驗將用戶的平均閱讀時長提高了20多秒。這些數據足以說明,這位資深工程師的這一次改進讀者閱讀體驗的實驗是成功的,算法一改變,用戶行為就出現了變化,增加了有效閱讀。
張永華告訴《博客天下》,這次試驗比較簡單,他隻寫了2000多行代碼來改進係統背後的算法。
算法誕生之初到現在,字節跳動的工程師們一共完成了1000多次算法實驗,這裏麵至少有五六百次是成功的,這些成功完成的算法實驗將最挑剔的讀者喜好存入計算機,此後,記住喜好的計算機會向讀者推送他們最感興趣的信息。改進算法的代碼越寫越長,原來隻需要工程師幾個小時就可以完成的代碼如今需要工程師反複測試兩三天甚至多達一個月。
工程師們的不懈努力使得今日頭條的這套算法越來越懂人心。它的聰穎使得這款推薦搜索引擎在兩年內擁有了1億用戶。
實際上,算法已經成為了這個時代科技界的又一新寵和熱錢湧向的領域。近日,《連線》雜誌作者Dan Saffer撰文稱,讓我們像馴化小狗一樣馴化算法。這位連線作者認為,人類目前正在與另外一種我們之外的物種共生在一起,和犬科動物相比,它更加危險也更有威力:這就是算法。
在這個時代裏,Facebook的內容是算法決定的,亞馬遜的內容是算法決定的,Spotify(全球最大的音樂流媒體)和Netflix(美國視頻服務商)上的內容也是算法決定的。現在,某種算法可能正在通過家裏的恒溫器控製我們的室溫。
科技作家克裏斯托弗·斯坦納(Christopher Steiner)則將算法描述為“龐大的決策樹,由一個個連續的二元判定組成……一組指令按序執行並獲得一個理想的結果。信息經由一個已知算法的處理,產出需要的答案。”
接受《博客天下》采訪當天下午,陷入權力部門調查和行業痛擊的張一鳴非常疑惑地問記者,“胡舒立(現任財新傳媒總發行人兼總編輯)這麼重視版權的女士都非常讚同今日頭條的做法,都說今日頭條給財新網進行引流,將用戶正常回流到財新網,為什麼一些門戶網站甚至是今日頭條的合作方和受益者反過身來罵我們最狠?”財新網副總編輯康偉平在回複《博客天下》記者郵件時確認了財新與今日頭條的合作,她說:“財新一直堅持維護版權,重視版權價值,但同時我們也希望能夠擴大影響,同步發展自有平台,因此回鏈無疑是最佳選擇。在這個意義上,我們願意與今日頭條合作。”
但麻煩還在繼續,6月23日,國家版權局管理司司長於慈珂在接受媒體采訪時表示正在對今日頭條進行立案調查。在政府、企業與用戶的關係場裏,在財富和權力糾織的森嚴等差序列裏,顯然,這套由張一鳴締造、給1億用戶提供閱讀決策的算法尚不能給他提供準確的對策。
算法禁區
在極客公園創始人張鵬眼中,張一鳴就是一個極客,橫溢的才華同時會帶來無盡的險境和機遇。但經曆一係列成功和波折,這位極客進入高階遊戲後,他身上帶有的不管不顧的創業者氣質和對技術的純粹開始帶來負累。
張鵬告訴《博客天下》,張一鳴是一個典型極客與科學家混合性格的創業者,“他非常講邏輯,與人溝通很直接。”一個例子是,與張鵬私下聊天時,張一鳴告訴張鵬,在這場關於今日頭條的風暴中,自己最困擾的就是不知道媒體的訴求是什麼,因為按他的邏輯,把媒體的內容推薦給更多的人看是一件對媒體有利的事。
另一個例證也能體現出張一鳴具備科學家的嚴謹氣質。一天,張鵬與張一鳴聊天,他對張一鳴說,今日頭條本質是希望理解人,給人提供更多的信息,讓人看到更廣的世界,那今日頭條最終不就是帶有一點“人工智能”的感覺嗎?張鵬本以為,自己提的“人工智能”是一個挺酷、挺有概念的詞。但張一鳴聽後卻連說三個“不”字,並一臉嚴肅地糾正他,“今日頭條的原理其實是機器學習,還談不上人工智能。”當時張鵬就發現張一鳴與其他急於引入投資、喜歡創造概念的創業者不同,他不說大話、空話。