百度助開發者享受最前沿技術
(余凱在大會現場做主題演講)
余凱在大會現場表示,在移動互聯網時代,智能可穿戴設備將會是未來的一大熱點。這其中人機交互的效率和質量,是設備“智能成色”高低的關鍵。“所有的交互方式中,最自然的人機交互方式之一是語音。”余凱強調。因此,無論是國外還是國內,語音技術如今都成為了最頂尖的科技公司的一大投入點。余凱頗有信心地表示,“百度是在移動搜索中文語音識別里面做得最出色的公司,在準確率上百度跟國際同行比起來可以說是毫不遜色。”
余凱介紹說,對于這一領先的語音技術,百度并沒有“獨享”,而是把其完全開放。實際上,在此之前百度就已經宣布向開發者免費開放百度整個語音生態系統。這樣的開放包括直接安裝百度語音助手、調用百度語音助手SDK以及開放最底層的語音識別技術API等由淺入深的三個層次。由此不同層次的開發者都可以方便快捷地使用、嫁接百度的語音服務。
除了語音技術之外,在現場余凱還通過生動的案例,詳細介紹了百度在圖像技術方面所取得的成就,包括以圖搜圖、圖片翻譯、人臉識別、為你寫詩等基于圖像技術的創新功能。針對一個例子,余凱表示,“百度圖像技術不但可以識別出這幅圖的內容是街頭藝人,把其灑脫的心境用中國詩歌描述出來,這說明百度對圖像識別的理解和語言模型的建模都達到了一個相當的高度。”
當百度把自身領先的圖像技術能力,植入具體產品時,就給產品帶去了不一樣的創新和獨特的賣點。百度魔圖,就是這樣的受益者。通過“PK大咖”、“夫妻臉”等功能,百度魔圖一度在 App Store 所有免費應用的綜合排名中奪得冠軍寶座,用戶數也快速地突破了1億。
實際上能夠有望創造這樣奇跡的,并不僅僅局限于“百度系”的產品。因為百度圖像技術同樣向廣大開發者進行了開放。余凱介紹說,通過人臉服務SDK、人臉服務API、圖像處理SDK等各種方式,百度可以向開發者開放人臉驗證、人臉檢索、人臉屬性識別、圖像處理四種技術能力。從而使得開發者可以低成本高效率地,開發出優質的產品,為用戶提供更為良好的使用體驗。
在余凱看來,百度之所以能夠在語音、圖像等領域取得如此巨大的成績,與百度在技術領域的底層建設——百度深度學習研究院的建立息息相關。余凱介紹說,深度學習是機器學習研究中的一個新的領域,核心在于以人腦復雜神經網絡的方式,模仿人腦的機制來解讀文本、語音、圖像等大數據。余凱表示,“用戶所有的瀏覽和使用行為,都需要復雜的機器學習模型做預測。深度學習可以站在使用者的角度去分析所有的問題,使我們的搜索引擎更加的智能。”
余凱透露,在深度學習技術的驅動下,百度在各方面都取得了長足的進步,可謂影響深遠。語音技術方面,相對錯誤率降低了25%以上,移動搜索中文語音識別率突破了90%;圖像技術方面,人臉識別技術世界領先,同時快速推出了世界上首個全網人臉搜索引擎;在相似圖像搜索方面,效果遠遠超過了國際上搜索引擎同類產品;此外,在全流量上線廣告CTR的預估方面,也提升顯著。“深度學習之于百度,還在顯示出厚積薄發的威力。”余凱強調。
據了解,此次2013國際創新峰會由TechCrunch中國官方戰略合作伙伴動點科技主辦。作為全球最重要的創新峰會之一,本次峰會云集了眾多顛覆性的創業公司,同時包括TechCrunch全球COO內德?德斯蒙德、聯合創始人凱斯?提爾等業界大佬也悉數到場,和中國互聯網行業的從業者一起,共同見證當下中國的創造與創新。
余凱最后表示,創新是中國互聯網行業發展的最大推動力,開放共享是互聯網最重要的精神內核之一,百度希望通過開放不斷地輸出自身的領先技術,幫助廣大開發者和創業者站在世界互聯網的前沿,和百度一起書寫更多神奇的中國創新故事。■
關注我們



