小米小艾同學5.0發布,雷軍詳情背后人工智能
在本月初舉行的2020年小米開發者大會上,小米發布了小艾5.0版本。
小米集團副總裁,集團技術委員會主席崔寶秋此前表示,小艾同學將從過去的語音助理升級為智能生活助理。
IT之家獲悉,今天上午,小米創始人,董事長兼CEO雷軍寫道,小艾學生激活的設備數量已達2.28億臺,月活躍量已達7840萬臺,累計喚醒量達617億臺,“小艾學生已成為業內唯一擁有大規模落地場景的語音助手“。
以下為“雷軍:小艾背后5.0人工智能”全文:
在本月早些時候舉行的MIDC開發者大會上,我們發布了最新一代愛學生——愛學生5.0。新小愛學子帶來五大升級,涵蓋了音視頻娛樂,生活服務,信息查詢,出行路況等8大領域1400項技能,成為每個人一生不可分割的智能生活助手。
從2017年3月21日開始,“小艾同學”第一次與大家見面,到現在只有四年時間,小艾同學激活的設備數量達到2.28億臺,月生活達到7840萬臺,累計覺醒617億次,小艾也成為業內唯一具有大規模落地場景的語音助手。
新一代愛心學生
新一代小艾學員五大升級包括:全場景智能協作,對話主動智能,定制情感聲音,多模態融合互動和智能學習好助手。
小艾5.0全場景智能協作
目前,有5個或更多的小連接米,AI,T平臺設備用戶已達560萬。 隨著用戶家中越來越多的智能設備,使用和操作變得更加復雜。 全場景智能協作是讓小艾5.0大腦控制你家的許多物聯網設備。 當您發布需求指令時,小艾將統一決策,與家中多臺設備合作,達到“無論多少臺設備,都能簡化”的效果,是當之無愧的“智能生活助手“。
實現智能協作,需要解決的問題非常復雜。 不僅要根據設備距離,主動狀態,形式等綜合條件進行判斷,自主選擇設備容量最能滿足當前語義需求,還需要預測用戶潛在的設備控制需求,及時主動做出提醒和建議。
到2020年6月,使用協同喚醒的用戶總數達到94.4萬,攔截喚醒的數量達到9.4億。
小艾同學5.0對話主動智力
不同于傳統的移動互聯網APP或信息流被動猜測用戶形式,對話主動智能產品形式是小艾同學以自己的方式和節奏與用戶互動,像人一樣發起問題來增強用戶的理解。
主動對話本身就是高級智能的體現,這意味著人工智能不僅存在于與用戶互動的短過程中,而且在較長的時間內不斷思考和計算,需要像人一樣,有“記憶“。
小艾5.0通過強大的自然語言處理技術,積極學習有關用戶的知識,從而建立記憶。 這取決于小米對自然語言處理技術(MiNLP)的深度積累,MiNLP現在已經迭代到3.0版本,支持超過30業務場景,每天通話高達80億。
在記憶的存儲中,小艾的云腦將為用戶建立多維度的個人畫像,實現個人信息的互聯互通。 小艾同學的所有功能都會分享這些關于用戶的“回憶”,每次互動結合個人畫像進行計算,從而為用戶帶來個性化的結果。
小愛5.0定制情感之聲
為了讓用戶滿意,可以跨越地理,時間的障礙,隨時隨地都能得到公司“情感訴求”的感覺,小艾同學定制的音響項目應運而生。
僅靠常規的聲音處理技術無法實現定制的情感聲音的實現。 首先,我們需要能夠對用戶音頻數據進行預處理。 然后提取關鍵的聲學特征來區分不同音色在頻譜上的表現。最后,通過定制合成音庫訓練和自適應學習的基本模型,只需實現少量的用戶錄音,即可達到良好的合成效果。
除了定制聲音功能外,小艾5.0還優化了粵語的深度,并在8月份對演講者進行了粵語內部測試。 本月中旬,我們正式啟動了手機電視小艾粵語功能內部測試。 預計小艾的粵語功能將在本月內陸續向所有演講者開放。
小愛5.0智慧學習助手
小艾5.0將學習作為重要升級模塊,整合大量優質K12在線課堂資源,精選1000個在線課堂視頻資源,與讀朗,藝坊教育等35個優質資源達成合作,并拉通電視/音箱/移動教育會員同步。
課程是學生學習中最基本的工具課要求。 我們會的課程結合小艾同學,打造具有國內首個AI照片導入課程功能等先進人工智能技術的AI課程。
另一個主要工具是翻譯。 為了使翻譯更加高效,準確,小艾的團隊優化了文本預處理模塊,包括基于語言規則和模型的文本平滑技術,集成上述內容的實時文本糾錯算法,以及基于多語言預訓練模型的實時語義中斷算法。
愛5.0多模態融合
為了讓小艾同學與用戶之間的交流更加自然,我們做了更多的智能多模態融合交互,可以通過聲音,肢體語言,信息載體(文字,圖片,音頻,視頻),環境等與智能設備進行交流。打破傳統PC鍵盤輸入與智能手機觸摸交互,定義下一代智能產品與人的專屬交互模式。
新一代愛學生的背后是小米AI能力的長期積累
小米集團擁有非常豐富的業務線,包括硬件產品、電子商務和新零售和互聯網業務。 小米的人工智能不僅體現在小艾學生身上,而且有著非常廣泛的應用,如計算機視覺技術、計算機語音技術和機器學習技術。
通過這些年的努力,我們的AI建立了一個比較完整的能力圖和小米的AI能力平臺,在此基礎上我們搭建了小米的相關應用,包括智能相機,小艾同學,機器翻譯等。強大的智能硬件生態為AI能力的快速提升奠定了基礎,反過來,AI能力也充分賦能了小米的各個業務線。
例如,在計算機視覺技術中,我們做了很多工作,包括超分辨率、文檔建模配方/OCR,魔法為天,魔法分離等。 今年,我們的HDR(高動態范圍照片)也幫助小米10Pro/至尊紀念相機成功獲得DXOMARK全球第一的評價。
我們在計算機語音,機器學習等多方面也做了很多工作。 整個集團在人工智能領域的投資可能遠遠超過每個人的想象。 截至2019年12月31日,小米集團已提交專利申請33000多項,其中AI領域專利申請數量已進入全球互聯網企業第一陣營。 多項技術,包括端到端語音識別,附近喚醒,分布式回放,離線翻譯等,均處于行業一流水平。
同時,我們也在積極引進世界頂尖的研發人才,例如,我們成功邀請了人工智能領域的頂級專家丹尼爾·波維加入小米。
未來,小米的人工智能將進一步打造核心技術,促進各種AI技術的業務落地,為用戶創造更好的體驗。 同時,它將更加開放,繼續加強與高校科研院所及其企業的合作,向社會開放更多更好的人工智能技術,為每個人帶來更美好、更智能的生活。