深耕語音輸入12載:訊飛輸入法走向萬物智能新世界
科目二考試不慎掛科后,我爸在微信上向我抱怨道:
“整天都在說人工智能,可人工智能到底在哪里呢,為什么到了2022年,自動倒車入庫的功能都沒普及,導致科目二考試還是那么難?!背宋淖稚系谋г梗€特意加了張某自動駕駛企業的宣傳圖。
我沒有正面回答我爸的疑問,而是問了他另外一個問題:“你連拼音都打不好,為什么能給我發這么長的一段文字?”大約過了一分鐘后,我爸回復了這樣一段話:“我用的是訊飛輸入法的語音輸入,直接對著手機說話就能生成字?!?/p>
可能在很多人的認知里,人工智能的價值在于顛覆性的改變,而選擇性忽略了生活中那些潛移默化的影響。
就像語音輸入的例子,我爸夾雜著普通話與河南方言的輸入習慣,五年前還是難以想象的場景,那時候語音輸入的準確率已經達到95%以上,但方言的識別準確率讓人難以直視,普通話和方言混合輸入的話,可能會直接讓系統“宕機”,如今語音輸入已經成為許多人最常用的輸入方式。
同樣被忽略的是,在語音輸入這件“小事”上,訊飛輸入法已經走了12年,創造了一個又一個里程碑。
01 被“語音”解放的長輩們
大約從五年前開始,“下沉市場”逐步成為外界討論的焦點,不但延長了人口紅利消失的時間周期,也為互聯網巨頭們找到了新的流量來源,甚至是說在某種程度上左右了當下的互聯網商業格局。
有人將其歸功于“華米OV”,因為智能手機價格的下降和渠道的密集覆蓋,加速了智能手機在下沉市場的滲透;也有人認為是微信、拼多多、抖音等殺手級應用的功勞,以一種特殊的魔力喚醒了“五環外人群”的參與感。
應該被銘記的還有語音輸入。
如果說拼音輸入法是打開中文互聯網的鑰匙,一度是PC時代最普及、調用頻次最高的產品;語音輸入就是移動互聯網走向下沉市場的捷徑,原本被隔離在互聯網圍墻外的中老年人,正是靠“語音輸入”的流行,才打破了他們與互聯網之間的藩籬,所扮演的角色不亞于智能手機的普及。
故事聽起來并不復雜,可想讓“語音輸入”被普通話都說不利索的中老年人用起來,并不是一件容易的事。就拿訊飛輸入法來說,為了提升語音輸入的效率和普適性,在技術上下了很大一番功夫。
比如訊飛輸入法12.0版本中推出的語種可控方言免切換系統,無須手動調整語音識別模式是普通話還是方言,就能實現普通話和23種方言的自由說。像我爸這類普通話中有著明顯的河南口音,時不時說幾個方言詞匯的用戶,語音輸入時不需要人為切換輸入方式,極大地提升了用戶體驗。
再比如訊飛輸入法對離線方言語音輸入和復雜環境語音識別的優化,不僅解決了高噪、遠場混響等環境下的識別準確率,即使是在離線的情況下,也能使用方言進行語音輸入。語音輸入不再是一種新奇的體驗,而是滿足用戶全場景需求的通用輸入方式,正在無形中重構人機交互的底層邏輯。
把視角再放大一些的話,隨著語音輸入效率的升維,被訊飛輸入法“征服”的絕不只有中老年人。驅動輸入法進化的源動力,始于“效率”二字,不管是拼音對五筆的替代,還是九宮格、手寫等輸入方式的流行,都離不開效率的提升。進一步解放生產力的語音輸入,自然是所有群體都無法拒絕的選項。
可以佐證的是,訊飛輸入法的用戶畫像中,包含了Z世代游戲人群、效率人群、銀發人群以及視障人群,他們的需求各有不同,或是青睞于游戲語音鍵盤、或是鐘情跨屏輸入模式、或是看到了長輩模式和無障礙模式的貼心……在語音輸入賽道上長跑了12年的訊飛輸入法,早已成為“個性多元需求”的代名詞。
02 萬物智能的輸入邏輯
當互聯網的用戶規模逐漸飽和,萬物智能被證實是下一個十年的核心命題,輸入法也需要與時俱進:所需要解決的不單單是人與人之間的溝通,還要為人與物的“對話”給出效率更高的解決方案。
在討論這個話題前,似乎有必要回答一個出現頻次很高的問題,即在萬物智能的秩序和規則里,輸入法是否屬于剛需產品?畢竟語音識別并不是輸入法的專屬,而作為“第三方”產品的輸入法,需要在萬物智能中找到自己的生態位。
這也是訊飛輸入法想要回答的拷問。剛剛結束的2022科大訊飛全球1024開發者節上,科大訊飛的輸入法總經理程坤在演講中多次提到“萬物皆智能”的理念,并給出了訊飛輸入法的應對之策。
首先是創新能力的輸出。正如前面提到的,訊飛輸入法針對語種免切換、離線方言、復雜場景下的語音識別等進行了深度優化,同樣的能力也適用于復雜多變的人機交互,用于解決人與機器之間的感知和表達難題。
一個直接的例子,當前用戶的智能產品列表中,已經出現了智能汽車、智能家居、穿戴式設備等不同產品,想要滿足不同場景下的人機交互需求,考驗的不只是語音識別的準確率,還有經過用戶實際使用驗證的差異化方案。而有著億萬活躍用戶的訊飛輸入法,已經為手表等小屏設備提供流暢的手寫、面向折疊屏設計了“分裂鍵盤”、更大顯示的智慧屏提供跨端流轉的輸入等等,可以說是離用戶和真實場景最近的玩家。
其次是內容表達的滿足。在用戶和智能化產品的交互中,“語音輸入”本質上只是入口,深層次的需求在于內容表達,通過語音輸入連接各種各樣的服務,譬如網購、社交、外賣等消費和生活的場景需求。
記憶中,訊飛輸入法在11.0版本中推出了“AI助手”,僅僅1年時間,這個平時不起眼的小助手已經擁有22種AI功能,覆蓋聊天、發布、搜索、評論、評價、個性表達等場景;并在訊飛輸入法12.0版本中,進一步搭載了全新AI智能化輸入引擎,在聊天、音樂、綜藝、影視、生活服務等場景下,都能賦以高效和準確。簡單來說,訊飛輸入法的切入口是輸入服務與用戶連接的需求,也是智能化時代用戶交互的根基。
至于訊飛輸入法的路線是否正確,現階段還無法給出確切的答案。不妨來重溫一個屢試不爽的產品邏輯:更低的使用門檻,更直接的交互方式,是一切產品發展的方向,萬物智能時代也不例外。
再確切一些的話,包括訊飛在內的第三方輸入法,正在不斷向金融、教育、司法、醫療、車載等場景滲透,輸出定制化的解決方案,為用戶帶來更好體驗的同時,也為自身找到了新的增長空間。
03 輸入法的生態化破局
從最早的語音輸入到賦能萬物智能,輸入法作為人工智能技術的天然載體,不可或缺性已經毋庸置疑,卻仍要面臨商業化的挑戰:在工具型產品整體式微的局面下,輸入法的想象空間到底在哪?
回到文初的例子,像我爸這樣的用戶不在少數,他們是語音輸入的直接受益者,以潤物細無聲的方式深切改變了他們的體驗感,一旦養成了語音輸入的用戶習慣,就是訊飛輸入法的護城河。可不同于智能駕駛等技術的話題性,語音輸入的大眾化普及,反倒制約了講述資本故事時的吸引力。
為了改變傳統的市場認知,訊飛輸入法代表的輸入法頭部玩家進行了多種嘗試。典型的例子就有To B探索,面向不同的行業打造場景化的輸入解決方案,降低用戶在垂直場景里的輸入門檻;同時還有增值服務的嘗試,利用個性化皮膚、字體、表情包等吸引用戶付費,事實上,好的產品和有價值的服務,用戶是樂于付費的。
在訊飛輸入法12.0的發布現場,面對輸入法在萬物智能時代遇到的新考題,訊飛輸入法產品總監趙明路給出了生態化的破局思路。
相對應的就是“i-Blocks”輸入個性化內容開放平臺,旨在搭建開放內容與服務的載體,以生態開放的理念,將創作者、IP方、設計師、普通用戶串聯在一起,形成生產、消費、價值創造的生態閉環。
個中邏輯并不難解釋。
進入到萬物智能時代后,人機交互勢必會出現復雜多樣的一幕,不同的產品有著不同的交互界面,不同的場景有著不同的輸入偏好,不同的用戶群體有著不同的需求,想要解決新的輸入問題,既需要產品功能的持續創新,也需要內容生態的不斷壯大,“i-Blocks”輸入個性化內容開放平臺擔綱的正是內容生態的建設。
以當前最為熱門的智能車機為例,首先要解決的是輸入效率,然后是個性化的滿足。比如定制化的皮膚提升品牌的用戶認知;再比如車機、手機、電腦的多端聯動,需要表情包、字體等元素進行表達……當輸入法的連接對象由過去的用戶和服務,衍生到終端客戶、品牌方、創作者、用戶差異化需求等更多層面,內容生態將是輸入法承接客戶訴求、滿足用戶需求的重要支撐。
找到的最新一組數據是:目前訊飛輸入法個性化內容服務使用者中年輕用戶占比達48%,吸引了內容創作者過萬人,內容使用量多達100億次。而在萬物智能時代,內容使用需求注定會爆炸性增長。
做一個總結的話,訊飛輸入法的優先級、競爭壁壘和技術優勢,決定了其行業地位短期內不會被挑戰,進一步拓寬語音輸入場景,并在內容生態上不斷積蓄力量,不失為一種正確且有前瞻性的打法。
04 寫在最后
按照官方公布的數據:目前訊飛輸入法的日活用戶已突破1億,語音滲透率達到75%,日語音調用量較2021年提升45%。
不難給出合理的解釋,語音為主、鍵盤觸摸為輔、肢體語言動作為補充的混合交互,滿足了萬物智能時代的基本特征,既是訊飛輸入法語音調用量逐年增長的誘因,也是其走向萬物智能新世界的戰略基石。
在語音賽道深耕十二載的訊飛輸入法,正在讓越來越多用戶擺脫人機交互的種種煩惱,改變不同代際用戶群體的交互習慣,沿循著“效率為王”的初心和恒心,賦以輸入生態新勢能、新方向、新動能。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)