點擊右上角微信好友
朋友圈
請使用瀏覽器分享功能進行分享
作者:王立非(北京語言大學高級翻譯學院教授)
智能語言服務是指利用人工智能(AI)和自然語言處理(NLP)技術提供語言相關服務,其通常包括機器翻譯、自然語言處理、語音識別與生成、圖像處理與生成、信息抽取、文本情感分析、內容創作、AI大語言模型等。這些服務能夠模擬人類對語言的理解和生成能力,以智能的方式處理和生成語言內容。智能語言服務根據技術類型可分為機器翻譯、自動語音識別、自然語言處理等技術;根據應用場景可分為智能翻譯、智能客服、智能語音助手等;根據服務對象可分為個人服務和企業服務,個人服務如個人智能翻譯機、手機應答軟件等,企業服務如企業機器翻譯平臺等;根據服務形態可分為在線服務和離線服務,在線服務如在線翻譯網站、實時語音翻譯等,離線服務如離線翻譯器、語音識別軟件等。
我國高度重視語言服務產業的發展,先后出臺了多項政策支持人工智能語言技術開發和應用。《“互聯網+”人工智能三年行動實施方案》提出,加快計算機聽覺、生物特征識別、復雜環境識別、新型人機交互、自然語言處理、機器翻譯等應用技術的研發和產業化?!缎乱淮斯ぶ悄馨l展計劃》明確提出,推進人類與機器的有效溝通和自由交互,實現多風格、多語言、多領域的自然語言智能理解和自動生成,著力研究短文本的計算分析技術,跨語言文本挖掘技術和面向機器認知智能的語義理解技術、多媒體信息理解的人機對話系統?!缎乱淮斯ぶ悄墚a業創新重點任務揭榜工作方案》提出,大力構建行業訓練資源庫,在工業、醫療、金融、交通等領域匯集一定規模的行業應用數據,用于支持創業創新?!豆膭钔馍掏顿Y產業目錄(2022年版)》首次將“語言服務產業”列入第460條,明確包括翻譯、本地化服務、語言技術開發應用、語言資源服務等?!懂a業結構調整指導目錄(2023年本)》在第一類鼓勵類產業中首次增加翻譯、本地化服務、語言文字技術開發應用等語言服務。
根據北京語言大學國際語言服務研究院即將發布的《中國語言服務市場發展報告》(2024)統計,截至2023年底,我國的機器翻譯與智能語言服務市場總產值為616.9649億元,全國機器翻譯與智能語言服務從業者達288735人。招聘網站數據顯示,2024年6月,各類智能語言服務招聘崗位需求為26989個,這反映出機器翻譯與智能語言服務市場人才需求的旺盛。培養和儲備適應人工智能新技術的語言人才是企業發展的關鍵。
發展智能語言服務學科具有重要價值
面對我國日益增長的智能語言服務市場,培養國家需要的智能語言服務人才顯得十分迫切和必要。智能語言服務學科建設只能依靠自主創新,走中國特色的自主知識體系創新道路,國際上沒有現成的智能語言服務學科模式和學科經驗可以借鑒。北京語言大學在相關學科領域進行了有益的嘗試,先后在中國語言文學一級學科下自主設立了“語言智能與技術”二級學科(語言智能與技術方向、語言數據挖掘方向)和“語言資源學”二級學科(語言資源建設方向);在外國語言文學一級學科下自主設立了“國際語言服務”二級學科(語言智能教育研究方向),奠定了一定的學科基礎,但學科方向沒有形成完整的學科體系。
智能語言服務學科是智能語言服務教育的學科依托,具有重要的學科價值和教育價值。就學科價值而言,首先,智能語言服務學科具有學科交叉性,融合了語言學、計算機科學、人工智能、數據科學和認知科學等多個學科,推動了跨學科研究的發展。其次,智能語言服務學科具有技術創新性,神經機器翻譯和預訓練語言模型技術不僅極大地提升了語言服務的效率和水平,還推動了其他相關技術的發展。再次,智能語言服務學科具有社會服務性,可以更好地滿足社會對高效、準確語言服務的需求,促進社會發展,提升公共服務的質量。
就教育價值而言,第一,智能語言服務學科具有人才培養價值,有助于培養既通語言又懂人工智能和數據技術的復合型人才,能在科技公司、政府機構、翻譯行業、國際組織中發揮競爭優勢。第二,智能語言服務學科具有教育創新價值,推動教育內容的迭代和創新,促使高校優化課程設置,更新教學內容。機器翻譯、語音識別、文本生成等領域的新成果和新應用為課程注入了更多前沿性內容,增加了科技含金量。第三,智能語言服務學科具有提升能力的價值,能促進學生獲得實踐經驗,將所學知識應用于解決實際問題,從而提高應用能力和創新能力。第四,智能語言服務學科具有持續學習的價值,不斷促進從業者學習新知識,提升自身技能,保持競爭力和創新力。建設智能語言服務學科不僅學術意義重大,而且對我國的經濟社會發展影響深遠。
智能語言服務學科體系建設重點
智能語言服務學科需要重點建設以下四個核心學科方向,即語言智能學、語言數據學、計算翻譯學和翻譯技術學,應大力培養我國漢外語言智能、漢外語言數據、漢外機器翻譯和漢外翻譯技術領域的語言人才。
語言智能學結合了語言學、計算機科學、人工智能、認知科學等領域,旨在研究和開發能夠理解、生成、處理和應用自然語言的智能系統。目標是通過計算機和人工智能技術實現對人類語言的全面理解和應用,從而提升語言服務的效率和質量。研究重點包括自然語言理解、自然語言生成、對話聊天系統、文本情感分析等。
語言數據學結合語言學與數據科學,旨在通過數據分析、機器學習和統計方法,研究和處理語言數據。目標是通過大數據技術和算法分析,從海量語言數據中提取有價值的信息和知識,應用于自然語言處理、語言研究和實際應用中。研究重點包括語料庫構建、數據標注與清洗、數據分析與挖掘、語言資源管理等。
計算翻譯學結合了翻譯學、計算語言學、計算機科學和人工智能,致力于利用計算技術實現和改進翻譯過程,提高翻譯效率和翻譯質量。研究內容廣泛,涵蓋理論研究、技術開發和實際應用。研究重點包括翻譯理論與模型、機器翻譯、翻譯質量評估、翻譯平行語料庫建設與分析、多語言與跨語言處理等。
翻譯技術學結合翻譯學、計算機科學、信息技術和項目管理,研究和開發各種技術工具和方法,支持和改進翻譯過程,涵蓋從翻譯工具的開發和應用到翻譯流程的自動化和優化。研究重點包括翻譯工具的開發與應用、翻譯管理系統、自動化工作流程、翻譯質量控制、多語言內容管理等。
智能語言服務學科的四個學科方向之間既有共同點,又有區別,相互之間既有密切聯系,又相對獨立,各有側重,一同構成了智能語言服務學科的學科生態體系。
從學科共同點看,四個學科方向都是交叉學科,結合了語言學和計算機科學,注重跨學科的研究和應用;四個學科方向都由技術驅動,依賴于先進的計算技術、人工智能、機器學習和大數據分析;四個學科方向都應用廣泛,應用于智能語言教育、智能傳播、智能商務等眾多領域。
從學科不同點看,四個學科方向都有各自的研究重點,語言智能學側重于理解和生成自然語言;語言數據學專注于語言數據的處理和分析;計算翻譯學主要研究機器翻譯過程和質量評價,以及多語言處理;翻譯技術學則關注計算機輔助翻譯工具應用、翻譯過程的優化和翻譯項目管理。
未來,智能語言服務將融合新技術和實際需求,通過深度學習、多模態處理、個性化服務和隱私保護等方面的創新,推動語言服務向更智能、更高效和更安全的方向發展。智能語言服務學科和智能語義服務人才將大有可為。