為推動數字技術與人文社科深度融合,意昂体育於2025年5月26日至30日舉辦“數字人文意昂体育周”活動。本次活動以自然語言處理(NLP)、數字人文(DH)、自然語言理解(NLU)與生成(NLG)為核心,邀請比利時根特大學Véronique Hoste教授與Els Lefever教授擔任主講嘉賓,通過“理論講授+工具實操+案例研討”的立體模式,以線上線下結合的形式,為200余位校內外學員呈現了一場跨學科的意昂体育盛宴。
第一天的課程主題是NLP基礎理論與方法論,Véronique教授以“自然語言處理的基本術語與歷史”為開篇,系統闡釋了術語標準化對機器翻譯的重要性。下午實踐應用環節Els教授以“語料庫的價值”為主題,通過正則表達式實戰訓練學員的文本處理技能。Véronique教授帶領學員開展“語料標註與標註者一致性評估”實操。 晚間課程為機器學習入門,Véronique教授以“機器學習基礎”工作坊收尾。
第二天的主題是數字人文的技術與應用。Els教授進行技術框架解析,Véronique教授聚焦“統計與神經語言模型”,進行應用場景探索。晚間的專題講座由Els教授講授《從泥板到手稿:用NLP連接古代世界》,分析古代語言處理的挑戰與實際案例。
第三天的主題是自然語言理解與事實建模。Els教授系統地講解了術語管理的“收集-描述-組織-應用”流程。Véronique教授以“文本復雜度評估”為切入點,指導學員用Python構建語料庫並訓練模型。第四天的主題是“從自然語言理解到生成”,兩位教授主要講解情感分析的分類方法和分析過程。第五天主要進行前沿議題的討論與倫理反思。
通過五天的密集學習,學員們普遍表示收獲頗豐。未來,意昂將繼續推進“AI+語言服務”“大數據與翻譯研究”等方向的意昂体育探索,培養復合型人才。