|
藍委柯志恩。(中評社 俞敦平攝) |
中評社台北11月11日電(記者 俞敦平)中國國民黨籍“立委”柯志恩今日在“立法院”教育及文化委員會質詢“中研院”院長廖俊智,質疑當前“中研院”所使用的大部分數據來源來自中國大陸,認為“中研院”應加強台灣繁體中文語料庫建設,才能在全球語言模型競爭中保持地位。廖俊智回應,表示“中研院”已意識到此問題,並承諾加強中文語料庫的擴展與優化,以支持台灣的語言技術發展需求。
“中研院”長廖俊智11日應“立法院”教育及文化委員會邀請列席報告業務概況並備質詢。
柯志恩首先指出,當前“中研院”所使用的AI訓練資料大部分數據來源來自中國大陸,使得所研發的AI模型在面對台灣在地語言需求時顯得不足。柯志恩進一步指出,簡體中文在全球AI語料的比例已達16%,而繁體中文僅佔0.05%,使得在全球語言模型中,繁體中文的存在感相對薄弱。
|