跳到主要內容區塊

僑務電子報

:::

用台語打造AI翻譯系統 Meta陳鵬仁:開民宿伯父想買

2022-10-28
中央社提供
分享
分享至Facebook 分享至Line 分享至twitter
臉書母公司Meta推出閩南語英語AI翻譯系統,來自台灣的軟體工程師陳鵬仁是幕後推手之一,他表示開發過程中最大困難點是尋找語料庫,除了與台灣的學術單位合作,也參考台灣連續劇中比較口語的說法。(Meta提供)
臉書母公司Meta推出閩南語英語AI翻譯系統,來自台灣的軟體工程師陳鵬仁是幕後推手之一,他表示開發過程中最大困難點是尋找語料庫,除了與台灣的學術單位合作,也參考台灣連續劇中比較口語的說法。(Meta提供)
來自台灣的Meta AI(人工智慧)研究員陳鵬仁與團隊共同開發閩南語英語翻譯系統,陳鵬仁在美國工作少有機會講閩南語,為了維持語感,會和小孩一起讀閩南語繪本。(Meta提供)
來自台灣的Meta AI(人工智慧)研究員陳鵬仁與團隊共同開發閩南語英語翻譯系統,陳鵬仁在美國工作少有機會講閩南語,為了維持語感,會和小孩一起讀閩南語繪本。(Meta提供)

臉書母公司Meta打造「台語翻英語」的人工智慧(AI)翻譯系統,引起廣大迴響,幕後推手之一為來自台灣的Meta AI研究員陳鵬仁,他首度接受訪問笑說,開民宿的伯父看到新聞後,追問是否有販售,方便接待外國觀光客。

Meta日前發布用閩南語(台語)與英語互譯的AI軟體,主要幕後功臣為陳鵬仁,出生於台灣的他,曾在新北市板橋居住20多年,畢業於台灣大學資訊工程學系,在台工作1年多後即加入Meta公司前身臉書的紐約辦公室。

在Meta工作近10年的陳鵬仁,主要負責AI相關,臉書的地點打卡功能精進就由他操刀,4年前研發文字翻譯,1年半前轉為研究語音對語音翻譯。

陳鵬仁接受媒體訪問時坦言,這套系統獲得媒體關注感到十分意外,新聞報導出來後,伯父透過父親詢問是否有販賣,因為伯父經營民宿,不太懂英文,如果有這套軟體,未來接待國外觀光客會方便許多。

他談到,閩南語是很複雜語言,儘管開發團隊成員大多聽得懂、會講台語,但牽涉到七聲八調,開發難度大增,翻譯系統發出來的聲音有時候腔調不對,需要找出新的研究課題設法解決,這是開發閩南語翻譯系統比較特別部分。

在研究過程中,陳鵬仁和團隊也有進行使用者意見調查,找出語音到語音翻譯系統有哪些特性,因此接觸到一些閩南語使用者,對於這項專案都非常熱情,提供很多建議。團隊甚至找來一名閩南語老師,協助團隊更精準翻譯閩南語。

被問及在美國工作如何讓小孩學會閩南語,陳鵬仁表示,有跟太太討論如何把閩南語帶到日常生活中,讓小孩自然而然熟悉這個語言。他的大女兒目前約4歲半,小女兒約1歲半,有透過一些輔助教材讓她們熟悉閩南語,例如睡前讀閩南語繪本,或跟小孩一起聽閩南語兒歌及流行音樂。

陳鵬仁透露,現在有越來越多以閩南語為主的Podcast,講一些有趣素材,自己平常走路或送女兒去學校時會收聽。YouTube上也有很多自媒體用閩南語介紹有趣事情,透過這些方法可以維持聽力。說的部分在家裡跟小朋友講,保持對閩南語的熟悉度,遇到有些字真的不會講,台灣也有很多相關網站可以查詢。

他說,在工作上可以做一個專案,打造出自己聽得懂的翻譯系統,覺得很幸運也很開心,過程中也學習更多閩南語知識,例如本來不知道七聲八調怎麼講,一方面是為了工作,另一方面是自己也想了解。

陳鵬仁強調,對翻譯系統而言,語料收集是很困難的部分,即使有語料資料,但授權不明確就難以使用。如果能引起外界更多重視,在推動閩南語翻譯系統和AI應用落地會有很大幫助,畢竟這不是單一機構或個人可以完成的事情。

提到翻譯系統下一步規劃,陳鵬仁表示,希望繼續提升精準度,解決閩南語變調問題,因為閩南語有聲調和各種不同語氣來表達問句或肯定句,都不是透過文字可以表達,會是接下來研究重點。

媒體提問未來是否可能納入如客家話或原住民語等其他台灣在地語言,陳鵬仁表示「有可能」,對於接下來要選擇哪些語言,Meta團隊還在討論,客語確實是考慮的語言之一,會評估不同因素來決定哪些語言優先發展,再繼續擴張。

 

相關新聞

top