AI 技術讓古籍數字化回歸:AI識別20萬頁古籍 準確率達97.5%( 二 )


阿里巴巴達摩院院長張建鋒表示,守護中華傳世典籍,是科技工作者和文化工作者共同的使命 。阿里計劃將這套技術工具連同古籍數字化平臺一并捐贈,交由權威公共機構長期運營,同時,阿里仍將在古籍數字化工作上持續投入人力物力 。
目前,在該系統基礎上,達摩院研發搭建了集古籍數字化交互式訓練、古籍全文內容檢索、古籍漢字字典三大功能于一體的漢典重光古籍數字化平臺 。隨著今后數字化規模的擴增,系統的識別準確率和識別效率還將不斷提升 。
據徐盈輝透露,未來,該平臺將嘗試拓展數據數量、進行更加詳細的數據挖掘、分析,提高識別準確率 。達摩院希望能夠實現古籍全文檢索的能力:只要在平臺輸入命名實體,比如一個人名、地名,就可以知道這個人名曾經出現過哪些典籍里面 。

推薦閱讀