使用人工智能填補古代文本的空白

【使用人工智能填補古代文本的空白】很多文章的報道都是由微觀而宏觀,今日小編講給大家帶來的關于使用人工智能填補古代文本的空白的資訊也不例外,希翼可以在一定的程度上開闊你們的視野!y有對使用人工智能填補古代文本的空白這篇文章感興趣的小伙伴可以一起來看看
恩里克·希門尼斯利用人工智能填補了3000年前早期城市社會中文士在粘土片上寫下的幸存文本中的許多誘人差距 。

使用人工智能填補古代文本的空白

文章插圖
單個角色通常可以在明確的閱讀和令人費解的難題之間產生差異 。EnriqueJiménez是古代近東研究的專家,致力于重建世界文學的起源 。美索不達米亞是第一個真正文明的家園,大約在公元前2500年左右浮現了豐富的雙語文學文化 。它的文本用粘土片上的楔形文字書寫在蘇美爾和阿卡德 。這些文本只能以片段形式存在 , 許多片段只能測量幾厘米 。Jiménez和他的同事面臨的挑戰是確定屬于一起的部分 - 腳本本身是多價的,語義依賴于高度依賴于上下文 。“由于缺少單個標志而不得不放棄對文本的處理令人非常沮喪 , 特殊是當你知道必須有某個片段填補空白時 。”
恩里克·希門尼斯(EnriqueJiménez)在人工智能的幫助下為自己設定了填補這些痛苦差距的目標,并獲得了亞歷山大·馮·洪堡基金會(Alexander von Humboldt Foundation)頒發的索菲亞·科瓦列夫斯卡婭獎(Sofia Kovalevskaya Prize),以幫助他實現這一目標 。該獎項旨在使初級學者能夠在自己選擇的領域開展創新研究項目 。Jiménez選擇在LMU進行他的項目,在那里他在Assyriology研究所和古代歷史系擔任雙重任命,他的電子巴比倫文學研究小組就在那里 。他和他的團隊已經開始組建一個“片段館” , 一個數據庫,世界博物館中的所有文本片段都將找到它們的位置 。該項目于2018年5月開始,數據庫現在包含大約10,000個片段 。“我希翼大約15歲,
大英博物館有40,000個碎片
Assurbanipal在2700年前在他的首都尼尼微建立了他的圖書館,旨在匯合他那個時代所收集的知識和智慧 。在他去世后,圖書館被公元前612年制服該城市的巴比倫人摧毀,其館藏被粉碎 。考古學家回收的大部分碎片現在都在倫敦大英博物館 。其中大約一半尚未被破譯 - 恩里克·希門尼斯與博物館合作,將這項任務作為其項目的一部分 。5月,該博物館的兩名工作人員開始拍攝該機構持有的其他粘土片,而Jiménez及其團隊將在未來5年內制作4萬張碎片楔形片的照片 。
多年來 , Jiménez向來在探究數字媒體開發的機遇 。首先,他自己編寫了簡單的程序 。現在他與數據科學家緊密合作 。在耶魯大學期間,他參與了Cuneiform評論項目,該項目旨在發表關于古代美索不達米亞文學的在線評論 。他還在一個專門的網站上提供他的研究成果 。他目前正在參與培訓該計劃,以“閱讀”阿卡德語 , 并認識到所有可能的阿卡德語文本中使用的符號讀數 。“目標是讓程序能夠識別字符序列,它可以自動插入到適當的上下文中 。這對于計算機來說比對我們人類來說更容易 。計算機可以立即考慮所有可想到的可能性,
希訥尼斯本人專注于在公元前一千年伊拉克時期流傳的文學文本 - 當時阿克卡文文學處于蓬勃進展的狀態 - 以及以詩歌形式寫成的文本 。在整個項目過程中 , Jiménez打算開辟一個包含大約10,000行的文本語料庫 。在這項努力中,他與巴格達大學的Anmar A. Fadhil博士合作,他在巴比倫北部著名的西帕爾圖書館策劃了一個文學平板電腦檔案 。希臘歷史學家貝羅索斯的生命跨越了公元前4世紀至公元3世紀的轉折,解釋了據稱它是如何產生的:當諾亞得知大洪水迫在眉睫時,在他登上方舟之前,據說他埋葬了在登上方舟之前,在西帕爾市的整個美索不達米亞著作 。西帕爾位于現今巴格達附近 , 但其圖書館僅在1986年被發現 。其中包括史詩“Enumaeliš”(巴比倫版本的創作,以及“非常美麗的文字”),Jiménez )和大洪水的描述 。“一方面,這些文本與我們熟悉的故事截然不同 。另一方面,不同版本之間存在很多相似之處,包括主題相似之處 。我們與伊拉克同事一起計劃公布最重要的文學片 。其中之一是關于“正義之人的苦難”的詩歌片段,這是巴比倫作品的故事 。“ Enumaeliš“(創作的巴比倫版本,以及”一個非常美麗的文本 , “Jiménez說)和大洪水的描述 。”一方面,這些文本與我們熟悉的故事非常不同 。另一方面,不同版本之間存在很多相似之處 , 包括主題相似之處 。我們與伊拉克同事一起,計劃出版最重要的文學片 。其中一個是關于“正義之人的苦難”的詩歌的一部分,這是巴比倫工作的故事 。“ Enumaeliš“(創作的巴比倫版本 , 以及”一個非常美麗的文本,“Jiménez說)和大洪水的描述 。”一方面 , 這些文本與我們熟悉的故事非常不同 。另一方面,不同版本之間存在很多相似之處,包括主題相似之處 。我們與伊拉克同事一起,計劃出版最重要的文學片 。其中一個是關于“正義之人的苦難”的詩歌的一部分,這是巴比倫工作的故事 。“ 包括不同版本之間的主題相似之處 。我們與伊拉克同事一起,計劃出版最重要的文學片 。其中一個是關于“正義之人的苦難”的詩歌的一部分,這是巴比倫工作的故事 。“ 包括不同版本之間的主題相似之處 。我們與伊拉克同事一起,計劃出版最重要的文學片 。其中一個是關于“正義之人的苦難”的詩歌的一部分,這是巴比倫工作的故事 。“
這首詩講述了一個正義男人的故事,然而他卻遭受了多次懲處 。在文本的中點,主角首先受到懲處,然后赦免,并在夢中收到赦免的消息 。Jiménez和Fadhil能夠將Sippar圖書館的短文本片段分配給詩歌中的夢想劇集 , 從而填補了之前已知版本的空白 。“我們現在能夠解讀這段經文,過去2000年沒有人能夠閱讀 。我們重建了一個被認為是古代經典的文學文本,并為現今的讀者解救了它 。”
希訥尼斯還發現了一首獻給巴比倫神馬爾杜克的贊嘆詩片段 。“我所處理的文本都是詩歌文本 。阿卡德語詩歌的編寫方式中間有明顯標記的caesura 。將這種詩意結構翻譯成德語非常困難 。” 在學術出版物中 , 文本通常逐字翻譯成英文 。EnriqueJiménez已將重新組合且現在完整的行翻譯成德語,下面給出的英文版本是該文本的免費呈現(新發現的短語以斜體顯示):
“馬杜克,你的憤慨就像一場洶涌的洪水,
但是在早晨,你的憐憫給你的受害者帶來安慰 , 
可怕而可怕的風暴已經減弱,
海浪在那里轟鳴,海岸現在平靜,你現在擁有
黑暗威脅的云彩照 。
當灼熱的烈日狂風呼嘯,你的陽光明麗的日子,現在統治 “ 。
研究人員可以從這些關于古代美索不達米亞日常生活的文本中學到很多東西 - 關于他們每天處理的物品以及一般的社會生活 。“正義之人的苦難”描述了主人是如何醒來并與他的隨行人員交談的 - 這段經文表明他有一個仆人,他的職責包括早上醒來他的主人 。
“就其功能而言,巴比倫的文學與我們的文學并沒有太大差別 , ”Jiménez說 。經典作品不斷被復制,主要是因為它們是學校閱讀和寫作教學的典范段落的來源 。但是 , 制造史詩在傳統上為慶祝新年的到來而舉行的節日中被公開朗誦 。巴比倫經典也遭遇了一種即使在今天仍然很熟悉的命運:它們經常被摹仿 。“這些摹仿告訴我們很多關于美索不達米亞人民與他們自己的傳統之間的關系 。例如,”正義之人的痛苦“中的一行被稍微修改,以便把它變成一個笑話 。我們有一個非常對現代世界文學傳統的態度相似 。一方面,
不幸的是,已經研究過的摹仿中存在許多空白,因為許多平板電腦曾經遭受過一次或多次損壞 。“我相信,在計算機的幫助下,我們將能夠在未來40到50年內重建整個阿卡德文學 。對我們來說,數字媒體只是工具:我們不是在抽象算法我們想用它們來建立錄制的文本 。如果不了解它的文學經典 , 就不可能理解任何文明 。“

    推薦閱讀