沃卡惠移动端logo

沃卡惠  行业资讯

资讯详情

尖端人工智能工具如何重塑历史

2023-01-31 08:36:044636

很少有一个月没有关于前瞻性和自主系统准备改变我们未来的新报告。我们不常听到的是越来越多地使用人工智能(AI)来审视我们的过去。

历史学家、考古学家、音乐家和数据科学家正在部署AI来重新想象和重现历史时刻。就像现代计算发展的许多故事一样,人工智能的成功基于协作、机会和实验的价值。

要从AI中获得最佳结果,人类面临着巨大的挑战,而且工作中没有灵丹妙药。专家们面临的挑战需要不同的解决方案,同时具有惊人的共性。恢复性人工智能的偏见和伦理也受到广泛关注,我们应该如何解释和分类此类作品。

尖端人工智能工具如何重塑历史

揭开古代雅典的秘密

牛津大学古代史教授乔纳森·普拉格(Jonathan Prag)一直对计算充满热情。“我开始研究绘图和视觉分析,这导致我试图建立一个包含古代西西里岛所有铭文的数字目录,”他说。

Prag是一位金石学家,专攻刻在石头上的古希腊文字的修复。几个世纪以来,许多雕刻被砸成碎片,其中一些从未被复原,文字之间留下了巨大的空白。2018年,Prag的博士生Thea Sommerschield和Google DeepMind的Yannis Assaelto建议使用AI来加快填补古代文本空白的费力过程。“我只是坐在那里就走了,太酷了!你可以做到吗?”

一个成功的AI项目依赖于高质量的源数据来“学习”,而Prag的团队没有。“在八十年代,惠普公司动员学者们将已出版的希腊铭文打印出来,”他说。“它非常混乱,因为它在某个时候从测试版代码变成了Unicode,所以它充满了人工制品”。

Sommerschield煞费苦心地清理了数据,为团队提供了超过100,000条文本,团队从中训练了第一台人工智能机器Pythia,以假设希腊文本中缺失的单词。然而,Pythia的继任者已经在开发中。“伊萨卡关注文本中的模式,参考每个文本的来源区域和建议的日期,”Prag说。

伊萨卡岛已经解决了雅典文献中关于希腊字母S,sigma的一个猜想点。“国家放弃了sigma的三栏形式,这使你能够在公元前445年的一侧或另一侧放置一堆文本,”Prag指出。这个日期标记曾被认为是历史学术界的福音,但当伊萨卡岛公布数据时,少数反对者一定会欢呼雀跃。“我们对Ithaca的原始数据进行了分析,得出了新的日期,将它们向下移动了大约30年”。

普拉格补充说,这种转变改变了对雅典帝国主义关键时期的解释,并对我们对希腊历史的解读产生了重大影响。

使用神经网络寻找失落的坟墓

悉尼大学的吉诺·卡斯帕里(Gino Caspari)博士是一位考古学家,他研究过斯基泰人(Scythian)的墓葬,斯基泰人是3,000多年前生活在亚洲部分地区的古老游牧部落。

他们与一位同事合作,建立了一个卷积神经网络(CNN),该网络使用卫星图像识别圆形结构,寻找失落的斯基泰人墓葬。“一年后到达调查区,我立即意识到自己错得离谱,”他说。“我原以为是掩埋结构的东西实际上源于当地人在圆形围栏区域过夜圈养绵羊”。

卡斯帕里(Caspari)长途跋涉去看别人的羊羔是因为人工智能的数据不佳。“限制是高分辨率卫星数据的可用性,这对于考古项目来说太昂贵了,”他补充道。

他最近在南美洲追踪具有3,000年历史的美洲原住民定居点的工作是使用商业软件包ArcGIS完成的。“在考古学方面,我们显然不在人工智能发展的最前沿,积极从事人工智能工作的人数也很有限,”他说。“为了获得更广泛的采用,我们最终需要一种直观的GUI,让您无需编码即可训练模型”。

重要的是要记住,尽管反乌托邦的头条新闻可能暗示,人工智能只是一种可定制的工具。Caspari博士将人工智能、激光雷达图像和多光谱数据结合起来寻找更多的定居点,其中包括许多位于比以往任何时候都更靠北的定居点。如果没有人工智能,这能实现吗?“是的,但这会花费更多时间,”他争辩道。“由于训练数据集较小,我们经常会有大量的误报检测,而这些仍然需要手动剔除。在大多数情况下,由于缺乏训练数据,我们并没有真正达到超人的表现。”

复活丢失的电影

1888年,在约克郡利兹奥克伍德庄园的花园里,“电影摄影之父”路易斯·勒·普林斯(LouisLe Prince)正在使用他的发明电影摄影机拍摄怀特利一家。今天,我们认为现存最古老的电影只剩下20个颗粒状的画面,但这并没有阻止Denis Shiryaev使用AI来创造一些相当奇妙的东西。“我一直是历史迷,我决定运用我的人工智能知识,”他说。

使用科学博物馆网站上发布的图像,Shiryaev重新激活了剧照,应用CNN为面部添加细节并提升分辨率。该工具总共生成了250个彩色稳定帧。“我是我自己观众的创作者,”Shiryaev说。“AI着色不是真实的,而且在历史上也不准确。我根据旧源照片或绘画生成面孔,它也是一个近似值。我认为这个视频是AI的小免责声明很重要。”

他使用AI不是为了建立历史准确性,而是将真实感注入旧镜头,让现代观众耳目一新。近6500万次YouTube的点击率凸显了人们的兴趣。“我把这种流行视为一个机会,”他说。“好莱坞的一些公司,大品牌,联系了我”。

2020年,Shiryaev推出了neural.love,这是一种基于云的自动AI服务,可以让任何人都可以使用媒体增强功能。“我们有一个很棒的功能,叫做Generate Portfolio,”他说。“你可以上传非常低分辨率的旧照片并生成高质量的肖像,人们喜欢它”。

清理旧点击

人工智能在音乐行业中的一个流行用途是通过去除噪音和人工制品来增强旧录音,这些噪音和人工制品通常从它们被捕获的那天起就存在。1972年5月,歌手玛丽·霍普金(Mary Hopkin)在伦敦皇家节日音乐厅(Royal Festival Hall)演出,场地工程师拍下了她的精彩表演。到2005年,录音的技术质量需要一些帮助,正如玛丽的儿子摩根维斯康蒂所解释的那样。“我认为这可能是仓促完成的;我认为这是四分之一英寸的磁带,”他说。“噪声流很重,而且随着演出接近尾声,情况变得更糟,噪声多于信号。”

Visconti是一位对技术充满热情的音乐家和制作人。“我和我妈妈聊了聊消除噪音的事情,并建议她让我试一试,这太棒了。只是在没有噪音的情况下听到它,感觉就像提神一样,就像你清理耳朵来听到细微差别一样。她对此非常满意”。

在使用iZotope的母带处理套件灵光一现后,实验和热情再次磨练了Visconti的技能。“这个功能——音乐重新平衡——只是让人大开眼界——或者说是让人大开眼界,”Visconti说。“能够进入混音轨道并为贝司、人声、鼓、吉他和键盘制作音轨。这是我小时候的梦想。我疯了,我把所有东西都拆开,就像披头士乐队的旧唱片一样,我想,‘我能用这个东西做什么’。”

Visconti将AI视为音乐制作人可用的另一种工具,并且在音乐工作室长大,他见过所有这些工具。他的父亲是传奇音乐制作人托尼·维斯康蒂(Tony Visconti),他请摩根为Moonage Daydream的配乐洒上技术星尘,这是一部关于大卫·鲍伊(David Bowie)生平和事业的新电影。

“导演使用了大量现成的镜头,其中一个片段是Bowie和我一起演奏摇滚乐,但混音效果并不好。和Festival Hall一样,这是直接录制成单声道的。我能够提供单独的人声、鼓、键盘和贝斯音轨,而托尼能够为电影重新混音。”

修复腐朽的艺术品

人工智能仍然是一项实验性技术,即使对于最大的科技公司也是如此。Emil Wallner是Google艺术与文化实验室的成员。“我们试验最前沿的技术,并试图找到有趣的领域来应用它,”他说。“有时它不起作用,我们不发表东西,有时我们有有趣的结果并分享它们”。

最近,该实验室对世界著名艺术家古斯塔夫·克里姆特(Gustav Klimt)的作品进行了实验。“我们去了很多博物馆,将藏品数字化,这样任何人都可以在线访问它们。在维也纳的Belvedere博物馆,开始处理这些学院画作的话题出现了。”

1945年,克里姆特备受争议的学院画作Jurisprudenze、Philosophie&Medizin被大火烧毁,只能通过少量旧的单色照片观看。为了给谷歌的AI一些颜色训练数据,Belvedere博物馆馆长兼克里姆特专家Franz Smola博士介入了。

Smola搜索了书面记录并收集了相似时期艺术家的画作,以参考他们的调色板和绘画类型。经过几个月的艰苦研究,Wallner的团队又花了六个月的时间将其转化为可用的机器数据。“我们只会让它添加一些像素和一些我们知道其颜色的图案。我们在机器学习模型中添加像素,从那里,它可以为整幅画着色。”

沃尔纳很清楚,这个非凡的项目不是修复,而是由于单色照片缺乏细节而重新着色。“一个领域是重现点画法,”他说。“他用了很多你看不到的黄金,所以你需要在3D环境中以某种方式增强黄金,以捕捉这些画作中金属元素的印象”。