AI通过儿童眼睛和耳朵學(xué)习语言-中國(guó)信息化•中國(guó)信息协会

AI通过儿童眼睛和耳朵學(xué)习语言

来源：科(kē)技日报作者：发布时间： 2024-02-02

科(kē)技日报北京2月1日電(diàn) （记者张梦然）美國(guó)纽约大學(xué)研究人员开展了一项实验，他(tā)们通过一个孩子的眼睛和耳朵来训练多(duō)模式人工智能(néng)（AI）系统，使用(yòng)的数据来自孩子6个月大到两岁生日期间的头戴摄像头的视频记录。发表在最新(xīn)一期《科(kē)學(xué)》杂志(zhì)上的这项研究表明，该模型或神经网络实际上可(kě)利用(yòng)孩子经历的有(yǒu)限片段，學(xué)习大量的单词和概念。也就是说，视频只捕捉了孩子大约1%的清醒时间，但这对于真正的语言學(xué)习来说已经足够。

　　GPT-4等AI系统现在可(kě)學(xué)习和使用(yòng)人类语言，但它们从海量的语言输入中學(xué)习，遠(yuǎn)比儿童在學(xué)习如何理(lǐ)解和表达语言时接受的要多(duō)。最好的AI系统训练的文(wén)本数量达到数万亿字，而儿童每年只能(néng)收到数百万字的文(wén)本。

　　由于数据存在巨大差距，研究人员一直怀疑AI的最新(xīn)进展能(néng)否反映出很(hěn)多(duō)有(yǒu)关人类學(xué)习和发展的信息。此次，研究团队从孩子6个月大开始，到25个月大结束，每周通过头戴式摄像机，捕获其第一视角视频并分(fēn)析。他(tā)们共使用(yòng)了超过60小(xiǎo)时的视频素材，包含大约25万个单词实例（即所传达的单词数量，其中许多(duō)是重复的）。这些单词实例与孩子在说出这些单词时所看到的视频帧相关联，包括进餐、读书和玩耍等各种不同的活动。

　　经过训练后，团队对模型进行了测试。他(tā)们向模型提供目标单词和四个不同的图像，要求它选择与目标单词匹配的答(dá)案。结果表明，该模型不但能(néng)够學(xué)习孩子日常经历中存在的大量单词和概念，还可(kě)以将它们概括為(wèi)视觉实例，哪怕实例与模型训练中看到的完全不同。

　　【总编辑圈点】

　　让AI用(yòng)孩子學(xué)习语言的方式學(xué)习，其实可(kě)以反过来帮助人们提升儿童教育。譬如说，怎样才是儿童學(xué)习一门语言更合理(lǐ)的方式？孩子们需要被传授多(duō)少知识？或者只是让他(tā)们通过联想去學(xué)习？其实专家们一直有(yǒu)所争论。使用(yòng)AI模型来研究儿童面临的真正學(xué)习问题，是一项创举，因為(wèi)人们可(kě)借此解决许多(duō)经典争论。其办法也很(hěn)简单——让算法进步与孩子自然體(tǐ)验相结合，就可(kě)能(néng)重塑人们对人类早期语言和概念掌握的理(lǐ)解。

上一篇：“合伙人”还是“上班族”？网络直播劳动争议引关注
下一篇：半导體(tǐ)市场迎转机

地方动态

中國(guó)信息协会会長(cháng)王金平参加第七届数字中國(guó)建设峰会

全國(guó)大學(xué)生创新(xīn)发明大赛暨“英创工程”启动

赋能(néng)未来，共创数智化新(xīn)纪元：中國(guó)信息协会集团企业数字化工作委员会正式成立

中國(guó)信息协会第四届信息技术服務(wù)业应用(yòng)技能(néng)大赛新(xīn)闻发布会在京召开

协会要闻
通知公告


关注中國(guó)信息协会官微	关注中國(guó)信息化网官微