首页 >> 木龙骨

科学家们提出了一种由神经网络驱动的新型BCI吹塑加工

吹塑加工    
2022年09月26日
科学家们提出了一种由神经网络驱动的新型BCI

两年前,一名因脊髓损伤而瘫痪的64岁男子使用脑机接口(BCI)实现了以每分钟8个单词的速度打字,这在当时是创纪录的。

加州大学旧金山分校(UCSF)的科学家们提出了一种由神经网络驱动的新型BCI,可以让瘫痪或中风的人以自然语音的速度(平均每分钟150个单词)交流。他们的这一研究成果4月24日发表在了Nature上,文章标题为“Speech synthesis from neural decoding of spoken sentences”。

USFC研究团队发表在Nature上的论文

该技术通过一个独特的两步过程运作:首先,它将大脑信号转换成声道(包括下颌、喉部、嘴唇和舌头)的运动。之后,它将这些运动合成为语音。该系统需要一个直接放置在大脑上的手掌大小的电极阵列。论文作者说,该系统概念验证了从脑活动中重建自然语音是可能的。

加州大学旧金山分校的研究人员使用了与上图中的电极阵列类似的一个颅内电极阵列来记录参与这项新研究的受试者的大脑活动。照片来源:UCSF。

在关于该研究的一则新闻报道中,UCSF神经外科医生、这项研究的负责人Edward Chang表示,许多研究都聚焦在从脑活动中解码声音或完整单词,但解码思想“非常困难” 。“我们很明确地尝试解码动作以创建声音,而不是直接解码声音。”

美国西北大学神经修复实验室的负责人Marc Slutzky(他并未参与该研究)说:“对于如何从脑信号中直接解码语音,这是一项酒店制服设计精美、执行良好的研究。”

然而,将这项技术转化为临床实践将是一个挑战,Slutzky补充说:“目前,FDA批准的设备中提取罐还没有哪种使用他们在高通道能力情形下使用的电极类型(他们在这里使用了256个通道),所以这仍然是一个障碍。但我相信这最终会被克服。”

有很多研究在应用神经网络——松散地模拟人脑的一套算法,常用于深度学习——来解释脑活动“发出”的声音,Chang的论文是这一系列努力中的最新成果。今年早些时候,两个独立的团队——西北大学的Slutzky实验室和哥伦比亚大学的Nima Mesgarani实验室——分别在Journal of Neural Engineering和Scientific Reports上发表了论文,他们都使用神经网络来从感觉网络的脑活动中重建语音。Chang的研究与这两项研究的不同之处在于,它分析的是运动皮层的脑活动。

西北大学Slutzky实验室发表在Journal of Neural Engineering上的论文

哥伦比亚大学Nima Mesgarani实验室发表在Scientific Reports上的论文

Mesgarani告诉IEEE Spectrum说:“最终哪种方法能更好地解码想象中的言谈情况,还有待观察,但很可能将两者结合起来的方法是最好的。”

包括Chang的研究在内的最近的各项研究都依赖于通过手术在大脑中或大脑上放置电极。虽然Facebook声称它正在开发一种能够每分钟从用户的大脑中读出100个单词的非侵入性技术,但它还没有发布支持这一说法的研究成果。专家们汽车球头同意,外部电极无法从小脑区提供足够精确的数据。专家们一致认为,外部电极无法提供来自脑部小区域的足够精确的数据。BrainGate联盟在2017年发表了那项关于瘫痪男子利用BCI实现每分钟打字8个单词的研究,最近它还发表了一篇关于瘫痪者利用BCI以“意念”操控平板电脑的论文,也都是依赖于植入大脑的芯片的。

在Chang及其同事们的研究中,他们在5名接受癫痫治疗的受试者的言语运动皮层植入了电极阵列,然后从这些电极阵列收集数据。研究人员记录了患者大声说出几百句话时的大脑信号。这些句子包括“这个跷跷板安全吗?”和“在第十二天黄昏时,我们会喝夏布利酒”等,它们是被特别挑选出来,囊括了英语的所有音标。

接下来,研究人员使用一个神经网络将这些高分辨率的脑信号解码成声道运动——本质上是将脑电波转换成能够产生声音的物理运动模型,比如嘴唇、舌头或下颌的运动。这项研究基于该团队去年发表在Neuron期刊上的一个模型。

Chang的团队去年发表在Neuron上的论文

最后,他们使用第二个神经网络将这些声道运动的数字化表示合成为音频信号,并让志愿者倾听。在对101个句子的试验中,听者可以在单词库的帮助下很好地识别和写出听到的合成语音:句子中单词来自25个单词的词汇池时,43%的句子被完美地写了出来;句子中单词来自50个单词的词汇池时,21%的句子被完美地写了出来。总的来说,大约70%的单词被正确地写了出来。Chang说,下一步的研究包括使音频更加自然和易懂。

这项研究还有一个有趣的发现,一名受试者被要求在不发出声音的情况下用其声道做相同的发音动作。BCI能够从这些发音动作中合成出可理解的语音,这表明该系统可以应用于不能发出声音的人。

解码出来的声道运动在人与人之间大同小异,这表明有可能接料钳创建出一种可在不同的人之间共享的“通用”解码器。Chang说:“模仿一个人声音的人造声道可以被用来从另一个人的脑活动中合成语音。”

这项研究的一个主要局限是,其受试者都是没有语言障碍的人。Chang说,未来,该团队希望对不能说话的患者进行临床试验。

神经网络
相关阅读
钛白粉行情坚挺维稳钛精矿无波动迹象江油工业设备果冻布丁液压部件旋耕刀Trp

钛白粉行情坚挺维稳 钛精矿无波动迹象节后开市,国内性能而没有到达要求...

2024-04-18
乳品包装特点呈现多样化车蜡大安拉网机床垫高尔夫Trp

乳品包装特点呈现多样化据来自中国包装技术协会锌电池的信息,近年来,乳...

2024-04-18
三相交流电动机的常见故障雷州潜水船车用冷媒铆接机马桶疏通Trp

三相交流电动机的常见故障三相交流异步电动机是工农业生产中最常见的电气...

2024-04-18
食品包装纸容器实行准入萃取设备临夏渔业机械膨化食品镀锌管Trp

食品包装纸容器实行准入自食品实行市场准入制度以后,纸杯、方便面纸碗等...

2024-04-18
华南地区PVC市场行情5环保厕所张家港固化机四通鞋眼Trp

华南地区PVC市场行情华南地区PVC市场态势不薯片机佳,价格持续下滑,电石法...

2024-04-18
钢化玻璃产量增速首次下滑行业或进入调整阶细碎机光学测绘电控设备加脂剂手机零件Trp

钢化玻璃产量增速首次下滑 行业或进入调整阶段据前瞻数据库数据显示,201...

2024-04-18
友情链接