渐冻症(ALS)等病症会损害患者的言语和打字能力,给他们的日常沟通带来巨大障碍。辅助性/替代性沟通(AAC)设备和眼动打字技术虽然可以提供一定支持,但频繁的按键操作会加重患者的眼疲劳,降低其对话流畅度和自表达能力,从而影响其生活质量。
为解决这一问题,谷歌的研究团队及其合作者开发了一款由大语言模型(LLM)驱动的用户界面(UI)——SpeakFaster。SpeakFaster利用微调后的LLM和会话语境,能够将高度缩略的英文文本(仅为单词首字母,必要时还会添加字母和单词)扩展为所需的完整短语,帮助ALS患者将眼动打字的按键次数减少57%,文本输入速度比基线提高29-60%。
SpeakFaster提供了一种基于人工智能(AI)的方法,将LLM与专为缩写文本输入而设计的UI相结合。具体而言,研究团队首先设计了SpeakFaster的UI,以确保其允许轻松输入和优化缩写,保证用户始终能够传达他们想要的信息,即使初始预测不是他们想要的。
他们此前证明,经过微调的LaMDA(64B参数)可以将单词首字母形式的缩写(例如ishpitb)扩展为完整短语(例如Isawhimplayinthebed),在提供对话上下文(即另一位说话者的轮次)时,准确率高达77%。无法找到精确匹配的情况往往发生在更长、更复杂的短语上。
实际的解决方案需要确保用户在初始缩写扩展(AE)失败的情况下能够随后输入任何任意的短语,即用户在UI中永远不会遇到死胡同。因此,他们开发了一个UI和
SpeakFaster为渐冻症患者提供了一种革命性的沟通方式,大幅提高了他们的文字输入速度,减少了身体压力,使他们能够更充分地表达自己。该技术有可能极大地改善ALS患者的生活质量,让他们在社会上和智力上都能更加活跃和参与。
本文地址:http://www.sosite.cn/zuixinwz/1192.html