FUTO发布百万级滑动输入数据集:开源助力输入法AI进化
2026年6月,FUTO发布包含100万条QWERTY英语滑动输入轨迹的大型数据集,始于2024年8月众包采集,经严格质量过滤后以MIT协议在HuggingFace平台开源。
滑动输入的技术挑战
滑动输入(Swype/Glide Typing)允许用户通过在键盘上滑动手指来输入单词,这是一种更高效的手写输入方式。但其核心技术挑战在于:如何根据滑动轨迹准确预测用户意图输入的单词。这需要大量的真实输入数据来训练AI模型。
数据集的技术价值
- 规模庞大:100万条真实输入轨迹
- 质量可控:经过严格的质量过滤和验证
- 开源友好:MIT协议,可用于商业项目
对开源输入法生态的意义
当前高质量的滑动输入技术主要掌握在商业公司手中(如SwiftKey、Gboard)。FUTO的开源数据集发布,为开源输入法项目提供了宝贵的训练资源,有助于打破商业技术垄断。
总结
FUTO通过开源高质量训练数据,正在推动输入法技术的民主化。这对于重视隐私、倾向使用开源输入法的用户而言,是一个重要的好消息。