
谷歌近日宣布NotebookLM平台迎来重大升级,新增强大的图像数据源功能,让用户能够轻松上传各类视觉资料。无论是课堂上的黑板板书、珍贵的教科书扫描页,还是生活中的街拍表格,系统都能自动完成OCR文字识别与深度语义解析,更令人惊喜的是,用户现在可以直接使用自然语言对图像内容进行精准检索。这一创新功能已面向全平台免费开放,旨在为用户提供更便捷的知识管理体验。
谷歌表示,为了进一步提升用户数据安全性,未来数周内将追加本地处理选项,让用户可以在本地设备上完成图像处理,有效减少敏感资料上传云端的需求。新版NotebookLM底层架构全面升级,采用了先进的多模态模型,能够智能分辨手写与印刷区域,精准提取表格结构,并能与用户已有的文本、音频、视频笔记实现无缝自动关联,构建更加立体的知识体系。
在功能演示中,谷歌展示了多个实用用例:用户只需拍摄课堂板书,然后提问”左下角公式如何推导”,系统就能即时定位目标公式并生成详细的步骤讲解;扫描教材第127页的表格后,用户可以直接查询单元格的数值信息;甚至上传街头咖啡店的菜单,系统也能自动提取拿铁等产品的价格。这些场景充分展现了NotebookLM在视觉信息处理方面的强大能力。

值得注意的是,该功能上线后的48小时内,教育账号上传的图像量就突破了50万页,环比增长了惊人的340%,这一数据有力证明了该功能的巨大吸引力。公司还透露了未来的发展规划,计划于明年为NotebookLM集成AR眼镜实时拍摄接口,实现”所见即所问”的沉浸式体验,让知识获取更加直观高效。
目前,图像处理功能仍然沿用现有的免费配额政策,谷歌尚未透露是否会推出付费加速通道。这一系列创新举措,无疑将进一步提升NotebookLM在知识管理领域的竞争力,为用户带来更加智能便捷的体验。
