中国有大约1730万视障人士,大模型技术有望打开他们的“视界”。6月6日,记者从阿里云深圳AI峰会上获悉,行业内首款多模态大模型视觉辅助产品“vivo看见”的累计用户已超十万,借助最新的多模态大模型技术带来的升级,“AI 向善”正从愿景变为现实。
七年前中途失明的生活博主“宝哥和他的导盲犬”用视频记录了他使用“vivo看见”乘高铁出行的全过程。他“看见”了高铁窗外的风景、桌上的水杯,“分清”了酒店里的洗漱用品。“vivo看见”为他描述路边的月季花,唤起了他似曾相识的童年回忆。
vivo AI研究院人工智能部总经理郝雄介绍,在这些“有温度”的场景背后,是vivo自研蓝心大模型的支持。从去年开始,vivo加紧大模型的研发,基于阿里云PAI机器学习的千卡大模型预训练性能接近LLaMA水平。
目前,vivo蓝心大模型已包含十亿、百亿、千亿三个参数量级、五款不同尺寸,去年11月上线以来对vivo手机的AI影像、智能助理、图文创作等场景进行了全面优化,并升级了视觉辅助产品“vivo看见”。
有了大模型的加持,“vivo看见”不仅可以在镜头对准周围环境和物品时自动播报画面内容及文字信息,还可切换到文字、卡证、条码等多种识别模式,并进行多轮对话,获取更多画面细节,同时支持常见物品查找。
郝雄表示,未来vivo还将与阿里云在算力、大模型和生态应用等方面持续合作,进一步提升智能化体验。
2024-06-06 13: 49
2024-06-06 13: 01
2024-06-06 13: 01
2024-06-06 13: 01
2024-06-06 11: 36
2024-06-06 11: 36