微新创想(Idea2003.com) 6月20日讯:LG创新科技再添新里程碑,正式推出名为Captioning AI的生成式AI服务。这项突破性技术能够精准识别图像中的关键元素,并自动生成详尽的描述文本与关键词,预示着韩国科技巨头将在生成式AI领域掀起市场新浪潮。作为当前引领行业变革的核心技术之一,以ChatGPT为代表的生成式AI正以前所未有的速度重塑各行各业,而LG此次的Captioning AI服务无疑将这一趋势推向了新的高度。
LG AI研究部门于当地时间周日,在加拿大温哥华举办的全球计算机视觉盛会”计算机视觉与模式识别2023″上隆重发布了这项创新服务。该服务基于LG AI研究部门自主研发的Zero-shot Image Captioning技术,这项技术赋予AI如同人类般的认知能力——即便面对首次出现的对象或场景,也能凭借先前的知识储备进行准确理解和描述。与Midjourney等需要用户输入文本或上传图像才能生成内容的AI工具不同,Captioning AI实现了真正的”零样本学习”能力,能够直接从原始图像中提取信息并生成智能描述。
据LG公司发言人介绍:”字幕生成看似简单,实则蕴含着复杂的AI技术。我们通过生成式AI技术赋予字幕全新的生命力,让AI能够对从未接触过的图像进行智能推理。比如系统可以自动分析图像中的风景特征或人物姿态,并准确推断出拍摄地点等关键信息。”研究人员透露,Captioning AI的效率惊人,仅需不到两天时间就能为1万张图像完成文本描述和关键词提取,这将极大提升需要处理海量图像内容企业的运营效率与生产力。
这项服务的实现得益于LG AI研究与全球最大视觉内容平台Shutterstock的战略合作。Shutterstock作为涵盖图像与视频的全球顶级内容提供商,在图像采集领域拥有深厚的技术积累。双方不仅合作开发Captioning AI服务,更在版权透明化与AI伦理验证方面达成共识,共同确保AI在图像学习过程中不会产生偏见性数据收集等问题。LG AI研究Vision Lab负责人Kim Seung-hwan表示:”为巩固我们在图像捕捉领域的全球研究领导地位,我们将持续深化与各类合作伙伴的有机合作,不断探索新的技术度量标准,推动AI视觉技术的持续创新。”
在此次会议期间,LG集团旗下多家核心子公司如LG AI研究、LG电子、LG Innotek、LG Energy Solution和LG UPlus联合举办了LG AI Day活动。这场专为研究生设计的招聘盛会,不仅展示了LG在AI领域的雄厚实力,更彰显了其培养未来科技人才的坚定决心。随着Captioning AI服务的推出,LG正以更加开放的姿态向全球开发者与合作伙伴敞开大门,共同构建更加智能化的视觉内容生态体系。