微新创想(Idea2003.com) 6月20日讯:LG创新科技再添新里程碑,正式推出名为Captioning AI的生成式AI服务。这项突破性技术能够精准识别图像中的关键元素,并自动生成详尽的描述文本与关键词,预示着韩国科技巨头将在生成式AI领域掀起市场新浪潮。作为当前引领行业变革的核心技术之一,以ChatGPT为代表的生成式AI正以前所未有的速度重塑各行各业,而LG此次的Captioning AI服务无疑将这一趋势推向了新的高度。

LG AI研究部门于当地时间周日,在加拿大温哥华举办的全球计算机视觉盛会”计算机视觉与模式识别2023″上隆重发布了这项创新服务。该服务基于LG AI研究部门自主研发的Zero-shot Image Captioning技术,这项技术赋予AI如同人类般的认知能力——即便面对首次出现的对象或场景,也能凭借先前的知识储备进行准确理解和描述。与Midjourney等需要用户输入文本或上传图像才能生成内容的AI工具不同,Captioning AI实现了真正的”零样本学习”能力,能够直接从原始图像中提取信息并生成智能描述。

据LG公司发言人介绍:”字幕生成看似简单,实则蕴含着复杂的AI技术。我们通过生成式AI技术赋予字幕全新的生命力,让AI能够对从未接触过的图像进行智能推理。比如系统可以自动分析图像中的风景特征或人物姿态,并准确推断出拍摄地点等关键信息。”研究人员透露,Captioning AI的效率惊人,仅需不到两天时间就能为1万张图像完成文本描述和关键词提取,这将极大提升需要处理海量图像内容企业的运营效率与生产力。

这项服务的实现得益于LG AI研究与全球最大视觉内容平台Shutterstock的战略合作。Shutterstock作为涵盖图像与视频的全球顶级内容提供商,在图像采集领域拥有深厚的技术积累。双方不仅合作开发Captioning AI服务,更在版权透明化与AI伦理验证方面达成共识,共同确保AI在图像学习过程中不会产生偏见性数据收集等问题。LG AI研究Vision Lab负责人Kim Seung-hwan表示:”为巩固我们在图像捕捉领域的全球研究领导地位,我们将持续深化与各类合作伙伴的有机合作,不断探索新的技术度量标准,推动AI视觉技术的持续创新。”

在此次会议期间,LG集团旗下多家核心子公司如LG AI研究、LG电子、LG Innotek、LG Energy Solution和LG UPlus联合举办了LG AI Day活动。这场专为研究生设计的招聘盛会,不仅展示了LG在AI领域的雄厚实力,更彰显了其培养未来科技人才的坚定决心。随着Captioning AI服务的推出,LG正以更加开放的姿态向全球开发者与合作伙伴敞开大门,共同构建更加智能化的视觉内容生态体系。

最新快讯

2025年12月11日

10:42
2025年,短剧已成为国民级的娱乐内容。相关数据显示,2024年中国微短剧市场规模突破504亿元,用户日均观看时长持续攀升,超过87%的受访从业者认为微短剧规模将持续增长,其中近四成认为将有显著增长,反映出行业整体的强劲预期。然而,在这些亮眼数据的背后,一些隐忧却悄然出现:新人创作者入局困难、优质内容创作者难以获得对应激励、行业信息不透明……这些问题表明,短...
10:42
微新创想12月11日讯 惊爆!网红冯提莫癌症复发冲上热搜第一,引发全网关注。这位拥有超3000万粉丝的知名主播,在停播近一年后意外回归,其直播间瞬间涌入10万观众,场面火爆。冯提莫在直播中坦诚分享,自己此前罹患甲状腺癌并已复发转移,目前正在医院积极治疗,目前身体状况已逐渐恢复。令人唏嘘的是,冯提莫早在2023年7月便曾透露病情,当时她已确诊甲状腺癌晚期,为此...
10:42
微新创想12月11日讯 汉语盘点2025活动近日公布了年度字词的候选前五位名单,引发广泛关注。这一活动由权威机构联合主办,旨在通过全民参与的方式,记录和反映年度社会热点与文化变迁。 汉语盘点2025涵盖四大板块:国内字、国内词、国际字和国际词,全面展现语言文化的多元性。其中,DeepSeek和草台班子分别成为国际词和国内词候选名单的亮点。这一活动不仅关注本土...
10:31
谷歌的 FACTS 团队与知名数据科学平台 Kaggle 联合宣布正式推出 FACTS 基准测试套件。这一创新评估框架旨在全面衡量生成式人工智能模型在企业级任务中的事实准确性与信息真实性,填补了现有基准测试的明显短板——传统测试往往过度关注问题解决能力,而忽略了模型输出与真实世界数据的客观一致性,尤其当信息以图像或图表形式呈现时更为突出。对于法律、金融、医疗...
10:31
阿里云通义千问重磅推出新一代语音合成大模型Qwen3-TTS,现已正式通过Qwen API面向全球开发者免费开放调用。该模型凭借其卓越性能,在语音合成领域树立了全新标杆,为开发者提供前所未有的声音创作体验。 Qwen3-TTS内置49种多角色音色库,涵盖丰富多样的性别、年龄、地域及角色设定,包括"撒娇搞怪茉兔"、"严厉老师墨讲师"、"智慧老者沧明子"等特色音...
10:31
Spotify 在本周三正式宣布推出一项革命性的新功能——"推荐播放列表",旨在为用户带来前所未有的个性化音乐体验。这项创新功能目前仅在新西兰的 Premium 会员中试点,未来将逐步推向全球市场。通过这项智能工具,用户只需用文字描述自己的音乐偏好,即可生成高度定制化的播放列表,完美契合个人品味。 Spotify 强调,该推荐系统不仅基于用户当前的听歌喜好,...
10:09
2025年12月8日,南京银行在南京河西总部大楼隆重召开第十届董事会第十六次会议,会议由董事长谢宁主持。此次会议的核心议题之一是审议通过不再设立监事会等多项重要议案,这一决策标志着南京银行在治理结构上迈出了重要调整步伐。会议还就董事会成员调整进行了表决,正式提名王厚印担任非独立董事候选人,同时提名王遥为独立董事候选人。王厚印现担任东部机场集团总会计师,该集团...
10:09
2025年12月11日,备受瞩目的AI新药研发企业深度智耀正式宣布成功斩获近5000万美元的D轮巨额融资。此次融资由鼎晖百孚强势领投,其老股东新鼎资本与红杉中国也纷纷追加投资,指数资本则担任本次交易的独家财务顾问。这一重大融资事件不仅彰显了资本市场对深度智耀创新技术的的高度认可,更为其未来发展注入强劲动力。 据悉,本次募集的资金将重点投向两大核心领域:一是全...
10:08
2025年12月11日,备受瞩目的“九天”无人机在陕西蒲城成功完成首飞任务,标志着我国大型无人机技术迈入新纪元。这款由航空工业第一飞机设计研究院精心设计、陕西无人装备科技有限责任公司委托研制的自主创新机型,是我国自主研发的大型通用无人机平台典范。 “九天”无人机秉持“通用平台+模块化任务载荷”的先进设计理念,展现出卓越的多功能性与高适应性。其核心优势包括...
10:08
2024年12月10日,科技资讯博主Evan Blass在社交平台X上意外曝光了美国运营商Verizon的一份内部认证文件,首次揭开了谷歌Pixel 10a的部分关键配置信息。据文件显示,这款备受关注的新机将采用一块6.3英寸FHD+分辨率塑料AMOLED显示屏,支持60Hz与120Hz智能刷新率切换,在视觉效果与续航之间取得完美平衡。影像系统方面,Pixe...
10:08
2025年12月11日,科技界迎来重磅消息。埃隆·马斯克通过社交平台X正式宣布,SpaceX即将启动首次公开募股(IPO)计划。这一消息迅速引发全球关注,此前多家媒体曾报道IPO可能于2026年启动,并预测SpaceX目标估值将高达1.5万亿美元,计划募集资金300亿美元。马斯克在公告中强调,此次上市不仅能为公司带来资金支持,更将助力推进一系列前沿项目,包括...
10:08
12月9日,北交所官方网站正式披露了创达新材与申万宏源承销保荐机构针对第二轮问询的详细回复内容。作为一家专注于高性能热固性复合材料领域的领先企业,创达新材致力于研发、生产与销售包括环氧模塑料、液态环氧封装料在内的先进电子封装材料,这些产品在电子信息产业中扮演着关键角色。 从股权结构来看,创达新材的控股股东包括张俊、锡新投资、陆南平和绵阳惠力,而实际控制人则由...