微新创想(Idea2003.com) 6月20日讯:LG创新科技再添新里程碑,正式推出名为Captioning AI的生成式AI服务。这项突破性技术能够精准识别图像中的关键元素,并自动生成详尽的描述文本与关键词,预示着韩国科技巨头将在生成式AI领域掀起市场新浪潮。作为当前引领行业变革的核心技术之一,以ChatGPT为代表的生成式AI正以前所未有的速度重塑各行各业,而LG此次的Captioning AI服务无疑将这一趋势推向了新的高度。

LG AI研究部门于当地时间周日,在加拿大温哥华举办的全球计算机视觉盛会”计算机视觉与模式识别2023″上隆重发布了这项创新服务。该服务基于LG AI研究部门自主研发的Zero-shot Image Captioning技术,这项技术赋予AI如同人类般的认知能力——即便面对首次出现的对象或场景,也能凭借先前的知识储备进行准确理解和描述。与Midjourney等需要用户输入文本或上传图像才能生成内容的AI工具不同,Captioning AI实现了真正的”零样本学习”能力,能够直接从原始图像中提取信息并生成智能描述。

据LG公司发言人介绍:”字幕生成看似简单,实则蕴含着复杂的AI技术。我们通过生成式AI技术赋予字幕全新的生命力,让AI能够对从未接触过的图像进行智能推理。比如系统可以自动分析图像中的风景特征或人物姿态,并准确推断出拍摄地点等关键信息。”研究人员透露,Captioning AI的效率惊人,仅需不到两天时间就能为1万张图像完成文本描述和关键词提取,这将极大提升需要处理海量图像内容企业的运营效率与生产力。

这项服务的实现得益于LG AI研究与全球最大视觉内容平台Shutterstock的战略合作。Shutterstock作为涵盖图像与视频的全球顶级内容提供商,在图像采集领域拥有深厚的技术积累。双方不仅合作开发Captioning AI服务,更在版权透明化与AI伦理验证方面达成共识,共同确保AI在图像学习过程中不会产生偏见性数据收集等问题。LG AI研究Vision Lab负责人Kim Seung-hwan表示:”为巩固我们在图像捕捉领域的全球研究领导地位,我们将持续深化与各类合作伙伴的有机合作,不断探索新的技术度量标准,推动AI视觉技术的持续创新。”

在此次会议期间,LG集团旗下多家核心子公司如LG AI研究、LG电子、LG Innotek、LG Energy Solution和LG UPlus联合举办了LG AI Day活动。这场专为研究生设计的招聘盛会,不仅展示了LG在AI领域的雄厚实力,更彰显了其培养未来科技人才的坚定决心。随着Captioning AI服务的推出,LG正以更加开放的姿态向全球开发者与合作伙伴敞开大门,共同构建更加智能化的视觉内容生态体系。

最新快讯

2026年01月30日

15:33
北京金山办公软件股份有限公司与华为在珠海正式签署战略合作协议。双方将围绕个人消费者领域展开深度合作,致力于通过技术融合与生态共建,系统性地解决跨设备办公、AI 适配及效率提升等核心痛点。核心目标:打造全球办公的“中国方案”根据协议规划,双方的目标是到2026年,为国内用户提供更加安全、流畅且高效的 AI 办公体验。这一合作不仅旨在优化国内市场,更抱有为全球操...
15:33
京东科技近日宣布,凭借其自主研发的JoyAI大模型成功助力北京市"京办"平台完成智能化升级,标志着政务办公正式迈入"智能化"时代。通过AI与大数据技术的深度融合,这一创新举措显著提升了超大城市的管理效率,为智慧城市建设树立了新标杆。 技术赋能:JoyAI破解政务办公难题 针对政务工作中长期存在的知识库分散、公文流转流程复杂等痛点,京东科技提供了系统性的AI解...
15:33
埃隆·马斯克再次对其人工智能公司 xAI 的愿景放出的“豪言”。据科技媒体 TweakTown 报道,马斯克曾在2025年预测,xAI 旗下的游戏工作室将于今年年底前推出一款“出色的 AI 生成游戏”。昨日,他进一步在 X 平台加码预期,宣称明年将大规模推出可实时生成、高画质且能高度个人定制的影视内容和电子游戏。尽管目前市场上已有如《Arc Raiders》...
15:33
近日,腾讯旗下AI助手“元宝”内测的社交功能**“元宝派”**因公测版本截图泄露成为行业焦点。此次泄露的核心看点在于其深度的生态整合与社交壁垒的突破。在功能层面,“元宝派”新增了**“一起听音乐”与“一起看视频”**功能。该功能疑似打通了QQ音乐与腾讯视频的资源库,支持好友同步观影、听歌并实时互动。更具颠覆性的是,“元宝派”实现了跨平台社交整合,用户可通过专...
15:33
2026年1月29日,商汤科技正式宣布开源其多模态自主推理模型 SenseNova-MARS,并同步提供8B 和32B 两个版本。这款模型的发布,标志着多模态大模型在自主推理领域迈出了关键一步。技术突破:首个 Agentic VLM 模型SenseNova-MARS在技术架构上实现了显著创新,是行业内首个将动态视觉推理与图文搜索深度融合的 Agentic V...
15:33
 长期以来,建筑业一直被视为数字化转型的“慢热者”,受困于成本超支、项目延期及劳动力短缺等顽疾。然而,这一局面正在被彻底打破。根据Persistence Market Research的最新预测,全球建筑业人工智能(AI)市场将迎来爆发式增长:预计到2026年市场规模将达 62亿美元,而到2033年将攀升至 320亿美元,复合年增长率(CAGR)高...
15:33
2026年1月30日,商汤科技正式开源了其首个支持动态视觉推理与图文搜索深度融合的 Agentic VLM 模型——SenseNova-MARS。该模型包含8B 和32B 两个版本,通过模拟“侦探破案”般的逻辑,实现了 AI 从单纯“理解”到自主“执行”的跨越。性能飞跃:在多项榜单超越 GPT-5.2在最新的行业基准测试中,SenseNova-MARS展现出...
15:33
腾讯在 AI 人才版图上再下一城。2026年1月30日,清华大学计算机系博士、前新加坡 Sea AI Lab 高级研究科学家庞天宇宣布,将于2月4日正式入职腾讯。他将出任腾讯混元大模型团队首席研究科学家,并兼任多模态强化学习技术负责人。人物履历:从清华学霸到顶级科学家庞天宇是机器学习领域的知名青年学者,其履历极具含金量:学术背景:1995年出生,高一即获得保...
15:31
近期,网络上掀起了一股自制霉豆腐的美食热潮,这项兼具传统韵味与现代创意的美食制作迅速成为大众关注的焦点。据观察,这股风潮的兴起主要得益于社交媒体平台上众多美食博主和网友分享的自制教程与成品展示。视频画面中,原本普通的豆腐经过独特的发酵工艺,呈现出诱人的深褐色泽和浓郁的特殊风味,令人食指大动。这种传统美食的制作方法不仅操作简便,且成本经济,因而迅速在网友群体中...
15:31
微新创想1月30日电 在当前手机行业内存价格持续飙升的背景下,REDMI Turbo 5 Max却以逆势降价的方式给消费者带来了惊喜。这款备受期待的新机于1月29日正式发布,雷军更是在微博上发文反问"Turbo定价厚道吧?"这一自信提问背后,是小米专项投入的10亿内存补贴计划,结合国家补贴政策,使得该机性价比再创新高。 此次REDMI Turbo 5 Ma...
15:31
微新创想1月30日电 苹果公司近日发布了截至12月27日的2026财年第一季度财报,多项核心财务数据创下历史新高,其中iPhone业务成为推动营收增长的关键引擎。财报显示,苹果该季度总营收达到1437.56亿美元,同比增长16%;净利润高达420.97亿美元,同比增长16%。iPhone业务收入为852.69亿美元,同比增长23%,在总营收中占比超过59%...
15:31
微新创想1月30日消息,本月中旬,美国佛州一名43岁专业捕蛇人卡尔杰克逊 (Carl Jackson) 在抓捕一条蟒蛇时出了意外,好在有惊无险。事发当天,他驾车行驶在国家公园公路上时,发现一条约5米长、92公斤重的巨大缅甸蟒正横穿马路。他一眼认出这是外来物种,基于职业本能,立刻下车实施抓捕,然而在这个过程中,巨蟒突然将杰克的腿紧...