找到相关的专题报道信息 - 模态

热门搜索

多模态大模型幻觉降低30%！中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

新智元报道编辑：好困【新智元导读】最近，来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」，可有效解决MLLM输出幻觉的问题。视觉幻觉是常见于多模态大语言模型（Multimodal Large Language Models, MLLMs）的一个典型问题...

智能设备 2023-10-30 15:01:02
精确率提升7.8%！首个多模态开放世界检测大模型MQ-Det登NeurIPS2023

新智元报道编辑：LRS【新智元导读】MQ-Det在已有基于文本查询的检测大模型基础上，加入了视觉示例查询功能，同时保留了高泛化性能和细粒度多模态查询，在ODinW-35基准上实现SOTA性能。目前的开放世界目标检测模型大多遵循文本查询的模式，即利用类别文本描述在目标图像中查询潜在目标，但这种方式往往会面临「广而不精」的问题。论文链接：https://arxiv.org/abs/2305...

智能设备 2023-10-19 02:15:01
百度李震宇：大模型将走向多模态，塑造完全自动驾驶的汽车机器人

雷递网乐天 10月17日百度创始人、董事长兼首席执行官李彦宏昨日在百度世界大会上表示：“未来的AI原生应用一定是多模态的，在信息世界之外，一定会重构物理世界，自动驾驶就是视觉大模型重构物理世界的一个典型应用。大模型会让百度的自动驾驶能力超越经验系统，更聪明地处理复杂场景，实现更广泛的时空覆盖。”在当天下午的百度世界大会2023“大模型‘重构’智能汽车”论坛上，百度集团资深副总裁、智能驾驶事业群组总裁李震宇表示：大模型的“智能涌现”带来理解、生成、推理、记忆等核心能力的突破，让汽车具有EQ和IQ，将重构智能汽车业态。未来的大模型还将走向多模态，塑造出完全自动驾驶的汽车机器人。萝卜快跑将越来越接近商业化盈利在智舱方面，语言大模型的上车，让人和车交互方式会从“命令式”升级到“对话式”，推动人车关系升级为人和虚拟人的关系。大模型将重构人车交互方式，让交互更加自然。以文心大模型为基础，百度Apollo为汽车座舱打造了专属大模型技术底座。人和车的交互不再需要复杂的按键操作，用语音就能操控，即便是七嘴八舌、多人指令、声音交织、连续对话的情况下，智能座舱也能理解每个人不同的需求，同时满足。目前，百度Apollo智舱大模型加持的产品将在极越01、凯迪拉克、别克、吉利银河等品牌车型中实现量产搭载。在智驾方面，通过Transformer和BEV等新技术彻底重构自动驾驶技术栈，感知能力获得代际感提升，加速纯视觉方案的成熟和普及。百度称，百度Apollo纯视觉高阶智驾方案可应用于高速、城市、泊车等全域场景，将在今年第四季度实现量产，这是国内首个纯视觉方案在城市场景落地。去掉激光雷达让整车成本更低，提升了市场竞争力。大模型还将走向多模态，重构物理世界，自动驾驶就是大模型重构物理世界的一个典型代表。大模型让自动驾驶超越经验系统，更聪明地处理复杂场景，实现更广泛的时空覆盖，塑造出完全自动驾驶的汽车机器人。百度称，百度自动驾驶出行服务平台萝卜快跑，已经是全球最大的自动驾驶出行服务商，累计提供了超过400万次服务。随着运营规模的不断扩大、技术水平的不断提升，成本更低的自动驾驶车辆的规模化部署，萝卜快跑将越来越接近商业化盈利。李震宇表示，百度在人工智能、深度学习等领域投入超过十年，在智能汽车领域也探索了十年，十年日拱一卒的技术积累、实践是百度Apollo信心和底气的来源。大模型让全无人自动驾驶真正落地，汽车智能化的浪潮也将快速到来。大模型“重构”智能汽车的三条关键路径近年来，智能驾驶在用户整体购车因素的占比快速上升，在“选购前最重视因素”占比从1.2%突破到30%，成为用户购车核心决策因素。智能汽车市场正处在规模化量产前夕，智能汽车底层智能化技术也在发生重构，让AI原生出行时代更快到来。李震宇认为，大模型对智能汽车行业的重构主要体现在三个方面。语言大模型上车，人车交互方式会从“命令式”升级到“对话式”；通过Transformer和BEV等新技术彻底重构自动驾驶技术栈，感知能力获得代际感提升，加速纯视觉方案的成熟和普及；未来的大模型还将走向多模态，塑造出完全自动驾驶的汽车机器人。会上还发布了多款智驾和舱驾融合产品。百度Apollo量产的Apollo Highway Driving Pro进一步演进，发布了新一代Apollo City Driving，使得使用场景从封闭道路升级到城市开放道路，功能场景无限接近全域。百度称，纯视觉城市领航高阶智驾产品Apollo City Driving Max将于2023年第四季度量产落地。与此同时，百度Apollo还行业首发了Apollo Robo-Cabin舱驾一体软芯融合智算平台，它是中国首个能够完成甚至是全球首个真正意义上在单SOC上实现了舱驾融合运行的平台。活动现场，百度Apollo与航盛签署战略合作，宣布将共同基于高通平台打造新一代舱驾融合产品。雷递由媒体人雷建平创办，若转载请写明来源。 ...

智能设备 2023-10-19 02:14:57
智谱AI开源多模态大模型并官宣即将发布新一代大模型产品

【网易科技10月17日报道】近期，智谱AI和清华KEG合作研发并开源了名为CogVLM-17B的多模态大模型，同样可以回答各种类型的视觉问题，可以在不牺牲任何 NLP 任务性能的情况下，实现视觉语言特征的深度融合。记者获悉，在多模态权威学术榜单上，目前CogVLM-17B是综合成绩第一的模型，在14个数据集中的10项权威跨模态基准上取得了SOTA性能，其余4项取得了第二名的成绩...

智能设备 2023-10-19 02:14:45
对话360孙浩：多模态大模型+物联网将是新风口

【网易科技6月5日报道】近日，360智慧生活推出360智脑·视觉大模型及360户外球机6 Pro等多款AI硬件新品，并宣布360智慧生活正式进军SMB（中小微企业）市场，实现从家庭场景到企业商用的全覆盖。在AI的落地应用上，360智慧生活已经探索多年，如今为何将视线放在了SMB市场？未来又将如何发展？针对这些话题，网易科技与360视觉云业务线总经理孙浩展开了深入交流...

智能设备 2023-06-05 10:25:26
360发布视觉大模型周鸿祎：多模态大模型与物联网结合是新风口

【网易科技5月31日报道】“原来的AIoT只是垂直AI，不是通用AI，经过大模型赋能的AIoT才是‘真AI’”，5月31日，三六零(601360.SH，下称“360”)智慧生活集团举办视觉大模型及AI硬件新品发布会，360集团创始人周鸿祎参会并发表演讲——大模型开启AIoT新时代。会上，周鸿祎宣布发布“360智脑-视觉大模型”。他表示，大语言模型是构建视觉大模型的基础，多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。同时，视觉大模型也是“360智脑”的重要能力组成，让“360智脑“能够看懂图片，未来还能看懂视频、听懂声音。周鸿祎表示，过去的人工智能是弱人工智能，在此基础上打造的智能硬件不具有真正的智能。大模型出现后，计算机第一次真正的理解这个世界，并能够赋予AIoT真正的智能。他表示，大模型的出现标志着通用人工智能到来，AI完成了从感知层到认知层的进化。“大模型将带来一场新工业革命”，周鸿祎认为，所有软件、APP、网站，所有行业都值得用大模型进行重塑，而智能硬件是硬件化的APP。从大模型的发展趋势来看，多模态是大模型发展的必经之路，GPT-4最重要的变化是拥有了多模态的处理能力。因此，周鸿祎预言，多模态大模型与物联网的结合将会成为下一个风口。他表示，多模态技术与智能硬件结合是大势所趋，未来大模型将成为物联网的大脑，物联网设备则相当于大模型的感知端，让大模型进化出“眼睛和耳朵”，大模型还有可能操控物联网设备，进化出嘴巴、手和脚，从而拥有行动力，最终实现从感知到认知，从理解到执行。据悉，360在视觉感知能力基础上，融合千亿参数“360智脑”大模型，基于十亿级互联网图文数据进行清洗训练，并针对安防场景百万级行业数据进行微调，最终打造出了专业的视觉及多模态大模型——360智脑-视觉大模型。“目前，大模型的能力主要体现在软件层，当大模型接入智能硬件，会让大模型的能力从数字世界走向物理世界。”周鸿祎说。（袁宁） ...

智能设备 2023-05-31 21:02:01
APUS发布多模态大模型“AiLMe”

4月18日消息，今日，APUS发布会现场发布自研多模态人工智能大模型“AiLMe”。据介绍，AiLMe参数已达千亿规模，具备对文本、图像、视频、音频的理解和生成能力...

互联网 2023-04-20 21:02:01
中文多模态模型问世！IDPChat生成图像文字，只需5步+单GPU

新智元报道编辑：桃子拉燕【新智元导读】中文多模态模型IDPChat来了，快速上手教程在此。中文多模态模型IDPChat和大家见面了...

智能设备 2023-04-18 08:18:00
中科金财：在人工智能领域已推出了智能客服机器人、多模态超写实数智人等产品

中科金财3月29日在互动平台表示，在人工智能等前沿创新领域，推出了智能客服机器人、RPA机器人、WEB3.0内容制作引擎、多模态超写实数智人。同时，公司一直在积极探索布局数字人民币、区块链、元宇宙、AIGC、数字人等创新前沿领域，多年来持续投入...

区块链 2023-03-29 14:43:29
GPT-4震撼发布：多模态大模型，直接升级ChatGPT、必应，开放API，游戏终结了？

机器之心报道机器之心编辑部ChatGPT点燃了科技行业的明灯，GPT-4能燎原吗？谁能革得了ChatGPT的命？现在看来还是OpenAI自己。在ChatGPT引爆科技领域之后，人们一直在讨论AI「下一步」的发展会是什么，很多学者都提到了多模态，我们并没有等太久...

智能设备 2023-03-15 09:53:21
名为机器狗Max，腾讯正式发布首个软硬件全自研的多模态四足机器人

站搜网 3 月 2 日消息根据腾讯官方的消息，今天，腾讯正式发布首个软硬件全自研的多模态四足机器人：机器狗 Max。官方表示，机器狗 Max 采用了足轮融合一体式设计，采用了腾讯 Robotics X 实验室原创自研的足轮融合方案，也就是有腿又有轮...

智能设备 2021-03-02 15:01:07
百度沈抖：多模态交互将成为智能经济时代的主流方式

12月8日消息，百度集团执行副总裁沈抖表示，智能经济时代，人机交互将全面智能化并带来一系列的深度变革。为了应对这些变化，百度移动生态提前进行了服务化、人格化战略布局，目前已经取得突破性进展...

互联网 2020-12-08 14:36:06

网站分类

热门文章

热点

标签列表

分享到:

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索