首页 > 资讯列表 >  本页面生成模态专题报道,模态滚动新闻,模态业界评论等相关报道!

热门搜索

  • 多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

    多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

    新智元报道编辑:好困【新智元导读】最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。视觉幻觉是常见于多模态大语言模型(Multimodal Large Language Models, MLLMs)的一个典型问题...

    智能设备 2023-10-30 15:01:02
  • 精确率提升7.8%!首个多模态开放世界检测大模型MQ-Det登NeurIPS2023

    精确率提升7.8%!首个多模态开放世界检测大模型MQ-Det登NeurIPS2023

    新智元报道编辑:LRS【新智元导读】MQ-Det在已有基于文本查询的检测大模型基础上,加入了视觉示例查询功能,同时保留了高泛化性能和细粒度多模态查询,在ODinW-35基准上实现SOTA性能。目前的开放世界目标检测模型大多遵循文本查询的模式,即利用类别文本描述在目标图像中查询潜在目标,但这种方式往往会面临「广而不精」的问题。论文链接:https://arxiv.org/abs/2305...

    智能设备 2023-10-19 02:15:01
  • 百度李震宇:大模型将走向多模态,塑造完全自动驾驶的汽车机器人

    百度李震宇:大模型将走向多模态,塑造完全自动驾驶的汽车机器人

    雷递网 乐天 10月17日百度创始人、董事长兼首席执行官李彦宏昨日在百度世界大会上表示:“未来的AI原生应用一定是多模态的,在信息世界之外,一定会重构物理世界,自动驾驶就是视觉大模型重构物理世界的一个典型应用。大模型会让百度的自动驾驶能力超越经验系统,更聪明地处理复杂场景,实现更广泛的时空覆盖。”在当天下午的百度世界大会2023“大模型‘重构’智能汽车”论坛上,百度集团资深副总裁、智能驾驶事业群组总裁李震宇表示:大模型的“智能涌现”带来理解、生成、推理、记忆等核心能力的突破,让汽车具有EQ和IQ,将重构智能汽车业态。未来的大模型还将走向多模态,塑造出完全自动驾驶的汽车机器人。萝卜快跑将越来越接近商业化盈利在智舱方面,语言大模型的上车,让人和车交互方式会从“命令式”升级到“对话式”,推动人车关系升级为人和虚拟人的关系。大模型将重构人车交互方式,让交互更加自然。以文心大模型为基础,百度Apollo为汽车座舱打造了专属大模型技术底座。人和车的交互不再需要复杂的按键操作,用语音就能操控,即便是七嘴八舌、多人指令、声音交织、连续对话的情况下,智能座舱也能理解每个人不同的需求,同时满足。目前,百度Apollo智舱大模型加持的产品将在极越01、凯迪拉克、别克、吉利银河等品牌车型中实现量产搭载。在智驾方面,通过Transformer和BEV等新技术彻底重构自动驾驶技术栈,感知能力获得代际感提升,加速纯视觉方案的成熟和普及。百度称,百度Apollo纯视觉高阶智驾方案可应用于高速、城市、泊车等全域场景,将在今年第四季度实现量产,这是国内首个纯视觉方案在城市场景落地。去掉激光雷达让整车成本更低,提升了市场竞争力。大模型还将走向多模态,重构物理世界,自动驾驶就是大模型重构物理世界的一个典型代表。大模型让自动驾驶超越经验系统,更聪明地处理复杂场景,实现更广泛的时空覆盖,塑造出完全自动驾驶的汽车机器人。百度称,百度自动驾驶出行服务平台萝卜快跑,已经是全球最大的自动驾驶出行服务商,累计提供了超过400万次服务。随着运营规模的不断扩大、技术水平的不断提升,成本更低的自动驾驶车辆的规模化部署,萝卜快跑将越来越接近商业化盈利。李震宇表示,百度在人工智能、深度学习等领域投入超过十年,在智能汽车领域也探索了十年,十年日拱一卒的技术积累、实践是百度Apollo信心和底气的来源。大模型让全无人自动驾驶真正落地,汽车智能化的浪潮也将快速到来。大模型“重构”智能汽车的三条关键路径近年来,智能驾驶在用户整体购车因素的占比快速上升,在“选购前最重视因素”占比从1.2%突破到30%,成为用户购车核心决策因素。智能汽车市场正处在规模化量产前夕,智能汽车底层智能化技术也在发生重构,让AI原生出行时代更快到来。李震宇认为,大模型对智能汽车行业的重构主要体现在三个方面。语言大模型上车,人车交互方式会从“命令式”升级到“对话式”;通过Transformer和BEV等新技术彻底重构自动驾驶技术栈,感知能力获得代际感提升,加速纯视觉方案的成熟和普及;未来的大模型还将走向多模态,塑造出完全自动驾驶的汽车机器人。会上还发布了多款智驾和舱驾融合产品。百度Apollo量产的Apollo Highway Driving Pro进一步演进,发布了新一代Apollo City Driving,使得使用场景从封闭道路升级到城市开放道路,功能场景无限接近全域。百度称,纯视觉城市领航高阶智驾产品Apollo City Driving Max将于2023年第四季度量产落地。与此同时,百度Apollo还行业首发了Apollo Robo-Cabin舱驾一体软芯融合智算平台,它是中国首个能够完成甚至是全球首个真正意义上在单SOC上实现了舱驾融合运行的平台。活动现场,百度Apollo与航盛签署战略合作,宣布将共同基于高通平台打造新一代舱驾融合产品。雷递由媒体人雷建平创办,若转载请写明来源。 ...

    智能设备 2023-10-19 02:14:57
  • 智谱AI开源多模态大模型并官宣即将发布新一代大模型产品

    智谱AI开源多模态大模型并官宣即将发布新一代大模型产品

    【网易科技10月17日报道】近期,智谱AI和清华KEG合作研发并开源了名为CogVLM-17B的多模态大模型,同样可以回答各种类型的视觉问题,可以在不牺牲任何 NLP 任务性能的情况下,实现视觉语言特征的深度融合。记者获悉,在多模态权威学术榜单上,目前CogVLM-17B是综合成绩第一的模型,在14个数据集中的10项权威跨模态基准上取得了SOTA性能,其余4项取得了第二名的成绩...

    智能设备 2023-10-19 02:14:45
  • 对话360孙浩:多模态大模型+物联网将是新风口

    对话360孙浩:多模态大模型+物联网将是新风口

    【网易科技6月5日报道】近日,360智慧生活推出360智脑·视觉大模型及360户外球机6 Pro等多款AI硬件新品,并宣布360智慧生活正式进军SMB(中小微企业)市场,实现从家庭场景到企业商用的全覆盖。在AI的落地应用上,360智慧生活已经探索多年,如今为何将视线放在了SMB市场?未来又将如何发展?针对这些话题,网易科技与360视觉云业务线总经理孙浩展开了深入交流...

    智能设备 2023-06-05 10:25:26
  • 360发布视觉大模型周鸿祎:多模态大模型与物联网结合是新风口

    360发布视觉大模型周鸿祎:多模态大模型与物联网结合是新风口

    【网易科技5月31日报道】“原来的AIoT只是垂直AI,不是通用AI,经过大模型赋能的AIoT才是‘真AI’”,5月31日,三六零(601360.SH,下称“360”)智慧生活集团举办视觉大模型及AI硬件新品发布会,360集团创始人周鸿祎参会并发表演讲——大模型开启AIoT新时代。会上,周鸿祎宣布发布“360智脑-视觉大模型”。他表示,大语言模型是构建视觉大模型的基础,多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。同时,视觉大模型也是“360智脑”的重要能力组成,让“360智脑“能够看懂图片,未来还能看懂视频、听懂声音。周鸿祎表示,过去的人工智能是弱人工智能,在此基础上打造的智能硬件不具有真正的智能。大模型出现后,计算机第一次真正的理解这个世界,并能够赋予AIoT真正的智能。他表示,大模型的出现标志着通用人工智能到来,AI完成了从感知层到认知层的进化。“大模型将带来一场新工业革命”,周鸿祎认为,所有软件、APP、网站,所有行业都值得用大模型进行重塑,而智能硬件是硬件化的APP。从大模型的发展趋势来看,多模态是大模型发展的必经之路,GPT-4最重要的变化是拥有了多模态的处理能力。因此,周鸿祎预言,多模态大模型与物联网的结合将会成为下一个风口。他表示,多模态技术与智能硬件结合是大势所趋,未来大模型将成为物联网的大脑,物联网设备则相当于大模型的感知端,让大模型进化出“眼睛和耳朵”,大模型还有可能操控物联网设备,进化出嘴巴、手和脚,从而拥有行动力,最终实现从感知到认知,从理解到执行。据悉,360在视觉感知能力基础上,融合千亿参数“360智脑”大模型,基于十亿级互联网图文数据进行清洗训练,并针对安防场景百万级行业数据进行微调,最终打造出了专业的视觉及多模态大模型——360智脑-视觉大模型。“目前,大模型的能力主要体现在软件层,当大模型接入智能硬件,会让大模型的能力从数字世界走向物理世界。”周鸿祎说。(袁宁) ...

    智能设备 2023-05-31 21:02:01
  • APUS发布多模态大模型“AiLMe”

    APUS发布多模态大模型“AiLMe”

    4月18日消息,今日,APUS发布会现场发布自研多模态人工智能大模型“AiLMe”。据介绍,AiLMe参数已达千亿规模,具备对文本、图像、视频、音频的理解和生成能力...

    互联网 2023-04-20 21:02:01
  • 中文多模态模型问世!IDPChat生成图像文字,只需5步+单GPU

    中文多模态模型问世!IDPChat生成图像文字,只需5步+单GPU

    新智元报道编辑:桃子拉燕【新智元导读】中文多模态模型IDPChat来了,快速上手教程在此。中文多模态模型IDPChat和大家见面了...

    智能设备 2023-04-18 08:18:00
  • 中科金财:在人工智能领域已推出了智能客服机器人、多模态超写实数智人等产品

    中科金财:在人工智能领域已推出了智能客服机器人、多模态超写实数智人等产品

    中科金财3月29日在互动平台表示,在人工智能等前沿创新领域,推出了智能客服机器人、RPA机器人、WEB3.0内容制作引擎、多模态超写实数智人。同时,公司一直在积极探索布局数字人民币、区块链、元宇宙、AIGC、数字人等创新前沿领域,多年来持续投入...

    区块链 2023-03-29 14:43:29
  • GPT-4震撼发布:多模态大模型,直接升级ChatGPT、必应,开放API,游戏终结了?

    GPT-4震撼发布:多模态大模型,直接升级ChatGPT、必应,开放API,游戏终结了?

    机器之心报道机器之心编辑部ChatGPT点燃了科技行业的明灯,GPT-4能燎原吗?谁能革得了ChatGPT的命?现在看来还是OpenAI自己。在ChatGPT引爆科技领域之后,人们一直在讨论AI「下一步」的发展会是什么,很多学者都提到了多模态,我们并没有等太久...

    智能设备 2023-03-15 09:53:21
  • 名为机器狗Max,腾讯正式发布首个软硬件全自研的多模态四足机器人

    名为机器狗Max,腾讯正式发布首个软硬件全自研的多模态四足机器人

    站搜网 3 月 2 日消息 根据腾讯官方的消息,今天,腾讯正式发布首个软硬件全自研的多模态四足机器人:机器狗 Max。官方表示,机器狗 Max 采用了足轮融合一体式设计,采用了腾讯 Robotics X 实验室原创自研的足轮融合方案,也就是有腿又有轮...

    智能设备 2021-03-02 15:01:07
  • 百度沈抖:多模态交互将成为智能经济时代的主流方式

    百度沈抖:多模态交互将成为智能经济时代的主流方式

    12月8日消息,百度集团执行副总裁沈抖表示,智能经济时代,人机交互将全面智能化并带来一系列的深度变革。为了应对这些变化,百度移动生态提前进行了服务化、人格化战略布局,目前已经取得突破性进展...

    互联网 2020-12-08 14:36:06

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持