10月AI产品&AI大模型热度榜单发布：Sora全球爆火，DeepSeek创新模型刷屏

AIGCRank 2025-11-03 13:20

全球AI产品风向标AI排行榜 AIGCRank 今日发布2025年10月《AI产品热度榜单》及《AI大模型热度榜单》。作为聚焦全球AI创新生态的核心榜单，热度榜单将基于海内外主流应用市场、社交媒体、搜索引擎指数及行业数据库，综合评估产品创新力与市场关注度，为广大用户及AI从业者提供有价值的参考。

榜单介绍：

《AI产品热度榜单》聚焦终端应用层，关注全球头部AI产品及AI厂商，关注新产品发布、功能迭代等。

《AI大模型热度榜单》瞄准技术基座层，追踪数十家主流大模型厂商，关注新模型发布、技术更新等。

作为观察中国及全球AI产业发展的风向标榜单，AIGCRank 建立了常态化监测体系：覆盖数百个AI产品与大模型，聚焦产品功能迭代、新模型发布及创新应用上线等，捕捉AI领域最新动向。同时，通过抓取社交平台内容声量、新闻媒体曝光指数、主流搜索引擎用户搜索趋势、平台互动数据等多维度指标，综合计算事件热度，提供市场参考。

AI热度榜单每月初更新，为你推荐上月最值得关注的产品和大模型动态！

产品&大模型爆料微信号：aishenqinet

✨

AIGCRank

AI产品热度榜单

2025年10月

1. OpenAI发布Sora 2，并上线Sora App

10月1日，OpenAI正式推出新一代视频生成模型Sora 2，显著提升物理真实感、细节精细度与用户控制能力，支持同步生成匹配音频及多镜头叙事。同期上线iOS应用“Sora”，以邀请制开放，创新融合AI视频创作与社交互动功能，支持用户生成个性化视频内容并通过"Remix"功能进行二次创作，上线两日即登顶美国App Store榜首，上线5日内下载量突破百万次。

2. 阿里夸克AI眼镜开启预售

10月24日，阿里巴巴旗下夸克AI眼镜正式开启预售，并预计12月初发货。夸克AI眼镜采用“高通AR1+恒玄BES2800”双芯片架构，搭载自研Master Agent大模型中控系统，支持实时语音交互、物体识别、翻译及支付宝生态服务。预售期间88VIP会员最低价3329元，开售半日即登顶天猫智能眼镜实时销量榜。

3. OpenAI发布AI浏览器Atlas

10月21日，OpenAI正式推出AI原生浏览器Atlas。该产品深度融合ChatGPT功能，用户可通过侧边栏实现光标聊天、内容总结与智能交互，无需复制粘贴即可直接调用AI助手处理网页信息。其代理模式支持自动完成订票、填表等任务。

4. 夸克上线AI对话助手

10月22日，阿里巴巴旗下夸克App正式上线对话式AI助手功能。该功能集成于夸克AI超级框内，支持多轮自然语言交互，具备数学题分步解析、AI写作及特色"锐评"生成能力，显著提升了智能搜索与内容创作体验。

5. Manus 1.5正式发布

10月17日，Manus正式推出1.5版本。该版本在架构和性能上实现显著优化，重点增强了自然语言驱动的全栈Web应用开发能力，支持动态算力分配，任务执行效率提升近四倍，平均完成时间缩短至4分钟内。同时，新版本采用双模型架构，以适配不同场景需求，进一步降低了执行失败率并提升结果质量。

6. Cursor 2.0正式发布

10月30日，Cursor正式发布2.0版本，推出自研代码模型Composer及多Agent并行处理功能。Composer针对低延迟编程优化，推理速度达同类模型4倍，支持8个Agent同时运行处理复杂任务，显著提升开发效率。该版本还升级了代码审查界面，并引入原生浏览器工具，实现更精准的代码修改交互。

7. LiblibAI 2.0正式发布

10月13日，LiblibAI正式发布2.0版本，实现从“聚合工具”到“AI专业创作工作室”的全面升级。新版本重点强化了视频生成能力，支持多模型协同生成与专业级特效模板，覆盖从文生视频、图生视频到视频续写的全流程功能，为用户提供从灵感到成片的端到端创作体验。

8. Flowith发布AI Agent操作系统FlowithOS

10月29日，Flowith正式发布全球首款专为AI Agent打造的操作系统FlowithOS。该系统致力于解决AI智能体在跨环境执行中的"思考与执行脱节"问题，通过整合浏览器提供思考与行动的统一环境，支持多线程、非线性交互的画布式工作流。

9. Vidu Q2参考生视频功能升级

10月21日，Vidu正式上线Q2版本，推出“参考生”功能，支持多主体一致性控制，生成速度提升至前代3倍。同时，视频延长功能允许付费用户生成最长5分钟视频，免费版限30秒。此次更新显著提升了视频语义理解与多主体控制能力。

10. 腾讯发布全新ima 2.0

10月27日，腾讯旗下AI工作台ima正式发布2.0版本。该版本核心升级为具备Agent能力的“任务模式”，可基于用户自然语言指令自主拆解规划任务步骤，调用全网搜索及知识库查询等工具，直接生成市场报告、会议纪要及教学播客等内容。

11. Google AI Studio推出Vibe Coding功能

10月22日，Google AI Studio推出全新"Vibe Coding"开发模式。该功能允许开发者通过自然语言描述应用需求，系统自动生成可运行代码框架，支持实时UI元素指向编辑与语音指令修改。同步上线应用画廊浏览与模板复用功能，并配备"手气不错"快速创意生成按钮，显著降低开发门槛。

12. Anthropic推出Claude Code网页版

10月21日，Anthropic推出网页版Claude Code测试版，用户可直接通过浏览器委派编程任务。该版本作为研究预览版向Pro和Max用户开放，标志着Claude Code从命令行工具向更便捷的Web服务扩展，为开发者提供全新的AI编程体验。

13. Perplexity正式发布AI浏览器Comet

10月2日，Perplexity宣布旗下AI浏览器Comet结束测试阶段，正式向用户免费开放使用。该浏览器深度集成AI助手功能，可实时识别浏览内容并提供智能解答，支持语音指令执行页面总结、网站操作等自动化任务。

14. Gemini上线PPT生成功能

10月27日，Google Gemini宣布在新增PPT一键生成功能。用户通过输入文字提示即可自动生成完整幻灯片，支持上传文档、表格或论文等材料创建针对性演示文稿，生成文件可直接导出至Google Slides进行编辑或协作。

15. Claude桌面客户端正式版发布

10月22日，Anthropic旗下Claude桌面客户端推出正式版，新版本支持截图发送与语音快捷指令功能，并强化了跨应用协作能力，用户可通过热键拖放实现无缝操作，显著提升办公场景下的交互效率。

16. 豆包AI编程升级可视化编辑

10月23日，豆包AI编程正式上线“创作”与“问答”双模式。创作模式新增参考图与画布功能，支持用户通过上传参考图或绘制草图快速生成网页，并支持实时预览与可视化编辑。问答模式专注于编程场景，可一键运行代码、自动分析错误并提供修复建议。此次升级进一步降低了编程门槛，使无编程基础的用户也能完成专业级创作。

17. Google推出AI学习平台Google Skills

10月23日，Google正式推出AI技能学习平台Google Skills，整合Google Cloud、DeepMind等多部门资源，提供超3000门AI相关课程，涵盖技术应用与伦理规范。

18. xAI推出AI百科Grokipedia

10月28日，马斯克旗下xAI公司上线AI驱动的开源百科全书Grokipedia 0.1版本。该平台收录超88.5万篇由Grok模型生成并核查的文章，旨在通过算法减少偏见，提供更准确的知识内容。用户可浏览词条并提交修改建议，但无法直接编辑。

19. Qoder CLI正式发布

10月16日，阿里巴巴正式推出AI编程命令行工具Qoder CLI。该工具具备代码生成与理解能力，可显著降低内存消耗和命令响应时间，提升开发效率。阿里在AI编程工具领域完成IDE与CLI的双形态布局。

20. 支付宝推出多模态AI应用“灵光”

10月24日，蚂蚁集团推出多模态AI应用“灵光”，该应用已登陆腾讯应用宝、vivo应用商店等平台并开启邀约内测。其核心功能“AGI相机”支持通过镜头实时识别场景内容，实现多模态推理与实时问答，强调认知层理解与强场景分析能力。

⚔️

AIGCRank

AI大模型热度榜单

2025年10月

1. DeepSeek发布并开源DeepSeek-OCR模型

10月20日，DeepSeek团队正式开源多模态OCR模型DeepSeek-OCR。该模型创新采用视觉模态压缩技术，将长文本渲染为图像处理，实现最高97%的识别精度。在10倍压缩比下仍保持高精度，单张A100显卡日处理量超20万页，显著提升大模型长文本处理效率，支持近百种语言及复杂图表解析。

2. Google发布Veo 3.1视频生成模型

10月15日，Google正式推出AI视频生成模型Veo 3.1，并面向付费Gemini用户开放。该版本显著提升了音频同步、提示词遵循及场景一致性能力，支持最长148秒高清视频生成，并新增精准编辑功能。

3. MiniMax发布并开源MiniMax-M2

10月27日，MiniMax正式发布并开源新一代文本大模型MiniMax-M2。该模型采用混合专家（MoE）架构，总参数量2300亿，专注于编码与智能体任务优化，在权威测评Artificial Analysis中位目前列全球前五、开源模型第一。

4. 字节跳动发布3D生成大模型Seed 3D 1.0

10月23日，字节跳动Seed团队正式推出3D生成大模型Seed3D 1.0，实现从单张图像到高质量仿真级3D模型的端到端生成。该模型基于Diffusion Transformer架构，通过大规模数据训练生成包含精细几何、真实纹理和物理渲染材质的完整3D模型，支持直接导入仿真引擎，显著降低3D内容创作与具身智能训练门槛。

5. MiniMax发布Hailuo 2.3视频生成模型

10月28日，MiniMax正式推出新一代视频生成模型Hailuo 2.3。该模型基于Hailuo 02升级，在动态表现力、风格化呈现及人物微表情细腻度方面显著提升，同时优化了对运动指令的响应能力。

6. 美团发布LongCat-Video视频生成模型

10月27日，美团LongCat团队正式发布并开源视频生成模型LongCat-Video。该模型基于Diffusion Transformer架构，参数量达136亿，原生支持文生视频、图生视频及视频续写三大核心任务，可稳定生成5分钟720p高清视频。

7. GagaAI推出视频生成模型GAGA-1

10月10日，Sand.ai团队正式发布音画同步视频生成模型GAGA-1。该模型专注于人物对话演绎，用户上传图片并输入提示词即可生成5-10秒影视级视频，支持口型同步与情绪还原，处理时长约3-4分钟。作为对标Sora2的国产模型，其以低成本优势开放使用，适用于短剧制作等场景。

8. Anthropic推出Claude Haiku 4.5

10月16日，Anthropic正式推出Claude Haiku 4.5。该模型以"高性能+低成本+快速度"为核心特点，在编程测试SWE-bench中达到73.3%的通过率，接近Sonnet 4水平，但成本仅为三分之一，速度提升两倍以上。并首次为Haiku系列加入扩展思考能力，支持高速推理和预算控制，适用于实时低延迟场景。

9. 阿里巴巴Qwen3-VL新增多个密集模型尺寸

10月15日，阿里巴巴通义千问团队正式发布Qwen3-VL视觉语言模型家族4B与8B两种参数规格，10月22日再次发布2B与32B参数规格。该系列包含了从轻量级到高性能的产品线，具备长视频处理、OCR识别、视觉Agent及空间感知能力，并已全面开源。模型均提供Instruct和Thinking双版本，其中Qwen3-VL-2B专为移动端设计，支持手机本地流畅运行。

10. 腾讯发布并开源混元世界模型1.1

10月22日，腾讯混元团队正式发布HunyuanWorld-Mirror大模型。该模型采用全景世界代理与语义分层网格表示技术，支持从文本或图像生成具备3D一致性、可探索及交互性的沉浸式虚拟世界，显著提升了虚拟现实、物理仿真及互动内容创建等领域的应用能力。

11. 字节跳动发布豆包语音合成模型2.0

10月16日，字节跳动正式推出新一代语音生成模型Seed-TTS 2.0。该模型基于大规模双语语料训练，采用分层语义-声学建模架构，显著提升长对话语音生成的流畅度与表现力。新版本支持零样本语音合成，在语义理解与韵律控制方面实现突破，可适配播客、聊天机器人等多场景应用。

12. xAI推出视频生成模型Imagine v0.9

10月8日，xAI正式推出视频生成模型Imagine v0.9，该版本在视觉质量、动态表现及音频生成方面实现显著升级，支持电影级文本生成视频与同步语音功能，模型通过Grok平台向用户免费开放。

13. MiniMax发布语音模型Speech 2.6

10月30日，MiniMax正式推出新一代语音合成模型Speech 2.6。该模型端到端延迟低于250毫秒，并引入Fluent LoRA技术，支持在音色复刻的同时生成流利自然的语音，覆盖40多种语言。此次升级深度优化了Voice Agent场景，支持非标准文本格式直接转换。

14. 月之暗面发布并开源KimiLinear架构

10月31日，月之暗面发布并开源了新型混合线性注意力架构Kimi Linear。该模型通过KDA门控机制和3:1混合设计，结合MoE技术，显著优化性能，解码速度较全注意力机制提升6倍。此次开源标志着其在高效推理架构领域的重要突破。

15. MiniMax发布音乐模型Music 2.0

10月31日，MiniMax正式推出新一代音乐生成模型Music 2.0。该模型可生成结构完整、时长5分钟的歌曲，在人声表现和器乐控制上实现突破，精准捕捉情绪与节奏细节，支持多种唱法和情感风格。

16. 百度发布并开源文档解析模型PaddleOCR-VL

10月16日，百度飞桨团队正式开源超紧凑视觉语言模型PaddleOCR-VL-0.9B。该模型集成动态分辨率视觉编码器与ERNIE语言模型，支持109种语言的文档解析，在复杂元素识别和跨模态理解任务中达到SOTA性能。

17. Adobe发布图像生成模型Firefly Image 5

10月29日，Adobe正式推出新一代图像生成模型Firefly Image 5。该模型支持400万像素原生输出，显著提升图像细节与人物渲染精度，并首次引入图层编辑功能，允许对独立对象进行提示词驱动编辑。新模型已整合至Photoshop、Premiere Pro等创意工具。

18. Fish Audio发布声音克隆模型Fish Audio S1

10月21日，Fish Audio宣布其S1语音克隆模型实现重大升级。该模型通过10秒语音样本即可高精度复刻真人声音，在情感表现力和拟真度方面取得突破，并具备超低延迟的实时语音生成能力。

19. 微软发布图像生成模型MAI-Image-1

10月14日，微软正式推出其首款自主研发的图像生成式AI模型MAI-Image-1。该模型专注于文本到图像生成，在渲染逼真光照和自然景观方面表现突出。微软表示，MAI-Image-1将逐步集成至Copilot及Bing Image Creator等产品中。

20. 百川发布循证增强医疗大模型M2 Plus

10月22日，百川智能正式发布循证增强医疗大模型Baichuan-M2 Plus，同步升级配套应用“百小应”并开放API接口。该模型在多场景医学评测中显著降低幻觉率，错误率约为DeepSeek的三分之一，表现优于海外基准OpenEvidence。通过引入循证医学知识库与多轮事实校验机制，其诊疗问答、病历生成等任务的事实一致性提升约40%，为医疗AI领域提供低幻觉、可追溯的技术支撑。（转载自AIGCRank）

扫码下载app 最新资讯实时掌握

上一篇明略科技港股上市：大涨100%，市值超400亿港元

下一篇10月AI产品榜：头部豆包、夸克稳定，腾讯元宝增速最快