×
加载中...
10月AI产品&AI大模型热度榜单发布:Sora全球爆火,DeepSeek创新模型刷屏
AIGCRank 2025-11-03 13:20

全球AI产品风向标AI排行榜 AIGCRank 今日发布2025年10月《AI产品热度榜单》及《AI大模型热度榜单》。作为聚焦全球AI创新生态的核心榜单,热度榜单将基于海内外主流应用市场、社交媒体、搜索引擎指数及行业数据库,综合评估产品创新力与市场关注度,为广大用户及AI从业者提供有价值的参考。

榜单介绍:

AI产品热度榜单聚焦终端应用层,关注全球头部AI产品及AI厂商,关注新产品发布、功能迭代等。

AI大模型热度榜单瞄准技术基座层,追踪数十家主流大模型厂商,关注新模型发布、技术更新等。

作为观察中国及全球AI产业发展的风向标榜单,AIGCRank 建立了常态化监测体系:覆盖数百个AI产品与大模型,聚焦产品功能迭代、新模型发布及创新应用上线等,捕捉AI领域最新动向。同时,通过抓取社交平台内容声量、新闻媒体曝光指数、主流搜索引擎用户搜索趋势、平台互动数据等多维度指标,综合计算事件热度,提供市场参考。

AI热度榜单每月初更新,为你推荐上月最值得关注的产品和大模型动态

产品&大模型爆料微信号:aishenqinet

AIGCRank
AI产品热度榜单

2025年10月

1. OpenAI发布Sora 2,并上线Sora App
10月1日,OpenAI正式推出新一代视频生成模型Sora 2,显著提升物理真实感、细节精细度与用户控制能力,支持同步生成匹配音频及多镜头叙事。同期上线iOS应用“Sora”,以邀请制开放,创新融合AI视频创作与社交互动功能,支持用户生成个性化视频内容并通过"Remix"功能进行二次创作,上线两日即登顶美国App Store榜首,上线5日内下载量突破百万次。
2. 阿里夸克AI眼镜开启预售
10月24日,阿里巴巴旗下夸克AI眼镜正式开启预售,并预计12月初发货。夸克AI眼镜采用“高通AR1+恒玄BES2800”双芯片架构,搭载自研Master Agent大模型中控系统,支持实时语音交互、物体识别、翻译及支付宝生态服务。预售期间88VIP会员最低价3329元,开售半日即登顶天猫智能眼镜实时销量榜。
3. OpenAI发布AI浏览器Atlas
10月21日,OpenAI正式推出AI原生浏览器Atlas。该产品深度融合ChatGPT功能,用户可通过侧边栏实现光标聊天、内容总结与智能交互,无需复制粘贴即可直接调用AI助手处理网页信息。其代理模式支持自动完成订票、填表等任务。
4. 夸克上线AI对话助手
10月22日,阿里巴巴旗下夸克App正式上线对话式AI助手功能。该功能集成于夸克AI超级框内,支持多轮自然语言交互,具备数学题分步解析、AI写作及特色"锐评"生成能力,显著提升了智能搜索与内容创作体验。
5Manus 1.5正式发布

10月17日,Manus正式推出1.5版本。该版本在架构和性能上实现显著优化,重点增强了自然语言驱动的全栈Web应用开发能力,支持动态算力分配,任务执行效率提升近四倍,平均完成时间缩短至4分钟内。同时,新版本采用双模型架构,以适配不同场景需求,进一步降低了执行失败率并提升结果质量。

6. Cursor 2.0正式发布
10月30日,Cursor正式发布2.0版本,推出自研代码模型Composer及多Agent并行处理功能。Composer针对低延迟编程优化,推理速度达同类模型4倍,支持8个Agent同时运行处理复杂任务,显著提升开发效率。该版本还升级了代码审查界面,并引入原生浏览器工具,实现更精准的代码修改交互。
7. LiblibAI 2.0正式发布

10月13日,LiblibAI正式发布2.0版本,实现从“聚合工具”到“AI专业创作工作室”的全面升级。新版本重点强化了视频生成能力,支持多模型协同生成与专业级特效模板,覆盖从文生视频、图生视频到视频续写的全流程功能,为用户提供从灵感到成片的端到端创作体验。

8. Flowith发布AI Agent操作系统FlowithOS
10月29日,Flowith正式发布全球首款专为AI Agent打造的操作系统FlowithOS。该系统致力于解决AI智能体在跨环境执行中的"思考与执行脱节"问题,通过整合浏览器提供思考与行动的统一环境,支持多线程、非线性交互的画布式工作流。
9. Vidu Q2参考生视频功能升级
10月21日,Vidu正式上线Q2版本,推出“参考生”功能,支持多主体一致性控制,生成速度提升至前代3倍。同时,视频延长功能允许付费用户生成最长5分钟视频,免费版限30秒。此次更新显著提升了视频语义理解与多主体控制能力。
10. 腾讯发布全新ima 2.0
10月27日,腾讯旗下AI工作台ima正式发布2.0版本。该版本核心升级为具备Agent能力的“任务模式”,可基于用户自然语言指令自主拆解规划任务步骤,调用全网搜索及知识库查询等工具,直接生成市场报告、会议纪要及教学播客等内容。
11. Google AI Studio推出Vibe Coding功能

10月22日,Google AI Studio推出全新"Vibe Coding"开发模式。该功能允许开发者通过自然语言描述应用需求,系统自动生成可运行代码框架,支持实时UI元素指向编辑与语音指令修改。同步上线应用画廊浏览与模板复用功能,并配备"手气不错"快速创意生成按钮,显著降低开发门槛。

12. Anthropic推出Claude Code网页版
10月21日,Anthropic推出网页版Claude Code测试版,用户可直接通过浏览器委派编程任务。该版本作为研究预览版向Pro和Max用户开放,标志着Claude Code从命令行工具向更便捷的Web服务扩展,为开发者提供全新的AI编程体验。
13. Perplexity正式发布AI浏览器Comet
10月2日,Perplexity宣布旗下AI浏览器Comet结束测试阶段,正式向用户免费开放使用。该浏览器深度集成AI助手功能,可实时识别浏览内容并提供智能解答,支持语音指令执行页面总结、网站操作等自动化任务。
14. Gemini上线PPT生成功能
10月27日,Google Gemini宣布在新增PPT一键生成功能。用户通过输入文字提示即可自动生成完整幻灯片,支持上传文档、表格或论文等材料创建针对性演示文稿,生成文件可直接导出至Google Slides进行编辑或协作。
15. Claude桌面客户端正式版发布

10月22日,Anthropic旗下Claude桌面客户端推出正式版,新版本支持截图发送与语音快捷指令功能,并强化了跨应用协作能力,用户可通过热键拖放实现无缝操作,显著提升办公场景下的交互效率。

16. 豆包AI编程升级可视化编辑

10月23日,豆包AI编程正式上线“创作”与“问答”双模式。创作模式新增参考图与画布功能,支持用户通过上传参考图或绘制草图快速生成网页,并支持实时预览与可视化编辑。问答模式专注于编程场景,可一键运行代码、自动分析错误并提供修复建议。此次升级进一步降低了编程门槛,使无编程基础的用户也能完成专业级创作。

17. Google推出AI学习平台Google Skills
10月23日,Google正式推出AI技能学习平台Google Skills,整合Google Cloud、DeepMind等多部门资源,提供超3000门AI相关课程,涵盖技术应用与伦理规范。
18. xAI推出AI百科Grokipedia

10月28日,马斯克旗下xAI公司上线AI驱动的开源百科全书Grokipedia 0.1版本。该平台收录超88.5万篇由Grok模型生成并核查的文章,旨在通过算法减少偏见,提供更准确的知识内容。用户可浏览词条并提交修改建议,但无法直接编辑。

19. Qoder CLI正式发布
10月16日,阿里巴巴正式推出AI编程命令行工具Qoder CLI。该工具具备代码生成与理解能力,可显著降低内存消耗和命令响应时间,提升开发效率。阿里在AI编程工具领域完成IDE与CLI的双形态布局。
20. 支付宝推出多模态AI应用“灵光”
10月24日,蚂蚁集团推出多模态AI应用“灵光”,该应用已登陆腾讯应用宝、vivo应用商店等平台并开启邀约内测。其核心功能“AGI相机”支持通过镜头实时识别场景内容,实现多模态推理与实时问答,强调认知层理解与强场景分析能力。

⚔️

AIGCRank
AI大模型热度榜单
2025年10月
1. DeepSeek发布并开源DeepSeek-OCR模型
10月20日,DeepSeek团队正式开源多模态OCR模型DeepSeek-OCR。该模型创新采用视觉模态压缩技术,将长文本渲染为图像处理,实现最高97%的识别精度。在10倍压缩比下仍保持高精度,单张A100显卡日处理量超20万页,显著提升大模型长文本处理效率,支持近百种语言及复杂图表解析。
2. Google发布Veo 3.1视频生成模型
10月15日,Google正式推出AI视频生成模型Veo 3.1,并面向付费Gemini用户开放。该版本显著提升了音频同步、提示词遵循及场景一致性能力,支持最长148秒高清视频生成,并新增精准编辑功能。
3. MiniMax发布并开源MiniMax-M2
10月27日,MiniMax正式发布并开源新一代文本大模型MiniMax-M2。该模型采用混合专家(MoE)架构,总参数量2300亿,专注于编码与智能体任务优化,在权威测评Artificial Analysis中位目前列全球前五、开源模型第一。
4. 字节跳动发布3D生成大模型Seed 3D 1.0
10月23日,字节跳动Seed团队正式推出3D生成大模型Seed3D 1.0,实现从单张图像到高质量仿真级3D模型的端到端生成。该模型基于Diffusion Transformer架构,通过大规模数据训练生成包含精细几何、真实纹理和物理渲染材质的完整3D模型,支持直接导入仿真引擎,显著降低3D内容创作与具身智能训练门槛。
5. MiniMax发布Hailuo 2.3视频生成模型
10月28日,MiniMax正式推出新一代视频生成模型Hailuo 2.3。该模型基于Hailuo 02升级,在动态表现力、风格化呈现及人物微表情细腻度方面显著提升,同时优化了对运动指令的响应能力。
6. 美团发布LongCat-Video视频生成模型
10月27日,美团LongCat团队正式发布并开源视频生成模型LongCat-Video。该模型基于Diffusion Transformer架构,参数量达136亿,原生支持文生视频、图生视频及视频续写三大核心任务,可稳定生成5分钟720p高清视频。
7. GagaAI推出视频生成模型GAGA-1
10月10日,Sand.ai团队正式发布音画同步视频生成模型GAGA-1。该模型专注于人物对话演绎,用户上传图片并输入提示词即可生成5-10秒影视级视频,支持口型同步与情绪还原,处理时长约3-4分钟。作为对标Sora2的国产模型,其以低成本优势开放使用,适用于短剧制作等场景。
8. Anthropic推出Claude Haiku 4.5
10月16日,Anthropic正式推出Claude Haiku 4.5。该模型以"高性能+低成本+快速度"为核心特点,在编程测试SWE-bench中达到73.3%的通过率,接近Sonnet 4水平,但成本仅为三分之一,速度提升两倍以上。并首次为Haiku系列加入扩展思考能力,支持高速推理和预算控制,适用于实时低延迟场景。
9. 阿里巴巴Qwen3-VL新增多个密集模型尺寸
10月15日,阿里巴巴通义千问团队正式发布Qwen3-VL视觉语言模型家族4B与8B两种参数规格,10月22日再次发布2B与32B参数规格。该系列包含了从轻量级到高性能的产品线,具备长视频处理、OCR识别、视觉Agent及空间感知能力,并已全面开源。模型均提供Instruct和Thinking双版本,其中Qwen3-VL-2B专为移动端设计,支持手机本地流畅运行。
10. 腾讯发布并开源混元世界模型1.1
10月22日,腾讯混元团队正式发布HunyuanWorld-Mirror大模型。该模型采用全景世界代理与语义分层网格表示技术,支持从文本或图像生成具备3D一致性、可探索及交互性的沉浸式虚拟世界,显著提升了虚拟现实、物理仿真及互动内容创建等领域的应用能力。
11. 字节跳动发布豆包语音合成模型2.0
10月16日,字节跳动正式推出新一代语音生成模型Seed-TTS 2.0。该模型基于大规模双语语料训练,采用分层语义-声学建模架构,显著提升长对话语音生成的流畅度与表现力。新版本支持零样本语音合成,在语义理解与韵律控制方面实现突破,可适配播客、聊天机器人等多场景应用。
12. xAI推出视频生成模型Imagine v0.9
10月8日,xAI正式推出视频生成模型Imagine v0.9,该版本在视觉质量、动态表现及音频生成方面实现显著升级,支持电影级文本生成视频与同步语音功能,模型通过Grok平台向用户免费开放。
13. MiniMax发布语音模型Speech 2.6
10月30日,MiniMax正式推出新一代语音合成模型Speech 2.6。该模型端到端延迟低于250毫秒,并引入Fluent LoRA技术,支持在音色复刻的同时生成流利自然的语音,覆盖40多种语言。此次升级深度优化了Voice Agent场景,支持非标准文本格式直接转换。
14. 月之暗面发布并开源KimiLinear架构
10月31日,月之暗面发布并开源了新型混合线性注意力架构Kimi Linear。该模型通过KDA门控机制和3:1混合设计,结合MoE技术,显著优化性能,解码速度较全注意力机制提升6倍。此次开源标志着其在高效推理架构领域的重要突破。
15. MiniMax发布音乐模型Music 2.0
10月31日,MiniMax正式推出新一代音乐生成模型Music 2.0。该模型可生成结构完整、时长5分钟的歌曲,在人声表现和器乐控制上实现突破,精准捕捉情绪与节奏细节,支持多种唱法和情感风格。
16. 百度发布并开源文档解析模型PaddleOCR-VL
10月16日,百度飞桨团队正式开源超紧凑视觉语言模型PaddleOCR-VL-0.9B。该模型集成动态分辨率视觉编码器与ERNIE语言模型,支持109种语言的文档解析,在复杂元素识别和跨模态理解任务中达到SOTA性能。
17. Adobe发布图像生成模型Firefly Image 5
10月29日,Adobe正式推出新一代图像生成模型Firefly Image 5。该模型支持400万像素原生输出,显著提升图像细节与人物渲染精度,并首次引入图层编辑功能,允许对独立对象进行提示词驱动编辑。新模型已整合至Photoshop、Premiere Pro等创意工具。
18. Fish Audio发布声音克隆模型Fish Audio S1
10月21日,Fish Audio宣布其S1语音克隆模型实现重大升级。该模型通过10秒语音样本即可高精度复刻真人声音,在情感表现力和拟真度方面取得突破,并具备超低延迟的实时语音生成能力。
19. 微软发布图像生成模型MAI-Image-1
10月14日,微软正式推出其首款自主研发的图像生成式AI模型MAI-Image-1。该模型专注于文本到图像生成,在渲染逼真光照和自然景观方面表现突出。微软表示,MAI-Image-1将逐步集成至Copilot及Bing Image Creator等产品中。
20. 百川发布循证增强医疗大模型M2 Plus
10月22日,百川智能正式发布循证增强医疗大模型Baichuan-M2 Plus,同步升级配套应用“百小应”并开放API接口。该模型在多场景医学评测中显著降低幻觉率,错误率约为DeepSeek的三分之一,表现优于海外基准OpenEvidence。通过引入循证医学知识库与多轮事实校验机制,其诊疗问答、病历生成等任务的事实一致性提升约40%,为医疗AI领域提供低幻觉、可追溯的技术支撑。(转载自AIGCRank)

扫码下载app 最新资讯实时掌握