龙蜥操作系统装机量突破1000万,市占率近50%,首发支持RISC-V RVA23预览版!
报告调研显示,在国产操作系统迁移意愿方面,龙蜥操作系统的吸引力最高,用户意愿迁移至龙蜥生态社区版和商业版的比例为 54.25%,占比第一。
沐曦GPU对SGLang的深度适配与工程实践
沐曦股份SGLang推理引擎核心开发者杨鑫压轴分享《沐曦GPU对SGLang的深度适配与工程实践》。视频详解SGLang在沐曦GPU上的全流程适配、自研MXMACA软件栈技术亮点,以及最新模型适配进展与性能优化实战,全面展示国产算力与开源推理框架深度融合的工程成果。
SGLang Roadmap - 面向大模型与多模态模型的高性能开源推理系统
SGLang社区核心维护者童心源深度解读《SGLang Roadmap:面向大模型与多模态模型的高性能开源推理系统》。视频涵盖SGLang发展历程,重点剖析PD分离、多模态与硬件支持、RL/post-training部署等关键技术创新,并分享开源社区协作进展及最新性能优化路线图,带你全面了解这一高性能开源推理系统的前沿动态。
从全链路可观测到智能分析 - AI 性能分析范式的演进与实践
龙蜥社区SGLang项目开发者苏峰与智算联盟委员常怀鑫联合分享《从全链路可观测到智能分析:AI性能分析范式的演进与实践》。视频回顾了SGLang Tracing可观测性建设历程,并结合实战案例,深入探讨如何借助AI Agent实现SGLang框架的智能性能优化,展现AI性能分析新范式的落地应用。
从社区到生产——基于 SGLang HiCache + Mooncake 的深度优化与企业级落地
陈凯悦带来《从社区到生产:基于 SGLang HiCache + Mooncake 的深度优化与企业级落地工程实践》主题分享。视频完整还原了 HiCache 与 Mooncake 在内部推理集群的规模化部署过程,并深入解析其在企业客户环境中的落地实践,为 SGLang 从开源社区走向生产环境提供了宝贵的工程经验与优化思路。
量化部署+算子优化:解锁国产硬件大模型高效推理破局之道
围绕主流开源大模型,介绍在国产化硬件上的适配实践:通过低比特量化实现高效部署,结合多算子融合与单算子调优技术,全面提升端到端推理性能。
从黑盒到透明:SGLang tracing如何赋能LLM推理性能诊断
大模型推理服务的性能问题往往难以定位——请求延迟高是卡在哪个环节?队列等待、prefill 计算、还是 decode 阶段?传统监控只能提供聚合指标,无法精准定位单请求瓶颈。SGLang 请求追踪系统解决了这一痛点。通过端到端的全链路追踪,每个请求从入口到输出的完整生命周期被精确记录:队列等待耗时、prefill/decode 各阶段时长、跨节点传输延迟等关键指标一目了然。结合 OpenTelemetry 标准,可与主流可观测性平台无缝集成,实现可视化分析。这套系统让性能调优从"猜测驱动"转变为"数据驱动",帮助开发者快速识别热点、优化资源配比,显著提升 LLM 服务的吞吐与响应质量。
从割裂到协同——超智融合算力中心的系统化搭建思路与落地路径
分享系统化搭建超智融合算力架构的思路,实现整套集群从芯片、存储、网络到操作系统、算力调度、系统运维的深度融合,以支撑复杂科学计算、工程仿真和AI大模型训练/推理的超智融合应用场景。
MuxWise:面向高Goodput LLM服务的GPU内Prefill-Decode复用技术
LLM推理中prefill(计算密集)与decode(访存密集)资源特性迥异。现有PD分离方案割裂KV cache池、难以适应流量波动;Chunked-prefill则在SLO达标率与GPU利用率间顾此失彼。MuxWise提出GPU内PD空分复用新范式:动态划分SM,让prefill与decode在同一GPU上并行执行、共享KV cache。系统包含三项核心技术:无气泡空分复用引擎、竞争感知延迟预测器、decode优先SLO感知调度。在主流GPU和任务上实现最高3倍goodput提升,代码已合并入SGLang主分支。
面向multi-agent场景的长上下文管理方法|龙蜥MeetUp
本次分享围绕“面向 multi-agent 场景的长上下文管理方法”展开,结合研究背景、现有系统痛点、方案设计与实验结果,系统介绍多智能体协作中长上下文管理的关键挑战与应对思路。内容涵盖长上下文在 multi-agent 场景中的应用需求、当前方法的局限性、本文提出的管理策略及其创新点,并展示系统实现与实验验证结果,帮助观众全面了解该方向的核心问题与解决方案。
2025龙蜥开源社区操作系统白皮书
当 Agent 在服务器上真正运行时,操作系统该如何应对?《2025 龙蜥操作系统开源社区白皮书》对AI、一云多芯、安全可信等九大技术方向、双产品线演进路线、各行业落地案例做了详细展示。
基于龙蜥操作系统的AI服务器GPU RAS增强技术|龙蜥大讲堂
在AI算力快速发展的今天,GPU已经成为AI服务器的核心引擎,但随之而来的稳定性、可观测性和故障定位问题,也对底层基础设施提出了更高要求。本视频将以“GPU黑匣子”技术应用为例,介绍如何基于龙蜥操作系统增强AI服务器的GPU RAS能力,提升GPU在运行过程中的可靠性、可用性与可维护性。通过对GPU关键状态、异常信息和运行日志的持续记录与分析,帮助运维人员在故障发生前提前感知风险,在故障发生后快速定位问题,从而有效降低AI训练与推理任务中断带来的影响,构建更加稳定、高效的AI算力底座。
MantaKV:基于 CXL 共享内存的 KVCache 创新管理方案介绍
在 AI 大模型推理日益普及的今天,如何高效管理显存、降低延迟成为核心挑战。特别是在 PD 分离架构下,传统的KVCache 管理方式是否已触及天花板?本期龙蜥大讲堂将带来一场硬核技术分享,深入解析龙蜥操作系统面向未来的存储革新方案——MantaKV!
当AI加速漏洞涌现:内核热补丁自动生成智能体赛题全解读
在 AI 技术的推波助澜下,高危内核 CVE 以周级频率爆发,系统修复面临前所未有的压力。尽管内核热补丁技术克服了传统修复需重启服务器的弊端,实现了业务零中断,但从上游原始 Patch 到可加载热补丁的转化过程,仍依赖大量繁琐的人工改写。 针对这一痛点,龙蜥社区系统运维 SIG 成员高向阳在 2026 全国大学生计算机系统能力大赛技术培训会上,详细剖析了如何利用 AI Agent 实现热补丁的自动化生成,成功将补丁制作周期从“天级别”压缩至“分钟级别”,有力证明了 AI Agent 已成为驱动内核安全修复效率变革的新引擎。
打破黑盒:基于可重复构建实现托管型 Trustee 的可信验证
本文介绍的基于可重复构建的托管型 Trustee 验证方案,成功构建了一条从“源码”到“发布制品”,再到“运行时”的强可信链路。
阿里云亮出 Agent 基础设施全景图,ANOLISA 要做每一个 Agent 的运行底座
ANOLISA 是打造的 Agent 系统管家。它的使命是:打造更高效、更安全的 Agent Native 环境。
解读《2025龙蜥社区操作系统白皮书》,这四大亮点值得关注
当 Agent 在服务器上真正运行时,操作系统该如何应对?《2025 龙蜥操作系统开源社区白皮书》对AI、一云多芯、安全可信等九大技术方向、双产品线演进路线、各行业落地案例做了详细展示。
Lua-LSM 系列二:从 CopyFail 到 Dirty Frag,看 732 字节的漏洞,用 79 字节关上
最近发生的真实安全漏洞场景,展示 Lua-LSM 如何在 79 字节内完成对内核提权漏洞的热缓解。
CXL 接口库开源!龙蜥智算联盟 MeetUp 圆满举办,聚焦 AI Infra全栈创新落地
围绕 AI Infra 全栈技术趋势与创新实践,与现场开发者进行了深入的技术交流,共同勾勒下一代 AI Infra 的技术蓝图。
Agent 烧钱如流水?Agentic OS (ANOLISA) 帮你逐笔看清 Token 账单
AgentSight 提供了能看清 Agent 全局状态和每笔 Token 去向的可视化面板。
【安全公告】Linux 内核高危本地提权漏洞 CVE-2026-31431 龙蜥已修复,请及时升级更新
龙蜥社区已发布 Anolis OS 7/8/23 的官方安全修复公告 ANSA-2026:0566、ANSA-2026:0565、ANSA-2026:0564。受影响用户请立即完成修复。
龙蜥社区4月技术委员会召开:同步社区质量基准建设及下一代操作系统规划
会上围绕 Anolis OS 23.5 版本规划、龙蜥社区质量基准建设、下一代操作系统规划方向、Agentic OS 架构设计、内核安全机制创新等技术议题进行了分享与探讨。
龙蜥社区第 40 次运营委员会会议圆满结束,共探 AI Agent 落地新路径
会上总结和回顾了龙蜥社区 2025 年 3 大运营目标进展,同步了 2026 年 3 大运营目标、社区活动进展等内容。
RISC-V 基金会 Data Center SIG 第八次会议圆满结束,围绕AIOE和TG推进展开深入探讨
与会者集中评审 Atomic I/O Enqueue(AIOE / Atomic IONQ)扩展提案 v4。
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。
