close
|
5月前
|
安全 Cloud Native 虚拟化
|
置顶

Anolis OS 23.4 发布:全面支持 RVA23 RISC-V 架构,强化安全与云原生生态

实现一次开发,多架构部署。

832 2
|
7月前
|
人工智能 达摩院 Anolis
|
置顶

龙蜥操作系统装机量突破1000万,市占率近50%,首发支持RISC-V RVA23预览版!

报告调研显示,在国产操作系统迁移意愿方面,龙蜥操作系统的吸引力最高,用户意愿迁移至龙蜥生态社区版和商业版的比例为 54.25%,占比第一。

384 2
BERJAYA

沐曦GPU对SGLang的深度适配与工程实践

沐曦股份SGLang推理引擎核心开发者杨鑫压轴分享《沐曦GPU对SGLang的深度适配与工程实践》。视频详解SGLang在沐曦GPU上的全流程适配、自研MXMACA软件栈技术亮点,以及最新模型适配进展与性能优化实战,全面展示国产算力与开源推理框架深度融合的工程成果。

16 0
BERJAYA
|
15小时前
|
Linux Anolis
|

SGLang Roadmap - 面向大模型与多模态模型的高性能开源推理系统

SGLang社区核心维护者童心源深度解读《SGLang Roadmap:面向大模型与多模态模型的高性能开源推理系统》。视频涵盖SGLang发展历程,重点剖析PD分离、多模态与硬件支持、RL/post-training部署等关键技术创新,并分享开源社区协作进展及最新性能优化路线图,带你全面了解这一高性能开源推理系统的前沿动态。

15 0
BERJAYA
|
15小时前
|
Linux Anolis
|

从全链路可观测到智能分析 - AI 性能分析范式的演进与实践

龙蜥社区SGLang项目开发者苏峰与智算联盟委员常怀鑫联合分享《从全链路可观测到智能分析:AI性能分析范式的演进与实践》。视频回顾了SGLang Tracing可观测性建设历程,并结合实战案例,深入探讨如何借助AI Agent实现SGLang框架的智能性能优化,展现AI性能分析新范式的落地应用。

12 0
BERJAYA

从社区到生产——基于 SGLang HiCache + Mooncake 的深度优化与企业级落地

陈凯悦带来《从社区到生产:基于 SGLang HiCache + Mooncake 的深度优化与企业级落地工程实践》主题分享。视频完整还原了 HiCache 与 Mooncake 在内部推理集群的规模化部署过程,并深入解析其在企业客户环境中的落地实践,为 SGLang 从开源社区走向生产环境提供了宝贵的工程经验与优化思路。

18 0
BERJAYA
|
15小时前
|
Linux Anolis
|

量化部署+算子优化:解锁国产硬件大模型高效推理破局之道

围绕主流开源大模型,介绍在国产化硬件上的适配实践:通过低比特量化实现高效部署,结合多算子融合与单算子调优技术,全面提升端到端推理性能。

12 0
BERJAYA
|
15小时前
|
Linux Anolis
|

从黑盒到透明:SGLang tracing如何赋能LLM推理性能诊断

大模型推理服务的性能问题往往难以定位——请求延迟高是卡在哪个环节?队列等待、prefill 计算、还是 decode 阶段?传统监控只能提供聚合指标,无法精准定位单请求瓶颈。SGLang 请求追踪系统解决了这一痛点。通过端到端的全链路追踪,每个请求从入口到输出的完整生命周期被精确记录:队列等待耗时、prefill/decode 各阶段时长、跨节点传输延迟等关键指标一目了然。结合 OpenTelemetry 标准,可与主流可观测性平台无缝集成,实现可视化分析。这套系统让性能调优从"猜测驱动"转变为"数据驱动",帮助开发者快速识别热点、优化资源配比,显著提升 LLM 服务的吞吐与响应质量。

20 0
BERJAYA
|
15小时前
|
Linux Anolis
|

从割裂到协同——超智融合算力中心的系统化搭建思路与落地路径

分享系统化搭建超智融合算力架构的思路,实现整套集群从芯片、存储、网络到操作系统、算力调度、系统运维的深度融合,以支撑复杂科学计算、工程仿真和AI大模型训练/推理的超智融合应用场景。

11 0
BERJAYA
|
15小时前
|
Linux Anolis
|

MuxWise:面向高Goodput LLM服务的GPU内Prefill-Decode复用技术

LLM推理中prefill(计算密集)与decode(访存密集)资源特性迥异。现有PD分离方案割裂KV cache池、难以适应流量波动;Chunked-prefill则在SLO达标率与GPU利用率间顾此失彼。MuxWise提出GPU内PD空分复用新范式:动态划分SM,让prefill与decode在同一GPU上并行执行、共享KV cache。系统包含三项核心技术:无气泡空分复用引擎、竞争感知延迟预测器、decode优先SLO感知调度。在主流GPU和任务上实现最高3倍goodput提升,代码已合并入SGLang主分支。

19 0
BERJAYA
|
15小时前
|
Linux Anolis
|

面向multi-agent场景的长上下文管理方法|龙蜥MeetUp

本次分享围绕“面向 multi-agent 场景的长上下文管理方法”展开,结合研究背景、现有系统痛点、方案设计与实验结果,系统介绍多智能体协作中长上下文管理的关键挑战与应对思路。内容涵盖长上下文在 multi-agent 场景中的应用需求、当前方法的局限性、本文提出的管理策略及其创新点,并展示系统实现与实验验证结果,帮助观众全面了解该方向的核心问题与解决方案。

12 0
BERJAYA
|
15小时前
|

2025龙蜥开源社区操作系统白皮书

当 Agent 在服务器上真正运行时,操作系统该如何应对?《2025 龙蜥操作系统开源社区白皮书》对AI、一云多芯、安全可信等九大技术方向、双产品线演进路线、各行业落地案例做了详细展示。

0
BERJAYA

异构场景下的大模型推理优化技术

本期龙蜥大讲堂将会为大家讲解异构推理的基本过程和存在的问题,分析在基于龙蜥操作系统的硬件资源受限场景下,稠密模型和MoE模型在CPU端的卸载技术。

15 0
BERJAYA
|
15小时前
|
Linux Anolis
|

基于龙蜥操作系统的AI服务器GPU RAS增强技术|龙蜥大讲堂

在AI算力快速发展的今天,GPU已经成为AI服务器的核心引擎,但随之而来的稳定性、可观测性和故障定位问题,也对底层基础设施提出了更高要求。本视频将以“GPU黑匣子”技术应用为例,介绍如何基于龙蜥操作系统增强AI服务器的GPU RAS能力,提升GPU在运行过程中的可靠性、可用性与可维护性。通过对GPU关键状态、异常信息和运行日志的持续记录与分析,帮助运维人员在故障发生前提前感知风险,在故障发生后快速定位问题,从而有效降低AI训练与推理任务中断带来的影响,构建更加稳定、高效的AI算力底座。

16 0
BERJAYA
|
15小时前
|
Linux Anolis
|

MantaKV:基于 CXL 共享内存的 KVCache 创新管理方案介绍

在 AI 大模型推理日益普及的今天,如何高效管理显存、降低延迟成为核心挑战。特别是在 PD 分离架构下,传统的KVCache 管理方式是否已触及天花板?本期龙蜥大讲堂将带来一场硬核技术分享,深入解析龙蜥操作系统面向未来的存储革新方案——MantaKV!

17 0
|
16小时前
|
人工智能 决策智能 Anolis
|

沐“蜥”芯生,开源共创 | SGLang MeetUp 圆满结束,共同探索 AI 推理落地新路径

技术PPT已上传,欢迎下载查看。

35 0
|
16小时前
|
人工智能 运维 安全
|

如何利用 AI Agent 实现热补丁的自动化生成

AI 不仅重塑了漏洞发现的效率,更应成为加速漏洞修复的核心驱动力。

37 0
|
16小时前
|
人工智能 监控 Java
|

龙蜥两大委员会5月工作会议召开:CXL SIG 新项目开源,全力推动 AI Agent 生态变革

两个会上总结和回顾了龙蜥社区技术贡献、近期运营目标进展。

40 0
BERJAYA
|
16小时前
|
Linux Anolis
|

当AI加速漏洞涌现:内核热补丁自动生成智能体赛题全解读

在 AI 技术的推波助澜下,高危内核 CVE 以周级频率爆发,系统修复面临前所未有的压力。尽管内核热补丁技术克服了传统修复需重启服务器的弊端,实现了业务零中断,但从上游原始 Patch 到可加载热补丁的转化过程,仍依赖大量繁琐的人工改写。 针对这一痛点,龙蜥社区系统运维 SIG 成员高向阳在 2026 全国大学生计算机系统能力大赛技术培训会上,详细剖析了如何利用 AI Agent 实现热补丁的自动化生成,成功将补丁制作周期从“天级别”压缩至“分钟级别”,有力证明了 AI Agent 已成为驱动内核安全修复效率变革的新引擎。

14 0
|
1天前
|
人工智能 监控 安全
|

阿里云亮出 Agent 基础设施全景图,ANOLISA 要做每一个 Agent 的运行底座

操作系统的用户主体,变了。

202 0
|
1天前
|
缓存 弹性计算 运维
|

运维不再需要“老师傅”——OS 运维 Skills 发布,欢迎体验

让任何运维 Agent 具备资深内核专家的诊断能力。

192 1
|
1天前
|
运维 供应链 Cloud Native
|

打破黑盒:基于可重复构建实现托管型 Trustee 的可信验证

本文介绍的基于可重复构建的托管型 Trustee 验证方案,成功构建了一条从“源码”到“发布制品”,再到“运行时”的强可信链路。

289 1
|
1天前
|
人工智能 决策智能 Anolis
|

亮点抢先看!沐曦x龙蜥xSGLang 技术 MeetUp 即将在北京举办

6月6日,北京见。

62 1
|
1天前
|
人工智能 安全 Anolis
|

解读《2025龙蜥社区操作系统白皮书》,这四大亮点值得关注

操作系统在 AI 时代该怎么走,龙蜥社区给出的答案已经越来越清晰。

305 1
|
1天前
|
人工智能 决策智能 Anolis
|

龙蜥邀约 | 当SGLang遇上国产算力,这场硬核Meetup等你来

6月6日,欢迎报名。

116 1
BERJAYA

阿里云亮出 Agent 基础设施全景图,ANOLISA 要做每一个 Agent 的运行底座

ANOLISA 是打造的 Agent 系统管家。它的使命是:打造更高效、更安全的 Agent Native 环境。

63 0
BERJAYA

解读《2025龙蜥社区操作系统白皮书》,这四大亮点值得关注

当 Agent 在服务器上真正运行时,操作系统该如何应对?《2025 龙蜥操作系统开源社区白皮书》对AI、一云多芯、安全可信等九大技术方向、双产品线演进路线、各行业落地案例做了详细展示。

48 0
BERJAYA

2分钟带你了解 ANOLISA——Agent 系统管家

ANOLISA 是转为AI Agent打造的操作系统,致力于打造更高效、更安全的 Agent Native 环境。

53 0
|
27天前
|
缓存 安全 小程序
|

Lua-LSM 系列二:从 CopyFail 到 Dirty Frag,看 732 字节的漏洞,用 79 字节关上

最近发生的真实安全漏洞场景,展示 Lua-LSM 如何在 79 字节内完成对内核提权漏洞的热缓解。

209 4
|
27天前
|
安全 小程序 Linux
|

开源!在 Linux 内核里跑 Lua-LSM 小程序,是什么样的体验?

不需要任何编译工具链,不需要安装额外软件。

178 3
|
27天前
|
人工智能 Anolis 开发者
|

CXL 接口库开源!龙蜥智算联盟 MeetUp 圆满举办,聚焦 AI Infra全栈创新落地

围绕 AI Infra 全栈技术趋势与创新实践,与现场开发者进行了深入的技术交流,共同勾勒下一代 AI Infra 的技术蓝图。

162 12
|
27天前
|
自然语言处理 供应链 监控
|

Agent 越能干,你越不敢放手?ANOLISA 给它穿上全套防护

安全有多层兜底、Token 省了多少看得见、操作做错了能撤回。

165 0
|
1月前
|
数据采集 运维 监控
|

Agent 烧钱如流水?Agentic OS (ANOLISA) 帮你逐笔看清 Token 账单

AgentSight 提供了能看清 Agent 全局状态和每笔 Token 去向的可视化面板。

319 5
|
1月前
|
缓存 人工智能 运维
|

SysOM Agent智能运维系列:Pod内存高告警,一次对话30秒定位根因

让内存诊断从"靠经验排查"变成"可解释、可复现、可执行"的工程化流程。

170 4
|
1月前
|
人工智能 运维 编译器
|

智算联盟年度工作会议召开:全票通过2026年目标,聚焦AI Infra与Agent生态

针对 2025 年工作和 2026 年规划进行了分享。

199 2
|
1月前
|
人工智能 安全 Linux
|

【安全公告】Linux 内核高危本地提权漏洞 CVE-2026-31431 龙蜥已修复,请及时升级更新

龙蜥社区已发布 Anolis OS 7/8/23 的官方安全修复公告 ANSA-2026:0566、ANSA-2026:0565、ANSA-2026:0564。受影响用户请立即完成修复。

1469 3
|
1月前
|
安全 Cloud Native 数据中心
|

RISC-V 基金会 Data Center SIG 第十次会议结束,围绕中断 SIMIC 展开讨论

就软件中断 MSI 控制器提案召开专题会议。

131 1
|
1月前
|
人工智能 自然语言处理 安全
|

龙蜥社区4月技术委员会召开:同步社区质量基准建设及下一代操作系统规划

会上围绕 Anolis OS 23.5 版本规划、龙蜥社区质量基准建设、下一代操作系统规划方向、Agentic OS 架构设计、内核安全机制创新等技术议题进行了分享与探讨。

183 1
|
2月前
|
人工智能 Anolis
|

倒计时 1 天!欢迎解锁 AI Infra MeetUp 直播渠道,明天北京见

AI Infra 产学研用全链路最新技术趋势与产业动态。

189 7
|
2月前
|
Anolis
|

直播预告: CXL 池化内存应用实践解析 | 龙蜥大讲堂

分享龙蜥生态下 CXL 在 Mooncake 框架的落地实践。

214 2
|
2月前
|
人工智能 Anolis 异构计算
|

欢迎报名!龙蜥智算联盟 MeetUp 带你直击 AI 基础设施技术最前线

智算时代,AI基础设施如何破局?

227 1
|
2月前
|
人工智能 运维 架构师
|

直播预告: 异构场景下的大模型优化技术 | 龙蜥大讲堂

异构场景下的大模型优化技术 。

201 2
|
2月前
|
人工智能 安全 Cloud Native
|

RISC-V 基金会 Data Center SIG 第九次会议结束,围绕硬件加速多队列展开讨论

围绕硬件加速多队列展开讨论

152 1
|
2月前
|
人工智能 运维 安全
|

龙蜥社区第 40 次运营委员会会议圆满结束,共探 AI Agent 落地新路径

会上总结和回顾了龙蜥社区 2025 年 3 大运营目标进展,同步了 2026 年 3 大运营目标、社区活动进展等内容。

281 3
|
2月前
|
Cloud Native 虚拟化 数据中心
|

RISC-V 基金会 Data Center SIG 第八次会议圆满结束,围绕AIOE和TG推进展开深入探讨

与会者集中评审 Atomic I/O Enqueue(AIOE / Atomic IONQ)扩展提案 v4。

141 1
|
2月前
|
资源调度 安全 中间件
|

同创可信与 Anolis OS 完成适配,可信计算 3.0 技术融合再进一步

携手打造“开放、可信、可验证”的国产基础软件生态。

226 1
|
2月前
|
人工智能 调度 Anolis
|

国内首个!龙蜥社区联合发起开放代理式人工智能基金会,共启智能体生态新篇章

以开源之力推动 AI 智能体生态开放共建。

172 4

龙蜥操作系统

龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。

0
今日
4372
内容
9
活动
9731
关注
BERJAYA
你好!
登录掌握更多精彩内容

活跃用户