跳转到主要内容
NexaSDK banner NexaSDK 是一个易于使用的开发者工具包,可在本地运行任意 AI 模型——支持 NPU、GPU 和 CPU——由我们的 NexaML 引擎驱动,从零构建,为每种硬件堆栈提供最佳性能。 与依赖现有运行时的封装不同,NexaML 是从内核级别构建的统一推理引擎。这使得 NexaSDK 能够在新模型架构发布的第一天就提供支持(LLM、VLM、CV、Embedding、Rerank、ASR、TTS)。NexaML 支持 3 种模型格式:GGUF、MLX,以及 Nexa AI 自研的 .nexa 格式。

为什么选择 NexaSDK

特性NexaSDKOllamallama.cppLM Studio
NPU 支持🟢 NPU 优先🟡🟡🔴
Android/iOS SDK 支持🟢 NPU/GPU/CPU 支持🟡🟡🔴
Linux 支持(Docker 镜像)🟢🟢🟢🔴
支持任意 GGUF、MLX、NEXA 格式模型🟢 底层控制🔴🟡🔴
完整多模态支持🟢 图像、音频、文本、Embedding、Rerank、ASR、TTS🟡🟡🟡
跨平台支持🟢 桌面、移动端(Android、iOS)、汽车、IoT(Linux)🟡🟡🟡
一行代码即可运行🟢🟢🟡🟢
OpenAI 兼容 API + 函数调用🟢🟢🟢🟢
图例: 🟢 支持  |  🟡 部分或受限支持  |  🔴 不支持

快速开始

社区