跳转到主要内容

LFM2-24B-A2B-Preview-GGUF

本小节与 nexa-sdk 仓库 Android README 中的「Tutorial: LFM2-24B-A2B-Preview-GGUF」一致,介绍如何在演示 App 中使用 LFM2-24B-A2B-Preview-GGUF 模型。

操作步骤

1

安装 App

安装演示 App(APK 或从源码构建)。APK 下载与从源码编译步骤见 GitHub Android README 的「Quick Start with APK」与「Build from Source」。
2

选择模型

打开模型选择器(模型名称旁的下拉菜单),选择 LFM2-24B-A2B-Preview-GGUF选择模型
3

下载

点击 Download,将模型下载到设备,等待下载完成。
4

加载

点击 Load。在出现的「加载模型配置」弹窗中选择 CPUGPUNPU(Qualcomm NPU),然后点击 SURE。加载完成后即可使用对话区域。加载模型配置
5

对话

在底部输入框中输入内容,点击 Send 获取回复。使用 Clear 可清空输入或会话。对话界面