- 与 KeywordGacha 配套的本地模型一键包
- 请确保安装了最新版本的显卡驱动程序
- 理论上支持所有 4G 以上显存的显卡(包括集成显卡)
-
从 发布页 下载最新版本的一键包并解压缩
-
下载模型 --> keyword_gacha_llm_1.5b_20241220_q6_km.gguf 并放入一键包文件夹
-
现在你的文件结构应该类似于:
KeywordGachaServer\llama\... \00_Core.bat \01_2K_NP16.bat \keyword_gacha_llm_1.5b_20241220_q6_km.gguf \...
-
双击
01_2K_NP16.bat
,会开启一个黑色的终端窗口 -
一阵文字滚动后,看到有类似
all slots are idle
的字样就说明成功启动了 -
关闭黑色的终端窗口即为关闭服务器
-
什么是
爆显存
,会导致什么问题?- 系统需求的显存超过了显卡实际的物理显存大小,称之为
爆显存
爆显存
时,翻译的速度和结果都会出现异常,基本丧失可用性,所以要避免这种情况
- 系统需求的显存超过了显卡实际的物理显存大小,称之为
-
如何判断是否
爆显存
- 如果爆的比较厉害,程序会直接报错或者退出
- 爆了一点又没有完全爆比较难判断
- 一个可参考的方式是通过第三方软件监测显卡功耗
- 满载执行任务时,显卡实际功耗应为最大功耗的
70%-80%
或者更高 - 如果显存接近用完,但是显卡实际功耗很低,则大概率是爆显存了
-
如何避免
爆显存
- 在模型启动后,模型占用的显存大小是固定的,不会变化,但是系统中的其他应用也会占用显存
- 本项目中的脚本都预留了一定的冗余空间,但如果开启过多应用,依然可能导致显存消耗完
- 所以在使用时,应尽量减少开启其他消耗显存的应用
- 比如
浏览器
、动态壁纸
、视频播放器
或QQNT
、VSCODE
等基于浏览器内核的应用