Skip to content

neavo/KeywordGachaServer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 

Repository files navigation

KeywordGacha Server

  • KeywordGacha 配套的本地模型一键包
  • 请确保安装了最新版本的显卡驱动程序
  • 理论上支持所有 4G 以上显存的显卡(包括集成显卡)

步骤

  • 发布页 下载最新版本的一键包并解压缩

  • 下载模型 --> keyword_gacha_llm_1.5b_20241220_q6_km.gguf 并放入一键包文件夹

  • 现在你的文件结构应该类似于:

    KeywordGachaServer\llama\...
                      \00_Core.bat
                      \01_2K_NP16.bat
                      \keyword_gacha_llm_1.5b_20241220_q6_km.gguf
                      \...
    
  • 双击 01_2K_NP16.bat,会开启一个黑色的终端窗口

  • 一阵文字滚动后,看到有类似 all slots are idle 的字样就说明成功启动了

  • 关闭黑色的终端窗口即为关闭服务器

常见问题

  • 什么是 爆显存,会导致什么问题?

    • 系统需求的显存超过了显卡实际的物理显存大小,称之为 爆显存
    • 爆显存 时,翻译的速度和结果都会出现异常,基本丧失可用性,所以要避免这种情况
  • 如何判断是否 爆显存

    • 如果爆的比较厉害,程序会直接报错或者退出
    • 爆了一点又没有完全爆比较难判断
    • 一个可参考的方式是通过第三方软件监测显卡功耗
    • 满载执行任务时,显卡实际功耗应为最大功耗的 70%-80% 或者更高
    • 如果显存接近用完,但是显卡实际功耗很低,则大概率是爆显存了
  • 如何避免 爆显存

    • 在模型启动后,模型占用的显存大小是固定的,不会变化,但是系统中的其他应用也会占用显存
    • 本项目中的脚本都预留了一定的冗余空间,但如果开启过多应用,依然可能导致显存消耗完
    • 所以在使用时,应尽量减少开启其他消耗显存的应用
    • 比如 浏览器动态壁纸视频播放器QQNTVSCODE 等基于浏览器内核的应用

About

与 KeywordGacha 配套的本地大模型一键包

Resources

Stars

Watchers

Forks

Packages

No packages published