llama swap

2026-02-14 09:23:11 -06:00
parent a50ae2e751
commit 6be6ebe2ee
4 changed files with 34 additions and 4 deletions
--- a/modules/nixosModules/.localization.nix.swp
+++ b/modules/nixosModules/.localization.nix.swp
--- a/modules/nixosModules/ai/llama.nix
+++ b/modules/nixosModules/ai/llama.nix
@@ -0,0 +1,29 @@
+{self, inputs, ...}: {
+	flake.nixosModules.llama = { lib, pkgs, ... }: {
+		nixpkgs.overlays = [
+			(final: prev: { 
+				llama-cpp-cuda = prev.llama-cpp.override {
+					cudaSupport = true;
+					blasSupport = true;
+				};
+			})
+		];
+		services.llama-swap = {
+			enable = true;
+			port = 9001;
+			openFirewall = true;
+			listenAddress = "0.0.0.0";
+			settings = {
+				models = {
+					"magidonia" = {
+						ttl = 3600;
+						cmd = "${pkgs.llama-cpp-cuda}/bin/llama-server --port \${PORT} -m /var/AI/Models/Chat/ggufs/Magidonia-24B-v4.3-Q4_K_M.gguf";
+					};
+				};
+			};
+		};
+		environment.systemPackages = with pkgs; [
+			llama-cpp-cuda
+		];
+	};
+}