Tags: #memory-efficiency - OSS Alternative - Discover Top Open Source Alternatives to Popular Software

Tags: #memory-efficiency

LLM Inference Optimization Library

17.0k

lyogavin/airllm

Optimizes large language model inference to run 70B models on a single 4GB GPU without quantization, enabling efficient deployment on resource-constrained hardware.

llm inference gpu optimization memory efficiency

Details