Tags: #cpu-inference

Technical Tutorial

2.4k

datawhalechina/handy-ollama

A comprehensive tutorial guiding users to deploy large language models locally on CPU using Ollama, making LLM inference accessible without dedicated GPU resources.

ollama llm-deployment cpu-inference

Details

Text-to-Speech Model

onnx

3.0k

OpenMOSS/MOSS-TTS-Nano

MOSS-TTS-Nano is an open-source, multilingual, tiny speech generation model optimized for real-time CPU inference and lightweight integration.

text-to-speech tts multilingual

Details