这篇博文旨在为 Intel GPU 用户提供一套硬核且高效的大语言模型(LLM)本地部署方案。