> GPTQ は GPU 専用の特定の形式です。 GGML は CPU および Apple M シリーズ向けに設計されていますが、GPU 上の一部のレイヤーをオフロードすることもできます
> GPTQはCUDA特化型