/work4ai/vllm - Scrapbox Reader

generated at 2/14/2025, 3:03:09 AM

vLLM

https://github.com/vllm-project/vllmvllm-project/vllm
https://vllm.readthedocs.io/en/latest/index.htmlWelcome to vLLM!
LMSYS ORG開発

https://vllm.ai/ブログ/仕組み
>vLLMはHFと比較して最大24倍、TGIと比較して最大3.5倍のスループットを達成した。


参考
大規模言語モデルの出力スピードを最大24倍に高めるライブラリ「vLLM」が登場、メモリ効率を高める新たな仕組み「PagedAttention」とは？

もしかして:vlm